Bagaimana Menemukan Obat Antiviral Dengan Deep Learning?

– Menuju AI – Teknologi, Sains, dan Teknik Terbaik


Penulis: Ömer Özgür

Pembelajaran Mendalam

Dari Pembelajaran Mendalam untuk Ilmu Hayati

Penemuan obat adalah proses yang memakan waktu dan mahal; pembelajaran mendalam dapat membuat proses ini lebih cepat dan lebih murah. Penemuan obat dapat dibagi menjadi tiga bagian.

Prediksi sifat obat Prediksi interaksi goal obat Penemuan Obat

Masalah pembelajaran mesin secara luas dibagi menjadi tiga subkelompok: pembelajaran yang diawasi, pembelajaran tanpa pengawasan, dan pembelajaran penguatan. Prediksi karakteristik obat dapat dinyatakan sebagai masalah pembelajaran terbimbing.

Masukan: Molekul
Keluaran: Derajat sifat kimiawi (toksisitas) molekul

Penemuan obat adalah proses pembelajaran tanpa pengawasan.

Mari kita mulai

Pengumpulan information: Pertama-tama, kami membutuhkan informasi tentang obat antivirus yang berhasil. Kami dapat mengakses bahan aktif obat anti virus dari American Chemical Society dan obat-obatan yang digunakan untuk mengobati epidemi MERS dari Kaggle.

Dari

Komputer tidak memproses informasi yang tidak diekspresikan secara matematis, jadi kita harus mengekspresikan molekul kita secara matematis. Metode yang bisa kita gunakan untuk ini:

Sidik jari molekuler Dengan series (SMILES) Struktur grafis (grafik 2d atau 3d)

Kami akan menggunakan metode SMILES (Sistem entri jalur enter molekuler yang disederhanakan) untuk merepresentasikan molekul. Secara singkat, kita dapat mengubah molekul two dimensi menjadi struktur teks 1 dimensi. Ini adalah metode yang lazim dan rentan terhadap pemrosesan bahasa alami.

Dari

Di sini, sidik jari molekuler terjadi. Karena molekul mirip dengan grafik, atom membentuk node, dan ikatan atom membentuk tepi. Kita dapat merepresentasikan node dengan vektor.

Vektor membawa informasi seperti jumlah atom hidrogen yang terhubung, muatan atom, jenis atom, misalnya (2,2, 1,3,0,1… n). Pada saat yang sama, vektor diperbarui dengan informasi dari tetangganya, sehingga mempelajari informasi geometris.

Saat mengembangkan obat, perpustakaan yang paling sering kami gunakan adalah DeepChem. DeepChem bertujuan untuk membuat perangkat lunak sumber terbuka berkualitas tinggi untuk penemuan obat, ilmu substance, kimia kuantum, dan biologi.

Variational AutoEncoder mengapa dan bagaimana cara kerjanya

Tujuan kami dengan VAEs adalah untuk mengekspresikan informasi molekul yang dikodekan secara diskrit dalam multidimensi secara terus menerus. Neural Network, yang telah dilatih dengan ribuan molekul, pada dasarnya terdiri dari 3 fungsi: encoder, decoder dan predictor.

Mewakili molekul secara matematis dalam arrangement kontinu memungkinkan kita menemukan obat baru; kami memilih vektor acak dari ruang molekul dan menerjemahkannya ke dalam struktur molekul dengan dekoder.
Saat kami memeriksa arsitektur AutoEncoders, kami menemukan tiga struktur:

1- Pembuat Enkode: Di sini, jaringan saraf tiruan belajar bagaimana merepresentasikan informasi dalam ukuran yang lebih kecil. Secara singkat, info mulai dikompresi saat bergerak menuju kemacetan dan fungsi penting dihapus; itu juga dapat dianggap sebagai reduksi dimensi nonlinier.

two – Hambatan: Ketika struktur AutoEncoder diperiksa, itu sebenarnya seperti kupu-kupu; bottleneck adalah bagian di mana informasi lewat di antara sayap-sayap. Statistics direpresentasikan dalam ruang vektor multidimensi terkompresi.

3- Decoder: Mempelajari cara merekonstruksi representasi yang dikodekan sedekat mungkin dengan enter asli.

Dari Pembelajaran Mendalam untuk Ilmu Hayati

Seperti di setiap Jaringan Neural, kita perlu membuat atau menentukan fungsi biaya. Kami tahu bahwa metode ini adalah proses pembelajaran tanpa pengawasan, dan kami ingin itu merekonstruksi arrangement SMILES dari molekul tersebut.

Fungsi biaya yang kami gambarkan mengukur perbedaan antara enter dan output. Betapa berhasilnya itu dapat menghasilkan inputsignal. Jika kita memasukkan dan mengeluarkan gambar, kita mencoba meminimalkan perbedaan antara angka-angka yang mewakili intensitas warna dalam pikselnya.

Perbedaan dari Variational Autoencoder

Dari Pembelajaran Mendalam untuk Ilmu Hayati

Sementara autoencoder mengurangi enter ke satu titik dalam ruang, autoencoder Variasional memaksa ruang vektor yang dikodekan untuk menyebar dengan distribusi Gaussian (Distribusi Regular ).

Hasilnya, kami dapat mencapai kualitas ekstraksi fitur yang lebih baik. Ini melakukan pengukuran yang berbeda antara distribusi probabilitas. Ketika fungsi kerugian semakin kecil, semakin dekat ruang vektor ke distribusi normal.

Jaringan permusuhan generatif digunakan untuk menghasilkan hal-hal yang tidak ada sebelumnya. Pada saat yang sama, lebih masuk akal menggunakan VAE untuk membuat jenis informasi yang sama (obat, gambar, suara) yang berbeda.

Arsitektur jaringan saraf tiruan yang digunakan dalam penemuan obat

String karakter (SMILES) dapat dikodekan menjadi vektor menggunakan jaringan saraf berulang (RNN). Pembelajaran sekuensial dapat dilakukan menggunakan 1D CNN atau RNN di bagian encoder dan RNN di decoder. RNN atau GRU di lapisan terakhir memprediksi karakter mana yang harus ditempatkan.

Penemuan obat

Penemuan obat mirip seperti mencari jarum di tumpukan jerami. Namun, obat yang kita buat dapat diekspresikan secara matematis, hukum kimia dan fisika mungkin tidak mengizinkan ketika Anda ingin mensintesisnya, sehingga kumpulan molekul yang dimulai dalam jumlah besar menyusut saat mereka melalui tahap eliminasi, beberapa tahap ini adalah:

Jika jumlah atom molekul kurang dari 10, tidak ada energi interaksi yang cukup untuk bereaksi. Jika molekul memiliki lebih dari 50 atom, sulit untuk larut dalam atmosphere, dan masalah dapat terjadi dalam reaksi biologis (secara umum).

QED (Estimasi kuantitatif kemiripan obat)

Dari penulis

Ini adalah metode yang digunakan untuk mengukur potensi molekul untuk menjadi obat. Kita bisa melakukan ini menggunakan pustaka RDkit; setiap molekul diberi skor antara 0–1, kita dapat meneruskan poin di atas 0,5 ke tahap berikutnya.

Molekul paling sukses yang pernah ditemukan dalam percobaan ini

Dari penulis

Molekul tersukses dikembangkan, skor QED 0,68
Untuk mengukur aktivitas biologis molekul, seorang ahli kimia harus terlebih dahulu disintesis, kemudian kita dapat melewati tahapan uji. Hasilnya, penemuan obat merupakan bidang baru dan terus berkembang. Ini bertujuan untuk memfasilitasi proses panjang yang melibatkan trial and error menggunakan intuisi manusia.

– Sumber –

Bagaimana Menemukan Obat Antiviral Dengan Deep Learning? ) Awalnya diterbitkan di Limit AI on Moderate, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.

Diterbitkan melalui Towards AI

Leave a Reply