AI Generatif membayangkan struktur protein baharu | Berita MIT



MIT News FrameDiff 0

Biologi adalah permaidani yang menakjubkan lagi halus. Di tengah-tengah adalah DNA, penenun induk yang mengodkan protein, bertanggungjawab untuk mengatur banyak fungsi biologi yang mengekalkan kehidupan dalam tubuh manusia. Walau bagaimanapun, badan kita adalah serupa dengan alat yang ditala halus, terdedah kepada kehilangan keharmoniannya. Lagipun, kita berhadapan dengan dunia semula jadi yang sentiasa berubah dan tidak henti-henti: patogen, virus, penyakit dan kanser. 

Bayangkan jika kita boleh mempercepatkan proses mencipta vaksin atau ubat untuk patogen yang baru muncul. Bagaimana jika kita mempunyai teknologi penyuntingan gen yang mampu menghasilkan protein secara automatik untuk membetulkan kesilapan DNA yang menyebabkan kanser? Usaha untuk mengenal pasti protein yang boleh mengikat dengan kuat kepada sasaran atau mempercepatkan tindak balas kimia adalah penting untuk pembangunan ubat, diagnostik, dan pelbagai aplikasi perindustrian, namun ia selalunya merupakan usaha yang berlarutan dan mahal.

Untuk memajukan keupayaan kami dalam kejuruteraan protein, penyelidik MIT CSAIL menghasilkan "FrameDiff," alat pengiraan untuk mencipta struktur protein baharu melebihi apa yang dihasilkan oleh alam semula jadi. Pendekatan pembelajaran mesin menjana "bingkai" yang sejajar dengan sifat sedia ada struktur protein, membolehkannya membina protein baru secara bebas daripada reka bentuk sedia ada, memudahkan struktur protein yang belum pernah berlaku sebelum ini.

"Secara semula jadi, reka bentuk protein adalah proses pembakaran perlahan yang mengambil masa berjuta-juta tahun. Teknik kami bertujuan untuk memberikan jawapan untuk menangani masalah buatan manusia yang berkembang jauh lebih pantas daripada rentak alam semula jadi, "kata pelajar PhD MIT CSAIL Jason Yim, pengarang utama pada kertas baharu tentang kerja itu. “Matlamatnya, berkenaan dengan kapasiti baharu menjana struktur protein sintetik ini, membuka pelbagai keupayaan yang dipertingkatkan, seperti pengikat yang lebih baik. Ini bermakna protein kejuruteraan yang boleh melekat pada molekul lain dengan lebih cekap dan selektif, dengan implikasi meluas yang berkaitan dengan penghantaran ubat dan bioteknologi yang disasarkan, di mana ia boleh menghasilkan pembangunan biosensor yang lebih baik. Ia juga boleh memberi implikasi kepada bidang bioperubatan dan seterusnya, menawarkan kemungkinan seperti membangunkan protein fotosintesis yang lebih cekap, mencipta antibodi yang lebih berkesan, dan kejuruteraan nanopartikel untuk terapi gen. 

Bingkai BingkaiDiff

Protein mempunyai struktur yang kompleks, terdiri daripada banyak atom yang disambungkan oleh ikatan kimia. Atom terpenting yang menentukan bentuk 3D protein dipanggil "tulang belakang", seperti tulang belakang protein. Setiap triplet atom di sepanjang tulang belakang berkongsi corak ikatan dan jenis atom yang sama. Penyelidik mendapati corak ini boleh dieksploitasi untuk membina algoritma pembelajaran mesin menggunakan idea daripada geometri pembezaan dan kebarangkalian. Di sinilah bingkai masuk: Secara matematik, triplet ini boleh dimodelkan sebagai badan tegar yang dipanggil "bingkai" (biasa dalam fizik) yang mempunyai kedudukan dan putaran dalam 3D. 

Bingkai ini melengkapkan setiap triplet dengan maklumat yang mencukupi untuk mengetahui tentang persekitaran spatialnya. Tugasnya ialah algoritma pembelajaran mesin untuk mempelajari cara menggerakkan setiap bingkai untuk membina tulang belakang protein. Dengan belajar membina protein sedia ada, algoritma diharapkan dapat membuat generalisasi dan dapat mencipta protein baharu yang tidak pernah dilihat sebelumnya dalam alam semula jadi.

Melatih model untuk membina protein melalui "penyebaran" melibatkan suntikan bunyi yang menggerakkan semua bingkai secara rawak dan mengaburkan rupa protein asal. Tugas algoritma adalah untuk menggerakkan dan memutar setiap bingkai sehingga ia kelihatan seperti protein asal. Walaupun mudah, pembangunan resapan pada bingkai memerlukan teknik dalam kalkulus stokastik pada manifold Riemannian. Dari segi teori, penyelidik membangunkan "SE(3) resapan" untuk mempelajari taburan kebarangkalian yang menghubungkan komponen terjemahan dan putaran setiap bingkai secara bukan remeh.

Seni penyebaran yang halus

Pada tahun 2021, DeepMind memperkenalkan AlphaFold2, algoritma pembelajaran mendalam untuk meramal struktur protein 3D daripada jujukannya. Apabila mencipta protein sintetik, terdapat dua langkah penting: penjanaan dan ramalan. Penjanaan bermaksud penciptaan struktur dan jujukan protein baharu, manakala "ramalan" bermaksud memikirkan apakah struktur 3D jujukan. Bukan kebetulan bahawa AlphaFold2 juga menggunakan bingkai untuk memodelkan protein. Penyebaran SE(3) dan FrameDiff telah diilhamkan untuk mengambil idea tentang bingkai dengan lebih lanjut dengan memasukkan bingkai ke dalam model penyebaran, teknik AI generatif yang telah menjadi sangat popular dalam penjanaan imej, seperti Midjourney, sebagai contoh. 

Bingkai dan prinsip yang dikongsi antara penjanaan struktur protein dan ramalan bermakna model terbaik dari kedua-dua hujung adalah serasi. Dengan kerjasama Institut Reka Bentuk Protein di Universiti Washington, penyebaran SE(3) telah digunakan untuk mencipta dan mengesahkan protein baru secara eksperimen. Secara khusus, mereka menggabungkan penyebaran SE(3) dengan RosettaFold2, alat ramalan struktur protein seperti AlphaFold2, yang membawa kepada "RFdiffusion." Alat baharu ini membawa pereka bentuk protein lebih dekat untuk menyelesaikan masalah penting dalam bioteknologi, termasuk pembangunan pengikat protein yang sangat spesifik untuk reka bentuk vaksin dipercepatkan, kejuruteraan protein simetri untuk penghantaran gen dan perancah motif yang teguh untuk reka bentuk enzim yang tepat. 

Usaha masa depan untuk FrameDiff melibatkan penambahbaikan umum kepada masalah yang menggabungkan pelbagai keperluan untuk biologi seperti ubat. Sambungan lain adalah untuk menggeneralisasikan model kepada semua modaliti biologi termasuk DNA dan molekul kecil. Pasukan itu berpendapat bahawa dengan mengembangkan latihan FrameDiff tentang data yang lebih besar dan mempertingkatkan proses pengoptimumannya, ia boleh menjana struktur asas yang membanggakan keupayaan reka bentuk setanding dengan RFdiffusion, sambil mengekalkan kesederhanaan sedia ada FrameDiff. 

"Membuang model ramalan struktur terlatih [dalam FrameDiff] membuka kemungkinan untuk menjana struktur dengan cepat yang meluas ke panjang yang besar," kata ahli biologi pengiraan Universiti Harvard, Sergey Ovchinnikov. Pendekatan inovatif penyelidik menawarkan langkah yang menjanjikan ke arah mengatasi batasan model ramalan struktur semasa. Walaupun ia masih merupakan kerja awal, ia adalah satu langkah yang menggalakkan ke arah yang betul. Oleh itu, visi reka bentuk protein, memainkan peranan penting dalam menangani cabaran paling mendesak umat manusia, nampaknya semakin mudah dicapai, terima kasih kepada kerja perintis pasukan penyelidikan MIT ini.” 

Yim menulis makalah itu bersama-sama postdoc Universiti Columbia Brian Trippe, Pusat Kebangsaan Perancis untuk Penyelidikan Saintifik di Pusat Sains Data penyelidik Paris Valentin De Bortoli, postdoc Universiti Cambridge Emile Mathieu, dan profesor statistik Universiti Oxford dan saintis penyelidikan kanan di DeepMind Arnaud Doucet . Profesor MIT Regina Barzilay dan Tommi Jaakkola menasihati penyelidikan itu. 

Kerja pasukan itu disokong, sebahagiannya, oleh Klinik MIT Abdul Latif Jameel untuk Pembelajaran Mesin dalam Kesihatan, geran EPSRC dan Perkongsian Kemakmuran antara Penyelidikan Microsoft dan Universiti Cambridge, Program Fellowship Penyelidikan Siswazah Yayasan Sains Kebangsaan, geran Ekspedisi NSF, Pembelajaran Mesin untuk konsortium Penemuan Farmaseutikal dan Sintesis, DTRA Discovery of Medical Countermeasures Against New and Emerging threats program, program DARPA Accelerated Molecular Discovery, dan geran Sanofi Computational Antibody Design. Penyelidikan ini akan dibentangkan di Persidangan Antarabangsa mengenai Pembelajaran Mesin pada bulan Julai.



Pautan sumber

Tinggalkan pesanan

Alamat e-mel anda tidak akan diterbitkan. Medan yang diperlukan ditanda *

Anda boleh menggunakan tag dan atribut HTML ini: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

ms_MYMalay