الذكاء الاصطناعي التوليدي يتخيل هياكل بروتينية جديدة | أخبار معهد ماساتشوستس للتكنولوجيا



إطار أخبار معهد ماساتشوستس للتكنولوجيا (MIT) 0

علم الأحياء هو نسيج عجيب ولكنه دقيق. في القلب يوجد الحمض النووي، وهو الحائك الرئيسي الذي يشفر البروتينات، والمسؤول عن تنسيق العديد من الوظائف البيولوجية التي تدعم الحياة داخل جسم الإنسان. ومع ذلك، فإن جسدنا يشبه أداة مضبوطة بدقة، وعرضة لفقدان تناغمها. ففي نهاية المطاف، نحن نواجه عالمًا طبيعيًا دائم التغير ولا هوادة فيه: مسببات الأمراض، والفيروسات، والأمراض، والسرطان. 

تخيل لو تمكنا من تسريع عملية إنتاج لقاحات أو أدوية لمسببات الأمراض التي ظهرت حديثا. ماذا لو كان لدينا تقنية تحرير الجينات القادرة على إنتاج البروتينات تلقائيًا لتصحيح أخطاء الحمض النووي التي تسبب السرطان؟ إن السعي لتحديد البروتينات التي يمكنها الارتباط بقوة بالأهداف أو تسريع التفاعلات الكيميائية أمر حيوي لتطوير الأدوية، والتشخيص، والعديد من التطبيقات الصناعية، ومع ذلك فهو في كثير من الأحيان مسعى طويل ومكلف.

لتعزيز قدراتنا في هندسة البروتين، توصل الباحثون في معهد ماساتشوستس للتكنولوجيا CSAIL إلى "FrameDiff"، وهي أداة حسابية لإنشاء هياكل بروتينية جديدة تتجاوز ما أنتجته الطبيعة. يولّد نهج التعلم الآلي "إطارات" تتوافق مع الخصائص المتأصلة في هياكل البروتين، مما يمكّنها من بناء بروتينات جديدة بشكل مستقل عن التصميمات الموجودة مسبقًا، مما يسهل هياكل البروتين غير المسبوقة.

"في الطبيعة، تصميم البروتين هو عملية احتراق بطيئة تستغرق ملايين السنين. "تهدف تقنيتنا إلى تقديم إجابة لمعالجة المشكلات التي من صنع الإنسان والتي تتطور بشكل أسرع بكثير من وتيرة الطبيعة" ، كما يقول طالب الدكتوراه في معهد ماساتشوستس للتكنولوجيا CSAIL جيسون ييم، المؤلف الرئيسي لورقة جديدة حول هذا العمل. "إن الهدف، فيما يتعلق بهذه القدرة الجديدة على توليد هياكل البروتين الاصطناعية، يفتح عددًا لا يحصى من القدرات المعززة، مثل الروابط الأفضل. وهذا يعني هندسة البروتينات التي يمكن أن ترتبط بجزيئات أخرى بشكل أكثر كفاءة وانتقائية، مع آثار واسعة النطاق تتعلق بتوصيل الأدوية المستهدفة والتكنولوجيا الحيوية، حيث يمكن أن يؤدي ذلك إلى تطوير أجهزة استشعار حيوية أفضل. ويمكن أن يكون لها أيضًا آثار على مجال الطب الحيوي وما بعده، مما يوفر إمكانيات مثل تطوير بروتينات التمثيل الضوئي الأكثر كفاءة، وإنشاء أجسام مضادة أكثر فعالية، وهندسة الجسيمات النانوية للعلاج الجيني. 

تأطير الإطار

للبروتينات هياكل معقدة، تتكون من العديد من الذرات المرتبطة بروابط كيميائية. الذرات الأكثر أهمية التي تحدد الشكل ثلاثي الأبعاد للبروتين تسمى "العمود الفقري"، وهو يشبه إلى حد ما العمود الفقري للبروتين. كل ثلاثية من الذرات على طول العمود الفقري تشترك في نفس نمط الروابط وأنواع الذرات. لاحظ الباحثون أنه يمكن استغلال هذا النمط لبناء خوارزميات التعلم الآلي باستخدام أفكار من الهندسة التفاضلية والاحتمالات. هذا هو المكان الذي تأتي فيه الإطارات: رياضيًا، يمكن نمذجة هذه التوائم الثلاثية كأجسام صلبة تسمى "الإطارات" (شائعة في الفيزياء) والتي لها موضع ودوران ثلاثي الأبعاد. 

تزود هذه الإطارات كل ثلاثي بمعلومات كافية للتعرف على محيطه المكاني. تتمثل المهمة بعد ذلك في أن تتعلم خوارزمية التعلم الآلي كيفية تحريك كل إطار لبناء العمود الفقري للبروتين. من خلال تعلم كيفية بناء البروتينات الموجودة، نأمل أن يتم تعميم الخوارزمية وتكون قادرة على إنشاء بروتينات جديدة لم يسبق لها مثيل في الطبيعة.

يتضمن تدريب نموذج لبناء البروتينات عن طريق "الانتشار" حقن ضوضاء تحرك جميع الإطارات بشكل عشوائي وتطمس الشكل الذي يبدو عليه البروتين الأصلي. تتمثل مهمة الخوارزمية في تحريك وتدوير كل إطار حتى يبدو مثل البروتين الأصلي. على الرغم من بساطته، فإن تطوير الانتشار على الإطارات يتطلب تقنيات في حساب التفاضل والتكامل العشوائي على المتشعبات الريمانية. على الجانب النظري، طور الباحثون تقنية "SE(3) diffusion" لتعلم التوزيعات الاحتمالية التي تربط بشكل لا تافه بين مكونات الترجمات والتدوير لكل إطار.

فن الانتشار الدقيق

في عام 2021، قدمت DeepMind AlphaFold2، وهي خوارزمية تعلم عميق للتنبؤ بهياكل البروتين ثلاثية الأبعاد من تسلسلاتها. عند إنشاء البروتينات الاصطناعية، هناك خطوتان أساسيتان: التوليد والتنبؤ. ويعني التوليد إنشاء هياكل وتسلسلات بروتينية جديدة، بينما يعني "التنبؤ" معرفة البنية ثلاثية الأبعاد للتسلسل. وليس من قبيل الصدفة أن يستخدم AlphaFold2 الإطارات أيضًا لنمذجة البروتينات. تم إلهام SE(3) diffusion وFrameDiff للارتقاء بفكرة الإطارات من خلال دمج الإطارات في نماذج الانتشار، وهي تقنية ذكاء اصطناعي توليدية أصبحت ذات شعبية كبيرة في توليد الصور، مثل Midjourney، على سبيل المثال. 

إن الأطر والمبادئ المشتركة بين توليد بنية البروتين والتنبؤ بها تعني أن أفضل النماذج من كلا الطرفين كانت متوافقة. بالتعاون مع معهد تصميم البروتين في جامعة واشنطن، يتم بالفعل استخدام تقنية الانتشار SE(3) لإنشاء بروتينات جديدة والتحقق من صحتها تجريبيًا. على وجه التحديد، قاموا بدمج نشر SE(3) مع RosettaFold2، وهي أداة للتنبؤ ببنية البروتين تشبه إلى حد كبير AlphaFold2، مما أدى إلى "RFdiffusion". جعلت هذه الأداة الجديدة مصممي البروتين أقرب إلى حل المشكلات الحاسمة في مجال التكنولوجيا الحيوية، بما في ذلك تطوير روابط بروتينية محددة للغاية لتصميم لقاح سريع، وهندسة البروتينات المتماثلة لتوصيل الجينات، والسقالات الدافعة القوية لتصميم الإنزيم الدقيق. 

تتضمن المساعي المستقبلية لـ FrameDiff تحسين عمومية المشكلات التي تجمع بين متطلبات متعددة للمواد البيولوجية مثل الأدوية. امتداد آخر هو تعميم النماذج على جميع الطرائق البيولوجية بما في ذلك الحمض النووي والجزيئات الصغيرة. يفترض الفريق أنه من خلال توسيع تدريب FrameDiff على بيانات أكثر أهمية وتعزيز عملية التحسين الخاصة به، فإنه يمكن إنشاء هياكل أساسية تتميز بقدرات التصميم على قدم المساواة مع RFdiffusion، كل ذلك مع الحفاظ على البساطة المتأصلة في FrameDiff. 

يقول سيرغي أوفتشينيكوف، عالم الأحياء الحسابي بجامعة هارفارد: "إن تجاهل نموذج التنبؤ بالبنية المُدرب مسبقًا [في FrameDiff] يفتح إمكانيات التوليد السريع لهياكل تمتد إلى أطوال كبيرة". يقدم النهج المبتكر للباحثين خطوة واعدة نحو التغلب على القيود المفروضة على نماذج التنبؤ الحالية بالبنية. وعلى الرغم من أن هذا لا يزال عملاً أوليًا، إلا أنه يمثل خطوة مشجعة في الاتجاه الصحيح. وعلى هذا النحو، فإن رؤية تصميم البروتين، التي تلعب دورًا محوريًا في معالجة التحديات الإنسانية الأكثر إلحاحًا، تبدو في متناول اليد بشكل متزايد، وذلك بفضل العمل الرائد لفريق أبحاث معهد ماساتشوستس للتكنولوجيا. 

كتب ييم الورقة البحثية جنبًا إلى جنب مع براين تريب، باحث ما بعد الدكتوراه من جامعة كولومبيا، والمركز الوطني الفرنسي للبحث العلمي في مركز باريس لعلوم البيانات، الباحث فالنتين دي بورتولي، وباحث ما بعد الدكتوراه من جامعة كامبريدج إميل ماتيو، وأستاذ الإحصاء بجامعة أكسفورد وعالم أبحاث كبير في ديب مايند أرنو دوسيه. . نصح أساتذة معهد ماساتشوستس للتكنولوجيا ريجينا بارزيلاي وتومي جاكولا بالبحث. 

تم دعم عمل الفريق، جزئيًا، من قبل معهد ماساتشوستس للتكنولوجيا، عيادة عبد اللطيف جميل للتعلم الآلي في مجال الصحة، ومنح EPSRC وشراكة الازدهار بين أبحاث مايكروسوفت وجامعة كامبريدج، وبرنامج زمالة أبحاث الدراسات العليا التابع للمؤسسة الوطنية للعلوم، ومنحة NSF Expeditions، والتعلم الآلي. لاتحاد اكتشاف الأدوية وتوليفها، وبرنامج DTRA لاكتشاف التدابير الطبية المضادة ضد التهديدات الجديدة والناشئة، وبرنامج DARPA Accelerated Molecular Discovery، ومنحة Sanofi لتصميم الأجسام المضادة الحسابية. سيتم تقديم هذا البحث في المؤتمر الدولي للتعلم الآلي في يوليو.



رابط المصدر

اترك رد

لن يتم نشر عنوان بريدك الإلكتروني. الحقول المطلوبة مشار إليها *

يمكنك استخدام علامات وسمات HTML هذه: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

arArabic