जीवविज्ञान एक अद्भुत लेकिन नाजुक टेपेस्ट्री है। दिल में डीएनए है, मास्टर बुनकर जो प्रोटीन को एनकोड करता है, जो मानव शरीर के भीतर जीवन को बनाए रखने वाले कई जैविक कार्यों को व्यवस्थित करने के लिए जिम्मेदार है। हालाँकि, हमारा शरीर एक सूक्ष्मता से तैयार किए गए यंत्र के समान है, जो अपना सामंजस्य खोने के लिए अतिसंवेदनशील है। आख़िरकार, हमारा सामना निरंतर बदलती और अनवरत प्राकृतिक दुनिया से है: रोगजनक, वायरस, बीमारियाँ और कैंसर।
कल्पना कीजिए कि क्या हम नए उभरे रोगजनकों के लिए टीके या दवाएँ बनाने की प्रक्रिया में तेजी ला सकते हैं। क्या होगा अगर हमारे पास जीन संपादन तकनीक हो जो कैंसर का कारण बनने वाली डीएनए त्रुटियों को सुधारने के लिए स्वचालित रूप से प्रोटीन का उत्पादन करने में सक्षम हो? प्रोटीन की पहचान करने की खोज जो लक्ष्य से मजबूती से जुड़ सकती है या रासायनिक प्रतिक्रियाओं को तेज कर सकती है, दवा विकास, निदान और कई औद्योगिक अनुप्रयोगों के लिए महत्वपूर्ण है, फिर भी यह अक्सर एक लंबा और महंगा प्रयास है।
प्रोटीन इंजीनियरिंग में हमारी क्षमताओं को आगे बढ़ाने के लिए, MIT CSAIL के शोधकर्ता "फ़्रेमडिफ़" लेकर आए, जो प्रकृति द्वारा उत्पादित प्रोटीन से परे नई प्रोटीन संरचनाएँ बनाने के लिए एक कम्प्यूटेशनल उपकरण है। मशीन लर्निंग दृष्टिकोण "फ़्रेम" उत्पन्न करता है जो प्रोटीन संरचनाओं के अंतर्निहित गुणों के साथ संरेखित होता है, जो इसे पहले से मौजूद डिज़ाइनों से स्वतंत्र रूप से उपन्यास प्रोटीन का निर्माण करने में सक्षम बनाता है, जिससे अभूतपूर्व प्रोटीन संरचनाओं की सुविधा मिलती है।
“प्रकृति में, प्रोटीन डिज़ाइन एक धीमी गति से जलने वाली प्रक्रिया है जिसमें लाखों वर्ष लगते हैं। हमारी तकनीक का लक्ष्य मानव-निर्मित समस्याओं से निपटने का उत्तर प्रदान करना है जो प्रकृति की गति से कहीं अधिक तेजी से विकसित होती हैं, ”एमआईटी सीसेल पीएचडी छात्र जेसन यिम, काम के बारे में एक नए पेपर के प्रमुख लेखक कहते हैं। “सिंथेटिक प्रोटीन संरचनाओं को उत्पन्न करने की इस नई क्षमता के संबंध में उद्देश्य, बेहतर बाइंडर्स जैसी अनगिनत बढ़ी हुई क्षमताओं को खोलता है। इसका मतलब इंजीनियरिंग प्रोटीन है जो लक्षित दवा वितरण और जैव प्रौद्योगिकी से संबंधित व्यापक निहितार्थों के साथ अन्य अणुओं से अधिक कुशलतापूर्वक और चयनात्मक रूप से जुड़ सकता है, जहां इसके परिणामस्वरूप बेहतर बायोसेंसर का विकास हो सकता है। इसका बायोमेडिसिन और उससे आगे के क्षेत्र पर भी प्रभाव पड़ सकता है, जो अधिक कुशल प्रकाश संश्लेषण प्रोटीन विकसित करने, अधिक प्रभावी एंटीबॉडी बनाने और जीन थेरेपी के लिए इंजीनियरिंग नैनोकणों जैसी संभावनाएं प्रदान करता है।
फ़्रेमिंग फ़्रेमडिफ़
प्रोटीन में जटिल संरचनाएं होती हैं, जो रासायनिक बंधों से जुड़े कई परमाणुओं से बनी होती हैं। सबसे महत्वपूर्ण परमाणु जो प्रोटीन के 3डी आकार को निर्धारित करते हैं उन्हें "रीढ़ की हड्डी" कहा जाता है, जो प्रोटीन की रीढ़ की तरह होती है। रीढ़ की हड्डी के साथ परमाणुओं का प्रत्येक त्रिक बंधन और परमाणु प्रकारों का समान पैटर्न साझा करता है। शोधकर्ताओं ने देखा कि इस पैटर्न का उपयोग अंतर ज्यामिति और संभाव्यता के विचारों का उपयोग करके मशीन लर्निंग एल्गोरिदम बनाने के लिए किया जा सकता है। यह वह जगह है जहां फ़्रेम आते हैं: गणितीय रूप से, इन त्रिक को कठोर निकायों के रूप में मॉडल किया जा सकता है जिन्हें "फ़्रेम" (भौतिकी में सामान्य) कहा जाता है जिनकी स्थिति और रोटेशन 3 डी में होता है।
ये फ़्रेम प्रत्येक त्रिक को उसके स्थानिक परिवेश के बारे में जानने के लिए पर्याप्त जानकारी से सुसज्जित करते हैं। फिर मशीन लर्निंग एल्गोरिदम का काम यह सीखना है कि प्रोटीन बैकबोन बनाने के लिए प्रत्येक फ्रेम को कैसे स्थानांतरित किया जाए। उम्मीद है कि मौजूदा प्रोटीन का निर्माण करना सीखकर, एल्गोरिदम सामान्यीकृत हो जाएगा और प्रकृति में पहले कभी नहीं देखे गए नए प्रोटीन बनाने में सक्षम होगा।
"प्रसार" के माध्यम से प्रोटीन के निर्माण के लिए एक मॉडल को प्रशिक्षित करने में शोर को इंजेक्ट करना शामिल है जो सभी फ़्रेमों को बेतरतीब ढंग से स्थानांतरित करता है और मूल प्रोटीन को धुंधला कर देता है। एल्गोरिदम का काम प्रत्येक फ्रेम को तब तक हिलाना और घुमाना है जब तक कि वह मूल प्रोटीन की तरह न दिखने लगे। हालांकि सरल, फ्रेम पर प्रसार के विकास के लिए रीमैनियन मैनिफोल्ड्स पर स्टोकेस्टिक कैलकुलस में तकनीकों की आवश्यकता होती है। सिद्धांत पक्ष पर, शोधकर्ताओं ने संभाव्यता वितरण सीखने के लिए "एसई (3) प्रसार" विकसित किया जो प्रत्येक फ्रेम के अनुवाद और घूर्णन घटकों को गैर-तुच्छ रूप से जोड़ता है।
प्रसार की सूक्ष्म कला
2021 में, डीपमाइंड ने अल्फाफोल्ड2 पेश किया, जो उनके अनुक्रमों से 3डी प्रोटीन संरचनाओं की भविष्यवाणी करने के लिए एक गहन शिक्षण एल्गोरिदम है। सिंथेटिक प्रोटीन बनाते समय, दो आवश्यक चरण होते हैं: पीढ़ी और भविष्यवाणी। पीढ़ी का अर्थ है नई प्रोटीन संरचनाओं और अनुक्रमों का निर्माण, जबकि "भविष्यवाणी" का अर्थ है यह पता लगाना कि अनुक्रम की 3डी संरचना क्या है। यह कोई संयोग नहीं है कि अल्फाफोल्ड2 ने प्रोटीन को मॉडल करने के लिए फ्रेम का भी उपयोग किया। एसई(3) डिफ्यूजन और फ्रेमडिफ को डिफ्यूजन मॉडल में फ्रेम को शामिल करके फ्रेम के विचार को आगे ले जाने के लिए प्रेरित किया गया, एक जेनरेटिव एआई तकनीक जो छवि निर्माण में बेहद लोकप्रिय हो गई है, उदाहरण के लिए मिडजर्नी की तरह।
प्रोटीन संरचना निर्माण और भविष्यवाणी के बीच साझा फ्रेम और सिद्धांतों का मतलब था कि दोनों छोर से सर्वोत्तम मॉडल संगत थे। वाशिंगटन विश्वविद्यालय में प्रोटीन डिज़ाइन संस्थान के सहयोग से, एसई(3) प्रसार का उपयोग पहले से ही नए प्रोटीन बनाने और प्रयोगात्मक रूप से मान्य करने के लिए किया जा रहा है। विशेष रूप से, उन्होंने एसई(3) प्रसार को रोसेटाफोल्ड2 के साथ जोड़ा, जो अल्फाफोल्ड2 की तरह एक प्रोटीन संरचना भविष्यवाणी उपकरण है, जिसके कारण "आरएफडिफ्यूजन" हुआ। इस नए उपकरण ने प्रोटीन डिजाइनरों को जैव प्रौद्योगिकी में महत्वपूर्ण समस्याओं को हल करने के करीब ला दिया, जिसमें त्वरित वैक्सीन डिजाइन के लिए अत्यधिक विशिष्ट प्रोटीन बाइंडर्स का विकास, जीन वितरण के लिए सममित प्रोटीन की इंजीनियरिंग और सटीक एंजाइम डिजाइन के लिए मजबूत मोटिफ मचान शामिल है।
फ़्रेमडिफ़ के भविष्य के प्रयासों में उन समस्याओं की व्यापकता में सुधार करना शामिल है जो दवाओं जैसे जीवविज्ञान के लिए कई आवश्यकताओं को जोड़ती हैं। एक अन्य विस्तार डीएनए और छोटे अणुओं सहित सभी जैविक तौर-तरीकों के लिए मॉडलों को सामान्य बनाना है। टीम का मानना है कि अधिक महत्वपूर्ण डेटा पर फ्रेमडिफ के प्रशिक्षण का विस्तार करके और इसकी अनुकूलन प्रक्रिया को बढ़ाकर, यह फ्रेमडिफ की अंतर्निहित सादगी को संरक्षित करते हुए, आरएफडिफ्यूजन के बराबर डिजाइन क्षमताओं का दावा करने वाली मूलभूत संरचनाएं उत्पन्न कर सकता है।
हार्वर्ड यूनिवर्सिटी के कम्प्यूटेशनल जीवविज्ञानी सर्गेई ओविचिनिकोव कहते हैं, "फ्रेमडिफ़ में एक पूर्व-प्रशिक्षित संरचना भविष्यवाणी मॉडल को त्यागने से बड़ी लंबाई तक फैली संरचनाओं को तेजी से उत्पन्न करने की संभावनाएं खुलती हैं।" शोधकर्ताओं का अभिनव दृष्टिकोण वर्तमान संरचना भविष्यवाणी मॉडल की सीमाओं पर काबू पाने की दिशा में एक आशाजनक कदम प्रदान करता है। हालाँकि यह अभी भी प्रारंभिक कार्य है, यह सही दिशा में एक उत्साहजनक प्रगति है। इस प्रकार, मानवता की सबसे गंभीर चुनौतियों से निपटने में महत्वपूर्ण भूमिका निभाने वाले प्रोटीन डिजाइन का दृष्टिकोण, इस एमआईटी अनुसंधान टीम के अग्रणी कार्य के लिए धन्यवाद, तेजी से पहुंच के भीतर लगता है।
यिम ने कोलंबिया यूनिवर्सिटी के पोस्टडॉक ब्रायन ट्रिप्पे, पेरिस के फ्रेंच नेशनल सेंटर फॉर साइंटिफिक रिसर्च के सेंटर फॉर साइंस ऑफ डेटा के शोधकर्ता वैलेन्टिन डी बोर्तोली, कैम्ब्रिज यूनिवर्सिटी के पोस्टडॉक एमिल मैथ्यू और ऑक्सफोर्ड यूनिवर्सिटी के प्रोफेसर ऑफ स्टैटिस्टिक्स और डीपमाइंड अरनॉड डौकेट के वरिष्ठ शोध वैज्ञानिक के साथ पेपर लिखा। . एमआईटी के प्रोफेसर रेजिना बार्ज़िले और टॉमी जाक्कोला ने शोध की सलाह दी।
टीम के काम को आंशिक रूप से स्वास्थ्य में मशीन लर्निंग के लिए एमआईटी अब्दुल लतीफ जमील क्लिनिक, ईपीएसआरसी अनुदान और माइक्रोसॉफ्ट रिसर्च और कैम्ब्रिज यूनिवर्सिटी के बीच समृद्धि साझेदारी, नेशनल साइंस फाउंडेशन ग्रेजुएट रिसर्च फेलोशिप प्रोग्राम, एनएसएफ अभियान अनुदान, मशीन लर्निंग द्वारा समर्थित किया गया था। फार्मास्युटिकल डिस्कवरी और सिंथेसिस कंसोर्टियम के लिए, नए और उभरते खतरों के खिलाफ मेडिकल काउंटरमेशर्स की डीटीआरए डिस्कवरी कार्यक्रम, डीएआरपीए त्वरित आणविक डिस्कवरी कार्यक्रम और सनोफी कम्प्यूटेशनल एंटीबॉडी डिजाइन अनुदान। यह शोध जुलाई में मशीन लर्निंग पर अंतर्राष्ट्रीय सम्मेलन में प्रस्तुत किया जाएगा।
उत्तर छोड़ दें