يحصل مبرمجو البروتين على يد المساعدة من الذكاء الاصطناعي التوليدي في Cradle
يحصل مبرمجو البروتين على يد المساعدة من الذكاء الاصطناعي التوليدي في Cradle
البروتينات هي الجزيئات التي تنجز العمل في الطبيعة ، وهناك صناعة كاملة ناشئة حول تعديلها وتصنيعها بنجاح لاستخدامات مختلفة. لكن القيام بذلك يستغرق وقتًا طويلاً وعشوائيًا ؛ مهد الحضارة ويهدف إلى تغيير ذلك باستخدام أداة مدعومة بالذكاء الاصطناعي تخبر العلماء بالتراكيب والتسلسلات الجديدة التي ستجعل البروتين يفعل ما يريده أن يفعله. خرجت الشركة من التخفي اليوم بجولة بذرة كبيرة.
ظهر الذكاء الاصطناعي والبروتينات في الأخبار مؤخرًا ، ولكن يرجع ذلك إلى حد كبير إلى جهود المؤسسات البحثية مثل DeepMind و Baker Lab. تأخذ نماذج التعلم الآلي الخاصة بهم بيانات تسلسل الحمض النووي الريبي التي تم جمعها بسهولة وتتنبأ بالبنية التي سيتخذها البروتين – وهي خطوة كانت تستغرق أسابيع ومعدات خاصة باهظة الثمن.
ولكن على الرغم من أن هذه القدرة لا تصدق في بعض المجالات ، فهي مجرد نقطة انطلاق للآخرين. يتضمن تعديل البروتين ليكون أكثر استقرارًا أو الارتباط بجزيء آخر أكثر بكثير من مجرد فهم شكله العام وحجمه.
“إذا كنت مهندس بروتين ، وتريد تصميم خاصية معينة أو وظيفة معينة في بروتين ، فإن مجرد معرفة شكله لا يساعدك. أوضح الرئيس التنفيذي لشركة Cradle والمؤسس المشارك Stef van Grieken أنه إذا كانت لديك صورة لجسر ، فهذا لا يخبرك ما إذا كان سيسقط أم لا.
“يأخذ Alphafold تسلسلاً ويتنبأ كيف سيبدو البروتين” ، تابع. “نحن الأخ المولِّد لذلك: أنت تختار الخصائص التي تريد هندستها ، وسيقوم النموذج بإنشاء تسلسلات يمكنك اختبارها في مختبرك.”
توقع ما ستفعله البروتينات – خاصة الجديدة على العلم – بالموقع هي مهمة صعبة للعديد من الأسباب ، ولكن في سياق التعلم الآلي ، تكمن المشكلة الأكبر في عدم توفر بيانات كافية. لذلك نشأ Cradle الكثير من مجموعة البيانات الخاصة به في مختبر رطب ، حيث يختبر البروتين بعد البروتين ويرى التغييرات في تسلسلها الذي يبدو أنه يؤدي إلى التأثيرات.
ومن المثير للاهتمام أن النموذج نفسه ليس خاصًا بالتكنولوجيا الحيوية تمامًا ولكنه مشتق من نفس “نماذج اللغة الكبيرة” التي أنتجت محركات إنتاج نصوص مثل GPT-3. لاحظ فان جريكين أن هذه النماذج لا تقتصر بشكل صارم على اللغة في كيفية فهمها للبيانات والتنبؤ بها ، وهي خاصية “تعميم” مثيرة للاهتمام لا يزال الباحثون يستكشفونها.
تسلسل البروتينات التي يتناولها Cradle ويتنبأ بها ليست بأي لغة نعرفها ، بالطبع ، لكنها عبارة عن تسلسلات خطية مباشرة نسبيًا للنص والتي لها معاني مرتبطة. قال فان جريكن: “إنها مثل لغة برمجة غريبة”.
مهندسو البروتين ليسوا عاجزين بالطبع ، لكن عملهم ينطوي بالضرورة على الكثير من التخمين. قد يكون المرء على يقين من أنه من بين التسلسلات المائة التي يقومون بتعديلها ، فإن المجموعة التي ستنتج التأثير المطلوب ، ولكن أبعد من ذلك ، فإن الأمر يتعلق باختبار شامل. القليل من التلميح هنا يمكن أن يسرع الأمور بشكل كبير ويتجنب قدرًا هائلاً من العمل غير المثمر.
يعمل النموذج في ثلاث طبقات أساسية ، وهو ما أوضحه. يقوم أولاً بتقييم ما إذا كان تسلسل معين “طبيعي” ، أي. سواء كانت سلسلة ذات مغزى من الأحماض الأمينية أو مجرد أحماض عشوائية. هذا يشبه نموذج اللغة فقط القدرة على القول بثقة 99 ٪ أن الجملة باللغة الإنجليزية (أو السويدية ، في مثال فان جريكن) ، والكلمات بالترتيب الصحيح. هذا يعرف من “قراءة” الملايين من مثل هذه التسلسلات التي يحددها تحليل معمل.
بعد ذلك يبحث في المعنى الفعلي أو المحتمل في اللغة الغريبة للبروتين. قال: “تخيل أننا نقدم لك تسلسلاً ، وهذه هي درجة الحرارة التي سينهار فيها هذا التسلسل”. “إذا فعلت ذلك للعديد من التسلسلات ، يمكنك أن تقول ليس فقط ،” هذا يبدو طبيعيًا ، ولكن “هذا يبدو 26 درجة مئوية.” “هذا يساعد النموذج على معرفة مناطق البروتين التي يجب التركيز عليها.”
يمكن للنموذج بعد ذلك أن يقترح تسلسلات لإدخال التخمينات المتعلمة ، بشكل أساسي ، ولكن نقطة انطلاق أقوى من نقطة الصفر. يمكن للمهندس أو المعمل بعد ذلك تجربتها وإعادة تلك البيانات إلى منصة Cradle ، حيث يمكن إعادة استثمارها واستخدامها لضبط النموذج وفقًا للموقف.
يعد تعديل البروتينات لأغراض مختلفة مفيدًا عبر التكنولوجيا الحيوية ، من تصميم الأدوية إلى التصنيع الحيوي ، ويمكن أن يكون المسار من جزيء الفانيليا إلى الجزيء المخصص والفعال والفعال طويلًا ومكلفًا. من المرجح أن يتم الترحيب بأي طريقة لتقصيرها ، على الأقل ، من قبل تقنيي المختبرات الذين يتعين عليهم إجراء مئات التجارب فقط للحصول على نتيجة جيدة واحدة.
تعمل شركة Cradle في مجال التسلل وهي الآن في طور النمو بعد أن جمعت 5.5 مليون دولار في جولة أولية بقيادة شركة إندكس فنتشرز وكيندريد كابيتال ، بمشاركة الملائكة جون زيمر وفيكي سيبيزما وإميلي ليبروست.
قال Van Grieken إن التمويل سيسمح للفريق بتوسيع نطاق جمع البيانات – كلما كان ذلك أفضل عندما يتعلق الأمر بالتعلم الآلي – والعمل على المنتج لجعله “أكثر خدمة ذاتية”.
قال فان جريكن في البيان الصحفي: “يتمثل هدفنا في تقليل تكلفة ووقت طرح منتج حيوي في السوق بترتيب كبير” ، “حتى يتمكن أي شخص – حتى” طفلين في مرآبهم “- من إحضار هو – هي. منتج حيوي في السوق “.