آیا هوش مصنوعی میتواند داروها و مواد آینده را طراحی کند؟

آیا هوش مصنوعی میتواند داروها و مواد آینده را طراحی کند؟
به گزارش gsxr و به نقل از سایتکدیلی، اکنون گروهی از پژوهشگران MIT و آزمایشگاه هوش مصنوعی MIT-IBM Watson رویکردی نوین و امیدوارکننده ارائه دادهاند. آنها با ترکیب LLM با نوعی دیگر از مدلهای یادگیری ماشین به نام «مدلهای گرافمحور»، توانستهاند روشی چندوجهی برای طراحی مولکولها توسعه دهند. این مدلهای گرافمحور بهطور خاص برای پیشبینی ساختارهای مولکولی طراحی شدهاند.
این سامانهٔ نوین با استفاده از یک LLM پایه، ابتدا درخواست کاربر را به زبان طبیعی تفسیر میکند، سپس بهصورت خودکار میان این مدل زبانی و ماژولهای گرافی جابهجا میشود تا ساختار مولکولی را طراحی کند، دلایل طراحی را توضیح دهد و گامبهگام، نقشهٔ سنتز (ساخت) مولکول را ارائه دهد.
بر این اساس، سیستم LLM از ترکیب متن، گراف و مراحل واکنش شیمیایی استفاده میکند و این دادههای متنوع را به زبانی مشترک برای پردازش در مدل زبانی تبدیل میکند.
در آزمایشهای مقایسهای، این روش جدید توانست مولکولهایی بسیار دقیقتر و با احتمال بالاتری برای سنتز موفق ارائه دهد و نرخ موفقیت را از ۵ درصد به ۳۵ درصد برساند.
جالب آنکه این سیستم حتی از مدلهای زبانی ۱۰ برابر بزرگتر که فقط با متن کار میکنند نیز عملکرد بهتری داشت؛ نکتهای که نشان میدهد «چندوجهیبودن» عامل کلیدی در موفقیت این فناوری بوده است.
مایکل سان (دانشجوی دکترای MIT و از نویسندگان مقالهٔ این پژوهش) میگوید: «اگر این سیستم بتواند از ابتدا تا انتها فرآیند طراحی و ساخت یک مولکول را خودکار کند، صرفهجویی بزرگی برای شرکتهای داروسازی خواهد بود. کافی است مدل در عرض چند ثانیه پاسخ طراحی را ارائه دهد.»
ترکیب متن و گراف: بهترینهای دو دنیا
مدلهای زبانی بزرگ، ذاتاً برای درک شیمی ساخته نشدهاند؛ آنها دادهها را به توکنهایی تبدیل میکنند و براساس آنها، پیشبینی کلمهٔ بعدی را انجام میدهند. اما ساختار مولکولها مانند جملات نیست؛ آنها بیشتر شبیه گرافهایی هستند که شامل اتمها (گرهها) و پیوندها (یالها) بدون نظم خاصی هستند.
از سوی دیگر، مدلهای گرافی قادرند ساختارهای مولکولی را بهصورت دقیقتری نمایش دهند، اما نمیتوانند زبان طبیعی را درک کنند و اغلب خروجیهایی پیچیده و غیرقابل تفسیر تولید میکنند.
اینجاست که «لامول» (Llamole) ــ مخفف Large Language Model for Molecular Discovery ــ وارد میدان میشود. این سیستم ابتدا درخواست زبانی کاربر را درک کرده و سپس به کمک ماژولهای گرافی ساختار مناسب را طراحی میکند.
برای نمونه، اگر کاربری بخواهد مولکولی با وزن مولکولی ۲۰۹ داشته باشد که از سد خونی-مغزی عبور کرده و HIV را مهار کند، سیستم ابتدا این خواسته را تحلیل کرده، سپس ماژولهای گرافی را فعال میکند: ماژول نخست با مدل انتشار گراف، ساختار مولکولی را طراحی میکند؛ ماژول دوم با شبکهٔ عصبی گرافی، ساختار طراحیشده را برای مدل LLM بازکدگذاری میکند؛ و ماژول سوم نیز مراحل واکنش شیمیایی را برای سنتز مولکول پیشنهاد میدهد.
ساختارهایی سادهتر با هزینهٔ کمتر
در پایان، خروجی سامانه شامل تصویر مولکول، توضیح متنی ویژگیهای آن و فهرستی از مراحل سنتز شیمیایی است. آزمایشها نشان دادند که این سیستم در طراحی مولکولهایی با ساختار سادهتر و مواد اولیهٔ ارزانتر، موفقتر از ۱۰ مدل LLM استاندارد، ۴ مدل تنظیمشده، و حتی یک روش پیشرفتهٔ دامنهمحور عمل کرده است.
گنگ لیو میگوید: «مدلهای زبانی معمولی نمیتوانند مراحل پیچیدهٔ سنتز را بهدرستی طراحی کنند، اما رویکرد ما هم ساختار بهتری تولید میکند و هم مراحل ساخت را سادهتر میسازد.»
شایان ذکر است که فعلاً این مدل تنها با ۱۰ ویژگی مولکولی عددی آموزش دیده است، اما پژوهشگران در گامهای بعدی میخواهند آن را به تمام ویژگیهای مولکولی تعمیم دهند.