تحول در معماری هوش مصنوعی: مدل زمانمحور با الهام از مغز انسان

تحول در معماری هوش مصنوعی: مدل زمانمحور با الهام از مغز انسان
به گزارش gsxr این مدل که «ماشین تفکر پیوسته» (CTM) نام دارد، دارای رویکردی متفاوت نسبت به مدلهای زبانی فعلی است، و به جای توجه به ورودی به عنوان یک تصویر ثابت و واحد، میتواند بر چگونگی همگامسازی نورونهای مصنوعی در طول زمان تمرکز نماید.
این مدل با اتکا به مدلهای سطح نورونی(NLM) که سابقه پیوسته فعالسازیهای گذشته را ردیابی میکنند، قادر است با توجه به تاریخچهها رفتار نورونها و همگامسازی بین آنها، مدل اصلی این سیستم را شکل دهد، و طرحی بسازد که بر الگوهای موجود در مغز بیولوژیکی الهام مبتنی است.
شرکت نوپای ساکانا که در توکیو مستقر است در زمان راهاندازی یعنی در سال ۲۰۲۳ اعلام کرد که قصدش ایجاد سیستمهای هوش مصنوعی با الهام از طبیعت خواهد بود، و اکنون به نظر میرسد مدل CTM یکی از اولین نتایج این طرح کلی است.
للیون جونز، یکی از بنیانگذاران این استارتاپ، همچنین یکی از طراحان اصلی معماری Transformer بود که امروزه تقریباً زیربنای هر مدل هوش مصنوعی مولد اصلی به شمار میرود.
یک حلقه تفکر گام به گام
CTM یک مفهوم درونی از زمان – چیزی که محققان آن را “تیکهای درونی” مینامند – را معرفی میکند که از ورودی خارجی جدا شده است. این به مدل اجازه میدهد تا هنگام حل یک مسئله، به جای پرش مستقیم به یک پاسخ نهایی در یک مرحله، با طی کردن چندین مرحله درونی به نتیجه برسد.
هر مرحله با یک «مدل سیناپس» آغاز میشود که حالتهای فعلی نورون را به همراه ورودی خارجی برای تولید پیشفعالسازیها پردازش میکند. هر نورون سپس سابقهای از این پیشفعالسازیها را نگه میدارد که برای محاسبه حالتهای بهروز شده یا پسفعالسازیها در مرحله بعدی استفاده میشوند.
این حالتهای نورونی در طول زمان تجمیع میشوند و برای همگامسازی مورد تجزیه و تحلیل قرار میگیرند.
توانایی مدل برای استدلال در طول زمان به هماهنگی بین نورونها بستگی دارد. این الگوها که مبتنی بر تاریخچه فعالسازی نورونهاست، هم توجه و هم پیشبینی را هدایت میکنند. نتیجه، سیستمی است که قادر به ادغام اطلاعات در مقیاسهای زمانی متعدد، از جمله واکنشهای کوتاهمدت به ورودی جدید و تشخیص الگوی بلندمدتتر، است.
در یک آزمایش، CTM بر روی پیمایش یک هزارتو به کار گرفته شد. به نظر میرسید که مدل مسیر خود را گام به گام برنامهریزی میکند، حتی توانست تا حدی هزارتوهای بزرگتر و پیچیدهتری را که در طول آموزش ندیده بود، حل کند.
ساکانا سپس یک نسخه نمایشی تعاملی منتشر کرد که میتوانست هزارتوهای ۳۹×۳۹ را تا ۱۵۰ مرحله حل کند.
هوش مصنوعی با انعطافپذیری شناختی
یکی از ویژگیهای مهم CTM، توانایی آن در تنظیم خودکار عمق پردازش است. یعنی مدل میتواند برای مسائل سادهتر، زودتر تصمیمگیری کند و برای مسائل دشوارتر، روند استدلال را طولانیتر ادامه دهد. این رفتار، بدون نیاز به کدنویسی خاص یا معیارهای توقف از پیش تعیینشده، بهصورت طبیعی از دل معماری مدل بیرون میآید.
نگاهی به آینده
CTM قرار نیست مغز انسان را بهطور کامل شبیهسازی کند، اما از مفاهیم علوم اعصاب الهام گرفته است. برخلاف نورونهای واقعی که به تاریخچه فعالسازی خود دسترسی ندارند، این مدل با هدف رسیدن به کارایی شناختی بیشتر طراحی شده است، نه شبیهسازی بینقص بیولوژیکی.
در برخی آزمایشها عملکرد این مدل در انجام وظایفی مانند مرتبسازی اعداد یا شناسایی اعداد زوج و فرد، سریعتر و دقیقتر بود. همچنین فعالیت نورونی در این مدل، پیچیدهتر و متنوعتر به نظر میرسد.
اگر چه مدل CTM فعالیت عصبی پیچیدهتری نسبت به مدلهای تثبیتشده تولید میکند، اما مشخص نیست که آیا در کاربرد عملی از آنها بهتر عمل خواهد کرد یا خیر، به خصوص از آنجایی که به قدرت محاسباتی بیشتر و دورههای آموزشی طولانیتری نیاز دارد.
شرکت ساکانا کد و نقاط کنترل مدل خود را به شکل متنباز منتشر کرده است و امیدوار است CTM به عنوان پایهای برای تحقیقات آینده در سیستمهای هوش مصنوعی الهامگرفته از زیستشناسی عمل مورد استفاده قرار گیرد.
منبع: the-decoder