به گزارش رسانههای محلی، پژوهشگران «مؤسسه اتوماسیون آکادمی علوم چین» در پکن سامانهای تازه با نام SpikingBrain 1.0 معرفی کردهاند. این مدل زبانی بزرگ هوش مصنوعی که از سوی تیم سازنده «مغزگونه» توصیف شده، با هدف مصرف انرژی کمتر و استفاده از سختافزار بومی چین توسعه یافته است؛ بهجای اتکا به تراشههای شرکت پیشرو انویدیا.
پژوهشگران در مقالهای فنی که هنوز بهصورت داوریشده منتشر نشده، تأکید کردهاند: «مدلهای زبانی بزرگ مبتنی بر ترنسفورمر با گلوگاههای جدی کارایی مواجهاند؛ محاسبات آموزش آنها بهشکل نمایی با طول توالی افزایش مییابد و حافظه در مرحله استنتاج نیز بهطور خطی رشد میکند.»
بر پایه نتایج این تحقیق، SpikingBrain 1.0 توانسته برخی وظایف را تا ۱۰۰ برابر سریعتر از مدلهای متداول انجام دهد؛ آن هم در حالی که تنها با کمتر از ۲ درصد دادههای معمول برای آموزش مدلهای مشابه تغذیه شده است. این پروژه بخشی از جریان گستردهتر «رایانش نورومورفیک» محسوب میشود؛ رویکردی علمی که میکوشد بهرهوری شگفتانگیز مغز انسان را بازآفرینی کند؛ مغزی که تنها با حدود ۲۰ وات انرژی فعالیت میکند.
الهام از سازوکار مغز انسان
فناوری محوری در SpikingBrain 1.0 «محاسبات اسپایکینگ» نام دارد؛ روشی که عملکرد نورونهای زیستی را شبیهسازی میکند. در این شیوه، بهجای فعال شدن کل شبکه، همانند ابزارهایی چون ChatGPT، شبکه عمدتاً خاموش میماند و تنها هنگام دریافت ورودی مشخص، نورونها سیگنال شلیک میکنند. همین واکنش انتخابی کلید مصرف انرژی پایینتر و سرعت پردازش بالاتر است.
برای اثبات این رویکرد، تیم پژوهشی دو نسخه از مدل را توسعه داد: نسخهای کوچک با ۷ میلیارد پارامتر و نسخهای بزرگتر با ۷۶ میلیارد پارامتر. هر دو با مجموع حدود ۱۵۰ میلیارد توکن داده آموزش دیدند؛ رقمی نسبتاً اندک برای مدلهایی در این ابعاد.
بازدهی این سیستم بهویژه در پردازش توالیهای بسیار طولانی داده چشمگیر بوده است. در یکی از آزمایشها، مدل کوچک توانست به پرسشی با چهار میلیون توکن بیش از ۱۰۰ برابر سریعتر از سیستمهای استاندارد پاسخ دهد. در آزمایشی دیگر، گونهای از SpikingBrain 1.0 در تولید نخستین توکن از متنی یکمیلیونتوکنی، سرعتی ۲۶.۵ برابر بیشتر از معماریهای ترنسفورمر رایج داشت.
پایداری و کاربردهای گسترده
طبق گزارش پژوهشگران، این سامانه هفتهها بدون وقفه بر روی صدها تراشه MetaX، محصول شرکت «MetaX Integrated Circuits» مستقر در شانگهای، اجرا شد. عملکرد پایدار روی سختافزار بومی نشاندهنده ظرفیت بالای این فناوری برای کاربردهای عملی است.
کاربردهای بالقوه این سیستم شامل تحلیل اسناد طولانی حقوقی و پزشکی، پژوهش در حوزه فیزیک پرانرژی و وظایف پیچیدهای چون توالییابی DNA میشود؛ حوزههایی که نیازمند پردازش سریع و کارآمد دادههای عظیم هستند.
پژوهشگران در پایان مقاله خود نتیجهگیری کردهاند: «این دستاورد نهتنها امکان آموزش کارآمد مدلهای بزرگ بر بسترهای غیرانویدیا را نشان میدهد، بلکه مسیرهای تازهای برای استقرار مقیاسپذیر و بهرهگیری از مدلهای الهامگرفته از مغز در سامانههای رایانشی آینده ترسیم میکند.»