اجرای هوش مصنوعی روی ویندوز ۹۸؛ شاهکاری از گذشته برای آینده!

در شاهکاری شگفتانگیز، تیمی از پژوهشگران EXO Labs موفق شدند مدل زبانیلاما ۲ را روی سیستمی قدیمی با ویندوز ۹۸، پردازنده پنتیوم II و تنها ۱۲۸ مگابایت حافظه رم اجرا کنند. این دستاورد که در قالب یک ویدئو در شبکههای اجتماعی به نمایش گذاشته شد، نشان میدهد که این مدل با سرعت قابل قبول ۳۵.۹ توکن در ثانیه، قادر به تولید متن است. پیشنهاد میکنیم خودتان این ویدئو جالب را ببینید.
جیب نیوز – در این ویدئو، یک کامپیوتر قدیمی با برند Elonex و پردازنده پنتیوم II با فرکانس ۳۵۰ مگاهرتز دید میشود که ویندوز ۹۸ را اجرا میکند. سپس تیم EXO موتور پردازش اختصاصی خود را که بر اساس کد ساده و قدرتمند Llama2.c از آندری کارپاتی طراحی شده، اجرا میکند. این مدل حتی توانست داستانی با موضوع «جو خوابآلود» را با سرعتی قابل قبول تولید کند.
پروژه بلندپروازانه BitNet
به گزارش شهر سخت افزار، EXO Labs، سازمانی که اخیراً از پشت پرده فعالیتهای خود پردهبرداری کرده، مأموریت خود را «دموکراتیزه کردن دسترسی به هوش مصنوعی» تعریف کرده است. این تیم که از پژوهشگران دانشگاه آکسفورد تشکیل شده، به دنبال ایجاد زیرساختهای باز برای آموزش و اجرای مدلهای پیشرفته هوش مصنوعی روی هر دستگاهی است. اجرای موفقیتآمیز مدل لاما روی ویندوز ۹۸، نمادی از این چشمانداز است تا نشان دهد که هوش مصنوعی میتواند روی منابعی با سختافزار محدود نیز قابل اجرا باشد.
اجرای چنین پروژهای روی سیستمی با قدمت ۲۶ سال با چالشهای فراوانی همراه بود. از جمله انتقال دادهها به این سیستم قدیمی که با استفاده از پروتکل FTP و پورت اترنت انجام شد. بزرگترین چالش، اما، تطبیق کدهای مدرن با ویندوز ۹۸ بود. تیم EXO با استفاده از IDE قدیمی Borland C++ 5.02 و چند تغییر کوچک، توانستند کدهای Karpathy را برای این سیستم سازگار کنند.
به گفته یکی از اعضای تیم، الکس چیما، مدل ۲۶۰ هزار پارامتری لاما با معماری اختصاصی و بهینه، توانست با سرعت ۳۵.۹ توکن در ثانیه اجرا شود. اما با افزایش پیچیدگی مدلها، سرعت کاهش یافت؛ به طوری که مدل ۱۵ میلیون پارامتری تنها با سرعت ۱ توکن در ثانیه و مدل بزرگتر ۱ میلیارد پارامتری با سرعت بسیار پایین ۰.۰۰۹۳ توکن در ثانیه اجرا شد.

این پروژه تنها بخشی از برنامه بزرگتر EXO با عنوان BitNet است. BitNet مدلی با معماری ترانسفورمر و وزنهای سهتایی است که به گفته EXO، میتواند یک مدل ۷ میلیارد پارامتری را تنها در ۱.۳۸ گیگابایت ذخیرهسازی کند. این فناوری جدید نه تنها نیاز به سختافزارهای گرانقیمت و به ویژه شتاب دهنده گرافیکی را از بین میبرد، بلکه ۵۰ درصد کارآمدتر از مدلهای دقیق عمل میکند. به ادعای تیم EXO، یک مدل ۱۰۰ میلیارد پارامتری BitNet حتی روی یک پردازنده مرکزی معمولی میتواند با سرعت خوانش انسانی اجرا شود.
EXO Labs همچنان به دنبال همکاریهای جدید است. این سازمان از افرادی که علاقهمند به جلوگیری از انحصار هوش مصنوعی توسط شرکتهای بزرگ هستند، دعوت به همکاری کرده است. همچنین، علاقهمندان میتوانند در کانال Discord این تیم، درباره اجرای مدلهای هوش مصنوعی روی سختافزارهای قدیمی، مانند مکهای قدیمی، گیمبویها و Raspberry Pi، به بحث بپردازند.
این پروژه نشان میدهد که آینده هوش مصنوعی میتواند فراتر از مراکز داده گرانقیمت باشد و بهسادگی در دسترس همگان قرار گیرد.




