به تازگی یک برنامهنویس لهستانی پس از 10 ساعت رقابت فشرده موفق شد مدل هوش مصنوعی کمپانی اوپنایآی را شکست دهد.
به گزارش تکراتو و به نقل از arstechnica، یک برنامهنویس لهستانی در حالی که کاملاً خسته و بیرمق شده بود، موفق شد کاری انجام دهد که شاید بهزودی غیرممکن شود: شکست دادن یک مدل پیشرفته هوش مصنوعی از شرکت اپنایآی در رقابت کدنویسی. این ماراتن ۱۰ ساعته آنقدر سنگین بود که او پس از پایان رقابت گفت کاملاً از پا افتاده است.
در روز چهارشنبه، پرژمیسواف دمبیاک که با نام کاربری سایخو شناخته میشود و پیشتر در اپنایآی فعالیت داشته، توانست مدل ویژه این شرکت را در فینال مسابقات جهانی AtCoder 2025 در بخش Heuristic شکست دهد.
این رقابت در توکیو برگزار شد و اپنایآی علاوه بر حمایت مالی، با یک مدل هوش مصنوعی اختصاصی هم در بخش ویژهای تحت عنوان «انسان در برابر هوش مصنوعی» شرکت کرد. با وجود این که مدل اپنایآی نیاز به استراحت نداشت، در نهایت جایگاه دوم را از آن خود کرد.
دمبیاک در شبکه اجتماعی ایکس نوشت: انسان فعلاً پیروز شد. او اشاره کرد که طی سه روز گذشته، با کمترین میزان خواب در چندین مسابقه شرکت کرده و دیگر توان جسمی برایش نمانده بود.
در این رقابت، شرکتکنندگان باید طی ۶۰۰ دقیقه تنها یک مسئله پیچیده بهینهسازی را حل میکردند. داستان این رقابت یادآور افسانه آمریکایی جان هنری، مرد آهنکوبی است که در دهه ۱۸۷۰ با یک دستگاه بخار مسابقه داد. همانند آن داستان، دمبیاک نیز تمام توان خود را برای نشان دادن برتری انسانی در برابر فناوری صرف کرد.
در هر دو داستان، تلاش طاقتفرسا محور اصلی است؛ هنری تا سر حد مرگ کار کرد، و دمبیاک نیز با کمخوابی شدید، ۱۰ ساعت بیوقفه کد نوشت. هر دو پیروزی طعمی تلخ دارند: هنری برنده شد اما جان باخت، و دمبیاک نیز میداند که این برتری شاید موقتی باشد.
دمبیاک با برد خود ۵۰۰ هزار ین جایزه گرفت، در حالی که بهتر از جان هنری سرپا ماند. این رقابتها که در ردهای بسیار بالا برگزار میشوند، ذهن انسان و ماشین را به چالش میکشند تا در حل مسائل پیچیده که پاسخ دقیقی ندارند، راهحلهای بهتر و بهینهتری ارائه دهند.
فینال تور جهانی AtCoder از جمله رقابتهای بسیار خاص برنامهنویسی است که تنها ۱۲ نفر برتر سال گذشته به آن راه پیدا میکنند. بخش Heuristic این رقابت بر مسائل بهینهسازی از نوع NP-hard تمرکز دارد، که حل دقیق آنها بسیار زمانبر است و به جای آن از راهحلهای تقریبی با استفاده از روشهای هوشمندانه بهره گرفته میشود.
همه شرکتکنندگان از جمله مدل اپنایآی، با سختافزار یکسانی که توسط برگزارکنندگان ارائه شده بود، کار میکردند تا شرایط برای همه برابر باشد. شرکتکنندگان میتوانستند از هر زبان برنامهنویسی موجود در پلتفرم AtCoder استفاده کنند. امکان ارسال مجدد کد وجود داشت، اما بین هر ارسال باید پنج دقیقه صبر میکردند.
در پایان رقابت، سایخو با امتیاز ۱,۸۱۲,۲۷۲,۵۵۸,۹۰۹ در رتبه اول قرار گرفت، در حالی که مدل اپنایآی با نام OpenAIAHC توانست امتیاز ۱,۶۵۴,۶۷۵,۷۲۵,۴۰۶ را کسب کند، یعنی حدود ۹.۵ درصد کمتر. این مدل هوش مصنوعی، که ساختاری مشابه مدل o3 دارد، در جایگاه دوم ایستاد و ۱۰ برنامهنویس انسانی دیگر را پشت سر گذاشت.
اپنایآی این نتیجه را نقطه عطفی برای عملکرد مدلهای هوش مصنوعی در حوزه برنامهنویسی رقابتی توصیف کرد. یکی از سخنگویان شرکت گفت: مدلهایی مثل o3 در حال حاضر در بین صد نفر برتر مسابقات کدنویسی و ریاضی قرار دارند، اما تا جایی که میدانیم این اولین حضور آنها در بین سه نفر برتر یک مسابقه بزرگ است.
رویدادهایی مثل AtCoder به ما امکان میدهند توانایی مدلها را در استدلال راهبردی، برنامهریزی بلندمدت و بهبود راهحلها از طریق آزمون و خطا بررسی کنیم، درست مانند انسان.
با وجود اینکه این موفقیت انسانی چشمگیر است، شکی نیست که هوش مصنوعی در چند سال اخیر جهش بزرگی در زمینه کدنویسی داشته است.
طبق گزارش شاخص هوش مصنوعی دانشگاه استنفورد در سال ۲۰۲۵، مدلهای هوش مصنوعی در سال ۲۰۲۳ تنها ۴.۴ درصد از مسائل برنامهنویسی را میتوانستند حل کنند، اما این رقم در سال ۲۰۲۴ به ۷۱.۷ درصد رسید.
برنامهنویسی یکی از پرکاربردترین زمینههای استفاده از چتباتهای شرکتهایی مانند اپنایآی، آنتروپیک، گوگل و متا است. ابزارهایی مانند گیتهاب کوپایلوت و کرسر به بخشی از روند کاری برنامهنویسان حرفهای تبدیل شدهاند.
در نظرسنجی سال ۲۰۲۴ گیتهاب، بیش از ۹۰ درصد توسعهدهندگان اعلام کردند که از ابزارهای هوش مصنوعی استفاده میکنند، اگرچه برخی مطالعات نشان دادهاند که این ابزارها شاید به اندازهای که تصور میشود در صرفهجویی زمان مؤثر نباشند.
با همه اینها، در حالی که مدلهای هوش مصنوعی روز به روز در حل مسائل پیچیدهتری توانمندتر میشوند، پیروزی دمبیاک بیشتر شبیه به یک نقطهعطف تاریخی است تا یک پیروزی همیشگی. برخلاف پایان تلخ جان هنری، دمبیاک همچنان زنده است تا باز هم کد بنویسد، اما شاید بار بعدی با رقیبی حتی سریعتر روبهرو شود.
او در پایان گفته است: واقعاً از اینهمه توجه شوکه شدم. هیچوقت فکر نمیکردم مردم تا این حد به رقابتهای برنامهنویسی علاقه داشته باشند.
حداقل فعلاً، توانایی انسان در یافتن راهحلهای غیرمنتظره همچنان منحصربهفرد است. اما با ادامه پیشرفت مدلهای هوش مصنوعی از سوی اپنایآی و دیگر شرکتها، شاید در آینده برنامهنویسان انسانی بهجای رقابت، ناچار به همکاری با این مدلها شوند… یا حتی جای خود را به آنها بدهند.