دانشمندان یک ربات چهارپا را آموزش دادهاند تا در مقابل یک انسان بدمینتون بازی کند. این ربات میتواند به سرعت در زمین حرکت کند و رالیهایی تا ۱۰ ضربه را اجرا کند. این ربات که ANYmal نام دارد، با ترکیب حرکات تمام بدن و درک بصری، یاد گرفت که چگونه حرکت خود را برای رسیدن به توپ و برگرداندن موفق آن از روی تور تنظیم کند. این موفقیت به لطف هوش مصنوعی به دست آمد. همانطور که محققان در مقالهای که در Science Robotics منتشر شده نوشتند، این دستاورد نشان میدهد که میتوان رباتهای چهارپا را به عنوان رقیب در «سناریوهای ورزشی پیچیده و پویا» ساخت.
رباتی با قابلیتهای جدید
ANYmal یک ربات چهارپا شبیه به سگ است که حدود ۵۰ کیلوگرم وزن و نیم متر قد دارد. داشتن چهار پا به این ربات اجازه میدهد تا در زمینهای دشوار حرکت کند و از موانع بالا و پایین برود. پیش از این، محققان به این ماشینهای سگمانند، بازوهایی اضافه کرده بودند و به آنها یاد داده بودند که اشیای خاصی را بردارند یا با گرفتن دستگیره درها را باز کنند. اما هماهنگی کنترل اندامها و درک بصری در یک محیط پویا، همچنان یک چالش در رباتیک باقی مانده بود.
یونتائو ما، محقق رباتیک در ETH زوریخ و یکی از نویسندگان این مقاله، در مصاحبه با Live Science گفت: «ورزش یک زمینه مناسب برای این نوع تحقیقات است، زیرا میتوانید به تدریج رقابت یا دشواری را افزایش دهید.»
در این تحقیق، ما و تیمش یک بازوی پویا که یک راکت بدمینتون را با زاویه ۴۵ درجه نگه میداشت، به ربات ANYmal متصل کردند. با اضافه شدن این بازو، قد ربات به ۱.۶ متر رسید و ۱۸ مفصل داشت: سه مفصل در هر یک از چهار پا و شش مفصل در بازو. محققان یک سیستم پیچیده داخلی برای کنترل حرکات بازو و پاها طراحی کردند. همچنین یک دوربین استریو با دو لنز که روی هم قرار گرفته بودند، به جلوی بدنه ربات اضافه شد تا اطلاعات بصری مربوط به توپهای ورودی را به صورت لحظهای پردازش کند و مسیر حرکت آنها را تخمین بزند.
روش آموزش: از شبیهسازی تا دنیای واقعی
این ربات سپس از طریق یادگیری تقویتی به یک بازیکن بدمینتون تبدیل شد. در این نوع یادگیری ماشینی، ربات محیط خود را جستجو کرد و با استفاده از روش آزمون و خطا یاد گرفت که چگونه توپ را پیدا و دنبال کند، به سمت آن حرکت کند و با راکت ضربه بزند. برای انجام این کار، محققان ابتدا یک محیط شبیهسازی شده شامل یک زمین بدمینتون ایجاد کردند. توپهای مجازی از نزدیکی میانه زمین حریف سرو میشدند و وظیفه ربات این بود که مسیر آنها را دنبال و تخمین بزند.
سپس، محققان یک برنامه آموزشی سختگیرانه طراحی کردند که به ANYmal یاد بدهد چگونه به توپ ضربه بزند. یک مربی مجازی به ربات برای ویژگیهای مختلفی مانند موقعیت راکت، زاویه سر راکت و سرعت ضربه پاداش میداد. مهمتر از همه، پاداشهای ضربه بر اساس زمان بود تا ربات برای ضربههای دقیق و به موقع تشویق شود.
از آنجا که توپ میتوانست در هر نقطه از زمین فرود بیاید، اگر ربات به طور مؤثر در زمین حرکت میکرد و سرعت خود را به طور غیرضروری افزایش نمیداد، نیز پاداش میگرفت. هدف ANYmal این بود که میزان پاداش دریافتی خود را در تمام این آزمایشها به حداکثر برساند. بر اساس ۵۰ میلیون آزمایش در این شبیهسازی، محققان یک شبکه عصبی ایجاد کردند که میتوانست حرکت تمام ۱۸ مفصل را برای حرکت به سمت توپ و ضربه زدن به آن کنترل کند.
عملکرد و یادگیری هوشمند
پس از شبیهسازیها، دانشمندان شبکه عصبی را به ربات منتقل کردند و ANYmal در دنیای واقعی به کار گرفته شد. در اینجا، ربات برای یافتن و دنبال کردن یک توپ بدمینتون نارنجی روشن که توسط یک دستگاه دیگر سرو میشد، آموزش دید. این دستگاه به محققان امکان میداد تا سرعت، زاویه و محل فرود توپها را کنترل کنند. ANYmal باید با سرعت در زمین حرکت میکرد تا به توپی که با سرعتی خاص سرو شده بود، ضربه بزند.
محققان دریافتند که پس از آموزش گسترده، ربات میتوانست توپها را دنبال کرده و با سرعت ضربهای تا حدود ۱۲ متر بر ثانیه به دقت برگرداند. این سرعت تقریباً نصف سرعت ضربه یک بازیکن آماتور بدمینتون است. ANYmal همچنین الگوهای حرکتی خود را بر اساس مسافتی که باید برای رسیدن به توپ طی میکرد، تنظیم میکرد. هنگامی که توپ قرار بود فقط نیم متر دورتر فرود بیاید، ربات نیازی به حرکت نداشت، اما در فاصله حدود ۱.۵ متری، ANYmal با حرکت دادن هر چهار پا برای رسیدن به توپ میشتافت. در فاصله حدود ۲.۲ متری، ربات با جهش به سمت توپ میدوید و یک دوره پرش را ایجاد میکرد که با آن، برد بازوی ربات یک متر در جهت هدف افزایش مییافت.
ما گفت: «کنترل ربات برای نگاه کردن به توپ به این آسانی نیست.» اگر ربات به توپ نگاه کند، نمیتواند خیلی سریع حرکت کند. اما اگر نگاه نکند، نمیداند کجا باید برود. او معتقد است «این بدهبستان باید به نوعی هوشمندانه اتفاق بیفتد.»
او از اینکه ربات چقدر خوب توانسته حرکت همه ۱۸ مفصل را به صورت هماهنگ انجام دهد، شگفتزده شد. این یک کار بسیار دشوار است؛ زیرا موتور هر مفصل به طور مستقل آموزش میبیند، اما حرکت نهایی نیازمند کار هماهنگ آنها با یکدیگر است.
تیم همچنین دریافت که ربات به صورت خودکار پس از هر ضربه به مرکز زمین برمیگشت، درست مانند بازیکنان انسانی که خود را برای توپ بعدی آماده میکنند. با این حال، محققان اشاره کردند که ربات حرکات حریف را در نظر نمیگرفت، که یکی از راههای مهم برای پیشبینی مسیر توپ در بین بازیکنان انسانی است. تیم در مقاله خود گفت که افزودن تخمین حرکات انسان به بهبود عملکرد ANYmal کمک خواهد کرد. ما همچنین اشاره کرد که میتوان یک مفصل گردن به ربات اضافه کرد تا به آن اجازه دهد توپ را برای مدت زمان بیشتری زیر نظر بگیرد.
او فکر میکند این تحقیق در نهایت کاربردهایی فراتر از ورزش خواهد داشت. برای مثال، او میگوید این فناوری میتواند در عملیات امداد و نجات در بلایای طبیعی برای جمعآوری آوار به کار گرفته شود؛ زیرا ربات قادر خواهد بود بین درک بصری پویا و حرکت چابک تعادل برقرار کند.