![]() جلسه دفاع ار پایاننامه: لیلا ساجدی، گروه کنترل
ارائهکننده: لیلا سادات ساجدی چکیده: در سالهای اخیر، ترکیب یادگیری تقویتی و شبکههای عصبی عمیق به موفقیتهای گستردهای در حوزهی کنترل رباتیک دست یافته است. یک مسئلهی رایج در حوزهی رباتیک، دستیابی به اجسام برای تعامل با آنها میباشد. با استفاده از روشهای یادگیری تقویتی، بازوی رباتیک تصمیمگیری و عمل خود را بر اساس بازخورد ایجاد شده از تعامل با محیط بهبود میبخشد. در این پژوهش یک بازوی رباتیک با هفت درجهی آزادی، برای رساندن مجری نهایی خود به جسم هدف در موقعیتهای تصادفی موجود در فضای کاری آموزش دیده است. بهمنظور شبیهسازی ربات و محیط آن، از نرمافزار کاپلیاسیم و برای تعیین توالی بهینه اقدامات و آموزش ربات، از الگوریتم گرادیان سیاست قطعی عمیق استفاده شده است. استفاده از این نرمافزار قدرتمند با گرافیک بالا و پشتیبانی از سینماتیک معکوس که به دلیل جامعه کاربری کمتر و متنبسته بودن، تعداد مطالعات کمی بر روی آن انجام شده است به این پژوهش اجازه دستیابی به نتایجی برتر را داد. در این پژوهش سعی شده است با وجود منابع محدود و با استفاده از قابلیتهای کاپلیاسیم، آموزش ربات با یادگیری تقویتی محقق شود. نتایج ارزیابی نشان داد که با بهرهگیری از این الگوریتم، زاویه هر مفصل بدون نیاز به دانستن مدل ربات، محاسبه شده و مجری نهایی ربات در 77.2 درصد آزمایشها میتواند با خطای قابل قبولی به مختصات مورد نظر برسد. افزایش قابل توجه دقت بهدست آمده نسبت به مطالعات مشابه، ضمن کاهش زمان لازم برای آموزش در محیط شبیهساز را میتوان بهعنوان دستاوردهای این پژوهش نام برد. |