این هوش مصنوعی از خطاهایش می آموزد
محققان موسسه OpenAI طی ماههای اخیر بر ایجاد هوش مصنوعی متمرکز بودهاند که میتواند بهتر از دیگر انواع این فناوری بیاموزد و این الگوریتم اکنون از توانایی آموزش دادن صحبت کردن به خود برخوردار است.
بازدید :
زمان تقریبی مطالعه :
تاریخ : شنبه 1396/12/19 ساعت 10:45
زینب شاه مرادی - مرکز یادگیری تبیان
به گزارش بیگ بنگ به نقل از همشهری، اکنون محققان در این موسسه موفق شده اند این سیستم را به گونه ای ارتقا دهند که بتواند مانند انسان ها از خطاهای خودش بیاموزد. این توانایی مدیون الگوریتم منبع بازی به نام HER (مخفف شناخت تکرار تجربه) است که محققان به تازگی آن را ایجاد کردهاند و همان طور که از نامش مشخص است، به سیستم امکان میدهد خطاهای خود را بازبینی کرده و از آن ها برای انجام درست وظیفه جدید درس بگیرد. از این رو هوش مصنوعی خطاهای خود را به عنوان موفقیت درنظر میگیرد.
به بیانی دیگر، هر تلاش خطایی که این سیستم هوش مصنوعی در مسیر انجام یک دستور انجام میدهد، به هدفی دیگر تبدیل میشود، هدفی ناخواسته و مجازی. درست مانند اولین تجربه یادگیری دوچرخه سواری که در آن فرد ابتدا در حفظ تعادل دچار مشکل می شود. هر بار زمین افتادن فرد را به هدفش که حفظ تعادل است نزدیک تر میسازد زیرا بشر به این شکل و با استفاده از خطاهایش میآموزد.
با استفاده از HER، این سیستم هوش مصنوعی نیز قصد دارد به شیوهای مشابه کارهای جدید را یاد بگیرد. این تکنیک به تدریج جایگزین سیستم پاداشی خواهد شد که در مدلهای یادگیری تقویت یادگیری مورد استفاده قرار میگیرند. برای اینکه یک هوش مصنوعی به خودش درس بدهد، باید از سیستم پاداشی استفاده کند، سیستمی که متناسب با رسیدن یا نرسیدن هوش مصنوعی به هدفش به آن جایزه میدهد.
این مدل کامل نیست و برخلاف آن سیستم HER حتی زمانی که هوش مصنوعی دچار خطا میشود نیز به او پاداش میدهد. به این شکل سیستم با سرعت و کیفیت بالاتری یاد میگیرد. به گفته محققان استفاده از سیستم جدید یادگیری به آن معنی نیست که یاد دادن کارهای ویژه به هوش مصنوعی سادهتر از گذشتهاست. حقیقت یادگیری با استفاده از HER در روبات های واقعی هنوز فرایند پیچیده ای است زیرا به دریایی از نمونه ها نیاز دارد.
منبع: http://bigbangpage.com
به گزارش بیگ بنگ به نقل از همشهری، اکنون محققان در این موسسه موفق شده اند این سیستم را به گونه ای ارتقا دهند که بتواند مانند انسان ها از خطاهای خودش بیاموزد. این توانایی مدیون الگوریتم منبع بازی به نام HER (مخفف شناخت تکرار تجربه) است که محققان به تازگی آن را ایجاد کردهاند و همان طور که از نامش مشخص است، به سیستم امکان میدهد خطاهای خود را بازبینی کرده و از آن ها برای انجام درست وظیفه جدید درس بگیرد. از این رو هوش مصنوعی خطاهای خود را به عنوان موفقیت درنظر میگیرد.
به بیانی دیگر، هر تلاش خطایی که این سیستم هوش مصنوعی در مسیر انجام یک دستور انجام میدهد، به هدفی دیگر تبدیل میشود، هدفی ناخواسته و مجازی. درست مانند اولین تجربه یادگیری دوچرخه سواری که در آن فرد ابتدا در حفظ تعادل دچار مشکل می شود. هر بار زمین افتادن فرد را به هدفش که حفظ تعادل است نزدیک تر میسازد زیرا بشر به این شکل و با استفاده از خطاهایش میآموزد.
با استفاده از HER، این سیستم هوش مصنوعی نیز قصد دارد به شیوهای مشابه کارهای جدید را یاد بگیرد. این تکنیک به تدریج جایگزین سیستم پاداشی خواهد شد که در مدلهای یادگیری تقویت یادگیری مورد استفاده قرار میگیرند. برای اینکه یک هوش مصنوعی به خودش درس بدهد، باید از سیستم پاداشی استفاده کند، سیستمی که متناسب با رسیدن یا نرسیدن هوش مصنوعی به هدفش به آن جایزه میدهد.
این مدل کامل نیست و برخلاف آن سیستم HER حتی زمانی که هوش مصنوعی دچار خطا میشود نیز به او پاداش میدهد. به این شکل سیستم با سرعت و کیفیت بالاتری یاد میگیرد. به گفته محققان استفاده از سیستم جدید یادگیری به آن معنی نیست که یاد دادن کارهای ویژه به هوش مصنوعی سادهتر از گذشتهاست. حقیقت یادگیری با استفاده از HER در روبات های واقعی هنوز فرایند پیچیده ای است زیرا به دریایی از نمونه ها نیاز دارد.
منبع: http://bigbangpage.com