ذهن مصنوعی که افراد رقت‌انگیز را در GO انجام می‌دهد - آیا شورش ماشین‌ها در اطراف است؟
ذهن مصنوعی که افراد رقت‌انگیز را در GO انجام می‌دهد - آیا شورش ماشین‌ها در اطراف است؟

تصویری: ذهن مصنوعی که افراد رقت‌انگیز را در GO انجام می‌دهد - آیا شورش ماشین‌ها در اطراف است؟

تصویری: ذهن مصنوعی که افراد رقت‌انگیز را در GO انجام می‌دهد - آیا شورش ماشین‌ها در اطراف است؟
تصویری: مهارت های پولسازی که هر کسی باید بلد باشه 2024, آوریل
Anonim

چندی پیش، استاد گو مستر کره جنوبی و یکی از پرافتخارترین بازیکنان جهان، لی سدول، بازنشستگی خود را اعلام کرد و بیانیه ای دراماتیک داد: امتیاز دهی از طریق تلاش های جنون آمیز. اکنون موجودی وجود دارد که نمی توان بر آن غلبه کرد."

لی در مورد کامپیوتر AlphaGo که توسط DeepMind ساخته شده صحبت کرد و گوگل آن را پنج سال پیش به قیمت 650 میلیون دلار خرید. این کره ای در سال 2016 به این خودرو باخت، اما از آن زمان تاکنون هوش مصنوعی قوی تر شده است. به طور کلی، پیروزی یک کامپیوتر بر یک شخص در Go یک پیشرفت واقعی در نظر گرفته می شود که به طور بالقوه می تواند منجر به تغییرات گسترده در جهان شود. آیا ترمیناتور در حال حاضر در افق است؟ بیایید آن را بفهمیم.

برنامه نویسان مدت هاست که قدرت هوش مصنوعی را در بازی های چالش برانگیز با بهترین انسان ها آزمایش کرده اند. کامپیوتر Deep Blue که توسط IBM ساخته شد، در سال 1997 گری کاسپاروف را در شطرنج شکست داد. قبل از مسابقه کاسپاروف فکر کرد: "این فقط یک ماشین است. ماشین ها احمقانه هستند."

اما پس از شکست او اعتراف کرد: "احساس کردم - بوییدم - که نوع جدیدی از ذهن روی میز وجود دارد."

برای شکست کاسپاروف، دیپ بلو از قدرت محاسباتی بی رحم استفاده کرد: پس از هر حرکت، برنامه تمام سناریوهای ممکن را محاسبه کرد و بر اساس این داده ها تصمیم گرفت. اما با Go، این رویکرد به دلیل حجم داده‌ای که باید پردازش شود، کار نمی‌کند. در حال حرکت، بازیکنان به نوبت سنگ های سیاه و سفید را روی تخته 19 در 19 قرار می دهند. هدف بازی این است که تا آنجا که ممکن است قلمرو را اشغال کند، در حالی که سنگ های حریف را قفل کرده و از به دست آوردن برتری او جلوگیری کند. به طور کلی، go شبیه به بازی نقاط آشنا برای بسیاری از مدرسه است - فقط دشوارتر است.

با توجه به اندازه تخته، 361 نوع از قبل برای اولین حرکت انجام شده توسط سنگ های سیاه (در شطرنج - فقط 20) امکان پذیر است. بر این اساس، با هر حرکت، درخت هم ترازی های بالقوه فقط رشد می کند. پس از دو حرکت اول، 400 پیشرفت احتمالی در شطرنج وجود دارد، و 129960 پیشرفت در حال حرکت است.جان ترومپ، ریاضیدان، محاسبه کرده است که تعداد ترکیب های ممکن اعداد 171 رقمی خواهد بود.

بنابراین، در بازی Go، افراد نه تنها به هوش و توانایی محاسبه نیاز دارند، بلکه باید تفکر انتزاعی قدرتمند، شهود قوی داشته باشند - ویژگی هایی که در رایانه ها ضعیف هستند. یکی از توسعه دهندگان AlphaGo، Demis Hassabis، گفت: این یک بازی بسیار شهودی است. استادان برو اغلب می گویند که حرکتی انجام داده اند زیرا درست به نظر می رسد. به گفته وی، استادان حس زیبایی شناسی خاصی ایجاد می کنند و موقعیت خوب فقط زیبا به نظر می رسد.

علیرغم این واقعیت که پردازنده‌ها هر سال قدرتمندتر و سریع‌تر می‌شدند، جست‌وجوی حرکات در درخت امکانات به هوش مصنوعی این امکان را داد که تنها به سطح یک آماتور قوی در حال حرکت برسد. کامپیوترها مردم را شکست دادند، اما فقط در چند سنگ شروع به کار کردند. در سال 2014، دیوید فوتلند، یکی از پیشگامان go for computer، گفت که برنامه ها با مشکلاتی مشابه انسان مواجه هستند:

"بسیاری از بازیکنان به یک اوج آماتور خاص می رسند و نمی توانند قوی تر شوند. برای غلبه بر این فلات باید نوعی جهش ذهنی داشته باشید و برنامه ها نیز همین مشکلات را دارند. شما باید به کل هیئت مدیره نگاه کنید، نه فقط نبردهای محلی." توسعه دهندگان AlphaGo برای غلبه بر این مانع فکری و شبیه سازی شهود و حس زیبایی شناسی حرفه ای ها، شبکه های عصبی و الگوریتم های یادگیری عمیق را به هم متصل کردند.

ابتدا شبکه‌های عصبی AlphaGo با پایگاه داده‌ای از بازی‌های انسانی تغذیه شدند که شامل حدود 30 میلیون حرکت بود.پس از آن، او یاد گرفت که در 57٪ مواقع مسیر یک فرد را به درستی پیش بینی کند، اگرچه رکورد قبلی هوش مصنوعی 44٪ بود. سپس توسعه دهندگان به AlphaGo یاد دادند که در برابر خود بازی کند - بنابراین رایانه حتی بهتر یاد گرفت که سودآورترین حرکت ها را برجسته کند و استراتژی های جدید ایجاد کند.

همه اینها به منطقی کردن فرآیندهایی که دیپ بلو که کاسپاروف را شکست داد، کمک کرد. اکنون این سیستم فقط تمام ترکیبات ممکن را بازی نمی کند، بلکه می داند چگونه روی امیدوار کننده ترین سناریوها برای توسعه رویدادها تمرکز کند. علاوه بر این، او حتی در موقعیت هایی که قبلاً هرگز با آنها روبرو نشده بود، رفتار خود را پیدا می کند. و چنین، به دلیل مقیاس Go، باقی ماند. با توجه به مکانیسم جدید، AlphaGo تمام بازیکنان کامپیوتری که قبلا ساخته شده بودند را شکست داد (در حالی که به آنها چهار سنگ را شروع کرد) و شروع به شکست دادن افراد حرفه ای کرد.

در اکتبر 2015، AlphaGo قهرمان دو دوره اروپا، فن هوی فرانسوی را شکست داد. آن‌ها پنج بازی انجام دادند، هیچ‌کس شروع به کار نکرد و کامپیوتر هر پنج بازی را برد. این اولین بار بود که یک فرد حرفه ای توسط یک ماشین شکست می خورد. پس از بازی، هوی گفت که چیزهای زیادی یاد گرفته است و این دانش به او کمک کرد تا در رنکینگ بین المللی اضافه و صعود کند.

توصیه شده: