DeepMind запустила навчальний проект AlphaGo Teach [*]


Команда DeepMind представила веб-інструмент AlphaGo Teach. Він допоможе початківцям і вже граючим в го знайти нові та, можливо, нетривіальні стратегії ведення гри.

AlphaGo Teach

Цей інструмент базується на аналізі 6000 найпопулярніших послідовностей початку гри з недавньої історії зіграних партій го. Він також використовує близько 231 тисячі ігор між гравцями-людьми і 75 ігор, проведених між людьми і АІ AlphaGo. На кожному етапі гри порівнюється вірогідність вибору наступного ходу АІ та людиною.

Як використати інструмент?

Кожен наступний можливий хід підсвічує або бірюзовим, або фіолетовим. Перший – хід, який AlphaGo віддав перевазі б в реальній грі, другий – віддається перевага людьми. Цифри всередині кіл означають вірогідний відсоток перемоги чорних у партії й передбачаються AlphaGo. Коли хід чорних, значення близьке до 100, розглядається як краще. Якщо хід білих, то прийнятніші значення близькі до 0. Значення, які дорівнюють 50, означають, що результат гри буде нічийним.

Як розуміти передбачені значення?

Переважний хід AlphaGo не завжди має найвище значення. Це пов’язано з тим, що вірогідність виграшу кожного ходу була розрахована шляхом проведення незалежного пошуку 10 мільйонів симуляцій ходів від поточної позиції. AlphaGo має деяку випадковість у цьому пошуку, тобто якщо ми знову запустимо пошук, то він може вибрати інше, але схоже значення. Детальніше дізнатися про роботу АІ AlphaGo можна у статті, опублікованій в журналі Nature.

Радимо також почитати наш матеріал про те, як AlphaGo Zero, прямий наступник AlphaGo, зміг після всього лише 40 днів самонавчання перемогти свого попередника.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *