Команда Google DeepMind представила новий ШІ, здатний вчитися розв’язувати задачі


Дізнайтесь більше про нові кар'єрні можливості в EchoUA. Цікаві проекти, ринкова оплата, гарний колектив. Надсилайте резюме та приєднуйтеся до нас.

Остання розробка від групи дослідників Google DeepMind-UNREAL – це надзвичайно швидкий агент, який здатний розв’язувати складніші за проходження ігор задачі.

Фахівці DeepMind представили проект UNsupervised REinforcement and Auxiliary Learning або UNREAL, який частково використовує механізм сновидінь тварин для прискорення навчання. Швидкість навчання в середньому дорівнює 87 % від людської. З результатами можна ознайомитися в статті.

Як пояснюють лондонські експерти з DeepMind, агент використав спеціальні методи навчання, щоб освоїти гру Go і деякі з ігор Atari 2600.

Проте особливістю UNREAL є той факт, що він використовує механізми сновидінь тварин.

Подібно до того, як тварини сприймають позитивні й негативні події, наш агент переважно відтворює послідовності продуктивних подій.

Дослідники використали цей концепт, щоб навчити агента фокусуватися на тих візуальних ознаках, які приводять до набуття досвіду в найкоротші терміни.

Ми навчали агента передбачати час безпосереднього отримання вигоди, надаючи йому невеликий історичний контекст. Для тог щоб агент легше справлявся з тим контекстом, у якому отримання вигоди – рідкість, ми навчали його як на ситуаціях із вигідним результатом, так і на несприятливих. Агент, який навчався на позитивних історіях, частіше може виявити візуальні ознаки вигоди набагато швидше.

Інша задача стосувалася  способу контролю пікселів на екрані, щоб агент навчився розуміти, яка дія в даному випадку буде корисніша і збільшить його рахунок у грі.

Використовуючи способи, описані вище, дослідники протестували агента на 57 іграх від Atari й на 13 рівнях гри Labyrinth.

Одне з важливих досягнень у їх роботі – не просто створення агента, який добре грає у якусь гру, а те, що агента не треба налаштовувати на кожну гру.

Як зазначають дослідники, головна мета DeepMind – вийти на новий рівень у ШІ за допомогою програм, які “можуть навчитися розв’язувати будь-які складні проблеми без необхідності навчання їх способам розв’язання цих проблем”.

“Ми сподіваємося, що ця розробка дозволить нам розширити можливості наших агентів для взаємодії зі складнішими середовищами”, – говорять дослідники.

Джерело: ZDNet

Київ, Харків, Одеса, Дніпро, Запоріжжя, Кривий Ріг, Вінниця, Херсон, Черкаси, Житомир, Хмельницький, Чернівці, Рівне, Івано-Франківськ, Кременчук, Тернопіль, Луцьк, Ужгород, Кам'янець-Подільський, Стрий - за статистикою саме з цих міст програмісти найбільше переїжджають працювати до Львова. А Ви розглядаєте relocate?


Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *