Google наділила ШІ інстинктом самозбереження [*]


Комплексні алгоритми глибокого навчання вже уміють імітувати дуже складні поведінкові навички. Проте для повного освоєння потрібно їх багатократне повторення з супутніми перезавантаженнями середовища навчання. Такі перезавантаження – завдання нетривіальне, тому процес навчання часто вимагає повноцінної участі людини.

Команді Google Brain разом з групами учених з університету Кембриджа, інституту Макса Планка і Каліфорнійського університету у Беркли вдалося розробити нові алгоритми, що звільняють людей від цієї монотонної роботи.

https://youtu.be/- WTlZFN07I

Роботизована інтуїція

Дослідниками була зроблена спроба навчити ШІ класифікувати усі дії, що піддаються перезавантаженню, як безпечні. Це створило основу для розробки так званих політик “форвард” і ” ресет”. Конкуруючі алгоритми з успіхом підказують ШІ, чи буде його наступна дія безповоротньою (наприклад, зайвий крок приведе до падіння зі скелі), і коли слід зупинитися. Таким чином роботи набирають досвід методом проб і помилок, “пізнаючи” все більше дій, придатних для навчання.

За прогнозами учених, навчання машин плануванню своїх дій допоможе істотно прискорити тестування складних алгоритмів в реальному житті (наприклад, автомобільних систем автопілотування), а також підвищити надійність і безпеку подібних експериментів.

Джерело: The Next Web

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *