Baidu представила Deep Voice 2 – систему для переведення тексту в мовлення, здатну розібрати сотні акцентів


Дізнайтесь більше про нові кар'єрні можливості в EchoUA. Цікаві проекти, ринкова оплата, гарний колектив. Надсилайте резюме та приєднуйтеся до нас.

Три місяці тому китайський пошуковий гігант Baidu продемонстрував Deep Voice, систему для переведення тексту в мовлення. Вона могла відтворювати мовлення, яке важко відрізнити від людського, і робила це практично в реальному часі. Проте система могла вивчати одночасно лише один голос, і для цього їй були потрібні години аудіозаписів.

Нещодавно компанія представила оновлення системи, Deep Voice 2. Вона може вивчити нюанси голосу людини всього за півгодини аудіозапису та імітувати голоси сотні різних ораторів.

Вивчення діалектів стало простішим

Пам’ятайте, як багато часу знадобилося Siri для вивчення акцентів? Це відбувалося внаслідок того, що кожен новий голос вимагав тисяч годин розмов. Після цього інженери витрачали багато часу для ручного налаштування програми, навчаючи її розмовляти. Deep Voice 2 пішла іншим шляхом: вона вивчає схожі елементи мови різних людей, щоб побудувати модель людського голосу, а потім налаштовує модель для розв’язання конкретної задачі без втручання людини.

Baidu вважає, що ця технологія буде корисною для цифрових помічників, якими управляють за допомогою голосових команд, також знадобиться для електронних книг.

Джерело: The Verge

Київ, Харків, Одеса, Дніпро, Запоріжжя, Кривий Ріг, Вінниця, Херсон, Черкаси, Житомир, Хмельницький, Чернівці, Рівне, Івано-Франківськ, Кременчук, Тернопіль, Луцьк, Ужгород, Кам'янець-Подільський, Стрий - за статистикою саме з цих міст програмісти найбільше переїжджають працювати до Львова. А Ви розглядаєте relocate?


Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *