Прямо сейчас в мире происходит расцвет искусственного интеллекта. Используя машинное обучение, исследователи создают системы, которые распознают объекты, разговорную речь и даже имитируют человеческий голос. И заметьте, качество этих систем становится лучше день ото дня.
Три месяца назад, китайский поисковый гигант Baidu выпустил систему Deep Voice для преобразования текста в речь. Система могла воспроизводить речь, которая была практически неотличима от настоящего человеческого голоса, в режиме реального времени. Проблема в том, что эта система могла обучиться лишь одному голосу за раз, плюс ко всему требовалось много часов аудиоматериалов, чтобы обучить систему особенностям голоса. Сегодня, компания выпустила Deep Voice 2. Обновленная система может изучить все нюансы речи, того или иного человека, всего за полчаса, а сама программа научилась имитировать голоса сотен разных людей с разными региональными акцентами.
Исследователи Baidu считают, что эта технология окажется очень полезной для цифровых помощников, которые управляются голосом и отвечают своим хозяевам. Потенциально, технология Deep Voice 2 найдет свое применение в приложениях и электронных книгах. «Способность быстро синтезировать множество человеческих голосов, в будущем, будет применена в электронных книгах. Представьте, что каждый персонаж книги, разговаривает своим уникальным голосом, который Вы сможете выбрать по собственному желанию», написала компания в своем блоге.
Источник: https://www.theverge.com/2017/5/25/15690578/baidu-deep-voice-2-text-to-speech
Ответить Отменить ответ