Menu

Google обучили озвучивать текст и говорить подобно человеку

В основе технологии — две нейросети глубокого обучения. Первая преобразует текст в спектрограмму (визуальное представление звуковых частот), которая потом передаётся в WaveNet — метод генерации речи.

Google создал систему преображения текста в речь Tacotron 2, которая с удивительной точностью имитирует голос человека. Потом метод WaveNet, созданный исследовательской лабораторией DeepMind, считывает данные и генерирует соответствующие звуковые субъекты. Программа Tacotron 2 воспринимает и воспроизводит сложные для произношения слова и наименования, делает ударение на подходящем слове и учитывает знаки препинания при построении заявлений.

Как пишет N+1, Google уже давно ведет разработки в области синтеза речи.

С примерами работы программы можно познакомиться на официальном сайте компании Google. Интонацией может быть выделено слово, написанное с заглавной буквы. Тут можно прослушать фразу, сказанную программой и человеком.

В отличие от остальных систем синтеза речи, метод Tacotron 2 представляет звуковую информацию в виде спектрограмм — визуализированной взаимосвязи частоты и времени. Предшествующая версия программы — Tacotron — набрала в среднем 4,0 балла.

Как считают создатели Tacotron 2, метод может быть использован для улучшения работы голосовых помощников, которые получают все не менее широкое распространение.

Как стало известно, с этого момента программы Google смогут говорить звуком не робота, а человека.

Google научился говорить по‐человечески

Рассказать друзьям:


Уважаемые посетители!

Проект «Добро24.рф» - волонтёрский некоммерческий информационный проект, главная цель которого - распространение только положительных новостей. Поддержав развитие информационного агентства, Вы сможете стать нашим официальным партнёром.

Читайте также:

Оставить отзыв

Добавить комментарий

Благотворительный фонд Дети Сибири / Детисибири.рф

Рассылка новостей

Введите свой e-mail:

ИНТЕРАКТИВ