fb pixel

Информационное агентство "Информ-UA"

Информационное агентство "Информ-UA"

Информ-UA

Искусственный интеллект от Facebook говорит голосом Билла Гейтса

Искусственный интеллект от Facebook говорит голосом Билла Гейтса


Программисты сервиса MelNet от Facebook разработали довольно правдоподобный синтез голоса во время воспроизведения кратких словосочетаний. Для привлечения общественного интереса речи озвучены голосами публичных людей, передает Информ-UA.

То время, когда искусственный голос был автоматизированным и техническим - уже вскоре станет историей. Команда программистов научилась создавать настоящий и живой звук. Слова компонуются в речь.

искусственный голос.

На данный момент программное обеспечение WaveNet и SampleRNN уже пользуется такими новшествами в сфере машинного обучения, где анализируется звук и происходит дальнейшая озвучка всей речи.

Программисты Facebook, которые тоже работали над созданием системы живого звука, выбрали для себя несколько иной путь и предоставили искусственному интеллекту работу со спектограммами. Разработчики отмечают, что в их продукте довольно качественно воспроизводится тонкая последовательность, которую задает спикер во время разговора. Эти последовательности очень чувствительны к слуху. Чтобы убедиться в такой находке исследователи предлагают прослушать озвучивание голосами известных личностей.

Читайте также: Светофоры будущего автоматически узнают, когда вы захотите перейти дорогу

Итак, разработчики MelNet от Facebook уже успели обработать голоса Билла Гейтса, Стивена Вольфрама, Стивена Хокинга и других известных персон. Желаемый голос пользователь может избрать из списка спикеров. Так, одну фразу можно услышать разными голосами.

Что касается самого оборудования, то для процесса анализа программисты использовали систему TED и ее 452-часовой состав. Также использовалась информация из аудиокниг, поскольку манера их воспроизведения довольно живая.

Самой главной проблемой и целью, которую пока не успели решить программисты, является эмоциональность при воспроизведении объемных текстов. На данный момент нет возможности сохранить все необходимые вербальные эмоции даже на протяжении воспроизведения абзаца. Поэтому разработчики ищут новые пути для развития системы искусственного голоса, который бы привлекал внимание большинства пользователей и стал более популярным.

Читайте также: В помощь родителям: ученые создали дешифратор плача младенцев

Поделитесь в Facebook

Ошибка в тексте? Выдели ее мышкой и нажми Ctrl + Enter



0 комментариев

Добавить комментарий

Новости по теме