Искусственный интеллект от Facebook говорит голосом Билла Гейтса

Программисты сервиса MelNet от Facebook разработали довольно правдоподобный синтез голоса во время воспроизведения кратких словосочетаний. Для привлечения общественного интереса речи озвучены голосами публичных людей, передает Информ-UA.

То время, когда искусственный голос был автоматизированным и техническим - уже вскоре станет историей. Команда программистов научилась создавать настоящий и живой звук. Слова компонуются в речь.

искусственный голос.

На данный момент программное обеспечение WaveNet и SampleRNN уже пользуется такими новшествами в сфере машинного обучения, где анализируется звук и происходит дальнейшая озвучка всей речи.

Программисты Facebook, которые тоже работали над созданием системы живого звука, выбрали для себя несколько иной путь и предоставили искусственному интеллекту работу со спектограммами. Разработчики отмечают, что в их продукте довольно качественно воспроизводится тонкая последовательность, которую задает спикер во время разговора. Эти последовательности очень чувствительны к слуху. Чтобы убедиться в такой находке исследователи предлагают прослушать озвучивание голосами известных личностей.

Читайте также: Кандидат в президенты США требует запретить выпуск роботов-убийц

Итак, разработчики MelNet от Facebook уже успели обработать голоса Билла Гейтса, Стивена Вольфрама, Стивена Хокинга и других известных персон. Желаемый голос пользователь может избрать из списка спикеров. Так, одну фразу можно услышать разными голосами.

Что касается самого оборудования, то для процесса анализа программисты использовали систему TED и ее 452-часовой состав. Также использовалась информация из аудиокниг, поскольку манера их воспроизведения довольно живая.

Самой главной проблемой и целью, которую пока не успели решить программисты, является эмоциональность при воспроизведении объемных текстов. На данный момент нет возможности сохранить все необходимые вербальные эмоции даже на протяжении воспроизведения абзаца. Поэтому разработчики ищут новые пути для развития системы искусственного голоса, который бы привлекал внимание большинства пользователей и стал более популярным.

Читайте также: Учёные создают приложение для оценки риска заражения COVID-19