Искусственный интеллект от Facebook говорит голосом Билла Гейтса
Программисты сервиса MelNet от Facebook разработали довольно правдоподобный синтез голоса во время воспроизведения кратких словосочетаний. Для привлечения общественного интереса речи озвучены голосами публичных людей, передает Информ-UA.
То время, когда искусственный голос был автоматизированным и техническим - уже вскоре станет историей. Команда программистов научилась создавать настоящий и живой звук. Слова компонуются в речь.
На данный момент программное обеспечение WaveNet и SampleRNN уже пользуется такими новшествами в сфере машинного обучения, где анализируется звук и происходит дальнейшая озвучка всей речи.
Программисты Facebook, которые тоже работали над созданием системы живого звука, выбрали для себя несколько иной путь и предоставили искусственному интеллекту работу со спектограммами. Разработчики отмечают, что в их продукте довольно качественно воспроизводится тонкая последовательность, которую задает спикер во время разговора. Эти последовательности очень чувствительны к слуху. Чтобы убедиться в такой находке исследователи предлагают прослушать озвучивание голосами известных личностей.
Читати далі: В США планируют «на пробу» сделать робота-киллера
Итак, разработчики MelNet от Facebook уже успели обработать голоса Билла Гейтса, Стивена Вольфрама, Стивена Хокинга и других известных персон. Желаемый голос пользователь может избрать из списка спикеров. Так, одну фразу можно услышать разными голосами.
Что касается самого оборудования, то для процесса анализа программисты использовали систему TED и ее 452-часовой состав. Также использовалась информация из аудиокниг, поскольку манера их воспроизведения довольно живая.
Самой главной проблемой и целью, которую пока не успели решить программисты, является эмоциональность при воспроизведении объемных текстов. На данный момент нет возможности сохранить все необходимые вербальные эмоции даже на протяжении воспроизведения абзаца. Поэтому разработчики ищут новые пути для развития системы искусственного голоса, который бы привлекал внимание большинства пользователей и стал более популярным.
Читати далі: ИИ ошибся: шахматную партию он распознал как проявление расизма