Канадский сервис для создания цифровой копии голоса на основе одной минуты речи Lyrebird запустил бесплатную бета-версию API, которая позволит сторонним разработчикам синтезировать и использовать голоса своих пользователей. Об этом говорится в рассылке проекта.
В Lyrebird предполагают, что с помощью API разработчики смогут создавать аватары, говорящие голосами пользователей, индивидуально озвучивать приложения и другое.
Инструкция к API размещена здесь. В каждом случае при создании копии голоса пользователи должны будут зарегистрироваться в Lyrebird и дать согласие на использование своих данных, прежде чем разработчики смогут синтезировать их голоса, отмечается в сообщении.
Нейросетевой алгоритм Lyrebird был разработан в Монреальском университете. В апреле 2017 года сервис продемонстрировал работу на копиях голосов Барака Обамы, Дональда Трампа и Хиллари Клинтон, а в сентябре того же года открыл публичное тестирование.
Хотя изначально Lyrebird позиционировал себя как первый сервис, способный синтезировать голос на базе всего одной минуты речи, для создания более достоверной копии ему требуется больше аудиоматериала.
Со времени запуска у Lyrebird появились конкуренты – к примеру, ирландский стартап Voysis недавно объявил об успешной разработке синтезатора речи, который не требует подключения к интернету и может работать в качестве приложения на смартфоне.
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- 1 Новый мультимодальный ИИ-ассистент от OpenAI сможет распознавать сарказм
- 2 Новинка OpenAI, гринвошинг в 40% инвест-фондах, заявления Илона Маска: главное для бизнеса 12 мая
- 3 Основательница Bumble предрекла появление в приложениях знакомств ИИ-аватаров
- 4 Apple достигла соглашения с OpenAI об использовании ChatGPT в iOS 18
- 5 Соглашение Apple и OpenAI, планы SpaceX, юбилей «Мелодии»: главное для бизнеса 11 мая
ВОЗМОЖНОСТИ
13 мая 2024
13 мая 2024
13 мая 2024