Американская компания Lexika запустила разработанный на основе нейросети сервис для поиска по тексту в аудио- и видеофайлах.
Об этом пишет N+1, воспользоваться самим поиском можно после регистрации на сайте DeepGram.
Для того, чтобы найти определенный текст в аудио или видео с помощью сервиса, необходимо сначала загрузить контент в базу – пользователям доступно до 40 часов аудио и видео ежемесячно. Файлы можно загружать с локального диска или с видеохостингов.
После этого DeepGram проиндексирует полученный файл, и функция станет доступна. Можно, в частности, просмотреть полную текстовую транскрипцию файла, либо найти место, где звучит определенная фраза или слово — такие места будут отмечены на временной шкале файла красными точками.
Отмечается, что при создании DeepGram использовались методы глубокого обучения. Причем сервис ориентируется при поиске не на написание проиндексированного текста, а на фонетическую транскрипцию, что позволяет искать и находить слова и фразы, которые звучат похоже при разном написании. Однако у этого подхода есть и негативная сторона – в результатах может содержаться большое количество ошибок.
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- 1 Сам себе Моцарт и Дрейк: подборка музыкальных нейросетей
- 2 «Тинькофф» запустил для пользователей «вселенную ассистентов» на основе ИИ
- 3 «Яндекс» представил обновленную нейросеть YandexART 1.3
- 4 ChatGPT обучали работники из Африки — теперь чат-бот повторяет их языковые привычки
- 5 Хотите снять квартиру? Готовьтесь сдать биометрию лица
ВОЗМОЖНОСТИ
25 апреля 2024
26 апреля 2024
29 апреля 2024