Диффузионная нейросеть «Яндекса» перешла на новую технологию для генерации изображений — латентную диффузию. Компания представила YandexART 1.3., которая лучше понимает текстовые запросы и создает более точные и реалистичные изображения. Об этом рассказали в пресс-службе компании.
Компания увеличила датасет, на котором обучалась модель, более чем в два раза. А технология латентной диффузии требует меньше вычислительных мощностей и при этом позволяет генерировать более совершенную графику, пояснили в «Яндексе».
Как устроена технология латентной диффузии
Технология латентной диффузии создает промежуточное представление изображения в формате латентного кода. Это компактное описание с основными данными об изображении в сжатом формате. После этого нейросеть в один шаг разворачивает код в полноценное изображение высокого разрешения. Как отмечают в компании, данный метод эффективнее многоэтапного уточнения картинки в каскадной диффузии.
Также «Яндекс» увеличил датасет, на котором обучалась нейросеть, в два с половиной раза. В него добавили синтетические тесты. Сам набор данных был увеличен до более чем 850 миллионов пар картинок с текстом.
Для того чтобы YandexART учитывала больше деталей из промта, в новой модели используются не один, а два текстовых энкодера, с помощью которых модель переводит текстовый запрос.
Также теперь с помощью YandexART можно создавать картинки в разных форматах: 16:9, 4:3 или 3:4. Обновление уже действует в «Шедевруме», вскоре оно появится и в других сервисах компании.
Впервые диффузионную нейросеть YandexART компания представила в 2023 году. В «Яндексе» отмечали, что сервис «понимает российский культурный код» и знает важные символы, персонажей и личностей из российской истории.
Фото на обложке: Пресс-служба «Яндекса»
Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- 1 «Яндекс Маркет» запустил собственный бренд товаров для отдыха на природе Outstep
- 2 Два сервиса «Яндекса» внесли в реестр организаторов распространения информации
- 3 Мосбиржа объявила дату снятия акций Yandex N.V. с торгов и допуска к ним бумаг МКАО «Яндекс»
- 4 Топ-5 инсайтов при мониторинге поисковой выдачи
- 5 Вечный рейв: обзор наушников Commo One
ВОЗМОЖНОСТИ
17 мая 2024
17 мая 2024
18 мая 2024
19 мая 2024
19 мая 2024