Top.Mail.Ru
Списки и рейтинги

Анна Вероника Дорогуш (Yandex) – о технологии CatBoost на Big Data Conference

Списки и рейтинги
Наиль Байназаров
Наиль Байназаров

Редактор медиа РБ.РУ

Наиль Байназаров

По итогам прошедшей 15 сентября 2017 года Big Data Conference, организованной Rusbase и Global Innovation Labs, публикуем подробные отчеты с выступлений всех спикеров.

В рамках конференции в трёх залах были представлены кейсы в «Бизнес-треке», технологические решения в «Техническом треке» и доклады на «Научном семинаре». Общий отчет с мероприятия можно найти по ссылке.

Анна Вероника Дорогуш (Yandex) – о технологии CatBoost на Big Data Conference

Анна Вероника Дорогуш, представляющая «Яндекс», выступила в «Техническом треке» с темой «Градиентный бустинг и сферы его применения. Технология CatBoost».

Благодаря сервису Penxy мы можем поделиться с вами презентацией Анны Вероники, которую можно не просто посмотреть, но и послушать:

 

После выступления аудитория задавала Анне Веронике вопросы через специальный сервис WhenSpeak. Мы публикуем «публичное интервью» с Анной Вероникой.


Как эта библиотека связана с MatrixNet?

CatBoost – это следующая версия Матрикснета. Но говорить о полной замене одной технологии на другую пока нельзя. Матрикснет по-прежнему отлично показывает себя во многих задачах, тем не менее, с развитием CatBoost мы действительно планируем внедрить его в большинство сервисов «Яндекса», где он дополнит или заменит Матрикснет.

Catboost может сырыми брать категориальные фичи, наподобие LightGBM?

Да, CatBoost работает с сырыми категориальными фичами, но не как LightGBM, а более оптимально.

А сравнение производительности разных инструментов?

Время обучения Катбуста пока что больше, чем у XGBoost и LightGBM, но мы работаем над ускорением алгоритма и надеюсь, что эту разницу скоро получится убрать.

Почему cat? Связано ли это с котиками? :)

CatBoost – от Categorical Boosting (категориальный бустинг). Оптимальная поддержка категориальных факторов – основная отличительная черта алгоритма.


Смотреть все презентации.

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Big Data Conference — итоговый отчет
  2. 2 Андрей Шумов (Vizex) – о геймификации больших данных на Big Data Conference
  3. 3 Александр Сербул (1С-Битрикс) – об инверсном индексе для чатботов на Big Data Conference
  4. 4 Максим Кулиш (OWOX) – об извлечении смысла из больших данных e-commerce на Big Data Conference
  5. 5 Андрей Орлов (IBM) – об использовании когнитивной платформы в реальных проектах на Big Data Conference