Top.Mail.Ru
Истории

ChatGPT обучали работники из Африки — теперь чат-бот повторяет их языковые привычки

Истории
Дарья Сидорова
Дарья Сидорова

Редактор направления «Истории»

Дарья Сидорова

Пользователи заметили, что в ответах ChatGPT некоторые слова встречаются гораздо чаще, чем в глобальном интернете. Например, чат-бот часто использует слово delve (углубиться, вникнуть), не особо распространенное в американской и британской версии английского. И это не случайность, а, вероятно, следствие того, как система создавалась.

ChatGPT обучали работники из Африки — теперь чат-бот повторяет их языковые привычки

В конце марта Джереми Нгуен, инфлюенсер в сфере ИИ из Технологического университета Суинберн в Мельбурне, обратил внимание на то, что в своих ответах ChatGPT часто использует слово delve (углубиться, вникнуть). Конечно, если это слово встречается в тексте, это не значит, что он сгенерирован ИИ. Однако в масштабе ситуация совсем другая.

Так, на сайте с биомедицинскими исследованиями PubMed слово delve встречается в 0,5% статей — это в 10-100 раз больше, чем несколько лет назад. А значит, эти статьи могли быть частично написаны с помощью ChatGPT.

Фото в тексте: Джереми Нгуен / X

Однако слово delve — не самое любимое у ChatGPT. Согласно другому набору данных, в его текстах также встречаются чаще, чем в интернете в целом, и некоторые другие слова. Среди них — explore (исследовать), tapestry (гобелен), testament (завет, завещание) и leverage (использовать). И это не случайность, а, вероятно, следствие того, как чат-бот создавался.


Читайте по теме:

60% ответов GPT-3.5 являются плагиатом — исследование

Илон Маск намерен сделать чат-бота Grok политически нейтральным


GPT-4 — это большая языковая модель, которая обучена почти на всех англоязычных текстах в интернете. Чтобы превратить ее в полезный чат-бот, используют метод обучения с подкреплением на основе отзывов людей (reinforcement learning with human feedback, RLHF). Тестировщики-люди задают вопросы и дают инструкции исходной версии модели, а также предоставляют ей фидбек — ставят лайки и дислайки или пишут текстовый ответ.

Такое обучение стоит дорого, поэтому крупные компании передают его на аутсорсинг в менее богатые страны, где можно дешево нанять англоговорящих работников.

Если сравнивать с интернетом в целом, то ChatGPT использует слово delve слишком часто. Однако в африканской части мировой паутины это слово гораздо более распространено.

В Нигерии слово delve используют в деловом английском гораздо чаще, чем в Великобритании и США. Работники, обучающие ИИ, предоставляли ему примеры на привычном языке. В итоге получился чат-бот, который пишет на языке, близком к африканскому английскому.

Источник.

Фото на обложке: Tada Images / Shutterstock

Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Все, что вы хотели знать про судьбоносный для Generative AI судебный иск
  2. 2 Что будет с поисковыми системами через 5 лет и как seo-специалистам справиться с переменами
  3. 3 Искусственный интеллект vs SEO: кто кого?
  4. 4 Нейросеть ChatGPT: новый бесплатный чат-бот с искусственным интеллектом
  5. 5 Почти половина российских PR-агентств используют ИИ для генерации сюжетов и креативов — опрос
FutureFood
Кто производит «альтернативную» еду
Карта