"Т-Технологии" опубликовали датасет T-ECD для рекомендательных систем
"Т-Технологии" опубликовали датасет T-ECD для рекомендательных систем - РИА Новости, 26.09.2025
"Т-Технологии" опубликовали датасет T-ECD для рекомендательных систем
Центр искусственного интеллекта группы "Т-Технологии" выложил в открытый доступ один из крупнейших в мире датасетов для рекомендательных систем в области... РИА Новости, 26.09.2025
2025-09-26T10:45:00+03:00
2025-09-26T10:45:00+03:00
2025-09-26T17:35:00+03:00
т-банк (ао «тинькофф банк»)
россия
МОСКВА, 26 сен - РИА Новости. Центр искусственного интеллекта группы "Т-Технологии" выложил в открытый доступ один из крупнейших в мире датасетов для рекомендательных систем в области электронной торговли T-ECD, сообщает Т-Технологии.Датасет собран на основе обезличенных действий 44 миллионов уникальных пользователей сервисов "Шопинг" и "Супермаркеты" в приложении Т-Банка, а также рекламной платформы компании, 30 миллионов товаров и более 135 миллиардов взаимодействий. Бенчмарк состоит из пяти взаимосвязанных и полностью анонизимированных источников данных: история покупок по транзакциям, чеки, отзывы, взаимодействие с рекомендациями по товарам повседневного спроса (FMCG) и непродовольственных товаров (non-FMCG), а также истории активаций специальных предложений и кэшбэков. Все источники данных можно использовать как самостоятельные датасеты, так и связывать их по ключам пользователей, товаров или брендов магазинов. Датасет подходит для большинства типов рекомендательных задач, отмечается в сообщении.Данные собраны с глубиной от 1 года до 3,5 лет, что позволяет анализировать как краткосрочные, так и долгосрочные предпочтения пользователей, динамику их изменения, а также сезонность и тренды."Фактор глубины данных крайне важен для исследований, поскольку позволяет делать корректные разбивки на данные для обучения моделей и дает возможности в разы повышать качество рекомендаций при использовании глубоких нейронных сетей", - отмечают в Т-Технологиях.Датасет содержит информацию по признакам пользователей и товаров, явную (explicit) и неявную (implicit) обратную связь пользователей, что открывает возможности для проведения исследования по полному охвату классов и типов рекомендательных систем – от коллаборативной фильтрации до более сложных контекстных и графовых подходов для использования глубокого обучения."В академических датасетах зачастую есть данные только о содержательных действиях пользователей: клики, покупки, лайки и другое, но нет данных о просмотрах (так называемые impressions). При этом для бизнеса важнее знать, что пользователям показывала рекомендательная система. Это помогает точнее понимать, что пользователи увидели, но никак не отреагировали. T-ECD содержит данные не только о фактах просмотров, но и уточняет источник – поиск, каталог или рекомендации, что позволяет оценивать влияние рекомендаций на пользователей или моделировать эффект воздействия", - говорится в сообщении.Как считает руководитель направления рекомендательных систем Т-Технологий Марина Ананьева, датасет T-ECD может стать одним из новых бенчмарков и принести ценность ML-сообществу для улучшения качества персонализации и клиентского опыта реальных пользователей.
"Т-Технологии" опубликовали датасет T-ECD для рекомендательных систем
Группа "Т-Технологии" опубликовала датасет T-ECD для рекомендательных систем
