Если в каталоге несколько десятков товаров, сократить названия можно вручную. Но когда речь идёт о тысячах или десятках тысяч позиций, такая работа быстро превращается в отдельный проект на недели или даже месяцы.
Особенно часто эта задача возникает при загрузке товаров на маркетплейсы, переносе каталогов между различными системами или подготовке товаров для интернет-магазина.
Например, на Wildberries длина названия ограничена 60 символами. Если название длиннее, карточку товара создать не получится. В интернет-магазинах ограничения могут быть связаны с SEO, особенностями платформы или требованиями к отображению товаров в каталоге.
Когда ассортимент большой, ручное сокращение названий становится слишком трудоёмким. Поэтому обычно используются автоматизированные способы обработки.
Самый простой вариант — использовать программный алгоритм.
Обычно наша система сначала удаляет лишние и запрещённые символы, затем проверяет длину названия и при необходимости сокращает его по границам слов. Дополнительно могут удаляться предлоги и служебные слова, которые остаются в конце после сокращения.
Например, если просто обрезать строку по количеству символов, можно получить что-то вроде:
Детский велосипед горный алюминиев
Такое название выглядит неаккуратно, поскольку последнее слово оказалось обрезано посередине.
Поэтому наша система сокращает текст только по границам слов.
Есть и другая распространённая проблема. Допустим, исходное название выглядело так:
Детский велосипед бренда X модели Y с дополнительными боковыми колёсами
После сокращения может остаться:
Детский велосипед бренда X модели Y с
Очевидно, что такое окончание выглядит странно и не несёт смысла. Поэтому дополнительно удаляются предлоги и служебные слова, оставшиеся без продолжения.
Такой подход позволяет быстро обработать большой объём данных и хорошо подходит для многих задач.
Однако у него есть ограничение: алгоритм не понимает смысл названия товара.
Например, если в конце названия находится цвет, материал или важная характеристика модели, обычный алгоритм может удалить именно её, хотя для покупателя эта информация может быть одной из самых важных.
Когда требуется получить более качественный результат, мы используем современные языковые модели.
В отличие от обычного алгоритма, нейросеть анализирует смысл названия товара. Она может определить наиболее важные характеристики, убрать второстепенные слова, сократить отдельные формулировки и сохранить максимум полезной информации в рамках заданного ограничения по длине.
Фактически получается результат, близкий к тому, который сделал бы специалист вручную, но значительно быстрее.
Особенно заметна разница на больших каталогах, где качество названий напрямую влияет на восприятие карточек товаров покупателями.
| Исходное название | Сокращённое название |
|---|---|
| Ящик для хранения вина Доляна «Кальяри», 35×18 см, на 2 бутылки, дерево, бежевый | Ящик для вина Доляна Кальяри 35×18 см на 2 бутылки дерево |
| Японский сад камней настольный «Дзен. Колокол», с набором аксессуаров, 15×14×13 см | Настольный японский сад камней Дзен Колокол 15×14×13 см |
| Эфирное масло для доливки в диффузор «Океан», длительного действия, 30 мл | Эфирное масло для диффузора Океан длительного действия 30 мл |
| Шампунь для волос восстанавливающий, с экстрактом макадамии, 750 мл | Шампунь восстанавливающий с экстрактом макадамии 750 мл |
| Термокружка Мастер К Coffee, 500 мл, сохраняет тепло 8 ч, нержавеющая сталь, чёрная | Термокружка Мастер К Coffee 500 мл нержавейка чёрная |
Как видно из примеров, задача заключается не просто в уменьшении количества символов.
Например, в случае с ящиком для вина ИИ не просто удалил часть текста, а сократил формулировку «для хранения вина» до более компактного варианта «для вина», сохранив смысл.
В примере с термокружкой были удалены второстепенные маркетинговые характеристики, но сохранены объём, материал и цвет — параметры, которые обычно важны покупателю при выборе товара.
Именно поэтому современные языковые модели часто позволяют получить более качественный результат по сравнению с обычным сокращением по формальным правилам.
На практике мы сталкивались с каталогами, содержащими более 500 000 товаров. В таких объёмах ручное сокращение названий становится практически невозможным.
Именно поэтому мы тестировали различные подходы — от классических алгоритмов до современных языковых моделей.
Мы пришли к выводу, что единого универсального решения не существует.
Если необходимо максимально быстро обработать большой каталог, часто достаточно обычного алгоритма.
Если же важно сохранить смысл названий и получить максимально качественный результат, лучше использовать искусственный интеллект.
Стоит отметить, что в таких случаях с ИИ мы взаимодействуем, конечно же, без человеческого участия и не отдельно по каждому товару, а массово через API нейросетей.
На практике оба подхода успешно работают, просто применяются для разных задач.
Если главная цель — быстро привести названия к требуемой длине, программного алгоритма обычно достаточно.
Если же важно сохранить наиболее значимые характеристики товара и получить максимально качественные названия, лучше использовать современные технологии искусственного интеллекта.
Мы используем оба варианта обработки и подбираем подход в зависимости от особенностей каталога, объёма данных и требований конкретной площадки.
Если перед вами стоит задача обработки большого каталога товаров, будем рады помочь подобрать подходящее решение.
Если Вы хотите что-то уточнить, прокомментировать или оставить отзыв - сделать это можно в наших мессенджерах и соцсетях. Например, в Telegram (ссылка в нижней части сайта, можно оставить комментарий или написать сообщение каналу). Будем рады Вашим обращениям.
Ozon, Wildberries, Яндекс Маркет и МегаМаркет являются зарегистрированными товарными знаками соответствующих правообладателей. Сервис Tovaroved не является их официальным представителем. Упоминание данных брендов носит информационный характер. Использование на сайте сертификатов осуществляется в информационных целях и на основании участия сервиса в соответствующих партнёрских программах.
Все права защищены © 2020-2026, Tovaroved ® ИП Гневышев А.Ю., ОГРН 313743017200061