Лемматизация текста и удаление дублей фраз

99₽ за первый месяц

Быстрая регистрация за 1 минуту
Зарегистрируйтесь и получите доступ на 30 дней

Вход
Регистрация
Или
Уже зарегистрированы? Войти

Самый трудоемкий этап работы с семантическим ядром — чистка от «мусора» (нецелевых ключей) и дублей. Наш онлайн сервис автоматизирует чистку ядра от дублирующих фраз: находит повторяющиеся ключевые слова, словоформы, фразы с перестановкой слов.

Для чего используют лемматизатор?

С точки зрения поисковых систем, запросы [купить квартиру в Москве] и [купить квартиру Москва] означают одно и то же. При индексировании документа они приводятся к начальной словоформе – лемме. Этот процесс называется лемматизация. При формировании семантического ядра, анализа списка запросов, работе с контекстной рекламой важно удалить дубли ключей.

Сервис позволяет отфильтровать и удалить полные дубли (повторяющиеся строки) или условные дубли — фразы с перестановкой слов, словоформы. А также лемматизирует слова — приводит их к начальной форме.

Лемматизация текста онлайн - фото 1

Принцип работы онлайн-инструмента

Удаление дубликатов строк проводится по алгоритму, с учетом выбранных функций:

  • 1

    Программа делит фразы на фрагменты (шинглы).

  • 2

    Преобразует каждый из шинглов в лемму (начальную форму).

  • 3

    Сравнивает получившиеся фразы, удаляет дубли.

Вариативность онлайн-проверки

Инструмент позволяет менять настройки, чтобы эффективно решать задачи пользователя:

Лемматизирует фразы или оставляет запросы в той форме, в которой они введены в сервис.
Позволяет убрать полные или условные дубли.
Удаляет дубли с учётом или без учета словоформы.
Можно ввести список запросов, которые не нужно лемматизировать.

Получение результатов анализа в виде CSV‑файла

Для удобства анализа и работы с выходными данными имеется возможность выгрузить результаты в формате CSV, как перед процессом проверки, так и после неё. Файл с источниками открывается в Excel для дальнейшей работы.

Как пользоваться инструментом

Сервис лемматизирует слова, то есть приводит их к первоначальной словарной форме. Например, существительные — к форме единственного числа именительного падежа, глаголы — к инфинитиву.

Основная функция сервиса — удаление дубликатов:

Полных дублей. Имеются в виду одинаковые повторяющиеся строки.
Фраз с перестановкой слов. Например, [купить самокат в Санкт-Петербурге] [самокат купить в Санкт-Петербурге].
Ключей с учётом лемматизации (без учёта словоформы). Например, [купить самокат в Санкт-Петербурге], [купить самокат Санкт-Петербург].
Условных дубликатов с учётом лемматизации. Имеется в виду комбинация всех этих методов.

Чтобы запустить поиск дубликатов, введите список поисковых запросов (не более 5 000 строк) и отметьте в чекбоксах нужные функции. Если выбрана опция «лемматизировать фразы», введите список исключений. Это могут быть аббревиатуры, бренды, термины.

Лемматизация текста онлайн - фото 2

Поиск и удаление дубликатов занимает несколько секунд.

Лемматизация текста онлайн - фото 3

Удаленные запросы отражены в отдельной таблице.

Лемматизация текста онлайн - фото 4

Сервис находит самые частотные запросы и формирует из них отдельную таблицу. Значение в правой колонке — число вхождений слова в итоговом списке запросов.

Лемматизация текста онлайн - фото 5

За каждую проверку списывается 5 лимитов, независимо от количества строк. Результат можно скачать в виде CSV-файла и пользоваться им как таблицей Excel.

Лемматизация текста онлайн - фото 6

Преимущества сервиса

Быстро и точно приводит слова к лемме.
Работает с большими объемами — до 5 000 строк за одну проверку
Несколько вариантов настроек для решения задач пользователя
С результатом можно работать в сервисе или скачать в виде CSV-файла.

Сервис полезен вебмастерам, семантикам, SEO-специалистам, маркетологам, контекстологам при сборе семантического ядра, аналитике запросов, настройке рекламы.

Дополнительные инструменты

Другие сервисы Пиксель Тулс, которые могут быть вам полезны:

Комплексная оценка запросов. Оценивает интент, степень коммерциализации, показывает ТОП-5 слов, которые задают тематику выдачи.
Анализ запроса. Инструмент проверяет SEO-параметры ключевой фразы: геозависимость, степень локализации, наличие витального ответа, общую и точную частотность, число объявлений в Яндекс.Директ, средний возраст документов.
Подбор семантики для сайта или страницы. Сервис собирает семантическое ядро объемом до 100 000 строк. Работает онлайн, не требует капчи. После чистки от мусора и повторяющихся фраз результат можно использовать как ядро для любого сайта, в том числе интернет-магазина.

Часто задаваемые вопросы

Как протестировать ваш сервис бесплатно?
Единожды вы можете воспользоваться акцией «Доступ на 30 дней за 99 рублей». Также мы сохраняем бесплатный доступ к проектам и инструментам для тех, кто пригласил от 2 рефералов или делегировал от 1 000 XML-лимитов. В остальных случаях следует рассмотреть тариф на общих условиях.
Интересует один-два инструмента или разовая задача?
Если ресурсов тарифа на 30 дней вам в избыток, воспользуйтесь тарифом на 10 дней (от 364 рублей) или пакетом лимитов (от 100 рублей). На них доступны все те же проекты и инструменты, просто объём лимитов на проверки не такой большой.
Работаете ли с юридическими лицами?
Да, мы работаем с юридическими лицами. Чтобы оплатить тариф, заполните данные плательщика и запросите счёт на сумму от 3 000 рублей. На баланс средства поступят по факту зачисления на расчётный счёт, как правило, в течение 1-3 рабочих дней. Закрывающие документы ежемесячно загружаем в раздел «Список плательщиков, счетов и актов/УПД».
Как подключить или отменить подписку?
Для удобства мы разработали систему подписки. При оплате ваша карта привязывается в разделе «Управление балансом». После окончания, если вы её не отключите, тариф будет автоматически продлён на тот же срок. Это позволит беспрерывно собирать статистику по проектам, а также получать бесплатные лимиты по программе лояльности.
Что делать, если не получается оплатить тариф?
В редких случаях оплату по карте может блокировать антивирус, блокировщик рекламы или настройки браузера. Попробуйте воспользоваться советами по ссылке. Если они вам не помогут, напишите в службу поддержки, поможем удалённо или предложим альтернативные способы оплаты.
Почему после оплаты тариф не изменился?
Средства зачисляются на баланс вашего аккаунта. Чтобы использовать их для оплаты тарифа, перейдите в раздел «Управление тарифом», выберите период, тариф и нажмите на кнопку «Принять». В этот раз, средства спишутся с баланса вашего аккаунта и тариф сразу же активируется.
Как перенести проекты из другой системы?
Выберите один из модулей на странице «Перенос проектов». Перенос фраз, групп, URL и настроек произойдёт автоматически. Если какой-то системы не оказалось, выберите универсальный способ «Excel файл».
Как понять, какой тариф и сколько лимитов нужно?
Чтобы упростить это, мы разработали калькулятором лимитов. Просто введите суммарное количество запросов в ваших проектах и частоту проверки, в ответ мы рассчитаем для вас необходимо количество лимитов и предложим оптимальный тариф. Если потребуется помощь, напишите в службу поддержки.

Узнайте, как увеличить SEO‑трафик сайта в 3+ раза?

Укажите домен + регион продвижения, получите текущие позиции проекта в выдаче и первые 25 рекомендаций для роста трафика и заказов.
1
Выберите ваш сайт
Укажите сайт, регион и близких вам конкурентов
2
Магия поисковой оптимизации
25 персональных рекомендаций ждут вас
3
Отслеживайте прогресс
Получайте регулярные советы, рост трафика и продаж
0%
Подбираем семантику,
это займёт около 20-30 секунд
Открыть справку Написать в поддержку
Обратная связь и помощь
Если у вас есть идеи, как улучшить данный инструмент или остались вопросы по работе с ним, напишите в нашу службу поддержки, мы обязательно вам поможем.