Удалить дубли фраз онлайн
При сборе семантического ядра используют несколько источников: сервисы, подсказки поисковых систем, ключи конкурентов, синонимы. В результате в ядре появляются повторяющиеся строки —прямые или неявные дубли. Удалять их вручную долго и неэффективно. Наш онлайн-сервис «Лемматизация и удаление дублей фраз» быстро решает эту задачу.
Как удалить дубли строк?
Инструмент выполняет несколько функций:
-
Удаление дубликатов строк (одинаковых ключей). Пример: [купить велосипед в Москве], [купить велосипед в Москве].
-
Удаление неявных дубликатов (с перестановкой слов). Пример: [купить велосипед в Москве], [велосипед купить в Москве].
-
Удаление дублей с учётом лемматизации (без учёта словоформы). Пример: [купить велосипед в Москве], [купить велосипед Москва].
-
Удаление дубликатов, включая условные дубли с учётом лемматизации. Имеется в виду комбинация всех этих методов.
-
Лемматизация фраз, то есть приведение их к первоначальной словарной форме и удаление повторяющихся фраз. Пример: [купить велосипеды] — [купить велосипед].
Чтобы удалить дубли строк, введите список ключевых фраз (до 5000 за одну итерацию). Отметьте в чекбоксах нужные функции. Кликните на кнопку «Проверить».
За каждую проверку списывается 5 лимитов, независимо от количества ключей.
Полученные данные автоматически скачиваются на компьютер в формате .Excel. Запросы разделены на несколько групп: введенные, очищенные, удаленные. В отдельную группу выведен список самых частотных слов из запросов.
Для дальнейшей работы используются очищенные запросы. Их нужно кластеризовать (разделить на группы). Готовое семантическое ядро используют для аналитики, создания структуры, оптимизации страниц сайта, работы с контекстной рекламой.
Вопросы и ответы
Что такое лемматизация?
Лемматизация — это приведение слова к лемме — исходной, первоначальной, канонической форме. Например, запрос [куплю квартиру] приводится к лемме [купить квартира]. Поисковые системы лемматизируют фразы, чтобы выдать один и тот же результат для разных по написанию, но одинаковых по смыслу запросов. На этапе сбора семантического ядра запросы лемматизируют, чтобы исключить дубли ключей.
Почему появляются дубли запросов?
При сборе семантического ядра используются разные источники: Вордстат.Яндекс, поисковые подсказки, сайты конкурентов. Один и тот же запрос может быть добавлен в ядро несколько раз, появляются дубли. Они могут быть полными (полностью совпадающие фразы) и условные (с перестановкой слов, словоформы без учета лемматизации).
Как найти дубли запросов?
Можно искать дубли вручную или воспользоваться инструментом поиска дубликатов в таблице Excel. Но это долго и неудобно. Используйте инструмент Пиксель Тулс «Лемматизация и удаление дублей фраз». Сервис выполняет выбранные операции: лемматизирует фразы, удаляет полные и условные дубли.
Как удалить дубли запросов?
Почистить семантическое ядро от дублей можно вручную или автоматически с помощью инструмента «Лемматизация и удаление дублей фраз».
Рейтинг статьи:
По оценкам 40 пользователей
Другие материалы