Главная » Статьи » База знаний » Как составить семантическое ядро самостоятельно?

Как составить семантическое ядро самостоятельно?

Семантическое ядро — это все запросы по которым мы хотим продвигать наш сайт, а также все поисковые запросы, которые уже существуют в выдаче.
 
● Частотность поисковых систем.
● Наличие фраз – синонимов или «зеркало спроса».
● Качественные ключевые запросы.
 
Основные формулировки, использующиеся дальше:
 

  • ● вч,сч,нч – высокочастотный, среднечастотный, низкочастотный;
  • ● ВК, НК – высококонкурентный, низкоконкурентный;
  • ● точное вхождение — запрос без изменений;
  • ● синоним;
  • ● словоформа – другой падеж, число, склонение;
  • ● перестановка – запрос, где слова стоят в разных порядках;
  • ● хвосты – запросы, с подсказками – подстановками роботов.

 
Способы сбора семантики
 
➕ Хорошие: сервисы поисковых систем (вордстат), сервисы с парсингом и программы (кей коллектор).

✖ Не очень хорошие: выгрузка счетчиков (метрика, вебмастер), базы – старые запросы и частотка, может быть мусор.
 
Маркеры (маски запросов)
 
Маркер – это запрос который наилучшим образом характеризует конкретный товар или услугу.
 
● Чётко отвечает одной продвигаемой странице (интенту).
● Похожие запросы, но с разными интентами – разные маркеры.
● Для категории «Телевизоры» — маркер «Телевизоры».
● Для страницы телевизоров бренда Самсунг – «Телевизоры Самсунг».
● «Телевизоры Самсунг дешево» — может быть маркером отдельно.
● «Телевизоры Самсунг купить в интернет-магазине» — нет.
● Обычно собираются в ручном или полу-ручном режиме.
 
Где взять маркеры:
 

  • ➖ логические гипотезы, знание бизнеса;
  • ➖ выгрузки из ассортимента / каталога;
  • ➖ счетчики статистики (метрика, ГА) – сложно и неточно;
  • ➖ Wordstat (левая колонка), AdWords;
  • ➖ конкуренты (вручную и с помощью парсинга).

 

Оптимально так: гипотезы/выгрузки, вордстат, конкуренты.
 
Логические гипотезы / выгрузки:
 

  • ● На сайте уже есть какие-то разделы, их названия станут маркерами.
  • ● Есть какие-то категории в прайс-листах поставщиков.
  • ● По опыту знаете, что ваши товары / услуги ищут именно так.
  • ● Конкуренты предлагают именно так.

 

Парсинг конкурентов:
 

  • ➖ если сайты небольшие, то лучше искать маркеры руками;
  • ➖ подходит лучше для ИМ, но и в услугах работает;
  • ➖ основных конкурентов получаем руками, Megaindex;
  • ➖ прямые конкуренты, лидеры именно по SEO;
  • ➖ нужна подходящая структура урлов и элементов страницы.
  • ➖ обязательно хорошая оптимизация (грамотные Title, H1 и т.д.);
  • ➖ нужна программа с парсером.

 

«Облако» запросов — это расширения маркеров, которые формируются из:
 

  • ➖ хвосты;
  • ➖ длинные запросы (далеко не всегда НЧ);
  • ➖ НЧ: «Купить ноутбук в Москве в интернет-магазине недорого»;
  • ➖ получаются из подсказок (подсказки – лучший, самый чистый источник облака);
  • ➖ блако получить проще, чем маркеры;
  • ➖ используем массовый парсинг;
  • ➖ используем сразу на входе стоп-слова и промежуточные чистки;
  • ➖ стоп-слова можно брать с этапа маркеров.

 

Группировка запросов — объединение в одну группу запросов с одинаковым интентом.
 
Используем метод подобия топов ПС для автоматизации:
 

  • ➖ если по запросам А и Б в выдаче встретилось 5 одинаковых URL’s (ПС даёт одинаковый ответ), следовательно и запросы эти — про одно и тоже;
  • ➖ высокая вероятность совместимости запросов, которые попали в кластер (можно продвигать вместе на 1 странице);
  • ➖ не идеальна, требует ручной «догруппировки»;
  • ➖ сильно зависит от качества выдачи;
  • ➖ видит то, что не видит глаз;
  • ➖ на выходе получаем готовое ядро, осталось только почистить.

 
Виды кластеризации – софт (все пересекается с одним значением, но не обязательно пересекаются между собой) и хард (все зависимы друг от друга и пересекаются между собой).
 
Настройки кластеризации
 
Порог – самая важная, определяет качество:
 

  • ● Определяет, сколько урлов в топ-10 должно совпасть, чтобы запросы объединились в группу.
  • ● Подбирается экспериментально (от тематики, конкуренции). Больше порог – много мелких кластеров, меньше порог – мало огромных.
  • ● Рекомендуется 4 для SOFT (под траф), реже 5.
  • ● 3 для HARD – всегда, в редких случаях 4 под очень мощные ВЧ.

 
Регион – всегда тот под который продвигаете. Важно, выбор ПС зависит от целевой аудитории, чаще Яндекс.
 

Пост-обработка после кластеризации

 
Обязательно проверить после кластеризации ядро руками! Ищем ошибки 4-х видов:
 

  1. Запросы про одно и то же распались на 2 разных кластера.
  2. Запросы с разным посылом «склеились» в 1 кластер.
  3. Запросы перемешались между 2-мя кластерами.
  4. Полезные запросы упали в «некластеризованные».

 

Исправляем ошибки руками или фильтрами. Объединяем, разделяем, переносим запросы в соответствующие группы. Не объединяем коммерцию и инфо и глав/внутр (смотрим по составу кластеров и по выдаче).
 
Фильтрация и чистка от мусора
 
В любой семантике всегда есть и будет мусор – надо вычищать.
 
Чистка по частотности:
 

  • ➖ удаляем нули / ультра НЧ – только если спрос не сезонный / трендовый;
  • ➖ если тематика сезонная (проверить по WS) – оставляем нули, перепробываем в сезон.

 


Чистка стоп-словами:

 

  • ➖ предварительные готовые стоп-слова (своими руками, отзывы и т.д.);
  • ➖ гипотезы, основанные на знании тематики;
  • ➖ ручные стоп-слова, полученные на этапе сбора Вордстата, анализ униграмм через макросы или софт (КК).

 
Ручная чистка – без нее никуда, но минимизируем её. Автоматическая чистка – кластеризатор.


(2 оценок, из 5)
Загрузка...