Как составить семантическое ядро самостоятельно?
Семантическое ядро – это все запросы по которым мы хотим продвигать наш сайт, а также все поисковые запросы, которые уже существуют в выдаче.
● Частотность поисковых систем.
● Наличие фраз – синонимов или «зеркало спроса».
● Качественные ключевые запросы.
Основные формулировки, использующиеся дальше:
- ● вч,сч,нч – высокочастотный, среднечастотный, низкочастотный;
- ● ВК, НК – высококонкурентный, низкоконкурентный;
- ● точное вхождение – запрос без изменений;
- ● синоним;
- ● словоформа – другой падеж, число, склонение;
- ● перестановка – запрос, где слова стоят в разных порядках;
- ● хвосты – запросы, с подсказками – подстановками роботов.
Способы сбора семантики
➕ Хорошие: сервисы поисковых систем (вордстат), сервисы с парсингом и программы (кей коллектор).
✖ Не очень хорошие: выгрузка счетчиков (метрика, вебмастер), базы – старые запросы и частотка, может быть мусор.
Маркеры (маски запросов)
Маркер – это запрос который наилучшим образом характеризует конкретный товар или услугу.
● Чётко отвечает одной продвигаемой странице (интенту).
● Похожие запросы, но с разными интентами – разные маркеры.
● Для категории «Телевизоры» – маркер «Телевизоры».
● Для страницы телевизоров бренда Самсунг – «Телевизоры Самсунг».
● «Телевизоры Самсунг дешево» – может быть маркером отдельно.
● «Телевизоры Самсунг купить в интернет-магазине» – нет.
● Обычно собираются в ручном или полу-ручном режиме.
Где взять маркеры:
- ➖ логические гипотезы, знание бизнеса;
- ➖ выгрузки из ассортимента / каталога;
- ➖ счетчики статистики (метрика, ГА) – сложно и неточно;
- ➖ Wordstat (левая колонка), AdWords;
- ➖ конкуренты (вручную и с помощью парсинга).
Оптимально так: гипотезы/выгрузки, вордстат, конкуренты.
Логические гипотезы / выгрузки:
- ● На сайте уже есть какие-то разделы, их названия станут маркерами.
- ● Есть какие-то категории в прайс-листах поставщиков.
- ● По опыту знаете, что ваши товары / услуги ищут именно так.
- ● Конкуренты предлагают именно так.
Парсинг конкурентов:
- ➖ если сайты небольшие, то лучше искать маркеры руками;
- ➖ подходит лучше для ИМ, но и в услугах работает;
- ➖ основных конкурентов получаем руками, Megaindex;
- ➖ прямые конкуренты, лидеры именно по SEO;
- ➖ нужна подходящая структура урлов и элементов страницы.
- ➖ обязательно хорошая оптимизация (грамотные Title, H1 и т.д.);
- ➖ нужна программа с парсером.
«Облако» запросов – это расширения маркеров, которые формируются из:
- ➖ хвосты;
- ➖ длинные запросы (далеко не всегда НЧ);
- ➖ НЧ: «Купить ноутбук в Москве в интернет-магазине недорого»;
- ➖ получаются из подсказок (подсказки – лучший, самый чистый источник облака);
- ➖ блако получить проще, чем маркеры;
- ➖ используем массовый парсинг;
- ➖ используем сразу на входе стоп-слова и промежуточные чистки;
- ➖ стоп-слова можно брать с этапа маркеров.
Группировка запросов – объединение в одну группу запросов с одинаковым интентом.
Используем метод подобия топов ПС для автоматизации:
- ➖ если по запросам А и Б в выдаче встретилось 5 одинаковых URL’s (ПС даёт одинаковый ответ), следовательно и запросы эти – про одно и тоже;
- ➖ высокая вероятность совместимости запросов, которые попали в кластер (можно продвигать вместе на 1 странице);
- ➖ не идеальна, требует ручной «догруппировки»;
- ➖ сильно зависит от качества выдачи;
- ➖ видит то, что не видит глаз;
- ➖ на выходе получаем готовое ядро, осталось только почистить.
Виды кластеризации – софт (все пересекается с одним значением, но не обязательно пересекаются между собой) и хард (все зависимы друг от друга и пересекаются между собой).
Настройки кластеризации
Порог – самая важная, определяет качество:
- ● Определяет, сколько урлов в топ-10 должно совпасть, чтобы запросы объединились в группу.
- ● Подбирается экспериментально (от тематики, конкуренции). Больше порог – много мелких кластеров, меньше порог – мало огромных.
- ● Рекомендуется 4 для SOFT (под траф), реже 5.
- ● 3 для HARD – всегда, в редких случаях 4 под очень мощные ВЧ.
Регион – всегда тот под который продвигаете. Важно, выбор ПС зависит от целевой аудитории, чаще Яндекс.
Пост-обработка после кластеризации
Обязательно проверить после кластеризации ядро руками! Ищем ошибки 4-х видов:
- Запросы про одно и то же распались на 2 разных кластера.
- Запросы с разным посылом «склеились» в 1 кластер.
- Запросы перемешались между 2-мя кластерами.
- Полезные запросы упали в «некластеризованные».
Исправляем ошибки руками или фильтрами. Объединяем, разделяем, переносим запросы в соответствующие группы. Не объединяем коммерцию и инфо и глав/внутр (смотрим по составу кластеров и по выдаче).
Фильтрация и чистка от мусора
В любой семантике всегда есть и будет мусор – надо вычищать.
Чистка по частотности:
- ➖ удаляем нули / ультра НЧ – только если спрос не сезонный / трендовый;
- ➖ если тематика сезонная (проверить по WS) – оставляем нули, перепробываем в сезон.
Чистка стоп-словами:
- ➖ предварительные готовые стоп-слова (своими руками, отзывы и т.д.);
- ➖ гипотезы, основанные на знании тематики;
- ➖ ручные стоп-слова, полученные на этапе сбора Вордстата, анализ униграмм через макросы или софт (КК).
Ручная чистка – без нее никуда, но минимизируем её. Автоматическая чистка – кластеризатор.