В настоящее время многие люди хотят иметь свой сайт, при этом большое количество людей желают еще зарабатывать на нем. Каждый вебмастер создавая свой интернет-ресурс, желает продвинуть его страницы на верхние позиции в поисковой системе. Многие хотят просто донести свою мысль громадному количеству посетителей, остальные желают получить доход с контекстной рекламы. Без достижения страницами ТОПа выдачи просто бессмысленно создавать и содержать свой портал.
В связи с огромным количеством создаваемых интернет-ресурсов, поисковые системы обязаны постоянно улучшать алгоритмы ранжирования страниц, чтобы они отвечали всем желаниям пользователей.
К огромному сожалению, для оптимизаторов и вебмастеров остается просто неведомым огромное количество алгоритмов ранжирования. Но известны основные правила
составления поисковой выдачи и это уже предоставляет возможность улучшать свой портал.
Релевантность – насколько контент на портале, изображения или видео совпадает с запросом человека. Если этот показатель будет близким к нулевому – ресурс не будет находиться в поисковой выдаче по запросу. За искусственное увеличение этого показателя документа, методом включения в текст лишнего количества запросов документ будет просто понижается вы выдаче или в худшем случае может попасть под фильтр.
Релевантность, которая позволяет занять топ поисковой выдачи является естественной. Если вдруг вы читаете статью из топ-10 по конкурентному запросу, наверное, она просто оптимизирована под поисковые системы, но заметить это непросто (текст совсем не режет глаз большим количеством повторяющихся фраз и синонимов).
Ранжирование представляет собой упорядочивание информации, согласно таким условиям, как респектабельность, авторитетность, а также релевантность. Результат ранжирования можно посмотреть, получив ответ от поисковика на свой запрос. Система обработает запрос пользователя, сортируя полученные данные в своей БД. Именно так и происходит ранжирование. Выдача результата представляет собой перечень ссылок в заданной последовательности. Это и можно назвать примером ранжирования информации. При продвижении сайта все веб-мастера учитывают такие понятия, о которых сказано выше, поскольку они играют немаловажную роль в этом деле.
Важные факторы ранжирования в Яндексе и Гугле
Внутренние факторы, которые можно разделить на 3 категории:
Текстовое ранжирование - насколько контент отвечает запросу пользователя
Качество контента - насколько этот текст является уникальным, насколько он является близким к естественному.
Свойства самого портала – входят ли ключевики в название домена, возраст ресурса и домена, количество страниц.
Внешние или ссылочные факторы ранжирования, которые можно разделить на 2 категории:
Статические факторы, которые не зависят от того, по какому именно запросу поисковая система должна определить релевантность этого документа.
Динамические факторы или ссылочное ранжирование - насколько являются релевантными тексты ведущих на этот сайт ссылок.
Как улучшить ранжирование и релевантность
Всё очень просто - следует просто отыскать общий язык с поисковиком и помогать ей в развитии своим порталом, что по любому вам вернется. Любая поисковая система желает увеличить своё качество, таким образом, и количество пользователей, чтобы продолжать развивать свой бизнес. Под развитием бизнеса имеется ввиду увеличение уровня качества и чистоты поисковика, которым мы с вами пользуемся. Для последующего развития нужно отвечать всем им требованиям, что позволит не только не допускать появления всех проблем с ним, но и своим проектом продвигать рунет, в общем.
Данная статья является итогом многолетних исследований и наблюдений за выдачей Яндекса. Я постараюсь перечислить все факторы ранжирования , о которых мне известно. Однако, я не могу утверждать, что все перечисленное ниже точно учитывается Яндексом. Неподтвержденные факты будут сопровождаться с комментариями "Есть мнения...".
1. Теги html
1.1. Заголовочные теги
1.1.1. Тег (тайтл)
Важность тега
1. Вхождение ключевого слова
Ключевые слова должны присутствовать в
2. Уникальность заголовка
Уникальность тега тайл оценивается, прежде всего, внутри сайта, т.е. нельзя чтобы один и тот же заголовок был у нескольких страниц. Также желательно иметь уникальный заголовок среди всех сайтов в интернете, но это требование не обязательное.
3. Месторасположение ключевого слова в заголовке
Считается, что чем ближе ключевые слова к началу
4. Расстояние между одинаковыми ключевыми словами
Близкие одинаковые вхождения ключевых слов - поисковый спам, а слишком большие расстояния могут плохо работать из-за большего разбавления ключевых слов. Лучше следовать совету: заголовок должен ориентироваться на запросы пользователей.
5. Разделители в заголовке
Есть мнения, что некоторые разделители являются не желательными.
P.S. Я использую в редких случаях разделительные вертикальные слэшы "|".
6. Уточняющие описания к ключевым словам
Считается, что чем короче тайтл, тем больше веса имеет каждое его слово. Например, если в тайтле 5 слов, то каждое слово будет иметь вес - 0.2, а если слов будет 15, то вес каждого слова уже будет в три раза меньше - 0.067. Поэтому нужно стараться сделать заголовок так, чтобы получилось как можно меньше слов, но с другой стороны, чтобы он содержал ключевые слова и был понятен для потенциальных пользователей.
7. Длина
Длина тайтла лучше делать не больше 80 символов, поскольку есть мнения, что длинные заголовки влияют негативно на продвижение. Хотя как показывает практика, поисковые системы индексируют и большое число символов.ы
8. Регистр текста
Писать все слова в верхнем регистре считается плохим тоном.
9. Плотность вхождений
Как ни странно, но этот показатель так же влияет. Приведу пример: многие составляют
1.1.2. Мета тег Description (описание страницы)
1. Наличие Description
Как известно мета тег Description не является обязательным, но я советую его никогда не опускать. Тем более Яндекс иногда берет сниппет именно из Description . Советую прочитать про важность оптимизации сниппетов при раскрутке сайта .
2. Наличие ключевых слов
В описании страницы должны присутствовать ключевые слова.
3. Уникальность Description
Для каждой страницы должно быть уникальное описание. Если описание повторяется на многих страницах, то этот тег лучше вообще убрать.
4. Длина описания
Считается, что слишком большое описание может негативно повлиять в спорных моментах, поскольку будет воспринято за спам. Описание должно быть не больше 200 символов.
1.1.3. Тег Keywords (ключевые слова)
1. Наличие Keywords
Как и Description
, мета тег Keywords
не является обязательным элементом страницы, но лучше чтобы он был. Как написано в официальном источнике Яндекса: "в некоторых случаях данный тег может учитываться".
2. Ключевые слова в Keywords
В Keywords должны быть ключевые слова , которые встречаются на странице. Ошибочно перечислять множество ключевых слов, которых даже нету на странице, хотя они имеют отношение к теме.
3. Уникальность ключевых слов
Для каждой страницы должны быть свои ключевые слова. Если одни и те же ключевые слова повторяются для многих страниц, то это может быть воспринято Яндексом как поисковый спам (лучше тогда вообще убрать этот тег).
4. Длина Keywords
Слишком большое наличие ключевых слов будет считаться поисковым спамом. Советую писать этот тег не длиннее чем 100 символов.
Последние исследования показывают, что сайты прекрасно продвигаются и без мета тега Keywords .
1.2. Остальные теги
1.2.1. Теги h1-h6
1.2.2. Другие теги
В основном я имею ввиду теги для выделения текста: , , , ,
1. Наличие ключевых слов
Ключевые слова встречающиеся на странице дают различный вес странице в зависимости от словоформ. Например, "Ламинированная ДСП" и "Ламинированное ДСП" будут давать разный вес. Также Яндекс дает вес отдельным словам встречающимся в тексте. Например, если в тексте было упоминание "ДСП", то это повысит релевантность запросу "купить ДСП".
2. Не ключевые слова в ключевой фразе
Не ключевые слова уточняют смысл, но уменьшают релевантность главной последовательности ключевых слов.
3. Уникальность околоссылочного текста
Есть мнения, что чем реже встречается околоссылочный текст на всех страницах интернета, тем больший вес будут иметь ключевые слова. Например, "купить лучшие пластиковые окна" и "история пластиковых окон уходит далеко в прошлое" - эти две фразы будут давать различный вес в релевантность страницы.
4. Плотность ключевых слов
Ключевые слова в контенте должны быть размыты и не стоят очень близко. Также не стоит выделять каждый раз ключевое слово какими-то выделяющим тегом.
5. Наличие
Обычно тот текст, который не нужно учитывать закрывают в тег
6. Иерархия заголовков и абзацев
Есть мнения, что после заголовка обязательно должен идти абзац с текстом. Также есть мнения, что ключевые слова встречающиеся в абзаце и присутствующие в заголовке перед этим абзацам - придают большую релевантность документу.
7. Выделение ключевых слов
Есть мнения, что выделения ключевых слов в абзацах придают ему больший вес, в случае, если эти слова встречались в заголовке к этому абзацу. Также стоит сказать, что присутствие ключевого слова во многих значимых тегах придает ему ещё больший вес.
8. Множественное выделение одного ключевого слова
Не стоит выделять в кучу разных тегов ключевые слова, поскольку это может помешать Яндексу правильно определить значимость этих слов на странице. Например, слова - может быть воспринято как поисковый спам.
На этом я закончу перечисление факторов ранжирования в Яндексе, которые зависят от тегов html. Идем дальше.
2. Работа хостинга
3. Количество редиректов по пути к странице
Может быть, что одна страница через редирект ведет на другую, а потом ещё на другую и т.д. Например, 301->301->302->301. Естественно, что такая картина не желательна.
2.2. Обработка 404 ошибки
Напомню, что 404 ошибка означает то, что документ не найден. Дело в том, что многие сайты неверно обрабатывают эту ошибку. Например, вместо ошибки может быть загружена главная страница сайта - что будет грубой ошибкой. См.: как правильно обработать 404 ошибку .
2.3. Скорость загрузки страниц
Более подробно про скорость загрузки страниц сайта читайте в статьях:
2.4. Стабильность работы хостинга
Когда сайт недоступен каждый день хотя бы по 3-10 минут, то советую сменить такого хостера. Дело в том, что если поисковый робот будет как раз делать обход в это время и увидит, что сайт недоступен, то это может плохо повлиять на позиции сайта в дальнейшем.
3. URL сайта
Сюда можно отнести несколько факторов:
1. Вхождение ключевого слова в название домена
Считается, что сайту гораздо легче попасть в топ по ключевому слову, если оно присутствует в названии домена. Например, если сайт про "ДСП", то будет очень хорошо, если в домене есть сочетание "dsp". Яндекс умеет воспринимать транслит на английском языке, поэтому старайтесь придумывать короткие домены содержащие ключевые слова или хотя бы слово (см. какой домен выбрать для сайта).
2. Длина домена
Есть мнение, что если домен слишком длинный, то это может быть плохо воспринято поисковой машиной.
3. Дата регистрации домена
Есть мнение, что возраст домена влияет на позиции, но важнее всего возраст контента.
4. Доменная зона
Есть мнение, что доменная зона влияет на позиции сайта в общем. Желательно, чтобы если сайт русский, то доменная зона была "ru" или "рф" ("com" также подойдет), если сайт украинский, то "ua" и т.д. (см. как зарегистрировать домен).
5. Добавление нового контента
Считается, что чем чаще добавляются новые материалы на сайт, тем лучше всему сайту в целом. При этом ценится постепенное добавление контента. Например, за один день выкладывается одна статья и т.п.
6. Обновление контента
Считается, что если контент со временем обновляется, то это хороший признак, поскольку значит сайт не заброшен, а его создатели пытаются сделать его лучше.
7. Видимость контента
Поскольку контент пишется для пользователя, то он должен быть хорошо читаем. Если текст плохо виден или же вообще не виден, то со временем сайт попадет под какие-нибудь санкции.
8. Клоакинг
Некоторые хитрые вебмастеры выводят поисковой машине один контент, а пользователю другой. Поисковые машины научились с этим бороться, поэтому никому не советую обманывать Яндекс, т.к. итог будет печальным. Более подробно про клоакинг читайте .
9. Копии статей на других сайтах
Есть мнения, что если статья с Вашего сайта разошлась по многим другим сайтам, то эта статья имеет большой авторитет, а значит Ваш сайт может получить определенные бонусы со стороны Яндекса за то, что именно Вы первоисточник такой важной статьи. Это правило работает даже если сайты не ссылаются на первоисточник.
10. Объем контента
Считается хорошим признаком, когда каждая статья на сайте имеет разный объем. Например, одна статья 1000 символов, другая 1500, третья 2500 и т.д. Если все статьи одного размера, то это создает подозрение на их не естественность.
И меня) подготовил ряд статей про алгоритмы поисковых систем. Постараемся подавать информацию максимально доступным языком, чтобы приблизиться к пониманию того, как работают поисковые системы.
Данная статья — адаптация статьи Яндекса . Все комментарии, которые приведены ниже, касаются только этой конкретной публикации, а не поисковой системы в целом. Многое, что характерно для реальных поисковиков, в комментариях может быть не учтено.
Список показателей которые учитываются формулой описанной в статье:
- частота использования ключевых слов в других документах;
- частота использования ключевых слов внутри текущего документа;
- выделение ключевых слов тегами и их расстояние до начала документа;
- длина документа;
- число пар слов которые подряд идут в запросе в таком же виде встречаются в тексте;
- число ключевых слов из запроса которые вообще встречаются в тексте;
- встречается ли весь запрос в тексте.
Алгоритм ранжирования проводит лемматизацию слов документа и запроса, поэтому не имеет значения в какой форме будет использоваться слово или его синонимы (разные формы будут считаться за одну и туже лемму). Для запроса была использована строка: «купить ноутбук с доставкой одесса» (здесь и далее кавычки для того чтоб отделить слова от текста, при запросе их не было). Рассмотрим как будет работать формула для нашего примера и какие параметры будут у первых 4-х сайтов из выдачи Yandex.
Расчет релевантности документа к запросу производится по формуле:
- Wsingle — вклад отдельных слов из запроса;
- Wpair — вклад пар слов;
- Wallwords — вклад вхождения всех слов из запроса;
- Wphrase — вклад вхождения всего запроса;
- Whalfphrase — вклад вхождения части запроса.
В оригинальной статье использовалось еще дополнительное слагаемое Wprf — за похожесть документа на документы из вершины выдачи, но мы его пока не будем учитывать. В наших расчетах коэффициенты k1, k2, k3 — нам также не известны поэтому предположим, что они равны 1.
1. Учет отдельных слов:
TF — частота вхождения слова в документ (= число_вхождений_слова / длину_документа). Значения частот для слов из запроса, для каждого из мест в топ выдаче:
- 1 место — "купить" 13, "ноутбук" 93, "с" 28, "доставкой" 7, "одесса" 11 раз
- 2 место — "купить" 22, "ноутбук" 50, "с" 2, "доставкой" 2, "одесса" 2 раза
- 3 место — "купить" 42, "ноутбук" 12, "с" 7, "доставкой" 10, "одесса" 9 раз
- 4 место — "купить" 2, "ноутбук" 92, "с" 83, "доставкой" 7, "одесса" 5 раз
DocLength — длина документа в словах;
- 1 место — 2589 слов
- 2 место — 1385
- 3 место — 1325
- 4 место — 3425
Hdr — сумма весов слова за форматирование. Согласно авторам статьи:
Учитывается наличие слова в первом предложении, во втором предложении, внутри выделяющих html тегов.
D — число документов в коллекции. Для получения конкретного значения можно воспользоваться поиском фразы "lang:ru" с помощью yandex.ru. Полученное при этом количество документов и будем считать за число документов в коллекции. В нашем случае в выдачу попало 2379 млн. документов.
CF — число вхождений слова в коллекцию документов (число документов, в которых слово встретилось хотя-бы раз). Конкретные числа для слов из нашего запроса получились следующими:
- "купить" 651 млн. документов
- "ноутбук" 35 млн.
- "с" 2344 млн.
- "доставкой" 163 млн.
- "одесса" 68 млн.
Wsingle мы рассчитывали для каждого слова и в Score добавляли их сумму.
2. Учет пар слов:
p1, p2 — рассчитываются так-же как и для Wsingle; TF — количество вхождений пары слов, с учетом весов. Пара учитывается, когда слова запроса встречаются в тексте подряд (+1), через слово (+0.5) или в обратном порядке (+0.5). Плюс еще специальный случай, когда слова, идущие в запросе через одно, в тексте встречаются подряд (+0.1).
- 1 место — "купить ноутбук" 6 раз, "ноутбук c доставкой" 1, "доставкой одесса" 2 раза
- 2 место — "купить ноутбук" 1
- 3 место — "купить ноутбук" 1
- 4 место — ни одна пара не встретилась ни разу.
Остальные пары в документах не встречались.
3. Учет всех слов:
Nmiss — число слов которые не встретились в документе. Для рассматриваемых сайтов это число оказалось одинаковым.
4. Учет запроса целиком:
TF — число вхождений запроса целиком, деленное на длину документа. Для топа значение получилось 0 для всех сайтов.
5. Учет части запроса:
Это слагаемое учитывалось когда сумма idf слов запроса в предложении (в формуле — сумма логарифмов) больше половины суммы idf всех слов запроса. TF здесь - количество учитываемых предложений в тексте деленное на число предложений в документе. Для нашей 4-ки это опять получился 0, т.к. там таких предложений не оказалось. Для сравнения предположим что мы создали документ и хотим рассчитать его релевантность для запроса. Пусть числовые значения для него будут иметь вид:
- слов в документе 400
- "купить" 3, "ноутбук" 10, "с" 1, "доставкой" 3, "одесса" 2
- "купить ноутбук" 1, "ноутбук c доставкой" 1, "доставкой одесса" 1 раз.
Остальные значения пусть будут такими же как и топовой четверки. Окончательные числа соберем в таблицу и посмотрим, что получилось. Таблица полученных значений для нашего примера:
И так можно видеть, что показатель релевантности у созданной странички оказался даже лучше чем у первого места. Это можно объяснить следующими факторами:
- относительно (первой 4-ки документов) небольшим размера документа;
- наличия пар ключевых слов идущих подряд (даже небольшого количества)
«Алгоритм текстового ранжирования Яндекса на РОМИП-2006» — статья, написанная работниками Яндекса. Среди авторов сам Илья Сегалович. Описанный алгоритм — экспериментальная поисковая система, созданная для улучшения основного поиска.
Стоит ли тратить на нее время? Ведь с момента публикации прошло более 10 лет: огромный срок для SEO. Стоит!
Дело не только в том, что нам ценна любая информация из первых рук — от представителей поисковой системы. И не в том, что ей можно доверять, как серьезной научной публикации.
Что можно узнать из этого исследования
Следите за руками:
- Создатели Яндекса конструируют поиск с нуля.
- В работе используется особая коллекция веб-страниц.
- Одна из характеристик этой выборки текстов — отсутствие поисковой оптимизации (см. пункт 4.3).
То есть. В статье описана не просто еще одна формула ранжирования. В ней также изложены характеристики естественных текстов, которые при этом являются релевантными поисковым запросам.
Алгоритмы ранжирования за 10 лет сильно поменялись и усложнились. Зато подходы к написанию текстов куда стабильнее. Качественная статья десятилетней давности мало отличается от современной в плане содержания. Понятно, что сайты стали сложнее и функциональнее, прибавилось мультимедиа, но основа неизменна. Поэтому многие факторы, работавшие в тогда, могут работать и сейчас — в «настоящем» поиске.
Факторы, определяющие текстовую релевантность
Скриншот формулы и пояснения к ней:
Как видим, формула не такая уж большая и сложная. Всего 5 слагаемых дают оценку текстовой релевантности, которая позволяет неплохо ранжировать документы.
Это еще больше подтверждает высказанную выше мысль о том, что в алгоритме описаны базовые, универсальные принципы текстовой релевантности.
А вот насчет последнего слагаемого — PRF сказать то же самое нельзя. Это мера похожести страницы на документы, которые считаются релевантными. «Похожесть» может рассчитываться по самым разным алгоритмам и не завязана на текстовое содержание. Наверняка с внедрением Matrixnet подходы к оценке сходства сильно поменялась. Поэтому раздел «2.4 Pseudo-relevance feedback» стоит смотреть лишь для понимания общей логики работы поисковой системы.
Перейдем непосредственно к факторам.
Встречаемость слов в документе
Всем известный и самый очевидный фактор ранжирования. В экспериментальной формуле применяется модификация алгоритма BM25.
Интересно, что:
При подсчете количества вхождений слова в документ мы проводим предварительную лемматизацию слов запроса и слов документа. Результат поиска без лемматизации существенно уступает варианту с лемматизацией.
Лемматизация — это приведение слов к начальной форме («пластиковые» -> «пластиковый», «окна»->»окно»). То есть спамить сверхточными вхождениями было не слишком осмысленным занятием уже в 2006 году . С позиции этого фактора разные словоформы дают одинаковый вклад в релевантность (и выглядят на странице куда естественнее и привлекательнее).
Еще цитата:
Помимо учета количества слов в документе можно учитывать html-форматирование и позицию слова в документе. Мы учитываем это в виде отдельного слагаемого. Учитывается наличие слова в первом предложении, во втором предложении, внутри выделяющих html тегов.
Учет пар слов
Пара учитывается, когда слова запроса встречаются в тексте подряд (+1), через слово (+0.5) или в обратном порядке (+0.5). Плюс еще специальный случай, когда слова, идущие в запросе через одно, в тексте встречаются подряд (+0.1).
Учет встречаемости трех и более слов запроса в документе улучшений в наших экспериментах не дал.
Из этого не следует, что для хорошего ранжирования всегда достаточно вхождения лишь пары слов из запроса. Очевидно, речь идет именно о Wpair слагаемом формулы. Вхождение остальных слов оценивается в следующем слагаемом.
Учет всех слов запроса в документе, учет фраз
Важным фактором помимо перечисленных является наличие в документе всех слов запроса. За наличие всех слов запроса мы добавляем дополнительный «бонус» , пропорциональный сумме idf слов запроса.
Проще говоря, наличие всех слов из поисковой фразы дает бонус к ранжированию, причем за вхождение более редких слов этот бонус выше. Вхождение часто употребляемых на разных страницах слов также даст бонус, но небольшой.
На практике бывает сложно добиться вхождения всех слов всего спектра поисковых запросов в документ. Просто потому, что мы и сами не знаем, по каким ключам можем привлечь трафик, как бы тщательно ни составляли семантическое ядро. Длинный хвост ключевиков настолько длинный, что его не охватить невооруженным глазом. А ведь поисковый спрос еще и меняется со временем, появляются новые пользовательские интересы.
Помимо наличия слов запроса в документе мы можем учесть наличие в документе текста запроса целиком. Плюс к этому еще небольшой «бонус» дается за наличие в тексте предложений, содержащих значительное количество слов запроса.
Насчет точного вхождения все очевидно, комментировать нечего. А вот второе предложение напоминает нам о том, что просто вхождения всех слов мало. Они должны быть логически связаны и располагаться в одном предложении.
Как все это использовать?
Итак, факторами текстовой релевантности можно считать:
- Частота вхождения леммы в документ.
- Вхождение в первое и второе предложения.
- Вхождение в выделяющие html-теги.
- Вхождение пар слов из запроса.
- Наличие всех слов запроса в тексте (более редкие слова дают больший бонус).
- Наличие точного вхождения фразы для многословных запросов.
- Наличие пассажей (предложений), содержащих значительное количество слов запроса.
Как уже отмечал выше, это основы текстового ранжирования, характеристики естественных релевантных документов. Поэтому, размещая текст на сайте, стоит убедиться, что вы «отработали» каждый из пунктов короткого списка (по-минимуму, без фанатизма). Это отправная точка. Только если начальной оптимизации окажется недостаточно, стоит браться за текстовые анализаторы, ручной анализ ТОПа, LSI и прочую магию.
Работаем строго по закону Парето: простые действия, дающие 80% результата — в первую очередь!
Фото пресс-службы Яндекса
На протяжении двух месяцев эксперты SEO-компаний раскрывали секреты ранжирования поисковой системы Яндекс в рубрике сайт « ». Теперь и сам Яндекс дал свой ответ на серию публикаций экспертов. Руководитель поисковых сервисов интернет-компании Александр Садовский в интервью сайт рассказал, что поисковик учитывает при ранжировании, почему нельзя обмануть Яндекс и нужно ли SEO в наши дни.
Каковы главные критерии оценки качества сайта в выдаче поисковой системы? Для каждого типа бизнеса Яндекс применяет разные настройки алгоритмов ранжирования, или они универсальны?
Главный критерий один — насколько этот сайт помогает решить задачу пользователя. Если вам интересно что-то более конкретное, скажем, какое слово и как часто использовать в тексте, чтобы попасть на первые позиции результатов поиска — такого «главного критерия» нет. Качество сайта во многом субъективно и связано с оценкой того, кто его потребляет — пользователем.
Вся сложность поисковых алгоритмов в том, что мнений много и все они разные. За одинаковыми формулировками запроса могут стоять разные задачи. Например, по запросу [легенда №17] одного пользователя интересует расписание кинотеатров, другого — отзывы о фильме. Поиск Яндекса умеет понимать и отвечать на такое разнообразие интересов с помощью технологий «Спектр» и интентного поиска . Поэтому даже в рамках одного запроса критерии оценки качества сайта могут отличаться в зависимости от того, на какой интент он отвечает.
Для каждой из многих миллиардов страниц мы рассчитываем около 800 факторов ранжирования, описывающих какое-то свойство страницы или сайта. Опираясь на закономерности поведения пользователей, асессоры размечают примеры качественных и некачественных ответов на некоторые запросы из пользователей. Машинное обучение «смотрит» на этот образец и «понимает», какие из факторов ранжирования помогут предсказать качественный ответ по всем миллиардам запросов, не попадающим в образец. И именно таким факторам придаёт больший вес в формуле ранжирования.
А если вспомнить, что интересы пользователей всё время изменяются, меняются и сами сайты, становится ясно, что при каждом обучении формулы вес факторов будет меняться. Сегодня более весомы одни, а завтра — другие.
Конечно, можно выделить понятные на интуитивном уровне признаки, которые коррелируют с решением задачи пользователя — авторитетность и популярность сайта у пользователей, отсутствие спама, наличие уникальной информации, интересной пользователям, полнота освещения какой-либо темы и так далее — в том или ином виде все эти признаки описаны факторами ранжирования.
- Между экспертами в нашей рубрике развязался спор о необходимости SEO-копирайтинга: одни говорят, что без него не обойтись, другие считают, что он в прошлом. Действительно ли SEO-копирайтинг больше не работает на улучшение места в поисковой выдаче? И как Яндекс определяет «заспамленность» текста сайта?
Когда вы сами смотрите на «заспамленный» текст, как вы понимаете, что он не естественный? Вы же видите разницу? Значит, можете как-то её «объяснить» программе? Ответив на эти вопросы — к слову, мы их иногда задаем на собеседованиях в Яндекс — вы поймете общий подход к детектированию таких текстов. В реализации есть много тонкостей, но это уже другая история.
Что касается SEO-копирайтинга и его эффективности — ответы могут быть разными, в зависимости от того, что понимать под этим термином. Если написание текста языком, понятным пользователю и замена узкопрофессиональных терминов словами, которые обычно используются в поисковых запросах, то это работает и будет работать. Мало кто станет вводить «оториноларинголог» вместо простого «лор». Человек не для того карабкался на вершину эволюции, чтобы лишние буковки одним пальцем набивать. А если «копирайтингом» эксперты называют попытки нашпиговать текст одним и тем же словом, то это тупиковый путь.
Такая тенденция, действительно, есть. И она «нарастает» уже несколько лет. Чем больше манипулируют ссылками во вред пользователям, тем ниже их вес.
Влияет ли полнота (указание адреса, телефона, ссылок на соцсети и разделы сайта) и привлекательность сниппета на место сайта в поисковой выдаче? Насколько вырастет значимость сниппета в продвижении с полноценным запуском «Островов»?
Сниппет — это сниппет, а место — это место. На сегодня ранжирование учитывает только способность сайта решить поисковую задачу пользователя, а не красоту его сниппета. Хотя это связанные вещи и рано или поздно система усложнится. Качественный «островной» сниппет помогает быстрее решать задачи, не переходя на сайт, а значит, при прочих равных обстоятельствах, могут быть причины показать его выше.
С другой стороны, уже сейчас более качественный структурированный сниппет при прочих равных (позиции сайта, сила бренда) привлекает больше посетителей, и среди этих посетителей больше неслучайных, хорошо представляющих себе, зачем они переходят на сайт.
Значительная часть «5 секретов» была посвящена контенту и юзабили сайта. Эксперты давали различные советы по улучшению этих параметров. Например, по тому, что нужно делать ставку на аудиовизуал, а не тексты. По мнению экспертов, сайтам нужны видео, различные онлайн-сервисы наподобие калькуляторов и «игрушек», использование форматирования - аналог текстовой верстки в печатных изданиях. Все это только привлекает пользователя или все-таки влияет на ранжирование?
Всё, что помогает пользователю в решении задачи, обозначенной запросом, должно влиять на ранжирование. Если окажется, что какая-то функциональность сайта, помогающая пользователю, всё ещё не помогает в ранжировании сайту, мы будем считать это своей проблемой.
Почему нельзя обмануть Яндекс? Эксперты рубрики отмечали, что все запросы должны соответствовать действительности: если сайт продвигается по ключевой фразе «Калькулятор КАСКО», значит, на сайте этот инструмент должен быть представлен.
А зачем обманывать Яндекс? Ведь можно же просто честно работать и приносить пользу людям. Или это уже не вариант?
Что касается продвижения по запросам нерелевантных сайтов, то надо понимать, что вы обманываете не столько Яндекс, сколько пользователей, ведь алгоритмы ранжирования подстраиваются под их желания и задачи.
Пользователи наблюдательны и умны — они видят плохой сайт в выдаче, распознают его по сниппету, и игнорируют. И каков результат? Обманщик не получит трафика, а некачественный сайт не задержится долго в выдаче поиска.
Мы пишем другие формулы, которые ранжируют. Они работают и результат, надеемся, нравится пользователям. Мы не эксперты в формулах продвижения.
В вопросе кроется какое-то очень механистическое понимание поиска. Примерно такое же, как у героя фильма про Электроника, который все время задавался вопросом: «Где же у него кнопка?». Поисковое ранжирование сейчас настолько сложная и гибкая система, что гораздо продуктивней её воспринимать с позиции интересов пользователя, а не искать кнопку.
Переход из соцсетей может говорить об интересе к сайту, а может и не говорить — всё зависит от того, каким описанием снабжена ссылка, насколько знакомо пользователям доменное имя. Однозначного ответа на такой вопрос нет.
- Насколько наличие и частота технических ошибок на сайте понижают его при ранжировании?
Яндекс не понижает сайт в выдаче из-за того, что тот содержит технические ошибки. Они могут приводить к невозможности индексации, к побочным эффектам, которые в конечном счете сказываются на ранжировании, но сам алгоритм никого не «наказывает».
Наши эксперты рассказывали о соответствии запросов развитости сайта. Если сайт неразвит, то следует использовать низкочастотные запросы и наоборот, так как они быстрее начнут приносить отдачу. Действительно ли такая политика обеспечивает более эффективное продвижение?
Я не знаю, что такое «развитость сайта». Но по каждому запросу можно предположить, а иногда и точно сказать, какая потребность пользователя за ним стоит. Если сайт может её качественно и полностью удовлетворить — то, что он находится, интересно всем — и пользователям, и вебмастеру, и, как следствие, поисковой системе. Если сайт бессилен ответить на какой-то запрос пользователя, мы не рекомендуем его продвигать по данному запросу.
Как был придуман персонаж Платон Щукин, от имени которого ведут переписку сотрудники технической поддержки Яндекса?
Это давняя история. В начале был придуман Аркадий Волож, от имени которого руководят компанией… :).
После Платона не могу не задать философский вопрос. Яндексу выгодно развивать контекстную рекламу, а не настраивать бизнес на SEO, так как компания имеет свою рекламную сеть. SEO-компании, напротив, призывают к тому, что контекст не заменит SEO. Как на рынке сосуществуют эти две позиции?
Яндексу выгодно то, что выгодно его пользователям. Нужна ли пользователям «настройка на SEO»? Вряд ли это их цель, им нужно просто решать свои задачи.
В тех случаях, когда есть задача что-то купить, контекстная реклама — отличный релевантный ответ, и там, где это уместно, мы ее показываем. Но она именно дополняет, а не заменяет естественные результаты поиска. Качественные сайты, решающие задачу, должны находиться, независимо от того, заплатили ли веб-мастеры за рекламу или нет, независимо от того, знают они слово «SEO» или нет.
Именно благодаря естественным результатам пользователи возвращаются в Яндекс снова и снова, и наша цель — помогать им решать задачи быстро и удобно.