В конце весны анонимный пользователь слил в сеть 2500 внутренних документов с важной информацией о работе алгоритмов поиска Google на март 2024 года. В документации хранится 2596 модулей с 14 014 атрибутами, которые связаны с инфраструктурой сканирования, компонентами YouTube, Books, Assistant, поиском видео, веб-документами, ссылками, системой внутреннего календаря и People API. 30 мая представитель Google Дэвис Томпсон подтвердил достоверность документов, но призвал не делать много выводов на основании «вырванной из контекста, устаревшей или неполной информации».
Рассказываем в статье о наиболее важных слитых сведениях и о том, как информация может быть полезна SEO-специалистам.
Факторы ранжирования Google из слитых документов
Возраст сайта, доменное имя и названия субдоменов
Актуальность и высокое качество контента
Что еще важного есть в документах
Факторы ранжирования Google из слитых документов
В документах содержится важная информация, которую использует Google для улучшения поисковой выдачи. Из утечки стало понятно, что поисковик лукавит, указывая факторы, способные повлиять на успешное ранжирование ресурса в выдаче, например полезный контент. Также Google часто отрицает ряд сигналов, которые в теории могут влиять на ранжирование. Но в документах они есть.
Выделили группы факторов, которые влияют на позиции сайта в выдаче Google.
Возраст сайта, доменное имя и названия субдоменов
Представители Google не раз заявляли, что «песочницы» для новых сайтов нет. Но, если верить документам, она все же существует. Google лучше ранжирует сайты с историей. В документе есть фактор HostAge. Google отсчитывает возраст домена с момента первого посещения роботом.
Также раньше в Google утверждали, что не важно, используются ли в структуре сайта подпапки или поддомены — варианты равнозначны. Это тоже оказалось не верно.
Что делать:
- обратить внимание на название доменов. Особенно важно владельцам сайтов с региональными поддоменами;
- при создании бизнеса сразу создать простой сайт, например на Tilda, и добавить его в Google. Время станет работать на владельца.
Пользоваться конструкторами сайтов и другими полезными для бизнеса инструментами можно бесплатно, если вести рекламу через click.ru. В маркетплейсе доступны CMS, сервисы для рассылок, создания чат-ботов и многого другого.
Сила бренда
Поисковик учитывает популярность бренда по количеству его упоминаний в интернете, и эти упоминания не обязательно должны быть опубликованы с ссылками на сайт.
Что делать:
- инвестировать в классический PR для повышения узнаваемости бренда;
- увеличивать при оптимизации количество брендовых запросов;
- стимулировать упоминание бренда и указание ссылок на него в авторитетных СМИ;
- поддерживать активность в социальных сетях, вести блоги на тематических площадках и создавать заинтересованные сообщества вокруг бренда;
- проводить уникальные исследования и устанавливать таким образом интеллектуальное лидерство бренда.
Поведенческие факторы
Считается, что Яндекс более требователен к поведенческим факторам, чем Google. Но утечка подтвердила, что поведение пользователей важно и для Google. Конечно, представители Google отмечали важность пользовательского опыта, релевантности контента. Но при этом отрицали наличие конкретных факторов ранжирования, например рейтинга кликов или показателя отказов.
- Данные о переходах, кликах и поведении посетителей Google берет не только из Google Analytics, но и из браузера Chrome. В слитых данных это понятно из модуля ChromeInTotal. Представители Google тоже неоднократно отрицали использование данных браузера при ранжировании.
- Данные передаются через систему NavBoost. Она оценивает число запросов пользователей по указанному ключевому слову, чтобы понять тенденцию поискового спроса, число кликов по результату поиска, CTR и условно поделить клики на «плохие» (badClicks), «долгие» (LastLongestClicks), «хорошие» (GoodClicks) и т. д.
- Еще один алгоритм Google — NevaBoost — защищает от клик-спама. Он делит пользователей на доверенных (с историей в Google Chrome) и недоверенных (без истории в браузере Google). Именно поэтому многие не могут накручивать поведенческие факторы.
- По прежнему важно содержимое тега title. У Google существует функция titlematchScore. Она оценивает, насколько полно заголовок отвечает запросу.
- Еще одно интересное открытие — Google может пользоваться при ранжировании сайтов данными из EWOK, который похож на Толоку от Яндекса. Это система оценки выдачи в поиске «живыми» людьми. То есть в ранжировании используются не только автоматические алгоритмы, но и мнения пользователей, которые определяют, какой именно сайт из выдачи лучше по заданному ими запросу.
Что делать:
- оптимизировать сайт для удобства пользователей — создать понятную структуру, продумать навигацию, внедрить перелинковку;
- добавить конверсионные элементы и блоки, которые удерживают внимание и продлевают время просмотра, — фото, видео, конструкторы, калькуляторы и прочее;
- делать максимально релевантные дескрипшн, тайтл, но немного разбавлять кликбейтом. Это может помочь выиграть клики у конкурентов;
- максимально улучшить первый и второй экраны, чтобы пользователь сразу понял, куда он попал, и получил информацию, которую искал.
Ссылочные факторы
На ранжирование сайта положительно влияет релевантный и разнообразный ссылочный профиль. Google анализирует количество трафика на странице, анкорный текст, куда ведет ссылка, отсутствие или наличие ссылочного спама. Интересный факт: для трастовых сайтов спамные анкоры считаются не спамными.
- PageRank, старый компонент алгоритма Google, — по-прежнему важный фактор. В особенности для главной страницы сайта. Кроме того, новые страницы временно получают PageRank домашней страницы, пока не заработают собственный показатель. Ссылки с наиболее известных сайтов сильнее влияют на PageRank.
- У Google существуют три ступени классификации ссылок: высокое, среднее, низкое качество. На то, к какой ступени относится ссылка, влияет количество кликов по ней. Простыми словами, если по ссылке кликают, она отправляет сигналы ранжирования, если нет — отмечается как низкокачественная. Ссылки низкого качества не вредят рейтингу сайта, Google их игнорирует.
- Google анализирует скорость прироста ссылок. Существует отдельный фактор — ссылочный взрыв. Если поставить множество ссылок сразу, можно получить штраф.
Что делать:
- сфокусироваться на ссылках с авторитетных ресурсов. Две ссылки с авторитетных сайтов будут работать лучше, чем 10—15 ссылок с сайтов без трафика. Главная метрика оценки донора — его трафик и число ссылок на главную. Также хорошо работают анкорные ссылки со СМИ;
- ссылаться на качественный контент.
Актуальность и высокое качество контента
- На ранжирование влияют E-E-A-T-факторы. Но непонятно, как именно влияет каждый элемент. Достоверно известно только то, что Google сохраняет информацию об авторах материалов и оценивает их авторитетность.
- Для поисковика важно, есть ли в статье уникальная часть, личное мнение или же это просто рерайт статьи из топа.
- Google оценивает свежесть и актуальность информации: даты в URL-адресах, подписях,контенте на странице.
- Тексты из группы YMYL (Your Money Your Life) — финансов, медицины, новостей — ранжируются на основе уникальности контента. В документах указано, что у Google есть классификаторы, генерирующие отдельные оценки для YMYL News и YMYL Health.
- Google определяет темы и микроподтемы в статьях. А с помощью NLP понимает, покрывает ли контент все микроподтемы, соответствующие запросу.
- Существует отдельная метрика, которая оценивает среднее качество статей на сайте. Это означает, что одна некачественная статья на сайте способна потянуть на дно весь качественный контент.
Что делать:
- привлекать авторитетных авторов, особенно для контента YMYL. Google хорошо понимает, кто является автором статей на сайте, и пытается связать его с компанией и его публикациями в интернете на других сайтах;
- Корректно размечать данные на страницах авторов для передачи в Google;
- Обновлять контент каждые 3—6 месяцев, в зависимости от конкурентности ниши;
- использовать специфические сигналы ранжирования для отрасли. Например, новостным сайтам — регулярно размещать свежий контент, региональным сайтам — продвигаться в локальном поиске, агрегаторам для поиска путешествий — размещать информацию о ценах и бронировании, обзоры на туры;
- покрывать все микротемы внутри статьи;
- закрывать интент пользователя, то есть решать те задачи, за решениями которых он пришел, или статья будет считаться неполезной;
- публиковать уникальный контент, то есть раскрывать тему так, как ее еще никто не раскрывал.
Что еще важного есть в документах
1. В Google есть набор функций, который называется Twiddlers — это опции переранжирования, меняющие рейтинг документа в выдаче. Среди причин пессимизации могут быть такие:
- недовольство пользователей контентом страницы;
- невысокое качество обзора продукта;
- нерелевантность местоположения — Google выводит на первые места сайты, которые соответствуют геолокации пользователя.
2. В поиске Google существуют белые списки сайтов по «чувствительным» тематикам, например COVID, выборы в США. Есть мнение, что в топ по таким темам попадают сайты с данными из официальных источников. А есть и черные списки сайтов, которые никогда не попадут в топ. Например, связанные с распространением любых незаконных материалов.
3. Из документов видно, что Google может сохранять копии всех версий страниц, которые он когда-либо индексировал. Это значит, что поисковик способен запоминать каждое изменение, когда-либо внесенное на страницу. Но при анализе ссылок Google учитывает последние 20 изменений URL.
4. Для борьбы со спамом, связанным с автоматическими и ручными кликами, Google пользуется историей файлов cookie, данными входа в систему Chrome и обнаружением шаблонов в поведении пользователя.
Список всех сигналов можно найти по ссылке, а детальный анализ документации — в материалах Майка Кинга и Рэнда Фишкина. Важно понимать, что в документах не указан вес тех или иных факторов ранжирования — они только перечислены.
Совет пользователям: если вам не хочется, чтобы данные о вашем поведении на сайтах были отправлены в Google, не пользуйтесь браузером Chrome.