Google всегда врала? Утечка внутренних документов компании показывает,

как на самом деле работает поисковая система

Компания Google попала в центр очередного скандала благодаря тому, что кто-то из ее сотрудников случайно опубликовал внутренние документы на GitHub. И информация там вполне может навредить репутации компании.

Документ под названием Google API Content Warehouse содержит 2500 страниц, на которых объясняется, какие факторы и компоненты влияют на результаты поисковой выдачи систему Google. Фактически это чит-код для ранжирования в Google.

Специалисты в сфере SEO заявляют, что некоторые утверждения Google относительно работы ее поисковика противоречат тому, что указано в документе. К примеру, упоминается, что данные из Chrome используются для анализа и ранжирования веб-страниц, при том, что ранее компания множество раз отрицала связь между данными браузера и системой ранжирования.

А еще фактором, влияющим на ранжирование, судя по документу, является показатель EEAT, и это Google тоже всегда отрицала.

Также у Google периодически появляются белые списки сайтов, имеющих более высокий рейтинг при выдаче. Такая система используется во время выборов в США или, к примеру, использовалась во время начала пандемии COVID-19.

Некоторые факты из слитых документов:
• Google официально не признает, что использует данные Chrome для ранжирования страниц. Однако информация, представленная в слитых документах, опровергает это. Chrome упоминается в разделах о том, как веб-сайты отображаются в Поиске. Например, некоторые ссылки могут быть предложены на основе данных об активности пользователя в браузере.
• Google отслеживает информацию об авторах контента, причем не только в чувствительных тематиках, но также в новостных и научных материалах. Ранее представители поисковика настаивали на том, что данные об авторе на страницах – это то, что владельцы сайтов должны делать для читателей, а не для Google, поскольку это не влияет на ранжирование.
• Авторитетность домена играет роль при ранжировании. «Молодые» сайты попадают в «песочницу» – поисковик целенаправленно не пускает их на высокие места в выдаче «для изолирования свежего спама». Ранее Google заявлял, что «песочницы» не существует.
• Поисковик неоднократно заявлял, что не учитывает поведенческие факторы. Сведения, представленные в слитых документах, говорят об обратном. Google использует данные о кликах по ссылкам в выдаче, сегментирует их по странам и устройствам. Поисковик анализирует клики и взаимодействие с сайтами в поиске во время и после введения основного запроса.
• Ссылки все еще остаются важными при ранжировании. Например, хорошим «весом» обладают ссылки, полученные со страниц, которые занимают высокие места в выдаче, а также с новостных ресурсов. Качество и релевантность ссылок важнее их количества.
• Ключевые слова в заголовках и title важны. Google смотрит, насколько заголовки соответствуют запросам пользователей. Также для поисковика важна «свежесть» – дата, когда был опубликован контент.
Google подтвердила утечку документации по поисковому алгоритму

Источник (англ)

Ознакомиться со слитыми данными на английском языке можно по ссылке.

Компьютерный доктор

Google всегда врала? Утечка внутренних документов компании показывает,

как на самом деле работает поисковая система

Комментарии