Обучение в IMBA

Мы собрали для тебя подробный список терминов, методик и инструментов, которые встречаются в учебных программах.

Яндекс YATI

В 2020 году «Яндекс» придумал и презентовал осенью на своей конференции "YaC" еще один трансформер с улучшениями. Сокращенно его называют YATI от английского Yet Another Transformer with Improvements. «Яндекс» говорит, что за последние 10 лет – это самое мощное изменение поискового алгоритма. Давай разберемся, что в нем такого особенного, и как он влияет на результаты ранжирования в поиске.

На фото справа Екатерина Серажим, она отвечает за качество ранжирования в поисковой выдаче Яндекса.

Что нового в алгоритме YATI

Предыдущими алгоритмами были «Палех» и «Королев». Они тоже анализировали сайты по текстам и ключевым запросам, как и YATI. Чтобы понять, чем они отличаются, следует разобрать принцип их работы. Не будем рассказывать о них слишком подробно, так как это отдельная тема. Но вкратце их затронем.

Как работал «Палех»

«Яндекс.Алгоритм» собирал статистику, по которой определял положительные и отрицательные примеры. «Палех» сравнивал вводимый пользователем запрос с заголовком, используя эту статистику.

Для алгоритмов текст выглядит совершенно не так, как для пользователей, поэтому они переводят его в цифровой формат.

Здесь используется система координат. Все страницы представляют два числа. Каждое из них относится к какой-то координате, а сами страницы обозначают точку на координатной плоскости. Это позволяет не просто искать точную фразу, которую ввел пользователь, а понимать ее смысл. При этом алгоритм самообучается, чтобы предлагать наиболее подходящие результаты.

Когда пользователь пишет запрос, система переводит его в цифровой формат и вставляет в координатную плоскость. Чем больше чисел совпадают, тем лучше страница подходит под запрос.

Такой способ позволяет показывать в выдаче даже те страницы, в которых нет ни одного слова, записанного в запросе. Главное, чтобы они подходили по смыслу. Например, если набрать в поиске «фильм, в котором Брэд Питт сыграл цыгана», выдача сразу покажет «Большой куш».

Несмотря на всю эффективность, такой алгоритм был очень «тяжелым». Поэтому его применяли только в самом конце ранжирования. Например, сначала через систему проходили миллионы сайтов, а потом «Палех» сортировал оставшиеся 100–200 штук.

Как работал «Королев»

Этот алгоритм стал более продвинутым. Он действовал по такому же принципу, что и «Палех», только для облегчения использовались семантические векторы в офлайне. А значит, и вычислять можно было гораздо больше страниц. Здесь тоже запрос проходил через несколько этапов, на каждом из которых алгоритм отбирал лучших. Только вместе с определением смысла одновременно проходила индексация страницы.
Процесс работы можно представить так:

  • сначала страницу переводят в вектор и сохраняют в базу;

  • введенный запрос тоже переводится в вектор;

  • происходит сравнение запроса и уже готовых страниц;

  • выводят наиболее подходящий результат.

Главное отличие «Королева» – в том, что он вычисляет данные в офлайн-режиме. Это позволяет одновременно обрабатывать огромное количество страниц, да еще и очень быстро. Основное направление здесь – низкочастотные запросы со сложной структурой. Ведь, по статистике, именно они составляют почти половину всех запросов, которые вводят пользователи.

Алгоритм сравнивал не только страницы, но и похожие запросы. Когда их смысл оказывался максимально похожим, поиск выдавал такие же результаты. Конечно, при условии, что на предыдущий запрос был получен положительный ответ.

Зачем потребовались нововведения

С помощью «Палеха» и «Королева» ранжирование в поисковых системах значительно улучшилось. Но все равно оно не принимало во внимание два важных момента:

  • не учитывался порядок слов;

  • смысл каждой страницы был связан только с одним вектором.

Новый алгоритм «Яндекса» работает не просто со страницей, а с каждым элементом текста отдельно.
Большую роль в обучении трансформера сыграли пользователи «Яндекс.Толоки», которые помогают ему на первых стадиях. Затем асессоры «Яндекса» добавляют экспертность. Сам трансформер работает по принципу повторов. Он сначала решает одну задачу, сохраняя все данные. Потом переходит к другой задаче, используя информацию с предыдущей.
Одним из самых значимых отличий работы алгоритма YATI можно считать предсказывание клика. Он определяет, какова вероятность того, что пользователь перейдет по ссылке. И это тоже влияет на результаты выдачи.

Как новый алгоритм повлияет на продвижение

«Яндекс» хочет показывать пользователям результаты, которые максимально соответствуют их запросам. Для этого он глубоко анализирует тексты. Получается, что для продвижения страницы необходимо создавать только полезный контент. Он должен полностью отвечать на запрос пользователя и соответствовать его ожиданиям. Чем полнее будет ответ, тем больше вероятности, что страница попадет на первые места поисковой выдачи.

Сейчас уже не нужно вставлять десяток кривых ключевых фраз, как это было в самом начале создания поисковых алгоритмов. Гораздо важнее стала экспертность и качество текста. Поэтому для продвижения следует создавать полезный и интересный контент.

Отличия YATI и BERT

Google тоже постоянно развивается, поэтому регулярно выпускает обновленные алгоритмы. Последней разработкой стала нейронная сеть, которая называется BERT. Она анализирует поисковые запросы и их контекст. Это позволяет предоставлять пользователям лучшие результаты в выдаче.

Задачи, которые ставят перед собой оба алгоритма, направлены на одно и то же. Они хотят более точно понимать смысл любого запроса, который вводят пользователи. Только BERT анализирует запросы, а YATI учится понимать смысл текста на страницах. Если добавить сюда предсказывание переходов, то обновление от «Яндекса» будет более весомым.

Как продвигать сайт с учетом алгоритма YATI

Его не зря называют еще одним трансформером. Ведь это не полная переделка алгоритма, а только дополнение.

Заголовки, метатеги и другие технические моменты продолжают работать. Нельзя забывать о предыдущих методах оптимизации, так как они не потеряли актуальности. Просто сейчас совместно с ними происходит и более глубокий анализ текстов. Заголовки очень важны, так как алгоритм по ним вычисляет вероятность перехода. Именно на них обращают внимание на первых этапах ранжирования, когда отсеивают большую часть сайтов. Заголовки должны быть информативными, чтобы система легче определяла смысл текста.

Улучшать поведенческие факторы и наращивать ссылочную массу сегодня так же важно, как и раньше. Чтобы сайт продолжал развиваться, следует работать над ним комплексно. Качество текстов играет огромную роль. Но это лишь один из факторов, влияющих на ранжирование.
Можно выделить несколько советов, которые помогут при работе с текстами:
  • создание грамотной структуры и добавление ключевых слов в заголовки;

  • составление метатегов для улучшенного сниппета;

  • разработка текстов с учетом LSI-копирайтинга;

  • сбор наиболее широкой семантики.

Заключение

Изменения в ранжировании сайтов уже наступили. Но пока YATI только начинает свое обучение. Если у тебя тексты не соответствуют стандартам нового алгоритма, то еще не поздно их изменить. Иначе велика вероятность, что твое место в выдаче займут более качественные сайты. Чтобы страница нравилась «Яндексу», нужно писать интересные и полезные тексты, которые полностью отвечают на запрос. Но и про техническую оптимизацию забывать не стоит. С каждым обновлением поисковик напоминает, что нужны сайты для людей, а не для роботов.
Синонимы:
Остались вопросы? Ответим!

Наш специалист перезвонит тебе, чтобы рассказать о деталях обучения и ответить на возникшие вопросы