FAQ: Все о новом алгоритме Google RankBrain

FAQ: Все о новом алгоритме Google RankBrain
Все о новом алгоритме Google RankBrain

Недавно Google начал использовать новую технологию машинного обучению, названную RankBrain, созданную для более качественной обработки уникальных запросов. Вот что мы знаем о ней на данный момент.

Вчера, 26 октября в сети появились новости о новом алгоритме ранжирования Google, основанном на базе искусственного интеллекта по имени «RankBrain». Мы собрали воедино информацию из 3-х источников, чтобы получить общую картину и понять, как работает «RankBrain».

Что такое RankBrain?

RankBrain – алгоритм Google, основанный на технологии машинного-обучения искусственного интеллекта, для более качественной обработки уникальных запросов.

Что такое машинное обучение?

Машинное обучение — обширный подраздел искусственного интеллекта, изучающий методы построения алгоритмов, способных обучаться. Различают два типа обучения. Обучение по прецедентам, или индуктивное обучение, основано на выявлении общих закономерностей по частным эмпирическим данным.

Что такое искусственный интеллект?

Искусственный интеллект — наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ; свойство интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека.

Итак, «RankBrain» теперь новая поисковая система Google?

Нет, RankBrain только часть всей поисковой системы Google, компьютерная программа, которая используется для сортировки миллиардов страниц и последующей выдачи релевантных результатов. Также хочется отметить что RankBrain – это не алгоритм ранжирования, а только инструмент обработки запросов.

Так как же называется алгоритм?

Hummingbird (Колибри). На протяжении многих лет алгоритм не имел названия, однако в середине 2013, Google перезапустил алгоритм и дал ему имя — Hummingbird (Колибри).

RankBrain часть алгоритма Hummingbird (Колибри)?

Google Hummingbird (Колибри)

Google Hummingbird (Колибри)

Нам кажется что да. Hummingbird (Колибри) является одним общим алгоритмом поиска, как автомобиль имеет один двигатель. Сам двигатель может состоять из разных частей, таких как  масляный фильтр, топливный насос, радиатор и т.д. Тоже самое и с Hummingbird – он состоит из большого количества частей, таких как RankBrain.

В частности, мы знаем, что RankBrain является частью общего алгоритма Hummingbird (Колибри), так как агентство Bloomberg в своей статье о новом алгоритме заявило, что RankBrain не обрабатывает все запросы. Только общие алгоритмы имеют такие права.

Hummingbird (Колибри) также включает в себя другие широкоизвестные в кругах оптимизаторов алгоритмы, такие как Panda, Penguin и Payday разработанные для борьбы со спамом, Pigeon для улучшения локальных результатов выдачи, Top Heavy разработан для понижения рейтинга нагруженных рекламой сайтов. Mobile Friendly разработан для повышения позиций сайтов оптимизированных под мобильные устройства. А также Pirate разработанный для борьбы с нарушением авторских прав.

Я думал главный алгоритм Google — “PageRank”.

PageRank, также является частью общего алгоритма Hummingbird (Колибри). Он определяет ценность страницы путем анализа качества ссылок с других страниц и сайтов.

PageRank особенный алгоритм, так как это первый алгоритм которому Google дала имя. Это было в далеком 1998 году.

Что насчет «сигналов», которые Google использует при ранжировании?

«Сигналы» – это характеристики вашего сайта, по которым Google оценивает его полезность. «Сигналами» для Google является по сути все, что есть на вашем сайта. Например, на вашей странице есть слова, а значит, слова и есть сигналом для поисковой системы. Если некоторые слова выделены полужирным шрифтом – это уже другие сигналы. Расчеты, используемые как часть алгоритма PageRank дают странице определенный PageRank (рейтинг), который и есть сигналом. Если страница оптимизирована под мобильные устройства это будет еще одним сигналом.

Все эти сигналы обрабатываются различными алгоритмами Hummingbird (Колибри), чтобы в конечном итоге выяснить какие сайты показывать в ответ на определенные запросы.

Сколько вообще этих сигналов?

Google имеет около 200 общих сигналов ранжирования, однако еще существует около 10000 вариаций или подсигналов.

Периодическая таблица SEO 2015

Периодическая таблица SEO 2015

RankBrain, третий по важности фактор ранжирования?

Это правда. Спонтанно, но Google утверждает, что этот фактор после запуска сразу попал в тройку наиболее приоритетных факторов ранжирования.

Тогда какой первый и второй?

Google не хочет говорить какие первые два важнейших сигнала. Мы спрашивали. Дважды.

Статья на Bloomberg не случайность, Google просто нужно немного PR о революционном прорыве нового алгоритма. Но чтобы реально оценить прорыв было бы полезно знать первые 2 фактора.

И кстати мы все еще считаем, что ссылки не растеряли свою власть и остаются очень важным сигналом для Google. Поисковая система просто подсчитывает их как голоса.

Что именно делает RankBrain?

После переписки с Google, мы можем предположить, что RankBrain используется для интерпретации запросов, которые пользователи используют при поиске. А именно для поиска страниц, которые могут не содержать точно таких же слов, которые пользователь вписал в запрос.

Что насчет графа знаний?

Граф знаний был анонсирован в 2012 году. Это было очень важное событие, так как теперь Google научился искать не строки, а вещи. Например, когда кто-нибудь ищет запрос «Обама», то Google интерпретирует это, как «Президент США Барак Обама».

Граф знаний представляет собой базу данных фактов о вещах в мире и отношениях между ними. Вот почему вы можете сделать запрос «, когда родилась жена Обамы» и получить ответ о Мишель Обаме не используя ее имя. Пример ниже с англ. google.com.

Граф знаний Google

Граф знаний Google

Как RankBrain помогает уточнять запросы?

Ежедневно Google обрабатывает три миллиарда поисковых запросов. При этом около 15% из них поисковая система видит впервые.

Среди них могут быть сложные многословные, низкочастотные запросы, так называемые «запросы с длинным хвостом». RankBrain призван помочь алгоритмам системы грамотно интерпретировать их, чтобы найти наиболее релевантные таким запросам страницы.

RankBrain призван помочь алгоритмам грамотно интерпретировать новые слова и распределять запросы по тематикам.

RankBrain может выявлять закономерности между, вроде бы, несвязанными между собой сложными запросами и понимать, схожи ли они друг с другом. Самообучение позволяет лучше понимать будущие сложные запросы. Это предоставляет поисковой системе возможность распределять запросы по тематикам.

И что самое важное, RankBrain способен связывать эти группы поисковых запросов с результатами выдачи, которые, по версии алгоритма, являются наиболее популярными среди пользователей.

Примеры работы RankBrain.

Агентство Bloomberg опубликовало в своей статье один пример работы нового алгоритма, где RankBrain предположительно имел влияние на выдачу.

Например (запрос на англ.):

What’s the title of the consumer at the highest level of a food chain

Дословный перевод: «Какое название потребителя высшего уровня пищевой цепочки»

Для обычного человека как я, «consumer» («потребитель») – звучит, как отсылка к человеку который что-то покупает. Однако, это также и научный термин, обозначающий, что-то или кого-то кто потребляет пищу. Есть также и уровни потребителей в пищевой цепочке. Наш потребитель находится на высшем уровне?

Ввод этого запроса в Google приводит к хорошему результату, несмотря на то, что сам запрос звучит довольно странно.

Пример работы алгоритма RankBrain

Пример работы алгоритма RankBrain

Теперь рассмотрим, насколько будет отличаться выдача для запроса «top level of the food chain» («высший уровень пищевой цепочки»)

Пример работы алгоритма RankBrain # 2

Пример работы алгоритма RankBrain # 2

Представьте себе, что RankBrain объединяет оригинальный длинный, сложный запрос и более простой, короткий, который вводится в строку поиска гораздо чаще. Google понимает, что они очень похожи. Как результат Google может использовать накопленные данные результатов поиска сложных запросов для улучшения выдачи по более простым и частотным запросам.

Хочу подчеркнуть, что мы не знает наверняка, соединяет ли RankBrain два этих запроса. Пока это лишь предположительная иллюстрация того, как RankBrain может объединять два типа поиска для улучшения выдачи.

Нужны еще примеры?

Google дал нам еще один свежий пример: «How many tablespoons in a cup?» («Сколько столовых ложек в чашке?»). Google говорит, что RankBrain считает более корректным выдавать разные результаты для США и Австралии, так как в каждой стране значения слов отличаются.

Мы попробовали сравнить эти запросы в google.com и google.com.au (Google Австралия). Однако не увидели большой разницы в результатах поиска. Даже без RankBrain результаты часто отличаются в пользу сайтов страны, в которой производится поиск.

Действительно ли RankBrain полезен?

Несмотря на 2 приведенных выше примера, которые не слишком убеждают нас в величии RankBrain, мы все же действительно верим, что алгоритм производит значительное влияние на ранжирование. Google довольно консервативная компания, которая тщательно тестирует все нововведения, поэтому можно быть 100% уверенным, что Google будет использовать алгоритм только если он будет действительно надежным и полезным.

Интеграция RankBrain и провозглашение его 3-м по важности фактором ранжирования, со стороны Google является очень большим шагом. Google не будет делать шаги и вкладывать ресурсы в то, во что сам не верит.

Когда RankBrain был (будет) запущен?

Google сообщил что развертывание системы происходило постепенно с начала 2015 года. Работа алгоритма имела влияние на реальную выдачу практически по всем странам.

Какие запросы обрабатываются алгоритмом RankBrain?

Google рассказал Bloomberg, что «очень большая доля» запросов уже обработана RankBrain. Мы попросили о более точной цифре, однако получили прежний ответ.

RankBrain, постоянно обучается?

Обучение Google происходит в офлайн режиме. Google рассказал нам, что система собирает историю запросов, изучает их и делает прогнозы.

Эти прогнозы тестируются и если они подтверждаются, последняя версия системы выкатывается и начинает работу в онлайн режиме. Цикл продолжается снова и снова.

RankBrain, делает еще что-нибудь кроме уточнения запросов?

Уточнение запроса не считается фактором ранжирования или сигналом. Сигналы, как правило, факторы которые привязаны к содержанию сайта, например, как слова на странице, ссылки, указывающие на страницу, является ли страница защищенной HTTPS и так далее. Они также могут быть привязаны к пользователю, например в зависимости от его местонахождения и истории просмотров.

Так почему же Google называет RankBrain третьим по значимости сигналом ранжирования. Сигнал это или нет? Сигнал! Google подтвердил нам, что есть компонент в котором RankBrain принимает некоторое непосредственное участие в ранжировании страниц.

Как именно? Есть некий RankBrain рейтинг, способный оценить качество страницы? Может быть. Но нам кажется, гораздо более вероятным, что каким-то образом RankBrain помогает Google лучше классифицировать страницы на основе их содержания. RankBrain способен лучше понимать о чем идет речь на странице, чем существующая система поиска Google.

Или нет… Google ничего не сказал, кроме компонента ранжирования на базе RankBrain.

Как я могу узнать больше о RankBrain?

Для тех, кто хочет узнать больше о понятии «вектор», Google рассказал в своем блоге (англ.). В статье описывается процесс математического соединения слов и фраз. В ней идет речь о системе (которая в статье не называется RankBrain) обученной соотносить страны и их столицы путем простого анализа новостных публикаций.

Новый алгоритм Google RankBrain

Новый алгоритм Google RankBrain

Это длинное исследование базирующиеся на этом. Вы даже можете работать с собственным проектом машинного обучения с использованием word2vec. В дополнение, Google имеет свой ресурс, посвященный искусственному интеллекту с документацией по теме машинного обучения, как и Microsoft, кстати.

Команда прогрессивно мыслящих интернет-маркетологов. Агенство продвижение с 4-х летним опытом работы в сфере продаж.