Западные журналисты из издательства CNBC, по приглашению корпорации Google, побывали на одной из внутренних встреч специалистов по изменению поисковых алгоритмов. Они окунулись в рабочий процесс и наблюдали за тем, как инженеры компании Google обсуждали с руководством внесение незначительных изменений в поисковую выдачу. Речь шла о показе небольших изображений в правой части сниппета.
В ходе данной встречи журналисты были весьма удивлены. Они узнали, что ответ на вопрос, как работает поиск Google, одновременно прост и сложен, очевиден и секретен. Им стало ясно, что любые изменения в алгоритмы вносятся только после тщательной проработки идеи и полноценной проверки со стороны асессоров.
Принципы работы поисковой системы Google
Некоторые пользователи, наблюдая за формированием результатов выдачи, в самом прямом смысле удивляются способности Google понимать неочевидные вещи. Алгоритмы каким-то образом интерпретируют слова запроса в намерение пользователя, предугадывая его вопрос. Одним из самых ярких примеров является запрос «фильм остров волейбол». В результатах выдачи Google по данному набору слов нередко в числе первых оказывается ссылка на фильм «Изгой» с Томом Хенксом в главной роли.
Алгоритмы Google способны «понять» запрос пользователя и выдают вероятный ответ.
Даже для многих людей данный ответ является далеким от очевидного. Тем не менее, алгоритмы Google каким-то образом находят связь между тремя словами и выдают ссылку, которая, вероятнее всего, действительно интересует пользователя.
На самом деле никакой мистики в этом нет. Поисковая система действительно не понимает смысл запроса. Но алгоритмы могут найти в своей «памяти» страницы, на которых отдельные слова встречаются с определенной частотой, где есть синонимы и слова, косвенно относящиеся к теме.
Роботы Google ежедневно посещают миллиарды страниц на миллионах сайтов, чтобы точно знать какое на них содержимое. Всю собранную информацию Google хранит в своем индексе. И не просто хранит, а постоянно проверяет и обновляет.
Любой запрос пользователя обрабатывает специально созданный алгоритм (программный код), который способен сравнить вопрос с данными, находящимися в хранилищах Google. Этот алгоритм буквально за секунду решает, что именно нужно показать пользователю в ответ на его запрос.
Одним из основных факторов ранжирования до сих пор является Google PageRank. Свое название данный показатель получил по имени сооснователя компании Ларри Пейджа. Данная метрика опирается на простую идею – если на определенную страницу ссылаются многие люди в интернете, значит, эта страница действительно полезна и несет значимую информацию. Страницы, на которые ссылаются чаще других, с большой долей вероятности являются релевантными.
Однако Google PageRank не единственный фактор ранжирования. Сейчас таких сигналов более 200 видов. Именно поэтому алгоритмы поисковой системы способны ответить на любой вопрос пользователя.
При этом полная формула ранжирования держится в строжайшей тайне, чтобы владельцы сайтов и оптимизаторы не смогли активно влиять на формирование выдачи.
Как в Google принимают решение об изменении алгоритма
Самое главное – любое изменение тщательно прорабатывается. Сначала появляется идея, как сделать поиск лучше. Затем ее реализуют в программный код и начинают тестировать.
Процесс разделен на две параллельные задачи:
- Измененную выдачу видит небольшое количество реальных пользователей. Они не знают, что в их случае алгоритм действует по-другому и ведут себя естественно. А инженеры Google изучают, насколько лучше показывает себя измененный алгоритм.
- Одновременно с этим по всему миру работают асессоры. Это удаленные сотрудники, которые должны оценить, лучше или хуже работает измененный алгоритм. У Google по всему миру более 10 000 асессоров. Они видят две версии органической выдачи (одна старая, вторая с измененным алгоритмом). Их задача отметить, в каком случае выдача больше соответствует запросу пользователя.
Чтобы понимать общий объем работы, нужно сказать – только в 2017 году в компании Google было проведено более 31,5 тысяч экспериментов по изменению выдачи. Далеко не все были признаны удачными. По факту инженеры внесли в алгоритм всего 2 453 изменения, то есть менее 10% идей воплотились в жизнь.
Примечательно, что даже самые серьезные изменения нередко ускользают от простых обывателей. Да, некоторые правки оказывают сильное влияние на отдельные интернет-ресурсы – одни теряют свои позиции, вторые резко взлетают в ТОП выдачи. Но простые пользователи всего этого не видят.
Встреча, на которую пригласили журналистов CNBC, была посвящена конкретному предложению. Команда разработчиков хотела внести изменения в мобильную выдачу. По мнению авторов идеи, если внутри сниппета будет появляться изображение с сайта, пользователю будет проще понять, что он найдет на конкретной странице.
По мнению разработчиков, небольшое изображение в сниппете поможет пользователю оценить релевантность страницы.
К моменту встречи, предложенное изменение уже было протестировано как асессорами, так и реальными пользователями. И теперь команда разработчиков Google отчитывалась о результатах начальству, которое представляли руководитель направления ранжирования Панду Найак и вице-президент Google Бен Гомес.
В отчете были представлены следующие данные по измененному алгоритму:
- как быстро, после взгляда на выдачу, пользователи делали полезное действие;
- какой процент людей прошел по ссылке, но быстро вернулся обратно в выдачу;
- какие виды запросов плохо сочетаются с новой формой отображения и т.д.
Под конец встречи группа разработчиков озвучила общий вывод: более 90% асессоров назвали изменения полезными и нужными; тестирование обыкновенных пользователей также показывает положительную реакцию.
В общей сложности на доклад и резолюцию руководства ушло порядка получаса. Оценив все данные, было принято решение реализовать нововведение. Эта встреча показала – даже минимальные изменения в выдаче тщательно прорабатываются.
Почему компания Google постоянно экспериментирует и меняет выдачу
Один из самых интересных вопросов – а зачем вообще вносить изменения в выдачу? Для чего проводить тысячи экспериментов и менять алгоритмы.
Сотрудники Google говорят, что их поиск не всегда идеален и его можно улучшить. Причем в своей работе они стараются понять, почему результат ошибочный. Ведь главная цель не просто исправить выдачу по определенному запросу. Основная работа заключается в том, чтобы поправить алгоритм, заставить его не ошибаться в будущем.
В настоящий момент внутри компании Google соперничают две идеи: одни сотрудники считают, что выдача должна быть полностью объективной, вторые настаивают на максимальной персонализации.
Прямо сейчас персонализация в поисковой системе Google находится на минимальном уровне. Алгоритмы учитывают только местоположение пользователя и его предыдущие запросы. Стоит заметить, что такой минимализм уже прошел ряд испытаний. Многочисленные эксперименты разных групп разработчиков доказали, что излишняя персонализация плохо сказывается на выдаче.
Кроме того, в компании Google учитывают опыт конкурентов. Например, в Twitter и Facebook персонализация находится на очень высоком уровне. Как следствие, пользователи получают только ту информацию, которая с большой долей вероятности им понравится. За это их критикуют – ведь такой подход приводит к искусственным ограничениям, когда пользователи замкнуты в своих микро-мирах.
В Google считают, что такая персонализация вредит – она может подорвать доверие пользователей. Именно поэтому любой желающий может самостоятельно настроить уровень собираемой информации о себе.
В конце встречи руководитель направления ранжирования Панду Найак сказал журналистам — в Google нет уверенности, что поисковая система идеальна. Но есть желание решить как можно больше проблем, сделать выдачу лучше для всех и каждого. И именно ради этого тысячи сотрудников компании работают каждый день.