Поисковая система: что это такое, как она работает
Поисковая система (поисковик) — это специальная программа, которая автоматизирует поиск информации в интернете. Благодаря индексации этот процесс происходит очень быстро, а в результате ранжирования пользователь получает упорядоченный список ресурсов, на которых содержится необходимая информация.
Искать информацию в интернете без поисковых систем было бы крайне сложно. Просмотреть триллионы страниц, расположенных хаотично, без всякой закономерности и структуры невозможно без использования специальных алгоритмов. Для этого и нужны поисковики. Они выстраивают четкую иерархию в этой системе и делают интернет доступным и удобным.
Самыми популярными поисковыми системами в России, по данным Яндекс.радар, являются «Яндекс» (61,7%) и Google (37,0%), доля Mail.ru и Rambler вместе взятых не превышает 1%.
Если обратиться к мировой статистике, то здесь лидирует Google (84,8%), а «Яндекс» (1,06%) уходит на 6-е место.
Доля рынка наиболее часто используемых поисковых систем по всему миру по состоянию на сентябрь 2022 г. Источник
Принципы работы поисковых систем
Принципы работы любой поисковой системы примерно одинаковы и их условно можно разделить на несколько этапов.
Составление списка страниц
Для того чтобы поисковая система смогла найти нужную фразу в большом количестве сайтов, эти сайты должны быть ей известны, то есть прочитаны и сохранены в памяти.
Можно сравнить с библиотекой: если вы не знаете, какие книги стоят на полках и никогда не заглядывали в них, то вероятность того, что вы быстро сориентируетесь и найдете нужную цитату, равна нулю.
Поисковая система узнает о содержимом сайтов с помощью специального робота — краулера, или паука. Название происходит от английского crawler (ползающее насекомое, ползунок). Робот обходит все страницы, переходит по ссылкам и постепенно охватывает миллиарды веб-страниц в сети, сохраняет их и отправляет на индексацию.
Индексация
Следующий этап — добавление данных о странице в базу поисковой системы. Обычно поисковик собирает и хранит информацию о содержимом страниц: ключевых словах, которые там используются, а также размещенном контенте (статьях, документах, изображениях, аудиофайлах). Пока страница не проиндексирована, для поисковика она не существует.
По аналогии с библиотекой это работает так: недостаточно знать, в каких примерно книгах содержится похожая фраза. Важно найти релевантную страницу с текстом. Тогда вы сможете воспользоваться этой информацией.
Искать фразу или слова, перелистывая страницы книги или просматривая весь сайт, неудобно. Но если у вас есть предметный указатель, например такой, который используется в технической литературе, учебниках или инструкциях к приборам, вы сможете без труда найти любой термин.
В предметном указателе к инструкции все термины расставлены по алфавиту и обозначены страницы, на которых они встречаются
Тот же принцип лежит в основе поисковой индексации.
Индексный робот получает информацию о странице от краулера и упорядочивает ее. Удаляет ненужные элементы, выбирает слова и запоминает, где эти слова были обнаружены. Получается подробный список адресов страниц и размещенных на них слов.
Ранжирование и поисковая выдача
Поиск и ранжирование — наиболее приближенная к пользователям и значимая для них часть процесса. Если предыдущие этапы проходят в автоматическом режиме и фактически являются подготовительными, то на этом этапе появляется видимый результат — поисковая выдача, ради которой и создаются поисковые машины.
Когда человек вводит текст в поисковую строку, машина с помощью алгоритмов выбирает все страницы, имеющие отношение к запросу. Их очень много и в таком количестве они не нужны, поэтому необходимо их отсортировать, упорядочить и выбрать релевантные страницы. То есть самые правильные и имеющие отношение к делу.
Этот процесс называется ранжированием. Он проходит в несколько этапов, на каждом из которых фильтрация становится сложнее, а список ресурсов сужается.
Результаты поисковой выдачи различаются:
- в разных поисковиках, так как используются различные критерии фильтрации;
- в разных регионах, так как в запросах учитывается местонахождение пользователя;
- на разных устройствах — в десктопной и мобильной версии;
- по одинаковым запросам у разных пользователей, так как учитывается индивидуальная история поиска.
По запросу «Муми тролли» «Яндекс» и Google выдают разные результаты, на первой странице совпадает только один сайт из шести
На выходе получается привычный для нас список ресурсов. Чем выше место веб-ресурса в этом списке, тем более актуальную информацию он содержит. Такая структура удобна пользователям и полезна владельцам страниц. Первые получают самую необходимую информацию в порядке значимости, вторые используют поисковую выдачу для продвижения своего сайта.
Апдейт и границы индексирования
Поисковая система использует данные только тех ресурсов, которые были проиндексированы. Это значит, что существуют страницы, которые не попадают в поисковую выдачу.
Формальных ограничений нет, но на практике они возможны:
- Языковые границы. Например, разные приоритеты индексации «Яндекс» и Google. «Яндекс» больше нацелен на русскоязычную аудиторию и ее интересы, хотя и не ограничивается только ими, Google индексирует сайты со всего мира.
- Технические ошибки разработчиков.
- Не все форматы данных одинаково хорошо индексируются, так как изначально поисковые машины были рассчитаны на обработку веб-страниц, то есть формат HTML.
- Плохая работа сервера или сайт загружается с перебоями.
- Дубли страниц и копипаст с других ресурсов.
- Низкий трафик.
- Слишком большая глубина сайта, размер документа — файлы более 10Мб не индексируются.
- Другие причины, иногда такие экзотические, как «Adult-фильтр» — блокировка сайтов за взрослый контент.
Но главная причина того, что страница не появляется в выдаче — она новая, и поисковый робот просто не успел ее проиндексировать. В зависимости от характеристик сайта обновление или апдейт страниц может занять от нескольких минут до недель. Проверить индексирование страницы можно в Яндекс.Вебмастере раздел «Индексирование», а в Google Search Console «Проверка URL».
Яндекс.Вебмастер помогает понять, виден ли сайт в поисковой выдаче
Апдейт не только обновляет базы данных поисковиков, но и приводит к пересортировке поисковой выдачи. Поэтому сайт, который находился на вершине ранжирования, может в один момент исчезнуть из зоны видимости. А так как критерии ранжирования засекречены, то снова вернуться в верхние строчки может быть довольно сложно.
Виды поисковых систем
Поисковые системы делятся на четыре категории в зависимости от типа обработки данных:
- Системы на основе поисковых роботов — краулеров.
Принципы работы такой системы описаны выше и большинство популярных поисковых систем работает по этой технологии. Задача поисковика — обойти и просканировать сеть, чтобы создать структурированный архив веб-документов и список слов. А целью является создание ранжированного списка ресурсов.
Примеры: Google, «Яндекс», Baidu (крупнейшая китайская поисковая система). - Системы, управляемые человеком. Каталог сайтов полностью формируется вручную. Владелец сайта отправляет описание веб-мастеру и указывает категорию каталога, в которую его нужно включить. Сайт проверяет человек и включает в список, если он проходит модерацию. Это гарантирует более качественный контент, чем в первом варианте, но значительно замедляет ранжирование и обновление данных.
Примеры: каталог Yahoo, dmoz - Гибридные системы. Сочетание автоматических поисковых роботов и процессов, управляемых человеком. Например, восстановление в каталоге удаленного сайта, нарушившего правила.
Владелец страницы в этом случае вносит исправления и отправляет запрос в поддержку. Решение о повторном включении ресурса в поисковую систему принимает эксперт.
Примеры: MSN. Сюда же условно можно отнести Google, «Яндекс» и другие популярные поисковики, функционал которых не исключает ручную корректировку каталогов. - Метакраулеры. В отличие от поисковых систем, метакраулеры сами не сканируют веб-страницы для создания списков. Вместо этого они позволяют отправлять запросы нескольким поисковым системам одновременно.
Примеры: dogpile, DuckDuckGo
Есть и другие специализированные сервисы, которые можно использовать для поиска информации. Некоторые из них более удобны для поиска книг, фотографий, а какие-то обеспечивают большую конфиденциальность при работе и не запрашивают данные пользователей.
Главные мысли
Зачем нужны поисковые системы?
Интернет – это бесконечное хранилище самой разной информации, которая обновляется ежесекундно. Каждый компьютер, имеющий подключение к сети, по сути, является одной из ячеек этого хранилища.
А информация лежит в этих ячейках не только в виде текста, но еще и в картинках, видео и аудиофайлах. Что же помогает каждый день пользователям интернета находить среди этого бесконечного числа информации то, что им нужно? Ответ прост – поисковые системы.
Что такое поисковая система?
Поисковик, поисковая машина или поисковая система – это самый главный навигатор в бесконечных океанах цифровой информации. С помощью поискового робота, который безостановочно «прогуливается» по страницам старых и только что созданных сайтов, поисковая система как бы заносит в свою память каждый отдельный текст, картинку, видео или любого другого рода файл.
Работа поисковой системы (ПС) строится на основе определенного алгоритма, который сортирует полученную информацию и соотносит её с теми или иными запросами, присваивая ей релевантность. Релевантность – это соответствие запросам.
Но не только от релевантности зависит то, попадет страница в выдачу поисковика или нет. Накладывается множество факторов: рейтинг сайта, его качество с точки зрения пользователя, правильный код страницы. И точный алгоритм работы ПС на основе этих факторов расшифровать невозможно.
Что такое позиция сайта в ПС?
Проходя индексацию, те или иные сайты попадают в базу поисковой системы. Индексация – это своеобразный официальный учет, признание того, что сайт существует (или определенная его страница). В зависимости от огромного количества факторов страница может попасть на 1000, 249, 11, 1 или любое другое место в выдаче.
Выдача – это то, что пользователь видит, вводя запрос в строку поисковой системы. Например, набирая «что такое поисковик?», человеку выдается бесконечный список страниц. Первая в списке – самая «удачливая», в ней наилучшим образом объединились все факторы, что и вывело её на лидирующую позицию.
Что влияет на эту позицию?
Конечно же, работа людей, занимающихся сайтами: вебмастеров, оптимизаторов, копирайтеров. Очень многое зависит именно от качества контента, расположенного на странице. Если на странице будет встречаться большое количество запросов – ключевых слов, — то она не попадет на первую строчку. ПС стали умными, они продуманным образом определяют полезность страницы.
Другой взгляд на актуальность ПС
Итак, поисковая машина нужна для следующего:
- Выдача актуальной и соответствующей (релевантной) информации пользователю на его запрос. Ищет ли человек сведения об истории, новости или интернет-магазин с сухим кормом для своего любимчика – ПС поможет сделать это за 1 секунду.
- ПС дает возможность развиваться новым сайтам, увеличивая мировой интернет таким образом. Сайты создаются для того, чтобы зарабатывать на них, или для того, чтобы делиться с людьми какой-то важной информацией с целью получения популярности, или просто потому, что «есть, что сказать».
ПС – это мощный инструмент, не только позволяющий структурировать миллиарды терабайтов информации, но и открывающий колоссальные возможности онлайн заработка.
Почему же поисковиков так много?
Многие рядовые юзеры пользуются, как правило, одной поисковой системой. В России – это Яндекс в подавляющем большинстве случаев. Второй по популярности – Google. Но существуют и другие системы, все из которых перечислить сложно. Одни из них работают достаточно успешно, другие нет.
Почему их так много? У них разные алгоритмы поиска и индексации, но суть не в этом. Конкуренция – вот то, что каждый день заставляет даже таких гигантов, как Яндекс, развиваться и совершенствоваться, а не стоять на месте. Если этот поисковик остановится в развитии, на его место быстро придет другой. И большое количество ПС – это, скорее, хорошо, чем плохо!
Основные понятия поисковой системы — Часы поисковой системы
Сбиты с толку поисковыми системами и тем, как они работают? Не техническое направление? К сожалению, это делает вас восприимчивым к плохим советам по SEO или может привести к тому, что вы попадете в плохую SEO-фирму.
В этом посте будет дано объяснение основ поисковых систем на уровне неспециалиста. Давайте углубимся.
Три основные концепции поисковой системы
Релевантность
Это основной первый вопрос, с которым поисковая система должна иметь дело при просмотре любой веб-страницы. О чем это? Поисковые системы хотят это знать, потому что это помогает им отвечать на поисковые запросы пользователей страницами, соответствующими этому запросу.
Существует множество сигналов, которые можно использовать для определения релевантности данной страницы. Вот некоторые из них:
- Тег заголовка веб-страницы. Как и следовало ожидать, заголовок любого документа должен быть ведущим индикатором его содержания.
- Семантический анализ контента. Это не так сильно привязано к конкретным ключевым фразам, как раньше, но общая релевантность страницы анализируется на основе используемых слов и фраз.
- Анкорный текст, используемый в ссылках на страницу. Текст, на который вы нажимаете в ссылке, также действует как метка для того, что вы ожидаете найти, перейдя на эту страницу.
- Тематика сторонних веб-страниц, содержащих ссылки на страницу. Если много страниц, посвященных автомобильной тематике, ссылаются на вашу страницу, посвященную продаже подержанного Ford Mustang, это хорошо.
- Тема сайта, на котором находится страница. Ваша страница о продаже подержанного Ford Mustang будет лучше смотреться на сайте о подержанных автомобилях, чем на сайте об аквапарках.
- Как пользователи реагируют на содержимое страниц результатов поисковой системы (SERP). Если каждый, кто нажимает на ссылку, немедленно возвращается к поисковой выдаче и нажимает на что-то еще, это может быть плохим признаком.
Есть и другие потенциальные сигналы, которые вы можете придумать без особого труда, но к этому моменту вы уже должны уловить идею.
Влияние релевантности
Вы просто не сможете ранжироваться по данным поисковым запросам, если у вас нет страницы, релевантной этому поисковому запросу.
Узнайте, какие типы поисковых запросов используют люди, которые ищут товары или услуги, подобные вашим. Убедитесь, что у вас есть страницы для каждого основного варианта, но не переусердствуйте. Вы можете прочитать больше о том, как думать об этом, в 3 золотых правилах тегов заголовков.
Кроме того, убедитесь, что контент на этих страницах соответствует тегу заголовка, и создайте сильный контент для его поддержки.
Важность
Поисковые системы также пытаются определить, насколько важна каждая из страниц, релевантных конкретному поисковому запросу. Так они определяют, какая страница должна быть первой, какая второй и так далее.
Ресурсы
Исторически сложилось так, что основной движущей силой этого фактора были входящие ссылки. Многие считают, что социальные сигналы играют здесь большую роль, но я не из их числа. Лично я считаю, что ссылки остаются основным фактором расчета важности.
Влияние важности
Создание отличных продуктов или отличного контента невероятно ценно по многим причинам. Во-первых, люди с веб-сайтами могут сделать ссылку на ваш сайт, если они считают это важным.
Однако мало просто создавать фантастические вещи, нужно рассказать об этом миру. Основные методы PR и контент-маркетинга очень важны для распространения информации и могут привести к тому, что люди будут взаимодействовать с вашим контентом и делиться им.
Популярность
Для определенных типов запросов важность не так интересно определять, как популярность. Например, для такого поискового запроса, как [самые популярные фильмы], это явный запрос на что-то самое популярное.
Популярность также является мощным фактором для актуальных тем, таких как последние новости. Это место, где сигналы социальных сетей могут быть важным фактором, так как большое количество социальных репостов конкретной новостной статьи — это то, что поисковые системы могут уловить и использовать.
Как и в случае с релевантностью, поведение пользователя в поисковой выдаче также может быть сильным индикатором. Поисковая система может попытаться ранжировать новостные статьи в определенном порядке и изменить этот порядок на основе шаблонов кликов пользователей.
Влияние популярности
Есть много вещей, которые могут сделать что-то популярным, но один из лучших способов сделать это — разработать контент, который вызовет эмоциональную реакцию у зрителя.
Если вы можете создавать изображения, которые «рассказывают историю», это само по себе может помочь сделать страницу на вашем сайте более популярной.
Видео тоже может быть весьма эффективным.
Создание популярного контента — это вид искусства, поэтому вам потребуется сильное творческое начало, чтобы преуспеть в этом, и даже в этом случае вам придется тестировать множество различных вещей и со временем развиваться, чтобы найти выигрышную формулу.
Дополнительные концепции поисковой системы
Сегментация
Это концепция изменения результатов на основе того, что известно о пользователе.
Например, искатель в Египте, скорее всего, захочет получить другие результаты для [дикой природы], чем в Сингапуре. Или пользователь в Бостоне, вероятно, хочет получить другие результаты по запросу [пицца], чем в Остине.
Это концепция локализации, и это один из многих способов разделения пользователей на группы. Вот еще:
- Персонализация: Если поисковая система знает, что вы посещали определенную страницу ранее (в частности, недавно), она может использовать это для продвижения страницы на более высокие позиции в результатах поиска.
- Связи Google+: Google использует связи в Google+ для изменения рейтинга. Если кто-то, на кого вы подписаны, поделится чем-то или поставит +1, его рейтинг может быть повышен для вас при вводе связанного поискового запроса.
- Время суток: Некоторые запросы могут означать разные вещи в зависимости от времени суток. Поиск ресторана в 8 утра, вероятно, ищет место для завтрака, а тот же запрос в 17:00.
скорее всего, это место, где можно поужинать.
- Время года: То же верно в зависимости от времени года или сезона. Например, запросы, связанные с одеждой, в ноябре могут быть связаны с поиском чего-то более теплого.
- Другие недавние поисковые запросы: Если вы искали [гостиницы], а непосредственно перед этим вы искали [Рим], поисковая система может включить для вас некоторые результаты о [гостиницах Рима].
Влияние сегментации
Адаптируйте свой контент к целевой аудитории.
Если вы управляете рестораном в Винчестере, штат Вирджиния, обязательно укажите свой адрес на своем веб-сайте. Если вы подаете итальянскую еду на обед и ужин, убедитесь, что информация также доступна на сайте.
Убедитесь, что то, что делает ваш бизнес уникальным, четко обозначено на вашем веб-сайте. Эти типы подсказок сегментации — мощный способ заставить поисковые системы понять, как сопоставить вас с людьми, которые, скорее всего, станут вашими клиентами.
Разнообразие
Поисковые системы любят разнообразить свои результаты. Даже если сигналы релевантности и важности предполагают, что данная веб-страница должна занимать третье место в результатах поиска, если страница очень похожа на первый и второй результаты, поисковая система может вместо этого показать другой результат на третьем месте. Почему?
Если искателю не нравятся первый и второй результаты, а третий результат говорит в основном то же самое, он не захочет видеть то же самое в третий раз. Иногда это называют «Запрос заслуживает разнообразия», и вы можете прочитать об этом подробнее здесь: Требование экстремальной дифференциации в вашей контент-стратегии.
Влияние разнообразия
Ваш веб-сайт должен выделяться и отличаться от других.
Например, местной юридической фирме необходимо найти способы выделиться среди других юридических фирм, работающих на том же рынке. Изучите, что делают другие сайты, и создайте контент или продвигайте себя так, как они этого не делают.
Перед национальным и международным бизнесом стоят большие задачи, но потребность в дифференциации остается. Одним из отличных подходов к этому может быть установление позиции идейного лидера, хотя это также очень сложно сделать.
Качество
Поисковая система может обнаружить, что страница на сайте является релевантной, важной или популярной, но она все равно не может быть качественной страницей. По этой причине у поисковых систем есть алгоритмы для измерения качества страницы. Примером этого является алгоритм Google Panda, который может понизить рейтинг страниц на веб-сайте на основе показателей качества этих страниц.
Влияние качества
Потратьте время на то, чтобы разместить на своем веб-сайте много интересной информации. Убедитесь, что он полезен, точен и тщательно проверьте орфографию и грамматику. Попросите других прочитать его и дать вам обратную связь о том, понимают ли они, о чем он говорит, и насколько эффективно он передает ваше сообщение.
Создавайте контент, который достаточно хорош, чтобы о нем захотели рассказать другие. Если люди естественным образом ссылаются на него или делятся им в социальных сетях, то для вас это явный показатель того, что вы опубликовали что-то хорошего или лучшего качества.
Доверие
У вас может быть релевантный и авторитетный сайт, но есть веские причины не доверять их мотивам.
Например, если веб-сайт регулярно использует методы, нарушающие правила поведения поисковой системы, такие как продажа ссылок со своего веб-сайта, поисковая система может понизить рейтинг страниц на этом сайте.
Воздействие доверия
Прочтите Руководство Google для веб-мастеров и убедитесь, что понимаете, что в них считается допустимым. Это поможет вам создать более надежный сайт, а также снизить риск алгоритмического понижения рейтинга или ручного наказания со стороны поисковых систем в будущем.
Попросите других просмотреть ваш сайт и спросить их, что они думают о сайте. Отличный вопрос, который нужно задать им, заключается в том, будут ли они чувствовать себя, предоставляя сайту информацию о кредитной карте. Еще одна отличная идея, которая может помочь, — это развитие тесных отношений с другими людьми в вашем рыночном пространстве, которые считаются авторитетными и заслуживающими доверия.
Резюме
Знаете кого-нибудь, у кого проблемы с пониманием SEO? Поделитесь этой статьей, чтобы помочь им лучше понять, как работает мир поисковых систем!
Что такое поисковая система и как она работает?
Понимание того, как работают поисковые системы, может помочь вашему бизнесу использовать SEO для привлечения потенциальных клиентов.
Что такое поисковая система?
Поисковые системы позволяют пользователям искать контент в Интернете по ключевым словам. Хотя на рынке доминируют немногие, существует множество поисковых систем, которые люди могут использовать. Когда пользователь вводит запрос в поисковую систему, возвращается страница результатов поисковой системы (SERP), ранжирующая найденные страницы в порядке их релевантности. То, как это ранжирование выполняется, различается в разных поисковых системах.
Поисковые системы часто меняют свои алгоритмы (программы, ранжирующие результаты), чтобы улучшить взаимодействие с пользователем. Они стремятся понять, как пользователи выполняют поиск, и дать им лучший ответ на их запрос. Это означает, что приоритет должен отдаваться страницам самого высокого качества и наиболее релевантным страницам.
Как работают поисковые системы?
Существует три ключевых этапа работы большинства поисковых систем:
- Сканирование — поисковые системы используют программы, называемые пауками, ботами или сканерами, для поиска в Интернете. Они могут делать это каждые несколько дней, поэтому контент может устареть до тех пор, пока они снова не просканируют ваш сайт.
- Индексирование — поисковая система попытается понять и классифицировать содержимое веб-страницы с помощью «ключевых слов».
Следование рекомендациям SEO поможет поисковой системе понять ваш контент, чтобы вы могли ранжироваться по правильным поисковым запросам.
- Рейтинг — результаты поиска ранжируются на основе ряда факторов. К ним могут относиться плотность ключевых слов, скорость и ссылки. Цель поисковой системы — предоставить пользователю наиболее релевантных результатов.
Хотя большинство поисковых систем предоставляют советы о том, как улучшить рейтинг вашей страницы, точные используемые алгоритмы тщательно охраняются и часто меняются, чтобы избежать неправильного использования. Но следуя рекомендациям по поисковой оптимизации (SEO), вы можете гарантировать, что:
- Поисковые системы смогут легко сканировать ваш веб-сайт. Вы также можете предложить им сканировать новый контент.
- Ваш контент проиндексирован по правильным ключевым словам, поэтому он может отображаться при релевантном поиске.
- Ваш контент может занимать высокие позиции в поисковой выдаче.
Поисковые системы каталогов
Некоторые нишевые поисковые системы работают как каталоги для определенных типов контента. Это означает, что они показывают результаты только для контента, добавленного вручную. Они не лазят по интернету. Тактика SEO по-прежнему может использоваться для получения высокого рейтинга по релевантным запросам в этих поисковых системах каталогов. См. типы поисковых систем.
Результаты поиска Rich Media
Универсальный или «смешанный» поиск — это то, как поисковые системы представляют пользователям различные типы контента в результатах поиска. Помимо результатов традиционной текстовой страницы, поисковая выдача также будет отображать мультимедийный контент, такой как изображения, видео, карты, статьи и страницы покупок.
Наличие на веб-сайте нескольких различных типов контента — например, обучающего видео о том, как использовать ваш продукт, или блога — может повлиять на ваши шансы появиться на страницах результатов и на ваш рейтинг.