Поисковая система: что это такое, как она работает
Поисковая система (поисковик) — это специальная программа, которая в ответ на запрос пользователя через веб-интерфейс (сайт) выдает список ресурсов, отсортированных по релевантности этому запросу.
Хорошая поисковая система предлагает материалы, которые наиболее корректно отвечают на запрос пользователя. При этом многие поисковики могут искать нужное не только по словам, но и по картинке или голосовому сообщению.
Прародителем всех поисковых систем считают программу Арчи — первый инструмент для поиска контента в интернете. Арчи предлагал пользователям архив со списком доступных файлов и возможностью поиска по ним.
Лишь в 1994 году появилась первая полноценная поисковая система — WebCrawler, которая стала индексировать не только названия файлов или заголовки страниц, но и их содержимое. А уже через три года, в 1997 году, на рынок вышли привычные нам Google и Яндекс — самые популярные поисковые системы в России, по данным Яндекс. радар.
Если обратиться к мировой статистике, то здесь лидирует Google (84,8%), а «Яндекс» (1,06%) уходит на 6-е место.
Доля рынка наиболее часто используемых поисковых систем по всему миру по состоянию на сентябрь 2022 г. Источник
Зачем нужна поисковая система
Без поисковых систем обычный пользователь вряд ли найдет в интернете нужную информацию, так как без них не будет привычного нам списка сайтов. Придется вручную вбивать адрес каждого ресурса, чтобы проверить, есть ли там то, что вы ищите. К счастью, алгоритмы поисковиков уже знают, какая информация есть на большинстве сайтов, и в ответ на запрос выдают список страниц, которые больше всего соответствуют этому запросу.
Кроме того, современные поисковые системы давно вышли за границы обычных поисковиков и превратились в целые экосистемы, которые помогают пользователям решать множество бытовых и бизнес-задач. В том же «Яндексе» есть электронная почта, маркетплейс, онлайн-кинотеатр, такси, доставка еды, карты, различные сервисы для бизнеса, а еще собственная платежная система и знакомый многим голосовой помощник Алиса.
У Яндекса столько разных сервисов, что они не поместились на одном экране даже мелким шрифтом
Этапы работы поисковиков
У каждой поисковой системы — свой алгоритм работы, который держится в строгом секрете. Однако условно весь процесс подбора нужной информации поисковиком можно разделить на три этапа: сканирование (поиск и сохранение страниц), индексация и ранжирование.
Сканирование
Чтобы поисковая система смогла найти нужную информацию в большом количестве сайтов, эти сайты должны быть ей известны, то есть прочитаны и сохранены в памяти.
Можно сравнить с библиотекой: если вы не знаете, какие книги стоят на полках и никогда не заглядывали в них, то вероятность того, что вы быстро сориентируетесь и найдете нужную цитату, равна нулю.
Поисковая система узнает о содержимом сайтов с помощью специального робота — краулера, или паука. Название происходит от английского crawler (ползающее насекомое, ползунок). Робот обходит все страницы, переходит по ссылкам и постепенно охватывает миллиарды веб-страниц в сети, сохраняет их и отправляет на индексацию.
Индексация
Следующий этап — подробный анализ загруженных страниц и добавление информации о том, какие сведения в них содержатся, в базу поисковой системы (создание индекса).
Индексный робот разбивает каждую сохраненную страницу на части (заголовки, текст, ссылки, теги html и т.д), изучает их содержимое, переваривает и структурирует. В результате получается упорядоченный список адресов страниц и размещенной на них информации.
По аналогии с библиотекой недостаточно знать, какие книги есть на полках. Важно составить подробный и удобный каталог, который расскажет, в каких книгах и на каких страницах искать нужную информацию.
Другой пример — предметный указатель в справочниках, который помогает без труда найти ответ на нужный вопрос. Все термины здесь размещены по алфавиту с указанием страниц, на которых они встречаются
Пока страница не проиндексирована, для поисковика она не существует. Поэтому важно, чтобы сайт был открыт для индексации. При необходимости можно закрыть от поисковых роботов отдельные страницы, например личный кабинет и корзину, чтобы они не попали в выдачу.
Как ускорить индексацию страниц
Если страница открыта для индексации, то самая распространенная причина того, что она не появляется в выдаче — она новая, и поисковый робот просто не успел ее проиндексировать.
В зависимости от характеристик сайта и возможностей поисковых роботов обновление или апдейт страниц может занять от нескольких минут до нескольких недель.
Проверить индексирование страницы можно в «Яндекс.Вебмастере» раздел «Индексирование», а в Google Search Console «Проверка URL».
Яндекс.Вебмастер помогает понять, виден ли сайт в поисковой выдаче
Также в «Яндекс Вебмастере» можно направить страницы сайта на индексацию вручную с помощью функции «Переобход страниц», а в Google Search Console — сделать запрос индексирования.
Ранжирование и поисковая выдача
Когда человек вводит запрос в поисковую строку, поисковик выбирает все страницы, которые имеют отношение к запросу, прогоняет их через свои алгоритмы и выдает список сайтов в определенном порядке. При этом чем выше сайт оказался в выдаче, тем лучше он соответствует запросу пользователя и требованиям поисковика.
Процесс сортировки сайтов по определенному списку критериев называется ранжированием. На результаты ранжирования влияет релевантность контента запросу, качество и удобство сайта, его технические и пользовательские характеристики и многое другое. Точный список критериев поисковые системы держат в секрете и постоянно обновляют свои алгоритмы.
По итогам ранжирования можно получить разные результаты поисковой выдачи:
- в разных поисковиках, так как используются различные критерии фильтрации;
- в разных регионах, так как в запросах учитывается местонахождение пользователя;
- на разных устройствах — в десктопной и мобильной версии, так как имеет значение удобство использования сайта на разных устройствах;
- по одинаковым запросам у разных пользователей, так как учитывается индивидуальная история поиска.
По запросу «Муми тролли» «Яндекс» и Google выдают разные результаты, на первой странице совпадает только один сайт из шести
Ранжирование позволяет пользователям быстрее получить нужную и достоверную информацию, а компаниям использовать поисковую выдачу для продвижения своего сайта.
Альтернативные поисковые системы
Большинству поисковых систем далеко до Яндекса и Гугла, и все же некоторые из них могут быть полезны в той или иной ситуации. Вот несколько примеров поисковиков, которые ориентируются на определенную нишу или предлагают больше конфиденциальности.
DuckDuckGo — поисковая система с открытым исходным кодом. Не собирает и не хранит данные о посетителях, а значит, обеспечивает максимальную конфиденциальность своим пользователям. Кроме того, Google и Яндекс стремятся персонализировать выдачу и учитывают предпочтения посетителя. В DuckDuckGo такого нет, поэтому поисковая выдача получается чуть более объективной. Например, через поисковик удобнее искать информацию на иностранном языке.
FindSounds — поисковик по звукам. Можно ввести текстовый запрос или загрузить образец. Запросы на русском не поддерживаются, но есть большой список русскоязычных тегов. Можно уточнить запрос, выбрав желаемый формат и качество звучания. Легко найти рев леопарда, жужжание осы, тикание часов и даже звук дыхания Дарта Вейдера. Все найденные звуки доступны для скачивания.
BoardReader — поиск по форумам, сервисам вопросов и ответов и другим сообществам. Специальные настройки помогут быстро найти посты и комментарии, которые соответствуют заданным критериям: языку, дате публикации и названию сайта.
Главные мысли
Поисковая система | это… Что такое Поисковая система?
Поиско́вая систе́ма — программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете. Под поисковой системой обычно подразумевается сайт, на котором размещён интерфейс (фронт-энд) системы. Программной частью поисковой системы является поисковая машина (поисковый движок) — комплекс программ, обеспечивающий функциональность поисковой системы и обычно являющийся коммерческой тайной компании-разработчика поисковой системы.
Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.
Улучшение поиска — это одна из приоритетных задач современного Интернета (см. про основные проблемы в работе поисковых систем в статье Глубокая паутина).
По данным компании Net Applications,[1] в ноябре 2011 года использование поисковых систем распределялось следующим образом:
- Google — 83,87 %;
- Yahoo! — 6,20 %;
- Baidu — 4,22 %;
- Bing — 3,69 %;
- Yandex — 1,7 %;
- Ask — 0,57 %;
- AOL — 0,36 %.
Содержание
|
История
Одним из первых инструментов поиска в интернете (до Всемирной паутины) был Archie.
Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью Грэем (англ. Matthew Gray) из Массачусетского технологического института в 1993. Также в 1993 году появилась поисковая система «Aliweb», работающая до сих пор. Первой полнотекстовой (т. н. «crawler-based», то есть индексирующей ресурсы при помощи робота) поисковой системой стала «WebCrawler», запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице — с тех пор это стало стандартом во всех основных поисковых системах. Кроме того, это был первый поисковик, о котором было известно в широких кругах. В 1994 был запущен «Lycos», разработанный в университете Карнеги Мелона.
Вскоре появилось множество других конкурирующих поисковых машин, таких как «Excite», «Infoseek», «Inktomi», «Northern Light» и «AltaVista». В некотором смысле они конкурировали с популярными интернет-каталогами, такими, как «Yahoo!». Позже каталоги соединились или добавили к себе поисковые машины, чтобы увеличить функциональность. В 1996 году русскоязычным пользователям интернета стало доступно морфологическое расширение к поисковой машине Altavista и оригинальные российские поисковые машины «Рамблер» и «Апорт». 23 сентября 1997 была открыта поисковая машина Яндекс.
В последнее время завоёвывает всё большую популярность практика применения методов кластерного анализа и поиска по метаданным. Из международных машин такого плана наибольшую известность получила «Clusty» компании Vivísimo. В 2005 году на российских просторах при поддержке МГУ запущен поисковик «Нигма», поддерживающий автоматическую кластеризацию. В 2006 году открылась российская метамашина Quintura, предлагающая визуальную кластеризацию в виде облака тегов. «Нигма» тоже экспериментировала[2] с визуальной кластеризацией.
Помимо поисковых машин для Всемирной паутины, существовали и поисковики для других протоколов, такие как Archie для поиска по анонимным FTP-серверам и «Veronica» для поиска в Gopher.
Популярные поисковые системы
Согласно данным LiveInternet в 2012 году об охвате русскоязычных поисковых запросов:
- Всеязычные:
- Google (24,9 %)
- Bing (0,8 %)
- Yahoo! (0,2 %) и принадлежащие этой компании поисковые машины:
- Inktomi
- AltaVista
- Alltheweb
- Англоязычные и международные:
- AskJeeves (механизм Teoma)
- Русскоязычные — большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках — украинском, белорусском, английском, татарском и др. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что в основном индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык или другими способами ограничивают своих роботов русскоязычными сайтами.
- Яндекс (61,3 %)
- Mail.ru (8,5 %)
- Рамблер (1,9 %)
- Нигма (0,3 %)
Некоторые из поисковых систем используют внешние алгоритмы поиска. Так, Qip.ru использует поисковый механизм Яндекса, а Nigma сочетает в себе как свой алгоритм, так и сборную выдачу от других поисковиков.
Необычные поисковые системы
- DuckDuckGo — гибридная поисковая система с политикой конфиденциальности пользователя и его поисковых запросов.
- Koogle (с его помощью ортодоксальные иудеи могли найти контент, признанный раввинами удовлетворяющим религиозным требованиям).[3]
- Yauba (индийский поиск «для параноиков» — в отличие от привычных поисковиков, за пользователями не следят, а все записи о его действиях удаляются с сервера). [3]
- TinEye — поисковая система, специализирующаяся на поиске изображений в Интернете. С недавнего времени теряет свою актуальность, после того, как Google ввел такую функцию в своем поиске по картинкам.
- Генон — поисковая система, собирающая и создающая контент у себя на сайте.
- ImHalal — первый исламский поисковик. Новый поисковик может отличить разрешённые для мусульман (халяльные) результаты поиска от запретных (харамных). Был открыт в 2009 году. Ориентировочно с начала сентября 2011 прекратил функционирование в связи с недостатком финансирования.
См. также
- Список поисковых машин
- Информационный поиск
- Статистика запросов
- Поисковый спам
- Каталог ресурсов в Интернете
- DataparkSearch
- Qwika
- Wikia Search
Примечания
- ↑ Search engine market share (англ.)
- ↑ 12.06.2006: Nigma.ru тестирует AJAX-интерфейс для поиска
- ↑ 1 2 Запущен «кошерный» поисковик Koogle
Литература
- Байков Владимир Дмитриевич. Интернет. Поиск информации. Продвижение сайтов. — СПб.: БХВ-Петербург, 2000. — 288 с. — ISBN 5-8206-0095-9
- Ашманов И. С., Иванов А. А. Продвижение сайта в поисковых системах. — М.: Вильямс, 2007. — 304 с. — ISBN 978-5-8459-1155-1
- Колисниченко Д. Н. Поисковые системы и продвижение сайтов в Интернете. — М.: Диалектика, 2007. — 272 с. — ISBN 978-5-8459-1269-5
- Ландэ Д. В. Поиск знаний в Internet. — М.: Диалектика, 2005. — 272 с. — ISBN 5-8459-0764-0
- Маннинг К., Рагхаван П., Шютце Х. Введение в информационный поиск. — Вильямс, 2011. — ISBN 978-5-8459-1623-5
Ссылки
- Захаров Н. В. Информационно-поисковые системы в филологических науках
- Компоненты, алгоритмы поисковых систем
- Портал поисковых технологий «Search Tools» (англ.)
- Национальная поисковая система Российской Федерации (статья)
Что такое поисковая система?
К
- Бен Луткевич, Технические характеристики Писатель
Поисковая система — это скоординированный набор программ, которые ищут и идентифицируют элементы в базе данных, соответствующие заданным критериям. Поисковые системы используются для доступа к информации во всемирной паутине.
Как работают поисковые системы?- Ползание. Поисковые роботы обнаруживают, какие страницы существуют в Интернете. Поисковая система постоянно ищет новые и обновленные страницы, чтобы добавить их в свой список известных страниц. Это называется обнаружением URL . Как только страница обнаружена, сканер проверяет ее содержимое. Поисковая система использует алгоритм, чтобы выбрать, какие страницы сканировать и как часто.
- Индексация. После обхода страницы текстовое содержимое обрабатывается, анализируется и помечается атрибутами и метаданными, которые помогают поисковой системе понять, о чем содержание. Это также позволяет поисковой системе отсеивать дубликаты страниц и собирать информацию о содержании, например о стране или регионе, в котором находится страница, и об удобстве использования страницы.
- Поиск и ранжирование. Когда пользователь вводит запрос, поисковая система ищет в индексе соответствующие страницы и возвращает результаты, наиболее релевантные на странице результатов поисковой системы (SERP). Механизм ранжирует контент по ряду факторов, таких как авторитетность страницы, обратные ссылки на страницу и ключевые слова, содержащиеся на странице.
Специализированные поисковые системы более избирательны в отношении тех частей Интернета, которые они сканируют и индексируют. Например, Creative Commons Search — это поисковая система для контента, предоставленного для повторного использования в соответствии с лицензией Creative Commons. Эта поисковая система ищет только этот конкретный тип контента.
Поисковые системы для конкретной страны могут отдавать приоритет веб-сайтам, представленным на родном языке страны, по сравнению с веб-сайтами на английском языке. Отдельные веб-сайты, такие как крупные корпоративные сайты, могут использовать поисковую систему для индексации и извлечения контента только с сайта этой компании. Некоторые крупные компании, занимающиеся поисковыми системами, лицензируют или продают свои поисковые системы для использования на отдельных сайтах.
Поисковые системы сканируют, индексируют и ранжируют контент в Интернете, используя алгоритмы для определения места на страницах результатов. Как поисковые системы ранжируют результатыНе все поисковые системы ранжируют контент одинаково, но у некоторых есть схожие алгоритмы ранжирования. Поиск Google и другие поисковые системы ранжируют релевантные результаты на основе следующих критериев:
.- Значение запроса. Поисковая система просматривает пользовательские запросы, чтобы установить намерение искателя, т. е. конкретный тип информации, которую ищет пользователь. Для этого поисковые системы используют языковые модели. Языковые модели — это алгоритмы, которые считывают вводимые пользователем данные, понимают, что они означают, и определяют тип информации, которую ищет пользователь.
- Актуальность. Ключевые слова из поисковых запросов сопоставляются с ключевыми словами в содержании. Ключевые слова, которые появляются в нескольких местах в содержании, означают большую релевантность, чем другие.
- Качество. Поисковые системы ищут в содержании индикаторы компетентности, авторитетности и надежности. Если другие известные веб-сайты ссылаются на контент, он считается более надежным.
- Удобство использования. Поисковые системы оценивают доступность контента и удобство для пользователей в целом и награждают контент более удобным просмотром страницы. Одним из примеров удобства использования страницы является удобство для мобильных устройств, которое является мерой того, насколько легко использовать веб-страницу на мобильном устройстве.
- Данные пользователя. Предыдущая история поиска пользователя, настройки поиска и данные о местоположении — это лишь некоторые из типов данных, которые поисковые системы используют для определения рейтинга контента, который они выбирают.
Поисковые системы могут использовать другие показатели производительности веб-сайта, такие как показатель отказов и время, проведенное на странице, чтобы определить место веб-сайта на странице результатов. Поисковые системы могут возвращать разные результаты для одного и того же термина при поиске текстового контента по сравнению с поиском изображения или видео.
Поисковые системы часто предоставляют ссылки на видео на своих страницах результатов поиска.Создатели контента используют поисковую оптимизацию (SEO), чтобы воспользоваться преимуществами вышеуказанных процессов. Оптимизация контента на странице для поисковых систем повышает ее видимость для поисковых систем и ее рейтинг в поисковой выдаче. Например, создатель контента может вставить ключевые слова, релевантные заданному поисковому запросу, чтобы улучшить результаты по этому запросу. Если создатель контента хочет, чтобы люди, которые ищут собак, попадали на его страницу, они могут добавить ключевые слова 9. 0033 кость , поводок и собака . Они также могут содержать ссылки на страницы, которые Google считает авторитетными.
Какова цель поисковых систем?Основная цель поисковой системы — помочь людям искать и находить информацию. Поисковые системы предназначены для предоставления людям нужной информации на основе набора критериев, таких как качество и релевантность.
Поставщики веб-страниц и веб-сайтов используют поисковые системы, чтобы зарабатывать деньги и собирать данные, такие как данные о посещениях, о пользователях, выполняющих поиск. Это второстепенные цели, которые требуют от пользователей уверенности в том, что контента, который они получают в поисковой выдаче, достаточно для взаимодействия с ним. Пользователи должны видеть, что информация, которую они получают, является правильной.
Доверие пользователей можно заслужить разными способами, включая следующие:
- Органические результаты. Неоплачиваемые органические результаты считаются более надежными, чем платные результаты на основе рекламы.
- Власть. Google пытается установить полномочия веб-страницы, чтобы идентифицировать ее как источник достоверной информации.
- Конфиденциальность. DuckDuckGo — это поисковая система, которая использует защиту конфиденциальности для установления доверия. Он защищает конфиденциальность пользователей и позволяет избежать искаженных результатов поиска, которые могут быть получены из-за использования личной информации для таргетинга пользователей или помещения их в ограниченные категории поиска, известные как 9.0033 пузырьки фильтра .
Поисковые системы зарабатывают деньги несколькими способами, включая следующие:
- Объявления с оплатой за клик. Рекламодатели или сторонние рекламные сети размещают рекламу в поисковой выдаче и в самом контенте. Чем больше просмотров или кликов получает ключевое слово, связанное с поиском, тем больше рекламодатели платят за то, чтобы его реклама была связана с ним.
- Данные пользователя. Поисковые системы также зарабатывают деньги на данных пользователей, которые они собирают. Примеры включают историю поиска и данные о местоположении. Эти данные используются для создания цифрового профиля для данного искателя, который поставщики поисковых систем могут использовать для показа целевой рекламы этому пользователю.
- Контекстная реклама. Поисковые системы также извлекают выгоду из контекстной рекламы, которая напрямую связана с текущим поиском пользователя. Если поисковая система включает в себя функцию покупок на платформе, она может отображать контекстную рекламу продуктов, связанных с поиском пользователя, на боковой панели веб-сайта, где отображаются рекламные объявления. Например, если интернет-магазин продает книги, в углу страницы может появиться реклама очков для чтения.
- Пожертвования. Некоторые поисковые системы предназначены для помощи некоммерческим организациям в сборе пожертвований.
- Партнерские ссылки. Некоторые системы включают партнерские ссылки, когда поисковая система имеет партнерство, в котором партнер платит поисковой системе, когда пользователь щелкает ссылку партнера.
Поисковые системы персонализируют результаты на основе цифровых профилей поисковых систем, созданных на основе пользовательских данных. Пользовательские данные собираются из приложения или устройства, с помощью которого пользователь получает доступ к поисковой системе. Собранные пользовательские данные включают следующее:
- история поиска
- дата и время поиска
- информация о местоположении
- аудиоданные
- идентификатор пользователя
- идентификация устройства
- IP-адрес
- диагностические данные устройства
- списки контактов
- история покупок
Файлы cookie используются для отслеживания истории просмотров и других данных. Это небольшие текстовые файлы, отправленные с веб-сайтов, которые пользователь посещает, в свой веб-браузер. Поисковые системы используют файлы cookie для отслеживания пользовательских предпочтений и персонализации результатов и рекламы. Они могут запоминать настройки, такие как пароли, языковые настройки, фильтры содержимого, количество результатов на странице и информацию о сеансе.
Использование настроек приватного просмотра или просмотра в режиме инкогнито защищает пользователей от отслеживания, но только на уровне устройства. История поиска и другая информация, накопленная в ходе поиска, не сохраняется и удаляется после сеанса поиска. Однако интернет-провайдеры, работодатели и владельцы доменов посещаемых веб-сайтов могут отслеживать цифровую информацию, оставленную во время поиска.
techtarget.com» type=»text/html» frameborder=»0″> Популярные поисковые системыGoogle — самая популярная поисковая система, охватывающая более 9По данным службы анализа веб-трафика StatCounter, занимает 2% доли рынка поисковых систем по всему миру. Yahoo и Microsoft Bing занимают второе и третье места с почти 4% и чуть более 1% рынка соответственно.
DuckDuckGo приобрела некоторую популярность из-за своей направленности на защиту личных поисковых данных пользователей. Некоторые пользователи могут предпочесть использовать Bing или Yahoo для своих других интегрированных предложений.
Другими популярными поисковыми системами в мире являются следующие:
- Байду
- BoardReader
- Храбрый поиск
- Поиск Creative Commons
- Экозия
- Экору
- Гибиру
- Гигабласт
- Дайте воду
- Айстак
- Моджик
- МетаГер
- Навер
- Единый поиск
- Поиск лука
- Разведчик
- Поиск Шифровать
- SearX
- Разумная гипероптимизированная сеть доступа к данным (Shodan)
- Стартовая страница
- Swisscows
- Количество
- Wiki. com
- Вольфрам Альфа
- Яндекс
Некоторые из этих систем, такие как Ecosia и Startpage, используют свои собственные поисковые роботы, но для индексации полагаются на более крупные и популярные поисковые системы, такие как Google и Bing. Другие, такие как Mojeek, используют собственные поисковые роботы и ведут собственный индекс.
Альтернативные поисковые системы, такие как HaystakOnion Search и Recon, позволяют пользователям просматривать темную сеть с помощью браузера Tor, который шифрует пользовательский трафик для дополнительной конфиденциальности и безопасности. Даркнет — это скрытая часть Интернета, недоступная для традиционных браузеров.
Другие поисковые системы фокусируются на определенных типах информации. Например, Wolfram Alpha — это поисковая система в Интернете по научным и математическим темам. Shodan — это инструмент для поиска устройств, подключенных к Интернету.
Браузеры обычно имеют поисковую систему по умолчанию. Например, Google Chrome и Safari для iOS используют Google.
Будущее поисковых системПоисковые системы и компании, которые их разрабатывают, скорее всего, будут использовать новые технологии для повышения точности, релевантности и качества ответов, предоставляемых поисковыми системами. Они также будут использовать передовые технологии, такие как искусственный интеллект, для улучшения взаимодействия с пользователем в будущем. Например, когда-нибудь пользователь сможет загрузить изображение компьютера в Google и спросить: «Этот компьютер подходит для игр?» и получите вдумчивый, развернутый ответ.
Google, скорее всего, сохранит большую часть поискового рынка. Учитывая это, SEO-компании могут ожидать, что Google будет периодически обновлять свой основной алгоритм поисковой системы. Google делает это, чтобы эти компании не оптимизировали контент для определенного алгоритма.
Однако в будущем могут появиться новые нишевые движки, обеспечивающие специфичность и конфиденциальность, которых, по мнению многих пользователей, не хватает Google. Пользователи могут тяготеть к поисковым инструментам, которые обеспечивают повышенную конфиденциальность или лучшее качество, индексируя только часть Интернета.
Некоторые эксперты также считают, что использование поисковых систем сокращается, поскольку в будущем поиск информации будет осуществляться в других приложениях и на сайтах социальных сетей, таких как Facebook, TikTok и LinkedIn.
Хотя Google держит свой алгоритм в секрете, создатели контента могут иметь некоторый контроль над производительностью контента. Узнайте, как улучшить свой рейтинг в поисковых системах.
Последнее обновление: ноябрь 2022 г.
Продолжить чтение О поисковой системе- Поиск вне поисковых систем
- Основные проблемы SEO-маркетинга
- Советы по созданию SEO-стратегии контент-маркетинга
- Как аналитика может улучшить управление контентом?
- Как таксономия тегов контента улучшает корпоративный поиск
распознавание изображений
Распознавание изображений в контексте машинного зрения — это способность программного обеспечения идентифицировать объекты, места, людей, надписи и действия на цифровых изображениях.
Сеть
- WAN (глобальная сеть)
Глобальная вычислительная сеть (WAN) — это географически распределенная частная телекоммуникационная сеть, которая соединяет между собой несколько локальных …
- сетевой протокол
Сетевой протокол — это набор установленных правил, которые определяют, как форматировать, отправлять и получать данные, чтобы компьютерная сеть …
- SD-ветка
SD-филиал — это единая автоматизированная централизованно управляемая программно-ориентированная платформа, которая заменяет или дополняет существующий филиал …
Безопасность
- Альянс облачной безопасности (CSA)
Альянс по безопасности облачных вычислений (CSA) — это некоммерческая организация, которая продвигает исследования передовых методов обеспечения безопасности облачных . ..
- квантовое превосходство
Квантовое превосходство — это экспериментальная демонстрация доминирования и преимущества квантового компьютера над классическими компьютерами с помощью …
- антивирусное программное обеспечение (антивирусная программа)
Антивирусное программное обеспечение (антивирусная программа) — программа обеспечения безопасности, предназначенная для предотвращения, обнаружения, поиска и удаления вирусов и других…
ИТ-директор
- сделка
В вычислениях транзакция представляет собой набор связанных задач, рассматриваемых как одно действие.
- бережливое управление
Бережливое управление — это подход к управлению организацией, который поддерживает концепцию постоянного совершенствования, долгосрочного …
- идентификатор устройства (идентификация устройства)
Идентификатор устройства (идентификация устройства) — это анонимная строка цифр и букв, которая однозначно идентифицирует мобильное устройство, такое как . ..
HRSoftware
- кадровый резерв
Кадровый резерв — это база данных кандидатов на работу, которые могут удовлетворить немедленные и долгосрочные потребности организации.
- разнообразие, равенство и инклюзивность (DEI)
Разнообразие, равенство и инклюзивность — термин, используемый для описания политики и программ, которые способствуют представительству и …
- пассивный кандидат
Пассивный кандидат (пассивный кандидат на работу) — это любой работник, который не ищет работу активно.
Служба поддержки клиентов
- лид, квалифицированный продуктом (PQL)
Лид, квалифицированный по продукту (PQL), — это физическое или юридическое лицо, которое получило выгоду от использования продукта в результате бесплатного …
- квалифицированный маркетолог лид (MQL)
Квалифицированный маркетолог (MQL) — это посетитель веб-сайта, уровень вовлеченности которого указывает на то, что он может стать клиентом.
- успех клиента
Успех клиента — это стратегия, направленная на то, чтобы продукция компании соответствовала потребностям клиента.
Что такое поисковая система?
Команда Neeva, 11.06.21
Пользоваться поисковой системой очень просто: вы открываете веб-страницу, вводите несколько слов в строку поиска и вуаля — миллионы результатов появляются за доли секунды. . Например, поиск Google по запросу «поисковая система» дает 1,43 миллиарда результатов за 0,69 секунды.секунды. Но как именно ? Вот как дикая, дикая сеть стала полностью индексируемой, доступной для поиска и ранжированной менее чем за десять лет.
Что такое поисковая система?
Поисковая система — это программное обеспечение, предназначенное для поиска определенной информации. Тип поисковой системы, с которой знакомо большинство из нас, — это поисковая система в Интернете, представляющая собой веб-службу, которая находит информацию в Интернете (иногда называемую «всемирной паутиной») на основе запроса пользователя, который обычно представляет собой набор слова.
Сегодня многие люди думают, что поисковые системы являются синонимами интернет-браузеров — отчасти благодаря браузеру Google Chrome, встраивающему функции поисковой системы в строку веб-адреса. Но поисковые системы — это веб-службы, специально созданные для получения информации. К ним можно легко получить доступ из браузера, но это разные технологии.
Как работают поисковые системы?
Хотя поисковые системы с годами стали более сложными, они по-прежнему следуют довольно простой формуле: сканировать и индексировать все данные в Интернете, чтобы при поиске чего-либо он мог предоставить вам набор результатов, ранжированных по актуальность. Вот как они это делают.
- Сканирование . Поисковые роботы, также известные как пауки, представляют собой программы, которые постоянно ищут в Интернете, находя новые сайты и идентифицируя новые ссылки. Краулеры также отправляют текст с каждого веб-сайта в индекс для анализа. Поисковые роботы могут даже хранить всю веб-страницу или ее часть, что называется кешем. Веб-мастера (люди, управляющие веб-сайтами) могут добавлять на свои сайты файл robots.txt, который сообщает сканеру, какие страницы следует просматривать, а какие игнорировать.
- Индекс . Данные, которые собирают сканеры, анализируются, систематизируются и сохраняются в индексе, чтобы механизм мог быстро находить информацию. Подобно указателю в конце книги, но гораздо более подробному, индекс поисковой системы включает запись для каждого слова на каждой проиндексированной веб-странице.
- Поиск . Когда вы запрашиваете поисковую систему, поисковая система должна сначала перевести ваши слова в термины, относящиеся к ее индексу. Это делается с помощью множества методов, включая обработку естественного языка (НЛП, которое использует машинное обучение, чтобы понять, что вы ищете). Результатом этого начального процесса перевода является переписанный запрос, в котором определяются важные части вашего запроса, исправляются орфографические ошибки и добавляются синонимы. Затем поисковая система обращается к своему индексу, чтобы найти веб-страницы, соответствующие переписанному запросу.
- Ранг. Поисковые системы используют алгоритмы, чтобы предоставить вам список результатов, ранжированных по тому, что, по их мнению, лучше всего ответит на ваш запрос. Для расплывчатых запросов, таких как «рамен», ваша поисковая система может предоставить ряд ответов, чтобы охватить свои основы, например, общую информацию о том, что такое рамен , наряду с другими популярными результатами, такими как рецепты, местные магазины рамэн и даже « люди также спрашивают», чтобы помочь вам сузить область поиска.
Как поисковые системы ранжируют результаты?
Один запрос может найти миллиарды релевантных веб-страниц, поэтому часть работы поисковой системы заключается в сортировке этих списков с использованием алгоритмов ранжирования. И хотя эти алгоритмы предназначены для предоставления вам наилучших ответов на ваши вопросы, они смещены в сторону определенных факторов. Поисковые системы хотят показать вам результаты, на которые вы нажмете, и они используют различные факторы для ранжирования результатов в соответствии с тем, с чем, по их мнению, вы будете взаимодействовать. К ним относятся, но не ограничиваются:
- Использование ключевых слов. Результаты поиска должны соответствовать хотя бы некоторым словам в запросе. Поисковые системы отдают приоритет страницам, на которых эти ключевые слова появляются на видном месте, например в заголовке страницы, или часто по всей странице.
- Содержимое страницы. Поисковые системы отдают предпочтение высококачественному контенту, анализируя длину, глубину и широту веб-страниц.
- Обратные ссылки . Обратные ссылки или упоминания одного веб-сайта на другом веб-сайте можно рассматривать как голосование в пользу авторитета этого сайта. Впервые созданный Google PageRank, ранжирование обратных ссылок ранжирует страницы в зависимости от того, сколько других сайтов ссылаются на этот сайт и насколько высоко рейтинг этих сайтов.
- Информация о пользователе. Поисковые системы, такие как Google, используют вашу личную информацию, такую как история поиска и местоположение, для предоставления результатов, которые являются уникальными для вас.
4 типа поисковых систем
Основные поисковые системы, такие как Google, могут быть первыми, когда мы думаем о поисковых системах, но есть и другие типы поисковых систем, которые позволяют нам перемещаться по Интернету.
- Основные поисковые системы . Основные поисковые системы, такие как Google, Bing и Yahoo! все они бесплатны для использования и поддерживаются онлайн-рекламой. Все они используют варианты одной и той же стратегии (сканирование, индексирование и ранжирование), чтобы вы могли осуществлять поиск по всему Интернету.
- Частные поисковые системы . В последнее время популярность частных поисковых систем возросла из-за проблем с конфиденциальностью, вызванных практикой сбора данных основных поисковых систем. К ним относятся анонимные поисковые системы с поддержкой рекламы, такие как DuckDuckGo, и частные поисковые системы без рекламы, такие как Neeva.
- Вертикальные поисковые системы . Вертикальный поиск или специализированный поиск — это способ сузить область поиска до одной тематической категории, а не всей сети. Примеры вертикальных поисковых систем включают:
- Панель поиска на торговых сайтах, таких как eBay и Amazon
- Google Scholar, которая индексирует научную литературу по публикациям
- Доступные для поиска сайты социальных сетей и приложения, такие как Pinterest
- Вычислительные поисковые системы . WolframAlpha — это пример вычислительной поисковой системы, предназначенной для ответов на вопросы, связанные с математикой и естественными науками.
Популярные поисковые системы
Технологии поиска сильно изменились с момента разработки первой поисковой системы в 1989 году. Вот основные игроки на сегодняшний день.
- Гугл . Есть только одна поисковая система, настолько популярная, что она стала синонимом глагола «искать». Имея 92,24 процента доли мирового рынка поисковых систем, Google на сегодняшний день является крупнейшей и самой популярной поисковой системой в мире. Чистый внешний вид Google и система ранжирования на основе обратных ссылок заслужили расположение пользователей в 99-м.0s, и он сохранил свое господство благодаря почти постоянным инновациям и множеству эксклюзивных соглашений с производителями устройств, операторами беспроводной связи и разработчиками браузеров, которые направляют около 60 процентов интернет-поиска прямо в Google.
- Бинг . На поисковую систему Microsoft Bing в настоящее время приходится 2,29 процента доли мирового рынка, что делает ее второй по величине поисковой системой в мире. С момента своего запуска в 2009 году Bing размещал фотографии на своей главной странице, что резко контрастировало со строгой целевой страницей Google.
- Yahoo! Комбинация веб-портала Yahoo!, новостного сайта и поисковой системы составляет 1,52 процента доли рынка поисковых систем. С момента своего скромного появления в качестве «Путеводителя Джерри и Дэвида по Всемирной паутине» Yahoo! стал крупной поисковой системой и был продан Verizon за 4,48 миллиарда долларов в 2017 году.
- Baidu . Baidu — китайская поисковая система, на долю которой приходится 1,48% мирового рынка поисковых систем. Как и Google, Baidu начиналась как поисковая система, а сейчас является одной из крупнейших технологических компаний Китая.
- DuckDuckGo . DuckDuckGo — это частная поисковая система с поддержкой рекламы, на долю которой в настоящее время приходится 0,58 процента доли мирового рынка.
В 2020 году Neeva объявила о создании первой в мире поисковой системы с частной подпиской без рекламы.
Краткая история поисковых систем
На заре Интернета было так мало веб-серверов (в основном, компьютеров, на которых размещались веб-сайты), что Тим Бернерс-Ли, создатель Всемирной паутины, держал их все на одном список. Используя этот список Бернерса-Ли, вы можете легко получить доступ к каждой существующей веб-странице — в основном к информационным сайтам, управляемым университетами или государственными организациями.
Сегодня существуют миллиарды веб-страниц и нет централизованной системы для их отслеживания, поэтому мы полагаемся на поисковые системы для поиска информации в Интернете.
- 1989: Будучи аспирантом Университета Макгилла, Алан Эмтадж создал первую общедоступную поисковую систему ARCHIE (архив без буквы «V») в 1989 году. Программа Emtage позволила ему легче находить файлы на FTP-сайтах (протокол передачи файлов), которые появились раньше Интернета.
- 1994 : Дэвид Фило и Джерри Янг основали Yahoo! как веб-каталог своих любимых сайтов. К концу 1990-х Yahoo! работал как веб-портал — целевая страница для доступа к различным функциям Интернета — и как поисковая система.
- 1995 : AltaVista была запущена как первая поисковая система на естественном языке, что означает, что она принимала запросы, написанные на разговорном языке, а не только ключевые слова. В то время в Интернете было не менее 30 миллионов страниц, около 20 миллионов из которых были проиндексированы AltaVista.
- 1996 : запущен сервис Ask Jeeves, который побуждал пользователей формулировать свои запросы в виде вопросов. Ask Jeeves использовал редакторов-людей для сопоставления результатов с самыми популярными запросами. Сегодня около 8 процентов поисковых запросов записываются в виде вопросов, и Ask Jeeves (теперь Ask.com) больше не считается основной поисковой системой.
- 1998 : Ларри Пейдж и Сергей Брин основали Google на основе своей поисковой системы 1996 года Backrub, которая использовала обратные ссылки как способ ранжирования результатов поиска. В то время у Google был очень простой интерфейс без рекламы с синими ссылками, за которыми следовало двухстрочное описание каждого сайта. (Реклама появится позже, в 2000 году.)
- 2009 : Microsoft Bing был запущен как ребрендинг MSN/Live search, первоначально запущенного в 1998 году. Вскоре после своего запуска Bing стал основой для Yahoo! поисковый движок.
Основные инновации в технологии поисковых систем
С момента запуска первых поисковых систем в 1990-х годах лидеры отрасли вносили инновации в поисковые технологии, чтобы удовлетворять все больше и больше потребностей с помощью единого интерфейса. Теперь нам не обязательно покидать страницу результатов поисковой системы, чтобы получить ответы, которые мы ищем. Вот некоторые из основных моментов в эволюции технологии поисковых систем.
- Машинное обучение : Microsoft разработала и запустила RankNet в 2005 году, которая использовала машинное обучение для ранжирования релевантных результатов поиска. Версия RankNet позже будет использоваться Microsoft Bing. Google представил свой собственный компонент машинного обучения, RankBrain, в 2015 году.
- Универсальный поиск : В 2007 году Google запустил универсальный поиск, который интегрировал некоторые из своих различных инструментов вертикального поиска (таких как изображения, новости, видео, карты и книги). ) в одну страницу результатов поисковой системы мультимедиа (SERP). Когда вы ищете «изображения заката» на Google.com и видите коллекцию изображений в верхней части страницы результатов вместо списка ссылок, это универсальный поиск. До универсального поиска вам приходилось заходить в Google Images, чтобы найти изображения.
- Локализованные результаты: В 2012 году Google начал показывать локальные результаты (на основе IP-адреса пользователя) для общих запросов. Это означало, что при поиске «футболки» Google мог предложить ближайший принтер для печати футболок, тогда как раньше только поиск «футболки рядом с Бруклином» запускал интеграцию с Картами. В 2016 году Google начал использовать службы определения местоположения смартфона и позиционирование Wi-Fi (которое использует местоположение ближайших точек доступа, чтобы точно определить ваше местоположение), чтобы предоставить вам локальные результаты на вашем точное местоположение.
- Hummingbird : Google представил свой алгоритм Hummingbird в 2013 году, который выходит за рамки поисковых запросов пользователя, используя контекст, чтобы попытаться определить его намерения.