Поисковой системой не являются – Поисковые системы Google, Yahoo, Яндекс и другие поисковики России и зарубежья: сходства, отличия, особенности продвижения

Содержание

Обзор поисковых систем, история создания, рейтинг поисковиков в Рунете

Не однократно каждому из нас приходилось пользоваться поисковиками в Интернете для поиска информации и прочих мелочей. Мы открываем привычный и удобный для нас веб-сервис, не задумываясь, что на самом деле в Интернете есть и другие поисковые системы.

Поисковые системы Поисковики Рунета

Некоторые считают, что поисковики – это небольшие сайты которые просто ищут другие веб-ресурсы. На самом деле в их основе лежат сложные алгоритмы ранжирования и базы данных с индексными подборками к различным запросам.

Над развитием данных веб-сервисов и алгоритмов работают огромные компании с сотнями сотрудников. Они стараются сделать поиск информации быстрым и удобным для людей, а также хорошенько заработать на контекстно-медийной рекламе и других сервисах.

Популярность в России, рейтинг

Проведем анализ за 2019 год
(данные с 01.01.2019 г. по 01.01.2020 г.)

Борьба продолжается. Последнее время Гугл хорошенько теснит Яндекс отбирая у “Яши” пользователей Рунета.

По данным портала SEO-Auditor ознакомимся со следующей веб-статистикой:

Рейтинг поисковых систем за 2019 год

Сам Яндекс (radar.metrika.yandex) предоставляет данные в свою пользу, его доля по данным Яндекс.Радар – 56,31%:

Доли поисковиков за 1 полугодие 2019 года

 

Интересный факт: мобильная аудитория в 2019 году обогнала десктопную

По данным Mediascope

Отношение мобильной аудитории к десктопной в 2019 году

 

Какая картина складывалась в предыдущие годы?

Доля поисковиков в 2018 году:

По данным портала SEO-Auditor:

Рейтинг поисковых систем за 2018 год

Статистика за 2018 год – по данным Яндекс.Радар:

Доли поисковиков за 2018 год

Доля поисковиков в 2017 году:

По данным портала SEO-Auditor:

Рейтинг поисковых машин за 2017 год

Статистика по месяцам – 2017 год:

Рейтинг поисковиков по месяцам 2017 года

Иная ситуация за 2017 год сложилась по данным Яндекс.Радар:

Сам Яндекс (radar.metrika.yandex) предоставляет данные в свою пользу, его доля – 55,12%:

Яндекс занимает 1 место в 2017 году

Статистические данные портала SEO-Auditor

за 2016 год:

Поисковики рунета за 2016 год

Статистические данные портала SEO-Auditor за 2015 год:

Поисковики в 2015 году

По данным liveinternet, наиболее популярным среди пользователей Рунета является Яндекс. В 2014 году его используют около 56% россиян. Хотя за предыдущие 2 года Яндекс теряет позиции, видимо из-за увеличения пользователей интернет-браузера Chrome от Google, который навязывает свой поисковик по умолчанию, а также популяризацией других сервисов и партнерских программ с Гугл.

Данные за 1 полугодие 2014 года

По данным портала “Вести Экономика” доля рынка Интернет-поиска в России в начале 2013 года выглядит так:

Статистика поисковиков - 2013

Сведения на начало второго полугодия 2013 года  опубликованы на веб-ресурсе “Вести Экономика”:

Доля поисковых систем - 1 полугодие 2013

Рейтинг поисковых машин в 2012 году:

Рейтинг

Немного о самих поисковиках

Яндекс

yandex Разработка системы Яндекс началась еще в 80-х годах, но официальным Днем Рождения считается 23 сентября 1997 года, когда он впервые был анонсирован в Москве.

Само слово «Яндекс» не имеет конкретного значения. Это слово придумали директоры системы, Илья Сегалович и Аркадий Волож. Выписывая производные, описывающие технологию системы (от «индекс»), Илья пришел к такому варианту, как «yandex».

Яндекс еще долго дорабатывали для пользователей Рунета, затем он вышел на международный рынок начав свою работу в Турции (20 сентября 2011 года).

При создании сайтов любого уровня сложности всегда необходимо учитывать рекомендации Яндекса и других систем поиска к разработке интернет-проектов.

Google

google Второй самой используемой поисковой системой является Гугл, который основательно занял 2 место рейтинга. Его предпочитают около 40-48% Россиян. Гугл, как и Яндекс, разрабатывался примерно в одно время. Правда, анонсирован Гугл был немного позже – в 1998 году.

Название взяли из слова «googol» – это математический термин, который обозначает число 10 в сотой степени – и переделали в «Google». Начиная с 1998 года, поисковая система потихоньку вклинивается в другие страны. Уже в 2001 Гугл становится доступным на 26-ти языках. Все поисковики из миллионов веб-ресурсов стараются выбрать  самые качественные и интересные – как разработать такие сайты?

Мейл ру

mail Третье место рейтинга занимает Mail.ru – им пользуются всего лишь 3-5%. Несмотря на то, что сама почта mail.ru достаточно популярна, поисковой системе мейла предпочитают Гугл и Яндекс. Работа Мейла началась с 2001 года с запуска одноименной почты. Затем, развиваясь, она росла – сейчас в мейле помимо почты и поисковика есть куча приложений, дополнений, игр, собственная социальная сеть и т.д.

С 2007 года Майл пользовался поисковыми технологиями Яндекса. С 1 января 2010 года до июля 2013 года портал Mail.ru использовал алгоритмы ранжирования и механизмы контекстной рекламы Гугла. Не так давно (01.07.2013 г.) Mail полностью отказался от сторонних алгоритмов в пользу собственного разработанного движка “Go-Go”.

Рамблер

rambler
Еще меньше населения (1%) используют такую поисковую систему, как Rambler. Возможно, даже не все про нее слышали и вообще когда-либо ее использовали. Тем не менее, Rambler является одним из самых ранних поисковиков. Рамблер начали разрабатывать еще в 1991 году, но основные этапы развития системы приходятся на 1996 год.

ramblerПрочитать статью о продвижении сайтов

Сама система начала работать уже 8 октября 1996 года. Именно с этого момента начинается история Рунета, его распространение среди жителей России и его развитие. Но вот только в отличие от Яндекса или Гугла, слово «Рамблер» не несет никакой смысловой нагрузки и какого-либо смысла. Название поисковику дал Дмитрий Крюков, и выбрал он имя системы достаточно просто – открыл словарь и увидел понравившееся слово. «Rambler» переводится как бродяга, странник.

Рамблер проиграл войну поисковиков и пытается развиваться в других направлениях, создавая различные проекты и веб-сервисы.

Другие игроки

В Рунете существует еще множество других поисковых систем, но вот только ими уже мало кто пользуется. Да и зачем кому-то искать малоизвестный поисковик, когда проще все найти через Яшу или Гугл, ну или прибегнуть к Мейлу. Все они ведут борьбу с СЕО-компаниями и частными вебмастерами – оптимизаторами, которые пытаются повлиять на результаты выдачи.

Интересный факт

Хотя интернет-браузеры не являются поисковыми системами, зато они плотно с ними сотрудничают (компании поиска сами разрабатывают браузеры). К примеру, браузер Chrome – от Гугла, у Яндекса – Яндекс.Браузер, а другие (Firefox, Opera и т.д.) – взаимодействуют с Яндексом или Гуглом.

Думаю, статистика популярности браузеров в России, предоставленная сервисом gs.statcounter.com, также будет интересна. Данные за 2018 год.

Доли браузеров за 2017 год в Рунете

Доля рынка социальных сетей в России, 2018 г.

Тем, кто интересуется глобальной статистикой Интернета, осмелюсь предположить, что также будет интересен рынок социальных сетей.

Доли браузеров за 2017 год в Рунете

Читайте также:

Тест: Изучение компьютера - Информатика 8 класс

Проверить свои знания в сфере компьютера .

Информатика 8 класс | Автор: Конькова М. и Климова Е. | ID: 5006 | Дата: 18.5.2015

Вопрос № 5

В какой строке единицы измерения информации расположены по возрастанию?

гигабайт, мегабайт, килобайт, байт, бит
бит, байт, мегабайт, килобайт, гигабайт
байт, бит, килобайт, мегабайт, гигабайт
бит, байт, килобайт, мегабайт, гигабайт
Вопрос № 8

По способу восприятия человеком различают следующие виды информации

текстовую, числовую, графическую, табличную и пр.
научную, социальную, политическую, экономическую, религиозную и пр.
обыденную, производственную, техническую, управленческую
визуальную, аудиальную, тактильную, обонятельную, вкусовую

Получение сертификата
о прохождении теста

Несколько слов о том, как работают роботы поисковых машин

Эта статья вовсе не является попыткой объяснить, как работают поисковые машины вообще (это know-how их производителей). Однако, по моему мнению, она поможет понять как можно управлять поведением поисковых роботов (wanderers, spiders, robots — программы, с помощью которых та или иная поисковая система обшаривает сеть и индексирует встречающиеся документы) и как правильно построить структуру сервера и содержащихся на нем документов, чтобы Ваш сервер легко и хорошо индексировался.

Первой причиной того, что я решился написать эту статью, явился случай, когда я исследовал файл логов доступа к моему серверу и обнаружил там следующие две строки:

lycosidae.lycos.com - - [01/Mar/1997:21:27:32 -0500] "GET /robots.txt HTTP/1.0" 404 -
lycosidae.lycos.com - - [01/Mar/1997:21:27:39 -0500] "GET / HTTP/1.0" 200 3270

то есть Lycos обратился к моему серверу, на первый запрос получил, что файла /robots.txt нет, обнюхал первую страницу, и отвалил. Естественно, мне это не понравилось, и я начал выяснять что к чему.

Оказывается, все «умные» поисковые машины сначала обращаются к этому файлу, который должен присутствовать на каждом сервере. Этот файл описывает права доступа для поисковых роботов, причем существует возможность указать для различных роботов разные права. Для него существует стандарт под названием Standart for Robot Exclusion.

По мнению Луиса Монье (Louis Monier, Altavista), только 5% всех сайтов в настоящее время имеет не пустые файлы /robots.txt если вообще они (эти файлы) там существуют. Это подтверждается информацией, собранной при недавнем исследовании логов работы робота Lycos. Шарль Коллар (Charles P.Kollar, Lycos) пишет, что только 6% от всех запросов на предмет /robots.txt имеют код результата 200. Вот несколько причин, по которым это происходит:

  • люди, которые устанавливают Веб-сервера, просто не знают ни об этом стандарте, ни о необходимости существования файла /robots.txt
  • не обязательно человек, инсталлировавший Веб-сервер, занимается его наполнением, а тот, кто является вебмастером, не имеет должного контакта с администратором самой «железяки»
  • это число отражает число сайтов, которые действительно нуждаются в исключении лишних запросов роботов, поскольку не на всех серверах имеется такой существенный трафик, при котором посещение сервера поисковым роботом, становится заметным для простых пользователей

Файл /robots.txt предназначен для указания всем поисковым роботам (spiders) индексировать информационные сервера так, как определено в этом файле, т.е. только те директории и файлы сервера, которые НЕ описаны в /robots.txt. Это файл должен содержать 0 или более записей, которые связаны с тем или иным роботом (что определяется значением поля agent_id), и указывают для каждого робота или для всех сразу что именно им НЕ НАДО индексировать. Тот, кто пишет файл /robots.txt, должен указать подстроку Product Token поля User-Agent, которую каждый робот выдает на HTTP-запрос индексируемого сервера. Например, нынешний робот Lycos на такой запрос выдает в качестве поля User-Agent: Lycos_Spider_(Rex)/1.0 libwww/3.1.

Если робот Lycos не нашел своего описания в /robots.txt — он поступает так, как считает нужным. Как только робот Lycos «увидел» в файле /robots.txt описание для себя — он поступает так, как ему предписано.

При создании файла /robots.txt следует учитывать еще один фактор — размер файла. Поскольку описывается каждый файл, который не следует индексировать, да еще для многих типов роботов отдельно, при большом количестве не подлежащих индексированию файлов размер /robots.txt становится слишком большим. В этом случае следует применять один или несколько следующих способов сокращения размера /robots.txt:

  • указывать директорию, которую не следует индексировать, и, соответственно, не подлежащие индексированию файлы располагать именно в ней
  • создавать структуру сервера с учетом упрощения описания исключений в /robots.txt
  • указывать один способ индексирования для всех agent_id
  • указывать маски для директорий и файлов

Общее описание формата записи.

[ # comment string NL ]* 

User-Agent: [ [ WS ]+ agent_id ]+ [ [ WS ]* # comment string ]? NL 

[ # comment string NL ]* 

Disallow: [ [ WS ]+ path_root ]* [ [ WS ]* # comment string ]? NL

[

# comment string NL

| 

Disallow: [ [ WS ]+ path_root ]* [ [ WS ]* # comment string ]? NL

]* 

[ NL ]+

Описание параметров, применяемых в записях /robots.txt

[…]+ Квадратные скобки со следующим за ними знаком + означают, что в качестве параметров должны быть указаны один или несколько терминов.

Например, после «User-Agent:» через пробел могут быть указаны один или несколько agent_id.

[…]* Квадратные скобки со следующим за ними знаком * означают, что в качестве параметров могут быть указаны ноль или несколько терминов.

Например, Вы можете писать или не писать комментарии.

[…]? Квадратные скобки со следующим за ними знаком ? означают, что в качестве параметров могут быть указаны ноль или один термин.

Например, после «User-Agent: agent_id» может быть написан комментарий.

..|.. означает или то, что до черты, или то, что после.

WS один из символов — пробел (011) или табуляция (040)

NL один из символов — конец строки (015) , возврат каретки (012) или оба этих символа (Enter)

User-Agent: ключевое слово (заглавные и прописные буквы роли не играют).

Параметрами являются agent_id поисковых роботов.

Disallow: ключевое слово (заглавные и прописные буквы роли не играют).

Параметрами являются полные пути к неиндексируемым файлам или директориям

# начало строки комментариев, comment string — собственно тело комментария.

agent_id любое количество символов, не включающих WS и NL, которые определяют agent_id различных поисковых роботов. Знак * определяет всех роботов сразу.

path_root любое количество символов, не включающих WS и NL, которые определяют файлы и директории, не подлежащие индексированию.

Каждая запись начинается со строки User-Agent, в которой описывается каким или какому поисковому роботу эта запись предназначается. Следующая строка: Disallow. Здесь описываются не подлежащие индексации пути и файлы. КАЖДАЯ запись ДОЛЖНА иметь как минимум эти две строки (lines). Все остальные строки являются опциями. Запись может содержать любое количество строк комментариев. Каждая строка комментария должна начинаться с символа # . Строки комментариев могут быть помещены в конец строк User-Agent и Disallow. Символ # в конце этих строк иногда добавляется для того, чтобы указать поисковому роботу, что длинная строка agent_id или path_root закончена. Если в строке User-Agent указано несколько agent_id, то условие path_root в строке Disallow будет выполнено для всех одинаково. Ограничений на длину строк User-Agent и Disallow нет. Если поисковый робот не обнаружил в файле /robots.txt своего agent_id, то он игнорирует /robots.txt.

Если не учитывать специфику работы каждого поискового робота, можно указать исключения для всех роботов сразу. Это достигается заданием строки User-Agent: *

Если поисковый робот обнаружит в файле /robots.txt несколько записей с удовлетворяющим его значением agent_id, то робот волен выбирать любую из них.

Каждый поисковый робот будет определять абсолютный URL для чтения с сервера с использованием записей /robots.txt. Заглавные и строчные символы в path_root ИМЕЮТ значение.

Пример 1:

User-Agent: * 

Disallow: / 

User-Agent: Lycos 

Disallow: /cgi-bin/ /tmp/

В примере 1 файл /robots.txt содержит две записи. Первая относится ко всем поисковым роботам и запрещает индексировать все файлы. Вторая относится к поисковому роботу Lycos и при индексировании им сервера запрещает директории /cgi-bin/ и /tmp/, а остальные — разрешает. Таким образом сервер будет проиндексирован только системой Lycos.

Пример 2

User-Agent: Copernicus Fred 

Disallow: 

User-Agent: * Rex 

Disallow: /t

В примере 2 файл /robots.txt содержит две записи. Первая разрешает поисковым роботам Copernicus и Fred индексировать весь сервер. Вторая — запрещает всем и осебенно роботу Rex индексировать такие директории и файлы, как /tmp/, /tea-time/, /top-cat.txt, /traverse.this и т.д. Это как раз случай задания маски для директорий и файлов.

Пример 3:

# This is for every spider! 

User-Agent: * 

# stay away from this 

Disallow: /spiders/not/here/ #and everything in it 

Disallow: # a little nothing 

Disallow: #This could be habit forming! 

# Don't comments make code much more readable!!!

В примере 3 — одна запись. Здесь всем роботам запрещается индексировать директорию /spiders/not/here/, включая такие пути и файлы как /spiders/not/here/really/, /spiders/not/here/yes/even/me.html. Однако сюда не входят /spiders/not/ или /spiders/not/her (в директории ‘/spiders/not/’).

Незаконченность стандарта (Standart for Robot Exclusion)

К сожалению, поскольку поисковые системы появились не так давно, стандарт для роботов находится в стадии разработки, доработки, ну и т.д. Это означает, что в будущем совсем необязательно поисковые машины будут им руководствоваться.

Увеличение трафика

Эта проблема не слишком актуальна для российского сектора Internet, поскольку не так уж много в России серверов с таким серьезным трафиком, что посещение их поисковым роботом будет мешать обычным пользователям. Собственно, файл /robots.txt для того и предназначен, чтобы ограничивать действия роботов.

Не все поисковые роботы используют /robots.txt

На сегодняшний день этот файл обязательно запрашивается поисковыми роботами только таких систем как Altavista, Excite, Infoseek, Lycos, OpenText и WebCrawler.

Начальный проект, который был создан в результате соглашений между программистами некоторого числа коммерческих индексирующих организаций (Excite, Infoseek, Lycos, Opentext и WebCrawler) на недавнем собрании Distributing Indexing Workshop (W3C) , ниже.

На этом собрании обсуждалось использование мета-тагов HTML для управления поведением поисковых роботов, но окончательного соглашения достигнуто не было. Были определены следующие проблемы для обсуждения в будущем:

  • Неопределенности в спецификации файла /robots.txt
  • Точное определение использования мета-тагов HTML, или дополнительные поля в файле /robots.txt
  • Информация «Please visit»
  • Текущий контроль информации: интервал или максимум открытых соединений с сервером, при которых можно начинать индексировать сервер

Этот таг предназначен для пользователей, которые не могут контролировать файл /robots.txt на своих веб-сайтах. Таг позволяет задать поведение поискового робота для каждой HTML-страницы, однако при этом нельзя совсем избежать обращения робота к ней (как возможно указать в файле /robots.txt).

<META NAME="ROBOTS" CONTENT="robot_terms">

robot_terms — это разделенный запятыми список следующих ключевых слов (заглавные или строчные символы роли не играют): ALL, NONE, INDEX, NOINDEX, FOLLOW, NOFOLLOW.

NONE — говорит всем роботам игнорировать эту страницу при индексации (эквивалентно одновременному использованию ключевых слов NOINDEX, NOFOLLOW).

ALL — разрешает индексировать эту страницу и все ссылки из нее (эквивалентно одновременному использованию ключевых слов INDEX, FOLLOW).

INDEX — разрешает индексировать эту страницу

NOINDEX — неразрешает индексировать эту страницу

FOLLOW — разрешает индексировать все ссылки из этой страницы

NOFOLLOW — неразрешает индексировать ссылки из этой страницы

Если этот мета-таг пропущен или не указаны robot_terms, то по умолчанию поисковый робот поступает как если бы были указаны robot_terms= INDEX, FOLLOW (т.е. ALL). Если в CONTENT обнаружено ключевое слово ALL, то робот поступает соответственно, игнорируя возможно указанные другие ключевые слова.. Если в CONTENT имеются противоположные по смыслу ключевые слова, например, FOLLOW, NOFOLLOW, то робот поступает по своему усмотрению (в этом случае FOLLOW).

Если robot_terms содержит только NOINDEX, то ссылки с этой страницы не индексируются. Если robot_terms содержит только NOFOLLOW, то страница индексируется, а ссылки, соответственно, игнорируются.

<META NAME="KEYWORDS" CONTENT="phrases">

phrases — разделенный запятыми список слов или словосочетаний (заглавные и строчные символы роли не играют), которые помогают индексировать страницу (т.е. отражают содержание страницы). Грубо говоря, это те слова, в ответ на которые поисковая система выдаст этот документ.

<META NAME="DESCRIPTION" CONTENT="text">

text — тот текст, который будет выводиться в суммарном ответе на запрос пользователя к поисковой системе. Сей текст не должен содержать тагов разметки и логичнее всего вписать в него смысл данного документа на пару-тройку строк.

Некоторые коммерческие поисковые роботы уже используют мета-таги, позволяющие осуществлять «связь» между роботом и вебмастером. Altavista использует KEYWORDS мета-таг, а Infoseek использует KEYWORDS и DESCRIPTION мета-таги.

Вебмастер может «сказать» поисковому роботу или файлу bookmark пользователя, что содержимое того или иного файла будет изменяться. В этом случае робот не будет сохранять URL, а броузер пользователя внесет или не внесет это файл в bookmark. Пока эта информация описывается только в файле /robots.txt, пользователь не будет знать о том, что эта страница будет изменяться.

Мета-таг DOCUMENT-STATE может быть полезен для этого. По умолчанию, этот мета-таг принимается с CONTENT=STATIC.

<META NAME="DOCUMENT-STATE" CONTENT="STATIC"> 

<META NAME="DOCUMENT-STATE" CONTENT="DYNAMIC">

Генерируемые страницы — страницы, порождаемые действием CGI-скриптов. Их наверняка не следует индексировать, поскольку если попробовать провалиться в них из поисковой системы, будет выдана ошибка. Что касается зеркал, то негоже, когда выдаются две разные ссылки на разные сервера, но с одним и тем же содержимым. Чтобы этого избежать, следует использовать мета-таг URL с указанием абсолютного URL этого документа (в случае зеркал — на соответствующую страницу главного сервера).

<META NAME="URL" CONTENT="absolute_url">
  1. Charles P.Kollar, John R.R. Leavitt, Michael Mauldin, Robot Exclusion Standard Revisited, www.kollar.com/robots.html
  2. Martijn Koster, Standard for robot exclusion, info.webcrawler.com/mak/projects/robots/robots.html

Статистика использования Яндекса и Google в 2019 году.

Статистика поисковых систем 2019 года

Статистика поисковых систем является важнейшим фактором, определяющим стратегию продвижения сайта. Действительно, важно знать,аудиторию пользователей поисковых систем, тем самым понимая, продвижение в какой поисковой системе (Яндекс, Google, Bing и т.д. ) более «выгодно», принесет больше посетителей, конвертаций, прибыли. Неверно выбранная стратегия продвижения может ощутимо повлиять на финансовые затраты при продвижении проектов.

Предыдущее исследование проводилось в июне прошлого года и показало возрастающую долю поисковой системы Google и падение доли поисковой системы  Яндекс. Давайте оценим, что произошло за текущий год.

1. Методология исследования

Сырые данные берутся из открытого доступа статистики Liveinternet. К сожалению, число сайтов, размещающих счетчик LI постепенно снижается. Так в 2016 году были данные на 200 млн уникальных пользователей ежедневно, а в текущем, 2019 году уже на 100 млн уникальных пользователей. Но тем не менее, данные статистики достаточны и не ангажированны, так как слабо зависят от «хотелок» поисковых систем.

Данные делятся по сегментам пользователей. Наиболее интересны данные для русскоязычного сегмента, но будут приводится сравнительные данные для иных стран.

2. Динамика трафика из поисковых систем Яндекс и Google

Было проведено исследование долей поисковых систем в генерации трафика на сайты русскоязычного сегмента в нескольких разрезах.

2.1. Переходы из Яндекса и Google русскоязычных пользователей

Здесь приведены данные о количестве среднесуточных переходов за август месяц каждого года всех русскоговорящих пользователей на сайты с установленной статистикой  LI из поисковых систем Яндекс и Google.  Эти данные не учитывают региональную принадлежность посетителей.

Переходы русскоязычных пользователей из поисковых систем

Как видно, доля русскоязычных пользователей Google ежегодно растет, на август 2019 года составляет 56,4% и значительно превышает долю Яндекса в 41%. Это обусловлено тем, что в русскоговорящих странах ближнего зарубежья, Яндекс не используется как поисковая система, что будет продемонстрировано ниже.

Динамика показателя приведена на графике:

График динамики и тренда русскоязычных пользователей Яндекса и Google

Как мы можем наблюдать, линия тренда у Google — восходящая, у Яндекса — нисходящая.

Вывод: В среде русскоговорящих пользователей более популярным является Google, при этом его популярность возрастает.

2.2. Динамика долей органического трафика для пользователей из России

Давайте исследуем, какой поисковой системой пользуются чаще в России. Сначала воспользуемся данными LI с ограничением — регион: «Россия».

Популярность поисковых систем у жителей России

Если еще в прошлом году Яндекс был более популярен среди пользователей России, то уже в текущем, 2019 году 50,7% россиян использовали Google в качестве поисковой системы. Доля Яндекса в этом году составила всего 46,6% процентов.

Динамика роста популярности поисковой системы Google в регионе «Россия» отчетливо прослеживается на графике.

Динамика роста популярности Google в регионе Россия

Отчетливо виден возрастающий тренд для Google и ниспадающий тренд для Яндекса.

Благодаря данным LI, можно отследить соотношение пользователей Яндекса и Google в России по регионам.

SEO Монстр 2020

Единственное полноценное руководство по продвижению сайтов.

Изучить…

Соотношение пользователей поисковых систем в Москве

Как это не странно, среди пользователей Москвы лидирует Яндекс. Доля использования этой поисковой системы составляет 49,7%, тогда как Google отстает на 2% с долей пользователей в 47,7%.

В Питере, как более прогрессивном городе, уверенно лидирует Google. Их доля составляет 53,2%, в то время как на Яндекс приходится всего 44,6%.

Пользователи поисковых систем в Питере

Далее, без скриншотов, распределение пользователей в субъектах России (первая доля — Google, вторая — Яндекс):

  • Казань: 56,1% / 40,6%
  • Екатеринбург: 52,9% /44,4%
  • Калининград: 62,1% / 32,3%
  • Кемерово: 45,6% / 49,8%
  • Новосибирск: 57,8% / 40,7%
  • Уфа: 50,2% / 46,5%
  • Владивосток: 67,5% / 30,3%

Таким образом, чем дальше от первопрестольной, тем выше доля использования Google и ниже — Яндекса. Удивительным образом из этой статистики выбивается Кемерово. Там в единственном из регионов доля пользователей Яндекса превышает пользователей Google.

Такова статистика запросов Яндекс и Гугл в России на август 2019 года.  Перейдем теперь к странам ближнего зарубежья.

2.3. Использование поисковых систем в Белоруссии

Традиционно, Google в Белоруссии занимает лидирующие места. Посмотрим какова доля поисковых систем в 2019 году по данным LI.

Популярность поисковых систем в Белоруссии

Как мы видим, в Белоруссии в августе 2019 года 72,8% пользователей выбрало Google для осуществления поиска. Доля Яндекса составляет всего 24,8%.

2.4. Популярность поисковых систем в Казахстане

В Казахстане картина для Яндекса еще более удручающая.

Поисковые системы в Казахстане

Яндексу принадлежит доля в 16,1% от всех поисковых запросов, тогда как Google  — 78,9%. Интересно, что поиск Mail.ru пользуется некоторой популярностью среди жителей Казахстана. Им воспользовалось 4,9% пользователей.

2.5. Использование поисковых систем на Украине

После запрета Яндекса и его сервисов на Украине, доля использования этой ПС неуклонно снижается.

Использование ПС на Украине

Помогу решить проблему…

 

Безусловным лидером является Google. 92,7% пользователей Интернета используют его для поиска. Доля Яндекса к августу 2019 года составляет всего 6,3%.

А теперь сравним данные LI с лукавыми данными Ротора

2.6. Данные Яндекс Радара по популярности поисковых систем

Итак, я выбрал настройки — данные за август 2019 года, все платформы и все операционные системы. И вот что я вижу:

Данные Яндекс Радара

По данным радара, 56% пользователей используют Яндекс, а Гугл только 40,69%. Данные абсолютно «не бьются» с цифрами от LI и выглядят явно подкрученными в сторону Яндекса.

Возможно Яндекс использует свои хитрые методики подсчета доли пользователей, по которым выходит что они являются лидером среди иных поисковых систем.

3. Мобильные и десктопные пользователи

Рассмотрим распределение десктопных и мобильных пользователей в различных срезах. Как всегда на помощь нам приходит статистика LI. Исследование будем проводить в основном для пользователей из России.

3.1. Распределение пользователей по устройствам

Сведем средние данные за август 2019 года по пользователям из региона «Россия» в единую таблицу. Здесь:

  • Посетители — количество уникальных посетителей сайтов.
  • Сессия — серия из нескольких просмотров сайтов от одного посетителя, причем между соседними просмотрами должно пройти не более 15 минут.
  • Средняя длительность — длительность сессий в минутах (промежуток времени между первым и последним просмотром в сессии. Длительность сессии из одного просмотра равна нулю).
  • Просмотров на посетителя — среднее количество просмотров, совершаемое одним посетителем.
Распределение пользователей по устройствам

Итак, 64,4% пользователей в России в августе 2019 года для доступа к сайтам используют мобильные устройства (телефоны и планшеты). 35,6% посетителей работают в Интернете с персональных компьютеров. Данные приведены усредненные за весь месяц.

Что интересно, «качество» десктопных пользователей намного выше, чем мобильных. С компьютера глубина просмотра сайтов больше в 2 раза, время проведенное на сайте выше раза в полтора, количество сессий с десктопа неизмеримо выше чем с мобильных устройств.

3.2. Использование операционных систем в России

Представим данные по использованию операционных систем посетителями сайтов, на которых установлен счетчик LI.

Операционные системы пользователей Интернета

Как мы видим, 52,2% пользователей в августе 2019 года заходили на сайты, используя устройства с Android на борту.

Что интересно:

  • На каждые 5 пользователей с Android-ом в России приходится 1 «яблочный» пользователь с iOS iPhone.
  • Windows 7  все еще более популярна,чем Windows 10.
  • Windows XP в 16 раз чаще используется, чем Windows Vista.
  • В Белоруссии айфоны используют почти  в 2 раза реже, чем в России —  6,8% против 10,6%. Доля владельцев айфонами на Украине примерно равна доли в России, а в Казахстане доля айфонов выше, чем в России на пару процентов.

12
Сен
2019

  Посмотрите еще

Классификация поисковых систем

Выделяют так называемые тематические каталоги (например, Yahoo!) и автоматические индексы (например, AltaVista), хотя необходимо иметь в виду, что целый ряд поисковых систем занимает некоторое промежуточное положение между этими двумя «полюсами», то есть они содержат в себе элементы обоих этих классов. Каждая из поисковых систем имеет свою обширную базу данных об адресах (местоположении) различных Web-документов, и поиск ссылок на необходимую нам информацию происходит, не в самих Web-документах, а именно в этой базе данных.

Тематические каталоги и автоматические индексы различаются по тому, как формируются и пополняются их базы данных: принимают ли в этом процессе участие люди, или все происходит автоматически.

Тематический каталог представляет пользователю Internet некоторую древовидную структуру категорий (разделов и подразделов), на верхнем уровне которой собраны самые общие понятия, такие как Наука, Искусство, Бизнес и т.п., а элементы самого нижнего уровня представляют собой ссылки на отдельные Web-страницы и серверы вместе с кратким описанием их содержимого. Например, для нахождения информации о состоянии научных исследований по теории суперструн можно спуститься вниз по следующей «лестнице понятий»: Science (Наука) - Physics (Физика) - Theoretical Physics (Теоретическая физика) -Theories (Теории) - String Theories (Теории струн).

Главным достоинством тематических каталогов является большая ценность получаемой пользователем информации, что обеспечивается присутствием «человеческого фактора» в процессе анализа и сортировки новых Web-страниц. С другой стороны, тематические каталоги имеют существенный недостаток, связанный опять же с человеческим фактором, т.к. из-за ограниченных возможностей человека их базы данных охватывают лишь небольшую часть всего информационного Web-пространства (менее 1 %).

В отличие от тематических каталогов, базы данных для автоматических индексов создаются и пополняются полностью автоматически некоторыми специальными, внутренними поисковыми программами-роботами, которые в круглосуточном режиме просматривают Internet-узлы (сайты) в поисках вновь появившихся Web-документов. В отличие от тематических каталогов, автоматические индексы охватывают до 25 % общего Web-пространства.

Некоторой разновидностью поисковых служб являются рейтинговые службы. Они предоставляют клиенту готовый список некоторых ссылок, к которым обращались наиболее часто другие пользователи сети Internet. Такие услуги, в частности, обеспечивает отечественная служба Rambler.

Поиск информации

Все поисковые указателя реализуют несколько алгоритмов поиска.

1.                     Простой поиск. В поле запроса вводится одно или несколько слов, которые могут характеризовать содержание документа. Если это слово одно, то в ответ выдается большое количество ссылок. Если несколько слов, то результат зависит от того, как эти слова введены, а это зависит от каждой конкретной системы.

2.                     Расширенный поиск – подразумевает запрос из группы слов. Слова связываются логическими операторами И, ИЛИ, НЕ  и др.

3.                     Контекстный поиск – реализован не во всех поисковых указателях. Если этот метод есть, то ключевая фраза должна быть заключена в кавычки.

4.                     Специальный поиск -  позволяет найти дополнительную информацию. Например, такие команды позволяют определить, как часто в Сети встречаются гиперссылки, указывающие на какой-то ресурс, с их помощью можно найти ключевые слова, входящие в заголовки Web-страниц и т.п.

Особенности группировки слов в поисковых системах

1.               Поисковые системы по-разному трактуют группы слов, введенные через пробел, как И или как ИЛИ. В большинстве систем в качестве оператора И используется «+» перед словом без пробела.  Большинство российских поисковых систем по умолчанию считают, что два слова должны присутствовать в документе. На Яндексе -  в одном предложении. ИЛИ в системах задается так: Апорт – ИЛИ, Рамблер – OR, Яндекс - .

2.               Прописные буквы. «хлеб» = «ХЛЕБ», но «ХЛЕБ» ≠ «хлеб». Если введены строчные символы, то разыскиваются как строчные, так и прописные символы, но если использованы прописные, то ищется точное совпадение с прописными. В системе Рамблер при индексации все прописные буквы принудительно «понижаются до строчных».

3.               Зарезервированные слова – это слова, которые не учитываются при обработке запроса. К ним относятся неинформативные слова: предлоги, союзы, местоимения, артикли и др. слова малого размера. В некоторых системах зарезервированными могут быть слова, которые часто встречаются, поэтому информативными не являются. Например, в системе, ориентированной на поиск книг слово «книга» будет не информативным. При контекстном поиске необходимо точное (!) соответствие между заказом и результатом поиска. Если поисковая система «зачистила» Web-документы от зарезервированных слов, то с контекстным поиском она справиться не может. На Яндексе и Рамблере  только делают вид контекстного поиска (через кавычки). В России честный контекстный поиск проводит только Апорт, но у него невелика база указателей.

4.               Формы поиска. С 1997 г. Поисковые системы предоставляют услуги по розыску данных, записанных в разных форматах: рисунки, видеофайлов, звуковые клипы и т.д. Для этого следует включить переключатель, соответствующий типу разыскиваемых данных. Яндекс позволяет найти тексты, товары и рисунки, Апорт – плюс MP3, Рамблер – только тексты. Из зарубежных служб подходит для домашнего пользования Fast Search, для делового потребления – Northern Light.

5.               Действия после поиска. Если представлен объемный документ, то можно воспользоваться кнопкой Правка – Найти на этой странице.

Приемы поиска в системе «Яндекс». Поиск по одному слову ведется на основе корня этого слова. Например, если введено слово «снег», то система выдаст документы, в состав которых входят однокоренные слова. Если поиск словоформ не требуется, то его отменить с помощью «!», например, !снегом.

Поиск по группе слов

       Знак «+» пишется слитно со словом без пробела.

       Можно ввести оператор И (&), справа и слева от & должны быть пробелы.

       Если требуется присутствие слов не только в предложении, но и во всем документе, применяется оператор &&.

       «~» - строгое исключение из предложения

       «~~» - исключение из всего документа

       Пример: «Москва Петербург&&+столица»

Поиск с указанием расстояния

       «/n», «/(-n+n)» Оператор NEAR позволяет находить документы, в которых искомые слова находятся близко друг от друга. Например, «Город/+1Москва» = «Город Москва».

       «/n &&» или «/n ~~» , например, «Город/+1&&Москва» - словосочетание будет ли в одном предложении или в соседних.

 Использование скобок. Служат для управления порядком действий. «Москва Петербург& (столица город-герой)».

 Управление ранжированием  производится с использованием весовых коэффициентов. Его можно присваивать любому ключевому слову или выражению, если оно заключено в скобки. «Москва:5 Петербург столица».

Ввод уточняющего слова осуществляется после знаков <-, например «Николай +Еременко<-младший артист+театра».

Задание 1. Создать аннотированный список интернет-ресурсов (библиотек, виртуальных музеев) по информационным технологиям и вычислительной технике. Аннотированный список должен содержать не менее 10 интернет-ресурсов. Задание 2. Создать аннотированный список интернет-ресурсов (библиотек, виртуальных музеев) интернет-ресурсов АПК. Аннотированный список должен содержать не менее 10 интернет-ресурсов.

Содержание отчета

Отчетом является файл, содержащий таблицу, отражающую результаты поиска.

Технология выполнения работы

В текстовом файле создать таблицу, отражающую результаты поиска:

 № п/п

 Адрес интернет-ресурса

 Автор ресурса

 Скриншот главной страницы

 Аннотация

 1.

 

 

 

 

 2.

 

 

 

 

 ........

 

 

 

 

Примечание

1).  Адрес интернет-ресурса представляет собой url-адрес ресурса. Например, http://computerhistory.narod.ru/ 2). Автор ресурса это тот, кто создал ресурс, или кому этот ресурс принадлежит. Например, автор идеи и web-дизайн: Исупов С.,  e-mail:   [email protected] 3). Скриншот главной страницы Например,

Для создания скриншота используют кнопку на клавиатуре PrintScreen (PRTSC). 4). Аннотация отражает чем полезен ресурс, о чем говорится в содержании ресурса, как можно использовать его содержание в учебной и профессиональной деятельности. 3. Сохранить созданный текстовый файл в формате .doc и выложить его в блог.

Вопросы для защиты работы

  1. Охарактеризовать основные функции браузеров.

  2. Охарактеризовать классификацию поисковых систем.

  3. Охарактеризовать алгоритмы поиска информации в сети Интернет.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *