Поиск по сайту как сделать – Расширенный поиск Яндекса (и Гугла) с помощью установленного скрипта или в интерфейсе

Содержание

Яндекс.Поиск для сайта — легко установить и настроить

Учёт морфологии и лексики языка

Яндекс.Поиск для сайта использует все технологии «большого» поиска Яндекса. В том числе учитывает различные формы слов, исправляет ошибки и опечатки, а также неправильную раскладку клавиатуры.

Поиск умеет находить на сайте не только слова, которые встречаются в запросе пользователя, но и их синонимы. Например, если пользователь ищет информацию об игре World of Warcraft, он не обязательно напишет название полностью. Его запрос может выглядеть как [Warcraft], [WoW] или даже [ВоВ]. Но Яндекс поймёт, что нужно человеку, и даст ему верный ответ.

Яндекс.Поиск для сайта понимает разные варианты написания слов, даже неправильные

Настройка синонимов для поиска

Вы можете дополнять основную базу синонимов поиска своими вариантами, специфическими именно для вашего сайта и ваших пользователей. Для этого в Яндекс.Поиске для сайта реализован простой и понятный интерфейс.

В левой колонке добавляйте слова, которые вводят ваши пользователи в поисковой форме, а в правой — соответствующие им синонимы со страниц вашего сайта или сайтов.

В левой колонке добавляйте слова, которые вводят ваши пользователи в поисковой форме, а в правой — соответствующие им синонимы со страниц вашего сайта или сайтов.

Гибкие настройки

Вы сами выбираете, как выглядит поиск Яндекса на вашем сайте. Он может быть ярким элементом интерфейса или не слишком бросающимся в глаза, но заметным помощником в навигации — всё зависит от ваших предпочтений и целей.

От вас зависит, оставить ли стандартное оформление, знакомое всем пользователям Яндекса, или оформить поисковую строку и результаты в своих фирменных цветах.

А если окажется, что стандартных опций оформления поисковой формы и результатов поиска недостаточно, чтобы идеально вписать поиск в дизайн вашего сайта, вы (или ваши разработчики) можете применить собственные CSS-стили к необходимым элементам формы или выдачи. Благодаря этому вы полностью можете управлять внешним видом поиска и дополнять его нужными вам элементами.

Если на найденных документах есть видеоролики или картинки, в результаты поиска будут вставлены их превью. Вы также можете менять оформление этих превью с помощью применения собственных CSS-стилей.

Можно выбрать дизайн поисковой формы для сайта. Например, она может быть со стрелкой.

Результаты поиска открываются или на странице вашего сайта, или на Яндексе — вот так.

Поисковые подсказки

Поиск для сайта, как и основной поиск Яндекса, содержит поисковые подсказки — они ускоряют ввод запроса. Ещё до того, как посетитель сайта наберёт запрос полностью, он сможет перейти к нужному варианту. Так получается гораздо быстрее.

Яндекс создаст набор поисковых подсказок специально для ваших нужд. Они будут учитывать запросы ваших пользователей и содержимое сайтов, по которым вы хотите искать.

Ничего страшного, если пользователи будут ошибаться при вводе запроса. Поиск для сайта умеет исправлять опечатки, грамматические ошибки и неправильную раскладку клавиатуры — в том числе и всё сразу. Исправление работает для запросов на русском, английском, украинском, белорусском, турецком и еще нескольких языках.

Поисковые подсказки умеют исправлять ошибки и опечатки, а также неправильную раскладку клавиатуры.Поисковые подсказки можно редактировать по вашему усмотрению в удобном интерфейсе: вы можете изменять порядок подсказок, удалять ненужные, а также добавлять свои.

Поисковые подсказки умеют исправлять ошибки и опечатки, а также неправильную раскладку клавиатуры.

Вы можете редактировать предложенные Яндексом поисковые подсказки. Например, добавлять новые, изменять порядок существующих и удалять ненужные. С помощью этого инструмента легко подсказать пользователям, на что обратить внимание на вашем сайте.

Уточнения результатов поиска

Вы можете помочь посетителям найти на вашем сайте именно то, что им нужно. Это может быть, например, статья, опубликованная в августе 2010 года, или документ из раздела «Обзоры и тесты». Поиск для сайта предоставляет инструмент для уточнения запросов — можно выбирать раздел сайта, указывать временной промежуток, а также формат или язык документа.

Также у вас есть возможность указать ключевые слова, которые посетитель сможет добавлять к запросу. Например, если ваш сайт связан с играми, то ключевыми могут быть слова «игра», «обзор», «купить» и так далее.

Вот так выглядят уточнения в результатах поиска.Понятный и удобный интерфейс редактирования уточнений.

Вот так выглядят уточнения в результатах поиска.

Поисковые темы

Если вам нужно организовать поиск по множеству различных сайтов или по группе сайтов одной тематики, воспользуйтесь поисковыми темами. Одна поисковая тема может объединять до 100 000 сайтов. Их список легко редактировать с помощью HTTP-запросов.

Подготовьте список сайтов, создайте новую тему и отправьте её на модерацию. После подтверждения темы организуйте поиск на её основе с помощью сервиса Яндекс.Поиск для сайта или Яндекс.XML.

Создать тему: http://site.yandex.ru/themes/new/

Вопросы и ответы — Поиск для сайта. Помощь

Если вы используете обычный Яндекс.Поиск для сайта, вы можете добавить в область поиска до 50 сайтов.

Если вы используете Поиск для интернет-магазинов, область поиска может включать в себя только один сайт — тот, на котором размещен поиск.

Нет. Вы можете настроить поиск только для тех сайтов, права на которые вы можете подтвердить.

Результаты поиска будут вести на главное зеркало сайта.

В поиске будут участвовать только те страницы сайта, которые проиндексированы Яндексом.

Мы не рекомендуем вставлять код формы в HTML-редакторах, входящих в состав в CMS.

Некоторые HTML-редакторы стремятся обезопасить введенный текст перед публикацией. Поэтому, даже если вы переключитесь из режима визуального редактирования в режим редактирования HTML, скрипт формы на отредактированной странице может оказаться нерабочим.

Чтобы гарантировать правильную работу скрипта формы, вставляйте код формы непосредственно в HTML-код нужной страницы. Если ваш сайт использует HTML-шаблоны, то вставьте код формы в файл шаблона.

Вы можете показывать рекламу на странице вашего сайта, содержащей результаты поиска. Для этого вам нужно будет самостоятельно разместить на странице как код результатов поиска, так и необходимые рекламные блоки.

Рекламные блоки можно получить, зарегистрировавшись в Рекламной сети Яндекса.

Нет. Яндекс.Поиск для сайта не поддерживает фреймы.

Внешний вид стандартных форм Поиска для интернет-магазинов не настраивается. Чтобы использовать собственные формы, настройте получение результатов поиска в формате JSON с помощью API Яндекс.Поиска для сайта.

Для веб-хостингов со стандартными настройками IP-адрес сайта узнать можно следующими способами:

  1. Воспользоваться сервисом «IP lookup». Например, вот этим: http://www.whois-service.ru/lookup.

  2. Выполнить в консоли команду

    ping для домена вашего сайта. (Чтобы открыть консоль в Windows, нажмите Windows+R, введите cmd в открывшемся окне и нажмите кнопку ОК).

    Пример вызова команды ping:

    ping example.com

    Система автоматически определит IP-адрес сайта и отобразит его в консоли.

В некоторых случаях IP-адрес сайта не совпадает с IP-адресом сервера, отправляющего ваши HTTP-запросы. В этом случае обратитесь за информацией в службу поддержки вашего хостинга.

Как сделать поиск по сайту

Создавая сайт компании или частного лица, всегда следует думать об удобстве пользователей. Для этого стоит ненадолго поставить себя на место человека, впервые посетившего неизвестную ему ранее страницу. Каждый автор стремится сделать свой продукт уникальным, продумывая дизайн и оригинальный интерфейс. Однако часто такие задумки на некоторое время усложняют для целевой аудитории выполнение основной задачи — получения нужной информации.

Существующая статистика утверждает: площадку быстро покидают, если при переходе на нее из поисковой выдачи невозможно сразу отыскать требуемый раздел. Это негативно сказывается на репутации ресурса — поисковик воспринимает ситуацию как несоответствие запросу или низкое качество контента. Дальнейший прогноз неутешительный — снижение позиций выдаче.

Именно поэтому разработчики задумываются, как сделать поиск по сайту. Это не только обеспечивает эффективное взаимодействие пользователей со страницей, но и положительно отражается на позициях площадки. Посетителям не придется разбираться в сложных каталогах и классификациях, они не покинут ресурс за считаные секунды.

Специалисты по продвижению говорят, что при количестве страниц, которое равно или больше двадцати, необходимо позаботиться о внутреннем поисковом механизме. Далее рассмотрим, как именно это можно реализовать.

Показатели качества

Прежде чем перейти непосредственно к методам разработки, стоит задуматься о том, как должна быть устроена идеальная с точки зрения пользователя форма поиска. Опросы и юзабилити-тестирования показали, что ценится:

  • Видимость. Поле для введения данных обязано быть заметным и броским. Если разместить его в футере, мало кто догадается о существовании такого элемента. Оптимально расположить форму в самом верху сайдбара или хедере, то есть в верхних частях странички.
  • Яркость. Строка должна отличаться от общего дизайна, сразу давая понять, что здесь расположено окно для поисковых запросов. Иконка в виде лупы, подсказывающий текст Search или другие опознавательные элементы сразу указывают на место для введения фразы с целью получения соответствующего ответа.

Также важно продумать параметры выдачи:

  • Учет морфологии. Особенно в русском языке много словоформ, поэтому важно знать, как сделать поиск по словам на сайте.
  • Механизм выделения искомых фраз. Подсветка — стандартный инструмент в любом приложении, достаточно привычный и удобный.
  • Вариант выдачи результатов в зависимости от соответствия. Первыми всегда демонстрируются самые подходящие и популярные ответы, что повышает шансы удовлетворить пользовательский запрос.

Еще одна хитрость: лучше закрывать страницы с поиском от индексации глобальными системами. Google считает, что качество ссылок в таком случае хуже, чем в ситуации с обычным текстовым блоком.

Google Search Console - UMI

Способы

Четыре главных метода, позволяющих эффективно организовать поисковый процесс:

  • установка аналогичных программ от Яндекс или Гугл;
  • прописывание скрипта для «чистого» HTML;
  • использование встроенных средств CMS;
  • конструктора сайтов со встроенным поиском.

Рассмотрим особенности каждого из них подробнее.

Сервисы от поисковых систем

Сложно усомниться в действенности алгоритмов, которые работают во всем мире. Yandex и Google учитывают морфологические особенности языка, дают специальные подсказки, исправляют орфографические ошибки. Также они ведут статистику, что позволяет более эффективно ранжировать (распределять по позициям) полученные результаты.

Бесплатный инструмент подсказывает, как сделать поиск по сайту Яндекс. Он способен просто и удобно интегрировать все важные функции:

  • можно менять внешний вид;
  • автоматически предлагает список смысловых подсказок;
  • существует возможность добавить параметры и фильтры;
  • благодарность за установку — повышение рейтинга в выдачах Яндекса.

Соответствующий инструмент от Google платный, однако во многом оправдывает потраченные средства. Дополнительные возможности, которые предлагает конкурент:

  • персонализированное изменение внешнего вида строки для ввода;
  • неограниченное использование языков с автоматическим механизмом его определения;
  • применение графического контента;
  • отсутствие рекламных материалов;
  • каталог синонимов;
  • одновременное участие нескольких ресурсов.

Сервисы для аналитики позволят создать личную статистическую базу, анализ которой послужит хорошей платформой для дальнейшего усовершенствования.

Ручная работа

Если говорить о том, как сделать поиск по сайту HTML, стоит отметить, что в последнее время процессы программирования существенно упростились. Сегодня можно найти около десятка готовых форм кодов, которые просто копируют. Переписыванию в таком фрагменте подлежит только название площадки. Однако знания никогда не лишние — при помощи CSS можно создать необходимый размер, цвет, настроить анимации и другие особенности поля или кнопки. Соответствующие скрипты позволяют исчезать замещающему тексту, создавать динамично изменяющийся фон, менять толщину линий, создавать объемы.

Язык PHP тоже остается популярным, главное условие — его поддержка сервером хостинга, где расположен указанный ресурс. Такой способ в большинстве случаев сопряжен с оформлением баз данных, проверки выборок и другими сервисами.

Если же навыки программирования находятся еще не на должном уровне, то лучше не читать советы, как сделать поиск по сайту PHP, а выбрать более простой вариант. Так вы будете уверены в качестве собственных трудов.

Поиск в мобильной версии - UMI

Конструкторы и системы управления содержимым

На конструктореах сайтов поиск часто включен в функционал изначально. На конструкторе 1С-UMI поиск уже встроен в сайты, ничего устанавливать и подключать не нужно. Это значит, что создав сайт на этом конструкторе, вы сразу получите веб-ресурс с работающим поиском.

Многие сайты работают на CMS (движке) — специальной программе, предназначенные для управления сайтами. Они сложнее, чем конструкторы и предусматривает наличие базовых навыков, но если в CMS встроен готовый шаблон, то разобраться можно и без посторонней помощи. Рассмотрим в качестве примера работу с модулем «Поиск» на системе UMI.CMS. Как сделать поиск текста по сайту? Во все редакции системы включен модуль «Поиск», который позволяет:

  • находить контент с учетом морфологии или же отключить эту функцию;
  • искать по заголовкам, метатегам, и текстам;
  • определять, какие разделы будут индексироваться, при необходимости индексировать принудительно или исключать страницы из поиска;
  • смотреть данные о дате последнего обновления индекса, а также запустить его в ручном режиме;
  • использовать инструмент Sphinx, подходящий для работы фраз, состоящих менее чем из трех букв;
  • включить отбор по любому участку слова или фразы, нестандартного для обычных ситуаций;
  • оформить количество выводимых результатов, формат их отображения.

Модуль является ответом на вопрос о том, как сделать поиск слова по сайту.

Как сделать поиск по сайту

Здравствуйте, дорогие друзья!

Сегодня я расскажу вам, как сделать поиск по сайту. Мы рассмотрим основные способы создания поискового механизма на сайте и наглядно попробуем воспользоваться одним из них.

Навигация по статье:

Обучение фотошоп

Способы создания поиска на сайте

Если перед вами возник вопрос создания поиска на сайте? Вы можете пойти несколькими путями:

  1. 1.Воспользоваться стандартным механизмом поиска той CMS, которую вы используете.
  2. 2.Воспользоваться плагином или модулем поиска.
  3. 3.Нанять программиста, чтобы он написал модуль поиска для вашего сайта.
  4. 4.Сделать поиск на сайте при помощи специальных сервисов Яндекс.Поиск и системы пользовательского поиска Google.

Первые два варианта позволяют создать более привлекательную, по внешнему виду, поисковую форму и страницу результатов поиска. Но в тоже время, имеют один очень существенный недостаток – они обладают более слабым алгоритмом поиска по введенному запросу по сравнению с вариантом использования сервисов Яндекс и Google.

Вариант с программистом, конечно, позволит создать более качественную систему поиска чем стандартные плагины или модули, но до поиска яндекса или Google ему всё же далеко. Да и стоить это будет не дешево.

Приведу пример. Пользователь заходит на ваш сайт и пытается найти информацию по определенному запросу. На вашем сайте есть статья с нужной информацией, но пользователь не знает ключевых слов, по которым была написана данная статья. Он вводит запрос, который не имеет точного совпадения с ключевыми словами в статье и получает отрицательный результат поиска. В результате пользователь уходит с вашего сайта, не получив необходимой ему информации. Вы незаслуженно теряете посетителей и получаете плохую статистику поведенческого фактора.

Поиск, сделанный при помощи сервисов, предоставляемых поисковыми система, изначально лишен этого недостатка, так как вы используете мощный поисковый механизм, работающий в пределах вашего сайта. При использовании поискового механизма Яндекс или Google можно быть уверенным в том, что посетители обязательно найдут то, что им нужно.

Итак, давайте разберемся, как сделать поиск по сайту с помощью специального сервиса одной из поисковых систем.

Поиск для сайта при помощи Яндекс.Поиск

Чтобы сделать поиск для сайта при помощи поисковой формы Яндекс вам нужно:

  1. 1.Зайти на главную страницу сервиса по этому адресу: https://site.yandex.ru. Пройти авторизацию, или, если у вас нет учетной записи в Яндексе, зарегистрироваться. После чего, нажимаем на кнопку «Установить поиск».
  2. Главная страница Яндекс.Поиск
  3. 2.На следующей странице в поле «Техническое название поиска» вводим название, которое будет отображаться только для нас, а в поле «Название поиска для стандарта Opensearch» вводим название для стандарта Opensearch.
  4. Вводим название будущего поиска
  5. 3.После чего выбираем фильтр. Если ваш сайт не содержит никакого противозаконного контента, можно выбрать «Без ограничений».
  6. Задаем фильт
  7. 4.В следующем пункте, при нажатии на кнопку «Добавить сайты и исключения», откроется форма, в которой нам нужно указать адрес сайта, или группу сайтов, в пределах которых будет осуществляться поиск. Это особенно удобно в случае, если у вас есть несколько ресурсов схожей тематики. В случае, если вы введете несколько адресов, пользователю, в поисковой выдаче, будут отображаться страницы с нескольких, указанных вами, сайтов.
  8. добавляем сайт для поиска вводим адрес сайта

    Вводим адрес и нажимаем на кнопку «Добавить».

  9. 5.Указываем адрес электронной почты, на который вы хотите получать уведомления, и нажимаем кнопку «Далее к шагу 2».
  10. переходим к следующему шагу
  11. 6.На следующей странице нам необходимо настроить внешний вид формы нашего будущего поиска Яндекс. Выбираем тип формы:
  12. выбираем тип формы

    Настраиваем цветовое оформление и шрифт, а так же задаем текст, который будет отображаться в пустом поле формы:

    выбираем дизайн формы

    Немного ниже можно посмотреть, как будет выглядеть наша форма. После того как мы задали все настройки, переходим к следующему шагу.

    предпросмотр
  13. 7.На следующей странице, переключаясь между вкладками, настраиваем внешний вид нашей страницы. Мы можем выбрать, для отображения результатов поиска, стандартную страницу поисковика Яндекс, а можем, указав адрес, задать свою страницу и настроить цвета, шрифты и другие параметры так, чтобы по внешнему виду страница как можно лучше сочеталась со стилем вашего сайта.
  14. настройка страницы результатов поиска
  15. 8.Переходим на следующую страницу настроек. Здесь нам нужно протестировать, как работает поиск, и если есть что-то, что нас не устраивает, мы можем вернуться на предыдущий шаг и исправить это. Если все в порядке, переходим на следующую страницу.
  16. тестирование поиска
  17. 9.Здесь мы видим сгенерированный кусок кода нашей формы поиска, который нужно скопировать вставить в шаблон страницы сайта в том месте, где вы хотите его расположить.
  18. код формы поиска

В случае, если вы выбрали, на третьем шаге, «Показывать результаты на моей странице», то у вас будет два фрагмента кода. Второй фрагмент нужно вставить в страницу, на которой вы планируете выводить результаты поиска.

Как добавить код формы поиска на сайт?

Так как у меня сайт сделан на WordPress, я покажу добавление кода формы на его примере.

  1. 1.Заходим в административную часть сайта и переходим в раздел «Внешний вид» => «Виджеты».
  2. 2.В область сайдбара перетягиваем новый виджет «Текст».
  3. добавляем виджет в сайдбар
  4. 3.Вставляем в него код и нажимаем на кнопку «Сохранить».
  5. добавляем код в виджет
  6. 4.Переходим на сайт и смотрим на полученный результат.
  7. провверяем готовый  поиск на сайте

В большинстве случаев нужно при помощи CSS-свойств подогнать внешний вид под дизайн сайта.

Для других CMS процесс добавления поиска будет выглядеть аналогично. Вы просто вставляете полученный код в том месте, где вам нужно чтобы был поиск.

Как научиться продвигать сайты?

На этом у меня все. В одной из следующих статей постараюсь рассказать, как сделать поиск по сайту с помощью Google. Если у вас возникнут проблемы – вы всегда можете задать вопрос в комментарии или воспользоваться услугой консультации по Skype. Желаю вам всего хорошего, до новых встреч.

С уважением Юлия Гусарь

Поисковые технологии или в чем загвоздка написать свой поисковик / Habr

Когда-то давно взбрела мне в голову идея: написать свой собственный поисковик. Было это очень давно, тогда я еще учился в ВУЗе, мало чего знал про технологии разработки больших проектов, зато отлично владел парой десятков языков программирования и протоколов, да и сайтов своих к тому времени было понаделано много.

Ну есть у меня тяга к монструозным проектам, да…

В то время про то, как они работают было известно мало. Статьи на английском и очень скудные. Некоторые мои знакомые, которые были тогда в курсе моих поисков, на основе нарытых и мной и ими документов и идей, в том числе тех, которые родились в процессе наших споров, сейчас делают неплохие курсы, придумывают новые технологии поиска, в общем, эта тема дала развитие довольно интересным работам. Эти работы привели в том числе к новым разработкам разных крупных компаний, в том числе Google, но я лично прямого отношения к этому не имею.

На данный момент у меня есть собственный, обучающийся поисковик от и до, со многими нюансами – подсчетом PR, сбором статистик-тематик, обучающейся функцией ранжирования, ноу хау в виде отрезания несущественного контента страницы типа меню и рекламы. Скорость индексации примерно полмиллиона страниц в сутки. Все это крутится на двух моих домашних серверах, и в данный момент я занимаюсь масштабированием системы на примерно 5 свободных серверов, к которым у меня есть доступ.

Здесь я в первый раз, публично, опишу то, что было сделано лично мной. Думаю, многим будет интересно как же работают Яндекс, Google и почти все мне известные поисковики изнутри.

Есть много задач при построении таких систем, которые почти нереально решить в общем случае, однако с помощью некоторых ухищрений, придумок и хорошего понимания как работает железячная часть Вашего компьютера можно серьезно упростить. Как пример – пересчет PR, который в случае нескольких десятков миллионов страниц уже невозможно поместить в самой большой оперативной памяти, особенно если Вы, как и я, жадны до информации, и хотите кроме 1 цифры хранить еще много полезностей. Другая задача – хранение и обновление индекса, как минимум двумерной базы данных, в которой конкретному слову сопоставляется список документов, на которых оно встречается.

Просто вдумайтесь, Google хранит, по одной из оценок, более 500 миллиардов страниц в индексе. Если бы каждое слово встречалось на 1 странице только 1 раз, и на хранение этого надо было 1 байт – что невозможно, т.к. надо хранить хотя бы id страницы – уже от 4 байт, так вот тогда объем индекса бы был 500гб. В реальности одно слово встречается на странице в среднем до 10 раз, объем информации на вхождение редко когда меньше 30-50 байт, весь индекс увеличивается в тысячи раз… Ну и как прикажите это хранить? А обновлять?

Ну вот, как это все устроено и работает, я буду рассказывать планомерно, так же как и про то как считать PR быстро и инкрементально, про то как хранить миллионы и миллиарды текстов страниц, их адреса и быстро искать по адресам, как организованы разные части моей базы данных, как инкрементально обновлять индекс на много сотен гигов, ну и наверное расскажу как сделать обучающийся алгоритм ранжирования.

На сегодня объем только индекса, по которому происходит поиск — 57Gb, увеличивается каждый день примерно на 1Gb. Объем сжатых текстов – 25Gb, ну и я храню кучу другой полезной инфы, объем которой очень трудно посчитать из-за ее обилия.

Вот полный список статей которые относятся к моему проекту и описаны здесь:
0. Поисковые технологии или в чем загвоздка написать свой поисковик
1. С чего начинается поисковик, или несколько мыслей про crawler
2. Общие слова про устройство поиска в Web
3. Dataflow работы поисковой машины
4. Про удаление малозначимых частей страниц при индексации сайта
5. Методы оптимизации производительности приложения при работе с РБД
6. Немного про проектирование баз данных для поисковой машины
7. AVL деревья и широта их применения
8. Работа с URL и их хранение
9. Построение индекса для поисковой машины

Полнотекстовый поиск по сайту — бич современного интернета / Habr

Реализация хорошего поиска по сайту — часто сильно недооцененная по сложности задача. Поиск является слабым местом сайтов настолько часто, что когда я вижу строку поиска, у меня сразу же возникает предвзятое ощущение предстоящего фиаско. И чтобы лишний раз не расстраиваться, я сразу переадресую свой вопрос гуглу или яндексу и быстро нахожу то, что требовалось. Что же делать, чтобы как-то улучшить эту ситуацию?

Форма поиска по сайту от Яндекса и Гугла 


Лучше всего это поняли и сделали за нас создатели популярных поисковых систем. И мы можем воспользоваться результатами их трудов, просто установив форму поиска по сайту от Яндекса или Гугла.Это простой путь, но у него есть свои минусы:
  1. В поиске могут быть доступны не все страницы сайта. Поисковая система не гарантирует включения в поиск всех страниц сайта, а кроме того не все страницы могут быть доступны поисковому роботу.
  2. Большая задержка между появлением новых страниц на сайте и их доступностью в поиске.
  3. Нельзя задавать уточнения для поиска. Например, задать поиск только в одном подразделе сайта или по ценовому диапазону товара.
  4. Нельзя идеально встроить результаты поиска в дизайн сайта. Это перечеркивает все плюсы такого поиска для большинства солидных порталов.
Вот неполный перечень проблем, с которыми может столкнуться начинающий поисковод. Поэтому такое решение можно рекомендовать только сайтам, не особо беспокоящимся о своём коммерческом имидже.

Качество поиска 


Для начала нужно понять, из чего вообще складывается понятие качества поиска.  Качество поиска зависит от многих факторов. О многих из них можно прочитать в книге известного поискового оптимизатора кандидата технических наук Игоря Ашманова. (Скажу по секрету, что недавно видел её на torrents.ru). Все факторы условно можно разбить на три категории: полнота, точность и ранжирование. 

Полнота 


Полнота — это количество страниц, по которым выполняется поиск. Существует два подхода к индексированию данных для поиска: «изнутри» и «снаружи».
  1. «Изнутри» — это индексирование исходных данных сайта, обычно хранящихся в БД. Этот способ исключает попадание в результаты поиска «мусорных» страниц, но и связан с риском уменьшения полноты поиска.
  2. «Снаружи» — индексирование поисковым роботом. Этот подход в большинстве случаев гарантирует высокую полноту, но и порождает множество проблем, которые будут описаны в будущих статьях.
Если пользователь видит на сайте поисковую строку без сопроводительного текста, то он ожидает, что, введя запрос «контакты», он попадет на страницу контактов. А если это не так, то это ошибка вебмастера, потому что клиент всегда прав 🙂

Причина этого чаще всего в том, что на большинстве сайтов реализован поиск только по динамическим данным из-за того, что поисковая программа получает данные из базы данных. Более того, обычно вебмастер (или создатель CMS) решает, какие таблицы в БД самые важные, а какие недостойны внимания. В результате «за бортом» поиска остаются некоторые «малозначимые» динамические данные и все статические страницы.

С другой стороны, если поставить целью обеспечение максимальной полноты поиска, то в результатах может оказаться много «мусорных» и дублирующихся страниц, что тоже негативно сказывается на лояльность пользователей. 

Точность 


Точность поиска — это характеристика соответствия найденных страниц поисковому запросу. В неё входят учет морфологии, снятие омонимии, учет опечаток, поиск по синонимам и др. Например, если пользователь ищет «количество голов Аршавина», то ясно, что головы тут ни при чем, и нужно показывать только информацию про забитые голы. Вот еще один интересный пример омонимии. Но это высший пилотаж, а самое простое, что хочет увидеть пользователь — это поиск по всем возможным словоформам.

Для учета морфологии используются различные алгоритмы: стеммеры, морфологические словари и гибридные алгоритмы. Все они в той или иной степени  несовершенны. Например, слово «есть» может иметь формы «был», «будет», «ем». Простой стеммер этого не поймёт. Морфологический словарь вряд ли предоставит словоформы для слова «упячка». Более сложные гибридные алгоритмы, использующие словарные базы и наборы эвристик, более совершенны, но и они неидеальны.  Сейчас ситуация с учетом морфологии примерно такая:

  1. При поиске по БД только лишь средствами SQL обычно используют стеммер. Это наихудший учет морфологии
  2. Open source поисковые системы, такие как Sphinx, Lucene, Xapian обычно поддерживают установку своего морфологического анализатора, но в качестве встроенного алгоритма для русского языка обычно также используется стеммер. 
  3. Яндекс.Сервер, FAST, Google Appliance имеют продвинутые гибридные алгоритмы учета морфологии. Вероятно, Яндекс.Сервер и  Google Appliance  имеют наилучший морфологический анализатор для русского языка из существующих, так как они используют тот же алгоритм, что и в веб-поиске. 

Ранжирование


Под ранжированием понимается порядок сортировки найденных документах на странице результатов поиска. Иногда достаточно сортировать результаты по простому критерию, например, по дате модификации, но чаще всего требуется упорядочивание документов в порядке уменьшения близости поискового запроса результату. На ранжировании разработчики крупных поисковых систем сломали много копий, поэтому их продукты дают наилучшие результаты. Ситуация с ранжированием примерно такая:
  1. При использовании поиска средствами SQL доступно ранжирование только по простым критериям, таким как дата. 
  2. Open Source системы (Sphinx, Lucene, др.) имеют встроенные продвинутые алогритмы ранжирования. Обычно это модификации алогритма текстовой релевантности.
  3. Коммерческие продукты (Яндекс.Сервер, FAST, Google Appliance, др.) имеют сложные многофакторные алгоритмы ранжирования, секрет которых хранится в тайне под семью замками так же, как рецепт приготовления Кока-Колы.

Выводы 

  1. Для небольшого некоммерческого сайта подойдет форма поиска Яндекса/Гугла.
  2. Для поиска по разделу сайта, не требующего анализа морфологии запроса, сложного ранжирования и содержащего небольшое количество данных, можно использовать SQL запрос + стеммер.  
  3. Для достаточно большого сайта, содержащего нетривиальные статьи стоит использовать движок с хорошей морфологией и ранжированием:Яндекс.Сервер, FAST, Google Appliance, др. 
  4. Lucene, Sphinx, и др. подойдут, если душа лежит к Open Source и требования к поиску удовлетворяются возможностями движка.

Ссылки по теме

  1. «Обзор решений для полнотекстового поиска в веб-проектах: Sphinx, Apache Lucene, Xapian» — статья на http://www.developers.org.ua
  2. «High Performance FullText Search» — сравнение производительности поиска и индексации популярных полнотекстовых Open Source движков при работе с MySQL (PDF 109кб)  
  3. http://poiskovod.ru — оригинал статьи в моем блоге

как сделать поиск по сайту?

напиши в гугле что именно тебя интересует (к примеру уроки фотошоп) затем поставь двоеточие, после него напиши адрес сайта (между двоеточием и адресом не должно быть пробел). В результате произведёшь поиск непосредственно по сайту пример: уроки фотошоп: demiart.ru

в google chrome это ctrl + F . Вылазит строка поиска и там пишешь что тебе нужно

Поставь CMF PHPc — в ней есть плагин «Поиск по сайту» 🙂

ты не написал, что у тебя за сайт. поиск можно реализовать при помощи серверных скриптов — если хостинг их разрешает. обычно инфа содержится в базе данных и там производится поиск (поиск по файлам не рентабелен — много ресурсов жрет) . но практически все CMS и так имеют встроенный поиск, так что предположу, что сайт на html — то есть отдельные html-страницы. тогда у тебя только один вариант — использовать сервисы типа того же яндекса, или гугла — что больше нравится. — у них есть готовые решения для таких случаев — т. е. для поиска только по конкретному сайту и не переходя на страницу поисковика. — форма, которая добавляется на твой сайт. Настраивается и вставляется просто, есть подробные инструкции: <a rel=»nofollow» href=»http://site.yandex.ru/» target=»_blank» >Яндекс. Поиск для сайта</a> <a rel=»nofollow» href=»http://www.google.com/intl/ru/sitesearch/index.html» target=»_blank» >Google Site Search</a> Сам html ничего искать не умеет — ни в html, ни в javascript нет для этого нужных инструментов. Какой лучше? — Проверь сам, где больше страниц проиндексировано — в гугле и в яндексе введи например такой запрос: * site: и после двоеточия адрес своего сайта (без http:// и www) и посмотри где больше результатов.

Ну вообще обурели, что бы удалить свой ответ за это ещё и платить нужно: Оплата удаления ответа

щас проверю точно))) 35р удалить ответ, корка!!!! маил как обычно Г. слава богу изменить сообщение бесплатно, гнилая контора

Похоже в данный момент для собственного поиска по сайту придется использовать Solr и Nutch.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *