Поиск информации примеры – Практическая работа по информатике «Поисковые системы. Пример поиска информации на государственных образовательных порталах.»

Содержание

Практическая работа №7.1 Поисковые системы. Пример поиска информации на государственных образовательных порталах.

Практическая работа №7.1 Поисковые системы. Пример поиска информации на государственных образовательных порталах.

  1. Цель работы: научиться осуществлять поиск информации с помощью поисковых систем.

 2. Оборудование, приборы, аппаратура, материалы: персональный компьютер с выходом в Интернет.

 3. Краткие теоретические сведения.

Поиск информации в Интернете осуществляется с помощью специальных программ, обрабатывающих запросы — информационно-поисковых систем (ИПС).

Существует несколько моделей, на которых основана работа поисковых систем, но исторически две модели приобрели наибольшую популярность — это поисковые каталоги и поисковые указатели.
Поисковые каталоги устроены по тому же принципу, что и тематические каталоги крупных библиотек. Они обычно представляют собой иерархические гипертекстовые меню с пунктами и подпунктами, определяющими тематику сайтов, адреса которых содержатся в данном каталоге, с постепенным, от уровня к уровню, уточнением темы. Поисковые каталоги создаются вручную. Высококвалифицированные редакторы лично просматривают информационное пространство WWW, отбирают то, что по их мнению представляет общественный интерес, и заносят в каталог.

Основной проблемой поисковых каталогов является чрезвычайно низкий коэффициент охвата ресурсов WWW. Чтобы многократно увеличить коэффициент охвата ресурсов Web, из процесса наполнения базы данных поисковой системы необходимо исключить человеческий фактор — работа должна быть автоматизирована.

Автоматическую каталогизацию Web-ресурсов и удовлетворение запросов клиентов выполняют поисковые указатели. Работу поискового указателя можно условно разделить на три этапа:

  • сбор первичной базы данных. Для сканирования информационного пространства WWW используются специальные агентские программы — черви, задача которых состоит в поиске неизвестных ресурсов и регистрация их в базе данных;

  • индексация базы данных — первичная обработка с целью оптимизации поиска. На этапе индексации создаются специализированные документы — собственно поисковые указатели;

  • рафинирование результирующего списка. На этом этапе создается список ссылок, который будет передан пользователю в качестве результирующего. Рафинирование результирующего списка заключается в фильтрации и ранжировании результатов поиска.

 

Под фильтрацией понимается отсев ссылок, которые нецелесообразно выдавать пользователю (например, проверяется наличие дубликатов). Ранжирование заключается в создании специального порядка представления результирующего списка (по количеству ключевых слов, сопутствующих слов и др.).

В России наиболее крупными и популярными поисковыми системами являются:

 4. Задание

 Задание 1.

    1. Загрузите Интернет.

    2. С помощью строки поиска найдите каталог ссылок на государственные образовательные порталы.

    3. Выпишите электронные адреса шести государственных образовательных порталов и дайте им краткую характеристику. Оформите в виде таблицы.

 Задание 2.

    1. Откройте программу Enternet Explorer.

    2. Загрузите страницу электронного словаря Promt– www.verdict.ru.

    3. Из раскрывающегося списка выберите Русско-английский словарь (Русско-Немецкий).

    4. В текстовое поле Слово для перевода: введите слово, которое Вам нужно перевести.

    5. Нажмите на кнопку Найти.

    6. Занесите результат в следующую таблицу:

Слово

Русско-Английский

Русско-Немецкий

Информатика

Клавиатура

Программист

Монитор

Команда

Винчестер

Сеть

Ссылка

Оператор

 Задание 3.

    1. Загрузите страницу электронного словаря– www.efremova.info.

    2. В текстовое поле Поиск по словарю: введите слово, лексическое значение которого Вам нужно узнать.

    3. Нажмите на кнопку Искать. Дождитесь результата поиска.

    4. Занесите результат в следующую таблицу:

Слово

Лексическое значение

Метонимия

Видеокарта

Железо

Папирус

Скальпель

Дебет

 

Задание 4. С помощью одной из поисковых систем найдите информацию и занесите ее в таблицу:

Личности 20 века

Фамилия, имя

Годы жизни

Род занятий

Джеф Раскин

Лев Ландау

Юрий Гагарин

 

Задание 5. Заполните таблицу, используя поисковую систему Яндекс: www.yandex.ru.

Слова,

входящие в запрос

Структура запроса

Количество

найденных

страниц

Электронный адрес первой найденной ссылки

Информационная

система

Информационная! Система!

Информационная + система

Информационная — система

«Информационная система»

Персональный

компьютер

Персональный компьютер

Персональный & компьютер

$title (Персональный компьютер)

$anchor (Персональный компьютер)

 

Задание 6. Произвести поиск сайтов в наиболее популярных поисковых системах общего назначения в русскоязычном Интернете (Рунете).

Краткая справка. Наиболее популярными русскоязычными поисковыми системами являются:

Rambler — www.rambler.ru;

Апорт — www.aport.ru;

Яndex— www.yandex.ru.

Англоязычные поисковые системы:

Yahoo — www.yahoo.com.

Специализированные поисковые системы позволяют искать информацию в специализированных слоях Интернета. К ним можно отнести поиск файлов на серверах FTP и систему поиска адресов электронной почты WhoWhere.

Порядок выполнения:

1. Создайте папку на рабочем столе с именем: Фамилия–Группа.

2. Запустите Internet Explorer.

Для перехода в определенное место или на определенную страницу воспользуйтесь адресной строкой главного окна Internet Explorer.

Краткая справка: Адрес узла (URL) обычно начинается с имени протокола, за которым следует обслуживающая узел организация, например в адресе http://www.rambler.ru «http://www» указывает, что это сервер Web, который использует протокол http, домен «.ru» определяет адрес российских узлов.

3. Произведите поиск в поисковой системе Rambler.

Введите в адресную строку адрес (URL) русскоязычной поисковой системы Rambler — www.rambler.ru и нажмите клавишу Enter. Подождите, пока загрузится страница. В это же время на панели, инструментов активизируется красная кнопка Остановить, предназначенная для остановки загрузки.

Рассмотрите загрузившуюся главную страницу – Вы видите поле для ввода ключевого слова и ряд рубрик. Для перехода на ссылки, имеющиеся на странице, подведите к ссылке курсор и щелкните левой кнопкой мыши. Ссылка может быть рисунком или текстом другого цвета (обычно с подчеркнутым шрифтом). Чтобы узнать, является ли элемент страницы ссылкой, подведите к нему указатель. Если указатель принимает вид руки с указательным пальцем, значит, элемент является ссылкой.

4. Введите в поле поиска словосочетание «Энциклопедия финансов» и нажмите кнопку Найти.

5. Убедитесь, что каталог Web работает достаточно быстро. Программа через некоторое время сообщит вам, что найдено определенное количество документов по этой тематике. Определите, сколько документов нашла поисковая система:_________

6. Запомните страницу из списка найденных, представляющую для вас интерес, командой Избранное/Добавить в папку.

7. Сохраните текущую страницу на компьютере. Выполните команду Файл/Сохранить как, выберите созданную ранее папку на рабочем столе для сохранения, задайте имя файла и нажмите кнопку Сохранить.

8. Для поиска информации на текущей странице выполните команду Правка/Найти на этой странице (или нажмите клавиши Ctrl-F). В окне поиска наберите искомое выражение, например «Финансы», и нажмите кнопку Найти далее. Откройте страничку одной из найденных энциклопедий.

9. Скопируйте сведения страницы в текстовый документ. Для копирования содержимого всей страницы выполните команду Правка/Выделить все и команду Правка/Копировать. Откройте новый документ текстового редактора MS Word и выполните команду Правка/Вставить.

Краткая справка: невозможно копирование сведений с одной Web-страницы на другую.

10. Произведите поиск в поисковой системе Yandex. Откройте поисковый сервер YAndex — www.yandex.ru. В поле поиска задайте «Энциклопедии», нажмите кнопку Найти, сравните результаты с поиском в Рамблере.

11. Сузьте круг поиска и найдите информацию, например, об управлении финансами (в поле поиска введите «Управление финансами»). Сравните полученные результаты с предыдущим поиском.

12. Введите одно слово «Финансы» в поле поиска. Отличается ли результат от предыдущего поиска? Попробуйте поставить перед поисковой системой задачу найти информацию о какой-нибудь конкретной валюте, предположим «Доллар». Сравните результаты поиска.

Краткая справка: не бойтесь повторять свой запрос на разных поисковых серверах. Зачастую один и тот же запрос на другом сервере дает совершенно иные результаты.

13. Произведите поиск картинок и фотографий в поисковой системе Yandex. В поле поиска наберите по-английски «Dollar» и укажите категорию поиска «Картинки». Запрос «Dollar» найдет в Интернете картинки, в имени которых встречается слово «Dollar». Высока вероятность того, что эти картинки связаны с финансами.

 

5. Содержание отчета

 

Отчет должен содержать:

    1. Название работы.

    2. Цель работы.

    3. Задание и его решение.

    4. Вывод по работе.

 

6. Контрольные вопросы

 

    1. Что понимают под поисковой системой?

    2. Перечислите популярные русскоязычные поисковые системы.

    3. Что такое ссылка и как определить, является ли элемент страницы ссылкой

    4. Возможно ли копирование сведений с одной Web-страницы на другую?

    5. Каким образом производится поиск картинок и фотографий в поисковых системах Интернет?

 

Практическая работа по информатике «Поисковые системы. Пример поиска информации на государственных образовательных порталах.»

 

ИНФОРМАТИКА и ИКТ

Практическая работа №10.

Поисковые системы. Пример поиска информации на государственных образовательных порталах.

  1. Цель работы: научиться осуществлять поиск информации с помощью поисковых систем.

 2. Оборудование, приборы, аппаратура, материалы: персональный компьютер с выходом в Интернет.

 3. Краткие теоретические сведения.

Поиск информации в Интернете осуществляется с помощью специальных программ, обрабатывающих запросы — информационно-поисковых систем (ИПС).

Существует несколько моделей, на которых основана работа поисковых систем, но исторически две модели приобрели наибольшую популярность — это поисковые каталоги и поисковые указатели.
Поисковые каталоги устроены по тому же принципу, что и тематические каталоги крупных библиотек. Они обычно представляют собой иерархические гипертекстовые меню с пунктами и подпунктами, определяющими тематику сайтов, адреса которых содержатся в данном каталоге, с постепенным, от уровня к уровню, уточнением темы. Поисковые каталоги создаются вручную. Высококвалифицированные редакторы лично просматривают информационное пространство WWW, отбирают то, что по их мнению представляет общественный интерес, и заносят в каталог.

Основной проблемой поисковых каталогов является чрезвычайно низкий коэффициент охвата ресурсов WWW. Чтобы многократно увеличить коэффициент охвата ресурсов Web, из процесса наполнения базы данных поисковой системы необходимо исключить человеческий фактор — работа должна быть автоматизирована.

Автоматическую каталогизацию Web-ресурсов и удовлетворение запросов клиентов выполняют поисковые указатели. Работу поискового указателя можно условно разделить на три этапа:

  • сбор первичной базы данных. Для сканирования информационного пространства WWW используются специальные агентские программы — черви, задача которых состоит в поиске неизвестных ресурсов и регистрация их в базе данных;

  • индексация базы данных — первичная обработка с целью оптимизации поиска. На этапе индексации создаются специализированные документы — собственно поисковые указатели;

  • рафинирование результирующего списка. На этом этапе создается список ссылок, который будет передан пользователю в качестве результирующего. Рафинирование результирующего списка заключается в фильтрации и ранжировании результатов поиска.

Под фильтрацией понимается отсев ссылок, которые нецелесообразно выдавать пользователю (например, проверяется наличие дубликатов). Ранжирование заключается в создании специального порядка представления результирующего списка (по количеству ключевых слов, сопутствующих слов и др.).

В России наиболее крупными и популярными поисковыми системами являются:

 

4. Задание

 Задание 1.

    1. Загрузите Интернет.

    2. С помощью строки поиска найдите каталог ссылок на государственные образовательные порталы.

    3. Выпишите электронные адреса шести государственных образовательных порталов и дайте им краткую характеристику. Оформите в виде таблицы. 

Задание 2.

    1. Откройте программу Enternet Explorer.

    2. Загрузите страницу электронного словаря Promt– www.verdict.ru.

    3. Из раскрывающегося списка выберите Русско-английский словарь (Русско-Немецкий).

    4. В текстовое поле Слово для перевода: введите слово, которое Вам нужно перевести.

    5. Нажмите на кнопку Найти.

    6. Занесите результат в следующую таблицу:

Слово

Русско-Английский

Русско-Немецкий

Информатика

Клавиатура

Программист

Монитор

Команда

Винчестер

Сеть

Ссылка

Оператор

 Задание 3.

    1. Загрузите страницу электронного словаря– www.efremova.info.

    2. В текстовое поле Поиск по словарю: введите слово, лексическое значение которого Вам нужно узнать.

    3. Нажмите на кнопку Искать. Дождитесь результата поиска.

    4. Занесите результат в следующую таблицу:

Слово

Лексическое значение

Метонимия

Видеокарта

Железо

Папирус

Скальпель

Дебет

 Задание 4. С помощью одной из поисковых систем найдите информацию и занесите ее в таблицу:

Личности 20 века

Фамилия, имя

Годы жизни

Род занятий

Морозов Г.Ф.

Тимерязев

Юрий Гагарин

 Задание 5. Заполните таблицу, используя поисковую систему Яндекс: www.yandex.ru.

Слова,

входящие в запрос

Структура запроса

Количество

найденных

страниц

Электронный адрес первой найденной ссылки

Информационная

система

Информационная! Система!

Информационная + система

Информационная — система

«Информационная система»

Персональный

компьютер

Персональный компьютер

Персональный & компьютер

$title (Персональный компьютер)

$anchor (Персональный компьютер)

 

Задание 6. Произвести поиск сайтов в наиболее популярных поисковых системах общего назначения в русскоязычном Интернете (Рунете).

Краткая справка. Наиболее популярными русскоязычными поисковыми системами являются:

Rambler — www.rambler.ru;

Апорт — www.aport.ru;

Яndex— www.yandex.ru.

Англоязычные поисковые системы:

Yahoo — www.yahoo.com.

Специализированные поисковые системы позволяют искать информацию в специализированных слоях Интернета. К ним можно отнести поиск файлов на серверах FTP и систему поиска адресов электронной почты WhoWhere.

Порядок выполнения:

1. Создайте папку на рабочем столе с именем: Фамилия–Группа.

2. Запустите Internet Explorer.

Для перехода в определенное место или на определенную страницу воспользуйтесь адресной строкой главного окна Internet Explorer.

Краткая справка: Адрес узла (URL) обычно начинается с имени протокола, за которым следует обслуживающая узел организация, например в адресе http://www.rambler.ru «http://www» указывает, что это сервер Web, который использует протокол http, домен «.ru» определяет адрес российских узлов.

3. Произведите поиск в поисковой системе Rambler.

Введите в адресную строку адрес (URL) русскоязычной поисковой системы Rambler — www.rambler.ru и нажмите клавишу Enter. Подождите, пока загрузится страница. В это же время на панели, инструментов активизируется красная кнопка Остановить, предназначенная для остановки загрузки.

Рассмотрите загрузившуюся главную страницу – Вы видите поле для ввода ключевого слова и ряд рубрик. Для перехода на ссылки, имеющиеся на странице, подведите к ссылке курсор и щелкните левой кнопкой мыши. Ссылка может быть рисунком или текстом другого цвета (обычно с подчеркнутым шрифтом). Чтобы узнать, является ли элемент страницы ссылкой, подведите к нему указатель. Если указатель принимает вид руки с указательным пальцем, значит, элемент является ссылкой.

4. Введите в поле поиска словосочетание «Энциклопедия финансов» и нажмите кнопку Найти.

5. Убедитесь, что каталог Web работает достаточно быстро. Программа через некоторое время сообщит вам, что найдено определенное количество документов по этой тематике. Определите, сколько документов нашла поисковая система:_________

6. Запомните страницу из списка найденных, представляющую для вас интерес, командой Избранное/Добавить в папку.

7. Сохраните текущую страницу на компьютере. Выполните команду Файл/Сохранить как, выберите созданную ранее папку на рабочем столе для сохранения, задайте имя файла и нажмите кнопку Сохранить.

8. Для поиска информации на текущей странице выполните команду Правка/Найти на этой странице (или нажмите клавиши Ctrl-F). В окне поиска наберите искомое выражение, например «Финансы», и нажмите кнопку Найти далее. Откройте страничку одной из найденных энциклопедий.

9. Скопируйте сведения страницы в текстовый документ. Для копирования содержимого всей страницы выполните команду Правка/Выделить все и команду Правка/Копировать. Откройте новый документ текстового редактора MS Word и выполните команду Правка/Вставить.

Краткая справка: невозможно копирование сведений с одной Web-страницы на другую.

10. Произведите поиск в поисковой системе Yandex. Откройте поисковый сервер YAndex — www.yandex.ru. В поле поиска задайте «Энциклопедии», нажмите кнопку Найти, сравните результаты с поиском в Рамблере.

11. Сузьте круг поиска и найдите информацию, например, об управлении финансами (в поле поиска введите «Управление финансами»). Сравните полученные результаты с предыдущим поиском.

12. Введите одно слово «Финансы» в поле поиска. Отличается ли результат от предыдущего поиска? Попробуйте поставить перед поисковой системой задачу найти информацию о какой-нибудь конкретной валюте, предположим «Доллар». Сравните результаты поиска.

Краткая справка: не бойтесь повторять свой запрос на разных поисковых серверах. Зачастую один и тот же запрос на другом сервере дает совершенно иные результаты.

13. Произведите поиск картинок и фотографий в поисковой системе Yandex. В поле поиска наберите по-английски «Dollar» и укажите категорию поиска «Картинки». Запрос «Dollar» найдет в Интернете картинки, в имени которых встречается слово «Dollar». Высока вероятность того, что эти картинки связаны с финансами.

 

 Самостоятельная работа

Подготовить сообщение о рейтинге различных поисковых систем.

Контрольные вопросы

    1. Что понимают под поисковой системой?

    2. Перечислите популярные русскоязычные поисковые системы.

    3. Что такое ссылка и как определить, является ли элемент страницы ссылкой

    4. Возможно ли копирование сведений с одной Web-страницы на другую?

    5. Каким образом производится поиск картинок и фотографий в поисковых системах Интернет?

 Домашнее задание

Угринович Н.Д. Информатика и ИКТ. Базовый уровень: учебник для 10 класса. М.: Бином. Лаборатория знаний, 2011

Гл. 2, стр. 187-193

Поиск информации в сети интернет

Проблема поиска

    Говорят, что в Интернете есть все. На самом деле – это не так. Материалы для размещения в сети готовят живые люди, и потому там можно найти лишь то, что они сочли нужным опубликовать. Впрочем, река питается ручьями, и, благодаря их творчеству сегодня в Интернете уже образовалось около двух миллиардов Web-страниц. В результате каталогизация имеющихся в сети ресурсов стала серьезной проблемой. Несмотря на то, что проблемой занимаются тысячи организаций, она не только не приближается к разрешению, но и становится острее. Процент каталогизированных ресурсов неуклонно падает. В последние годы это падение стало катастрофическим. Так, если в 1999 году процент каталогизированных ресурсов приближался к 40%, то всего лишь за один следующий год он опустился до 25 %.

    Вывод простой: пространство Web быстрее наполняется, чем систематизируется.

     К сожалению, у нас нет оснований предполагать, что в ближайшее время что-нибудь может измениться к лучшему. В итоге поиск информации в Интернет можно считать одной из самых трудных задач.

Поисковые системы

    Для поиска интересующей вас информации необходимо указать браузеру адрес Web-страницы, на которой она находится. Это самый быстрый и надежный вид поиска. Для быстрого доступа к ресурсу достаточно запустить браузер и набрать адрес страницы в строке адреса.

hello_html_m7ed57c77.jpg

    Адреса Web-страниц приводятся в специальных справочниках, печатных изданиях, звучат в эфире популярных радиостанций и с экранов телевизора.

    Если вы не знаете адреса, то для поиска информации в сети Интернет существуют поисковые системы, которые содержат информацию о ресурсах Интернета.

    Каждая поисковая система – это большая база ключевых слов, связанных с Web-страницами, на которых они встретились. Для поиска адреса сервера с интересующей вас информацией надо ввести в поле поисковой системы ключевое слово, несколько слов или фразу. Тем самым вы посылаете поисковой системе запрос. Результаты поиска выдаются в виде списка адресов Web-страниц, на которых встретились эти слова.

    Как правило, поисковые системы состоят из трех частей: робота, индекса и программы обработки запроса.

Робот (Spider, Robot или Bot) — это программа, которая посещает веб-страницы и считывает (полностью или частично) их содержимое.

    Роботы поисковых систем различаются индивидуальной схемой анализа содержимого веб-страницы.

Индекс — это хранилище данных, в котором сосредоточены копии всех посещенных роботами страниц.

    Индексы в каждой поисковой системе различаются по объему и способу организации хранимой информации. Базы данных ведущих поисковых машин хранят сведения о десятках миллионов документов, а объемы их индекса составляют сотни гигабайт. Индексы периодически обновляются и дополняются, поэтому результаты работы одной поисковой машины с одним и тем же запросом могут различаться, если поиск производился в разное время.

Программа обработки запроса — это программа, которая в соответствии с запросом пользователя «просматривает» индекс на предмет наличия нужной информации и возвращает ссылки на найденные документы.

    Множество ссылок на выходе системы распределяется программой в порядке убывания от наибольшей степени соответствия ссылки запросу к наименьшей.

    В России наиболее распространенными поисковыми системами являются:

     За рубежом поисковых систем гораздо больше. Самыми популярными являются:

     Яндекс является пожалуй наилучшей поисковой системой в российском Интернете. Эта база данных содержит около 200 000 серверов и до 30 миллионов документов, которые система просматривает в течение нескольких секунд. На примере этой системы покажем как осуществляется поиск информации.

    Поиск информации задается введением ключевого слова в специальную рамку и нажатием кнопки «Найти», справа от рамки.

hello_html_1fb2a4ab.jpg

    Результаты поиска появляются в течение нескольких секунд, причем ранжированные по значимости – наиболее важные документы размещаются в начале списка. При этом ранг найденного документа определяется тем, в каком месте документа находится ключевое слово (в заглавии документа важнее, чем в любом другом месте) и числом упоминаний ключевого слова (чем больше упоминаний, тем ранг выше).

hello_html_7b1847d5.jpg

    Таким образом, сайты, расположенные на первых местах в списке, являются ведущими не с содержательной точки зрения, а практически, по отношению к частоте упоминания ключевого слова. В связи с этим, не следует ограничиваться просмотром первого десятка предложенных поисковой системой сайтов.

    Содержательную часть сайта можно косвенно оценить по краткому его описанию, размещаемому Поисковой системой под адресом Сайта. Некоторые недобросовестные авторы сайтов, для того, чтобы повысить вероятность появления своей Web-страницы на первых местах Поисковой системы, умышленно включают в документ бессмысленные повторы ключевого слова. Но как только поисковая система обнаруживает такой «замусоренный» документ, она автоматически исключает его из своей базы данных.

    Даже ранжированный список документов, предлагаемый поисковой системой в ответ на ключевую фразу или слово, может оказаться практически необозримым. В связи с этим в Яндекс (как и других мощных Поисковых Машинах) предоставлена возможность в рамках первого списка, выбрать документы, которые точнее отражают цель поиска, то есть уточнить или улучшить результаты поиска. Например, на ключевое слово список из 34 899 Веб-страниц. После ввода в команду «Искать в найденном» уточняющего ключевого слова список сокращается до 750 страниц, а после ввода в эту команду еще одного уточняющего слова этот список сокращается до 130 Веб-страниц.

Поиск по рубрикатору поисковой системы

    Поисковые каталоги представляют собой систематизированную коллекцию (подборку) ссылок на другие ресурсы Интернета. Ссылки организованы в виде тематического рубрикатора, npeдставляющего собой иерархическую структуру, перемещаясь по которой, можно найти нужную информацию.

    Приведем в качестве примера структуру поискового интернет-каталога Яндекс.

hello_html_659f7e11.jpg

    Это каталог общего назначения, так как в нем представлены ссылки на ресурсы Интернета практически по всем возможным направлениям. В этом каталоге выделены следующие темы:

  • Бизнес и экономика;

  • Общество и политика;

  • Наука и образование;

  • Компьютеры и связь;

  • Справочники и ссылки;

  • Дом и семья;

  • Развлечения и отдых;

  • Культура и искусство.

    Каждая тема включает множество подразделов, а они, в свою очередь, содержат рубрики и т. д.

    Предположим, вы готовите мероприятие ко Дню победы и хотите найти в Интернете слова известной военной песни Булата Окуджавы «Вы слышите, грохочут сапоги». Поиск можно организовать следующим образом:

    Яндекс > Каталог > Культура и искусство > Музыка > Авторская песня

    Такой способ поиска является достаточно быстрым и эффективным. В конце вам предлагается всего несколько ссылок, среди которых есть ссылки на сайты с песнями известных бардов. Остается только найти на сайте архив с текстами песен Б. Окуджавы и выбрать в нем нужный текст.

    Другой пример. Предположим, вы собираетесь приобрести мобильный телефон и хотите сравнить характеристики аппаратов разных фирм. Поиск мог бы вестись по следующим рубрикам каталога:.

    Яндекс > Каталог > Компьютеры и связь > Мобильная связь > Мобильные телефоны

    Получив ограниченное количество ссылок, можно достаточно оперативно их просмотреть и выбрать телефон, исследовав характеристики по фирмам и модификациям аппаратов.

Поиск по ключевым словам

    Большинство поисковых машин имеют возможность поиска по ключевым словам. Это один из самых распространенных видов поиска.

Для поиска по ключевым словам необходимо ввести в специальном окне слово или несколько слов, которые следует искать, и щелкнуть на кнопке Найти.

hello_html_1fb2a4ab.jpg

    Поисковая система найдет в своей базе и покажет документы, содержащие эти слова. Таких документов может оказаться множество, но много в данном случае не обязательно означает хорошо.

    Проведем несколько экспериментов с любой из поисковых систем. Предположим, что мы решили завести аквариум и нас интересует любая информация по данной теме. На первый взгляд самое простое — это поиск по слову «аквариум». Проверим это, например, в поисковой системе Яндекс. Результатом поиска будет огромное количество страниц — огромное количество ссылок. Причем, если посмотреть внимательнее, среди них окажутся сайты, упоминающие группу Б. Гребенщикова «Аквариум», торговые центры и неформальные объединения с таким же названием, и многое другое, не имеющее отношения к аквариумным рыбкам.

    Нетрудно догадаться, что такой поиск не может удовлетворить даже непритязательного пользователя. Слишком много времени придется потратить на то, чтобы отобрать среди всех предложенных документов те, что касаются нужного нам предмета, и уж тем более на то, чтобы ознакомиться с их содержимым.

    Можно сразу сделать вывод, что вести поиск по одному слову, как правило, нецелесообразно, ведь по одному слову очень сложно определить тему, которой посвящен документ, веб-страница или сайт. Исключение составляют редкие слова и термины, которые практически никогда не используются вне своей тематической области.

    Имея определенный набор наиболее употребительных терминов в нужной области, можно использовать расширенный поиск. На рис. показано окно расширенного поиска в поисковой системе Яндекс. В этом режиме возможности языка запросов реализованы в виде формы. Подобный сервис, включающий словарные фильтры, предлагается почти всеми поисковыми системами.

hello_html_463ad09c.jpg

    Попробуем уточнить условия поиска и введем словосочетание «аквариумные рыбки». Количество ссылок уменьшится более чем в 20 раз. Этот результат нас устраивает больше, но все равно среди предложенных ссылок могут встретиться, например, русские сувенирные наборы спичечных этикеток с изображениями рыбок, и коллекции заставок для Рабочего стола компьютера, и каталоги аквариумных рыбок с фотографиями, и магазины аквариумных аксессуаров. Очевидно, что следует продолжить движение в направлении уточнения условий поиска.

    Для того чтобы сделать поиск более продуктивным, во всех поисковых системах существует специальный язык формирования запросов со своим синтаксисом. Эти языки во многом похожи. Изучить их все достаточно сложно, но любая поисковая машина имеет справочную систему, которая позволит вам освоить нужный язык.

Правила формирования запросов в поисковой системе Яндекс

    Приведем несколько простых правил формирования запроса в поисковой системе Яндекс.

Ключевые слова в запросе следует писать строчными (маленькими) буквами.

    Это обеспечит поиск всех ключевых слов, а не только тех, которые начинаются с прописной буквы.

При поиске учитываются все формы слова по правилам русского языка, независимо от формы слова в запросе.

Например, если в запросе было указано слово «знаю», то условию поиска будут удовлетворять и слова «знаем», «знаете» и т. п.

Для поиска устойчивого словосочетания следует заключить слова в кавычки.

Например, «фарфоровая посуда».

Для поиска по точной словоформе перед словом надо поставить восклицательный знак.

Например, для поиска слова «сентябрь» в родительном падеже следует написать «!сентября».

Для поиска внутри одного предложения слова в запросе разделяют пробелом или знаком &

Например, «приключенческий роман» или «приключенческий&роман». Несколько набранных в запросе слов, разделенных пробелами, означают, что все они должны входить в одно предложение искомого документа.

Если вы хотите, чтобы были отобраны только те документы, в которых встретилось каждое слово, указанное в запросе, поставьте перед каждым из них знак плюс «+». Если вы, наоборот, хотите исключить какие-либо слова из результата поиска, поставьте перед этим словом минус «-». Знаки « + » и «-» надо писать через пробел от предыдущего и слитно со следующим словом.

Например, по запросу «Волга -автомобиль» будут найдены документы, в которых есть слово «Волга» и нет слова «автомобиль».

При поиске синонимов или близких по значению слов между словами можно поставить вертикальную черту «|».

Например, по запросу «ребенок | малыш | младенец» будут найдены документы с любым из этих слов.

Вместо одного слова в запросе можно подставить целое выражение. Для этого его надо взять в скобки

Например, «(ребенок | малыш | дети | младенец) +(уход | воспитание)».

Знак «~» (тильда) позволяет найти документы с предложением, содержащим первое слово, но не содержащим второе.

Например, по запросу «книги ~ магазин» будут найдены все документы, содержащие слово «книги», рядом с которым (в пределах предложения) нет слова «магазин».

Если оператор повторяется один раз (например, & или ~), поиск производится в пределах предложения. Двойной оператор (&&,~~ ) задает поиск в пределах документа.

Например, по запросу «рак ~~ астрология» будут найдены документы со словом «рак», не относящиеся к астрологии.

    Вернемся к примеру с аквариумными рыбками. После про¬чтения нескольких предлагаемых поисковой системой документов становится понятно, что поиск информации в Интернете следует начинать не с выбора аквариумных рыбок. Аквариум — сложная биологическая система, создание и поддержание которой требует специальных знаний, времени и серьезных капиталовложений.

    На основании полученной информации человек, производящий поиск в Интернете, может кардинально изменить стратегию дальнейшего поиска, приняв решение изучить специальную литературу, относящуюся к исследуемому вопросу.

    Для поиска литературы или полнотекстовых документов возможен следующий запрос:

    «+(аквариум | аквариумист | аквариумистика) +начинающим +(советы | литература) +(статья | тезис | полнотекстовый) -(цена | магазин | доставка | каталог)».

    После обработки запроса поисковой машиной результат оказался весьма успешным. Уже первые ссылки приводят к искомым документам.

    Теперь можно подытожить результаты поиска, сделать определенные выводы и принять решение о возможных действиях:

  • Прекратить дальнейший поиск, так как в силу различных причин содержание аквариума вам не под силу.

  • Прочитать предлагаемые статьи и приступить к устройству аквариума.

  • Поискать материалы о хомячках или волнистых попугайчиках.

Вопросы.

  1. Какой вид поиска является самым быстрым и надежным?

  2. Где пользователь может найти адреса Web-страниц?

  3. Каково основное назначение поисковой системы?

  4. Из каких частей состоит поисковая система?

  5. Какие поисковые системы вы знаете?

  6. Какова технология поиска по рубрикатору поисковой системы?

  7. Какова технология поиска по ключевым словам?

  8. Когда в критерии поиска надо задавать + или -?

  9. Какие критерии поиска в Яндексе заданы следующей фразой:

 (няня|воспитатель|гувернантка)++(уход|воспитание|присмотр)?

  1. Что означает удвоение знака (~~ или ++) при формировании сложного запроса?

Задание.

Задание 1. Поиск по каталогам.

    Пользуясь каталогом поисковой системы, найдите следующую информацию (по указанию учителя):

  1. Текст песни популярной музыкальной группы

  2. Репертуар Мариинского театра на текущую неделю

  3. Характеристики последней модели мобильного телефона известной фирмы (по вашему выбору)

  4. Рецепт приготовления украинского борща с галушками

  5. Долгосрочный прогноз погоды в вашем регионе (не менее чем на 10 дней)

  6. Фотография любимого исполнителя современной песни

  7. Примерная стоимость мультимедийного компьютера (прайс)

  8. Информация о вакансиях на должность секретаря в вашем регионе или городе

  9. Гороскоп своего знака зодиака на текущий день

    По результатам поиска составьте письменный отчет в Word: представьте в документе найденный, скопированный и отформатированный материал. Предъявите отчет учителю.

Задание 2. Формирование запроса по точному названию или цитате.

    Вам известно точное название документа, например «Гигиенические требования к персональным электронно-вычислительным машинам и организации работы». Сформулируйте запрос для поиска в Интернете полного текста документа.

    Результат поиска сохраните в своей папке. Предъявите учителю.

Задание 3. Формирование сложных запросов.

  • В любой поисковой системе составьте запрос для поиска информации о русской бане. Исключите предложения об услугах, рекламу банных принадлежностей и прочую рекламу. Сосредоточьте поиск на влиянии русской бани на организм.

  • Составьте сложный запрос на поиск информации по уходу за домашними кошками. Исключите из поиска крупных кошек (например, львов), а также предложения о покупке, продаже, фотографии для обоев и т. п.

  • Текст запроса и результат поиска оформите в Word и представьте учителю.

Задание 4. Тематический поиск.

    Всеми известными вам способами выполните поиск в Интернете информации по истории развития вычислительной техники. Поиск производите по различным направлениям: историческая обстановка, техника, личности. Результаты поиска оформите в виде презентации. Используйте в презентации многоступенчатой оглавление в виде гиперссылок.

Поиск информации — это… Что такое Поиск информации?

Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе (например, MS Windows).

Поиск по изображению — поиск по содержанию изображения. Поисковая система распознает содержание фотографии (загружена пользователем или добавлен URL изображения). В результатах поиска пользователь получает похожие изображения. Так работают поисковые системы:

Методы поиска

Адресный поиск

Процесс поиска документов по чисто формальным признакам, указанным в запросе.
Для осуществления нужны следующие условия:

  1. Наличие у документа точного адреса
  2. Обеспечение строгого порядка расположения документов в запоминающем устройстве или в хранилище системы.

Адресами документов могут выступать адреса веб-серверов и веб-страниц и элементы библиографической записи, и адреса хранения документов в хранилище.

Семантический поиск

Процесс поиска документов по их содержанию.
Условия:

  • Перевод содержания документов и запросов с естественного языка на информационно-поисковый язык и составление поисковых образов документа и запроса.
  • Составление поискового описания, в котором указывается дополнительное условие поиска.

Принципиальная разница между адресным и семантическим поисками состоит в том, что при адресном поиске документ рассматривается как объект с точки зрения формы, а при семантическом поиске — с точки зрения содержания.
При семантическом поиске находится множество документов без указания адресов.
В этом принципиальное отличие каталогов и картотек.
Библиотека — собрание библиографических записей без указания адресов.

Документальный поиск

Процесс поиска в хранилище информационно-поисковой системы первичных документов или в базе данных вторичных документов, соответствующих запросу пользователя.

Два вида документального поиска:

  1. Библиотечный, направленный на нахождение первичных документов.
  2. Библиографический, направленный на нахождение сведений о документах, представленных в виде библиографических записей.

Фактографический поиск

Процесс поиска фактов, соответствующих информационному запросу.
К фактографическим данным относятся сведения, извлеченные из документов, как первичных, так и вторичных и получаемые непосредственно из источников их возникновения.

Различают два вида:

  1. Документально-фактографический, заключается в поиске в документах фрагментов текста, содержащих факты.
  2. Фактологический (описание фактов), предпологающий создание новых фактографических описаний в процессе поиска путем логической переработки найденной фактографической информации.

Информационный поиск как наука

Информационный поиск — большая междисциплинарная область науки, стоящая на пересечении когнитивной психологии, информатики, информационного дизайна, лингвистики, семиотики, и библиотечного дела.

ИП рассматривает поиск информации в документах, поиск самих документов, извлечение метаданных из документов, поиск текста, изображений, видео и звука в локальных реляционных базах данных, в гипертекстовых базах данных таких, как Интернет и локальные интранет-системы.

Существует некоторая путаница, связанная с понятиями поиска данных, поиска документов, информационного поиска и текстового поиска. Тем не менее, каждое из этих направлений исследования обладает собственными методиками, практическими наработками и литературой.

В настоящее время ИП — это бурно развивающаяся область науки, популярность которой обусловлено экспоненциальным ростом объемов информации, в частности в сети Интернет. ИП посвящена обширная литература и множество конференций. Одной из наиболее известных является Министерством обороны США совместно с Институтом Стандартов и Технологий (NIST) с целью консолидации исследовательского сообщества и развития методик оценки качества ИП.

Запрос и объект запроса

Говоря о системах ИП, употребляют термины запрос и объект запроса.

Запрос — это формализованный способ выражения информационных потребностей пользователем системы. Для выражения информационной потребности используется язык поисковых запросов, синтаксис варьируется от системы к системе. Кроме специального языка запросов, современные поисковые системы позволяют вводить запрос на естественном языке.

Объект запроса — это информационная сущность, которая хранится в базе автоматизированной системы поиска. Несмотря на то, что наиболее распространенным объектом запроса является текстовый документ, не существует никаких принципиальных ограничений. В частности, возможен поиск изображений, музыки и другой мультимедиа информации. Процесс занесения объектов поиска в ИПС называется индексацией. Далеко не всегда ИПС хранит точную копию объекта, нередко вместо неё хранится суррогат.

Задачи информационного поиска

Центральная задача ИП — помочь пользователю удовлетворить его информационную потребность. Так как описать информационные потребности пользователя технически непросто, они формулируются как некоторый запрос, представляющий из себя набор ключевых слов, характеризующий то, что ищет пользователь.

Классическая задача ИП, с которой началось развитие этой области, — это поиск документов, удовлетворяющих запросу, в рамках некоторой статической коллекции документов. Но список задач ИП постоянно расширяется и теперь включает:

  • Вопросы моделирования;
  • Извлечение информации, в частности аннотирования и реферирования документов;

Оценки эффективности

Существует много способов оценить насколько хорошо документы, найденные ИПС, соответствуют запросу. К сожалению, понятие степени соответствия запроса, или другими словами релевантности, является субъективным понятием, а степень соответствия зависит от конкретного человека, оценивающего результаты выполнения запроса.

Точность (precision)

Определяется как отношение числа релевантных документов, найденных ИПС, к общему числу документов:

\mbox{Precision}=\frac{,

где Drel — это множество релевантных документов в базе, а Dretr — множество документов, найденных системой. По результатм исследований компании, оценивающей релевантность показателей основных русских и зарубежных поисковых систем.

Точность рамблера~ 0,756. яндекса~0.706, гугла~0.899 апорта~0.705 yahoo~0.689 altavista~0.698 Эти показатели были получены на основе анализа запроса на слово cat и по тому, как много релевантных ссылок выдаёт поисковик на 100 первых ответов.

Полнота (recall)

Отношение числа найденных релевантных документов, к общему числу релевантных документов в базе:

\mbox{Recall}=\frac{,

где Drel — это множество релевантных документов в базе, а Dretr — множество документов, найденных системой.

Выпадение (fall-out)

Выпадение характеризует вероятность нахождения нерелевантного ресурса и определяется, как отношение числа найденных нерелевантных документов к общему числу нерелевантных документов в базе:

\mbox{Fall-out}=\frac{,

где Dnrel — это множество нерелевантных документов в базе, а Dretr — множество документов, найденных системой.

F-мера (F-measure, мера Ван Ризбергена)

Традиционно F-мера определяется, как гармоническое среднее точности и полноты:

F = 2 \times \mathrm{Precision} \times \mathrm{Recall} / (\mathrm{Precision} + \mathrm{Recall}).\,

Часто ее также называют F1 мерой, потому что точность и полнота присутствуют в этой формуле с одинаковым весом.

Более общая формула для положительного вещественного α имеет вид:

F_\alpha = (1 + \alpha) \times \mathrm{Precision} \times \mathrm{Recall} / (\alpha \times \mathrm{Precision} + \mathrm{Recall}).\,

См. также

Ссылки

Литература

  • Дональд Кнут Искусство программирования, том 3. Сортировка и поиск = The Art of Computer Programming, vol.3. Sorting and Searching. — 2-е изд. — М.: «Вильямс», 2007. — С. 824. — ISBN 0-201-89685-0

Урок+ПР «Поиск информации в интернет»

Урок «Поиск информации в Интернете»

hello_html_11090369.pnghello_html_11090369.pngЦель:

Освоить основные методы поиска в сети; знать способы представления информации в Интернете.

уметь ориентироваться в логических уровнях организации информации

Задачи:

Образовательная – формирование навыков поиска информации в сети Интернет;

Развивающая – развитие у учащихся умения ориентироваться в логических уровнях организации информации.

Воспитательная – воспитание у учащихся ответственности к делу, интереса к информатике.

Тип урока:

изучение нового материала.

Формы обучения:

Фронтальная, индивидуальная.

Методы обучения:

Словесный, наглядный, практический, частично-поисковый.

Оборудование:

  • Компьютер с выходом в Интернет, мультимедийный проектор, кабинет, оснащённый персональными компьютерами с выходом в Интернет из расчёта 1 ученик – 1 компьютер.

  • Презентация к уроку

Краткий план урока:

  1. Организационный момент, ТБ – 5 мин.

  2. Технологии поиска информации в сети Интернете – 30 мин.

  3. Решение задач по теме.

  4. Работа в группах по поиску информации в Интернет. Анализ поиска. – 15 мин.

  5. Сообщения от учащихся результатов поиска – 10 мин.

  6. Подведение итогов урока – 10 мин.

Ход урока

1. Организационный момент.

Учитель:

  1. Какие виды компьютерных сетей вам известны?

  2. Что такое Интернет?

  3. Какие программы для выхода в Интернет вам известны? Какое общее название у этих программ?

  4. Почему Интернет так популярен в сегодняшнем мире?

2. Изучение новой темы

Учитель:

Существуют три способа поиска информации в Интернете :

  1. Указание адреса страницы.

  2. Передвижение по гиперссылкам.

  3. Обращение к поисковой системе (поисковому серверу).

Остановимся на каждом из них:

Указание адреса страницы – это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа или сайта, где расположен документ.

Передвижение по ссылкам – Это наименее удобный способ, так как с его помощью можно искать документы, только близкие по смыслу текущему документу.

Но этот способ очень простой и подходит для начинающего пользователя.

Пользуясь гипертекстовыми ссылками, можно бесконечно долго путешествовать в информационном пространстве Сети, переходя от одной web-страницы к другой, но если учесть, что в мире созданы многие миллионы web-страниц, то найти на них нужную информацию таким способом вряд ли удастся.

Здесь на помощь приходят специальные поисковые системы (их еще называют поисковыми машинами). Адреса поисковых серверов хорошо известны всем, кто работает в Интернете. В настоящее время в русскоязычной части Интернета популярны следующие поисковые серверы: Яндекс (yandex.ru), Google (google.ru), Rambler (rambler.ru) и некоторые другие.

Что же такое – поисковая система?

Во всемирной паутине Интернет находится несколько тысяч поисковых систем. У каждой системы свои достоинства и недостатки. Критерием выбора поисковой системы могут служить такие характеристики, как:

  • Принцип работы поисковой системы.

  • Удобство использования.

  • Сложность языка запросов.

  • Скорость работы.

Существуют 2 основных типа поисковых систем Интернет: индексные и классификационные (каталоговые).

Индексные поисковые системы, работая в автоматическом режиме обновления своей информации, просматривают в сети Интернет содержимое серверов, индексируют всю информацию, содержащуюся в них и вносят информацию о расположении слов на страницах сайтов в свои базы данных.

Каталоговые системы поиска содержат тематически структурированный каталог серверов и чаще всего пополняются вручную.

Основные понятия и характеристики результатов поиска.

Информационная потребность – сведения и данные, необходимые пользователю в данный момент.

Свойство релевантности – совокупность документов, которая соответствует запросу.

Полнота поиска – отражает отношение релевантных откликов к количеству всех возможных документов, удовлетворяющих информационную потребность потребителя.

Точность поиска – выражает отношение совокупности релевантных откликов, к количеству всех выданных документов.

А теперь давайте попробуем вывести правила поиска информации в сети Интернет?

  1. Учитывать особенности естественного языка.

  2. Не допускать орфографических ошибок.

  3. Избегать поиска по одному слову, использовать необходимый и достаточный набор слов.

  4. Не писать большими буквами.

  5. Исключать из поиска не нужные слова.

Понятие языка запросов.

! ИНФОРМАТИКА

(из поиска будут исключены слова Информатику, Информатике и т.д.)

+

Обязательное присутствие слов в найденных документах

УРОК по+пятница

(должны быть выбраны страницы, где встречаются слово не только УРОК) но обязательное условие наличие слова «пятница»

&

Обязательное вхождение слов в одно предложение

Информатика & ОГЭ

«»

Поиск устойчивых словосочетаний

«ОГЭ по информатике» (учитывается строгая последовательность слов, слово «система педагогическая» будет исключена)

А теперь ответим на несколько вопросов (Приложение 1, слайд11):

– Назовите основные способы поиска информации?

– Какие два вида поисковых машин вы знаете?

– Назовите наиболее популярные поисковые машины Интернета.

– Назовите правила поиска информации?

— Для чего используются языки запросов?

3. Решение задач по теме по материалам для подготовки к ЕГЭ.

4. Практическая деятельность за ПК:

  1. В каком году изобрели компьютерную мышь?

  2. Что означает термин «энтропия» с точки зрения теории информации?

После выполнения задания учащиеся сообщают результаты поиска информации.

В конце урока учитель подводит его итог, оценивает работу учащихся.

Учитель: Урок окончен. Спасибо за урок!

Поиск информации в Интернете (стр. 1 из 3)

Поиск информации в интернет

Общие сведения.

В настоящее время Интернет объединяет сотни миллионов серверов, на которых размещены миллиарды различных сайтов и отдельных файлов, содержащих различного рода информацию. Это гигантское хранилище информации. Существуют различные приемы поиска информации в Интернет.

Поиск по известному адресу. Необходимые адреса берутся из справочников. Зная адрес, достаточно ввести его в адресную строку Браузера.

Пример 1.

www.gov.ru — сервер органов государственной власти России.

Конструирование адреса пользователем. Зная систему формирования адреса в Интернет, можно при поискеWeb-сайтов конструировать адреса.

К ключевому слову (названию фирмы, предприятия, организации или простому английскому существительному) необходимо добавить домен тематический или географический, при этом необходимо подключать интуицию.

Пример 2.

Адреса коммерческих Web-страниц:

www.cnn.com (всемирные новости CNN),

www.sony.com (фирма SONY),

www.mtv.com (музыкальные новости MTV).

Пример 3.

Адреса учебных заведений:

www.ntu.edu (Национальный университет США).

Пример 4.

Адреса региональных серверов:

www.poland.net (Польша),

www.israil.net (Израиль).

Поисковые системы Интернет

Для поиска информации в Интернет разработаны специальные информационно-поисковые системы. Поисковые системы имеют обычный адрес и отображаются в виде Web-страницы, содержащей специальные средства для организации поиска (строку для поиска, тематический каталог, ссылки). Для вызова поисковой системы достаточно ввести ее адрес в адресную строку Браузера.

По способу организации информации информационно-поисковые системы делятся на два вида: классификационные (рубрикаторы) и словарные.

Рубрикаторы (классификаторы) — поисковые системы, в которых используется иерархическая (древовидная) организация информации. При поиске информации пользователь просматривает тематические рубрики, постепенно сужая поле поиска (например, если необходимо найти значение какого-то слова, то сначала в классификаторе нужно найти словарь, а затем уже в нем найти нужное слово).

Словарные поисковые системы — это мощные автоматические программно-аппаратные комплексы. С их помощью просматривается (сканируется) информация в Интернет. В специальные справочники-индексы заносятся данные о местонахождении той или иной информации. В ответ на запрос осуществляется поиск в соответствии со строкой запроса. В результате пользователю предлагаются те адреса (URL), на которых в момент сканирования найдены искомые слово или группа слов. Выбрав любой из предложенных адресов-ссылок, можно перейти к найденному документу. Большинство современных поисковых систем являются смешанными.

Наиболее известные и популярные системы поиска:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

Существуют системы, специализирующиеся на поиске информационных ресурсов по различным направлениям.

Поиск людей в Интернет:

www.whowhere.ru ww. bigfoot.com

Поиск по телеконференциям (Usenet):

www.dejanews.com

Предметные поисковые системы:

www.webring.org

Поиск программного обеспечения:

www.files.com

www.files.ru

Поиск по файловым архивам:

http://ftpseach. city.ru, http://ftpsearch. licos.com

Каталоги (тематические подборки ссылок с аннотациями):

http://www.atrus.ru

www.aup.ru

Часто эффективный поиск информации можно провести с помощью региональных каталогов — специализированных серверов, содержащих данные о предприятиях или Web-ресурсах какого-то города или региона. Например, для Санкт-Петербурга такой каталог располагается по адресу http://www.spb.ru.

Список ИПС можно найти на сайте www.monk. newmail.ru

Более подробный перечень поисковых систем и каталогов представлен в табл. 3.2.

Правила выполнения запросов

В каждой поисковой системе в разделе Помощь (Help) можно получить сведения о том, как искать, как составить строку запроса. Ниже приведена информация о типовом, «усредненном» языке запросов.

Простой запрос.

Ввести одно слово, определяющее тему поиска. Например, в поисковой системе Rambler.ru достаточно ввести: автоматика.

Находятся документы, в которых встречаются слова, указанные в запросе. Распознаются все формы слов русского языка, как правило, регистр букв игнорируется.

В запросе можно использовать символ «*» или «?». Знаком «?» в ключевом слове заменяется один символ, на место которого может быть подставлена любая буква, а знаком «*» — последовательность символов.

Например, запрос автомат* позволит найти документы, включающие слова автоматический, автоматика и т.д.

Сложный запрос.

Часто возникает необходимость комбинирования ключевых слов для получения более определенной информации. В этом случае используются дополнительные слова-связки, функции, операторы, символы, комбинации операторов, разделенные скобками.

Например, запрос музыка & (beatles | битлз) означает, что пользователь ищет документы, содержащие слова музыка и beatles или музыка и битлз.

В табл.3.1 приведены правила формирования запросов, принятые в системе Апорт (http://www.aport.ru).

Таблица 3.1

Операторы для формирования запросов

Таблица 3.2

Список поисковых серверов и каталогов

Поиск информации в Интернете: подводные камни

Проблемы, не лежащие на поверхности, нередко дают о себе знать лишь «задним числом», после того как определенный этап поисковых работ завершен и, возможно, исходя из его результатов уже принято какое-либо решение. Что же мешает сделать ситуацию прозрачной с самого начала эксплуатации той или иной информационно-поисковой системы (ИПС)? Ответ довольно прост: отсутствие исчерпывающей информации подобного рода со стороны разработчика. Прямым следствием этого становятся недостоверность получаемых данных и их неконтролируемая потеря. Редко удается встретить в Сети поисковую систему, которая не обладала бы некоторыми «недокументированными» особенностями. Казалось бы — пользователю необходимо не так уж много сведений, а именно:

как происходит наполнение базы данных ИПС и каков ее объем;

полный спектр возможностей поискового языка системы;

основные особенности представления результатов поиска, прежде всего алгоритма ранжирования записей из списка отклика на поисковый запрос.

Увы, источником подобной информации обычно является не документ, доступный с головной страницы поискового сервера, а разбросанные по Сети, книгам и компьютерным журналам публикации отдельных авторов. К причинам такого положения дел, по-видимому, можно отнести не только небрежность разработчика, но и фактор, именуемый маркетинговой политикой. Проще говоря, предоставление поисковой системой наиболее полной информации о самой себе не всегда положительно сказывается на ее рейтинге. Тем не менее, взять ситуацию под контроль в ряде случаев пользователю оказывается вполне по силам. Выяснить особенности работы избранного поискового сервиса часто удается с помощью тестирования. Построение специальных тестовых запросов, быстро проясняющих именно тот аспект работы системы, который наиболее важен для текущей задачи, во многих случаях оказывается нетривиальным. Тому, как избежать некоторых неприятностей при работе с ИПС, мы и посвятим наше обсуждение. В качестве примеров, иллюстрирующих изложение, будут рассмотрены широко известные поисковые системы Интернета.

«Поиск информации в Интернете». 8-й класс

Цель: понимать основные принципы организации поиска информации в Интернете.

Задачи:

Образовательная:

  • формирование навыков поиска информации в сети Интернет;
  • использовать поиск и отбор информации в практической деятельности и повседневной жизни;

Развивающая:

  • развитие у школьников логического мышления, внимательности, творческого подхода к делу;

Воспитательная:

  • воспитание у учащихся ответственности к делу, интереса к информатике, коллективизма и взаимовыручки.

Тип урока: изучение нового материала.

Формы обучения: Фронтальная, индивидуальная, групповая.

Методы обучения: Словесный, наглядный, практический, поисковый.

Оборудование:

План урока:

  1. Организационный момент – 2 мин.
  2. Приёмы поиска информации в сети Интернет – 18 мин.
  3. Служба World Wide Web (WWW)
  4. Информационно-поисковые системы
  5. Поисковые каталоги.
  6. Поисковые системы.
  7. Формирование запросов на поиск информации.
  8. Работа в группах по поиску информации в Интернет – 15 мин.
  9. Выполнение теста – 5 мин.
  10. Подведение итогов урока – 5 мин.

Ход урока

1. Организационный момент.

2. Приёмы поиска информации в сети Интернет

Сеть Интернет растет очень быстрыми темпами, найти нужную информацию среди сотен миллиардов Web-страниц и сотен миллионов файлов становится все сложнее. Для поиска информации используются специальные поисковые системы, которые содержат постоянно обновляемую информацию о местонахождении Web-страниц и файлов на сотнях миллионов серверов Интернета.

Прежде, чем рассматривать информационно-поисковые системы, нам надо разобраться с вопросами — что мы можем искать и где, а после — как организовать такой поиск.

Хранения информации обычно завершается поиском конкретной информации для дальнейшего использования. Поиск органически связан с процедурой хранения, поэтому он не всегда выделяется отдельно.

Служба World Wide Web (WWW)

Это самая популярная служба современного Интернета. Именно её нередко отождествляют с Интернетом в целом, хотя на самом деле это лишь одна из его многочисленных служб.

Определение WWW

Основатель сети Тим Бернес-Ли дал такое определение.

WWW — это сеть серверов, распределённая гетерогенная информационная мультимедиа-система коллективного пользования.

Из определения понятно, какую огромную роль в современном обществе имеет компьютерная информационная среда. Среда WWW не имеет централизованной структуры. Все, кто желает разместить в Интернете свои материалы, не противоречащие законодательству, могут это сделать. Отдельный документ World Wide Web называют Web-страницей. Обычно это комбинированный документ, который может содержать текст, графические иллюстрации, мультимедийные и другие объекты. Отличительной особенностью среды WWW является наличие средств перехода от одного документа к другому, тематически с ним связанному, без явного указания адреса. Связь между документами осуществляется при помощи гипертекстовых ссылок. Огромное число гипертекстовых электронных документов, хранящихся на серверах WWW, образует своеобразное гиперпространство документов, между которыми возможно перемещение.

Связь между сотнями миллионов документов, хранящихся на физических серверах Интернета, не могла бы существовать, если бы каждый документ в этом гиперпространстве не обладал своим уникальным адресом. Файл одного локального компьютера обладает уникальным полным именем, в которое входит собственное имя файла с расширением и путь доступа к файлу, начиная от имени устройства, на котором он хранится. Определяя местоположение файла в Глобальной сети, надо расширить представление об уникальном имени файла. Адрес любого файла во всемирном масштабе определяется унифицированным указателем ресурса — URL. URL-адрес представляет собой стандартизованную строку символов, указывающую местонахождение ресурса, документа или его части в Интернете, и состоит из трех частей.

  • имя протокола для доступа к службе Интернет;
  • имя сервера, на котором хранится ресурс и работает сервер-программа службы Интернет;
  • полное имя файла, который хранится на сервере.

Для функционирования службы Интернет, необходимо серверное и клиентское программное обеспечение. Работу службы World Wide Web обеспечивают серверные программные средства — Web-серверы, и клиентские программы — Web-браузеры.

Информационно-поисковые системы

Информационные службы определяют технологию хранения, передачи информационных объектов и, соответственно, алгоритмы поиска.

Web-документы хранятся на Web-серверах, файлы и файловые архивы — на файловых серверах. В связи с этим, набор информационных объектов, доступных с помощью каждого сервиса, может рассматриваться как отдельное информационно-поисковое пространство.

Теперь, зная, что мы можем искать и где, обратимся к вопросу – как организовать такой поиск.

В настоящее время для поиска конкретной информации существуют так называемые информационно-поисковые системы или, как принято выражаться на языке Интернет, поисковые службы. Поисковая система представляет собой специализированный Web-узел. Принцип работы таких систем прост: пользователь должен объяснить системе, что ему необходимо получить, а задача поисковой службы состоит в том, чтобы найти и выдать список гиперссылок на страницы, на которых упоминаются соответствующие сведения.

Классификация поисковых служб:

  • по способу организации и пополнения базы данных о документах в сети на поисковые каталоги и поисковые машины;
  • по глубине охвата ресурса на глобальные и локальные.

Особенности поисковых каталогов

Поисковые каталоги устроены по тому же принципу, что и тематические каталоги крупных библиотек. Принципы работы с каталогами достаточно просты. Как правило, главная страница Web-сайта каталога содержит в себе список категорий, или рубрик, каждая из которых представлена гиперссылкой.

Работа с поисковыми каталогами интуитивно проста. В них поиск информации практически всегда завершается более или менее плодотворно. Однако за этой простотой скрывается высочайшая сложность создания и ведения каталога.

Важнейшей характеристикой каталогов является объем базы данных, т.е. количество представленных документов. Для глобальных каталогов данная величина составляет примерно 1-2 миллиона документов, что составляет порядка 0,1-0,2% от общего пространства WWW, и степень охвата общего объема ресурсов WWW непрерывно уменьшается из-за лавинообразного увеличения информационных ресурсов в Глобальной сети. Поэтому использование каталогов не может дать результатов, обладающих высокой полнотой.

По сравнению с поисковыми машинами скорость увеличения баз данных каталогов достаточно мала. Дело в том, что поисковые каталоги создаются вручную, коллективом высококвалифицированных редакторов, которых называют также модераторами. Однако это может рассматриваться и как преимущество поисковых систем, поскольку ручной отбор позволяет повысить точность поиска и распределение материалов по соответствующим рубрикам.

Другой характеристикой каталогов является количество категорий или рубрик в каталоге. Естественно, чем выше это значение, тем большей точностью характеризуются результаты поиска. Для глобальных каталогов это значение в настоящее время составляет несколько десятков тысяч.

Особенности поисковых машин

В поисковых машинах каталоги Web-ресурсов создаются автоматически специальными программами, называемыми поисковыми роботами или поисковыми указателями (а также “червяками”, “пауками”, “траулерами”, “автоматами”, “агентами” и т.п.). Из процесса наполнения базы данных поисковой системы исключается человеческий фактор. При этом падает качество ссылок, предоставляемых системой по результатам поиска, но одновременно увеличивается их количество.

Программа Поисковый робот осуществляет просмотр Сети с целью выявления новых документов для включения их в базу данных поисковой машины — индекс. Процесс занесения информации о документе в индекс называется индексированием.

Этапы работы поискового робота

  1. Сбор первичной базы данных.
  2. Индексация базы данных.
  3. Создание результирующего списка ссылок.

Формирование запросов на поиск информации

Осуществляя поиск информации в Интернете, мы вправе надеяться на полноту, точность и актуальность результатов поиска, к тому же результаты мы хотим получить как можно быстрее.

На часть из перечисленных факторов пользователь, проводящий поиск, не может повлиять. Например, скорость получения информации зависит от технических характеристик и загруженности каналов связи и серверов поисковых служб, а также особенностями алгоритмов, реализованных в поисковой системе. Однако, пользователь может повлиять на качество результатов поиска, если при проведении поисковых работ будет:

  • делать оправданный выбор информационно-поисковой службы;
  • учитывать особенности информационно-поисковой системы;
  • грамотно формулировать запросы на поиск информации.

Формирование запроса — это процесс выражения информационной потребности с помощью ключевых слов и комбинирования этих ключевых слов с помощью средств информационно-поискового языка системы.

На качество запроса оказывают воздействие три фактора: знание пользователем особенностей естественного языка, умение учитывать   языковые особенности документов и знание структуры и особенностей информационно-поискового языка.

Структуры и особенности информационно-поискового языка

Для повышения точности результатов поиска, как уже было отмечено, важно грамотно формулировать запросы на поиск информации. Информационно-поисковые языки предоставляют пользователю большое число операторов, т.е. служебных слов, которые используются для комбинирования ключевых слов запроса. Каждая поисковая машина имеет свой состав операторов, однако обычно эти операторы объединены в группы, общие для большинства систем.

Операторы поисковых систем

При использовании языков запроса приходится учитывать, что они сильно отличаются в различных поисковых машин. Это становится большой проблемой при использовании сложных запросов в метапоисковых системах.

Логические операторы

В поисковых системах обычно имеются три оператора: “логическое И”, “логическое ИЛИ” и “логическое НЕ”. Оператор “логическое И” указывается между ключевыми словами, если необходимо выдать документы, содержащие все искомые слова. “Логическое ИЛИ” используется при необходимости поиска документов, содержащих хотя бы одно из ключевых слов, связанных этим оператором. Оператор “логическое НЕ” необходим для исключения из списка документов, в которых присутствует слово, предваренное в запросе этим оператором.

Приложение 3

Простая ситуация поясняет изложенное выше. Запрос “автобус и трамвай” или “автобус трамвай” выдаст только документы, в которых одновременно встречаются слова и автобус, и трамвай.

Запрос “автобус или трамвай” выдаст три типа документов: в документе есть только слово автобус, в документе есть только слово трамвай, в документе есть слова автобус и трамвай.

Символ “!”, в Яндексе, например, означает закрепление регистра. Если вы ищите название села “Остров”, а не географическое понятие “остров”, следует написать “!Остров”. При поиске информации о фильме “Остров” запрос лучше оформить в виде цитаты: “фильм Остров”.

Операторы расстояния

Большинство поисковых машин в настоящее время предоставляют возможность использовать так называемые операторы расстояния, которые задают ограничения на удаленность вхождений ключевых слов друг от друга в тексте документа. Как правило, выделяют три оператора этой группы: оператор поиска фразы, позволяющий находить точные вхождения указанной последовательности слов (фраза задаётся в кавычках), оператор, с помощью которого задаётся расстояние в словах, и оператор, задающий расстояние в предложениях.

Прочие операторы

Помимо двух указанных групп существуют также операторы:

  • учета особенностей естественного языка;
  • выбора части документа, по которой осуществляется поиск;
  • отбора для поиска страниц, написанных на определенном языке;
  • ограничения поиска определенным типом файла;
  • поиска текста в заголовках страниц;
  • выбора подмножества документов.

Состав этих групп сильно зависит от поисковой машины.

Работа в группах по поиску информации в Интернет – 15 мин.

Группам учащихся выдает задание Приложение 2.

Выполнение теста – 5 мин.

Приложение 3.

Подведение итогов урока – 5 мин.

Давайте подведем итоги нашей работы. Вы друг за другом высказываетесь одним предложением, выбирая начало фразы из рефлексивного экрана.

  • Сегодня я узнал…
  • Было трудно…
  • Я выполнял задания…
  • Я научился…
  • Я приобрел…
  • Я понял, что…
  • Было интересно…

Домашнее задание

1. Параграф 3.5. Ответить на вопросы после параграфа.

2. Выполнить письменно. Предложен список различных поисковых систем. Распределите их в две колонки.

Российская система Международная система
   
   

Литература

  1. Информатика и ИКТ., Н.Д.Угринович, 8 класс

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *