Поиск информации в интернет – Поиск информации в сети Интернет. Полезные и интересные ссылки в Интернет. Мытищинский филиал МГТУ им. Н. Э. Баумана (МГУЛ)

Содержание

16. Поиск информации в интернете

16.Поиск информации в интернете

Информация, размещенная во Всемирной сети, исчисляется огромным количеством байт. Для поиска информации во Всемирной сети используются специальные веб-сайты – информационно-поисковые системы. Они позволяют по ключевым словам найти информационные ресурсы, связанные с ключевыми словами. Это может быть текст, содержащий ключевые слова, или графическое изображение одного из ключевых слов. Примерами информационно-поисковых систем являются системы Google и Yandex.

Поиск информации – одна из самых востребованных на практике задач, которую приходится решать любому пользователю Интернета.

Существуют три основных способа поиска информации в Интернет:

1. Указание адреса страницы.

2. Передвижение по гиперссылкам.

3. Обращение к поисковой системе (поисковому серверу).

Способ 1: Указание адреса страницы

Это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа или сайта, где расположен документ.

Не стоит забывать возможность поиска по открытой в окне браузера web-странице (Правка-Найти на этой странице…).

Способ 2: Передвижение по гиперссылкам

Это наименее удобный способ, так как с его помощью можно искать документы, только близкие по смыслу текущему документу.

Способ 3: Обращение к поисковой системе

Пользуясь гипертекстовыми ссылками, можно бесконечно долго путешествовать в информационном пространстве Сети, переходя от одной web-страницы к другой, но если учесть, что в мире созданы многие миллионы web-страниц, то найти на них нужную информацию таким способом вряд ли удастся.

На помощь приходят специальные поисковые системы (ихеще называют поисковыми машинами). Адреса поисковых серверов хорошо известны всем, кто работает в Интернете. В настоящее время в русскоязычной части Интернет популярны следующие поисковые серверы:Яндекс (yandex.ru), Google (google.ru) и Rambler (rambler.ru

Поисковая система — веб-сайт, предоставляющий возможность поиска информации в Интернете.

Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.

По принципу действия поисковые системы делятся на два типа: поисковые каталоги и поисковые индексы.

Поисковые каталоги служат для тематического поиска.

Информация на этих серверах структурирована по темам и подтемам. Имея намерение осветить какую-то узкую тему, нетрудно найти список web-страниц, ей посвященных.

Катало́г ресурсов в Интернете или каталог интернет-ресурсов или просто интернет-каталог — структурированный набор ссылок на сайты с кратким их описанием.

Каталог в котором ссылки на сайты внутри категорий сортируются по популярности сайтов называется рейтинг (или топ).

Поисковые индексы работают как алфавитные указатели. Клиент задает слово или группу слов, характеризующих его область поиска, — и получает список ссылок на web-страницы, содержащие указанные термины.

Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, разработанный Мэтью Грэйем из Массачусетского технологического института в 1993.

Как работает поисковой индекс?

Поисковые индексы автоматически, при помощи специальных программ(веб-пауков), сканируют страницы Интернета и индексируют их, то есть заносят в свою огромную базу данных.

Поисковый робот ( «веб-паук») — программа, являющаяся составной частью поисковой системы и предназначенная для обхода страниц Интернета с целью занесения информации о них (ключевые слова) в базу поисковика. По своей сути паук больше всего напоминает обычный браузер. Он сканирует содержимое страницы, забрасывает его на сервер поисковой машины, которой принадлежит и отправляется по ссылкам на следующие страницы.

В ответ на запрос, где найти нужную информацию, поисковый сервер возвращает список гиперссылок, ведущих web-страницам, на которых нужная информация имеется или упоминается. Обширность списка может быть любой, в зависимости от содержания запроса.

http://www.yandex.ru/

Яндекс — российская система поиска в Сети. Сайт компании, Yandex.ru, был открыт 23 сентября 1997 года. Головной офис компании находится в Москве. У компании есть офисы в Санкт-Петербурге, Екатеринбурге, Одессе и Киеве. Количество сотрудников превышает 700 человек.

Слово «Яндекс» (состоящее из буквы «Я» и части слова index; обыгран тот факт, что русское местоимение «Я» соответствует английскому «I») придумал Илья Сегалович, один из основателей Яндекса, в настоящий момент занимающий должность технического директора компании.

Поиск Яндекса позволяет искать по Рунету документы на русском, украинском, белорусском, румынском, английском, немецком и французском языках с учётом морфологии русского и английского языков и близости слов в предложении. Отличительная особенность Яндекса — возможность точной настройки поискового запроса. Это реализовано за счёт гибкого языка запросов.

По умолчанию Яндекс выводит по 10 ссылок на каждой странице выдачи результатов, в настройках результатов поиска можно увеличить размер страницы до 20, 30 или 50 найденных документов.

Время от времени алгоритмы Яндекса, отвечающие за релевантность выдачи, меняются, что приводит к изменениям в результатах поисковых запросов. В частности, эти изменения направлены против поискового спама, приводящего к нерелевантным результатам по некоторым запросам.

http://www.google.ru/

Лидер поисковых машин Интернета, Google занимает более 70 % мирового рынка. Cейчас регистрирует ежедневно около 50 млн поисковых запросов и индексирует более 8 млрд веб-страниц. Google может находить информацию на 115 языках.

По одной из версий, Google — искажённое написание английского слова googol. «Googol (гугол)» – это математический термин, обозначающий единицу со 100 нулями. Этот термин был придуман Милтоном Сироттой, племянником американского математика Эдварда Каснера, и впервые описан в книге Каснера и Джеймса Ньюмена «Математика и воображение»(Mathematics and the Imagination). Использование этого термина компанией Google отражает задачу организовать огромные объемы информации в Интернете.

Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д.

http://www.rambler.ru/

Rambler Media Group — интернет-холдинг, включающий в качестве сервисов поисковую систему, рейтинг-классификатор ресурсов российского Интернета, информационный портал.

Rambler создан в 1996 году.

Поисковая система Рамблер понимает и различает слова русского, английского и украинского языков. По умолчанию поиск ведётся по всем формам слова.

Поиск информации в интернете — способы поиска информации с применением языка запросов

Становимся профессионалами поиска информации в интернете

Всем привет! В сегодняшней статье я расскажу вам о том, как научиться быстрее и качественнее отыскивать нужную вам информацию. Однажды мне, по долгу службы, пришлось выполнять заказ, информации по которому было совсем мало и найти ее было тяжело. Приходилось перелопачивать пол интернета, чтобы найти нужную информацию. Именно в тот момент, я решил поближе познакомиться с расширенными возможностями поисковых систем. В результате знакомства были найдены интересные способы поиска, которые в дальнейшем очень помогли закончить тот сложный  проект.

Содержание статьи

Существуют три основных способа поиска информации в Интернет:

  1. Указание адреса страницы.
  2. Передвижение по гиперссылкам.
  3. Обращение к поисковой системе (поисковому серверу).

О последнем пункте и поговорим дальше. В этой статье речь пойдет об известных поисковиках, о принципах их работы и о расширенных возможностях поисковых систем. Вы узнаете некоторые интересные способы поиска и получите массу полезных советов, которые непременно облегчат вам поиск нужной информации в интернете.

Как работают системы веб-поиска

По данным сервиса статистики LiveInternet.ru распределение поисковых систем в России примерно следующее:

  1. Яндекс — 53.9%
  2. Гугл — 35.0%
  3. Поиск Mail.ru — 8.3%
  4. Рамблер — 0.9%
  5. Яндекс (картинки) — 0.6%
  6. Гугл (картинки) — 0.2%
Данные сервиса статистики LiveInternet.ru

Теперь, чтобы лучше понять, как работают поисковые системы, сделаем краткий обзор механизма работы. Поисковая система работает в следующем порядке:

  • Сбор данных поисковым роботом пауком (Web crawling)
  • Индексация найденных данных (Indexing)
  • Поиск по индексированным данным (Searching)

Сбор данных поисковым роботом пауком

Обычно делится на 2 этапа – скачивание веб-страницы и анализ ссылок. Первый этап выполняет Spider (быстрый поисковый паук) – программа для последовательного перебора и скачивания веб-страниц для анализа. Она получает веб-страницы с сайтов по определенному алгоритму и отдает их другой программе Crawler-у. После этого в дело вступает Crawler (медленный паук анализатор), который находит все ссылки и составляет дальнейший маршрут для spider-а. У spider-а есть определенный список сайтов для посещения, заранее подготовленный другими подсистемами поиска. Из этого списка spider получает все необходимые данные.

Индексация найденных данных

После того, как проходит первый этап, в дело вступает вторая подсистема – подсистема индексации. Она размещает найденную пауками информацию так, чтобы было удобно в дальнейшем к ней обращаться. Для этого программа Индексатор разбирает страницу на различные ее части и анализирует их. Из страницы выделяются заголовки страниц, ссылки, текст, структурные элементы и т.д. Все полученные данные структурируются по определенному алгоритму и затем полученные данные заносятся в базу данных.

Поиск по индексированным данным

Эта подсистема выдачи результатов, которая использует сформированную индексатором базу данных. Она определяет, какие страницы удовлетворяют запросу пользователя и показывает результаты поиска. Когда вы вводите ключевое слово и делаете поиск, поисковая система отбирает результаты на основании следующих критериев:

  1. Title (заголовок): Есть ли ключевое слово в заголовке?
  2. Domain/URL (Домен/адрес): Есть ли ключевое слово в имени домена или в адресе страницы?
  3. Style (стиль): Анализ стиля текста на страницы. Используется ли Жирный текст или Курсив, используются ли заголовки h2, h3 и т.д.
  4. Density (плотность): Как часто употреблено ключевое слово на странице? Какова величина плотности ключевого слова?
  5. MetaInformation (мета данные) – поиск совпадений в метаданных.
  6. Outbound Links (ссылки наружу): Есть ли ссылки на странице и на кого они ведут, а также встречается ли ключевое слово в тексте ссылки?
  7. Inbound Links (внешние ссылки): Кто ссылается на искомую страницу? Каков текст ссылки?
  8. Insite Links (ссылки внутри страницы): На какие страницы данного сайта содержит ссылки эта страница?

В результате этого сравнения подсистема поиска выбирает нужные веб-страницы и показывает их пользователю, который осуществляет поиск.

Что можно найти через поисковики

Технически найти можно любую информацию, которая проиндексирована поисковиком, находиться в общем доступе в сети интернет и не запрещена политикой поисковой системы. При поиске в интернете имейте ввиду следующее:

  • Большая часть информации в интернете не контролируется и любой человек с компьютером и доступом в интернет может публиковать информацию. Поэтому нужно понимать, что данные могут быть недостоверными.
  • Не всегда легко узнать кто автор найденной информации.
  • Вы не всегда знаете откуда приходит информация.
  • Информация может быть предвзятой, специально вводящей в заблуждение или просто неверной.
  • Дата публикации данных может быть не указано и будет трудно понять, является ли информация актуальной.

Чаще всего люди ищут через поиск (расположено примерно по убыванию):

  1. Всевозможные социальные сети – Вконтакте, Instagram, Одноклассники, mail.ru и т.д
  2. Порно
  3. Фильмы
  4. Картинки
  5. Музыку
  6. Интернет
  7. Авто
  8. Youtube
  9. Игры онлайн
  10. Компьютеры
  11. Деньги, финансы
  12. Отдых
  13. Недвижимость
  14. Спорт
  15. Реклама
  16. Строительство
  17. Здоровье
  18. Информацию о знаменитостях
  19. Приготовление еды, кулинария
  20. Логистика
  21. Заработок в интернете

Примерно 2-3% от всех введенных запросов обычно сформулированы как вопрос. Больше всего вопросительных запросов начинаются с:

  • какой
  • сколько
  • кто

В последнее время все больше запросов (около 10%) стали содержать прямое указание – купить, продать или получить что-то. Самые распространённые уточнения сегодня в рунете – это скачать и бесплатно. Примерно 4% от всех запросов. Самыми часто встречающимися ошибками при поиске – ошибки, возникающие из-за неверной раскладки клавиатуры, недописанные запросы и синтаксические ошибки.]

Методы поиска информации в интернете

5 полезных способов поиска в Google

Итак, давайте рассмотрим несколько хитрых способов поиска информации через поисковую систему. Для примера, используем Google (наверное не совсем удачный пример, ну да ладно 🙂 ).

Ситуация 1 – Поиск по изображению: Есть изображение или логотип какой-то программы или компании и вы хотите найти подробную информацию о нем.

Приведу пример. Я однажды увидел на стенах во дворе примерно следующее изображение:

Значок пацифистов

и никак не мог вспомнить, откуда оно взялось. Написать в поиске – «Кружочек, внутри которого палочка и еще 2 палочки» вряд ли что-нибудь дал 🙂 . Вот здесь и приходит нам на помощь сервис поиска картинок по цифровому коду изображения от Google. Рисуем на скорую руку изображение в любом графическом редакторе и перетаскиваем его в поиск гугл по картинкам.

 

Поиск по картинке

Обычно, в результатах поиска по картинкам можно всегда найти искомое, главное — это более-менее сносно нарисовать. Т.к. художник из меня никакой, то результаты поиска оставлю в секрете 🙂

Другой пример. Есть логотип компании, например такой:

Логотип Инфинити

Логотип лишь для примера, потому как его наверное многие знают. Перетаскиваем его мышкой в поле для поиска и видим что получилось:

Поиск компании по логотипу

Иногда изображения наложены друг на друга в одной картинке. Чтобы найти по нужному изображению, придется его аккуратно скопировать каким-нибудь графическим редактором, выделив нужную область. Если вы хорошо владеете каким-нибудь графическим редактором, то прежде чем искать по изображению, можно его обработать и почистить от лишнего «шума». Тогда результат поиска будет намного качественнее.

Ситуация 2 – Поиск внутри файлов с определенным расширением. Для того, чтобы искать текст в файлах, нужно ввести в поисковую строку следующую команду: filetype:xls искомый текст. Xls в данном случае – это расширение файлов Excel. Т.е. поисковая машина будет искать текст внутри файлов с указанным расширением. Например: filetype:xls отчет. В итоге получаем все Excel файлы, в которых встречается слово отчет:

Поиск по типу файла

Таким образом можно, например скачать шаблон какого-нибудь документа, ну или сам документ 🙂 , если его специально в общий доступ положили или просто забыли защитить.

Для поиска доступны следующие типы файлов:

  • pdf – поиск указанного текста внутри pdf файлов
  • dwf – файлы программы AutoCAD
  • ps – файлы Adobe Post Script, специальные сценарии для вывода высококачественной векторной графики на принтеры и плоттеры
  • kml и kmz – файлы программы Гугл Планета Земля(Google earth)
  • xls – файлы программы Microsoft Office Excel
  • ppt – файлы программы Microsoft Office Power Point
  • doc – файлы программы Microsoft Office Word
  • rtf – файлы Rich Text Format, поддерживаемые большинством текстовых редакторов
  • swf – файлы проигрывателя флеш-плеера Shockwave Flash
  • txt – поиск внутри обычных текстовых файлов

Ситуация 3 – Ищем точное вхождение поисковой фразы. Иногда нужно найти точное вхождение фразы в каком то тексте. В принципе здесь два пути. Первый подход – вводите в поисковую строку точную и достаточно длинную поисковую фразу и поисковик найдет текст, который наиболее точно содержит то, что мы ищем. Чем больше и точнее будет поисковый запрос, тем более точное совпадение найдет поисковая машина (если конечно такая информация присутствует в сети интернет).

Второй подход – обрамлять кавычками поисковую фразу. В этом случае фраза может состоять из небольшого количества слов. Например, вводим – “Большие города”, получаем:

Поиск по точному вхождению фразы

Но если мы попытаемся ввести между этими двумя словами в кавычках что-то бессмысленное, то поиск не даст результатов. И даже если вставить одну бессмысленную букву, поиск не даст результатов, хотя поисковая система и попытается предложить нам подходящие варианты.

Ситуация 4 – Поиск информации только по одному определенному сайту или домену. Если вам нужно найти информацию по определенному сайту, то… можно воспользоваться поиском, который есть на сайте ну или попробовать найти что-то при помощи поисковый системы Google. Глядишь, и найдется что-то, что не хотел (или не смог) искать встроенный в сайт поиск. Для этого вводим в поисковую строку следующее выражение: Разное site:livejournal.ru  Разное – это текст, который вы ищете, все что после site: это доменное имя сайта, на котором нужно искать.

Поиск по сайту

Тот же механизм работает для доменов. Вместо имени сайта можно указать в каком домене искать информацию, например: Закон site:gov, где .gov — общий домен верхнего уровня для правительственных организаций.

Ситуация 5 – Поиск информации по электронной почте. Иногда необходимо найти информацию по человеку или организации, но на руках есть только адрес электронного почтового ящика (email). Если ввести в поисковую строку адрес почтового ящика, то можно найти все сайты и ресурсы, где человек оставлял свой email. Можно также найти домены, которые зарегистрированы на этот ящик.

Поиск по email

Еще один способ поиска – это использование оператора *, который позволяет заполнить поисковый запрос произвольным текстом и частью почтового адреса. Например можно найти почтовые ящики сотрудников компании, написав *@имякомпании.ru, для примера *@microsoft.com

7 полезных советов при поиске информации

  1. Составлять поисковый запрос нужно так, чтобы максимально сузить количество вариантов в выдаче
  2. Используйте фильтрацию по времени – это позволит найти более-менее актуальную информацию. Благо сейчас все крупные поисковые системы предоставляют расширенный поиск, в котором можно установить диапазон дат.
  3. Корректный вопрос, задаваемый поисковику, должен состоять как минимум из двух ключевых слов тогда поисковику будет гораздо проще отыскать нужную информацию
  4. Для поиска информации используйте разные поисковые машины. Несмотря на то, что все поисковики построены на общих принципах, алгоритмы у них могут различаться. Поэтому может случиться так, что то, что не смог найти Yandex, выдаст Google
  5. Если вы ищете какие-либо товары или услуги в вашем городе, уточняйте регион поиска(например Москва). Это уменьшит количество результатов, но найденные результаты будут более релеванты вашим поисковым запросам
  6. Используйте больше существительных для поиска.
  7. Используйте синонимы, если по запросу не было найдено то, что нужно

Главный фактор успешного и быстрого поиска – это формулировка запроса для поисковой системы. Если вы умеете сообразить, какие нужны ключевые слова для устраивающего вас результата – вы король поиска!

«Горячий» расширенный поиск от Google. 16 способов

Некоторые методы я уже затрагивал выше, некоторые еще нет. Привожу для полноты весь список.

Исключение из Google поиска

Чтобы исключить из поисковой выдачи какое либо слово, фразу, символ и т.п., достаточно перед ним поставить знак “-” (минус), и оно не появится в результатах поиска. Для примера, я ввёл в строку поиска следующую фразу: “бесплатный хостинг – ru” и в поисковой выдаче нет ни одного .ru сайта, кроме оплаченных рекламных объявлений.

Поиск по синонимам

Используйте символ “~” для поиска схожих слов к выбранному. Например в результате выражения: “~лучшие фильмы -лучшие” вы увидите все ссылки на страницы, содержащие синонимы слова “лучшие”, но ни одно из них не будет содержать этого слова.

Неопределённый поиск

На тот случай, если вы не определились с конкретным ключевым словом для поиска, поможет оператор “*”. Например фраза “лучший редактор * изображений” подберёт лучшие редакторы для всех типов изображений, будь то цифровые, растровые, векторные и т.д.

Поиск на выбор из вариантов

Используя оператор “|”, можно осуществить Google поиск по нескольким сочетаниям фраз, заменяя несколько слов в различных местах. Например, введём фразу “купить чехол | ручку” выдаст нам страницы, содержащие либо “купить чехол”, либо “купить ручку”

Значение слова

Чтобы узнать значение того или иного слова, достаточно ввести в поисковую строку “define:” и после двоеточия искомую фразу.

Точное совпадение

Для нахождения точного совпадения поисковой выдачи с запросом достаточно заключить ключевики в кавычки.

Поиск по определённому сайту

Чтобы осуществить поиск ключевых слов только по одному сайту, достаточно прибавить к искомой фразе следующий синтаксис – “site:”.

Обратные ссылки

Чтобы узнать расположение ссылок на интересующий сайт, достаточно ввести следующий синтаксис: “links:” и далее адрес интересующего сайта.

Конвертер величин

Поисковая система Google также умеет конвертировать величины по запросу пользователя. Например, нам нужно узнать, сколько составляет 1 кг в фунтах. Набираем следующий запрос: “1 кг в фунтах”

Конвертер валют

Для того, чтобы узнать курс валют по официальному курсу, набираем следующий поисковой запрос: “1 [валюта] в [валюта]”

Время по городу

Если хотите узнать время по какому либо городу, то используйте синтаксис: “time” или русский аналог “время” и название города.

Google калькулятор

Google умеет считать онлайн! Достаточно вбить пример в строку поиска и он выдаст результат.

Поиск по типам файлов

Если вам необходимо найти что-то по конкретному типу файла, то у Google есть оператор “filetype:” который осуществляет поиск по заданному расширению файла.

Поиск кэшированной страницы

У Google есть собственные сервера, где он хранит кэшированные страницы. Если нужна именно такая, то воспользуйтесь оператором: “cached:”

Прогноз погоды по городу

Ещё одним оператором поиска у Google является оператор погоды. Достаточно вбить “weather” и город, как вы увидите, будет у вас дождь или нет

Переводчик

Можно переводить слова сразу, не отходя от поисковика. За перевод отвечает следующий синтаксис: “translate [слово] into [язык]”

P.S. Комбинируя различные варианты параметров можно очень сильно сократить диапазон поиска и найти то что нужно. Надеюсь, приведенные выше примеры помогут вам в поиске информации.

Электронный учебникПоиск информации в Интернете

Поиск информации в Интернете

Для поиска информации в обычно используются три способа (См. Рис.1). Первый из них — поиск по адресу. Он применяется, когда пользователю известен адрес информационного ресурса, содержащего необходимую ему информацию. При организации поиска информации по адресу (форма адреса — IP, доменный или URL — в этом случае значения не имеет) пользователю достаточно просто ввести адрес ресурса в соответствующее поле браузера – программы, предназначенной для обеспечения доступа к сетевым ресурсам.

Рис. 1. Способы поиска информации в гипертекстовых базах данных

Второй – поиск с помощью навигации по гиперсвязям. При использовании этого вида поиска случае пользователь сначала должен получить доступ к серверу, связанному с соответствующей БД. После этого можно найти документ, используя гиперссылки. Очевидно, что этот способ удобен, когда адрес ресурса неизвестен пользователю. Для использования в качестве исходной точки для поиска при реализации этого способа предназначены Web-порталы — серверы, предоставляющие прямой доступ к некоторому множеству серверов, включая установленные на них информационные ресурсы, а также Web-приложения, которые реализуют Web-сервисы, соответствующие назначению портала. Доступные через портал серверы могут относиться к определенной системе (например — корпоративной) или различным системам и быть специально подобраны по видовому, тематическому или другим признакам документов и данных, содержащихся на их сайтах. Обычно порталы совмещают в себе разнообразные функции с целью удержать клиента как можно дольше. Доминирующим сервисом портала является сервис справочной службы: поиск, рубрикаторы, финансовые индексы, информация о погоде и т.д. Если Web-сайты в большинстве случаев представляют собой наборы статических Web-страниц, то порталы являются совокупностями программных средств и заранее неструктурированной информации, которую эти средства превращают в структурированные данные по запросу конкретных пользователей.

Третий способ поиска предполагает использование поисковых серверов Интернета. Поисковыми серверами называют выделенные хост — компьютеры, в которых размещаются базы данных ресурсов Интернета. Пользовательский интерфейс такого сервера имеет поле для ввода ключевых слов, описывающих тему, интересующую пользователя (См. Рис. 2).

Рис.2. Вид окна поискового сервера системы Яндекс

Эти слова сервер воспринимает как информационный запрос, в соответствии с которым он осуществляет поиск ресурсов и представляет список найденных документов пользователю. Очевидно, что при реализации этого способа возможны ошибки как 1-го (пропуск цели), так и 2-го рода (информационный шум). Следует упомянуть, что различаются две группы поисковых серверов: поисковые машины и предметные каталоги. Их отличие обусловлено способом создания и последующего пополнения базы данных ресурсов Интернета, которой данный сервер осуществляет информационный поиск. Так, поисковые машины имеют в своем составе специальную программу — поисковый робот. Она осуществляет постоянный мониторинг сети, собирает информацию с Web- страниц, индексирует их и фиксирует их поисковый образ в своей базе данных. В предметных каталогах база данных о документах Интернета формируется «вручную» специалистами-редакторами. Поскольку в Интернете отсутствует единое администрирование, постольку его информационные ресурсы постоянно меняются. В нём могут появляться новые и исчезать существующие документы. Частота обновления информации в документах для разных сайтов различна: для некоторых — это несколько раз в час, для некоторых — раз в сутки, день, месяц и т.д. Поэтому очень важно понимать, что при использовании информационно-поисковых систем для нахождения информации в Интернете, поиск осуществляется не на реальном пространстве документов Сети, а в некоторой модели, содержание которой может значительно отличаться от действительного содержания Интернет в момент проведения поиска. По степени охвата индексируемых ресурсов поисковые системы можно разделить на две группы: международные и русскоязычные. Первые индексируют все опубликованные в Интернете документы подряд. Вторые индексируют ресурсы, расположенные в доменных зонах с преобладанием русского языка. Список наиболее популярных систем приведен в Табл. 1.

Табл. 1. Наиболее популярные поисковые системы

Примечание: Рунет – это русскоязычная часть Интернета, составляющая домены с именами ru и рф.

Необходимо упомянуть, что существует особая категория поисковых серверов – метапоисковые системы. Их принципиальное отличие от поисковых машин и предметных каталогов состоит в том, что у них отсутствует собственная индексная база данных, и поэтому они, получив запрос пользователя, перенаправляют его сразу к нескольким поисковым серверам (См. Рис. 3).

Рис. 3. Схема работы метапоисковой системы

Возможность одновременного использования нескольких поисковых серверов по одному запросу является очевидным преимуществом метапоисковых систем. В настоящее широкое применение время нашла система Metabot.ru, интерфейс которой представлен на Рис. 4. Эта система позволяет использовать для поиска ресурсов как международные, так и русскоязычные поисковые серверы.

Рис.4. Окно метапоисковой системы Metabot.ru

 

Способы поиска в Интернете Три способа поиска в Интернете

Интернет в целом и Всемирная паутина, в частности, предоставляют абоненту доступ к тысячам серверов и миллионам Web-страниц, на которых хранится невообразимый объем информации. Как не потеряться в этом «информационном океане»? Для этого необходимо научиться искать и находить нужную информацию в сети.

Как уже было сказано, существуют три основных способа поиска информации в Интернете.

1. Указание адреса страницы. Это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа.

2. Передвижение по гиперссылкам. Это наименее удобный способ, так как с его помошыо можно искать документы, только близкие по смыслу текущему документу. Если текущий документ посвящен, например, музыке, то, используя гиперссылки этого документа, вряд ли можно будет попасть на сайт, посвященный спорту.

3. Обращение к поисковому серверу (поисковой системе). Использование поисковых серверов — наиболее удобный способ поиска информации. В настоящее время в русскоязычной части Интернета популярны следующие поисковые серверы:

Yandex; Rambler; Апорт.

Существуют и другие поисковые системы. Например, эффективная система поиска реализована на сервере почтовой службы mail.ru.

Поисковые серверы

Наиболее доступным и удобным способом поиска информации во Всемирной паутине является использование поисковых систем. При этом поиск информации можно осуществлять по каталогам, а также по набору ключевых слов, характеризующих отыскиваемый текстовый документ.

Рассмотрим использование поисковых серверов более подробно. Поисковый сервер содержит большое количество ссылок на самые различные документы, и все эти ссылки систематизированы в тематические каталоги. Например: спорт, кино, автомобили, игры, наука и др. Причем эти ссылки устанавливаются сервером самостоятельно, в автоматическом режиме путем регулярного просмотра всех появляющихся во Всемирной паутине Web-страниц. Кроме того, поисковые серверы предоставляют пользователю возможность поиска информации по ключевым словам. После ввода ключевых слов поисковый сервер начинает просматривать документы на других Web-серверах и выводить на экран ссылки на те документы, в которых встретились указанные слова. Обычно результаты поиска сортируются по убыванию специального рейтинга документов, который показывает, насколько полно заданный документ отвечает условиям поиска или насколько часто он запрашивается в сети.

Язык запросов поисковой системы

Группа ключевых слов, сформированная по определенным правилам — с помощью языка запросов, называется запросом к поисковому серверу. Языки запросов к разным поисковым серверам очень похожи. Подробнее об этом можно узнать, посетив раздел «Помощь» нужного поискового сервера. Рассмотрим правила формирования запросов на примере поисковой системы Яndex.

Синтаксис оператора

Что означает оператор

Пример запроса

пробел или &

Логическое И (в пределах предложения)

лечебная физкультура

&&

Логическое И (в пределах документа)

рецепты && (плавленый сыр)

|

Логическое ИЛИ

фото | фотография | снимок | фотоизображение

+

Обязательное наличие слова в найденном документе

+быть или +не быть

( )

Группирование слов

(технология | изготовление) (сыра | творога)

~

Бинарный оператор И НЕ (в пределах предложения)

банки ~ закон

~~ или _

Бинарный оператор И НЕ (в пределах документа)

путеводитель по Парижу ~~ (агентство | тур)

/(n m)

Расстояние в словах (минус (-) — назад, плюс (+) — вперед)

поставщики /2 кофе музыкальное /(-2 4) образование вакансии ~ /+1 студентов

» «

Поиск фразы

«красная шапочка» Эквивалентно: красная /+1 шапочка

&&/(n m)

Расстояние в предложениях (минус (-) — назад, плюс (+) — вперед)

банк && /1 налоги

Чтобы получить лучшие результаты поиска, необходимо запомнить несколько простых правил:

1. Не искать информацию только по одному ключевому слову.

2. Лучше не вводить ключевые слова с прописной буквы, так как это может привести к тому, что не будут найдены те же слова, написанные со строчной буквы.

3. Если в итоге поиска вы не получили никаких результатов, проверьте, нет ли в ключевых словах орфографических ошибок.

Современные поисковые системы предоставляют возможность подключения к сформированному запросу семантического анализатора. С его помощью можно, введя какое-либо слово, выбрать документы, в которых встречаются производные от этого слова в различных падежах, временах и пр.

48 защита информации в компьютерных сетях

Объекты защиты информации в сети К объектам защиты информации в компьютерных сетях, подвергающихся наиболее интенсивному воздействию со стороны злоумышленников, относятся: сервера; рабочие станции; каналы связи; узлы коммутации сетей. Основными задачами серверов являются хранение и предоставление доступа к информации и некоторые виды сервисов. Следовательно, и все возможные цели злоумышленников можно классифицировать как получение доступа к информации, получение несанкционированного доступа к услугам, попытка вывода из рабочего режима определенного класса услуг, попытка изменения информации или услуг, как вспомогательный этап какой-либо более крупной атаки. Попытки получения доступа к информации, находящейся на сервере, в принципе ничем не отличаются от подобных попыток для рабочих станций, и мы рассмотрим их позднее. Проблема получения несанкционированного доступа к услугам принимает чрезвычайно разнообразные формы и основывается в основном на ошибках или недокументированных возможностях самого программного обеспечения, предоставляющего подобные услуги. Основной целью атаки рабочей станции является, конечно, получение данных, обрабатываемых, либо локально хранимых на ней. А основным средством подобных атак до сих пор остаются «троянские» программы. Эти программы по своей структуре ничем не отличаются от компьютерных вирусов, однако при попадании на ЭВМ стараются вести себя как можно незаметнее. При этом они позволяют любому постороннему лицу, знающему протокол работы с данной троянской программой, производить удаленно с ЭВМ любые действия. То есть основной целью работы подобных программ является разрушение системы сетевой защиты станции изнутри – пробивание в ней огромной бреши. Для борьбы с троянскими программами используется как обычное антивирусное ПО, так и несколько специфичных методов, ориентированных исключительно на них. В отношении первого метода как и с компьютерными вирусами необходимо помнить, что антивирусное ПО обнаруживает огромное количество вирусов, но только таких, которые широко разошлись по стране и имели многочисленные преценденты заражения. В тех же случаях, когда вирус или троянская программа пишется с целью получения доступа именно к Вашей ЭВМ или корпоративной сети, то она практически с вероятностью 90% не будет обнаружена стандартным антивирусным ПО. Каналы связи Естественно, основным видом атак на среду передачи информации является ее прослушивание. В отношении возможности прослушивания все линии связи делятся на: широковещательные с неограниченным доступом широковещательные с ограниченным доступом каналы «точка-точка» Узлы коммутации сетей Узлы коммутации сетей представляют интерес для злоумышленников 1) как инструмент маршрутизации сетевого трафика, 2) как необходимый компонент работоспособности сети. Защита информации в сети Internet Наибольший риск подвергнуться атаке со стороны внешних злоумышленников возникает в случае, если ваш компьютер, или локальная, или корпоративная сеть предприятия подключена в публичную глобальную сеть. Самой большой публичной глобальной сетью является Internet. Многие корпоративные сети используют каналы Internet для объединения удаленных частей сети. Широкое распространение получили корпоративные intranet–сети, основанные на использование технологий Internet. От злоумышленников страдают в основном информационные ресурсы предприятий, которые имеют постоянные соединения с Интернет и используют постоянные IP-адреса, по которым можно атаковать внутренние корпоративные сайты. Пользователи же Интернет, соединяющиеся с Интернет по модему на небольшое время и использующие временный IP-адрес, предоставляемый провайдером на период сессии, могут пострадать только от почтовых вирусов или от «дырок» в системе мгновенных сообщений, такой как ICQ. С этой точки зрения представляют интерес механизмы защиты, используемые в Internet.

49 безопасность сетей

Обеспечение безопасности сети требует постоянной работы и пристального внимания к деталям. Пока «в Багдаде все спокойно», эта работа заключается в предсказании возможных действий злоумышленников, планировании мер защиты и постоянном обучении пользователей. Если же вторжение состоялось, то администратор безопасности должен обнаружить брешь в системе защиты, ее причину и метод вторжения

Формируя политику обеспечения безопасности, администратор прежде всего проводит инвентаризацию ресурсов, защита которых планируется; идентифицирует пользователей, которым требуется доступ к каждому из этих ресурсов, и выясняет наиболее вероятные источники опасности для каждого из этих ресурсов. Имея эту информацию, можно приступать к построению политики обеспечения безопасности, которую пользователи будут обязаны выполнять.

Политика обеспечения безопасности — это не обычные правила, которые и так всем понятны. Она должна быть представлена в форме серьезного печатного документа. А чтобы постоянно напоминать пользователям о важности обеспечения безопасности, можно разослать копии этого документа по всему офису, чтобы эти правила всегда были перед глазами сотрудников.

Хорошая политика обеспечения безопасности включает несколько элементов, в том числе следующие:

  • Оценка риска. Что именно мы защищаем и от кого? Нужно идентифицировать ценности, находящиеся в сети, и возможные источники проблем.

  • Ответственность. Необходимо указать ответственных за принятие тех или иных мер по обеспечению безопасности, начиная от утверждения новых учетных записей и заканчивая расследованием нарушений.

  • Правила использования сетевых ресурсов. В политике должно быть прямо сказано, что пользователи не имеют права употреблять информацию не по назначению, использовать сеть в личных целях, а также намеренно причинять ущерб сети или размещенной в ней информации.

  • Юридические аспекты. Необходимо проконсультироваться с юристом и выяснить все вопросы, которые могут иметь отношение к хранящейся или генерируемой в сети информации, и включить эти сведения в документы по обеспечению безопасности.

  • Процедуры по восстановлению системы защиты. Следует указать, что должно быть сделано в случае нарушения системы защиты и какие действия будут предприняты против тех, кто стал причиной такого нарушения.

3. Поиск информации в сети Internet

3.1 Поисковые системы и правила поиска информации

Удобство Интернета в том, что в нем можно найти практически любую информацию, даже когда мы не знаем точно, где она находиться. Если адрес страницы с интересующим нас материалом неизвестен и страницы с подходящими ссылками тоже нет, приходиться разыскивать материалы по всему Интернету. Для этого применяют поисковые системы Интернета – специальные web-узлы, позволяющие найти нужный документ.

Существует два основных метода поиска в Интернете. В первом случае вы ищите web-страницы, относящиеся к определенной теме. Поиск производится путем выбора тематической категории и постепенным ее сужением. Подобные поисковые системы называют поисковыми каталогами. Они удобны, когда вам нужно познакомиться с новой для себя темой или добраться до широко известных «классических» ресурсов по данной теме. Второй способ поиска используется, когда тема носит узкий, специфический характер или нужны редкие, малоизвестные ресурсы. В этом случае вы должны представлять себе, какие ключевые слова должны встретиться в документе по интересующей вас теме. Эти слова надо выбрать таким образом, чтобы они, скорее всего, имелись в нужных документах, не имеющих отношения к выбранной теме. Системы, позволяющие выполнять подобный поиск, называют поисковыми указателями. Поисковые каталоги отличаются от поисковых указателей не только методом поиска, но и способом формирования. Любая поисковая система Интернета состоит из двух частей. Специализированная web-страница, доступная всем желающим и позволяющая выполнять поиск, опирается на большую, постоянно пополняемую и обновляемую базу данных, которая содержит сведения о ресурсах Интернета.

Способ пополнения этой базы данных зависит от типа поисковой системы, поисковых каталогов самое главное – это точность отбора. Каждый найденный ресурс должен быть полезным. Тематика страницы определяется или проверяется вручную. Из-за этого объем поисковых каталогов относительно невелик. Когда объем приближается к миллиону страниц, объем ручного труда настолько велик, что дальнейший рост каталога останавливается.

Поисковые указатели, напротив, ориентированы на широту охвата. С определением слов, имеющихся на web-странице, вполне справляется автоматика, данных поискового указателя может охватывать многие миллионы web-страниц. При этом выполнять поиск в указателе труднее, чем в каталоге, потому что одни те же ключевые слова могут встречаться на web-страницах, посвященным разным темам.

Информационно-поисковые системы размещаются в Интернете на общедоступных серверах. Основой поисковых систем являются так называемые поисковые машины, или автоматические индексы. Специальные программы-роботы (известные также как пауки) в автоматическом режиме периодически обследуют Интернет на основе определенных алгоритмов, проводя индексацию найденных документов. Созданные индексные базы данных используются поисковыми машинами для предоставления пользователю доступа к размещенной на узлах Сети информации. Пользователь в рамках соответствующего интерфейса формулирует запрос, который обрабатывается системой, после чего в окно браузера выдаются результаты обработки запроса. Механизмы обработки запросов постоянно совершенствуются, и современные поисковые системы не просто перебирают огромное число документов. – Поиск ведется на основе оригинальных и весьма сложных алгоритмов, а его результаты анализируются и сортируются таким образом, чтобы представленная пользователю информация в наибольшей степени соответствовала его ожиданиям. В настоящее время в развитии поисковых систем наблюдается тенденция объединения автоматических индексных поисковых машин и составляемых вручную каталогов Интернет-ресурсов. Ресурсы этих систем удачно дополняют друг друга, в объединение их возможностей вполне логично.

Тем не менее исследования возможностей поисковых машин, даже самых мощных из них, таких как AltaVista или HotBot, показывают, что реальная полнота охвата ресурсов Всемирной паутины отдельной такой системой не превышает 30%. Поэтому не стоит ограничиваться использованием какой-либо одной из них. Если вам не удалось отыскать интересующую вас информацию с помощью одной системы, попробуйте воспользоваться другой.

Каждая поисковая Система имеет свои особенности и, и качество полученного результата зависит от предмета поиска и точности формулировки запроса. Поэтому, приступая к поиску информации, прежде всего, нужно четко представлять себе, что именно и где вы хотите найти. Например, зарубежные системы поражают числом проиндексированных документов. Для поиска в области профессиональных знаний, особенно информации на иностранном языке, такие системы, как AltaVista, HotBot или Northern, подходят наилучшим образом.

Однако для поиска информации на русском языке, особенно в российской части Интернета, лучше приспособлены русские поисковые машины. Во-первых, они специально ориентированные именно на русскоязычные ресурсы Сети и, как правило, отличаются большей полнотой охвата и глубиной исследования эти ресурсов. Во-вторых, российские системы работают с учетом морфологии русского языка, то есть в поиск включаются все формы искомых слов. Российские системы лучше учитывают и такую исторически сложившуюся особенность российских Интернет-ресурсов, как сосуществование нескольких кодировок кириллицы.

Поиск информации в Интернете — Викиучебник

Это — свободный викиучебник по поиску информации в Интернете. Пожалуйста, не стесняйтесь исправлять и улучшать существующие страницы и добавлять новые.

В Интернете с каждым днём скапливается всё больше информации, когда-либо созданной и вновь создаваемой людьми. Равнодоступность большей части информации в Интернете уравнивает возможности доступа к этой информации как обычных пользователей Интернета и журналистов локальных СМИ, так и сотрудников мировых информационных агентств.

Благодаря Интернету перед каждым человеком открылся доступ к многомиллионной аудитории, которой он может передать свой информационный материал, полученный, например, с помощью обычного мобильного телефона с диктофоном и встроенной фотокамерой. Следовательно, уровень монополизации деятельности по распространению информации также снижается благодаря Интернету.

До недавнего времени ограничения в прямой коммуникации между людьми, порождаемые пространством и временем, во многом определяли потребность людей в услугах журналистов. По мере роста общего количества пользователей Интернета, а среди них — числа владеющих английским языком, эти ограничения всё в большей степени снимаются, что закономерно ведёт к уменьшению спроса на услуги журналистов. Одновременно с этим растёт объем «сырой» информации, доступной каждому отдельному пользователю Интернета, что актуализирует проблему её отбора и редактирования. Последнее всегда входило в перечень функций журналистики, но с ростом числа пользователей Интернета начинает приобретать всё большую значимость в журналистской деятельности. Журналисты всё больше становятся похожими на «поисковые машины», отбирающие, редактирующие и предлагающие полученный при этом информационный продукт своим читателям.

Для того, чтобы найти в Интернете требуемую информацию, необходимо знать либо адрес её местоположения (например, адрес html-страницы или файла), либо пользователя Интернета, который может предоставить информацию. Если мы не знаем ни адреса, ни человека, который мог бы нам помочь, то следует перейти к вопросам «Как можно узнать адрес размещения информации?» или «Как найти человека, который мог бы нам помочь с поиском информации?». При этом не следует переоценивать возможности Интернета. Лучшие результаты может дать совмещение онлайновых и офлайновых методов поиска информации.

Методов поиска в Интернете и через Интернет достаточно много. Поэтому поиск информации в Интернете есть выбор методов поиска информации, что требует их оценки, исходя из поставленной задачи. В каждом конкретном случае успешность поиска определяется знаниями возможных методов и навыками владения ими, знанием этнических языков, на которых эта информация может быть представлена, либо нашими социальными связями.

Учебник может быть полезен как журналистам, так и всем другим пользователям Интернета. Ведь для того, чтобы найти именно то, что необходимо, надо знать где и как это искать.

Таким образом, планирование поиска сводится к трём вопросам: «Что ищем?», «Где ищем?», «Как ищем?».

Поисковые запросы бывают явные и неявные. В явных вопросах конкретно указывается объект поиска. В неявных вопросах, например, «какая сегодня погода», «происходит ли сейчас что-то важное», «можно ли проехать по городу», или у А. С. Пушкина в «Сказке о мертвой царевне и о семи богатырях»:
Свет мои, зеркальце! скажи
Да всю правду доложи:
Я ль на свете всех милее,
Всех румяней и белее?
объект поиска конкретно не указывается.

Поисковые запросы также делятся в зависимости от требуемой системы поиска. Первая группа поисковых систем предназначена лишь для линейного поиска информации, то есть для обнаружения в текстах фрагментов, аналогичных заданному. Следовательно, в запросе должен содержаться фрагмент текста. Вторая группа систем позволяет выбирать данные о связях между объектами, что требует указания в запросе на связь между теми или иными объектами.

Чтобы спланировать поиск, следует прежде всего определить объект поиска, сформулировать какую информацию необходимо найти. Если однозначно ответить на этот вопрос не представляется возможным, то поиск следует разделить на задачи с разными объектами. В планировании поиска также следует определить соотношение видов информации в поисковой задаче.

Например, если необходимо представить какую-то компанию, то полезными могут стать не только стандартные характеристики фирмы (данные об обороте, клиентах и пр.), но и сведения о связях ее первых лиц. И наоборот — физическое лицо можно охарактеризовать через компанию, которой оно владеет или в которой работает.

Надо определиться и с возможными форматами файлов в которых может содержаться требуемая информация. Это может быть html-страница, текстовый документ в форматах txt, rtf, odt, doc или docx, документ pdf, презентация в форматах odp, ppt или pptx, электронная таблица в форматах ods, xls или xlsx, аудио в формате mp3, flash-ролик формата swf, видео в формате avi и т. д.

Информация может размещаться на веб-серверах, на ftp-серверах, в блогах, в новостях, в книгах, в словарях, в товарах, на географических картах, в справочниках адресов организаций, среди афиш театров и музеев, в телепрограммах, в каталогах, в Википедии, в архивах Интернета, в пиринговых сетях, в базах данных, в веб-закладках или в рейтинговых системах. Поэтому лучше заранее определиться где мы начнём свой поиск.

Методы поиска зависят от того, как мы ответили на два первых вопроса. Поиск может осуществляться в поисковых индексах, через размещение собственной публикации по определенной теме, через экспертов и т. д.

Поиск информации в Интернете

Открытие Web-страниц и работа с поисковыми системами

В адресное поле программы-браузера (далее — браузера) можно вводить не полный адрес компьютера (URL), а только его часть, начинающуюся с букв www. Например, можно вводить не http://www.aanet..ru, а www.aanet.ru, остальное браузер допишет сам. Существует два варианта сохранить понравившийся адрес:

  • выполнить команду Избранное, Добавить в;

  • щелкнуть по кнопке Избранное на панели инструментов.

Если Web-страница долго не открывается (более 3-4минут), можно перезагрузить адрес. Для этого надо щелкнуть по кнопке Стоп (прервать загрузку), затем — по кнопке Обновить. Иногда это приводит к ускорению загрузки страницы.

Указатель мыши в области гиперссылки приобретает вид ладони с указательным пальцем.

Открыть документ по адресу, указанному в гиперссылке, можно, нажав один раз левую кнопку мыши на гиперссылке. В результате в текущее окно браузера будет загружен этот документ.

Для открытия документа в новом окне, не закрывая текущее окно, надо нажать правую кнопку мыши (указатель мыши — на гиперссылке) и выполнить команду Открыть в новое окно. Не рекомендуется открывать много окон (больше двух-трех), так как это может привести к замедлению работы программы.

Вернуться на предыдущую страницу можно, щелкнув по кнопке Назад на панели инструментов.

Изменить кодировку символов, если на экране появились нечитаемые выражения, можно, выполнив команду Вид, Шрифты и выбрав другую (по сравнению с установленной) кодировку. Обычно используется либо кодировка Cyrillic KOI8-R, либо Cyrillic Windows-1251.

Стандартные возможности Windows-приложений в браузере.

Для сохранения Web-страниц надо выполнить команду Файл, Сохранить как, затем в соответствующем поле ввести имя сохраняемого файла, выбрать папку, в которой хотите сохранить этот файл, и тип файла, в котором хотите сохранить информацию, а затем щелкнуть по кнопке Сохранить. Сохранять файл можно в двух форматах — в HTML или в текстовом. Для выбора типа файла надо нажать на значок черного треугольника в правой части поля «Тип файла» и щелкнуть курсором по нужному формату.

Для сохранения рисунков с Web-страниц надо навести указатель мыши на рисунок, щелкнуть правой кнопкой и выполнить команду Сохранить рисунок как, а далее выполнить действия, аналогичные указанным в предыдущем абзаце, т.е. задать имя, задать тип файла и указать, в какой папке следует сохранить рисунок. Рисунки можно сохранять в двух форматах — в BMP (стандартный формат Windows для рисунков) и в JPG. Лучше сохранять в формате JPG, так как в этом случае файл рисунка намного меньше по размеру, чем файл этого же рисунка в формате BMP.

Справочные службы Интернет

Цель: Познакомиться с работой поисковых систем.

Универсальные справочные службы

Поисковый язык системы Yandex.

Поиск по ключевым словам.

Специализированные справочные службы.

Тематический поиск

Существуют справочные службы Интернет, помогающие пользователям найти нужную информацию. Эти службы можно разделить на две категории универсальные и специализированные.

13.1.Универсальные справочные службы

В универсальных службах используется обычный принцип поиска в неструктурированных документах — по ключевым словам.

Поисковая система (универсальная служба поиска) — это комплекс программ и мощных компьютеров, способные принимать, анализировать и обслуживать запросы льзователей по поиску информации в Интернет. Поскольку современное Web-пространство необозримо, поисковые системы вынуждены создавать свои базы данных поWeb- страницам. Важной задачей поисковых систем является постоянное поддержание соответствия между созданной информационной базой и реально существующими в Сети материалами. Для этого специальные программы (роботы) периодически обходят имеющиеся ссылки и анализируют их состояние. Данная процедура позволяет удалять исчезнувшие материалы и по добавленным на просматриваемые страницы ссылкам обнаруживать новые.

Среди наиболее известных и мощных поисковых систем:

AltaVistaс возможность поиска на русском языке —http://www.altavista.telia.com/,

Ramblerс возможностью поиска во всех кодировках русского языка —http://www.rambler.ru/, Русскоязычная поисковая системаYandex- —http://www.yandex.ru/,

Апорт с хорошими подсказками по поиску — — http://russia.agama.com/

Поисковые системы отличаются друг от друга по языку запроса, представлению адресной информации, выходных документов, совместимостью с другими поисковыми системами.

Специализированные справочные службы — это тематические каталоги (subjectcatalogs), в которых собраны более или менееструктурированные сведения обадресах серверов по той или иной тематике. В отличие от универсальных баз индексов, тематические каталоги составляются специалистами и обеспечивают клиента более строгой, достоверной и систематизированной информацией о Сети.

13.2 Поисковый язык системы Yandex

В каждой поисковой системе приняты собственные соглашения и ограничения на условия поиска.. Для перехода к странице с описанием поискового языка Yandexнеобходимо:

Открыть Web-страницу поисковой системыYandexс адресом —http://www.yandex.ru/

Щелкнуть по гиперссылке Расширенный поиск

На раскрывшейся странице щелкнуть по гиперссылке Формальное описание.

Вот некоторые правила:

1. Несколько набранных в запросе слов, разделенных пробелами, означают, что все они должны находится в одном предложении искомого документа. Запрос, соответствующий логической операции И (&)

2. Между словами можно поставить знак «|» (логическая операция ИЛИ), чтобы найти документы, содержащие любое из указанных слов.

3. Знак тильда «~» позволяет найти документ с предложением, содержащим первое слово, но не содержащим второе ( по запросу ‘банки~закон’ будут найдены все документы, содержащие слово ‘банки’, рядом с которым (в пределах предложения) нет слова ‘закон’.

4. Начиная слово с большой буквы, вы не найдете слов, написанных с маленькой буквы, если это слово не первое в предложении. Поэтому не набирайте обычные слова с большой буквы, даже если с них начинается ваш запрос. Заглавные буквы в запросе рекомендуется использовать только в именах собственных.

Эффективность поиска в значительной мере зависит от опыта и кругозора пользователя. Когда вы ищете материалы по определенной тематике, ни в коем случае не следует полагаться на «интеллект» машины: вы сами должны учитывать особенности лексикона специалистов по данной теме, возможные сочетания терминов и т. п.

Для работы с поисковыми системами используется обычный браузер.

13.3 Поиск по ключевым словам

запустить приложение InternetExplorer

в строке Адрес набрать URLпоисковой системы

ознакомиться с описанием языка запросов данной поисковой системы

в поле для запроса ввести запрос – одно слово или словосочетание

щелкните по кнопке Поиск.

Результат поиска – список гиперссылок. Часто список очень большой.

Этот список можно сократить двумя способами.

Способ 1

введите новый запрос

в форме поиска поставьте флажок Искать в найденном (поиск будет вестись не по всем документам, а только по тем, которые были найдены в предыдущем поиске).

щелкните по кнопке Поиск

Способ II

В полосе под поисковой формой щелкнуть по ссылке (название темы), тем самым задав поиск только по страницам сайтов, относящихся к этой теме.

Каждый найденный документ имеет числовой рейтинг, который показывает, насколько полно отвечает заданный документ условиям поиска. Список документов приводится в порядке этого рейтинга, начиная от документа с самым большим рейтингом.

13.4.Специализированные справочные службы

Специализированные справочные службы — это тематические каталоги (subject catalogs), в которых собраны более или менее структурированные сведения об адресах серверов по той или иной тематике. В отличие от универсальных баз индексов, тематические каталоги составляются специалистами и обеспечивают клиента более строгой, достоверной и систематизированной информацией о Сети

13.5 Тематический поиск

На стартовой страницы поисковой системы в перечне тематик щелкнете по интересующей вас теме. Вам будет предложен перечень ссылок на наиболее посещаемые сайты по этой проблеме и перечень тематик, расположенных на следующем уровне иерархии (более низком) и т.д. Пользователь сам движется по этой цепочке, просматривая материалы.

Чаще всего универсальная и специализированная справочные службы совмещены, поэтому пользователь в любой момент может воспользоваться

16. Глоссарий

п/п

Новые понятия

Содержание

1

Компьютерная сеть

Совокупность взаимосвязанных через каналы передачи данных компьютеров, обеспечивающих пользователей средствами обмена информацией и коллективного использования ресурсов сети.

2

Техническое обеспечение компьютерной сети

ЭВМ различных типов, средства связи, оборудование абонентских пунктов.

3

Информационное обеспечение сети

Единый информационный фонд, ориентированный на решаемые в сети задачи.

4

Доменная адресация

Доменная система имен компьютеров.

5

IP-адрес компьютера

Имя-адрес компьютера, состоящее из четырех целых чисел от 0 до 255, разделенных точкой.

6

Протокол

Набор правил и процедур, регулирующих порядок осуществления связи в компьютерной сети.

7

Топология сетей

Физическое расположение компьютера, кабелей и других компонентов сетей, т.е. способ организаций физических связей.

8

OSI — Open System Interconnections

Эталонная модель взаимодействия открытых систем.

9

TCP -Transmission Control Protocol

Протокол управления передачей информации.

10

IP- Internet Protocol

Протокол адресации информации.

11

Интернет

Глобальная всемирная компьютерная сеть.

12

URL-Universal Resource Locator

Адрес любого ресурса в Интернете.

13

WWW — World Wide Web

Единое информационное пространство, состоящее из сотен миллионов взаимосвязанных электронных документов, хранящихся на Web-серверах.

14

Web-страница

Документ, составленный на языке HTML и доступный в WWW.

15

Web-узлы

Группы тематически объединенных Web-страниц.

16

HTML -Hyper Text Markup Language

Язык гипертекстовых документов, называемых Web-страницами.

17

Браузер

Программа просмотра Web-страниц.

18

ftp — File Transfer Protocol

Протокол сети для работы с любыми типами файлов.

19

http -Hyper Text Transfer Protocol

Протокол передачи гипертекста.

20

DNS -Domain Name Servise

Служба имен доменов ,осуществляет преобразование доменных имен в цифровую форму IP-адреса.

21

Internet Explorer (IE).

Браузер. Просмотр Web-документов.

22

гипертекст

Множество отдельных текстов, которые имеют ссылки друг на друга.

23

Основные характеристики качества компьютерной сети

Скорость передачи данных. по каналу связи ;

Пропускная способность канала связи;

Достоверность передачи информации

Надежность канала связи и модемов;

24

шлюз

Компьютер, непосредственно подключенный к магистральным каналам Интернета.

25

Сервис- провайдеры

Компании со шлюзами в Интернете, которые они предоставляют другим компаниям или частным лицам.

26

Хост-компьютер

Компьютер ,непосредственно подключенный к Интернету.

27

Ресурсы сети

Аппаратные, программные, информационные составляющие сети.

28

Глобальные сети

Сети, объединяющие пользователей, расположенных по всему миру на значительном расстоянии друг от друга. Взаимодействие между абонентами может осуществляться на базе телефонных линий ,радиосвязи и систем спутниковой связи.

29

Локальные сети

Сети, объединяющие пользователей, расположенных

в одном или нескольких близко стоящих зданий. Компьютеры в локальной сети связаны единым высокоскоростным каналом передачи данных.

30

Сервер

Компьютер, подключенный к сети и обеспечивающий ее пользователей определенными услугами.

31

Брандмауэр

Специальный компьютер или компьютерная программа, препятствующая несанкционированному перемещению данных между сетями.

Вопросы по вариантам:

Вариант №

Номера вопросов

1

10

14

1

12

23

8

19

4

9 ЗАДАЧ решают все

2

11

15

2

13

24

9

20

5

3

12

16

3

14

25

10

21

6

4

13

17

4

15

26

11

22

7

5

14

18

5

16

1

12

23

8

6

15

19

6

17

2

13

24

9

7

16

20

7

18

3

14

25

10

8

17

21

8

19

4

15

26

11

9

18

22

9

20

5

16

1

12

10

19

23

10

21

6

17

2

13

11

20

24

11

22

7

18

3

14

Контрольные вопросы

  1. Как появился Интернет?

  2. Что такое IP-адрес и каково его предназначение? Какова структура IP-адреса?

  3. Для чего используется протокол TCP/IP?

  4. Что называется доменом?

  5. Какие функции выполняет доменная служба имен?

  6. Что такое глобальная сеть? Как устроена Всемирная паутина (WWW)?

  7. С помощью чего и как проводится поиск информации в Интернете?

  8. Назовите и охарактеризуйте базовые протоколы сети Интернет.

  9. Охарактеризуйте основные понятия Интернет: сайт, провайдер, хост, сервер?

  10. Для чего в Интернете используется URL? Какой формат имеет запись URL?

  11. Для чего существует служба имен доменов (DNS)? Перечислите, какие домены первого уровня вы знаете?

  12. Назовите прикладные протоколы, на которых основана работа электронной почты.

  13. Какова структура адреса электронной почты?

  14. Для чего используется служба FTP?

  15. Для чего используется служба Telnet?

  16. Для чего используется служба IRC?

  17. Какие функции выполняет программа-браузер?

  18. Что такое провайдер, клиент?

  19. Для чего используются гиперссылки?

  20. Какие Вы знаете поисковые системы?

  21. Что такое поисковый робот?

  22. Каково назначение языка HTML?

  23. Для чего используются теги?

  24. Способы подключения к сети Интернет?

  25. Что такое модем?

  26. Что такое провайдер?

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *