Особенности поиска в Яндексе — поисковые операторы, о которых мало кто знает
Здравствуйте, уважаемые читатели блога MonetaVInternete.ru. Ежедневно миллионы людей ищут информацию в интернете. Большинство пользователей делают это с помощью поисковой системы Google, в то время как около 60% русского сегмента производят поиск в нашем отечественном Яндексе. Но мало кто знает о специальных поисковых операторах Яндекса.
С помощью них вы сможете в кратчайшие сроки найти нужную вам информацию. Отличие от обычного поиска заключается в том, что если вы вводите, например, слова из какого-либо афоризма, в выдаче вы, скорее всего, увидите что угодно, кроме того, что искали. Вот тут на помощь приходят операторы.
Кстати, про два из них я уже писал в статье про частотность и конкурентность запросов, вот только там они использовались в Яндекс Вордстате. В случае с афоризмом: используя оператор для поиска точной фразы, вы сможете найти сайт, на котором она встречается. Но операторов больше, чем вы думаете. Поисковая система Яндекс называет все это
Итак, если вам очень очень нужно найти что-либо в интернете, но у вас это никак не получается, то либо попросите об этом другого, либо используйте следующие операторы.
Кавычки («) — поиск без изменения порядка слов:
Восклицательный знак (!) — поиск без изменения морфологии и регистра слова:
Вертикальная черта (|) — поиск любого слова, слева или справа от черты. Если же несколько перечисленных слов встречаются на сайте, то все они выделяются жирным шрифтом:
Знак & — поиск слов в одном предложении:
Два знака && — поиск слов в одном документе (интернет-странице):
Звездочка * — обозначение пропущенного слово (употребляется с кавычками):
Два восклицательных знака !! — исключение из выдачи похожих слов, но с изменением морфологии и регистра:
Знак + — поиск страниц, в которых слово встречается обязательно, наряду с другими введенными (зачастую в поиск добавляются результаты, содержащие лишь одно из введенных слов):
Тильда ~ — поиск страниц, где слово перед «~» встречается без слова после «~»:
Двойная тильда ~~ — исключение слова перед знаком «~» из поиска:
Слеш /N — Указание количества слов в предложении между словами (N — число слов):
Оператор title:(поисковая фраза) — поиск по заголовкам (мета-тегам Title) документов (тайтл — можно ли заработать в интернете):
Оператор url:адрес — поиск фразы в на определенной странице:
Оператор host:адрес — поиск по всему указанному сайту (хосту):
Оператор site:адрес — поиск по всем поддоменам и страницам сайта:
Оператор mime:формат — поиск по определенному типу файлов
Оператор lang:язык — поиск с ограничением по языку:
Оператор domain:доменная_зона — поиск в определенной доменной зоне:
Оператор date:ГГГГММДД — поиск по определенной дате:
Оператор date:дата1…дата2 (второй вариант: date:>/<дата) — поиск по интервалу дат (формат аналогичный предыдущему):
Также хочу сказать, что для удобства все операторы можно комбинировать. Например, если вам нужно найти все документы, содержащие все слова в том же виде и порядке, что и в запросе, используйте
А если вам нужны еще и результаты на английском языке, то смело добавляйте соответствующий оператор (но учтите, фразу-то он будет искать русскую):
Также прошу обратить внимание на пробелы после каждого оператора. Если их не указывать, то желаемого результата вы не получите.
На этом все. В следующих статьях планирую описать операторы поисковой системы Google. До скорых встреч на страницах блога MonetaVInternete.ru!
Символы оптического распознавания — Таблица символов Юникода®
Главная › Разделы Юникода › Символы оптического распознавания
- Количество символов: 32
Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов, использующихся для представления в текстовом редакторе. Распознавание широко используется для конвертации книг и документов в электронный вид, для автоматизации систем учета в бизнесе или для публикации текста на веб-странице. Оптическое распознавание текста позволяет редактировать текст, осуществлять поиск слова или фразы, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тесту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание текста является исследуемой проблемой в областях распознавания образов, искусственного интеллекта и компьютерного зрения.
Системы оптического распознавания текста требуют калибровки для работы с конкретным шрифтом; в ранних версиях для программирования было необходимо изображение каждого символа, программа одновременно могла работать только с одним шрифтом. В настоящее время больше всего распространены так называемые «интеллектуальные» системы, с высокой степенью точности распознающие большинство шрифтов. Некоторые системы оптического распознавания текста способны восстанавливать исходное форматирование текста, включая изображения, колонки и другие нетекстовые компоненты.
Этот текст также доступен на следующих языках: English;
ℹ — Источник информации (U+2139) Эмоджи
Описание символа
Источник информации. Буквоподобные символы.
Кодировка
Кодировка | hex | dec (bytes) | dec | binary |
---|---|---|---|---|
UTF-8 | E2 84 B9 | 226 132 185 | 14845113 | 11100010 10000100 10111001 |
UTF-16BE | 21 39 | 33 57 | 8505 | 00100001 00111001 |
UTF-16LE | 39 21 | 57 33 | 14625 | 00111001 00100001 |
UTF-32BE | 00 00 21 39 | 0 0 33 57 | 8505 | 00000000 00000000 00100001 00111001 |
UTF-32LE | 39 21 00 00 | 57 33 0 0 | 958464000 | 00111001 00100001 00000000 00000000 |
— Знак справа-налево (U+200F) rlm
Описание символа
Знак справа-налево. Знаки пунктуации.
Кодировка
Кодировка | hex | dec (bytes) | dec | binary |
---|---|---|---|---|
UTF-8 | E2 80 8F | 226 128 143 | 14844047 | 11100010 10000000 10001111 |
UTF-16BE | 20 0F | 32 15 | 8207 | 00100000 00001111 |
UTF-16LE | 0F 20 | 15 32 | 3872 | 00001111 00100000 |
UTF-32BE | 00 00 20 0F | 0 0 32 15 | 8207 | 00000000 00000000 00100000 00001111 |
UTF-32LE | 0F 20 00 00 | 15 32 0 0 | 253755392 | 00001111 00100000 00000000 00000000 |
♪ — Восьмая нота (U+266A)
Описание символа
Восьмая нота. Разнообразные символы.
Кодировка
Кодировка | hex | dec (bytes) | dec | binary |
---|---|---|---|---|
UTF-8 | E2 99 AA | 226 153 170 | 14850474 | 11100010 10011001 10101010 |
UTF-16BE | 26 6A | 38 106 | 9834 | 00100110 01101010 |
UTF-16LE | 6A 26 | 106 38 | 27174 | 01101010 00100110 |
UTF-32BE | 00 00 26 6A | 0 0 38 106 | 9834 | 00000000 00000000 00100110 01101010 |
UTF-32LE | 6A 26 00 00 | 106 38 0 0 | 1780875264 | 01101010 00100110 00000000 00000000 |
Наборы с этим символом: