Электронный учебникпоиск информации в интернете. Секреты поиска в интернет и необычные поисковики Группы каталогов ссылок

Эффективный поиск информации с использованием компьютера – актуальная задача, возникающая не только перед начинающими, но и бывалыми пользователями сети интернет, ведь кто владеет данными – тот владеет миром, как гласит всем хорошо известная поговорка. Сегодня мы разберем способы быстрого поиска необходимой и важной информации в русскоязычном интернете . На данный момент их выделяют всего три вида:

  1. через указание прямого адреса сайта, где размещены нужные данные и необходимая информация;
  2. серфинг по ссылкам с помощью персонального компьютера в сети интернет;
  3. с помощью поисковых систем (машин) в интернет.

Рассмотрим более развернуто все способы поиска актуальной информации в сети с помощью компьютера.

Поиск информации по прямой ссылке в сети

Если вы уже знаете, по какому адресу в интернете размещена нужная вам информация, то тогда поиск с помощью компьютера заметно облегчается: достаточно просто вбить адрес сайта в браузерную строку и ознакомиться с предложенными данными. Если перед вами открылся объемный текст на странице сайта в интернете, а вас интересует буквально несколько строчек, спрятанные в «тонне» печатных символов, то можете воспользоваться внутристраничным поиском. Для этого нажмите сочетание клавиш Ctrl и F (любой раскладки клавиатуры компьютера), а в предложенную графу «Найти» вбейте фразу или слово, которое точно содержится в абзаце с информацией, которую ищете, после чего нажмите «Enter».

В браузере подсветятся другим цветом все слова, упоминающиеся на странице и похожие на то слово, которое вы ищете. Однако довольно часто случается так, что мы не помним или вообще не знаем ссылки с местонахождением информации в интернете. В этом случае удобнее всего прибегнуть к другим двум видам поиска данных с помощью компьютера.

Поиск с помощью интернет серфинга

Интернет серфинг – поиск, при котором осуществляется последовательный переход по ссылкам с одного тематического сайта на другой до тех пор, пока не будет найден источник нужных данных. Преимущество такого способа интернет-поиска данных заключается в его увлекательности и возможности освоить большой объем информации из разных сайтов последовательно и основательно. Среди недостатков этого вида поиска находится его длительность, а также то, что на первоначальный сайт, с которого начнется ваш серфинг, тоже нужно как-то попасть. А если вы не располагаете адресом сайта, с которого начнете серфинг, то здесь вам придется прибегнуть к помощи такого способа поиска, как поисковые системы.

Способы поиска информации в сети с помощью поисковиков

Сегодня широко известны публике Рунета такие поисковые машины, как Яндекс.ru, Rambler.ru, Google.ru. Эти сайты позволяют искать данные по вводимому запросу на всех сайтах интернета. По принципу работы поисковые системы бывают двух видов: поисковые индексы и поисковые каталоги:

  • Поисковые каталоги. Эти сайты оказывают помощь в поиске данных определенной тематики в сети интернет: информация в таких каталогах четко структурирована по группам и темам, что способствует быстрому нахождению результата. В каждой теме пользователю предлагается ряд ссылок на сайты, где можно найти интересующие его знания.
  • Поисковые индексы. Это сайты-указатели, в которых при введении ключевого слова в строку поиска, пользователь получает ряд ссылок на страницы в интернете, где содержится запрашиваемое слово или фраза. Поисковые индексы осуществляют поиск с помощью специальных программ, называемых «пауками», сканирующих страницы сайтов в интернете на предмет их тематики. После такого скана поисковик заносит их в свою базу, из которой позже и «достается» информация при вводе пользователем запроса в поисковую сроку.

Правила поиска информации в сети интернет

Сейчас рассмотрим основные, но важные правила эффективного поиска актуальной информации в русскоязычной сети интернет с помощью компьютера.

  1. Формируйте правильную ключевую фразу для обращения к поисковой системе. Нельзя использовать только одно слово для поиска, если вы хотите получить действительно полезный результат, а также не стоит вводить и слишком большие фразы. Оптимальный размер поискового запроса составляет от 2 до 4 слов. Если в результатах поиска поисковиком найдено слишком мало результатов, то стоит попробовать переформулировать введенную фразу, заменив некоторые слова синонимами, а также проверить наличие орфографических ошибок в словах. Запомните: нет такой информации, которой нет в интернете. Просто подбирайте правильные слова, соблюдайте правила и вы найдете то, что ищете.
  2. Применяйте специальные операторы. Современный эффективный и быстрый поиск любой необходимой информации посредством поисковика и с помощью персонального компьютера подразумевает знание и применение некоторых хитростей, которыми являются сокращения и специальные символы-операторы. Операторы – значки, используемые при формировании запроса в поисковой системе и облегчающие поиск необходимых данных. Рассмотрим самые распространенные операторы и их значения, которые могут пригодиться на практике.
  3. Пробел или знак & - означает, что требуется искать документы с требуемым словосочетанием в пределах одного предложения. Пример ввода в поисковую строку: вкусный рецепт или вкусный & рецепт.
  4. && - означает необходимость поиска страницы, на которой будут упомянуты отдельные слова из словосочетания в пределах всего текста, а не только одного предложения. Пример: вкусный && рецепт.
  5. | - вам будут предложены статьи, в пределах которых будет употреблено только 1 из введенных слов. Пример: брак | недостаток | дефект.
  6. + - означает поиск текста с обязательным сочетанием подряд слов, введенных между знаком «+». Пример: вкусный+рецепт.
  7. “ ” – поиск цепочки слов без ее разбивания на отдельные слова. Пример: “конфеты «Красная Поляна»”.

Соблюдая эти простые правила при поиске данных с помощью компьютера и интернета, вы облегчите себе задачу и всегда быстро сможете найти информацию, необходимую вам в любой момент времени.

Все больше и больше людей ищут необходимую информацию во Всемирной паутине. окажется более эффективным, если вы будете соблюдать несложные правила. Все поисковые системы имеют определенный . Успешный поиск в сети Интернет невозможен без хотя бы поверхностного знания этих принципов. В Интернете настолько огромное количество разной информации, что хаотичный и неорганизованный поиск в сети Интернет ни к чему не приведет . Вы потратите кучу времени и нервов, а найдете лишь крупицы того, что вам было нужно.

Поиск в сети Интернет требует знания определенных принципов и хитростей. Как найти необходимую информацию максимально быстро? Нужно лишь соблюдать определенные правила .

  1. Правильно сформулируйте поисковый запрос. Он не должен быть ни слишком коротким, ни слишком длинным. Оптимальная длина поискового запроса — 2-3 слова.
  2. Если результат вас не удовлетворил, попробуйте изменить запрос, переставив местами слова в запросе или используя синонимы.
  3. Чтобы найти точную фразу или цитату, заключите поисковый запрос в кавычки.
  4. Обычно введение уточненного запроса более эффективно, чем поиск по результатам.
  5. Постарайтесь не формулировать поисковый запрос в виде вопроса поисковой системе.
  6. Обращайте внимания на домены сайтов из поисковой выдачи, чтобы случайно не перейти по подозрительной ссылке.
  7. Обычно самые удачные ссылки и востребованная информация находятся на первых двух-трех страницах поисковой выдачи. Кстати, не факт, что лучшая информация будет находиться исключительно на первой странице.
  8. Используйте не одну поисковую систему, а несколько. У разных поисковиков разный принцип ранжирования, поэтому то, что не нашлось в одном, может найтись в другом.
  9. Используйте дополнительные поисковые технологии поисковых систем (поиск по картинкам, поиск по региону, поиск по блогам, расширенный поиск и т.п.).
  10. Используйте поисковые возможности браузеров. Например, комбинация клавиш Ctrl+F включает поиск по странице.

Учтите, что результаты поисковой выдачи динамичны и через несколько дней или даже часов могут измениться. Поэтому найденную полезную ссылку стоит тут же добавить в закладки: в следующий раз результат поиска в сети Интернет может оказаться другим, и вы просто-напросто потеряете однажды найденный сайт.

Для того чтобы облегчить поиск в сети Интернет поисковая система Google предлагает ряд дополнительных операторов и функций , которые позволяют точнее сформулировать поисковый запрос и сделать поиск в сети Интернет более эффективным.

  • Знак + позволяет принудительно включить слово в запрос: +как искать в Интернете . Если он находится в середине фразы, перед ним нужно поставить пробел.
  • Знак исключает слово из списка результатов поиска: автомобили -отечественные .
  • Слово OR или знак | используются для поиска одного из двух слов: CD OR MP3 плеер (CD | MP3 плеер) .
  • Знак ~ (тильда) позволяет находить синонимы слов из запроса: купить ~мотоцикл .
  • Знак * означает любое слово: реферат по * .
  • Две точки (.. ) используются для поиска в определенном диапазоне значений: плеер за 150..200 долларов .

Эти операторы имеют влияние на сам поисковый запрос . Следующая группа операторов упрощает поиск в Интернете, сужая круг поисков: страницы в выдаче выбираются по определенному критерию .

  • Оператор Site нужен для поиска по проиндексированным страницам конкретного сайта. Его можно использовать как для поиска всех проиндексированных страниц (site:сайт ), так и для поиска по ключевым словам на этих страницах (site:сайт хобби ).
  • Оператор Filetype позволяет находить файлы определенного , например: реферат по биологии filetype:rtf .
  • Оператор Cache отображает страницы, сохраненные в кэше поисковой системы: cache:сайт . Зачем это нужно? Бывает так, что нужный материал был удален с сайта, однако он какое-то время сохраняется в кэше.
  • Оператор Define позволяет находить определение слов и словосочетаний: define поисковая система .
  • Для поиска сайтов, схожих по тематике с определенным сайтом, используют оператор Related : related:сайт .

Некоторые функции поиска Google способны значительно упростить повседневную жизнь: тут вам и прогноз погоды, и конвертер валют, и многое другое.

  • Для того, чтобы узнать прогноз погоды , достаточно ввести слово «погода» и название вашей страны и населенного пункта: погода в Москве . Для США кроме города указываются штат и индекс.
  • Если вам нужно узнать часовой пояс , в котором находится тот или иной город, введите в строку поиска словосочетание «часовой пояс» и название города: часовой пояс Калининград .
  • Можно ограничить поиск различных организаций (ресторанов, магазинов и т.п.) определенным городом : пицца в Казани .
  • Если вы хотите узнать расписание киносеансов в определенном населенном пункте, добавьте к запросу «кино» название вашего города: кино в Сочи .
  • Для поиска карт городов используется такой поисковый запрос: карта Санкт-Петербурга (подставьте нужный город), со страницы результатов поиска вы сможете перейти к сервису Google Maps.
  • Строку поиска Google можно использовать в качестве калькулятора , введя в нее пример, который нужно посчитать: (7+3*5)/11=
  • Также эта поисковая система позволяет конвертировать единицы измерения величин из английской системы мер в метрическую и наоборот: 9,5 ярдов в сантиметрах .
  • Кроме конвертации единиц измерения, можно также конвертировать валюту разных стран, к примеру: 200 долларов США в рублях .

Конечно, это далеко не полный список функций и операторов, но для начала вам должно хватить и их. Поиск в сети Интернет может осложняться тем, что не все операторы и функции всегда работают корректно . Часто, например, «грешит» некорректными результатами поиска оператор Related.

Поиск в сети Интернет на первый взгляд очень прост. Но потом, столкнувшись с огромным количеством информации, которую тяжело отфильтровать, многие пользователи разочаровываются в поисковых системах. А зря! Умение правильно сформулировать запрос и знание некоторых тонкостей и хитростей избавят вас от утомительного хождения по ненужным и малоинформативным сайтам .

Поиск в сети Интернет может быть быстрым и эффективным — если вы знаете, как правильно искать !

Найти нужную информацию в Интернете зачастую довольно трудно. Интернет развивается хаотично, в нем нет четко выделенной структуры. Никто не может гарантировать, что на одном домене будет только информация определенной тематики, а на другом - информация другой, но тоже четко определенной тематики. Например, на доменах.com можно найти не только коммерческую информацию, а, например, различную документацию по программным продуктам или даже анекдоты.

Если бы доменная структура была бы похожа на структуру каталога, например, в домене ru.comp.os.linux (как в системе новостей) была бы вся информация об операционной системе Linux на русском языке и какая-то организация-модератор следила, чтобы в других доменах не выкладывалась информация о Linux, то тогда поиск был бы значительно проще. Ведь мы бы знали, где искать. Открываешь браузер, вводишь ru.comp.os.linux и получаешь... миллионы различных ссылок на статьи, HOWTO-документы и прочую информацию, так или иначе связанную с Linux.

Эффективность поиска

    Эффективность поиска зависит от многих факторов:
  • От самой информации - по одной теме информации может быть много, по другой - мало. Иногда можно найти много информации по заданной теме, но коэффициент полезного действия этого поиска окажется близким к 0,0%, а можно найти всего 3-4 ссылки, и это будет как раз то, что нужно. Сюда же относится умение веб-мастера правильно подать информацию, чтобы ее могли найти сами поисковые машины Предположим, где-то очень далеко есть нужная вам информация, но поисковая машина о ней ничего не знает. Возможно, информация была только что опубликована или просто веб-мастер, опубликовавший информацию, даже и не подозревает о существовании поисковых машин. Вы-то ищите информацию с помощью поисковой машины. Если она не "знает" нужную вам информацию, то, следовательно, и вы о ней ничего не узнаете.
  • От поисковой машины - поисковых машин много и все они разные. Даже если они относятся к одному типу (о типах поисковых машин мы поговорим чуть позже), несомненно, у каждой из них будет свой алгоритм. Если вы не нашли информацию с помощью одной поисковой машины, попробуйте поискать ее с помощью другой. Не зацикливайтесь на одной поисковой машине, как бы она вам ни нравилась.
  • От умения использовать поисковую машину - от того, как вы умеете использовать поисковую машину, зависит очень многое. Если вы не знаете, как использовать поисковую машину, вряд ли поиск будет эффективным.

Как правильно искать информацию

Поскольку чаще всего вы не выбираете нужный вам сайт из каталога поисковой машины, а вводите определенное ключевое слово (или несколько ключевых слов), то вам нужно максимально конкретно задать это самое ключевое слово. Чем точнее вы определите предмет поиска, тем точнее будет результат. Поисковая машина ведь не может угадать ваши мысли, нужно четко указать ей, что вы ищите.

У каждой поисковой машины есть свой синтаксис, который необходимо знать. В этой главе будет описан синтаксис поисковых машин Google, Yandex и Rambler. Если вы хотите использовать другую поисковую машину, то ее синтаксис вы сможете узнать на ее же сайте (обычно он подробно описан).

Поисковые машины

А теперь поговорим о самих поисковых машинах.

На территории бывшего СНГ наиболее популярными являются следующие поисковые машины, по данным SpyLog (Openstat) :

  • 1. Яндекс (www.yandex.ru );
  • 2. Google (www.google.com );
  • 3. Поиск@Mail.ru (go.mail.ru );
  • 3. Рамблер (www.rambler.ru );
  • 5. Yahoo! (www.yahoo.com );
  • 6. AltaVista (www.altavista.com );
  • 7. Bing (www.bing.com ).

Поисковые машины указаны в порядке "убывания популярности". Как видите, самой популярной у нас является поисковая машина Яндекс.

Типы поисковых машин

    Существуют два основных типа поисковых машин:
  • индексные - Google, AltaVista, Rambler, HotBot, Яндекс и др.;
  • классификационные (каталоговые) - Rambler, Yahoo! и др.

Не удивляйтесь, что поисковая машина Rambler указана дважды - она одновременно являлася и индексной, и классификационной. К этому мы еще вернемся, а пока поговорим об отличиях этих двух систем.

Как работает индексная поисковая машина? Поисковая машина запускает специальную программу, которая просматривает содержимое веб-серверов, индексируя информацию: она заносит в свою базу данных ключевые слова той или иной веб-страницы, некоторую информацию из веб-страницы.

Краткая история Google

Начнем с названия. Google - это немного видоизмененный вариант слова googol (не зря ее часто называют "гуглом"). В свою очередь это слово было введено Милтоном Сиротой, племянником известного математика Эдварда Каснера, а потом было популяризировано в книге Каснера и Ньюмана "Математика и воображение". Слово "googol" отображает число одной единицей и 100 нулями. Название "Google" отображает попытку организовать огромное количество информации в Сети.

Итак, начнем с самого начала. Будущие разработчики Google Сергей Брин (Sergey Brin) и Лэрри Пейдж (Larry Page) познакомились в 1999 году в Станфордском университете. Тогда Лэрри было 24 года, а Сергею - 23. Лэрри в то время был студентом Мичиганского университета и на несколько дней приехал в Станфорд. Сергей был в группе студентов, которая должна была ознакомить гостей с университетом. С первой встречи Сергей и Лэрри, мягко говоря, недолюбливали друг друга - они спорили относительно всего, о чем можно было спорить. Хотя в итоге это и оказалось положительным моментом, поскольку их разные мнения привели к созданию алгоритма для решения одной из самых актуальных компьютерных задач: поиск нужной информации среди огромного массива данных. С января 1996 года Лэрри и Сергей начинают работу над поисковой машиной BackRub, которая должна была анализировать "обратные" ссылки, указывающие на данный веб-сайт. Работы над этим сервером велись в постоянной нехватке средств - ведь в то время Сергей и Лэрри были аспирантами университета - сами понимаете, что средств у аспирантов не очень много. Кстати, Лэрри впервые принимал участие в столь серьезном проекте, а до этого он занимался всякими "несерьезными", даже порой анекдотическими проектами, например, он построил работающий принтер из конструктора Lego.

Базовый синтаксис Google

Интерфейс Google поражает своей простотой: поле для ввода и две кнопки. Как говорится, все гениальное просто.

Специальный (расширенный) синтаксис Google

В дополнение к логическим операторам Google предоставляет вам модификаторы поиска, перечисленные в таблице. Модификаторы поиска называются специальным синтаксисом Google. Отнеситесь к этой таблице со всей серьезностью: попробовав однажды поискать что-нибудь с использованием модификаторов, вы уже не откажетесь от них.

Правильное использование модификатора inurl

Модификатор inurl используется для поиска по указанному URL. И отличие от модификатора site, который позволяет искать информацию только на одном сайте или домене, модификатор inurl позволяет искать информацию в подкаталогах сайта, например:

inurl: сайтskype-zvonim-besplatno

Модификатор inurl позволяет использовать символ * для указания домена, например:
inurl: "*.redhat.com"

Эффективнее всего использовать inurl в паре с site. Следующий запрос будет искать информацию в домене gidmir.ru, на всех его поддоменах, кроме www:
site: gidmir.ru inurl: "*.gidmir" -inurl: "www.gidmir.ru"

Смешанный синтаксис Google

Google позволяет использовать смешанный синтаксис, т.е. такой синтаксис, в запросе которого используются несколько специальных модификаторов поиска. Это позволяет достичь наилучшего результата.

Вот самый просто пример смешанного синтаксиса:
site: ru inurl: disc

В данном случае поиск будет произведен на сайтах домена, a URL должен содержать слово disc.

Вот еще один пример:
site: ru -inurl: оrg.ua

Поиск будет произведен на сайтах домена ru, но в результатах поиска будут отсутствовать страницы, расположенные на org.ua.

Как преодолеть ограничение на количество ключевых слов

Для большинства рядовых пользователей Google лимит в 10 ключевых не заметен. Но любители длинных запросов, наверное, заметили, что Google принимает во внимание только первые 10 ключевых слов, а все остальные просто игнорируются.

Зачем нужно искать длинные фразы? В большинстве случаев - это отрывки произведений. Предположим, что мы ищем произведение "Мастер и Маргарита". Нужно отметить, что ключевая фраза должна выглядеть как "Мастер Маргарита", поскольку слова и, или, and, of, or, I, a, the и некоторые другие игнорируются поисковой машиной. Если вы хотите принудительно включить одно из этих слов в поиск, поставьте перед этим словом знак "+", например +the.

Преодолеть лимит в 10 слов позволяет правильное построение запроса. Следующие рекомендации помогут вам не только сократить длину запроса, но и повысить эффективность поиска в целом.

Расширенный поиск Google

Набираем в строке ввода браузера адрес - www.google.ru/advanced_search и переходим на расширенный поиск Google.

С помощью расширенного поиска можно искать информацию почти также гибко, как и с помощью модификаторов поиска. Почему "почти"? Интерфейс расширенного поиска предоставляет доступ далеко не ко всем модификаторам поиска.

Установка свойств поиска в Google

Мне не хочется забивать вам голову техническими подробностями, поэтому я кратко скажу, что такое Cookies и нет, не с чем их едят, а как с ними нужно работать.

Представим, что перед нами поставлена такая задача: нужно написать индивидуальный отчет посещения для каждого клиента сайта нашей компании. То есть, чтобы пользователь не видел общее количество посещений, знал, сколько раз именно он был на нашем сайте. Для каждого IP-адреса нужно вести учет в одной таблице, которая, скорее всего, будет большой, а из этого следует, что мы нерационально используем процессорное время и дисковое пространство. Гораздо правильнее с нашей стороны будет использовать это пространство с большей пользой.

Мы устанавливаем Cookies - переменную, которая будет храниться на диске у пользователя. Эта переменная и будет хранить информацию о посещениях. Выгода очевидна. Во-первых, нам не нужна никакая таблица, во-вторых, мы упрощаем работу нашей программы.

Результат поиска Google

Результат поиска Google - это не просто набор ссылок, соответствующих указанным условиям поиска. Это нечто большее, заслуживающее отдельного рассмотрения. Введите слово "rusopen" и щелкните на кнопке Поиск в Google.

В верхней части мы видим общее количество результатов (883 000 000) и общее время, которое занял поиск, а именно 0,34 секунды.

    В большинстве случаев результат представляется в виде:
  • название страницы;
  • описание страницы;
  • URL страницы;
  • размер страницы;
  • дата последнего индексирования страницы;

Поиск картинок с Google

Служба Google Images позволяет найти различные изображения в Интернете. Хотя сами изображения индексировать нельзя, индексируются страницы, содержащие эти изображения. Введите описание изображения и получите много, очень много ссылок, а также сами изображения, представленные в виде галереи.

    Для более эффективного поиска картинок нужно использовать следующие модификаторы поиска:
  • intitle: - поиск в заголовке страницы;
  • filetype: - позволяет указать тип картинки, можно указывать следующие типы: JPEG and GIF, not BMP, PNG, изображения других типов не индексируются;
  • inurl: - поиск по указанному URL, например inurl: www.gidmir.ru ;
  • site: поиск на указанном домене или сайте, например, site: com.

Службы Google

Google - это мощнейшая поисковая система, охватывающая более 3 миллиардов страниц. Кроме обычных веб-страниц, Google индексирует файлы в форматах Word, Excel, PowerPoint, PDF и RTF. Также Google можно использовать для поиска картинок и номеров телефонов: для этого предназначены, соответственно, служба Google Images и Phonebook. В этой статье мы поговорим о специальных службах Google.

Почта Google

Попробуйте использовать почту от Google. Нужно отметить, что это не совсем обычная веб-почта.

    Среди особенностей Gmail нужно выделить следующие:
  • огромный размер почтового ящика - более 7 Гбайт;
  • вместо удаления писем их можно архивировать - тогда и места вам хватит надолго, и сможете восстановить письма, которые были получены или отправлены вами несколько лет назад;
  • возможность поиска по почтовому ящику с эффективностью Google;
  • удобная организация писем и ответов на них: все письма и ответы составляют одну цепочку, которую легко отслеживать;
  • хорошая защита от спама;
  • запоминающийся адрес ваше_имя@gmail.com;
  • удобный интерфейс.

Поисковая машина Рамблер (Rambler)

История Рамблера

Все началось в далеком 1991 году в городе Пущино Московской области. В том далеком году собралась группа единомышленников, среди которых были Дмитрий Крюков, Сергей Лысаков, Виктор Воронков, Владимир Самойлов, Юрий Ершов. Общим интересом этой группы стал Интернет. Наверное, в 1991 году ни один из будущих разработчиков Рамблера и не предполагал, что они станут создателями одной из самых крупных и известных поисковых машин Рунета. Ведь до этого все они обслуживали радиотехнические приборы в Институте биохимии и физиологии микроорганизмов РАН. В 1992 году была создана компания "Стек" во главе с Сергеем Лысаковым. Профиль компании - локальные сети и Интернет. По сути, компания "Стек" была интернет-провайдером. Фирма создала внутригородскую сеть, затем подключила Пущино к Москве, а уже через нее - к Интернету. Кстати, это был первый IP-канал, выходящий за пределы Москвы. И это в 1992 году! Сейчас проложить канал довольно проблематично - всегда найдется масса нюансов, а тогда кабели приходилось прокладывать самостоятельно, вручную, под землей, причем все это делалось зимой.

Как работал Рамблер

Интернет постоянно развивается: число сайтов и их размеры увеличиваются с каждым днем. Ведь только представьте: большие сайты обновляются каждый день, даже если объем обновлений составляет 1024 байт (1 Кбайт), то если предположить, что таких сайтов 10 000, каждый день поисковой машине приходится обрабатывать (индексировать) 10 000 Кбайт (грубо говоря, 10 Мбайт) информации. Число 10 000 взято "с потолка" - примера ради. Оно может быть выше или ниже - ведь даже крупные сайты обновляются не каждый день. Размер обновления также надуман. Представьте информационно-аналитический сайт, на котором практически каждый день публикуются новые статьи или перепечатываются материалы с других сайтов. В этом случае размер обновлений будет далеко не 1 Кбайт, а как минимум 10. Добавьте ко всему этому еще новости и другую информацию и выходит, что при количестве обновленных сайтов 10 000 поисковая машина должна проиндексировать 120 Мбайт текста. И при всем этом поисковик должен не только точно отобразить результаты поиска, но еще и сделать это как можно быстрее, чтобы пользователю было удобно с ним работать. Кому захочется ждать результатов поиска 10 минут? Это я, конечно, утрирую, но лично я бы не ждал результатов поиска более 30 секунд (с момента щелчка по кнопке Найти до появления первых десяти результатов). Выходит, разработчикам поисковой машины приходится постоянно поддерживать на должном уровне не только "железо", которое должно быть в состоянии обрабатывать постоянно растущие объемы информации, но и "математику" одним железом не возьмешь. Нужно постоянно совершенствовать алгоритмы поиска, чтобы при увеличении объемов поисковой базы, время поиска не увеличивалось (имеется в виду существенное увеличение времени - для пользователя нет разницы, сколько будет выполняться поиск 2,5 секунды или 2,0555 секунды, поскольку он не в состоянии оценить это время).

Синтаксис Рамблера

Запрос к Рамблеру мог состоять из одного или нескольких слов, причем запрос мог содержать знаки препинания. Разработчики Рамблера сконструировали свою поисковую машину для максимального удобства пользователя. Рамблер мог использовать даже неопытный пользователь, который совсем не знаком с языком запросов. Все, что ему нужно было сделать, - это ввести запрос, состоящий из нескольких слов (например, какую-то фразу) и без знаков препинания - Рамблер сам находил нужные документы, причем делал это максимально эффективно. Конечно, если правильно использовать язык запросов, эффективность значительно увеличивалася, но даже при полном незнании языка запросов эффективность поиска была на высоком уровне. Как уже отмечалось, знание языка запросов - в ваших же интересах, вы просто сможете найти нужную вам информацию значительно быстрее.

Поисковая машина Яндекс (Яndex)

Историческая справка

В далеком 1990 году в компании «Аркадия», которую возглавляли Аркадий Борковский и Аркадий Волож, началась разработка поискового программного обеспечения. Спустя шесть лет появился сайт «Яндекс». Но что же произошло за эти шесть лет?

За два года были созданы две информационно-поисковые системы - «Международная Классификация Изобретений» и «Классификатор Товаров и Услуг». Обе системы работали под DOS и позволяли производить поиск слова из заданного словаря с использованием логических операторов.

В 1993 году компания «Аркадия» стала подразделением CompTek. За 1993-1994 годы значительно усовершенствовались технологии поиска, например, словарь, обеспечивающий поиск с учетом морфологии русского языка, занимал всего 300 Кбайт, а это значит, что он свободно помещался в оперативную память, и работа с ним происходила очень быстро. На основе этой новой технологии в 1994 году был создан «Библейский компьютерный справочник» - информационно-поисковая система, работающая с переводами Ветхого и Нового Заветов.

Как Яндекс интерпретирует слова

Как поисковая система будет интерпретировать введенное вами слово?

    Сейчас мы об этом и поговорим:
  • Правило 1. Оказывается, система интерпретирует его согласно правилам русского языка. Пример: если вы ввели слово "машина", то также получите результаты, содержащие слова "машины", "машину" и т.д. Аналогично и с глаголами - по запросу "идти" получите документы, содержащие слова "идти", "идет", "шел", "шла" и т.д. Как видите, поисковая система более интеллектуальная, чем вы думали - это не просто средство для поиска определенного слова в базе данных.
  • Правило 2. Особое внимание уделяется словам, написанным с большой буквы. Если слово написано с большой буквы и не является первым в предложении, то будут найдены только слова с большой буквы. Иначе - будут найдены слова, написанные как с большой, так и с маленькой буквы. Пример: по запросу "Такса А." будут найдены документы, содержащие как "такса" (плата), так и "Такса" (фамилия), поскольку слово "Такса" хоть и написано с большой буквы, но оно стоит первым в предложении. А вот по запросу "А. Такса" будут найдены документы, содержащие только слово "Такса", написанное с большой буквы.

Основной синтаксис Яндекса

По умолчанию Яндекс использует логический оператор И. Это означает, что если вы ввели запрос "телевизор Samsung", то в результатах получите документы, в которых в одном предложении будут встречаться слова "телевизор" и "Samsung". Если вы хотите указать оператор И явно, то используйте символ амперсанда &. Другими словами, запрос "телевизор Samsung" аналогичен запросу "телевизор & Samsung". Можно также использовать запрос "телевизор + Samsung".

Если вам нужен обратный эффект, т.е. вы хотите получить документы, в которых есть отдельно слово "телевизор" и отдельно слово "Samsung", то вам нужно использовать оператор ИЛИ (|), например: "телевизор | Samsung".

Знак тильда (~) позволят найти документы, в которых есть первое слово, но нет второго. Например, по запросу "телевизор ~ Горизонт" будут найдены документы, в которых есть слово "телевизор", но рядом с ним (в одном предложении) нет слова "Горизонт". А что, если нам нужно найти документы, в которых вообще нет слова "Горизонт", но есть слово "телевизор". Чтобы перейти с уровня предложения на уровень документа, дважды укажите нужный оператор, например: && или ~~. В нашем случае подойдет запрос "телевизор ~~ Горизонт".

Очень часто нужно найти точную фразу, например, "президент России", в которой слово "России" строго следует сразу после слова "президент". В этом случае искомую фразу нужно заключить в кавычки.

Поиск с учетом расстояния в Яндексе

Все слова в тексте документа Яндекс нумерует по порядку. Расстояние между соседними словами равно 1 (а не 0!), а расстояние межу словами в обратном порядке равно -1. То же самое относится и к предложениям.

Для указания расстояния между словами ставится знак /, за которым сразу стоит число, значит, это расстояние между словами. Например, по запросу "разработчик /2 программ" будут найдены документы, в которых содержатся слова "разработчик" и "программ", причем расстояние между словами должно быть не более двух слов и все эти слова должны быть в одном предложении. В данном случае будут найдены документы, содержащие "разработчик прикладных программ", "разработчик системных программ" и т.д.

Если нам точно известны расстояние и порядок слов, то можно воспользоваться синтаксисом /+n. Например, запрос "красная /+1 шапочка" приведет к результату, в котором слово "шапочка" следует сразу за словом "красная". К такому же результату привел бы запрос "красная шапочка".

Использование скобок при поиске в Яндекс

Скобки используются для представления в запросе целого выражения. Например, по запросу "(история | технологии | программы)/+1 Linux" будут найдены документы, содержащие одну из фраз "история Linux", "технологии Linux", "программы Linux".

Зоны

Зона - это место поиска нужной вам информации. Вы можете задать зону, в которой вы хотите выполнить поиск - заголовках (зона Title), ссылках (anchors) или адресе (Address). Можно также использовать зону all - поиск по всему документу.

Синтаксис: $имя_зоны запрос.

Например: запрос $title "Microsoft" найдет все документы, в заголовках которых встречается точная фраза "Microsoft".

Дополнительные возможности поиска Яндекс

Поисковая машина Google позволяла ограничить место поиска определенным списком серверов или же, наоборот, исключить некоторые серверы из списка поиска. Точно такие же возможности есть и в поисковой машине Яндекс. Вы также можете искать документы, в которых есть ссылки на определенные URL или картинки. При задании маски файла (например, картинки) можно использовать символ *, означающий все символы, например: ”audi-*”.

Синтаксис следующий: #имя_элемента=”значение”.

    Элементом может быть:
  • url - определенный сайт;
  • link - ссылка;
  • image - картинка;
  • keywords - ключевые слова (*);
  • abstract - аннотация (*);
  • hint - подпись к картинке (*).

Поиск информации в Интернете

Сеть Интернет растет очень быстрыми темпами, поэтому найти нужную информацию среди сотен миллиардов Web-страниц и сотен миллионов файлов становится все сложнее. Для поиска информации используются специальные поисковые системы, которые содержат постоянно обновляемую информацию о местонахождении Web-страниц и файлов на сотнях миллионов серверов Интернета.

Поисковые системы содержат тематически сгруппированную информацию об информационных ресурсах Всемирной паутины в базах данных. Специальные программы-роботы периодически "обходят" Web-серверы Интернета, читают все встречающиеся документы, выделяют в них ключевые слова и заносят в базу данных Интернет-адреса документов.

Большинство поисковых систем разрешают автору Web-сайта самому внести информацию в базу данных, заполнив регистрационную анкету. В процессе заполнения анкеты разработчик сайта вносит адрес сайта, его название, краткое описание содержания сайта, а также ключевые слова, по которым легче всего будет найти сайт.

Поиск по ключевым словам. Поиск документа в базе данных поисковой системы осуществляется с помощью введения запросов в поле поиска .

Запрос должен содержать одно или несколько ключевых слов, которые являются главными для этого документа. Например, для поиска самих систем поиска в Интернете можно в поле поиска ввести ключевые слова "российская система поиска информации Интернет" (рис. 6.21).

Через некоторое время после отправки запроса поисковая система вернет список Интернет-адресов документов, в которых были найдены заданные ключевые слова. Для просмотра этого документа в браузере достаточно активизировать указывающую на него ссылку (рис. 6.22).

Если ключевые слова были выбраны неудачно, то список адресов документов может быть слишком большим (может содержать десятки и даже сотни тысяч ссылок). Для того чтобы уменьшить список, можно в поле поиска ввести дополнительные ключевые слова или воспользоваться каталогом поисковой системы.

Одной из наиболее полных и мощных поисковых систем является Google (www.google.ru), в базе данных которой хранятся 8 миллиардов Web-страниц и каждый месяц программы-роботы заносят в нее 5 миллионов новых страниц. В Рунете (российской части Интернета) обширные базы данных, содержащие по 200 миллионов документов, имеют поисковые системы Яndех (www.yandex.ru) и Rambler (www.rambler.ru).

Поиск в иерархической системе каталогов. В базе данных поисковой системы Web-сайты группируются в иерархические тематические каталоги , которые являются аналогами тематического каталога в библиотеке.

Тематические разделы верхнего уровня, например: Интернет, Компьютеры, Наука и образование и т. д., содержат вложенные каталоги. Например, каталог Интернет может содержать подкаталоги Поиск, Почта и др. (рис. 6.23).

Поиск информации в каталоге сводится к выбору определенного каталога, после чего пользователю будет представлен список ссылок на Интернет-адреса наиболее посещаемых и содержательных Web-сайтов. Каждая ссылка обычно аннотирована, т. е. содержит короткий комментарий к содержанию документа.

Наиболее полный многоуровневый иерархический тематический каталог русскоязычных Интернет-ресурсов имеет поисковая система Апорт (www.aport.ru). Каталог содержит подробную аннотацию содержания Web-сайтов и указание на их географическое положение.

Поиск файлов. Для поиска файлов на серверах файловых архивов существуют специализированные поисковые системы, в том числе поисковая система FileSearch (www.filesearch.ru). Для поиска файла необходимо ввести имя файла в поле поиска, и поисковая система выдаст Интернет-адреса серверов файловых архивов, на которых хранится файл с заданным именем.

Поиск информации в русскоязычной части Интернета с помощью наиболее поисковых систем: Google, Rambler, Апорт, Япс1ех и файловой поисковой системы Research можно производить с использованием интегрированной поисковой системы Gogle.ru (рис. 6.24). Для этого достаточно ввести ключевые слова в строку поиска, с помощью переключателей установить тип необходимой информации и щелкнуть по кнопке с названием поисковой системы Gogle.ru (рис. 6.24). Для этого достаточно ввести ключевые слова в строку поиска, с помощью переключателей установить тип необходимой информации и щелкнуть по кнопке с названием поисковой системы.


Рис. 6.24. Интегрированная поисковая система Gogle.ru

Способы поиска в Интернете

Три способа поиска в Интернете

Интернет в целом и Всемирная паутина, в частности, предоставляют абоненту доступ к тысячам серверов и миллионам Web-страниц, на которых хранится невообразимый объем информации. Как не потеряться в этом "информационном океане"? Для этого необходимо научиться искать и находить нужную информацию в сети.

Как уже было сказано, существуют три основных способа поиска информации в Интернете.

1. Указание адреса страницы. Это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа.

2. Передвижение по гиперссылкам. Это наименее удобный способ, так как с его помошыо можно искать документы, только близкие по смыслу текущему документу. Если текущий документ посвящен, например, музыке, то, используя гиперссылки этого документа, вряд ли можно будет попасть на сайт, посвященный спорту.

3. Обращение к поисковому серверу (поисковой системе) . Использование поисковых серверов - наиболее удобный способ поиска информации. В настоящее время в русскоязычной части Интернета популярны следующие поисковые серверы:

    Yandex;
    Rambler;
    Апорт.

Существуют и другие поисковые системы. Например, эффективная система поиска реализована на сервере почтовой службы mail.ru.

Поисковые серверы

Наиболее доступным и удобным способом поиска информации во Всемирной паутине является использование поисковых систем. При этом поиск информации можно осуществлять по каталогам, а также по набору ключевых слов, характеризующих отыскиваемый текстовый документ.

Рассмотрим использование поисковых серверов более подробно. Поисковый сервер содержит большое количество ссылок на самые различные документы, и все эти ссылки систематизированы в тематические каталоги. Например: спорт, кино, автомобили, игры, наука и др. Причем эти ссылки устанавливаются сервером самостоятельно, в автоматическом режиме путем регулярного просмотра всех появляющихся во Всемирной паутине Web-страниц. Кроме того, поисковые серверы предоставляют пользователю возможность поиска информации по ключевым словам. После ввода ключевых слов поисковый сервер начинает просматривать документы на других Web-серверах и выводить на экран ссылки на те документы, в которых встретились указанные слова. Обычно результаты поиска сортируются по убыванию специального рейтинга документов, который показывает, насколько полно заданный документ отвечает условиям поиска или насколько часто он запрашивается в сети.

Язык запросов поисковой системы

Группа ключевых слов, сформированная по определенным правилам - с помощью языка запросов, называется запросом к поисковому серверу. Языки запросов к разным поисковым серверам очень похожи. Подробнее об этом можно узнать, посетив раздел "Помощь" нужного поискового сервера. Рассмотрим правила формирования запросов на примере поисковой системы Яndex.

Синтаксис оператора Что означает оператор Пример запроса
пробел или & Логическое И (в пределах предложения) лечебная физкультура
&& Логическое И (в пределах документа) рецепты && (плавленый сыр)
| Логическое ИЛИ фото | фотография | снимок | фотоизображение
+ Обязательное наличие слова в найденном документе +быть или +не быть
() Группирование слов (технология | изготовление) (сыра | творога)
~ Бинарный оператор И НЕ (в пределах предложения) банки ~ закон
~~
или
_
Бинарный оператор И НЕ (в пределах документа) путеводитель по Парижу ~~ (агентство | тур)
/(n m) Расстояние в словах (минус (-) - назад, плюс (+) - вперед) поставщики /2 кофе музыкальное /(-2 4) образование вакансии ~ /+1 студентов
" " Поиск фразы "красная шапочка" Эквивалентно: красная /+1 шапочка
&&/(n m) Расстояние в предложениях (минус (-) - назад, плюс (+) - вперед) банк && /1 налоги

Чтобы получить лучшие результаты поиска, необходимо запомнить несколько простых правил:

    1. Не искать информацию только по одному ключевому слову.

    2. Лучше не вводить ключевые слова с прописной буквы, так как это может привести к тому, что не будут найдены те же слова, написанные со строчной буквы.

    3. Если в итоге поиска вы не получили никаких результатов, проверьте, нет ли в ключевых словах орфографических ошибок.

Современные поисковые системы предоставляют возможность подключения к сформированному запросу семантического анализатора. С его помощью можно, введя какое-либо слово, выбрать документы, в которых встречаются производные от этого слова в различных падежах, временах и пр.

Контрольные вопросы

1. Каким образом производится поиск документов по ключевым словам? В системе каталогов?

Задания для самостоятельного выполнения

6.8 Практическое задание. Сравнить результаты поиска документов по ключевому слову с использованием различных поисковых систем (воспользоваться интегрированной поисковой системой Gogle).

6.9 Практическое задание. Найти на серверах файловых архивов файл мультимедиа проигрывателя WinAmp.