1995 | 1996 | 1997 | 1998 | 1999 | 2000 | 2001 | 2002 | 2003 | 2004 | Оглавление текущего номера /126, 1995 г./ | Бонус | Поиск  

Интернет

Как найти информацию в Сети

Максим Пресняков


© 2004, Еженедельник «Компьютерра» | http://www.computerra.ru/offline
Этого материала на сайте "Компьютерры", к сожалению, нет

Первая проблема, встающая перед человеком, начавшим работать с "Интернетом", – как искать информацию.

Сразу оговорюсь ниже будет постоянно упоминаться словосочетание "инструмент (средство) поиска". Думается, это наиболее адекватный перевод английского "search engine". Но я не настаиваю если кому-то больше нравится переводить слово "engine" как "локомотив" – пожалуйста.

 

На сегодня в "Интернете" существует несколько инструментов поиска Lycos, Veronica, Archie. Все они похожи друг на друга, так как используют так называемый контекстный поиск. Это довольно простой в освоении инструмент, но если вы в Lycos зададите для поиска слово "windows" (или, не дай Бог, просто "window", без "s" на конце), то получите несколько десятков тысяч ссылок. Чтобы просмотреть их все, понадобится несколько лет.

Если же вас подобная перспектива не устраивает, лучше придумать еще пару слов, сужающих круг поиска Зайдя в "search options", можно задать логическое условие например, есть ли в найденном тексте все заданные слова (логическое "И"), или хотя бы одно из слов (логическое "ИЛИ"), или в документе должны встречаться любые пять из заданных слов. Однажды меня попросили найти тексты и дискографию группы "Yes". Представляете, сколько я получил ссылок с этим словом. Но круг поиска был серьезно сужен, когда я задал в качестве второго ключа слово "music".

 

Кроме того, можно уточнить, где именно будет осуществляться поиск в заголовках страниц, в адресах, или же по всему тексту.

Некоторые поисковые инструменты имеют свой язык запросов (хотя отличий и немного). Описание каждого из них вы сможете найти непосредственно на том сервере, на котором располагается выбранное вами поисковое средство. В большинстве случаев запрос будет чем-то вроде "Вася" И "Курочкин" ИЛИ ("Таня" ИЛИ "Маша"). И "Потапова". Понятно, что результатом этого запроса будут ссылки на серверы, где встречается упоминание либо о Васе Курочкине, либо о Тане или Маше Потаповых.

Думаю, не будет преувеличением сказать, что искусство поиска в "Интернете" – это искусство задавать ключевые слова так, чтобы получить минимум информационного мусора.

Первый поисковый инструмент, о котором я хочу рассказать, – "Yahoo!", находящийся по адресу http://www.yahoo.com. На этом сервере представлен один из лучших в мире каталогов ссылок, очень хорошо рассортированный по темам. Так что поиск по ключевым словам может и не потребоваться, если же избежать его не удалось, то вы сразу увидите, к какой теме относится ссылка, появившаяся в результате вашего запроса. Поиск с помощью "Yahoo1" осуществляется только по WWW-серверам.

По-видимому, наиболее мощным на сегодня инструментом поиска является Lycos, который можно найти по адресу http://lycos.cs.emu.edu/. Ныне он включает в себя более десяти миллионов ссылок на различные места в "Интернете". В отличие от остальных средств поиска, здесь есть возможность искать не по одному, а сразу по всем услугам "Интернета", исключая, пожалуй, только телеконференции.

OpenText, Infoseek и Webcrawler предназначены для поиска по "Повсеместно протянутой паутине" (WWW) Вы найдете их соответственно, по адресам:

http://www.opentext.com,

http://www.webcrawler.com

http://www2.mfoseek.com.

Скажу пару слов о том, почему упоминаются похожие по назначению инструменты поиска. Просто их базы данных создавались независимо и перекрывают друг друга не полностью. Поэтому некоторые ссылки, отсутствующие на одном из серверов, могут присутствовать на другом. Отсюда и совет если вы не нашли того, что искали, попробуйте повторить поиск с использованием другого инструмента. Для поиска в телеконференциях USEnet можно применить инструмент Dejanews, находящийся по адресу http://www.dejanews.com/. Это единственное из известных автору этих строк средство поиска в телеконференциях.

 

Для поиска в телеконференциях сети "Релком", являющейся составной частью "Интернета", есть пока единственное средство, полную информацию о котором можно получить на WWW-сервере, находящемся по адресу http://www.dux.ru. Правда, поиск там осуществляется не по всем конференциям, а только по некоторым группам, например – relcom.commerce.spb. Если же вам надо организовать постоянный приток информации из этих конференций, то здесь есть список рассылки, позволяющий создать свою "миниконференцию". Естественно, запрос информации также производится по ключевым словам. При этом результаты поиска будут регулярно поступать к вам по электронной почте. Из-за того, что запрос осуществляется по ключевым словам, на мой взгляд, имеет смысл, прежде чем подписываться на постоянное получение информации, проверить адекватность подбора ключевых слов в диалоговом режиме, чтобы исключить информационный мусор, ведь в "Релкоме" вы платите не только за время нахождения на линии, но и за трафик.

 

 

Для поиска по ftp-серверам существует Archie. И снова я называю несколько серверов – из-за того, что у них разная область охвата, и ни один Archie-сервер не содержит информацию обо всех ftp-серверах. Одним словом, имеет смысл посылать запросы на несколько серверов.

С помощью telnet можно получить доступ, например, к archie.mcgill.ca, archie.sura.net, archie.unl.edu, archie.ans.net, archie.rutgers.edu и другим. Кроме того, можно сделать запрос по электронной почте, посылая письмо с командой help по адресам вида archie@quiche.cs.mcgill.ca.

Для поиска в Gopher также существует специальный инструмент – veronica, который можно найти по адресу gopher://veronica.scs.unr.edu.

 

Присущий "Компьютерре "Дух Противоречия, тертый калач и стреляный воробей Internet, счел необходимым сделать к этой статье следующее примечание:

 – Вот до чего доводит людей Web. Запускают поиск, получают локатор, нажимают кнопку – и готово. Как будто браузер и в самом деле по Сети шарит. В действительности же, search engine, или инструменты поиска, как их автор называет, это не локомотивы, а обычные компьютеры, то есть специальные серверы, которые время от времени автоматически "копаются " в Сети и составляют справочники. А с помощью описанных в этой статье интерфейсов мы даем серверам задание на поиск в справочниках. Эх, бывает, найдешь в справочнике файл, а его уже и след простыл...


1995 | 1996 | 1997 | 1998 | 1999 | 2000 | 2001 | 2002 | 2003 | 2004 | Оглавление текущего номера /126, 1995 г./ | Бонус | Поиск  

© 2004, Издательский дом «Компьютерра» | http://www.computerra.ru
Телефон редакции: (095) 232-22-61
E-mail редакции: inform@computerra.ru