Русский Журнал
Mac
Содержание Unix
Dos
14.11.1997

Электронные библиотеки, объединяйтесь!


Уважаемый читатель! Вы можете вступить в полемику с автором этой статьи, написать о ней , который будет опубликован на этой странице.

   Уважаемая Лена!
   Спасибо за отзыв.
   Если Вы уже смотрели мою страницу, мы действительно рассматривали возможность использования различных "искалок",
   в том числе и Яndex. Возможности этой искалки действительно необходимы для нашего проекта, особенно что касается проблемы различных кодировок. В то же время есть у нее и недостатки, а именно: нестандартный синтаксис запросов
   (+ понимается иначе, чем в Альтависте) и относительно
   длительное время ожидания вставки URL (неделя и более против
   2 дней в Альтависте). Учитывая последнее, я предложил использовать пока только Альтависту для экспериментов,
   а затем, когда будут более или менее окончательно оговорены правила использования ключевых слов, заняться и другими "искалками". Кроме того,у меня уже давно есть идея обратиться с призывом к разработчикам "искалок" для изготовления и ведения специализированной датабазы поиска
   под наш проект. Может, кто откликнется.
   Кстати, это было бы заодно и ответом тем, кто высказывает следующее возражение по проекту: количество информации возрастет, что приведет к засорению датабазы.
   Пользуясь случаем, хочу внести поправки в статью:
   - запрос к Альтависте - ссылка на текст "нужную ссылку"
   должен выглядеть так:
   +CompuLib +"Майн Рид"
   В результате будет найдена ссылка на Майн Рида только у
   меня в библиотеке, поскольку запрос набран в кодировке 1251,
   и только у меня страница в этой кодировке занесена в Альтависту;
   - слова "ведущих электронных библиотек" следует понимать:
   тех, кто ведет электронные библиотеки, а не иначе.
   == Борис ==

18.11.97 18:8
Борис Бердичевский
Boris Berdichevski Home Page


   Уважаемый Борис!
   Проблема поиска в Сети безусловно существует.
   В качестве альтернативы AltaVista можно рассмотреть ЯNDEX.
   Яndex - это информационно-поисковая система (ИПС) с учетом морфологии русского и английского языка. Для русского языка она умеет выполнять две функции: анализ (разбор) - описание грамматических характеристик слова и приведение его к начальной форме и синтез (построение парадигмы) - создание списка всех словоформ, полученных при изменении слова по числам, падежам, родам и временам.
   Таким образом, учетом морфологии достигается большая чувствительность - нахождение всего того, что можно найти. Но остается проблема избирательности - отсев лишних документов.
   Продукт линии ЯNDEX - ЯNDEX-Web (www.yandex.ru) индексирует документы, находящиеся в доменах 'su', 'ru', русскоязычные инстранные сервера ('com', 'edu'), а также некоторые русскоязычные сервера СНГ (например, 'ua' - Украина). Список пополняется автоматически по мере того, как робот встречает ссылки на неизвестные ему сайты в доменах 'su' и 'ru'. Также сайты могут добавляться вручную.
   Одна из проблем русского Интернет-поиска - необходимость обработки разных кодировок. Яndex-Web поступает следующим образом: пользователю по возможности выдается ссылка на документ в той кодировке, в которой он дал запрос (если документ в этой кодировке существует). То есть Яndex, скачивая страницы, умеет понимать, явялются ли они разными документами либо одним и тем же, но в разной кодировке.

18.11.97 16:7
Lena Zemlinsky




В начало страницы
Русский Журнал. 14.11.1997.
Основная тенденция информационной недели:
действия президента намечают потенциал нового курса. Отзывы.
http://www.russ.ru/journal/media/97-11-14/berdic0.htm
Пишите нам: russ@russ.ru