Русский Журнал / Net-культура /
www.russ.ru/netcult/20020605.html

Единое информационное пространство. Утопия. Часть первая
Татьяна Мерсадыкова

Дата публикации:  5 Июня 2002

Типичный пример - история с терактами 11 сентября. Как сейчас выясняется, спецслужбы, оказывается, вполне могли, по крайней мере, попытаться его предотвратить - были доклады и о планах Аль-Каеды использовать самолеты в качестве бомб, и о том, что в летных школах США обучаются арабские граждане сомнительного свойства, и другие сигналы тоже были. Как признался один из руководителей шпионских ведомств, просто некому было свести все это воедино - административные барьеры не позволили.

Нарушим классическую формулу изложения "зачем-что-как" и начнем все-таки с сути. А то будет непонятно, зачем нужны рассуждения на тему "зачем?".

Итак, вопрос первый: что?

Если кратко, то "единое информационное пространство" - слияние двух информационных сред: традиционной (оффлайновой) и новой (сетевой).

Как бы мы ни любили наш Интернет, с точки зрения информации - это игрушечная страна, диснейлэнд. Там по игрушечным дорожкам мимо игрушечных газончиков разъезжает такая шикарная машина, как, например, поисковая система Яндекса. За державу обидно!

Основная информация, накопленная человечеством, записана все-таки на бумаге. Книги печатали 5 веков, а сервера заполняют ... ну лет этак 20-30. С другой скоростью? Да, конечно. Но в книгах (статьях, отчетах, диссертациях, газетах, журналах) описывали все, что узнали (изобрели, сделали, поругали, воспели), а в Сети появляется только то, что кому-то для чего-то потребовалось разместить. Не будем углубляться в тему "кому, для чего и в каком виде" - сколько бы ни рассуждали, все равно получим хвост от кошки. Удобная коммуникативная среда нужна для организации информации, донесения ее до потребителя, для составления из нее букетов, цветущих красотой другого уровня осознания, а не для профанации и дублирования.

Первое действующее лицо: авторитетный файл

Поскольку книг очень много, над их упорядочением (каталогизацией) потрудились немало. То, что интернетовские поисковики и каталоги - родные дети библиотечного каталога - не более, чем красивая сказка. В библиотечном деле есть такое понятие: авторитетный файл (слово файл здесь используется в первоначальном смысле "том", поскольку изобретены оные до компьютеров). Он состоит из нескольких частей:
- авторитетный файл предметных рубрик
- имен
- названий
- событий.
При каталогизации книги (статьи) также указывается к какому временному интервалу относится содержащийся в ней материал.

Авторитетный файл (АФ) разрабатывается ведущими библиотеками мира, под одними и теми же кодами там сидят названия (рубрик, стран, людей), записанные на разных языках. Книга, подписанная псевдонимом "Сирин", но отнесенная (при каталогизации) к имени "Набоков Владимир Владимирович", всегда будет найдена при составлении библиографии классика. А статья про жуков, подписанная Владимиром Набоковым (отцом) - появится в списке его трудов, поскольку ей будет поставлен в соответствие код Набокова Владимира Дмитриевича. Вот пример действительно единого информационного пространства (оторванного, правда, от всего остального).

АФ предметных рубрик, разработанный Российской Национальной библиотекой (РНБ), содержит более миллиона записей. Отдельные разделы АФ создаются специализированными библиографирующими организациями. Нельзя сказать, что эта работа завершена или идет гладко - ведутся постоянные доработки, происходит борьба гипотез, мнений, авторитетов: чей файл авторитетнее. НО. Библиотеки договорились об едином формате представления данных (RUSMARC - разновидность международного формата MARC - есть еще USMARC, UKMARC и т.д., но все они совместимы). В настоящее время и у нас и за рубежом производится корпоративная каталогизация библиотек - в Интернете создается сводный каталог всех библиотек. Почему каталогизация корпоративная? Потому что библиотеки, хотя и с трудом, но договариваются о разделении труда - кто что каталогизирует (по разделам, по специализации). Каждую книгу достаточно описать 1 раз, а потом все остальные могут этим описанием пользоваться. Почему каталог сводный, а не единый? Именно потому, что библиографирующие организации не могут договориться об одном авторитетном файле. Как умные люди это обходят? Дают возможность подключать тот АФ, который вам больше нравится - или несколько - или все имеющиеся.

Обмен данных с файлом (файлами) обеспечивается специальным протоколом обмена. Он международный и называется z39.50 - это второе действующее лицо нашей утопии. Он тоже не единственный. Граждане, как у нас принято, нагородили кучу преград: административных, ведомственных, амбициозных и прочих - и с криками "ура!" их преодолевают.

Но несмотря на все эти "временные трудности", сводные каталоги в Сети есть, записи получать по одной и пачками их них можно, книги заказываются и доставляются - в электронном виде или живьем (в том числе, из Библиотеки Конгресса США и других библиотек мира). Можно получить полную библиографию (из того, что каталогизировано, естественно) по любой интересующей теме. Выдача самих книг - это порядки конкретных библиотек, в которых они хранятся, но в большинстве цивилизованных мест уже поддержана передача запрашиваемого текста в электронном виде (чаще всего, за деньги, но есть и бесплатные ресурсы - научные, в основном). То, что библиотеки еще до конца не договорились и не все корпоративно каталогизировали, не мешает создать сейчас механизм (технологию), объединяющий информационные ресурсы на основе АФ. Для этого всего лишь надо использовать при описании каждого информационного объекта рубрики и названия из АФ с соответствующими кодами. Он большой и сложный? Да. Но каждая предметная область использует один небольшой его раздел, и сервисом для поиска он обеспечен. А если коды не проставлены, связь обеспечивается (менее надежно) по ключевым словам.

Что за информационные ресурсы и какие информационные объекты? Пора представить третье действующее лицо: база данных.

Чем отличается качественный сайт от простой странички о том - о сем? Тем, что на страничке написано только то, что на ней написано, а то что она удаленно доступна - ничего принципиально не меняет - информации от этого больше не становится. Она плоская. За качественным сайтом стоит база данных - информационный ресурс, создаваемый профессионалами. Информационный объект - это 1 запись этой базы. В открытый доступ редко (или никогда) выставляют всю информацию (все поля), но (важный момент) информация там не плоская, а объемная, база поддерживает разные срезы ее представления и обобщения, позволяет получить (с помощью горизонтальных связей и умной головы пользователя) ту самую новую информационную сущность, о которой мы говорили вначале.

Небольшой пример. В Пскове в соответствующем учреждении сидят специально обученные люди и заносят в базу данных информацию о памятниках истории и культуры Пскова и Псковской области. Им за это платят зарплату. С помощью специально обученной программы, без приложения чьих-либо сил (времени, денег, настроения, вдохновения) из базы динамически генерируются HTML-странички, доступные на сайте по запросу:
- о церквях, построенных в 17 веке;
- о местах, связанных со светлым именем Петра I;
- обо всех памятниках Гдовского района;
- ... сами понимаете, что и так далее.

Все связи по именам, временам и меридианам, включая гиперссылки на сетевые ресурсы, проставлены прямо в базе, все изменения вносятся туда же и своевременно.

А теперь: идеальная картина (утопия)

Все трудящиеся, возделывающие информационное поле (крестьяне, хуторяне, колхозники и даже председатели колхозов) сидят и заполняют свои базы. Стоит звенящая тишина. Библиотеки, чтоб не нарушать оную, прекратили спорить, договорились об едином авторитетном файле и дружно корпоративно каталогизируют свои немеренные фонды. Шикарная машина типа Яндекса - только еще шикарнее, поскольку научилась летать, плавать и печь пирожки, подключившись к протоколу z39.50 - привозит счастливому обитателю новой он-офф-лайновой обители на дом ВСЮ информацию, которая есть на свете. Последняя актуальна, не содержит ошибок и не требует ни от кого никаких дополнительных затрат. Счастливый гражданин может получить ее не только дома через усталый рваный диал-ап, но и в библиотеке, в музее, прямо на улице. Залюбовавшись красивым зданием, деревом и девушкой, он заглядывает в ближайшее интернет-кафе (интернет-булочную, интернет-аптеку, интернет-туалет) и дрожащей рукой набирает: "Моховая 15, береза". Он (наконец) имеет шанс научиться задавать вопросы...

Обещанный вопрос "зачем?", который и так умеют задавать граждане пока еще не идеальной державы, мы рассмотрим во второй части нашей утопии.