Русский Журнал
СегодняОбзорыКолонкиПереводИздательства

Gateway | Невод | Интер(офф)вью | Бессрочная Ссылка | НасНет | ГлобусНет | Интер(акти)вью | Дурацкий Музей | Кафедра | Русская сеть: истории | Конец прекрасной эпохи
/ Net-культура / Gateway < Вы здесь
Как поисковые машины трактуют Интернет
Дата публикации:  7 Сентября 2003

получить по E-mail получить по E-mail
версия для печати версия для печати

InfoSeeker News

Перевод Дмитрия Беляева

Поисковые машины создаются людьми и в силу этого обнаруживают некоторую предвзятость. В частности, поскольку поисковые машины - не только информационные инструменты, но и культурные артефакты, то самим способом, которым они получают, обрабатывают и выдают информацию, - продукт, которым мы пользуемся, - они отражают культурную и социальную перспективу своих создателей. Уже то, что мы предпочитаем пользоваться Google, Yahoo! или AllTheWeb, указывает на нашу предвзятость, или социокультурную перспективу. Google и Yahoo! - продукты североамериканской культуры среднего класса, и как таковые являются наследием хайтековской культуры разработки программного обеспечения. AllTheWeb разработан в той же хайтековской культуре с имитацией североамериканской модели, хотя и отражает (в некоторой степени) европейские воззрения на жизнь. С другой стороны, MSN - создание достаточно самоуверенного и влиятельного разработчика ПО. Она настойчиво раскручивает себя и свои детища, зачастую смещая информацию в сторону собственных интересов - и это несмотря на то, что существуют иные, равноценные и конкурентоспособные продукты. Свои пристрастия есть у всех поисковиков. И знать эти пристрастия и влияющие на результат факторы нужно, чтобы научиться верно читать информацию, выданную машиной, и знать ее ценность.

Необъективность поисковых машин

Slashdot недавно представил статью "Насколько объективен MSN Search?" Пройдя по ссылкам, можно увидеть, что MSN так компонует результаты поиска, чтобы продвигать корпорацию Microsoft и ее продукты. К сожалению, рамки поставленного вопроса не охватывают коренных трудностей. Понятие объективности всегда относительно. Google не более объективен, чем MSN или AllTheWeb. Вопрос следует ставить иначе: на основе каких явных, базовых предпосылок вырабатывает информацию данный поисковик? Как только дело доходит до представления информации в таком порядке и так, чтобы выявить наиболее релевантные запросу сайты, точку зрения творцов инструмента оставлять без внимания нельзя. Искать объективное или беспристрастное представление бессмысленно. Чтобы пользоваться полученной информацией и знать, в чем пристрастен ее источник, будет правильней найти другие источники и сравнить с ними результаты первого.

Приблизиться к пониманию этой предвзятоости и/или системы интерпретации MSN можно, задав один и тот же запрос MSN и Google. Поискав слово "программное обеспечение (software) с помощью MSN, мы узнаем, что все ПО разрабатывается в Microsoft и что его можно купить в особых местах распространения, где оно продается в коробках и пересылается с помощью механизмов физической доставки, - да прочтите описания любого из пяти первых результатов поиска в Microsoft. Вы сразу увидите, что они основаны на вышеописанных принципах. Поискав то же самое в Google, обнаружим, что все ПО скачивается с Tucows и, как правило, бесплатно. Проведя тот же поиск в AskJeeves, приходим к выводу, что программное обеспечение производится (или его исходный код предоставляется) отдельными разработчиками, и чаще скачивается исходный код, а не сама программа. Так, в версии мира от AskJeeves мы обнаруживаем, что Microsoft рассматривается как один из этих производителей, в то время как Google и AllTheWeb и вовсе не учитывают Microsoft.

Вне зависимости от того, какой поисковой машиной вы пользуетесь, ей будет свойственна некоторая предвзятость или предпочтения в отборе сайтов, наилучшим образом соответствующих вашему запросу. Воспользовавшись любой и каждой поисковой машиной, мы получим набор результатов, которые в интерпретирующей структуре создателей поисковой машины рассматриваются как значимые и существенно важные.

Как сравнить поисковые машины

Мы в Microdoc News исследовали пятьдесят общих понятий - таких, как энергия (power), занятость (employment), правительство (government), Библия (Вible) и магазин (shop). Вообще говоря, мы пришли к определенным выводам по каждой из следующих поисковых машин:

  • MSN - рассматривает мир с коммерческой точки зрения. Да так, что она говорит, где можно купить Библию, вместо того, чтобы дать ссылку на самое книгу. Программное обеспечение - это то, что можно купить и доставить. Здравоохранение ограничивается сайтами, на которых можно приобрести медицинские товары и услуги. Энергия - это электричество, которое погасло в Нью-Йорке. Жизнь - это сайт "Зерно жизни"(Life Cereal), комедия Эдди Мерфи Life Movie и заведение хиропрактики Life University, - что отражает коммерческие интересы с точки зрения MSN. Здесь бал правит торговля: сплошные магазины, товары и главные торговые державы.
  • Google - рассматривает мир с технической, организационной точки зрения и с позиций консенсуса. Например, больше внимания уделяется фондам и организациям здравоохранения, а также библейским обществам и юридическим практикам. Энергия - электрическая субстанция, обладающая техническими характеристиками и практической пользой. Жизнь - фокусируется на книгах и иллюстрированных газетах с рассказами и разговорами о жизни. Точка зрения Google -квазиакадемическая, в значительной мере тяготеющая к Соединенным Штатам, к свободомыслию и индивидуализму.
  • AllTheWeb - довольно подражательный сайт, чьи результаты поиска во многом напоминают Google. Его система интерпретации так походит на Google, что мы заключаем: AllTheWeb следует в кильватере Google и стремится к гуглеобразию.
  • AskJeeves клонится к постмодернистской, коллажной и эклектичной системе трактовки. С одной стороны, для нее важны постмодернистские комментарии Библии - и в то же время здравоохранение рассматривается как главная забота правительства. Торговля и шоппинг здесь котируются довольно высоко. Жизнь сосредоточена в беременности, праве на жизнь и в пролайфистских организациях. Словом, меркантильность тут замешана на индивидуалистических свободах, правительственном контроле, а идентичность прослеживается и в старине, и в современности.

    Как сжиться с предвзятостью поисковых машин

    Работая с той или иной поисковой машиной, необходимо учитывать потенциальную предубежденность и перспективу ее системы толкования. При необходимости провести серьезные поиски, особенно если важна перспектива, задайте нескольким поисковым машинам идентичные запросы и сравните результаты. Наверняка можно сказать одно: поисковые машины - вовсе не отражение того, чем является сеть. Они представляют свою версию толкования Сети и ранжируют ссылки в соответствии с этой системой толкования.


  • поставить закладкупоставить закладку
    написать отзывнаписать отзыв


    Предыдущие публикации:
    Тодд Гаррисон (Todd Garrison), Вскрывая код /18.08/
    Это эссе - для тех читателей Нила Стивенсона, которые в предвкушении выхода его книги "Ртуть" взялись решить криптографическую загадку, предложенную на сайте Барочного Цикла. Если вы и сами пытались разгадать ее, или вам просто любопытно, - ниже следует объяснение того, как один любитель смог найти решение.
    Некоторые из трехсот с лишним доказательств существования Бога /10.08/
    Мы публикуем выдержки из доказательств существования Бога, собранных на форуме интернет-безбожников. Те, кому выдержек покажется мало, может прочесть все 343 (на сегодняшний день) доказательства и даже придумать свои. Но мало не покажется.
    Шива Вайдхьянатан (Siva Vaidhyanathan), Новая информационная экосистема: культуры анархии и давления (окончание) /05.08/
    Что было бы, если бы в годы холодной войны Соединенные Штаты ограничивали - вместо того чтобы поощрять - научное общение между американскими учеными и учеными из-за железного занавеса? Что было бы, если бы Лейбницу пришлось спрашивать у Ньютона позволения, чтобы пользоваться интегральным исчислением?
    Шива Вайдхьянатан (Siva Vaidhyanathan), Новая информационная экосистема: культуры анархии и давления. Часть первая: Это мир p2p /30.07/
    То, что мы называем коммуникативными сетями "p2p", на самом деле, отражает и развивает - модифицирует и расширяет - старую идеологию или культурную традицию. Электронные p2p-системы - Gnutella, к примеру, - лишь имитируют иные, знакомые формы не опосредованной, не подверженной цензуре, безответственной, тревожащей речи.
    Клэй Ширки (Clay Shirky), Группа - сама себе злейший враг /21.07/
    Люди, работающие над социальным ПО, по духу ближе к политологам и экономистам, нежели к создателям компиляторов. Вроде бы и то, и другое - программирование, но если одним из динамических факторов в работе выступает группа людей, то практики совершенно различны.
    предыдущая в начало следующая
    Поиск
     
     искать:

    архив колонки:





    Рассылка раздела 'Gateway' на Subscribe.ru