Русский Журнал
СегодняОбзорыКолонкиПереводИздательства

Gateway | Невод | Интер(офф)вью | Бессрочная Ссылка | НасНет | ГлобусНет | Интер(акти)вью | Дурацкий Музей | Кафедра | Русская сеть: истории | Конец прекрасной эпохи
/ Net-культура / < Вы здесь
Степенное распределение, веблоги и неравенство
Дата публикации:  17 Февраля 2003

получить по E-mail получить по E-mail
версия для печати версия для печати

Версия 1.1: Дополнена 10 февраля 2003 г., добавлены упоминания об обновлении проекта "Экосистема блогов" и обработанная Джейсоном Коттке статистика Technorati.com. В примечании речь идет о списке интересных новичков Technorati - его составил Дэвид Сифрай отчасти в ответ на эту статью

Пишущие о социальных аспектах веблогов имеют обыкновение отмечать (с недовольством, как правило) возникновение "верхушки": большую часть трафика генерит узкий круг авторов. Мы это уже слышали в контексте MUD, BBS и сетевых сообществ - Echo, например, или Well. Образуется новая среда, поначалу восхитительно непохожая на существующие с их элитами и групповщиной. Потом система вырастает и возникают иерархии. Не каждый может участвовать во всех разговорах. Не всех слышат. Создается ощущение, что какой-то костяк сплочен тесней, чем все остальные. И так далее.

До недавнего появления теоретических работ по социальным сетям это обычно объяснялось поведением участников: какие-то члены сообщества скурвились, новички разбодяживают исходную атмосферу, все в таком духе. Теперь известно, что подобные объяснения ошибочны или, во всяком случае, не по делу. Причина в другом: многообразие плюс свобода выбора дают неравенство, и чем система разнообразнее, тем неравнее.

В системе, дающей свободу выбора из множества опций множеству людей, небольшое подмножество получает непропорционально большой трафик (внимание, доход), даже если участники системы такого результата не добиваются. Моральная слабость, предательство или любой психологический резон тут ни при чем. Сам акт выбора, осуществленный многими и притом достаточно свободно, создает степенные законы распределения.

Предсказуемый дисбаланс

Степенные законы распределения - те, что породили афоризмы вроде "правила 80/20" и "победитель получает все", - теперь, наконец, вполне ясны и могут принести пользу. На протяжении последнего столетия ученые обнаруживали степенные распределения в человеческих системах. Экономист Вильфредо Парето утверждал, что благосостояние распределяется с "предсказуемым дисбалансом": 80% благосостояния - у 20% населения. Лингвист Джордж Ципф отмечал, что словоупотребление описывается формулами степенных распределений: небольшое число частоупотребимых слов (например, "я"), среднее число общеупотребимых ("книга", "кошка", "чашка") и огромное - редкоупотребимых ("аристотелевский", "гипогнатический"). Якоб Нильсен обнаружил степенные распределения в статистике просмотра веб-страниц. И так далее.

Мы так привыкли к гауссовой кривой, что степенные распределения могут показаться странностью. Кривая на рис. 1 - несколько сотен блогов, ранжированных по числу входящих линков, - в общих чертах дает степенное распределение. Из 433 блогов аж 5% ссылок приходятся на двух лидеров (InstaPundit и Эндрю Салливан, что неудивительно). На первую десятку (менее 3% от общего числа блогов) приходятся 20% линков, а на первые пятьдесят, то есть менее 12% общего числа, - 50% линков.


Рис. 1: 433 веблога, ранжированные по числу входящих ссылок.
Данные заимствованы из работы N.Z Bear 2002 года по экосистеме блогосферы.
Текущая версия проекта - http://www.myelin.co.nz/ecosystem/.

Число входящих линков - просто пример. Степенные распределения обнаруживаются повсюду. Списки рассылки Yahoo Groups, ранжированные по числу подписчиков, дают степенное распределение (график ╧2). Пользователи LiveJournal, ранжированные по количеству френдов, - оно же (график ╧3). У Джейсона Коттке в статистике линков Technorati снова обнаруживаем степенное распределение. Трафик статьи, которую вы читаете сейчас, будет описываться степенным законом распределения: большая часть трафика - с крошечного процента сайтов. Если у вас есть веб-сайт, где больше двух десятков страниц, выберите любой временной отрезок, когда трафик составляет по крайней мере 1000 просмотров, и увидите, что просмотры, как и трафик с рефереров, тоже согласуются со степенным распределением.


Рис. 2: Все списки рассылки категории Yahoo Groups Television, ранжированные по числу подписчиков (сентябрь 2002 года).


Рис. 3: Пользователи LiveJournal, ранжированные по числу френдов (данные на март 2002 года).

У верхушки свои привилегии

Базовая кривая проста - в любой ранжированной системе значение N-ной позиции равно 1/N. По какому параметру ни выстраивай (по доходам, линкам, трафику), значение второй позиции составит половину значения первой, а значение десятой - одну десятую первой. (Существуют и более сложные формулы, дающие большую или меньшую крутизну кривой, но все они описывают ту же самую кривую.) Мы наблюдаем ее во множестве систем. Однако до недавнего времени нам не хватало теории, которая упорядочила бы эти паттерны.

Благодаря открытиям в области теории сетей - к примеру, Альберта-Ласло Барабаши, Дункана Уоттса и Бернардо Хьюбермана (см. работы "Линк", "Шесть переходов" и "Законы веба"), - мы знаем, что степенные распределения возникают в социальных системах, где многие выбирают из многого. Мы также знаем, что с ростом числа вариантов выбора крутизна кривой растет. Это расходится с нашими интуитивными представлениями - большинство из нас решило бы, что увеличение числа вариантов выравнивает кривую, но в действительности с ростом системы разрыв между первой и центральной позициями увеличивается.

Еще одна неожиданность: большинство элементов в степенном распределении находятся ниже среднего уровня - кривая резко смещена к первым позициям. На рис. 1 среднее число входящих линков (отношение всей их совокупности к числу блогов) равно 31. Первый же блог с числом входящих линков меньше 31 занимает 142-е место; следовательно, у двух третей блогов это число ниже среднего. Мы привыкли к равномерной гауссовой кривой, середина которой совпадает со средним значением рассматриваемой системы, так что расположение двух третей ниже среднего кажется странным. (Фактический центральный элемент, то есть 217-й блог из 433-ти, имеет лишь 15 входящих линков.)

При свободе выбора от звезд никуда не денешься

Вот каким образом свобода выбора приводит к столь неравным распределениям. Возьмем гипотетическую группу из тысячи человек. Каждый из них выбирает 10 любимых блогов. Одна из возможных моделей такова: допустим, у каждого имеется равный шанс полюбить каждый блог. Распределение получится примерно равное: любой блог желают читать приблизительно одинаковое число людей. Популярность одних блогов выше среднего, других, естественно, ниже, но это лишь статистическая погрешность. Популярность же подавляющего большинства окажется средней, а экстремумы будут не слишком отклоняться от этого среднего. При такой модели картины не изменят ни качество текста, ни чужой выбор. В этой модели нет общих интересов, любимых жанров, влияния рекламы или рекомендаций друзей.

На самом деле, никто не свободен от влияния чужих предпочтений. Если допустить, что блог, выбранный одним пользователем, с большей (пусть незначительно) вероятностью будет выбран другим, ситуация резко меняется. Алиса, первый пользователь, выбирает блоги самостоятельно, но несколько вероятнее, что Боб выберет блоги Алисы, а не какие-нибудь другие. Боб осуществил акт выбора и тем больше шансов, что блоги, выбранные им и Алисой, выберет Кармен - и так далее. Таким образом, небольшое число блогов все с большей вероятностью будут выбираться в дальнейшем, поскольку ранее они уже были отмечены выбором.

Считайте, что позитивный отклик - это такой бонус. Система исходит из того, что новички приходят в среду, сформированную теми, кто пришел раньше; тысяча первый пользователь выберет блоги не случайно, а под влиянием, пусть неосознанным, уже сформировавшихся в системе предпочтений.

Заметьте, эта модель ни капли не учитывает причин, по которым пользователь предпочитает один блог другому. Может, тексты лучше среднего (выбор по качеству), может, по чужим рекомендациям (выбор по рекламе), может, есть некая ценность в чтении блогов, которые читают друзья (выбор "из солидарности", в группах он особенно популярен). Может, работают все три фактора, или какой-нибудь четвертый, разные факторы для разных читателей и разных авторов. Суть в том, что любое стремление к согласию в разнообразной и свободной системе, как бы незначительно это стремление ни было и чем бы ни объяснялось, в итоге дает степенные распределения.

Оно возникает естественно и, чтобы изменить это распределение, надо заставить сотни тысяч блоггеров ссылаться на одни блоги и убирать линки на другие. Следовательно - тотальный надзор и применение силы. Ликвидация "звездной системы" с целью спасения сообщества станет его уничтожением.

Неравенство и справедливость

Степенные распределения вездесущи, и потому вопрос о том, существует ли неравенство в мире веблогов (вообще говоря, в любой социальной системе), неправомерен: ответ всегда будет "да". "Правильный" вопрос должен стоять так: а справедливо ли такое неравенство? За то, что оно максимально справедливо, есть четыре аргумента.

  • Во-первых, разумеется, свобода мира веблогов в целом. Они открываются бесплатно, контроля никакого, так что порог открытия веблога на бесконечно малую величину выше, чем порог собственно подключения к Интернету.
  • Во-вторых, блоги требуют ежедневных трудов. При всей нашей любви к Джошу Маршаллу (TalkingPointsMemo.com) или Марку Пилгриму (DiveIntoMark.org) оба они исчезнут, перестав писать или заметно сократив число записей. Блоги - не место для почивания на лаврах.
  • В-третьих, звезды существуют не из-за внутригрупповых предпочтений, но из-за предпочтений сотен людей, на них ссылающихся. Популярность - результат своего рода распределенного одобрения, а его подделать сложновато.
  • Наконец, никакой "верхушки" на самом деле нет, поскольку нет точек разрыва. В объяснениях степенных законов (включая данное) часто приводятся цифры "50% ссылок ведут на 12% блогов", но это произвольная разметка. В степенном распределении самая большая дуга по определению располагается между точками 1 и 2. "Верхушки", которая качественно отличалась бы от ближайших соседей, не существует, поэтому любые границы между более и менее читаемыми блогами произвольны.

Средней позиции не удержать

Да, сейчас, когда система еще слишком молода, такое неравенство наиболее справедливо. Но ее распределенность по степенному закону может стать началом некого гомеостаза, тенденции к самосохранению вопреки давлению извне. Такова ли система веблогов? Имеются ли талантливые люди, которые заслуживают внимания не меньше нынешних звезд, однако не получают такого трафика? Без сомнения. Ухудшится ли эта ситуация в дальнейшем? Да.

Хотя каждый день приходят новые блоггеры и новые читатели, все они добавляют трафика главным образом меньшинству, "верхушке", а у большинства новых блогов трафик ниже среднего. И этот разрыв будет расти с ростом всего мира веблогов. Сейчас еще можно запустить новый хороший блог и стать популярным - но добиться этого сложней, чем год назад, а через год станет еще сложнее. В какой-то момент (возможно, он уже прошел) технология веблогов превратится в платформу для такого разнообразия форм публикаций, фильтрации, объединений и слияний, что "блог" перестанет обозначать какую-то четко очерченную деятельность. Сам термин отойдет на второй план, как "домашняя страница" или "портал" - слова, смысл которых когда-то был весьма конкретен, но со временем размылся. Это случится, когда разрыв между крайними значениями степенного распределения так вырастет, что какой-нибудь Просто Блоггер и Гленн Рейнолдс с его InstaРundit уже будут заниматься вроде бы разными вещами.

Рейтинг возглавят блоггеры, котороые станут обычными СМИ (что, видимо, означает "привычные СМИ"). Это происходит очень просто: с увеличением аудитории блоггера его тексты читает все больше народу, в том числе и блоггеров, за чьими блогами он уже не в состоянии уследить. Блоггер-СМИ уже не может ссылаться на всех жаждущих его внимания. Он не может ответить на всю почту и прочесть все комментарии к своим записям. В результате такого давления блоггер начинает вещать, выдавать информацию, не участвуя в ее обсуждении.

А тем временем читаемые немногими веблоги в длинном хвосте кривой превратятся в средство общения. В мире, где блоггеры располагаются по большей части ниже средней отметки трафика, размер аудитории не может быть единственным показателем успеха. LiveJournal уловил это несколько лет назад, предположив, что люди будут писать скорее для друзей, чем для какой-то безликой толпы. Опубликовать текст для трех случайно забрежших посетителей - верный способ разочароваться, но опубликовать сагу о том, как провел субботний вечер, для трех ближайших друзей, - все равно что с ними поболтать, особенно если они сами что-нибудь от себя добавят. У LiveJournal есть большое преимущество перед большинством других блог-платформ: в нем гораздо проще отслеживать взаимосвязи между френдами и сообществами. Однако распространение клиентов вроде Trackback позволяют поддерживать такой диалоговый режим и на других платформах.

Между блогами-СМИ и блогами-беседками расположатся Классические Блоги - записи одного или нескольких человек для средних размеров аудитории, с которой автор плюс-минус связан. Мир веблогов непрерывно растет, и в дальнейшем классических блогов станет больше. Однако они будут отставать - и по траффику (забитые "СМИ-блогами"), и по общему числу (диалоговые блоги станут большинством).

Неравенство в широких и ничем не ограниченных средах - как пробки на забитых дорогах. Оно никем не инспирировано и возникает как неизбежное свойство нормально функционирующей системы. Сравнительно равномерное распределение читателей в начальный период никак не связано с природой блогов или блоггеров. Просто раньше блогов не хватало для по-настоящему неравного распределения. А теперь хватает.

Примечание. - Дэвида Сифрая, создателя Technorati.com, эта статья отчасти подтолкнула к созданию списка интересных новичков Technorati. Список создан для придания системе динамичности: в нем указаны пользователи, у которых в целом линков мало, но которые сделали нечто для резкого увеличения их числа.


Оригинал статьи Power Laws, Weblogs, and Inequality на сайте Клэя Ширки.

Впервые опубликовано 8 февраля 2003 года в списке рассылки "Сети, экономика и культура".

Перевод: Настик Грызунова.


поставить закладкупоставить закладку
написать отзывнаписать отзыв


Предыдущие публикации:
Юрий Ревич, Рождение и закат звезды Xerox /16.02/
Компания Xerox бесплатно поработала на мировое сообщество - идеи, заложенные в Star, начали использоваться повсеместно практически сразу после его возникновения, а ведущие разработчики, разочарованные неудачей, оказались либо в Microsoft, либо в Apple
Мирослав Немиров, Все о поэзии 125 /14.02/
Подземные тайны.
Кот Аллерген, VIP-ы в сетевой бане. Два Димы Б. /14.02/
Явление литературных ВИПов сетевому народу происходит по своим законам, происходит все чаще и приносит нам, сетевым аборигенам, немало радости. Кроме того, оно весьма поучительно.
Виктор Перельман, Бум-спам или что такое почтовый ящик? /11.02/
Об эффективности мелких бумажек, заполняющих почтовый ящик, судить трудно. Раз эти бумажки не переводятся, значит, это кому-то выгодно. Вряд ли я буду оригинален, если скажу, что массированные рекламные вложения в ящики вызывают у многих раздражение и приводят к неудобствам, а порой и к неприятностям. И в связи с этим встают кое-какие вопросы.
Юрий Ревич, Хороните лицо /10.02/
Игнорирование элементарных и хорошо известных профессионалам-психологам положений - обычное дело не только для разработчиков таких безобидных вещей, как программы или пульты управления бытовыми приборами, но и для конструкторов многих весьма опасных "игрушек".
предыдущая в начало следующая
Клэй Ширки (Clay Shirky)
Клэй Ширки
(CLAY SHIRKY)
URL

Поиск
 
 искать:

архив колонки: