Русский Журнал
СегодняОбзорыКолонкиПереводИздательства

Gateway | Невод | Интер(офф)вью | Бессрочная Ссылка | НасНет | ГлобусНет | Интер(акти)вью | Дурацкий Музей | Кафедра | Русская сеть: истории | Конец прекрасной эпохи
/ Net-культура / < Вы здесь
Снова о спаме
Дата публикации:  28 Июля 2003

получить по E-mail получить по E-mail
версия для печати версия для печати

усский журнал" порадовал нас перепалкой1 по поводу этого животрепещущего предмета. Я тоже решил добавить свой голос к обсуждению этого вопроса. Причина, которая побудила меня высказаться на эту изрядно избитую уже тему, - то, что суждения как противников, так и защитников спама содержат довольно много ошибок и предрассудков в трактовке этой в целом несложной темы. Большая часть утверждений каждой из сторон при внимательном рассмотрении оказывается ерундой.

Короче: "начнем, пожалуй".

Вопрос N1: "что такое спам?" Ответ не столь очевиден, как кажется. Вы можете убедиться в этом, попробовав придумать формальный критерий того, что то или иное письмо (не)является спамом.

Я склонен присоединиться к мнению Пола Грэма, выраженному в его замечательной во многих отношениях статье "A plan for spam". Он пишет: "я предлагаю определить спам как нежелательную автоматизированную почтовую рассылку". Это достаточно тонкий момент - многие фирмы склонны настаивать на том, что если вы зарегистрировались на их сайте (например, потому что Вы что-то у них купили), то они имеют полное право заваливать Вас своей рекламой. А автор одной из статей в РЖ искренне полагает, что "письмо от восьмиклассницы с призывом взглянуть на ее домашнюю страничку - естественное следствие висящего на вашем сайте адреса и спамом не является, как бы вы ни желали обратного."

Если отправитель письма пишет его не лично Вам и Вы не считаете его письмо интересным - это спам (как ни странно, но даже при столь широком определении спама, существуют эффективные методы борьбы с ним). Более того - если существует программа, способная распознавать спам в такой формулировке (а она существует), то более или менее компетентный судья тоже способен это сделать. Такова реальность. Как бы это ни было грустно для спаммеров.

Теперь продолжим:

Почему спам - это плохо

Как ни странно, но аргументы сторонников спама позволяют прояснить этот вопрос гораздо лучше, нежели доводы его противников: "ведь в области борьбы со спамом покамест происходит именно это. К примеру, многие ли из вас ходят на демонстрации по запрету рекламы в печатных журналах? Между тем, часть их полезной площади занимает реклама, которая вам не нужна и которую вы, естественно, не запрашивали."

Лукавство этого аргумента в том, что я могу не смотреть бесплатное TV (я его и не смотрю, так же как и не покупаю глянцевых журналов), но я не могу пользоваться е-(или обычной) почтой и не получать всего этого рекламного дерьма. Причем, в отличие от TV, - для почты (что обычной, что электронной) не существует разумной альтернативы, а стало быть, отсутствует и отмазка, что "я могу не покупать журнал с рекламой".

К тому же на самом-то деле меня крайне раздражают и наружная реклама, и килограммы рекламной макулатуры, которыми заваливают мой почтовый ящик, вынуждая меня тратить изрядные усилия на выяснение вопроса - "а не лежит ли там среди всего этого бесполезного хлама, котому прямая дорога - в мусоропровод, счет за телефон или квартиру?". Просто надо с чего-то начинать. Но к этому вопросу мы вернемся чуть позже.

Популярные в среде и сторонников и противников спама призывы "почаще менять адреса" у меня вызывают в основном раздражение - я пользуюсь своим адресом уже около 7 лет и не желаю его менять из-за кучки гопников (попутно теряя контакты и заставляя своих друзей править их адресные книги).

Короче говоря, электронный спам - действительно просто разновидность традиционной крайне раздражающей нецелевой назойливой рекламы. Интернет, с его крайней дешевизной и общедоступностью, довел это явление до масштабов, с которыми публика мириться уже не готова. Спаммеры склонны делать из этого вывод, что неправа публика. Я склонен делать вывод, что неправы спаммеры и их защитники (у нас ведь демократия - не так ли - большинство право? И все, что не разрешено законом явно, может быть им и запрещено?).

Я склонен рассматривать спам как разновидность нарушения общественного порядка. Если вы возьмете мегафон и начнете вещать посреди Красной площади или Невского проспекта, что "единственные настоящие матрешки - покупайте - только у нас", то к вам в течение нескольких минут подойдут люди в форме (а то и без оной) и прикроют ваш бизнес. И правильно сделают. Во что бы без этих "репрессивных" мер превратился центр города (что Москвы, что СПб) знает любой, кто хотя бы изредка ездит на электричках, где явление это цветет и пахнет (довольно дурно пахнет, на мой непросвещенный и нелиберальный вкус).

Таким образом мы плавно переходим к следующему акту мерлезонского балета:

Почему есть смысл бороться со спамом "полицейскими" методами

Еще одно неявно подразумеваемое обеими сторонами мнение состоит в том, что "принимать законы против спама бесполезно". Это неверно. Хотя, вполне очевидно, такие законы не могут полностью искоренить спам, они могут его существенно ограничить:

Большая часть спама - это коммерческая реклама, и она, как любая коммерческая реклама, содержит в себе ясное и недвусмысленное указание на рекламодателя. А потому - при сравнительно несложной работе по сбору доказательств, которой с радостью займутся страдающие от спама провайдеры, тот же "Американский Английский" не вылезал бы из судов и регулярно платил деньги. Подчеркиваю - АА не только был бы вынужден прекратить спам, но и заплатить за то, что он им занимался.

А этот аргумент действует весьма доходчиво.

Кроме того - большая часть спама осуществляется при поддержке специальных сервисов, занимающихся организацией спама. Такие сервисы тоже уязвимы для преследования по закону.

Тут, как правило, спаммеры начинают возражать "спам ничем не отличается от прочей почтовой рекламы и потому законен". Это верно. Сейчас. А вот что будет в будущем - вопрос сложный, как говаривал в похожей ситуации один из глуповских градоначальников - "а мы закон тот переменим". И ведь переменил. Более того - как только это будет сделано, этот же аргумент начнет работать в обратную сторону - прецедент запрета одного из видов назойливой электронной рекламы можно распространить и на другие ее виды (и не только электронные). И это не может не радовать. За это стоит побороться (я очень рад был узнать, что мое мнение разделяет и наш министр связи).

Сухой остаток: большая часть "классического" спама законодательными мерами ликвидируется, либо сильно ограничивается и для этого не нужно никакой "выдачи персонального IP под расписку" и прочей подобной лабуды, по поводу которой ломается столько копий. Все, что требуется, - это просто написать в законе - "спам запрещен".

Что останется - осуществляемая "любительскими" средствами рассылка "нигерийских" писем (хотя популяризация идеи, что это занятие может достаточно дорого обойтись, окажет сдерживающее влияние) и еще один вид спама - когда фирма, у которой вы что-то когда-то купили или собирались купить, заваливает вас своей рекламой.

Последняя составляющая сравнительно невелика и в последнее время заметно сократилась: в результате роста нетерпимости к спаму уважающие себя фирмы перестали прибегать к этому виду рекламы: репутация дороже. И тут мы переходим к следующему действию:

Есть ли смысл в борьбе Иннокентия Жеглова с "Американским Английским"?

Я вполне согласен с господином Поповым в том, что прямой экономический ущерб от обструкции, устроенной "Центру Американского Английского", сравнительно невелик (возможно, он даже компенсируется рекламным эффектом скандала). Но эта затея (как и деятельность самого АА) сильно способствовала популяризации идеи, что "спам - это плохо и приличные фирмы этим не занимаются".

А заодно, способствовала и популяризации идеи о том, что со спамом надо что-то делать в том числе среди людей, участвующих в выработке законов (в частности - министра связи).

А потому эта деятельность полезна и нужна. Не говоря уж о том, что наработка почти отсутствующего в России практического опыта коллективных действий небесполезна сама по себе.

Подобная деятельность сама по себе не приведет к существенному сокращению спама, но она создает необходимые предпосылки для борьбы с ним юридическими и техническими методами. К которым мы и перейдем:

Со спамом можно эффективно бороться техническими методами

Да, я говорю о почтовых фильтрах. На самом деле, они работают. Тема защиты от спама столь же мифологизирована, как и прочие темы, касающиеся спама. Цитировать примеры я не буду - если Вам интересны подробности, то Вы сами можете найти вполне представительный комплект глупостей (и ссылок на другие глупости) на эту тему в статьях, послуживших поводом для этой заметки.

Миф первый - "если фильтр примет нужное письмо за спам, это совершенно ужасно. Лучше разбирать почту руками".

По этому поводу я могу сказать следующее: Да это неприятно, но лично я занялся настройкой фильтров именно после того, как несколько раз по ошибке удалил вместе со спамом нужные мне письма. Так что даже ошибающийся фильтр снижает вероятность потери письма. Это раз.

Фильтры не удаляют спам, а классифицируют. По результатам классификации спам может автоматически удаляться, а может и просто складываться в отдельный ящик. Как ни странно, но даже весьма приблизительно работающий фильтр при таком использовании очень облегчает жизнь. В частности - сводит почти к нулю риск случайно удалить что-то нужное. А на самом деле даже старенькая программка SpamAssasin делает это весьма неплохо. Это два.

Миф второй - "фильтры могут отсеять не более 95% спама". Я посмотрел статистику по фильтру, которым пользуюсь лично я: за сегодняшний день через него прошло 31 нужное мне письмо и 38 - спаммерских. При нуле ложных срабатываний в любую сторону.

Миф третий - "спаммеры могут обойти любой фильтр". Этот тезис звучит правдоподобно. Я бы с ним согласился, если бы не был в курсе существования алгоритма фильтрации, описанного в уже упоминавшейся выше статье Пола Грэма. Лично я затрудняюсь придумать более или менее систематический способ обхода фильтра, основанного на этом алгоритме.

Основная идея проста и изящна: вместо того чтобы выдумывать разные эвристики и считать, сколько раз там встретилось слово sex, и тому подобное, фильтр просто делает статистический анализ писем, которые по мнению получателя не являются спамом, и писем, которые по его же мнению спамом являются. Фильтр быстро набирает статистику и находит признаки, характерные только для спама, и признаки, характерные только для нормальных писем2.

Достоинства этого подхода очевидны: фильтр является самообучающимся, то есть он очень быстро адаптируется к новым разновидностям спама и ухищрениям спаммеров. Более того - большая часть этих ухищрений (например, замена отдельных букв в "подозрительных" словах на похожие по написанию цифры, случайные разрывы в словах, к которым пытался прибегать "американский английский" etc) не только не вводят фильтр в заблуждение, но напротив - служат практически железобетонным свидетельством того, что письмо является спамом.

Кроме этого, есть еще одно достоинство: крайняя простота самого алгоритма (что вызвало появление массы программ, основанных на этом подходе, в числе которых встроенный в Мозиллу фильтр, которым я и пользуюсь, и плагины для OutLook'a3) и крайняя простота его обучения4. И тут мы переходим к следующему мифу:

Миф четвертый - фильтры сложны в настройке. Это сильное преувеличение, хотя и фильтры бывают разные и ориентируются они на пользователей разного уровня: понятно, что фильтр, предназначенный для использования администратором почтового Unix-сервера, будет требовать несколько большей квалификации при установке.

Но чтобы закрыть тему, я расскажу как это выглядит в почтовом клиенте Mozill'ы, которой пользуюсь лично я. Там есть кнопочка - "Отметить письмо как спам" (Mark as Junk). Все, что требуется от пользователя - это нажимать ее, когда он видит в почтовом ящике спам, который не был распознан (или наоборот - нормальное письмо, ложно распознанное как спам). Через 20-30 писем после начала обучения Мозилла уже очень неплохо классифицирует письма и можно включить функцию, автоматически перемещающую спам в специальный фолдер.

После этого надо время от времени туда заглядывать и поправлять Мозиллу, если она ошиблась (что уже на этой стадии обучения случается довольно редко). Через некоторое время она практически перестает ошибаться в "опасную" сторону. Тогда можно включить функцию, удаляющую письма в "спаммерском" фолдере через определенный срок (или немедленно, если вы не боитесь риска).

В принципе, подобную услугу без труда может организовать и провайдер (и вероятно, они это в какой-то момент и сделают), что было бы весьма удобно - во-первых, не надо скачивать спам с его сайта, во-вторых, провайдер получает прекрасную базу данных по спаммерам, в которой все письма прошли ручную сортировку.

Выводы:

Что из всего этого следует? Следующее: Cпам не является серьезной проблемой. Ближайшим аналогом спаммера будет человек, регулярно гадящий в подъездах. Оно противно, но не смертельно.

Методы борьбы с этим явлением тоже примерно те же - по возможности ловить и сдавать в милицию (или просто бить морду), не лениться вести разъяснительную работу и поставить замок на дверь.

Ничего особенно оригинального. И Большой Брат тут ни при чем.


1) Началось все со статьи Иннокнетия Жеглова, продолжилось заметками от "дерссской дивчонки" и завершилось прилюдным поливанием друг друга помоями в классическом стиле виртуальной склоки.

2) Если точнее - проводится подсчет частоты появления слов в спаме и в нормальных письмах. При анализе нового письма выбираются 15-20 слов из него, у которых разница в статистике между спамом и неспамом наиболее сильно выражена. После чего по ним оценивается вероятность того, что письмо является спамом. Сомнения трактуются в пользу обвиняемого.

По мере прихода новых писем статистика корректируется.

3) Обширный список программ, основанных на этом методе, есть на страничке Пола Грэма. Она вообще содержит массу полезной информации на эту тему.

4) Интересно, что несмотря на эффективность статистического метода и то, что он известен уже более года, на сайтах, где обсуждают методы борьбы со спамом, публика в целом до сих пор пребывает в неведении и предлагает рецепты борьбы разной степени наивности и громоздкости. Даже специально посвященный проблеме www.antispam.ru хранит глухое молчание на эту тему. Наводит на печальные мысли.


поставить закладкупоставить закладку
написать отзывнаписать отзыв


Предыдущие публикации:
Виктор Захарченко, Модный Рунет: амбициозное дитя или капризная дама? /28.07/
Рассказывает владелец одного из самых популярных проектов модного направления Евгений Малышев.
Мирослав Немиров, Все о поэзии 145 /25.07/
Кабаков, Илья.
Дмитрий Смирнов, Критика нечистых идей /22.07/
Анонимность, свобода слова, неприкосновенность жизни - давно пора понять, что это просто красивые фетиши. В нормальном государстве таких вещей нет. В крепком государстве, в здоровом, либеральном и демократическом государстве.
Николай Попов, Которые которых, Или дерррская дивченка о спаме - снова! - 2 /22.07/
Если Михаил Ходорковский вдруг решит ссудить вас миллионом, он напишет об этом с юридической точки зрения точно так же, как и восьмиклассница из соседнего подъезда, наваявшая себе розового хомяка на народ.ру. В обоих случаях это будут письма, побуждающие вас сделать нечто в интересах отправителя, - и для обоих отправителей их послания будут представлять одинаковую ценность.
Николай Попов, Которые которых, Или дерррская дивченка о спаме - снова! /21.07/
Тоталитарное сознание нынешних правильных пацанов немедленно порождает соответствующие химеры в средневековом духе.
предыдущая в начало следующая
Антон Москаль
Антон
МОСКАЛЬ

Поиск
 
 искать:

архив колонки: