Научно-методическая конференция "ИНТЕРНЕТ И СОВРЕМЕННОЕ ОБЩЕСТВО

Научно-методическая конференция
«ИНТЕРНЕТ И СОВРЕМЕННОЕ ОБЩЕСТВО»

РЕГУЛИРОВАНИЕ ИНТЕРНЕТ И ФИЛЬТРАЦИЯ «ЯЗЫКА ВРАЖДЫ»

Ф.И. Торчинский

ИДПО Европейский университет в Санкт-Петербурге
Санкт-Петербург

Доклад посвящен обзору регулирования размещения и получения информации в Интернет. Рассмотрены причины, способы регулирования, а также действующие лица, связанные с регулированием Интернет. Доклад касается организационных и технических способов ограничения доступа к материалам в Интернет.

ОГРАНИЧЕНИЕ ДОСТУПА К ИНФОРМАЦИИ

Как только в Интернет появились материалы, предназначенные только строго определенным группам потребителей (например, порнография), возник спрос на ограничение доступа к информации такого типа. Позже возник вопрос запрета распространения секретных материалов и пропаганды ненависти и насилия. Эти проблемы решаются несколькими путями, которые дополняют друг друга.

Законодательные ограничения на распространение какой-либо информации вообще.
Технические ограничения на получение такой информации. Ограничения делятся на фильтрацию передаваемой информации на компьютере получателя и на сервере провайдера получателя.
Ограничения на получение ссылок на определенную информацию.

ЗАКОНОДАТЕЛЬНОЕ ОГРАНИЧЕНИЕ РАСПРОСТРАНЕНИЯ ИНФОРМАЦИИ

Например, во Франции запрещена пропаганда фашизма, сайт с такой пропагандой может быть закрыт по суду. Под «закрытием» понимается комплекс мероприятий, в результате которого информация становится недоступна в сети. Обычно это подразумевает удаление информации с компьютеров компании, предоставляющей услуги хостинга.

Более подробный анализ законодательства разных стран в этой области не входит в задачи данного документа. В России нет законов, которые регламентировали бы распространение информации в Интернете, хотя формально такое распространение регулируется существующими законами. Прецеденты закрытия сайтов по решению суда в России вследствие незаконного содержания сайта мне неизвестны.

В докладе практика регулирования Интернет в России рассматривается более подробно.

ТЕХНИЧЕСКИЕ ОГРАНИЧЕНИЯ ДОСТУПА

ФИЛЬТРАЦИЯ ИНФОРМАЦИИ НА КОМПЬЮТЕРЕ ПОЛЬЗОВАТЕЛЯ

Вначале рассмотрим технические ограничения на получение информации пользователем. Эти ограничения вводятся как для домашних пользователей (дети), так и для корпоративных (сотрудники компаний). В первом случае родители заботятся о нравственности и безопасности детей, во втором - работодатели стремятся сократить неслужебное использование компьютеров компании.

В обоих случаях также есть стремление предотвратить оплату передачи данных, особенно это проявляется в случае запрета просмотра порнографии в корпорациях. Если десятки сотрудников будут смотреть порноматериалы, которые имеют сравнительно большой объем (фотографии, видео и т.п.), расходы компании на передачу данных из Интернет вырастут, потери будут состоять из потерь рабочего времени и потерь на передачу внеслужебных данных.

Для фильтрации на компьютере получателя используются программы-фильтры. Наиболее известны CyberPatrol, WebSense, CYBERsitter, Net Nanny, Surf Watch, PureSight. Принцип действия этих программ одинаков. Они содержат внутри себя закодированный список web-сайтов, доступ к которым надо запретить. Список разделен по категориям («обнаженные тела», «насилие», «культы и сатанизм», «наркотики» и др.), при настройке программы можно запретить доступ к сайтам только части категорий. Список ежедневно или еженедельно обновляется, подписка на обновления является статьей дохода компании-производителя.

Некоторые программы (например, CYBERsitter и PureSight) содержат средства динамического определения «запретного» характера инормации и блокируют доступ к ней, даже если она размещена на сайте, которого нет в списке программы. Механизм «динамического определения» компания-производитель программы всегда держит в тайне, как и точный список сайтов, встроенный в программу. Механизм «динамического определения» обновляется при выходе новой версии программы - примерно раз в квартал-полгода.

Из-за того, что методику определения «запретности» характера информации, принцип составления списка «запретных» сайтов и сам этот список держат в секрете, возникают скандалы, связанные с ошибочной блокировкой доступа к безобидной и нужной информации. Инициатором разбирательств обычно являются компании, к чьим сайтам был ошибочно заблокирован доступ. В различных обзорах, опубликованных в западной печати и Интернете, часто отмечаются ошибки в работе блокирующего ПО.

Кроме этого, часть программ-фильтров довольно легко обходится. Идея фильтрации на компьютере пользователя предполагает, что более опытный или наделенный большими правами в компьютерной системе человек (администратор сети в корпорации или родители дома) настраивает программу-фильтр так, чтобы пользователи компьютера не могли получить доступ в Интернет в обход этой программы. Тесты независимых экспертов говорят о том, что многие программы легко обходятся. Часто для правильной настройки нужна квалификация администратора сети. Обычный родитель, желающий оградить чадо от нежелательной информации, не всегда может настроить программу-фильтр так, чтобы ее нельзя было обойти, причем часто ее можно обойти незаметно.

Громкими скандалами отмечена, прежде всего, работа программ CyberPatrol и CyberSitter. Это связано не столько с тем, что эти программы хуже других, сколько с их широкой рекламой и распространением.

Существует альтернативная схема фильтрации информации, основанная на том, что владельцы сайтов (контент-провайдеры) будут сами оценивать свои сайты по содержанию (например, «детский сайт», «порнографический сайт»). Такая самоидентификация предложена международной организацией ICRA (Internet Content Rating Assosiation). Предлагаемый способ идентификации соответсвует стандарту, известному как PICS (Platform for Internet Content Selection). ICRA образовалась из Recreational Software Advisory Council (RSAC), которая участвовала в разработке этого стандарта, созданного консорциумом World Wide Web Consortium. Система RSACi (RSAC on the internet) встроена в Netscape Navigator и Microsoft Internet Explorer. Пользователи вышеупомянутых браузеров могут просто включить в настройках этих программ настройку «не заходить на порнографические сайты» и не смогут попасть на сайты, помеченные их хозяевами как «порнографические». Этот способ годится только для блокировки доступа к законопослушным крупным деятелям порнобизнеса, но не для защиты пользователей от оскорбительной информации в российских условиях. Сейчас только некоторые крупные компании идентифицируют свои сайты в соответствии с этим стандартом.

ФИЛЬТРАЦИЯ ИНФОРМАЦИИ НА СЕРВЕРЕ ПРОВАЙДЕРА ИЛИ КОМПАНИИ

Второй способ фильтрации информации - на сервере провайдера получателя. Для этого используют так называемые «прокси-серверы». Некоторые из этих программ (например, WinProxy, Squid) могут выполнять несколько функций, а именно - кэширование запросов информации, блокирование доступа к информации, мониторинг запросов пользователей. Этими программами могут пользоваться не только провайдеры, но и компании в своей корпоративной сети. Эти программы осуществляют блокирование доступа к сайтам, содержащимся в списке «запретных». Список обычно составляется сотрудником компании-провайдера или администратором сети компании. Доступность и открытость такого списка - вопрос политики провайдера или компании. В Интернет есть открытые для всех списки «запретных» сайтов (например, по адресу http://www.squidguard.org/). В случае публикации открытых списков их составители объявляют, что они не несут никакой ответствености за содержание списка, так как он составляется программой, которая может ошибаться. По запросу они могут исключить ошибочно внесенный адрес из списка. Открытые списки могут частично совпадать с закрытыми, однако разные программы используют разные списки, независимо от степени их открытости.

В случае фильтрации информации на сервере провайдера клиент обычно может попросить фильтровать или не фильтровать информацию, получаемую лично им. При использовании фильтрующего ПО сервером компании сотрудник компании вынужден подчиняться принятым в компании правилам. Скандалы, связанные с таким ограничением в доступе к информации, обычно решаются в пользу провайдера или компании, так как клиент вправе выбрать другого провайдера, а сотрудник - уволиться из компании, если ему не подходят корпоративные правила.

Провайдеры редко проводят мониторинг Интернет-запросов клиентов, хотя имеют такую техническую возможность. В то же время компании часто ведут мониторинг Интернет-запросов сотрудников. Более того, базируясь на опубликованных правилах работы в компании и данных мониторинга, компании увольняют служащих, которые, согласно данным мониторинга, нарушают эти правила.

Положение дел в этой области остается практически неизменным последние несколько лет. Однако совершенствуются системы контекстной фильтрации. Кроме этого, в программы фильтрации вносятся дополнения для фильтрации новых средств получения информации (чаты, доски объявлений, конференции в Интернете и т.п.)

ОГРАНИЧЕНИЯ НА ПОЛУЧЕНИЕ ССЫЛОК НА ОПРЕДЕЛЕННУЮ ИНФОРМАЦИЮ.

Некоторые поисковые системы (например, Altavista, Яндекс) предлагают возможность фильтрации результатов поиска. На Altavist'e (www.altavista.com) это включает фильтрацию фотоизображений, исключение из результатов поиска ссылок на материалы сексуального или оскорбительного характера. Материалы характеризуются посредством автоматизированного контекстного анализа, вручную редакторами Altavista и по результатам комментариев пользователей.

Фильтр Altavista фильтрует не только материалы сексуального характера, но и пропаганду насилия и т.п. («hate speech»). Altavista умеет фильтровать только англоязычные тексты.

Поисковая система Яндекс (www.yandex.ru) позволяет фильтровать мат и порнографию, то есть то, что не разрешено «детям до 16». Сегодня фильтр строится полуавтоматически - в него включаются «взрослые» сайты, а также все страницы, содержащие «нехорошие» слова. Яндекс фильтрует только русскоязычный текст, при этом фильтрация hate speech пока не реализована.

Методики, используемые Яндексом и Altavist'ой, сходны. Одинаковы методы сбора информации (анализ текстов, отчеты сотрудников и пользователей), методы фильтрации (требуется минимальная настройка программы-браузера пользователя на его компьютере, чтобы фильтр работал). Сам анализ текстов, конечно, разный - прежде всего, из-за разных языков и объектов фильтрации (американская неполиткорректность и русская ненормативная лексика отличаются по направленности текста).

Группа исследователей из ЕУСПб планирует реализовать совместно с компанией «Яндекс» собственную методику распознавания экстремистских текстов, содержащих, в частности, призывы к насилию.

Методика будет открытой и сможет применяться по желанию пользователями поисковой системы Яндекс так же, как сейчас применяется «семейный фильтр» Яндекс.

[Аннотация на английском языке]

Опубликовано: Торчинский Ф.И. Регулирование Интернет и фильтрация "языка вражды" // Технологии информационного общества - Интернет и современное общество: труды V Всероссийской объединенной конференции. СПб., 25 - 29 ноября 2002 г. СПб.: Изд-во С.-Петерб. ун-та, 2002. С. 58-61.

Ориг. URL — http://imsconference2002.spbu.ru/02-r1f25.html

Научно-методическая конференция «ИНТЕРНЕТ И СОВРЕМЕННОЕ ОБЩЕСТВО»