Научно-методическая конференция
«ИНТЕРНЕТ И СОВРЕМЕННОЕ ОБЩЕСТВО»

ОБЗОР ПОДХОДОВ И МЕТОДИК ИССЛЕДОВАНИЯ ИНТЕРНЕТА

А.С. Биккулов

Санкт-Петербургский государственный университет
Санкт-Петербург

Самое общее деление видов исследований можно сделать на уровне предмета исследований:

1) исследования состояния и динамики технического развития Интернета

2) исследования содержания, наполнения (контента) Интернета

3) исследования состояния и динамики аудитории Интернета

Исследования состояния и динамики технического развития Интернета проводятся на основании статистических данных министерств связи, провайдеров (см. напр. [2]), а также техническими средствами поисковых серверов [5, 6]. Хотя некоторые данные получают также и выборочными опросами.

Исследования содержания (контента) Интернета проводятся в основном техническими, программными средствами. Например, такие показатели как объем наполнения Интернета, количество сайтов и страниц, отслеживаются специальными программами-роботами, работающими на основных поисковых серверах. В России, например, такие данные собирают и выставляют на своих сайтах поисковые системы Яndex [5], Rambler [6].

Классификация ресурсов Интернета и представленность в Сети различных тем также отслеживаются поисковыми системами - это, по сути, статистические данные, получаемые на основе анкет, заполненных при регистрации сайтов. В этих анкетах разработчики регистрируемого сайта указывают его тематическую направленность, ключевые слова, и т.д. Данные различных поисковых систем могут отличаться, так как иногда создатели ресурса регистрируют его не во всех поисковых системах, поэтому, чем крупнее и известнее поисковая система, тем более точными можно считать ее данные.

Оценка содержания сайтов необходима в Интернете в двух целях: во-первых, для того, чтобы отнести ресурс к той или иной тематической категории, и, во-вторых, для того, чтобы оградить детей от неблагопристойного содержимого Сети, материалов, описывающих насилие и т.д.

Существует два основных подхода к оценке содержания сайтов:

1) При первом подходе информационные ресурсы оцениваются по определенным стандартным критериям самими создателями ресурса.

Когда ресурс оценивается для каталогизации, самооценка обычно происходит при регистрации разработчиком своего сайта в поисковых системах.

В целях ограждения детей от неблагопристойности и сцен насилия в Сети была разработана рейтинговая служба RSACi, основанная на самооценке, самозаполнении разработчиком сайта стандартной анкеты. Именно эту службу использует при фильтрации (когда она включена пользователем) браузер Internet Explorer. В качестве критериев выступают наличие на сайте и уровень откровенности материалов изображающих насилие, секс, обнаженные тела или содержащих нецензурные выражения, брань.

2) При втором подходе к оценке содержимого сайтов информационные ресурсы оцениваются третьими лицами (группами экспертов, учителями, родителями, добровольцами и т.д.).

У обоих подходов есть свои преимущества и недостатки. Основное преимущество рейтингов самооценки - оперативность и теоретически безграничная широта охвата. К недостаткам относится опасность того, что узлы могут иметь склонность приукрасить правду, чтобы получить большую аудиторию; некоторые также считают формулировки критериев самооценки недостаточно определенными, жесткими. Оценка узлов третьими лицами имеет преимущество в том, что теоретически может быть более точной, более гибкой (хотя она также может быть и более предвзятой). С другой стороны, при взрывном росте количества информационных ресурсов, способность оценивать ресурсы ограниченным кругом людей может не успевать за этим ростом.

В исследованиях состояния и динамики аудитории Интернета выделяют два основных подхода [1]:

Названия, возможно, не очень удачны, но, тем не менее, действительно, все исследования аудитории органично делятся на два направления: 1) проводимые известными социологическими центрами по проверенным, отработанным методикам; и 2) исследования, проводимые Интернет-компаниями с помощью методов автоматической фиксации. Как правило, это компании, поддерживающие такие ресурсы, как поисковые системы, бесплатные почтовые службы (например, Яndex, Rambler). Промежуточную позицию занимают «блиц-опросы», выставляемые на различных сайтах. Когда мы говорим о таких «блиц-опросах», мы имеем дело с типичной стихийной выборкой, что не позволяет получить сколько-нибудь надежных результатов. Вследствие этого такие «блиц-опросы» нами не рассматриваются.

Общий объем аудитории и ее отдельных видов (например, по частоте использования Интернета) обычно измеряется традиционными социологическими методами - репрезентативными опросами (личные интервью на дому, телефонные интервью) по общероссийской выборке. Вопросы о пользовании Интернетом либо включаются в качестве одного из блоков в исследование, посвященное различным темам, либо в анкету такого исследования включаются только скрининговые, фильтрующие вопросы о пользовании Интернетом, а те, кто положительно ответил на эти вопросы, опрашиваются по дополнительной анкете пользователей Интернета.

Наиболее масштабные опросы проводит Фонд «Общественное мнение» (проект «Интернет в России») [3], компания Gallup Media (Проект NRS-Россия). Их выборки достигают 20-25 тыс.

Постоянно исследует аудиторию Агентство Monitoring.ru (АРПИ-НИСПИ), добавляя вопросы об Интернете в анкеты, посвященные различным вопросам. Их выборка - примерно 4500 человек.

С учетом того, что в сельской местности Интернет распространен очень слабо, часто выборку делают репрезентативной только для городского населения. Так, например, поступает компания «Комкон-2» (Проект «Web-вектор»). Выборка 7500-8500 респондентов репрезентирует население городов с населением не менее 250 тыс. чел. (их доля в населении России - 36,0%).

Аудиторию Интернета также измеряют и поисковые системы, в автоматическом режиме собирая информацию со счетчиков, установленных на большинстве сайтов российского Интернета. Например, компания Рамблер, собирая информацию со своих счетчиков, оценивала аудиторию Интернет (включая в нее тех, кто посещал Интернет не реже двух раз в месяц) примерно в 3 миллиона россиян в середине 2001 года [4], что, в принципе, соотносится с аналогичными цифрами, полученными путем репрезентативных социологических опросов.

Информацию о социально-демографических характеристиках пользователей, предпочтениях и популярности ресурсов также получают в ходе перечисленных социологических опросов и автоматическими исследованиями поисковых систем. Для социологических исследований проблема состоит в том, что эта информация, как правило, носит коммерческий характер и очень редко выкладывается в свободный доступ либо печатается в открытой печати. Поисковые системы постоянно проводят исследования на эти темы и выкладывают результаты на своих сайтах. С социологической точки зрения цифры, получаемые счетчиками, не вполне репрезентируют всех пользователей Интернета, поэтому при всем удобстве и доступности подобных данных, приходится делать серьезную поправку на возможную неточность, смещенность данных. Эти цифры можно использовать только как приблизительные ориентиры при отсутствии других данных.

Кроме перечисленных видов исследований, в России были и эксперименты, в частности направленные на создание новой исследовательской методики с использованием контент-анализа. Начиная с мая 1998 года, поисковая система «Яndex» каждую неделю измеряет так называемый НИНИ-индекс (НИНИ - аббревиатура «Непостоянство интересов населения Интернета») [8]. Анализируются запросы пользователей путем сравнения частоты запрашиваемых слов от недели к неделе.

ИСТОЧНИКИ

1. Дим П. Методы измерения аудитории Интернета и других сетевых средств коммуникации. // Методологические проблемы и практика изучения Интернета: Сб. научн. статей / Под ред. к.п.н. А.В. Шарикова. - М.: ВГТРК, 1999. С.31-44.

2. Готовность России к информационному обществу. Оценка возможностей и потребностей широкомасштабного использования информационно-коммуникационных технологий / Под ред. Т.В. Ершовой. - М.: Изд-во Института развития информационного общества, 2001. 113 с.

3. Галицкий Е.Б. Опросы «Интернет в России» (http://www.fom.ru/reports/frames/o0209241.html).

4. У каждого свой Интернет (http://www.rambler.ru/db/rumetrica/article.html?mid=2037392).

5. Рунет сегодня. График роста Рунета. График «углубления» Рунета (http://www.yandex.ru/chisla.html).

6. Ruметрика: Сайты, сайты... (http://rumetrica.rambler.ru/data/runet/3/).

7. Ruметрика: Russian Internet Survey (http://rumetrica.rambler.ru/data/runet/3_1/).

8. Статистика запросов НИНИ (http://www.yandex.ru/nini/html).

[Аннотация на английском языке]

Опубликовано: Биккулов А.С. Обзор подходов и методик исследования Интернета // Технологии информационного общества - Интернет и современное общество: труды V Всероссийской объединенной конференции. СПб., 25 - 29 ноября 2002 г. СПб.: Изд-во С.-Петерб. ун-та, 2002. С. 12-14.

Ориг. URL — http://imsconference2002.spbu.ru/02-r1f04.html