Научно-методическая конференция
«ИНТЕРНЕТ И СОВРЕМЕННОЕ ОБЩЕСТВО»

ОРИЕНТИРОВАННАЯ НА ПОЛЬЗОВАТЕЛЕЙ НАУЧНЫХ И ОБРАЗОВАТЕЛЬНЫХ СЕТЕЙ СИСТЕМА КОНТРОЛЯ НАДЕЖНОСТИ И КАЧЕСТВА СЕТЕВОГО СЕРВИСА

И.В. Ванин, А.Ю. Глебовский

Санкт-Петербургский государственный политехнический университет
Санкт-Петербургский государственный университет
Санкт-Петербург

ПРЕДПОСЫЛКИ

Лавинообразное развитие сетевых информационных технологий, их возрастающая роль во всех областях человеческой деятельности и, в первую очередь, в науке и образовании открывают многообещающие перспективы. Однако столь быстрое интенсивное и экстенсивное развитие неизбежно сопровождается «болезнями роста». В частности, по мере того, как индивидуальная и коллективная деятельность в организации все более опирается на поддержку сервисов ее корпоративной сети и Интернет, в пропорциональной степени проявляется синдром «Интернет-зависимости». Не только полные отказы, но и частые перебои или продолжительные периоды снижения уровня сетевого сервиса ощутимо сказываются на эффективности работы как сотрудников и структурных подразделений вуза, НИИ или научного центра, так и на взаимодействии рассредоточенных научных коллективов в рамках коллаборативных проектов, препятствуя своевременному выполнению работ, планов и договорных обязательств.

Задачи обеспечения надежного, безопасного, стабильного и высококачественного сетевого сервиса становятся все более актуальными, причем для подразделений научных и образовательных организаций с характерным для них опосредованным доступом к Интернет по многозвенной цепочке (например: «локальная сеть - сеть кампуса - транзитная сторонняя сеть - академсеть - первичный провайдер - Internet Exchange») потенциальные источники проблем рассредоточены во всей такой цепи. Насколько транзитные узлы и сети отвечают возрастающим требованиям, зависит от их технического оснащения и качества администрирования. При этом в сложившейся практике не только конечные пользователи, но и организации-клиенты оказываются в положении пассивных потребителей предоставляемых им услуг, неконтролируемый уровень качества которых (лишь в редких случаях формально оговоренный договором типа LSA, Level of Service Agreement) зависит не только от первичного провайдера (ISP), но и от транзитных сетей.

Для потребителей услуг возникает проблема доверия к обеспечивающим их сетям в условиях недостаточной информированности о реальном уровне сервиса и отсутствия средств его контроля. (Отметим, что прагматический скептицизм в отношении надежности и качества окружающих сетей - одна из ключевых идей Интернет, обеспечивших устойчивость, жизнестойкость и, в конечном итоге, глобальную экспансию этой структуры поверх любых каналов и частных сетей, так что принцип «доверяй, но проверяй», безусловно, оправдан в отношениях потребителей с поставщиками сетевых услуг.)

ПРОБЛЕМА КОНТРОЛЯ

Проблема контроля качества обслуживания в IP-сетях, которые, как известно, сами по себе в принципе не гарантируют стабильность параметров QoS (quality of service) и маршрутов доставки пакетов в широкотерриториальных сетях (WAN), сложна и многоаспектна.

Во-первых, точки зрения и представления об эффективности работы сетей различны у их администраторов и у конечных пользователей. Последних интересуют не столько «интегральные» характеристики и статистические показатели, существенные для администраторов сетей (число одновременно обслуживаемых пользователей, интенсивность и пульсации потоков трафика, суммарная пропускная способность каналов, средняя и максимальная производительность, коэффициент готовности, среднее время наработки на отказ, средняя продолжительность отказов и т.п.), сколько субъективно ими оцениваемая способность сети достаточно стабильно обеспечивать коммуникационные услуги и доступ к распределенным ресурсам, необходимым для эффективного выполнения ежедневных плановых и экстренных работ.

Во-вторых, не имея доступа к лог-файлам маршрутизаторов или базам данных менеджерирования типа SNMP MIB, а также не располагая средствами диагностики сети (более совершенными, чем обычно доступные утилиты зондирования типа ping и traceroute), даже «продвинутый» пользователь далеко не всегда может определить тип и продолжительность нарушений в работе сети, дифференцировать и локализовать источники (локальная, корпоративная, транзитная или провайдерская сеть) и причины (перегрузки или сбои в работе каналов обмена, маршрутизаторов или серверов, обрывы линий связи, нарушения энергоснабжения и др.) периодически или часто возникающих проблем. Как следствие он лишен возможности фиксировать отказы, сбои и периоды деградации сервиса, регистрировать их продолжительность и повторяемость, вести учет и документировать.

В-третьих, не имея, как сказано выше, критерия объективной оценки и не располагая информацией о текущих и прошлых событиях, состояниях и условиях функционирования сети и внешних каналов обмена, пользователь вынужденно оценивает ее качество на основе субъективного восприятия с весьма приблизительной привязкой ко времени, что проявляется в характерных формулировках типа «на этой неделе доступ в Интернет заметно ухудшился», «вчера сеть периодически сбоила» и т.п. Подобные оценки не позволяют пользователям вести конструктивный диалог с администратором корпоративной сети с целью улучшить ситуацию в будущем или формулировать требования для урегулирования возникших или потенциальных проблем с провайдерами.

Итак, контроль пользователем качества и надежности предоставляемого сетевого сервиса требует решения теоретических проблем (разработка отражающих интересы пользователя объективных критериев оценки), а также технологических (сбор и хранение первичных данных для их последующей статистической обработки, представление результатов, расчет показателей по выбранным критериям). Ниже рассматриваются технологические проблемы.

ПОСТАНОВКА ЗАДАЧИ

С учетом условий функционирования научных и образовательных корпоративных сетей, опосредованности их внешних связей с пунктами обмена IP-трафиком IX (Internet Exchange), возможностей и средств обнаружения частичных или полных функциональных отказов, измерения их длительности, локализации и диагностики причин, задача комплексной оперативной и ретроспективной диагностики функционального состояния корпоративных сетей была сформулирована следующим образом (проект Netscope).

Отказом (перерывом, перебоем) в обеспечении сетевого сервиса считается:

Возникающие перебои могут касаться внутренних сервисов локальной сети, корпоративной сети или внешних сервисов, причем недоступными из них может оказаться какая-то часть либо все (тотальный крах сети). Ощутимые для пользователей перебои в обеспечении сервиса могут быть вызваны причинами в локальной или корпоративной сети, во внешних транзитных сетях, в сетях провайдера. Источниками возникающих перебоев могут быть технические сбои, отказы линий и аппаратуры, аномальная маршрутизация, источники помех в виде интенсивных паразитных потоков (например, ICMP flooding) и др.

Требуется обеспечить автоматический сбор, накопление, оперативный первичный анализ, последующую статистическую обработку, агрегирование и интерпретацию данных, характеризующих работоспособность сети в текущий момент и за весь прошедший сколь угодно длительный период наблюдений.

Данные, характеризующие отказ или снижение качества сервиса ниже допустимого уровня, должны фиксироваться с привязкой к астрономическому времени и с регистрацией длительности периода недоступности сервиса.

Сбор данных, характеризующих состояние внешних и внутренних ресурсов и сервисов сети, может осуществляться как активным способом - зондирование заданных маршрутов, так и пассивным - считывание и фильтрация пакетов с заданных сетевых интерфейсов хоста в режиме перехвата (promiscuous mode).

В активном режиме должна минимизироваться нагрузка на зондируемые сегменты внутренних и внешних сетей. Частота зондирования целевых точек в устойчивых режимах работы сети должна быть минимальной, а в неустойчивых и аварийных режимах размер тестовых пакетов также должен быть минимальным.

Сбор данных в пассивном режиме должен осуществляться программным анализатором протокольных пакетов, инсталлированным на одном из хостов локальной сети. Для большей информативности собираемых данных желательно, чтобы этот хост был присоединен к опорному сегменту ЛВС, объединяющему маршрутизаторы.

Цель первичной обработки - обнаружение случаев угрожающего снижения или полной утраты работоспособности всей сети или какой-либо ее части и оперативное извещение о возможном отказе. Цель вторичной обработки - получение данных, позволяющих проводить объективную оценку работоспособности сети, а также регистрировать «анамнез» в течение жизненного цикла сети и выявлять колебания надежности и качества внешних сервисов.

РЕШЕНИЯ, ПРЕДЛАГАЕМЫЕ В РАМКАХ ПРОЕКТА

Разработаны методики и алгоритмы измерения динамических характеристик и анализа трасс IP-маршрутизации, а также структуры и методы хранения данных с целью их последующего анализа и отображения.

На этой основе создан тестер IP-сетей Netscope. В режиме активного зондирования тестер периодически проверяет трассы перемещения пакетов по заданным маршрутам, для которых одновременно измеряет основные параметры (время задержки и долю потерь на промежуточных этапах пересылки) и отслеживет их изменение.

Результаты каждого теста хронометрируются и регистрируются в базе данных для последующей обработки, анализа, отображения и генерации отчетов по запросу. Для хранения накопленных данных в текущей версии системы Netscope используется СУБД MySQL

Подсистема генерации отчетов реализована web-приложением и в существующей версии позволяет получать справки об отказах и параметрах функционирования любого из тестировавшихся в период наблюдения маршрутов на избранном отрезке времени в форме генерируемой по запросу HTML-таблицы.

Модули Netscope реализованы на языках C/C++ и РНР. Предусмотрен перенос системы в различные версии Unix-подобных ОС семейств BSD и System V (FreeBSD, Linux, etc.).

ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ И НАПРАВЛЕНИЯ СОВЕРШЕНСТВОВАНИЯ

Предложенная концептуальная основа решения проблем диагностирующего мониторинга сетей, разработанные новые и усовершенствованные «классические» методики тестирования и реализующая их система комплексной диагностики состояния IP-сети отвечают целям оценки и повышения эффективности сети организации не только с точки зрения администратора этой сети, но и с коллективной точки зрения ее пользователей. Анализатор предоставляет возможность:

Первая версия Netscope эксплуатировалась в региональной сети образования, науки и культуры (РОКСОН) с 01.01.2001, осуществляя сбор данных тестирования сегментов этой сети с опорного узла «Северный-1». В том же году система Netscope v.2 была инсталлирована на узле «Академический», запланирована ее установка на ряде других узлов в 2002 г. Дальнейшее совершенствование системы и открытый доступ к базе накопленных статистических данных через веб-интерфейс позволит индивидуальным и коллективным пользователям РОКСОН получать объективные данные о надежности и качестве функционирования сегментов ее опорной сети и центрального узла обмена трафиком.

Основные направления развития системы: разработка методики и реализация подсистемы графического вывода по запросу, реализация пассивного режима (подсистемы протокольного анализа прослушиваемого трафика), объединение отдельных автономных анализаторов Netscope в распределенную мультиагентную систему.

Система Netscope совершенствуется и внедряется в рамках проекта, поддержанного грантом РФФИ № 00-07-90298в.

ПУБЛИКАЦИИ

1. Глебовский А.Ю. Принципы построения адаптивного программного анализатора для диагностики состояния трасс передачи дейтаграмм в IP-сетях // Тезисы докл. Международной научно-методической конференции Телематика-2000, 29 мая - 1 июня 2000 г. - СПб., 2000.

2. Ванин И. В., Глебовский А.Ю. Разработка методов и алгоритмов комплексного анализа состояния трасс IP-маршрутизации // Тезисы докл. XXX юбилейная неделя науки СПбГТУ. Ч. IV: Материалы межвузовской научн. конф. СПб. 26-27 ноября 2001 г. - СПб.: Изд-во СПбГТУ, 2001.

[Аннотация на английском языке]

Опубликовано: Ванин И.В., Глебовский А.Ю. Ориентированная на пользователей научных и образовательных сетей система контроля надежности и качества сетевого сервиса // Технологии информационного общества - Интернет и современное общество: труды V Всероссийской объединенной конференции. СПб., 25 - 29 ноября 2002 г. СПб.: Изд-во С.-Петерб. ун-та, 2002. С. 76-79.

Ориг. URL — http://imsconference2002.spbu.ru/02-r2f08.html