Научно-методическая конференция
«ИНТЕРНЕТ И СОВРЕМЕННОЕ ОБЩЕСТВО»

ТЕХНОЛОГИЧЕСКИЕ ВОПРОСЫ ИСПОЛЬЗОВАНИЯ ИНТЕРНЕТ-КОЛЛЕКЦИЙ ЗВУКОВЫХ МАТЕРИАЛОВ ДЛЯ НАУЧНЫХ ИССЛЕДОВАНИЙ

В.В. Захаркина, П.А. Скрелин, Т.В. Шерстинова, П.П. Щербаков

Санкт-Петербургский государственный университет
Санкт-Петербург

Рассматривается опыт работы, проводимой в Санкт-Петербургском университете, целью которой является разработка модели электронной звуковой коллекции для Интернета и ее техническая реализация. Особенностью работы является то, что материалы коллекции предназначаются для научного использования, в первую очередь для фонетических исследований. Обсуждаются проблемы, возникающие при создании таких коллекций, и возможные подходы к их реализации на примере опыта авторского коллектива, полученного при реализации программ, поддержанных грантом РФФИ N 00-07-90197.

Представляется работа, направленная на подготовку и публикацию звуковых коллекций в Интернете. Особенностью работы является то, что материалы коллекции предназначаются для научного использования, в первую очередь для фонетических исследований. Наличие таких коллекций с доступом через Интернет позволит создать условия, при которых у удаленных территориально друг от друга исследователей появится возможность проводить фонетические исследования на основе единого звукового материала или использовать его как эталонные образцы.

При реализации проекта приходится решать ряд специфических задач, и большинство проблем, которые приходится преодолевать, связаны с самим предметом изучения, которым при фонетических исследованиях является собственно звуковой материал [1].

С одной стороны, этот звуковой материал должен представлять достаточно представительный массив данных. Для хранения десяти минут звучания речи приемлемого качества требуется около 25 Mb. Для использования и хранения на локальном компьютере это обстоятельство не является критической характеристикой, однако при необходимости передать данные через Интернет такой объем становится серьезным препятствием. Использование компрессии (например, mpeg) позволяет существенно уменьшить размер звуковых файлов, однако потери информации при такой компрессии могут сделать звуковой материал непригодным для дальнейшего использования. С другой стороны, для научных исследований может понадобиться не весь звуковой файл, ссылка на который имеется на сайте, а лишь какой-то его фрагмент (хотя заранее не всегда известно, какой). Например, специалисты в области речевых технологий, независимо от того, работают они в сети Интернет или вне ее, во многих случаях интересуются «локализованными» фонетическими явлениями (например, произнесением отдельного слова, слога или даже звука) [2].

Во многих случаях в фонетических исследованиях предоставление самого речевого материала должно сопровождаться соответствующими описаниями и расшифровкой. Таким образом, наряду с непосредственно звуковым материалом существенной может являться дополнительная информация, которую необходимо привязать к соответствующему звуковому фрагменту.

Еще одной проблемой при изучении звукового материала является отличие в восприятии звуковой информации и визуальной. При изучении визуальной информации у исследователя имеется возможность сделать один или несколько мгновенных снимков - стоп-кадров. Имеется возможность некоторого изменения масштаба изображения. При изучении звукового материала для тонкого изучения свойств приходится использовать результаты обработки сигналов, например, спектрограммы.

При фонетических исследованиях возникают и другие специфические проблемы. Фонетическая транскрипция не дает полного и исчерпывающего описания речевого материала. Это обстоятельство, в свою очередь, поднимает вопрос об эталонах, шкалах, что считать нормой, отклонением от нормы и так далее.

Нам представляется, что в настоящий момент в нашем распоряжении уже имеется ряд технологий, позволяющих решать задачи создания звуковых Интернет-коллекций, предназначенных для использования в научных целях.

Прежде всего, для подготовки таких коллекций необходимо:

Следующий этап подготовки звукового материала включает:

Подготовленный материал размещается на web-сайте, что включает следующие действия:

Интерфейс призван решить следующие задачи:

В настоящий момент имеется возможность формировать следующие содержательные запросы:

В Санкт-Петербургском государственном университете осуществляется совместная программа кафедры фонетики, лаборатории экспериментальной фонетики филологического факультета и Междисциплинарного центра СПбГУ, целью которой является разработка модели электронной звуковой коллекции для Интернет и ее техническая реализация. В рамках программы разрабатываются веб-системы, содержание которых должны составить эталонные образцы русской речи и ее варианты в чтении и спонтанном диалоге (проект РФФИ «Создание Wеb-коллекции эталонных звуковых образцов произношения для исследований в области синтеза и распознавания речи» (http://www.webspeaker.nw.ru); разработанные технологии используются и при реализации нового проекта «Фонетические свойства русской спонтанной речи» (http://www.phonetics.pu.ru/s-speech/s-speech.htm) - грант РФФИ, № 01-08-80188).

При разработке модели профессионального звукового архива для Интернета авторским коллективом в той или иной степени были решены или находятся в стадии решения все основные технологические задачи организации научно-ориентированных звуковых коллекций для Интернета. Так, в настоящий момент система, основанная на использовании фонетической базы данных, делает возможным пофрагментное прослушивание звукозаписей в режиме он-лайн, выдает по запросу пользователя всю имеющуюся в ней информацию по каждому из фрагментов. Представляется, что разрабатываемая модель может быть использована при разработке подходов к созданию единой универсальной технологии, позволяющей унифицированным образом решить задачи, возникающие при создании интернет-коллекций мультимедийных данных.

Работа поддержана грантом РФФИ № 00-07-90197

ЛИТЕРАТУРА

1. Скрелин П.А., Шерстинова Т.Ю., Щербаков П.П. Технологические аспекты публикации звуковых коллекций в Интернет // Технологии информационного общества - Интернет и современное общество: Материалы Всероссийской объединенной конференции. СПб., 20-23 ноября 2001 г. - СПб: Изд-во СПбГУ, 2001. С. 63 - 65.

2. Скрелин П.А., Таланов А.О., Шерстинова Т.Ю., Щербаков П.П. Разработка интерактивной системы Интернет-доступа к коллекциям звуковых архивов // Труды конф. EVA'2000 «Электронная конвергенция: новые технологии в музеях, галереях, библиотеках и архивах». Москва, Гос. Третьяковская галерея, 30 октября - 3 ноября 2000 г. С. 06 - 10.

[Аннотация на английском языке]

Опубликовано: Технологические вопросы использования интернет-коллекций звуковых материалов для научных исследований / Захаркина В.В., Скрелин П.А., Шерстинова Т.В., Щербаков П.П. // Технологии информационного общества - Интернет и современное общество: труды V Всероссийской объединенной конференции. СПб., 25 - 29 ноября 2002 г. СПб.: Изд-во С.-Петерб. ун-та, 2002. С. 231-233.

Ориг. URL — http://imsconference2002.spbu.ru/02-r4f05.html