Контакты
Подписка
МЕНЮ
Контакты
Подписка

Audio-over-IP в реальном времени: предпосылки для профессионального использования в производстве программ и телерадиовещании

В рубрику "Оборудование и технологии" | К списку рубрик  |  К списку авторов  |  К списку публикаций

Audio-over-IP в реальном времени: предпосылки для профессионального использования в производстве программ и телерадиовещании

Детлеф Визе
Генеральный менеджер MAYAH Communications

Йорг Римкус
Генеральный менеджер, руководитель отдела исследований и разработок (R&D) компании MAYAH Communications

Ханс-Хайнрих Хансен
Ведущий разработчик программного обеспечения компании MAYAH Communications

Кристиан Диль
Разработчик ПО компании MAYAH Communications в области мобильных аудиокодеков и внедрения SIP

Перевод: Даниил Адасинский

Передача аудиосигнала по сетям IP становится все более и более значима для вещательной индустрии. Особенно если учесть растущую доступность сетей, постоянно увеличивающуюся пропускную способность и снижающуюся стоимость их эксплуатации. В то же время количество новых подключений по аналоговым линиям или же синхронным сетям, таким как ISDN или Х.21, неуклонно снижается. Уже в самом ближайшем времени многие телекоммуникационные компании просто перестанут предлагать эти услуги. Поэтому уже сейчас важен высокий уровень подготовки технического персонала вещательных компаний в области IP-технологий и соответствующая компетенция для выбора правильных технических решений

Основы IP

Многим инженерам-связистам знакома модель OSI (Open Systems Interconnection Reference Model) для представления уров-невого подхода к взаимодействию сети или сетей. На основе этой модели была разработана более специализированная модель для семейства Интернет-протоколов TCP/IP. Последняя описывает структуру и взаимодействие различных сетевых протоколов на четырех уровнях (рис. 1 а, б): сетевой уровень (Network Layer), Интернет-уровень (Internet Layer), транспортный уровень (Transport Layer) и прикладной уровень (Application Layer).

Пакетная передача данных вместо цифровых синхронных линий

Для транспортировки сигнала на дальние расстояния в телерадиовещании еще не так давно применялись, в основном, цифровые соединения типа "точка - точка". Как правило,такие линии высоконадежны, величина задержки сигнала здесь постоянна, а так называемый джиттер практически отсутствует, так же как и потери пакетов (Packet Losses) или смена порядка их доставки (Sequence Errors).

Основной фактор, препятствующий более интенсивному использованию подобных линий связи, - это их высокая стоимость в эксплуатации или недостаточная эффективность для телекоммуникационных компаний. Однако уже в 2000 году некоторые крупные вещательные компании делали ставку на передачу аудио по IP в реальном времени, а не только в виде аудиофайлов, как это было возможно и несколько раньше. В 2001 году ORF (Государственная телерадиокомпания Австрии) совместно с Austrian Telekom построила собственную IP-сеть, названную L-Net, которая связала все региональные студии и некоторые стратегически важные мобильные позиции с главным вещательным центром в Вене. Вся аудиоинфраструкту-ра L-Net также основана на аппаратных аудиокодеках. С их помощью осуществляется всесторонняя передача репортажей и вещательного сигнала многочисленных радиостанций в составе ORF, трансляция и запись живых концертов, в том числе и в формате звука 5.1 и 7.1, а также практически вся техническая аудиокомму-никация для живого теле- и радиопроизводства. В 2002 году National Public Radio в Вашингтоне включила IP-аудиокодеки в состав своей собственной IP-сети для эффективного распространения сигнала практически на всю территорию США. С 2004 года крупнейшая спутниковая радиостанция США XM Radio использует CENTAU-RI для доставки сигналов прямого эфира с различных концертов по всему миру. Как правило, передача музыкальных мероприятий для ХМ Radio ведется в формате MPEG Layer 2,384 кбит/с по IP с автоматическим "бэкапом" через ISDN. Так транслировались концерты Live8 (2005), "Неделя Моцарта" в Зальцбурге (2006) и другие.

Для того чтобы подобные задачи могли быть реализованы, IP-сеть должна удовлетворять определенным условиям. В частности, задержка, джиттер и общая доступность сети должны находиться в известных пользователю рамках и на том уровне, который позволит эксплуатацию сети в режиме 24 часа в сутки, семь дней в неделю, если это необходимо. Необходимая пропускная способность сети также должна быть доступна в любое время. Впрочем, для повышения стабильности передачи могут быть применены определенные методы и технологии. Так, например, максимальный период джиттера (как правило, указывается в миллисекундах) определяет размер компенсационного буфера на стороне декодера. Использование предварительной коррекции ошибок (Forward Error Correction или FEC) позволяет восстановить потерянные IP-пакеты, а ошибки в порядке доставки пакетов (Sequence Errors) можно легко исправить, используя протокол RTP (Realtime Transport Protocol), который присваивает каждому пакету уникальный маркер времени (Timestamp).

Кодирование аудио для IP: задержка против битрейта

В последние двадцать пять лет в вещательной индустрии использовались самые разные алгоритмы кодирования аудиосигнала. Стандартизованные, вроде J.41, J.57, MPEG Layer 2 и Layer 3, а также проприетарные, но достаточно широко распространенные. Например, apt-X или 4SB ADPCM.

Многим вещателям, с их разносторонними запросами, бывает непросто найти идеальную комбинацию типа передачи, битрейта, частоты сэмплирования и т.д. В последнее время эта задача особенно усложнилась в связи с большим количеством новых алгоритмов, пришедших на рынок.

Детальное рассмотрение подходящего метода передачи сигнала должно обязательно включать следующие критерии: качество, гибкость задействования, доступный частотный диапазон, задержка, совместимость, стандартизация, текущая и ожидаемая доля на рынке.

В то же время при разработке алгоритмов кодирования аудио особое внимание уделяется оптимизации следующих параметров: совместимость, задержка, битрейт и, конечно, воспринимаемое качество звука (в том числе после "каскадирования" - многократного кодирования/декодирования).

MPEG-4 AAC HEv2

Данный алгоритм был создан исключительно для значительного снижения используемой полосы пропускания (битрейта) при сохранении субъективного восприятия высокого качества звука. За основу был взят уже ставший привычным MPEG-4 AAC LC (Low Complexity), популяризованный компанией Apple с ее iPod и iTunes. "Наложив" поверх ААС технологию репликации фрагментов частотного спектра (SBR -Spectral Band Replication) и добавив впоследствии уникальный метод параметрического стерео (Parametric Stereo), разработчики получили ААС High Efficiency Version 2. В зависимости от контента стереосигнал отличного качества (при использовании этого алгоритма) можно передавать с битрейтом порядка 20-24 кбит/с.

apt-X/Enhanced apt-X

В разработке алгоритма apt-X главенствующую роль играла минимальная возможная задержка. Основой его является метод ADPCM (Adaptive Differential Pulse Code Modulation). Наиболее типичный битрейт - 192 кбит/с на канал. Превосходное качество аудио сохраняется даже после многократного каскадирования. Алгоритмическая задержка в теории составляет 3 мс при частоте сэмплирования 48 кГц. В реальной ситуации, при трансляции сигнала по IP-сети, удалось достичь минимальной задержки в 6 мс, используя протокол RTP. Продвинутая версия - Enhanced apt-X -позволяет улучшить динамические показатели кодируемого аудиосигнала, поскольку здесь поддерживается битовое разрешение до 24 бит. В настоящее время apt-X - один из самых распространенных в мире форматов для эффективной передачи аудио с минимальной задержкой.

ААС ELD

В настоящее время появляются примеры компромиссных алгоритмов, сочетающих относительно низкий delay с низкими же требованиями к полосе пропускания. Новейшая разработка -алгоритм ААС ELD - позволяет невероятное: высокое качество звука уже при 48-96 кбит/с; при этом задержка не превышает критическую для работы в прямом эфире, т.е. ниже 50 мс. Такие решения особенно важны в профессиональных продуктах для мобильного применения.

AES/EBU Transparent

Совсем другое направление в области передачи звука по IP-сетям развивается благодаря растущей доступности широкополосных соединений. В итоге IP-передачи линейного аудио (linear PCM) с битовым разрешением 16, 20 и 24 бит и частотой сэмплирования до 96 кГц уже никого не удивляют. Кроме того, появилась возможность передавать вообще некодирован-ный сигнал AES/EBU no IP. В данном случае на один AES/EBU-сигнал понадобится 3,072 Мбит/с. Этот метод чрезвычайно подходит, если надо передать по IP-сети готовый сигнал Dolby E или DTS.

Коммутируемая связь в Интернете ISDN vs. SIP

В отличие от пакетов данных стандарта ISDN, каждый IP-пакет всегда содержит информацию об исходящем адресе и своем пункте назначения. Поэтому передача их происходит обычно без предварительного установления соединения с удаленным терминалом. Чтобы обеспечить в IP-сети коммутацию, подобную телефонной, и был разработан протокол SIP (Session Initiation Protocol).

SIP - как он работает?

SIP (Session Initiation Protocol) -это текстовый протокол для установления связи на базе Интернет-протокола (IP). Более всего он известен благодаря широкому распространению технологий Voice-over-IP или IP-телефонии. Использование SIP для передачи профессионального аудио и/или видео до последнего времени было практически невозможно ввиду отсутствия соответствующих стандартов.

SIP используется исключительно для сигнализирования соединения между участниками контакта. Фактический транспорт медиаданных, подобно технологии ISDN, происходит отдельно от установления связи. Зачастую медиаданные передаются по другому маршруту, нежели SIP-сигнализация. Чаще всего для доставки данных используется RTP-протокол.

В наиболее простом случае (прямое соединение "точка - точка") будущие участники "разговора" устанавливают связь напрямую, т.е. без какого-либо посредника.

Каждый SIP-прибор может как принимать входящий вызов, так Й инициировать исходящий "звонок". Для того чтобы начать процедуру вызова, вызывающая сторона отправляет сообщение INVITE на SIP-ад-рес получателя. Термин INVITE в данном случае является одним из так называемых методов, которые каждый пользовательский терминал должен обрабатывать в процессе установления связи. К другим методам относятся сообщения типа АСК, BYE или REGISTER.

Если принимающая сторона готова принять вызов, она отвечает простым сообщением ОК, которое немедленно подтверждается вызывающей стороной с помощью сообщения АСК (анг. acknlowledgement). INVITE, OK и АСК - это тот минимум сообщений, при помощи которых можно установить мультимедиасоединение в самом простом случае. Важно отметить, что все эти сообщения могут содержать дополнительную информацию в так называемом "теле сообщения" (Body). Здесь, собственно, содержится описание медиасоединения. В том числе определяются аудио- или видеокодеки, которые необходимо использовать, и обязательно указываются IP-адреса и IP-порты пользовательских терминалов. Для этого описания используется протокол SDP (Session Description Protocol), успешно зарекомендовавший себя еще до появления SIP.

Основные достоинства протокола SIP проявляются, однако, в том случае, когда соединение устанавливается не напрямую, а через так называемые SIP-Proxy или SIP-сервер. Тогда участникам вызова вовсе не обязательно иметь какую-либо информацию об их текущем местоположении в Сети - после регистрации на таком сервере он свяжет обе стороны путем прозрачного перенаправления SIP-сообщений. Вызов происходит под одним и тем же SIP-адресом, который более всего похож на адрес электронной почты, а фактические IP-адреса передаются (в момент соединения) внутри "тела" SIP-сообщений. Это позволяет достичь настоящей мобильности в использовании Audio-over-IP. Оператору SIP-прибора не надо знать данные сети, чтобы установить или принять соединение. Достаточно иметь доступ в Интернет и быть зарегистрированным на своем собственном или общественном SIP-Proxy. Пример коммуникации при вызове через SIP-Proxy см. на рис. 2.

Перспективы Audio-over-IP для телерадиовещания

Любые технологические достижения в области передачи профессионального аудио по IP-сетям не принесут никакой выгоды, если ими нельзя будет пользоваться широко и повсеместно. Благодаря активному развитию сетей пакетной передачи данных, постоянному улучшению качества Интернет-соединений и провайдерских "бэкбо-нов" IP становится действительно удобным, гибким и доступным средством профессиональной коммуникации.

Более того, практически уже в самом начале массового внедрения Audio-over-IP в повседневную работу вещателей всего мира появился соответствующий стандарт EBU. Это означает, что в рамках, предписываемых стандартом, оборудование различных производителей обязано и будет взаимодействовать без каких-либо трудностей.

Основой нового стандарта или, если точнее, рекомендации Европейского вещательного союза (EBU), опубликованной в октябре 2007 года (EBU-ТЕСН 3326), стал протокол SIP. Изначально предназначенный только лишь для IP-телефонии, протокол SIP не предусматривал возможность использования "продвинутых" аудиокодеков с их многочисленными параметрами. В рамках нового стандарта, который продолжает развиваться, процесс установления соединения будет включать не только определение, "какой кодек" используется, но и "с каким битрейтом, моно или стерео" и т.д. (см. также Приложение).

Приложение

Некоторые пункты технической спецификации "Audio Contribution over IP, requirements for interoperability", подготовленной рабочей группой EBU N/ACIP (EBU TECH 3326).

Транспортные протоколы

  • Оборудование обязано поддерживать IP-протокол версии 4 - согласно RFC 791.
  • Поддержка режима "мультикаст" - согласно RFC 1112 - рекомендована.
  • Поддержка IPv6 - согласно RFC 2460 - рекомендована.
  • Оборудование обязано поддерживать протокол UDP - согласно RFC 768.
  • Для передачи должен использоваться протокол RTP (over UDP). RFC 3550, 3551.
  • Использование протокола RTCP - рекомендовано.
  • По умолчанию должны использоваться порты 5004 (RTP) и 5005 (RTCP).
  • Предварительная коррекция ошибок (FEC) - в настоящее время в процессе разработки. В случае необходимости использования FEC порт 5006 должен использоваться по умолчанию. FEC-данные должны передаваться отдельным потоком для "обратной совместимости" с приборами, не поддерживающими FEC.
  • Протокол TCP (RFC 793) может быть использован в дополнение к RTP. Сигнализация
  • Протокол SDP обязателен к использованию (RFC 4566 section 5).
  • Протокол SAP (Session Anouncement Protocol) v1 обязателен к использованию в режиме "мультикастинга" (RFC 2974).
  • Протокол SIP обязателен к использованию для двунаправленных (bi-directional) соединений (RFC 3261). По умолчанию использование порта 5060 для SIP обязательно.

Кодирование аудиосигнала

Обязательна поддержка следующих аудиокодеков:

  • ITUG.711;
  • ITUG.722;
  • ISO MPEG-1/2 Layer II;
  • 16 bit PCM;
  • 20, 24 bit PCM (опционально для мобильных приборов).

Рекомендованные аудиокодеки:

  • ISO MPEG-1/2 Layer III;
  • MPEG-4 AAC, MPEG-4 AAC LD (Low Delay).

Опциональные аудиокодеки:

  • Enhanced APT-X;
  • MPEG-4 HEAACv2.

Полный текст стандарта Audio Contribution over IP и дальнейшая информация: www.ebu-acip.org

Библиография

  1. G. Stoll, F. Kozamernik. EBU subjective listening tests on low-bitrate audio codecs // EBU. 2003.
  2. Detlef Wiese. Too many audio codecs // Tonmeistertagung. 2002.
  3. D. Sisale, J. Kutan, White Paper. Understanding SIP // GMD Fokus, 2000.
  4. Audio Contribution over IP, requirements for interoperability. Материалы рабочей группы EBU N/ACIP под председательством Ларса Джонсона. 2007.
  5. Christian Diehl. SIP implementation; Audio-over-IP Rundfunktauglich! // Meeting of ARD.ZDF.Medienakademie, 2007.
  6. Werner Ludwig. CENTAURI II Audio Gateway Codecs Manual, 2007.

Опубликовано: Журнал "Broadcasting. Телевидение и радиовещание" #1, 2008
Посещений: 21367

  Автор

 

Детлеф Визе

Генеральный директор MAYAH Communications

Всего статей:  1

  Автор

 

Йорг Римкус

Генеральный менеджер, руководитель отдела исследований и разработок (R&D) компании MAYAH Communications

Всего статей:  1

  Автор

 

Ханс-Хайнрих Хансен

Ведущий разработчик программного обеспечения компании MAYAH Communications

Всего статей:  1

  Автор

 

Кристиан Диль

Разработчик ПО компании MAYAH Communications в области мобильных аудиокодексов и внедрения SIP

Всего статей:  1

В рубрику "Оборудование и технологии" | К списку рубрик  |  К списку авторов  |  К списку публикаций