Контакты
Подписка
МЕНЮ
Контакты
Подписка

Эволюция систем видеокомпрессии

В рубрику "Оборудование и технологии" | К списку рубрик  |  К списку авторов  |  К списку публикаций

Эволюция систем видеокомпрессии
Часть 1

Дэвид Вуд
Глава департамента новых технологий EBU

Дэвид ВудДэвид Вуд — глава департамента новых технологий Европейского союза вещателей (EBU), один из активистов Study Group 11. В течение долгих лет он плодотворно сотрудничал с профессором Марком Кривошеевым, которого до сих пор считает своим учителем и другом. Вуд состоял членом ряда Дэвид Вуд исследовательских групп, Глава департамента новых технологий EBU в течение 5 лет принимал участие в рабочих группах CCIR и в течение 11 лет — в рабочей группе 11 А. Его деятельность охватывала несколько областей, таких, как цифровое вещание и ТВЧ. Дэвид учился электронике в университете Саутгемптона (Англия) и получил степень мастера в UNIRT (Одесса, Украина). Он также является выпускником Гарвардской школы бизнеса (США). До своего сотрудничества в EBU Вуд работал в Великобритании на Би-би-си

Развитие техники цифровой видеокомпрессии продолжается, и выбор того или иного способа сжатия видеоданных для систем телевизионного вещания и Интернета представляет трудную, но интересную задачу. В данной статье, основанной на докладе автора, представленном на технической ассамблее EBU в Москве весной 2003 года, описываются факторы, определяющие направление эволюции техники видеокомпрессии и даются сравнительные характеристики систем компрессии.

Изучение развития систем видеокомпрессии, базирующихся на открытых международных стандартах, показывает, что совершенствование техники сжатия видеоданных носит циклический характер, причем в ближайшие 10 лет может завершиться несколько таких циклов. Это надо учитывать в первую очередь для принятия решения о выборе систем компрессии.

Введение

Фото 1. "Ломо-компакт" автора в действии"Ломо-компакт" — нечто большее, чем просто скромный фотоаппарат, сделанный в Санкт-Петербурге (фото 1). На самом деле это феномен фотохудожника. Приверженцы данной камеры утверждают, что с ее помощью можно получать прекрасные снимки, придающие окружающей действительности особенный вид (фото 2). Такая техника съемки называется теперь "ломографией", и по всему миру появляются клубы ее фанатов.

С точки зрения инженеров телевидения снимки, сделанные с помощью камеры "Ломо-компакт", кажутся ужасными: цвета перенасыщены, гамма неправильна, а еще добавляется виньетирование и т.п. Но, несмотря на "искажения", эти снимки нравятся многим людям. Дело в том, что оценка качества изображения — это очень сложный, иногда кажущийся нелогичным процесс, на который влияет множество факторов.

Зачастую бывает трудно оценить качество изображения, используя только слова "хорошо" или "плохо". К каждому суждению о качестве добавляются различные оговорки о типах изображений, для которых эти суждения справедливы и т.д. Но, несмотря на это, при оценке качества изображения невозможно избежать обобщений. Мы должны брать быка за рога и получать непосредственные, Фото 2. Типичный снимок, сделанный автором с помощью "Ломо-компакт": перенасыщенные цвета, слишком большой контраст, виньетирование, но изображение живое иэнергичноепонятные и полезные интегральные оценки качества изображения. Это важно во многих областях и, в частности, в понимании эффективности систем цифровой компрессии.

Сегодня настали критические времена для цифровой видеокомпрессии. Система MPEG-2 хорошо служила мировой вещательной индустрии с середины 90-х годов XX века.

Система следующего поколения — MPEG-4 Part 4 — включила в себя не только усовершенствованные инструменты компрессии, но и потенциально новый способ доставки мультимедиапрограмм с кодированием объектов и семантическим кодированием.

Затем была разработана система MPEG-4Part 10 (Н.264).

Наконец, на сцену вышла компания Microsoft с видеокодеком в системе Windows Media Player 9, который предназначается как для вещания, так и для Интернета.
Цель настоящей статьи — исследование того, как нужно оценивать эти кодеки и как принимать стратегические решения выбора одного из них. Предлагаемые вниманию читателей заметки не объясняют принципов работы новых кодеков: для этого есть прекрасные статьи разработников. Цель материала — осмотреться, понять, где мы находимся, куда идем, что может помочь нам решить вопросы, касающиеся систем видеокомпрессии.

Оценка качества

Когда субъективная оценка качества проводится традиционным методом, в результате получается кривая, иллюстрирующая зависимость между усредненной оценкой качества изображения и основным параметром — обычно скоростью компрессированного потока видеоданных. Пример подобной кривой показан на рисунке (данные взяты из недавнего исследования EBU-BPN 055). Можно оценить несколько кодеков и получить семейство кривых.

Путем сравнения значений скорости потока данных, необходимой для достижения заданного качества (или показателей качества, полученных на данной скорости передачи) , мы можем установить разницу в уровне эффективности кодирования, демонстрирующей способность кодеков сжимать потоки данных без заметных искажений. Это поможет нам сделать стратегическое заключение о том, в каком случае каждый из них мог бы быть использован.

Подобные графики (кривые) служат основой для принятия решения в таких исследовательских группах и организациях, как ISO/IEC JTCI MPEG и EBU. Эти кривые сами по себе дают полезную информацию, но к ним надо еще добавить (не показанное на рисунке) статистическое распределение значений оценки качества, окружающих кривые и взвешенных в соответствии с частотой их появления.

Форма и расположение кривых, показанных на рисунке, являются важными индикаторами того, как работает система компрессии. Если кривые параллельны, это означает, что разница в эффективности не зависит от уровня качества. Непараллельность кривых знаменует обратное. Кривые, отображающие зависимость качества от скорости потока, могут сближаться в области высокого качества. Это означает, что различия между системами компрессии в отношении эффективности становятся меньше при высоком качестве.

Однако кривые "качество/скорость потока" — это не единственное, в чем мы нуждаемся для принятия стратегического решения о выборе кодека. Необходимо знать, как с течением времени будут меняться характеристики конкретного кодека в сравнении с другими аналогичными устройствами. Нужно оценить, как долго отдельный кодек будет либо самым дешевым, либо самым лучшим в своем классе. Мы должны спросить себя, когда появится что-либо лучшее. Также нужно рассмотреть изменение цен кодеков.

На первый взгляд кажется, что на подобные вопросы невозможно ответить: как узнать заранее, когда изобретательный ум гения проявит себя в исследовательских группах по стандартизации технологий компрессии? Однако ситуация небезвыходна. Мы можем выявить тенденции и составить прогнозы.

Тенденции и прогнозы

Для того чтобы обрести уверенность в себе, мы обратимся к так называемому закону Мура, который делает возможным стратегическое планирование во многих областях техники, где используются интегральные схемы.

Закон Гордона Мура утверждает, что количество логических вентилей в интегральной схеме с фиксированной площадью подложки будет удваиваться каждые 18 месяцев. Этот закон выдержал испытание временем, исчисляемым несколькими десятилетиями. Он базируется на простом допущении. Оглянитесь на происходящее вокруг и не воображайте, что обнаруженная тенденция вдруг перестанет быть справедливой.

Но существует ли нечто подобное закону Мура в цифровой компрессии? Все свидетельствует о том, что существует.

Системы компрессии (сжатия потоков видеоданных) представляют собой набор компрессионных "орудий труда", или инструментов, собранных вместе. Современные системы компрессии для телевизионного вещания отличаются асимметричной структурой, в рамках которой предельно простой декодер сочетается со сложным Рисунок. Пример способа представления результатов субъективной оценки качества (по данным исследования характеристик кодеков для Web-контента, проверенного EBU)кодером. И это разумно, поскольку вещание предполагает работу миллионов декодеров с несколькими кодерами. Процедура обработки сигнала в кодере даже не подвергается регламентации с помощью стандартов (в отличие от декодера). В этом случае все, что должен делать производитель кодеров, — это разрабатывать устройство, которое формировало бы декодируемый сигнал. Производитель может делать все, что захочет, внутри кодера, но при условии, что кодированный сигнал будет декодироваться без проблем с использованием стандартного декодера. Поэтому со временем общие характеристики системы компрессии будут улучшаться, так как производители будут конкурировать друг с другом и соревноваться в выпуске более "интеллектуальных" кодеров. Это вполне возможно. Характеристики изображения могут, например, подвергаться анализу, и изображение может быть обработано оптимальным образом для достижения лучшей "сжимаемости".

Набор каких инструментов должен образовать систему декомпрессии, или декодирования? Их выбор делается на основе практических соображений: какую сложность (то есть количество вентилей) в микросхемах декодеров телевизионных приемников допускает закон Мура? Здесь нельзя произвести точный расчет, но можно получить довольно точные оценки стоимости приемников в ближайшем будущем.

Данный выбор также должен базироваться на информации, полученной из исследовательских лабораторий и проектных организаций о последних разработках. Если, например, в лабораториях еще не отработана реализация какого-либо нового алгоритма с использованием интегральных микросхем, то в ближайшем будущем этот алгоритм нельзя будет использовать на практике.

Механизмы, влияющие на качество кодеков

Существует два механизма, оказывающих влияние на разработку и применение кодеков.

Во-первых, после того как некоторый набор инструментов компрессии согласован и принят как лучший на текущий момент времени, происходит улучшение качества ко-
деков. Во-вторых, через некоторое время, когда накопленные знания дали возможность производить интегральные схемы с большей степенью интеграции и большим числом вентилей на кристалле, разрабатываются новые инструменты компрессии (обычно дополняющие, а не заменяющие прежние) и создается новый кодек компрессии. Если все старые инструменты компрессии входят в состав набора новых, то изображения, закодированные с использованием прежних кодеров, могут быть декодированы с использованием новых декодеров. Этот принцип совместимости используется во многих системах MPEG.

Суть эволюции кодеков компрессии (как в процессе улучшения эффективности и качества одного кодека, в котором используется некоторый набор инструментов, так и в результате создания нового расширенного множества инструментов компрессии и нового кодека) состоит в том, что процесс компрессии становится все более "приспособленным" к содержанию изображения. Система компрессии способна все в большей степени и все более интеллектуальным образом адаптироваться к структурным свойствам изображения, например к его детальности и динамичности. Мы движемся от "систематики" к "адаптации".

В качестве иллюстрации рассмотрим чересстрочную развертку — первый в мире инструмент видеокомпрессии. При его использовании каждая вторая строка опускается в каждом из двух полей, образующих кадр телевизионного изображения, то есть динамичные вертикальные высокочастотные составляющие изображения подавляются, но при этом мы добиваемся двукратного уменьшения полосы частот видеосигнала. Это весьма эффективно, если в изображении нет движущихся деталей, хотя чересстрочная развертка применяется к любому изображению.

Таковы "систематические" инструменты компрессии.

Чересстрочная развертка незаменима, если изображение статично и лишено движущихся деталей. Если в изображении есть движущиеся детали, то оно размывается. Возможно, в таком случае стоит прекратить чересстрочную развертку при появлении в изображении движущихся деталей? И соответственно изменить алгоритмы компрессии в зависимости от содержания изображения? Именно таким образом системы компрессии и становятся все лучше и совершеннее. В этом состоит прогресс технологий кодеков.

Между прочим, несмотря на то, что использование чересстрочной развертки было эффективно в аналоговом телевидении, для цифрового телевидения она становится обузой: можно получать лучшие результаты при помощи адаптивной системы цифровой компрессии. Поэтому в следующих поколениях систем вещательного телевидения мы, возможно, перейдем к построчной развертке, что позволит добиться более высокого качества при видеокомпрессии.

Продолжение следует...

Опубликовано: Журнал "Broadcasting. Телевидение и радиовещание" #6, 2003
Посещений: 12273

  Автор

Дэвид Вуд

Дэвид Вуд

Глава департамента новых технологий EBU

Всего статей:  2

В рубрику "Оборудование и технологии" | К списку рубрик  |  К списку авторов  |  К списку публикаций