В рубрику "Оборудование и технологии" | К списку рубрик | К списку авторов | К списку публикаций

Цифровое и аналоговое вещание.Пути развития. Стандарт сжатия JPEG

В предыдущей статье “Цифровое и аналоговое вещание. Пути развития. IP-вещание. Часть III”, опубликованной в журнале “Broadcasting. Телевидение и радиовещание”, № 3–2018, была затронута тема эффективности телекоммуникационных систем и целесообразности способов и стандартов сжатия цифрового потока при эффективной передаче телевизионной информации по каналу связи. Рассмотрим в этой статье логику реализации самого простого стандарта сжатия – JPEG

Алексей Синятынский
Генеральный директор ООО “Фирма “Интеграл-Т”, к.ф.-м.н., ч.-к. МАОН

Импульсно-кодовая модуляция (ИКМ)

В цифровом телевидении технология преобразования аналогового сигнала в цифровой, основой которого является дискретизация, квантование и кодирование, является комплексом операций под названием импульсно-кодовая модуляция (ИКМ). При этом заключительной операцией преобразования аналогового сигнала в цифровой является кодирование квантовых отсчетов в виде последовательности импульсов. Эта последовательность представляется в двоичной форме, и m уровням квантования соответствует K = log₂m кодовых импульсов. Метод ИКМ стал классическим при применении в передаче телевизионных картинок. Мы уже видели в предыдущей части публикации, что к достоинствам этого метода можно отнести:

низкую чувствительность к шумам;
низкую чувствительность к интерференционным помехам и искажениям при передаче и записи сигналов;
простоту восстановления утерянного цифрового сигнала путем его регенерации.

Однако избыточность в передаваемой информации вынудила к разработке более эффективных методов кодирования сигналов ТВ-изображений. Таким образом, появились три способа кодирования:

Групповое кодирование с использованием дискретного косинусного преобразования (ДКП).
Кодирование сигнала с предсказанием.
Адаптивное групповое кодирование.

Принцип действия систем кодирования с предсказанием учитывает наличие сильных корреляционных связей между близко расположенными элементами изображения и нецелесообразность передачи по каналу связи полной информации о каждом элементе. В этом методе система передачи ограничивается передачей отсчета одного элемента – “базового”, а остальные элементы предсказываются, то есть вычисляются с помощью статистических законов на приемной стороне системы. Конечно, тут всегда появляется ошибка, обусловленная случайным распределением в картинке сигнала яркости и цветности. Эта ошибка должна быть скорректирована для получения первоначального изображения.

Таким образом, при кодировании сигнала с предсказанием, передача при отсчете кодированной разности ошибки предсказания, передается меньший объем информации, чем при полном отсчете. Вследствие этого снижается скорость передачи информации, то есть осуществляется процесс сжатия сигнала.

Данный способ передачи цифрового сигнала дает хорошие результаты лишь в общем, но когда речь идет о деталях изображения, содержащих резкие перепады яркости, то для полученного изображения будут характерны всплески сигнала ошибки. В изображении появляются искажения, которые, как мы уже упоминали ранее, человеческий глаз не замечает из-за латерального торможения, подавляющего фоновую составляющую изображения в зрении, и подчеркивания контуров и мелких деталей, то есть выделяя тем самым более информативную часть картинки.

Системы кодирования с предсказанием получили название систем с дифференциальной импульсно-кодовой модуляцией (ДИКМ). В целом с использованием методов ДИКМ удается сократить скорость передачи с 7–8 бит на элемент (при ИКМ) до 3–5, то есть в два раза. Конечно, эта ситуация сказывается на помехоустойчивости системы. На изображении формируются “треки ошибок”, которые можно убрать увеличением (частоты дискредитации) “опорных” отсчетов, но при этом уменьшается эффективность кодирования.

Двумерное кодирование с предсказанием повышает помехоустойчивость системы. Это обусловлено тем, что мы имеем дело с большими коэффициентами корреляции элементов в соседних кадрах, нежели у соседних элементов в одном кадре.

Еще одним способом эффективного кодирования является кодирование с ДКП. Применяемый метод преобразования изображений основан на том, что его цифровой эквивалент приводится к виду, удобному для сокращения избыточной информации. Наиболее эффективным приемом является метод ортогональных преобразований. Суть заключается в преобразовании исходного сигнала из амплитудно-временных координат в частотно-временной эквивалент.

Наиболее известным математическим методом ортагонального преобразования является разложение, называемое дискретным преобразованием Фурье (ДПФ).

Логика рассуждений сводится к следующему. Если мы имеем периодический сигнал, описываемый периодической функцией S = s(t), то ее можно разложить в ряд Фурье. Результат разложения описывается в комплексном виде, как

где:

T - период функции,
i – мнимая единица,
t – время,
ω₀= 2π/Т - собственная условная частота

Следует отметить, что в реальной жизни процессов, описываемых строго периодическими функциями, мало. Поэтому, если в интервале (функция отличается от 0, продлив ее всю ось времени с периодом Т, ее можно разложить в ряд Фурье. В этом смысле дискретный информационный сигнал s(n), не равный 0 при n = 0,1,2…..N-1, также можно разложить в ряд Фурье. Имея дело с аналогово-цифровым преобразованием сигнала и требованием теоремы Котельникова о верхнем ограничении частотного спектра сигнала, подвергаемого дискретизации, мы видим, что в разложении дискретного сигнала содержится конечное число частотных составляющих. В результате получим разложение описываемого выражением:

где n = 0,1,2…..N-1 u

в котором k = 0,1,2….N-1 и частоте km0 с размерностью рад/с соответствует безразмерная величина 2itk/N, где величина k/N показывает, какую часть частоты дискредитации составляет частота данной составляющей.

Такое разложение называется дискретным преобразованием Фурье (ДПФ), поэтому в приведенных соотношениях применяется не интегрирование, а суммирование. Разложение с поиском коэффициентов по формуле (4) обычно называют прямым ДПФ, а разложение сигнала по формуле (3) определяют как обратный ДПФ.

Дискретное косинусное предобразование (ДКП)

Экспоненциальные множители в выражениях (3) и (4) определяют коэффициенты ДПФ как комплексные числа, имеющие действительную и мнимую часть, и запоминаются в цифровом ЗУ в виде пары действительных чисел. Соответственно, удваиваются все операции сложения и умножение чисел. Поэтому, чтобы иметь дело только с действительными числами, обычно пользуются разложением, называемым дискретное косинусное преобразование (ДКП),

при k = 0,1,2….N-1

Соответственно, коэффициенты (6) являются коэффициентами прямого ДКП, а представление сигнала в виде выражения (5) является обратным ДКП. Аналогично можно записать соотношения для прямого и обратного ДПФ и ДКП для многомерных случаев.

Если оценить количество операций, необходимых для осуществления ДПФ, из (4), выделив в нем операции над действительными и мнимыми числами, получим следующие результаты. Для вычисления одного значения S(k) по формуле (4) необходимо выполнить и 2N умножений, и (2N-2) сложений действительных чисел. Для вычисления N значений S(k) надо выполнить 2N² умножений и N(2N-2) сложений. Выполнение обратного ДПФ потребует в два раза больше операций. В среднем можно оценить затраты вычислительных ресурсов при выполнении прямого и обратного ДПФ как

N2. В двумерном случае количество операций N²М². Для вычисления ДПФ квадратного блока изображения размером 8 х 8 элементов потребуется 16 х 10³ операций умножения и сложения.

Поэтому для вычисления ДПФ телевизионных кадров в реальном времени за период кадровой развертки необходимо сокращать количество требуемых операций. Для этого используется прием, называемый быстрым преобразованием Фурье (БПФ). Основа уменьшения объема вычислений с помощью БПФ заключается в свойствах периодичности экспоненциальных функций типа (4) и их симметричности относительно перестановки множителей в аргументе. Количество операций, требуемых для вычисления коэффициентов ДПФ, уменьшается в 10⁵ раз.

Аналогичный результат дает алгоритм быстрого вычисления ДКП. При использовании этого алгоритма используется связь коэффициентов ДКП С(k) с коэффициентами ДПФ S (k):

Существуют алгоритмы для N = 16, 32, 64 и более значений.

Скорость передачи двоичных символов при использовании ДКП основана на том, что корреляционные связи между коэффициентами ДКП значительно меньше, чем между элементами исходной картинки. Кроме этого мощность телевизионного сигнала распределена неравномерно по частотным составляющим, и человеческое зрение ограниченно воспринимает изменения и искажения мелкой структуры изображения.

Количество передаваемой информации уменьшается за счет отбрасывания тех частотных составляющих, для которых коэффициенты, получаемые при выполнении ДКП, оказываются меньше установленного порога. Дополнительно уменьшение символьной скорости достигается за счет уменьшения при кодировании количества двоичных разрядов, используемых для представления ДКП.

В результате используемых приемов уменьшается скорость передачи информации, но это достигается за счет удаления части информации, поэтому изображение, полученное за счет обратного ДКП, в приемной части системы передачи информации не будет соответствовать исходной передаваемой картинке. Такой метод кодирования относится к методам кодирования с потерей информации. Однако отбрасываемая информация избыточна для зрения, и метод кодирования является воплощением сокращения психофизиологической избыточности телевизионной картинки для человеческого зрения.

На практике в цифровых системах одним из методов использования ДКП-сжатия заключается в том, что передаваемая телевизионная картинка подвергается ДКП-преобразованию блоками 8 х 8 единиц. После выполнения ДКП получается матрица, содержащая 8 х 8 коэффициентов ДКП. При сравнении с установленным уровнем порога значительная часть коэффициентов обнуляется. Впоследствии, после зигзагообразного считывания, двумерная матрица преобразуется в одномерный поток оставшихся коэффициентов. Каждому ненулевому коэффициенту присваивается пара индексов, в которой первый индекс указывает, сколько нулевых коэффициентов прошло в последовательности перед данным коэффициентом, а второй индекс указывает на величину значения самого коэффициента. Таким образом достигается почти трехкратное сжатие передаваемой информации.

Дальнейшее сжатие информации при использовании ДКП осуществляется путем выбора различного шага квантования для различных коэффициентов ДКП. Осуществляется повторное квантование. При этом для малочувствительных для зрения зон картинки, соответствующие коэффициенты ДКП квантуются с меньшей частотой, то есть при передаче таких коэффициентов используется меньшее число бит на коэффициент. Вследствие этого уменьшение общего количества бит, то есть уменьшение символьной скорости, не приводит к заметному ухудшению качества изображения.

Метод эффективного кодирования по Хаффмену

Другим интересным способом уменьшения скорости передачи цифровой информации является метод эффективного кодирования получаемых пар индексов при коэффициентах ДКП, несущих информацию о нулевых коэффициентах ДКП между двумя ненулевыми. Сутью эффективного кодирования является кодирование потока пар чисел, основанных на применении кодов с переменной длиной кодового слова, или так называемых кодов Хаффмена. Построение кода с переменной длиной кодового слова основано на принципе, что более вероятным символам ставятся в соответствие более короткие кодовые слова, а менее вероятным – длинные. Построение кода Хаффмена позволяет получить кодовые слова различной длины таким образом, что в непрерывно принимаемой последовательности двоичных символов начало и конец каждого слова определяются однозначно. Кодирование по Хаффмену является самым эффективным из всех методов кодирования, дающим наименьшую среднюю длину кодового слова.

Стандарт сжатия JPEG

Изложенные методы кодирования – это методы внутрикадрового кодирования, являющиеся основой Международного стандарта сжатия JPEG (Joint Photographic Experts Group), который определяет методику кодирования отдельных кадров или неподвижных изображений для экономии объема запоминающих устройств. В упомянутом стандарте сжатия объем информации, который можно передать по каналу связи, можно уменьшить в 5–10 раз без заметного ухудшения визуально воспринимаемой картинки.

Кратко суть использования стандарта JPEG для сжатия цифровых потоков информации при передаче неподвижных изображений или отдельных кадров телевизионного изображения сводится к разбиванию телевизионной картинки на квадратные блоки размером 8х8 пикселов. Напомним, что пиксел – это наименьший элемент цифрового изображения, сводящийся к точке, для которой независимо могут быть заданы интенсивность (яркость свечения) и цвет. Цветные пикселы на цветной телевизионной картинке подразделяются на три субпиксела: красный, синий и зеленый. Комбинация яркостей субпикселов дает цветовую гамму пиксела. Выполнение операций ДКП, пороговой обработки и квантование коэффициентов ДКП, в дальнейшем считывание обработанных коэффициентов ДКП в каждом блоке в зигзагообразном порядке, преобразование получившейся последовательности коэффициентов ДКП в последовательность пар чисел с переменной длиной кодового слова обеспечивает компрессию телевизионной информации. Изменение порога и шага квантования коэффициентов ДКП обеспечивает изменение качества получаемого изображения.

Вся описанная технология относится к внутрикадровому кодированию. Для большего сжатия телевизионной информации применяются методы межкадрового кодирования. Но эти методы мы рассмотрим в следующих статьях

Опубликовано: Журнал "Broadcasting. Телевидение и радиовещание" #4, 2018
Посещений: 2744

Автор

Алексей Синятынский

Генеральный директор ООО “Фирма “Интеграл-Т”, к.ф.-м.н., ч.-к. МАОН

Всего статей: 10