ONM SYSTEM CODING AND DECODING DEVICE FOR DIGITAL VIDEO DATA STREAM COMPRESSION

Abstract


We present method for digital video data stream compression over television channel for ONM system. Proposed method is based on researching of psychophysical features of human vision. This approach provides better results for visual quality in comparison to conventional standard MPEG-2. Here we divide sequence of fields (half-frames) into 3 groups. There 3 types of fields in the each group. O-fields are image field, which is base during reconstruction of other images. O-fields use intra-field coding, and predictions for O-fields are not formed. N-even-fields are images coded by prediction based on the previous field. N-fields utilize intra-field coding that produces line difference of two neighbor lines of even and odd fields. M-odd-fields are coded under prediction based on previous odd-filed from other frame. Even and odd fileds are replaced together over all video or frame of group to improve visual quality of image. That provides to frames with higher resolution and improving of image quality. This work also discusses practical realization of ONM system, coding scheme and decoding devices. We present their detailed descriptions and comparison analysis of known systems based on MPEG-compression together with methods for improving of compression effectiveness for digital video data stream over television channel.

Full Text

Введение В работе [1] рассмотрены основные принципы способа сжатия видеоданных в системе ONM [2]. В предложенном способе последовательность полей (полукадров) делится на группы. В группе есть поля трех типов: O-поля - изображения, играющие роль опорных при восстановлении других изображений. Предсказание для них не формируется, используют внутриполевое кодирование; N-четные поля - изображения, кодируемые путем предсказания на основе предыдущего поля, используют межполевое кодирование, в результате которого образуется межстрочная разность двух соседних строк нечетного и четного полей; M-нечетные поля - кодируемые с предсказанием на основе предыдущего нечетного поля из другого кадра. Изображения M-полей содержат в основном высокочастотные составляющие, отражают межкадровую разность в пределах нечетных полей соседних кадров. При передаче малоподвижных объектов в изображениях М-полей сигнал практически равен нулю, а сигнал от N-полей отличен от нуля. Для повышения эффективности сжатия цифрового потока для неподвижных и малоподвижных изображений в системе ONM возможно кадровое кодирование путем объединения нечетных и четных полей в один кадр перед кодером. При этом возможны три варианта передачи полей в группе кадров: - первый вариант: (O, N); (M,N); (M,N) … (O, N); (M,N); (M,N) … ; - второй вариант: перестановка местами нечетных и четных полей в каждой группе кадров для улучшения четкости изображения: в первой группе: (O, N); (M,N); (M,N) …; во второй группе: (N,O); (N,M); (N,M) … и т.д.; - третий вариант: перестановка местами нечетных и четных полей во всей видеопоследовательности кадров: (O,N); (N,M); (M,N); (N,M) … (N,O); (M,N); (N,M); (M,N) и т.д. Такая перестановка полей в силу особенностей зрительного восприятия зрения приводит к существенному повышению четкости изображения в целом, то есть происходит образование опорного кадра (O,N) + (N,O), который определяет качество телевизионного (ТВ) изображения в целом [3]. В приемнике, естественно, должна быть восстановлена исходная очерёдность следования полей. Кодирующее устройство системы ONM Возможны различные схемные решения, обеспечивающие такое сокращение цифрового потока в канале связи. Рассмотрим реализацию способа на примере устройства, изображенного на рис. 1. Кратко рассмотрим работу кодирующего устройства. Структурная схема кодера (см. рис.1) отображает лишь основные операции, выполняемые при кодировании и обеспечивающие получение выходного потока данных с требуемыми параметрами. В кодере реализуются два режима кодирования: внутрикадровое и межкадровое с предсказанием и компенсацией движения. Входной видеосигнал с ИКМ поступает на блок предварительной обработки сигналов (БПО). В БПО сигналов осуществляются следующие преобразования: - изображение достраивается до кратного 16 числа элементов (пикселов) по строкам и столбцам; - перестановка местами нечетных и четных полей в видеопоследовательности кадров; - изображение разбивается на последовательность макроблоков, каждый из которых состоит из четырех блоков 8×8 элементов, несущих информацию о яркости. Рис. 1. Кодирующее устройство Рис. 2. Декодирующее устройство Аналогичные преобразования осуществляются и с сигналами цветности в формате 4:2:0. Далее в блоках 2- 5 и 8 происходит образование опорных и разностных сигналов О, M и N. Управляющие сигналы U1, U2, U5 (см. рис. 1 и [1]) координируют работу названных блоков. В блоке 9 осуществляется передискретизация (прореживание) сигналов N-полей в горизонтальном и вертикальном направлениях (см. рис. 3). Все макроблоки О-полей кодируются в режиме внутриполевого кодирования. С этой целью входной сигнал ИКМ поступает на блок ДКП по верхнему каналу. В ДКП 6 и 10 происходит преобразование матриц значений сигналов в матрицы коэффициентов Фурье. В квантователе происходит кодирование коэффициентов ДКП в соответствии с формулой [2]: , (1) где - коэффициенты квантования, задаваемые в виде таблицы из 8×8 целых чисел (см. таблицу 1, параметр Q); - параметр, определяющий степень сжатия изображения; - операция округления до ближайшего целого значения; - полученные в результате данной операции квантованные коэффициенты ДКП, которые могут быть как положительными, так и отрицательными [2]. Квантование полученной после ДКП матрицы коэффициентов производится с учётом чувствительности глаза к различным пространственным частотам, причем при передаче более ВЧ компонентов возможна большая погрешность, то есть их можно квантовать на меньшее число уровней. Для крупных деталей коэффициенты ДКП квантуются на большее число уровней. В результате выполнения операций деления и округления многие коэффициенты ДКП становятся равными нулю. Именно квантование создает возможность уменьшения числа двоичных символов, необходимых для представления информации о коэффициентах ДКП, то есть сжатия изображения. В то же время квантование является источником необратимых потерь информации при сжатии. Выбор конкретной таблицы квантования Q предоставляется на усмотрение пользователя. В блоках «Энтропийное кодирование» 21-23 осуществляется кодирование с переменной длиной кодовых слов. В петле обратной связи (деквантователь Кв-1 (15), блок обратного дискретного косинусного преобразования - ДКП-1 (14) и предсказатели (12 и 19), ЗУ которых могут содержать несколько предыдущих полей (τ = Тп + 1/2Тс , τ = 2Тп) происходит формирование предсказанного поля. Оценка движения ОД (18) осуществляется путем сравнения текущего изображения, поступающего на вход кодера, с изображением, находящимся в ЗУ (19) и используемым для предсказания. Через блок 16 на вход ОД (18) поступают сигналы О- и М-полей. Предсказатель в системе не просто память для хранения предшествующих полей (кадров), но и устройство, которое при формировании предсказания отыскивает из массива данных, находящихся в его памяти, блок, согласованный с блоками текущего кадра. Для этого в предсказатель заводятся данные о векторах движения. Сигнал предсказания также подвергается энтропийному кодированию (блок 23) и мультиплексируется (блок 24) в общий цифровой поток с коэффициентами ДКП. Основные цифровые потоки О, M, N с выходов блоков 21 и 22 мультиплексируются (см. блок 24) в один поток. В общий цифровой поток мультиплексируются сигналы с выхода определителя векторов движения ОД (18). В блоках 21; 22 и 23 осуществляется дополнительное сокращение цифрового потока. Общий цифровой поток после мультиплексора МП (24) поступает на вход буферного запоминающего устройства (БЗУ) (26), работающего по принципу: «первым вошел - первым вышел». Необходимость введения в систему БЗУ объясняется следующими обстоятельствами. В зависимости от детальности движения и характера передаваемого движения в существенной степени может меняться скорость цифрового потока на выходе блоков кодирования 21-23 с переменной длиной. При возрастании в изображении уровня высокочастотных компонентов, при быстроменяющихся сюжетах скорость потока данных на выходе компрессора возрастает. Это возрастание может приводить к превышению возможностей канала передачи по его пропускной способности. Ограничение скорости кодированного цифрового потока осуществляется реализацией обратной связи, в которую включена буферная память 26 и квантователи 7 и 11. Сущность действия обратной связи (ОС) заключается в следующем. Если передается мелкоструктурное изображение и заполнение БЗУ увеличивается (память переполняется), то под воздействием ОС увеличивается параметр квантования коэффициентов ДКП (формула 1). При этом число бит на каждый коэффициент уменьшается, и уровень потока данных поддерживается примерно постоянным. Наоборот, при передаче «гладких» изображений квантование становится более точным (параметр в формуле (1) уменьшается, а коэффициенты после квантования - увеличиваются). Такой метод соответствует свойствам человеческого зрения: на мелкоструктурных изображениях менее заметны неточности в пределах уровней яркости. Конечно, изменение масштаба квантования в зависимости от содержания изображения отражается на качестве воспроизводимого изображения, изменяется уровень шумов квантования. Включенное в цепь обратной связи устройство управления коэффициентом сжатия УКС 25 повышает ее быстродействие. В результате, благодаря действию обратной связи, степень заполнения буферной памяти (блок БЗУ) в среднем поддерживается постоянной. В декодере (см. рис. 2) восстанавливается исходная скорость потока. Рис.3. Структура дискретизации растра: а) исходный кадр; б) нечетные О- и М-поля; в) четные N-поля: 2, 6, 10; г) четные N-поля: 4, 8, 12 Прореживание отсчетов по сравнению с общеизвестными имеет свои особенности, которые улучшают визуальную четкость изображения N-полей (см. рис. 3): - в 2; 6; 10 … (4n - 2) N-полях передаются только 2; 6; 10 … (4z - 2) строки с половинным количеством отсчетов: (2; 4; 6; 8 … - передача; 1; 3; 5; 7; 9 … - прореживание, см. рис.3в). Информация в 4; 8; 12 … строках не передается; - в 4; 8; 12 … (4n) N-полях передаются строки с номерами (см. рис.3г): 4; 8; 12 … 4z, а информация в 2,6,10,… строках не передается, здесь n и z - порядковые номера: 1, 2, 3 …). Такой порядок прореживания отсчетов в N-полях повышает визуальную четкость N-полей до исходной, так как создается полноценный N-полукадр (поле) из двух смежных полей при использовании первого варианта перестановки полей. Следует отметить, что в результате прореживания N-полей ортогональная структура отсчетов сохраняется, что весьма важно для ДКП. Для повышения качества изображения четных полей прореживание отсчетов по вертикали можно не проводить (второй вариант). Декодирующее устройство системы ONM Декодирующее устройство (см. рис. 3) осуществляет обратный процесс преобразования видеосигнала из цифровой формы в аналоговую. Блок БЗУ 1 на входе декодера выполняет функцию согласования постоянной скорости передачи двоичных символов во входном потоке данных с процессами в декодере, то есть восстанавливается исходная скорость цифрового потока кодера без учета регулировки УКС (см. рис.1). С выхода буферного запоминающего устройства кодированные данные изображения и значения параметров квантования поступают на блоки декодирования энтропийного кода 3, 6 и далее на деквантователи () 4, 7,а сигналы векторов движения поступают на блок декодирования энтропийного кода 10 и предсказатель 12. В результате выполненных преобразований на выходе электронного коммутатора ЭК 17 получаем исходную последовательность О-, N- и М-полей с импульсно-кодовой модуляцией (ИКМ). Рассмотрим более подробно процесс образования исходных сигналов О-, М- и N-полей. Цифровой сигнал с выхода блока5 содержит опорный сигнал О-полей, передаваемый с внутрикадровым кодированием, и разностный сигнал М-полей (межкадровая разность двух нечетных полей соседних кадров). Во втором канале, кроме декодирования энтропийного кода, деквантования и обратного ДКП 8, в сигнале N происходит восстановление (интерполяция) пропущенных отсчетов в блоке 9. Восстановление ИКМ в сигналах N и M происходит следующим образом. При появлении сигнала О на выходе5 электронный коммутатор 17 пропускает сигнал «О» на выход схемы (положение 1 переключателя). Одновременно сигнал «О» через сумматор 11 поступает на предсказатель 14 (запоминающее устройство ЗУ на время одного поля и полстроки) и через схему «И» 13 на предсказатель 12 с компенсацией движения. При появлении сигнала N в сумматоре 15 происходит сложение его с задержанным опорным О-сигналом и образование ИКМ сигнала N, который через блок 16 поступает через ЭК 17 на выход схемы (переключатель в положение 2). Сигнал М поступает на сумматор 11, где происходит его сложение с задержанным на опорным сигналом «О». С выхода сумматора 11 восстановленный М-сигнал с ИКМ через блок 16 поступает через ЭК 17 (переключатель в положение 2) на выход схемы. Таким образом, все три сигнала (О, N и М) с ИКМ, пройдя в блоке 18 обратную перестановку полей, приобретают исходную очередность следования полей О, N, M и могут быть поданы на блок ЦАП (на схеме не показан). Выводы 1. Известные способы сжатия цифрового потока MPEG-2, MPEG-4, вейвлет-преобразование сложнее предложенного способа [3] в смысле технической реализации, поэтому ограничены в своем применении. В MPEG не возможна перестановка полей для повышения визуальной четкости: в предполагаемом способе поля с высокой и пониженной четкостью меняются местами. Это создает виртуальный полноценный кадр. Качество изображения в предложенном способе выше, чем в MPEG-2 благодаря перестановке соседних полей в видеопоследовательности кадров. При нечетном числе полей в группе кадров такая перестановка осуществляется автоматически. 2. Дополнительное прореживание отсчетов в рассмотренном случае повышает эффективность системы в сокращении цифрового потока более чем в два раза. В MPEG такая возможность отсутствует. 3. Значительно более сильные, по сравнению с прототипом, корреляционные связи между сравниваемыми элементами обеспечивают эффективное устранение избыточности из ТВ сообщений и делают систему перспективной при ее модернизации. 4. Преимуществом данного предложения является улучшение качества изображения при относительно более простой схемной его реализации, что имеет не только экономический, но и социальный эффект, так как может найти широкое применение во многих областях цифрового телевидения. 5. Для повышения эффективности сжатия цифрового потока для неподвижных и малоподвижных изображений в системе ONM возможно также и кадровое кодирование.

About the authors

Vadim Nicolaevich Bezrykov

Moscow Technical University of Communications and Informatics

Email: cdtv@mail.ru

Andrey Vladimirovich Balobanov

Moscow Technical University of Communications and Informatics

Email: andrey_sam@mail.ru

Vladimir Grigorjevich Balobanov

Povolzhskiy State University of Telecommunication and Informatics

Email: balobanov@tv.psati.ru

References

  1. Балобанов А.В., Балобанов В. Г., Безруков В.Н. Сжатие цифрового потока видеосигнала в телевизионном канале связи // Инфокоммуникационные технологии. Т.12, №3, 2013. - С.60-64.
  2. Смирнов А.В., Пескин А.Е. Цифровое телевидение: от теории к практике. М.: Горячая линия - Телеком, 2005. - 352 с.
  3. Балобанов В.Г., Безруков В.Н., Балобанов А.В. Способ сжатия цифрового потока в телевизионном канале связи. Патент RU № 2467499, БИ №32, 2012.
  4. Катаев С.И., Хромой Б.П., Безруков В.Н., Балобанов В.Г. Способ передачи двух программ черно-белого телевидения. А.с. СССР № 301875. БИ №14, 1971.

Statistics

Views

Abstract - 9

PDF (Russian) - 2

Cited-By


Article Metrics

Metrics Loading ...

PlumX

Dimensions


Copyright (c) 2015 Bezrykov V.N., Balobanov A.V., Balobanov V.G.

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies