COMPRESSION OF DIGITAL VIDEO STREAM IN A TELEVISION COMMUNICATION CHANNEL


Cite item

Full Text

Abstract

This paper describes a way how to compress digital video stream on the television communication channel with the help of exploring psychophysical features of human vision. It leads to achieving better results of the visual quality of the picture than standard MPEG-2 has. The fields are supposed to be divided into groups. There are 3 types of the fields: an O-field, which performs as a bearing; an N-even field, encoded by prediction based on the previous field within one frame, M-odd fields, encoded with the prediction based on the previous odd field from another frame. To improve the visual quality of the picture odd and even fields are interchanged during the whole video sequence or a frame group. It results in frames with better high-definition, and the visual quality of the picture becomes much higher.

Full Text

Введение Проблема сокращения цифрового потока в телевидении сохраняет свою актуальность и в настоящее время. Широкая полоса частот, занимаемая цифровым сигналом, является главным препятствием при передаче его по каналам связи. В то же время цифровые методы позволяют создать новый тип ТВ аппаратуры, более надежный, стабильный, компактный и технологичный. В настоящее время известно более 100 способов преобразования аналогового сигнала изображения в цифровой. Способы различаются видом обработки аналогового сигнала перед аналого-цифровым преобразованием (АЦП) и видом последующей обработки первичного цифрового сигнала. На всех этапах преобразования сигнала учитываются свойства изображения и зрительного анализатора, что позволяет достигнуть максимальной эффективности процесса преобразования сигнала в целом. Устранение избыточности в MPEG-2 Устранение внутрикадровой и межкадровой избыточностей в стандарте MPEG является наиболее эффективным. MPEG-2, в отличие от MPEG-1, дает возможность обработки чересстрочных изображений. В MPEG-1 для кодирования таких изображений приходилось предварительно объединить два поля в один кадр и только после этого подавать сигнал на вход кодера. Однако процедура приводила к замет «Инфокоммуникационные технологии» Том 11, № 3, 2013 Балобанов А.В., Балобанов В.Г., Безруков В.Н. 61 ным искажениям типа «жалюзи» и «расческа». В MPEG-2 введена концепция полевого и кадрового кодирования. При полевом кодировании два поля одного кадра кодируются раздельно как самостоятельные изображения. Каждое поле разбивается на непе-ресекающиеся макроблоки 8^8 или 16x16 пикселей (элементов), и к ним применяется ДКП. Кадровое кодирование предполагает построчное объединение двух полей в один кадр и обработку его как обычного изображения с прогрессивным разложением. MPEG-2 определяет два типа ДКП для макроблоков: кадровое и полевое. Полевое ДКП более эффективно при существенном различии между полями, например при наличии движения. Полевая структура лучше подходит для компрессии изображений с быстрым движением, обеспечивая меньше артефактов. То есть она хороша для сюжетов с большим количеством движения, но хуже подходит при пространственной избыточности, обеспечивая худшее сжатие неподвижных изображений с точки зрения минимизации артефактов. При передаче неподвижных и малоподвижных изображений в стандарте MPEG-2 используется также и межкадровое кодирование, которое значительно повышает эффективность сжатия цифрового потока. При межкадровом кодировании, основанном на временной избыточности, возможны различные способы предсказания. В зависимости от этого изображения (кадры) в своей временной последовательности подразделяются на следующие типы: - I-кадры (intra), опорные, являются основными и кодируются без обращения к другим кадрам; - P-кадры (predictive - предсказанные), при передаче которых используется межкадровое кодирование путем предсказания с компенсацией движения по ближайшему предшествующему I-кадру или P-кадру. P-кадры сжаты в три раза сильнее, чем I-кадры, и служат опорными для поступающих P- и B-кадров; - B-кадры (bidirectional - двунаправленные), которые передаются с межкадровым кодированием путем предсказания с компенсацией движения по ближайшим к ним как спереди, так и сзади I-кадрам и P-кадрам. Недостатки в работе системы MPEG-2 Рассмотрим пример последовательности кадров, используемый в MPEG-2 [1]: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 IBBPBBPBBPBBPBBIBBPB. Здесь кадры с 1 по 15 образуют группу кадров. Число кадров в группе может быть и другим, но они всегда начинаются с I-кадра. Перед кодиро ванием порядок следования кадров изменяется, так как каждый B-кадр должен идти после обоих кадров, по которым он предсказывается: 1 4 2 3 7 5 6 10 8 9 13 11 12 16 14 15 19 17 18 22 ІРВБРББРББР ВБ I ББР ББР. В таком порядке кадры кодируются и передаются, а в процессе декодирования восстанавливается исходный порядок кадров. Изображение типа B компрессированы наиболее глубоко. Если P-кадры требуют для своей передачи в три раза меньше битов, чем I-кадры, то в B-изображениях число битов для большинства сюжетов в 2-5 раз меньше, чем в P. Как следствие, страдает помехоустойчивость B-кадров. Поэтому для защиты от возможных ошибок изображения B не используются для предсказания других кадров. Проведенный анализ работы системы MPEG-2 показывает, что она имеет и недостатки. Известно, что степень сжатия цифрового потока напрямую зависит от корреляции между элементами изображения. В MPEG-2 межкадровое кодирование между I- и P-кадрами осуществляется через три кадра (поля), а не через один кадр (поле). Это в сильной степени ослабляет корреляционные связи между элементами и, соответственно, ухудшает эффективность сокращения избыточности изображения. Хотя этот недостаток и компенсируется двунаправленным предсказанием B-кадров, но при этом снижается помехоустойчивость и качество изображения B-кадров. Естественно, перестановка P-, B1- и B2-ra-дров существенно усложняет построение системы, делая ее громоздкой и дорогой. При этом упомянутые усложнения системы не всегда себя оправдывают в смысле получения высокого качества изображения [2]. Устранение вышеназванных недостатков позволит создать более простую и не менее эффективную систему сжатия цифрового потока для прикладного и вещательного телевидения. Система сжатия цифрового потока ONM Поставленная цель достигается тем, что последовательность полей (полукадров) делится на группы. В группе есть поля трех типов: - O-поля - изображения, играющие роль опорных при восстановлении других изображений. Предсказание для них не формируется, используют внутриполевое кодирование; - N-четные поля - изображения, кодируемые путем предсказания на основе предыдуще «Инфокоммуникационные технологии» Том 11, № 3, 2013 62 Балобанов А.В., Балобанов В.Г., Безруков В.Н. го поля, используют межполевое кодирование, в результате которого образуется межстрочная разность двух соседних строк нечетного и четного полей; - M-нечетные поля - кодируемые с предсказанием на основе предыдущего нечетного поля из другого кадра. Начинается группа с изображения типа O, подвергается только внутриполевой компрессии. В изображениях полей N- и M-типа устраняется как пространственная, так и временная избыточности. Число полей (кадров) в группе может быть иным, чем это представлено на рис. 1, и легко варьируется путем изменения частоты следования импульсов U1 и соответственно U4. Стрелки на рис. 1 определяют порядок предсказания: для N - в пределах одного кадра между нечетным и четным полями и M - в пределах двух соседних кадров для нечетных полей. Синхронную и синфазную работу кодирующего и декодирующего устройств осуществляют импульсы U2-U4 (см. рис. 1). Изображения N-полей содержат в основном тонкие горизонтальные линии разной протяженности (низкочастотные составляющие). При движении в изображениях N-полей появляются ВЧ-составляющие. Изображения M-полей содержат в основном высокочастотные составляющие, отражают межкадровую разность в пределах нечетных полей соседних кадров. Здесь возможно предсказание с компенсацией движения. При передаче малоподвижных объектов в изображениях М-полей сигнал практически равен нулю, а сигнал от N-полей отличен от нуля. Для повышения эффективности сжатия цифрового потока для неподвижных и малоподвижных изображений в системе ONM возможно кадровое кодирование путем объединения нечетных и четных полей в один кадр перед кодером. Подытоживая сказанное, видим, что эффективность сокращения цифрового потока О-полей является наиболее низкой по сравнению с M- и N-полями и примерно равна по эффективности I-полям в стандарте MPEG-2. Зато качество изображения здесь выше, чем в M- и N-полях. Эффективность сжатия в M-полях примерно одинакова с Р-полями, а в N-полях она несколько выше, чем в B-полях, так как в N-полях осуществляется прореживание (передискретизация) значений сигналов матрицы ДКП (до матрицы коэффициентов). Кроме того, для повышения четкости изображения по предлагаемому способу нечетные и четные поля в каждой группе кадров меняются местами: в первой группе - (O, N), (M,N), (M,N) ... а во второй группе - (N,0), (N,M), (N,M) ... и т.д. (рис. la). Такая перестановка полей в силу особенностей зрительного восприятия зрения приводит к существенному повышению четкости изображения в целом, то есть происходит образование опорного кадра (O,N)+(N,O), который определяет качество ТВ изображения в целом [3]. В приемнике, естественно, должна быть восстановлена исходная очередность следования полей. Возможен еще один вариант перестановки полей в кадрах (рис. 1а) - перестановка нечетных и четных полей во всей видеопоследовательности кадров: (O,N), (N,M), (M,N), (N,M), (M,N), (N,O) и т.д. При нечетном числе (2n + 1) полей в группе кадров O- и N-поля, а также (М- и N-поля) периодически меняются местами, что более предпочтительно. Здесь визуально формируется виртуальный опорный кадр: (O,N) + (N,O). В нашем случае (см. рис. 1 а) визуально кадры (0,N) и (N,O) накладываются друг на друга через четыре кадра, образуя опорный кадр. Из рассмотренных вариантов последний является предпочтительнее, так как частота перестановки полей здесь более высокая, чем в первом варианте. То есть если зрителю поочередно предъявлять кадры (поля) изображения с высокой и низкой четкостью, то глаз в целом воспринимает изображение с высокой четкостью. В MPEG-2 такая возможность дополнительного повышения визуальной четкости изображения отсутствует. Варианты рассмотренной системы могут найти применение в специальных системах телевидения при регистрации одиночных кадров с различной частотой следования. Такая необходимость возникает при видеонаблюдении за особо важными объектами. Частота регистрации задается вручную или автоматически. Если в зоне наблюдения все спокойно, регистрация ведется с предельно низкой частотой. При появлении посторонних объектов запускается автоматическая регистрация изображений охраняемого объекта. Параллельно подается звуковой сигнал тревоги. При этом для регистрации в чрезвычайных ситуациях желательно использовать опорные кадры, если требуется высокое качество изображения. Другие кадры (N и M) не могут использоваться для регистрации, так как связаны с соседними кадрами и самостоятельно использоваться не могут. Выводы Подводя итоги сказанному, можно сделать следующие выводы. «Инфокоммуникационные технологии» Том 11, № 3, 2013 Балобанов А.В., Балобанов В.Г., Безруков В.Н. 63 1. Рассмотренный способ [4] выгодно отличается от существующих способов сжатия цифрового потока видеосигнала в канале связи. Не уступая в эффективности сжатия цифрового потока стандарту MPEG-2, предложенный способ значительно проще и легче реализуется на практике. Известные способы сжатия цифрового потока MPEG-4, MPEG-7, вейвлет-преобразование сложнее предложенного способа в смысле технической реализации, поэтому ограничены в своем применении. В MPEG-2 невозможна перестановка полей для повышения визуальной четкости: в предлагаемом способе поля с высокой и пониженной четкостью меняются местами, это создает виртуальный полноценный кадр. Качество изображения в предложенном способе выше, чем в MPEG-2, благодаря перестановке соседних полей в видеопоследовательности кадров. 2. При необходимости система сжатия цифрового потока по предлагаемому способу легко переходит в режим работы «опорного кадра», когда передается последовательность полей, состоящая из кадров: (O, N), (N, O), (O,N),..., то есть поля O и N в каждом кадре меняются местами. В результате произведенной перестановки полей визуальная четкость изображения повышается. Все кадры визуально воспроизводятся с качеством изображения опорного кадра (виртуального). Переход работы системы в режим работы «опорного поля (кадра)» в прикладном телевидении может осуществляться автоматически по сигналу тревоги. 3. Существенными отличиями предлагаемого способа являются: - применяются для каждой группы полей одновременно полевое и кадровое предсказание. В MPEG-2 используется только кадровое или только полевое кодирование в зависимости от характера передаваемого изображения; - значительно более сильная корреляция между сравниваемыми сигналами, а следовательно, и более эффективное устранение избыточности из телевизионных сообщений; - перестановка местами нечетных и четных полей во всей видеопоследовательности кадров приводит к улучшению визуальной четкости изображения в системе ONM; - скорость цифрового потока при передаче виртуального опорного кадра (O,N)+(N,O) в системе ONM меньше, чем в MPEG-2. 4. Для повышения эффективности сжатия цифрового потока для неподвижных и малопод Рис. 1. Диаграммы, поясняющие принцип сокращения цифрового потока «Инфокоммуникационные технологии» Том 11, № 3, 2013 64 вижных изображений в системе ONM возможно также и кадровое кодирование. 5. В системе, построенной по пре
×

References

  1. Смирнов А.В., Пескин А.Е. Цифровое телевидение: от теории к практике. М.: Горячая линия - Телеком, 2005. - 352с.
  2. Цифровое сжатие видеоинформации и звука. Под ред. Артюшенко В.М. М.: Изд. ТК «Дашков и Ко». 2003. - 426с.
  3. АС СССР № 301675. Способ передачи двух программ черно-белого телевидения // Катаев С.И., Хромой Б.П., Безруков В.Н., Балобанов В.Г. Бюл. № 14, 1971.
  4. Патент РФ № 2467499. Способ сжатия цифрового потока в телевизионном канале связи. // Балобанов В.Г., Безруков В.Н., Балобанов А.В. Бюлл. №32, 2012.

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2013 Balobanov A.V., Balobanov V.G., Bezrykov V.N.

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies