Зачем нужны форматы хранения видео? И какие они ? - 27 Апреля 2009

Воскресенье, 19.05.2024, 04:16	Приветствую Вас Гость RSS
Помощь сборщикам Аниме
Главная Регистрация Вход

Меню сайта

Разделы новостей

Аудио [3]

Видео [6]

Юмор [0]

Друзья сайта

Главная » 2009 » Апрель » 27 » Зачем нужны форматы хранения видео? И какие они ?

Зачем нужны форматы хранения видео? И какие они ?

21:18

Вопрос очевиден. Действительно, зачем нужно столько форматов хранения видео? Можно же превращать каждый кадр в оцифрованную картинку аналогично тому, например, как обычный сканер переносит фотографию на компьютер. В этом случае и качество такого видео будет наилучшим! На самом деле, такой вариант переноса видео в компьютер возможен и используется профессионалами. Но работа с незжатым видео (именно так называется этот фотмат - uncompressed) требует довольно значительных финансовых затрат, так как объем обрабатываемых данных составляет 31 мегабайт в секунду, что требует очень быстрых компьютеров с огромными дисковыми массивами. Час несжатого видео в этом случае займет на жестком диске примерно 112 гигабайт.

Единственный выход сделать редактирование видео доступным для всех - это сжимать видеоинформацию. Собственно говоря, главный признак, отличающий один формат от другого - способ сжатия (компрессии). Первые способы компрессии видеоизображений появились в середине 80-х годов прошлого века и предназначались только для показа видео на кампьютере, так как качество видео по современным понятиям не выдерживало никакой критики. Это было связано с очень слабыми в те времена возможностями персональных компьютеров. Поэтому приходилось заметно уменьшать размер изображения. что неминуемо отражалось на качестве.

В настоящее время поддержка старых фотматов еще присутствует во всех операционных системах, но реально остались только несколько наиболее распространенных:

Quick Time - формат, разработанный фирмой Apple и в основном используемый для ощифровки видео на компьютерах той же фирмы. Формат Quick Time также широко используется в сети Интернет для распространения различных демороликов. Расширение имени файлов формата Quick Time - .mov;
DV (сокращение от Digital Video) - формат, разработанный для хранения и обработки видео цифровыми камерами с последующим переносом на компьютер и обратно. В настоящее время станосится самым массовым форматом видео как для любителей, так и для профессионалов. Специального расширения имени файлов формат не имеет.
MPEG (сокращение от Motion Pictures Experts Group) - один из самых популярных способов сжатия видео. Применяется как для любительских, так и для профессиональных целей. Существует несколько вариантов основанных на MPEG-технологии форматов сжатия видео. Файлы в MPEG форматах могут иметь расширения .mpg, .mpeg, .m2v, .mp2, .dat, m1v;
ASF (Microsoft Advanced Streaming Format) - формат потоковой передачи. Разработан и применяется в основном для передачи видео- и аудио-информации в Интернет. Расширение имён файлов .asf;
WMV (Windows Media Video) - основанный на MPEG алгоритмах сжатия формат от фирмы Microsoft. Расширение имён файлов .wmv.

Существует также широко распространенное заблуждение о том, что есть формат видео AVI (Audio-Video Interleave). Это действительно заблуждение. Существует формат: только не видеоданных, а файла avi, поэтому формат видеоклипа, сохраненного в файле с расширением .avi, в принципе может быть любым.

Теперь перейдем к более подробному описанию двух основных форматов, с которыми обязательно придется встретиться в практической работе.

DV-формат появился в середине 90-х годов прошлого века как формат хранения видеоданных для тогда еще очень дорогих и редких цифровых видеокамер. До этого самым популярным форматом сжатия для хранения обработки видео на компьютере был Motion JPEG (MJPEG). Подавляющее большинство тогдашних плат захвата и обработки видео использовала именно MJPEG. Собственно формат JPEG известен сейчас практически всем, кто хоть раз посещал сайты в Интернете, так как в нем хранятся практически все фотографии на миллионах сайтах в сети. MJPEG использует те же принципы сжатия, что и JPEG, но только применительно к каждому кадру фильма. На тех же принципах сжатия базируется и DV-формат.

В DV используется как intraframe (внутрикадровая) компрессия, при которой каждый кадр сжимается сам по себе, без учета информации в соседних кадрах, так и interfield (межполевая) компрессия, применяющая анализ статичных изображений на соседних полях одного кадра с использованием одинакового фона для соседних полей. Такие алгоритмы компрессии дают очень незначительное количество артефактов. Просматривая фильм, сохраненный в DV-формате, можно обнаружить артефакты, вызванные компрессией, только в случае появления на экране множества движущихся мелких объектов, например, листвы дерева при сильном ветре.

Формат DV разрабатывался для потребительского рынка, поэтому его основное отличие от подавляющего большинства форматов компрессии видео в невозможности для пользователя изменять какие-либо параметры кодирования/декодирования видео. Это делает работу с видео в DV-формате удобной для начинающего видеолюбителя. У DV фиксированный коэффициент сжатия видеосигнала 5:1 и, соответственно, поток 3.515 MBytes/s. Разрешение для PAL 720x576, для NTSC 720x480. Поскольку никакие из указанных параметров пользователь изменить не может, то и навредить по незнанию он тоже не может. Кроме этого, фиксированность параметров формата делает совершенно необязательным глубокие знания о нем и тем самым существенно облегчает работу с видео в DV-формате.

Различают два варианта DV-формата:

DV Type-1 (Digital Video Type-1) - оригинальный (native) вариант DV-формата, совершенно несовместимый с Video for Windows и поддерживаемый только через Di-rectShow. Поток (файл) формата Туре-1 содержит видео и аудио (стерео, 48 kHz, 16 bit) в одном потоке, т.е. с чередованием видео и аудио. Именно этот формат является рекомендуемым для захвата и последующей обработки видео DV-формата на компьютере;
DV Type-2 (Digital Video Type-2) - старый вариант DV-формата, обратно совместимый с Video for Windows — программа, понимающая Video for Windows, может прочитать файл формата Туре-2. Поток (файл) формата Туре-2 содержит видео и от одного до четырех потоков (каналов) для аудио (максимально 2 стереоканала, по 32 kHz, 12 bit каждый). По сравнению с Туре-1 требует больших затрат на декодирование и микширование, поэтому область применения этого формата постепенно, по мере перехода программ видеомонтажа на формат Туре-1 будет сокращаться.

Поскольку формат фиксированный, то легко понять, сколько места на жестком диске компьютера займет фильм.

1 час видео в DV-формате - 12 гигабайт;
1 минута видео в DV-формате - 210 мегабайт;
1 гигабайт видео в DV-формате - 4 минуты 45 секунд.

Концепция сжатия видео в MPEG очень проста - определить, какая именно информация в потоке повторяется хотя бы в течение какого-то отрезка времени и принять меры к избежанию дублирования этой информации. Наиболее ценное достоинство MPEG кодирования, особенно удобное для передачи по различным сетям - возможность гибкой настройки качества изображения в зависимости от пропускной способности сети. Это и сделало MPEG-2 фактическим стандартом для приема/передачи цифрового телевидения по различным сетям.

К сожалению, не существует возможности однозначно оценить качество кодирования некими приборами и измерениями. Единственный критерий здесь - человек и как он воспримет сжатую информацию. Поэтому правила сжатия видеоданных при MPEG кодировании вырабатывались на основе модели восприятия человеком видеоизображений (HVS - Human Visual Sense). Избыточность изображения согласно HVS определяется по трем основным критериям:

Невидимые человеческим глазом детали изображения - места гашения по вертикали и горизонтали. Удаление этой информации вообще никак не сказывается на изображении;
Статистическая избыточность. Подразделяется на пространственную и временную. Под пространственной избыточностью понимаются участки изображения, на которых смежные пиксели практически одинаковы. Под временной - не изменяемые во времени фрагменты изображения;
Избыточность по цвету и яркости - рассчитывается исходя из ограниченной чувствительности человека к небольшим изменениям цветов и яркости деталей изображения.

Как реализуется формат MPEG.

Для удобства кодирования видеоданных весь видеопоток разбивается на группы, называемые GOP (Group of Pictures - Группа изображений). Такая группа строится, как показано на Рис. 1.3

Рис. 1.3. «Устройство» формата MPEG

На рисунке изображены следующие кадры:

I - Intra-кадры, которые обычно называются опорными и содержат всю информацию об изображении. MPEG последовательности без этих кадров быть не может в принципе. При компрессии I-кадров происходит удаление только пространственной избыточности. Именно с этого кадра начинается декодирование изображения в последовательности;
Р - Predictive кадры. «Предсказанные» кадры, при формировании которых используется метод предсказания изображения на следующем кадре с учетом компенсации движения от последнего I или Р-кадра перед формируемым. Р-кадр также служит для дальнейшего предсказания изображения. Р-кадр создается с помощью межкадровой компрессии, уменьшающей как пространственную, так и временную избыточность. Изображение Р-кадра вычитается из следующего изображения и эта разница кодируется и вместе с вектором движения добавляется к сжатым данным;
В - Bi-directional, «двунаправленные» кадры. Они названы так потому, что хранят наиболее существенную информацию с окружающих их I и Р-кадров. В кадры имеют наивысшую степень компрессии, но требуют предыдущего и последующего изображения для компенсации движения объектов на изображении.

Такую структуру MPEG потока обычно описывают в виде дроби M/N, для которой М сообщает общее число кадров в GOP, a N - каким по счету будет очередной Р-кадр после предыдущего. Таким образом, GOP-последовательность, изображенная на рисунке выше, может быть записана как 12/3. Собственно поток данных MPEG состоит из 6 иерархических уровней:

Блок - данные по яркости и цветности для блоков 8x8 пикселей изображения. Блоки анализируются по значениям Y (яркость), СВ и CR (цветоразностные сигналы);
Макроблок — как следует из названия, состоит из 4 простых блоков в окне 16x16 пикселей соответственно. В формате 4:2:0 макроблок содержит 4 блока яркостных данных Y и по одному СВ и CR;
Слой - содержит несколько смежных макроблоков;
Кадр - состоит из группы слоев, содержащих изображение, которое, в свою очередь, может быть как I, так Р или В;
Группа изображений (она же GOP) - содержит последовательность кадров. Может включать до 15 кадров и должна обязательно начинаться с I кадра;
Видеопоследовательность — должна содержать минимум одну GOP, а также заголовок в начале последовательности и код конца последовательности.

Уровни и профили MPEG

Под профилем MPEG понимается подмножество структуры битового потока сжатого видеоизображения. В пределах такого подмножества возможен широкий разброс параметров потока и, соответственно, кодеров и декодеров для них.

Под уровнем понимается ряд ограничений, применяемых к параметрам MPEG-потока, например, разрешение выходного изображения, частота кадров и т.п.

Таблица ниже иллюстрирует максимальные значения ограничений, накладываемых на уровни и профили MPEG.

Профиль/ уровень	Простой I, P 4:2:0 (Simple Profile)	Основной 1, P, В 4:2:0 (Main Profile)	I, P, В 4:2:2	1,P,B 4:2:0 (SNR Scalable Profile)	Пространственный I, P, В 4:2:0 (Spatially Scalable Profile)	Высокий 1, P, В 4:2:0 или 4:2:2 (High Profile)
Самый высокий (High Level)		1920x1152 80 Mbit/s				1920x1152 100 Mbit/s
Высокий (High 1440 Level)		1440x1152 60 Mbit/s			1440x1152 60 Mbit/s	1440x1152 80 Mbit/s
Основной (Main Level)	720x576 15Mbit/s	720x576 15 Mbit/s	720x608 50 Mbit/s	720x576 15 Mbit/s		720x608 20 Mbit/s
Низкий (Low Level)		352x288 4 Mbit/s		352x288 4 Mbit/s

Эта таблица нужна в первую очередь для понимания часто встречающихся обозначений формата конкретной записи или описаний возможности какого-либо кодера. Например, вот так может характеризоваться запись в формате MPEG:

Название	Обозначение	Что есть что
Standard	PAL	Система телевидения 1)
Resolution	720*576	Разрешение изображения
Profile and level	MP@ML	Main Profile и Main Level
Frame rate	25	Частота кадров
Bitrate	around 5 Mbit avg	Средняя скорость потока 5 Mbit
GOP structure	IBBPBBPBBPBB	Структура GOP

1) На самом деле здесь правильнее было бы написать: PAL - название аналогового стандарта телевидения, в котором был создан исходный видеофильм. Собственно MPEG фильм нельзя отнести к какой-либо системе цветного телевидения, так как кадры в MPEG являются просто цифровым представлением ранее аналогового изображения и не имеют никакого отношения даже к исходной для оригинала фильма системе телевидения.

Для видеолюбителя определяющую роль играют всего несколько наиболее важных параметров настройки MPEG-кодера (компрессора). Это:

Bit Rate (Скорость потока) - измеряется в мегабитах (обратите внимание, в мегабитах, а не в мегабайтах) в секунду. Чем выше Bit Rate, тем выше качество изображения, но тем больше места занимает созданный кодером MPEG файл;
Constant Bit Rate (Постоянная скорость потока) - параметр кодирования, указывающий на то, что скорость потока не должна зависеть от кодируемого изображения и быть постоянной величиной. Установка постоянной скорости позволяет точно определить размер итогового файла фильма, но не оказывает влияния на качество изображения только в случае одной и той же динамики фильма на всем его протяжении. Например, в течение фильма непрерывно показываются автомобильные гонки или медленно и плавно картины в музее;
Variable Bit Rate (Переменная скорость потока) - параметр кодирования, указывающий на то, что скорость потока должна зависеть от динамики изображения - расти на динамичных сценах и уменьшаться на статичных. Variable Bit Rate применяется сейчас наиболее широко, так как позволяет в подавляющем большинстве случаев добиться лучшего качества видео по сравнению с Constant Bit Rate при том же размере файла результата;
Average Bit Rate (Средняя скорость потока) - параметр, совпадающий по значению с Constant Bit Rate при постоянной скорости потока и оговаривающий среднюю скорость потока с Variable Bit Rate.

Используя MPEG или планируя его использовать, следует помнить, что MPEG ориентирован на хранение и передачу видеоданных, но не на их обработку. Редактировать, т.е. каким-либо образом изменять видео в любом из форматов MPEG крайне неудобно и приводит в подавляющем большинстве случаев к потере качества исходного видеоматериала, не говоря уже о больших по сравнению с любыми другими форматами временных затратах компьютера на редактирование.

Атор оригинала Igon
Материал взят с