Вопрос очевиден.
Действительно, зачем нужно столько форматов хранения видео?
Можно же превращать каждый кадр в оцифрованную картинку аналогично
тому, например, как обычный сканер переносит фотографию на
компьютер. В этом случае и качество такого видео будет наилучшим!
На самом деле, такой вариант переноса видео в компьютер возможен
и используется профессионалами. Но работа с незжатым видео
(именно так называется этот фотмат - uncompressed) требует
довольно значительных финансовых затрат, так как объем обрабатываемых
данных составляет 31 мегабайт в секунду, что требует очень
быстрых компьютеров с огромными дисковыми массивами. Час несжатого
видео в этом случае займет на жестком диске примерно 112 гигабайт.
Единственный выход сделать редактирование видео доступным
для всех - это сжимать видеоинформацию. Собственно говоря,
главный признак, отличающий один формат от другого - способ
сжатия (компрессии). Первые способы компрессии видеоизображений
появились в середине 80-х годов прошлого века и предназначались
только для показа видео на кампьютере, так как качество видео
по современным понятиям не выдерживало никакой критики. Это
было связано с очень слабыми в те времена возможностями персональных
компьютеров. Поэтому приходилось заметно уменьшать размер
изображения. что неминуемо отражалось на качестве.
В настоящее время поддержка старых фотматов еще присутствует
во всех операционных системах, но реально остались только
несколько наиболее распространенных:
- Quick Time - формат, разработанный
фирмой Apple и в основном используемый для ощифровки видео
на компьютерах той же фирмы. Формат Quick Time
также широко используется в сети Интернет для распространения
различных демороликов. Расширение имени файлов формата Quick
Time - .mov;
- DV (сокращение от Digital
Video) - формат, разработанный для
хранения и обработки видео цифровыми камерами с последующим
переносом на компьютер и обратно. В настоящее время станосится
самым массовым форматом видео как для любителей, так и для
профессионалов. Специального расширения имени файлов формат
не имеет.
- MPEG (сокращение от Motion
Pictures Experts Group)
- один из самых популярных способов сжатия видео. Применяется
как для любительских, так и для профессиональных целей.
Существует несколько вариантов основанных на MPEG-технологии
форматов сжатия видео. Файлы в MPEG
форматах могут иметь расширения .mpg, .mpeg, .m2v,
.mp2, .dat, m1v;
- ASF (Microsoft
Advanced Streaming Format)
- формат потоковой передачи. Разработан и применяется в
основном для передачи видео- и аудио-информации в Интернет.
Расширение имён файлов .asf;
- WMV (Windows
Media Video) - основанный
на MPEG алгоритмах сжатия формат
от фирмы Microsoft. Расширение имён файлов .wmv.
Существует также широко распространенное заблуждение о том,
что есть формат видео AVI (Audio-Video
Interleave). Это действительно заблуждение.
Существует формат: только не видеоданных, а файла avi, поэтому
формат видеоклипа, сохраненного в файле с расширением .avi,
в принципе может быть любым.
Теперь перейдем к более подробному описанию двух основных
форматов, с которыми обязательно придется встретиться в практической
работе.
DV-формат
появился в середине 90-х годов прошлого века как формат хранения
видеоданных для тогда еще очень дорогих и редких цифровых
видеокамер. До этого самым популярным форматом сжатия для
хранения обработки видео на компьютере был Motion JPEG
(MJPEG). Подавляющее большинство тогдашних плат
захвата и обработки видео использовала именно MJPEG.
Собственно формат JPEG известен
сейчас практически всем, кто хоть раз посещал сайты в Интернете,
так как в нем хранятся практически все фотографии на миллионах
сайтах в сети. MJPEG использует
те же принципы сжатия, что и JPEG,
но только применительно к каждому кадру фильма. На тех же
принципах сжатия базируется и DV-формат.
В DV используется как
intraframe (внутрикадровая) компрессия, при которой
каждый кадр сжимается сам по себе, без учета информации в
соседних кадрах, так и interfield (межполевая) компрессия,
применяющая анализ статичных изображений на соседних полях
одного кадра с использованием одинакового фона для соседних
полей. Такие алгоритмы компрессии дают очень незначительное
количество артефактов. Просматривая фильм, сохраненный в DV-формате,
можно обнаружить артефакты, вызванные компрессией, только
в случае появления на экране множества движущихся мелких объектов,
например, листвы дерева при сильном ветре.
Формат DV разрабатывался
для потребительского рынка, поэтому его основное отличие от
подавляющего большинства форматов компрессии видео в невозможности
для пользователя изменять какие-либо параметры кодирования/декодирования
видео. Это делает работу с видео в DV-формате
удобной для начинающего видеолюбителя. У DV
фиксированный коэффициент сжатия видеосигнала 5:1 и, соответственно,
поток 3.515 MBytes/s. Разрешение для PAL
720x576, для NTSC 720x480. Поскольку
никакие из указанных параметров пользователь изменить не может,
то и навредить по незнанию он тоже не может. Кроме этого,
фиксированность параметров формата делает совершенно необязательным
глубокие знания о нем и тем самым существенно облегчает работу
с видео в DV-формате.
Различают два варианта DV-формата:
- DV Type-1 (Digital
Video Type-1) - оригинальный
(native) вариант DV-формата, совершенно
несовместимый с Video for Windows и поддерживаемый только
через Di-rectShow. Поток (файл) формата Туре-1
содержит видео и аудио (стерео, 48 kHz, 16 bit) в одном
потоке, т.е. с чередованием видео и аудио. Именно этот формат
является рекомендуемым для захвата и последующей обработки
видео DV-формата на компьютере;
- DV Type-2 (Digital
Video Type-2) - старый
вариант DV-формата, обратно совместимый
с Video for Windows — программа, понимающая Video for Windows,
может прочитать файл формата Туре-2.
Поток (файл) формата Туре-2 содержит
видео и от одного до четырех потоков (каналов) для аудио
(максимально 2 стереоканала, по 32 kHz, 12 bit каждый).
По сравнению с Туре-1 требует больших затрат
на декодирование и микширование, поэтому область применения
этого формата постепенно, по мере перехода программ видеомонтажа
на формат Туре-1 будет сокращаться.
Поскольку формат фиксированный, то легко понять,
сколько места на жестком диске компьютера займет фильм.
- 1 час видео в DV-формате - 12 гигабайт;
- 1 минута видео в DV-формате - 210 мегабайт;
- 1 гигабайт видео в DV-формате - 4 минуты 45 секунд.
Концепция
сжатия видео в MPEG очень проста
- определить, какая именно информация в потоке повторяется
хотя бы в течение какого-то отрезка времени и принять меры
к избежанию дублирования этой информации. Наиболее ценное
достоинство MPEG кодирования, особенно
удобное для передачи по различным сетям - возможность гибкой
настройки качества изображения в зависимости от пропускной
способности сети. Это и сделало MPEG-2
фактическим стандартом для приема/передачи цифрового телевидения
по различным сетям.
К сожалению, не существует возможности однозначно оценить
качество кодирования некими приборами и измерениями. Единственный
критерий здесь - человек и как он воспримет сжатую информацию.
Поэтому правила сжатия видеоданных при MPEG
кодировании вырабатывались на основе модели восприятия человеком
видеоизображений (HVS - Human
Visual Sense). Избыточность
изображения согласно HVS определяется
по трем основным критериям:
- Невидимые человеческим глазом детали изображения - места
гашения по вертикали и горизонтали. Удаление этой информации
вообще никак не сказывается на изображении;
- Статистическая избыточность. Подразделяется на пространственную
и временную. Под пространственной избыточностью понимаются
участки изображения, на которых смежные пиксели практически
одинаковы. Под временной - не изменяемые во времени фрагменты
изображения;
- Избыточность по цвету и яркости - рассчитывается исходя
из ограниченной чувствительности человека к небольшим изменениям
цветов и яркости деталей изображения.
Как реализуется формат MPEG.
Для удобства кодирования видеоданных весь видеопоток разбивается
на группы, называемые GOP (Group
of Pictures - Группа изображений).
Такая группа строится, как показано на Рис. 1.3
Рис. 1.3. «Устройство» формата MPEG
На рисунке изображены следующие кадры:
- I - Intra-кадры, которые
обычно называются опорными и содержат всю информацию об
изображении. MPEG последовательности
без этих кадров быть не может в принципе. При компрессии
I-кадров происходит удаление только
пространственной избыточности. Именно с этого кадра начинается
декодирование изображения в последовательности;
- Р - Predictive кадры.
«Предсказанные» кадры, при формировании которых используется
метод предсказания изображения на следующем кадре с учетом
компенсации движения от последнего I
или Р-кадра перед формируемым.
Р-кадр также служит для дальнейшего
предсказания изображения. Р-кадр
создается с помощью межкадровой компрессии, уменьшающей
как пространственную, так и временную избыточность. Изображение
Р-кадра вычитается из следующего
изображения и эта разница кодируется и вместе с вектором
движения добавляется к сжатым данным;
- В - Bi-directional,
«двунаправленные» кадры. Они названы так потому, что хранят
наиболее существенную информацию с окружающих их I
и Р-кадров. В кадры имеют наивысшую
степень компрессии, но требуют предыдущего и последующего
изображения для компенсации движения объектов на изображении.
Такую структуру MPEG потока обычно
описывают в виде дроби M/N, для которой М сообщает общее число
кадров в GOP, a N - каким по счету
будет очередной Р-кадр после предыдущего.
Таким образом, GOP-последовательность,
изображенная на рисунке выше, может быть записана как 12/3.
Собственно поток данных MPEG состоит
из 6 иерархических уровней:
- Блок - данные по яркости и цветности
для блоков 8x8 пикселей изображения. Блоки анализируются
по значениям Y (яркость), СВ и CR (цветоразностные сигналы);
- Макроблок — как следует из названия,
состоит из 4 простых блоков в окне 16x16 пикселей соответственно.
В формате 4:2:0 макроблок содержит 4 блока яркостных данных
Y и по одному СВ и CR;
- Слой - содержит несколько смежных
макроблоков;
- Кадр - состоит из группы слоев,
содержащих изображение, которое, в свою очередь, может быть
как I, так Р или В;
- Группа изображений (она же GOP)
- содержит последовательность кадров. Может включать до
15 кадров и должна обязательно начинаться с I кадра;
- Видеопоследовательность — должна
содержать минимум одну GOP, а также заголовок в начале последовательности
и код конца последовательности.
Уровни и профили MPEG
Под профилем MPEG понимается подмножество
структуры битового потока сжатого видеоизображения. В пределах
такого подмножества возможен широкий разброс параметров потока
и, соответственно, кодеров и декодеров для них.
Под уровнем понимается ряд ограничений, применяемых к параметрам
MPEG-потока, например, разрешение
выходного изображения, частота кадров и т.п.
Таблица ниже иллюстрирует максимальные значения ограничений,
накладываемых на уровни и профили MPEG.
Профиль/ уровень |
Простой I, P 4:2:0 (Simple Profile) |
Основной 1, P, В
4:2:0 (Main Profile)
|
I, P, В
4:2:2
|
1,P,B
4:2:0 (SNR Scalable Profile)
|
Пространственный I, P, В 4:2:0 (Spatially
Scalable Profile) |
Высокий 1, P, В 4:2:0 или 4:2:2 (High Profile) |
Самый высокий (High Level) |
|
1920x1152 80 Mbit/s |
|
|
|
1920x1152 100 Mbit/s |
Высокий (High 1440 Level) |
|
1440x1152 60 Mbit/s |
|
|
1440x1152 60 Mbit/s |
1440x1152 80 Mbit/s |
Основной (Main Level) |
720x576 15Mbit/s |
720x576 15 Mbit/s |
720x608 50 Mbit/s |
720x576 15 Mbit/s |
|
720x608 20 Mbit/s |
Низкий (Low Level) |
|
352x288 4 Mbit/s |
|
352x288 4 Mbit/s |
|
|
Эта таблица нужна в первую очередь для понимания часто встречающихся
обозначений формата конкретной записи или описаний возможности
какого-либо кодера. Например, вот так может характеризоваться
запись в формате MPEG:
Название |
Обозначение |
Что есть что |
Standard |
PAL |
Система телевидения 1) |
Resolution |
720*576 |
Разрешение изображения |
Profile and level |
MP@ML |
Main Profile и Main Level |
Frame rate |
25 |
Частота кадров |
Bitrate |
around 5 Mbit avg |
Средняя скорость потока 5 Mbit |
GOP structure |
IBBPBBPBBPBB |
Структура GOP |
1) На самом деле здесь правильнее было бы
написать: PAL - название аналогового стандарта телевидения,
в котором был создан исходный видеофильм. Собственно MPEG
фильм нельзя отнести к какой-либо системе цветного телевидения,
так как кадры в MPEG являются просто цифровым представлением
ранее аналогового изображения и не имеют никакого отношения
даже к исходной для оригинала фильма системе телевидения.
Для видеолюбителя определяющую роль играют всего несколько
наиболее важных параметров настройки MPEG-кодера (компрессора).
Это:
- Bit Rate (Скорость потока)
- измеряется в мегабитах (обратите внимание, в мегабитах,
а не в мегабайтах) в секунду. Чем выше Bit Rate,
тем выше качество изображения, но тем больше места занимает
созданный кодером MPEG файл;
- Constant Bit Rate (Постоянная
скорость потока) - параметр кодирования, указывающий
на то, что скорость потока не должна зависеть от кодируемого
изображения и быть постоянной величиной. Установка постоянной
скорости позволяет точно определить размер итогового файла
фильма, но не оказывает влияния на качество изображения
только в случае одной и той же динамики фильма на всем его
протяжении. Например, в течение фильма непрерывно показываются
автомобильные гонки или медленно и плавно картины в музее;
- Variable Bit Rate (Переменная
скорость потока) - параметр кодирования, указывающий
на то, что скорость потока должна зависеть от динамики изображения
- расти на динамичных сценах и уменьшаться на статичных.
Variable Bit Rate применяется
сейчас наиболее широко, так как позволяет в подавляющем
большинстве случаев добиться лучшего качества видео по сравнению
с Constant Bit Rate при том же
размере файла результата;
- Average Bit Rate (Средняя
скорость потока) - параметр, совпадающий по значению
с Constant Bit Rate при постоянной
скорости потока и оговаривающий среднюю скорость потока
с Variable Bit Rate.
Используя MPEG или планируя его
использовать, следует помнить, что MPEG
ориентирован на хранение и передачу видеоданных, но не на
их обработку. Редактировать, т.е. каким-либо образом изменять
видео в любом из форматов MPEG крайне
неудобно и приводит в подавляющем большинстве случаев к потере
качества исходного видеоматериала, не говоря уже о больших
по сравнению с любыми другими форматами временных затратах
компьютера на редактирование. Атор оригинала Igon Материал взят с
|