sdi сигнал что это такое
Интерфейсы SDI/HD-SDI: проблемы, характеристики, структура
Зачем нужны цифровые форматы телевидения?
Как известно, изначально телевидение, как и все прочее, было аналоговым и в основном остается таковым до сих пор. Только сейчас начинается активный переход к цифровому ТВ, практически совпадающий по времени с принятием стандартов и внедрением телевидения высокой четкости.
Цифровые форматы ТВ очень перспективны по многим причинам:
Однако неоспоримые преимущества цифровой обработки ощутимо теряют свою привлекательность из-за того, что существует необходимость многократной транспортировки сигнала из студии в студию, с одного аппаратного комплекса или компьютера на другой. При этом многочисленные преобразования из аналоговой в цифровую форму и наоборот не менее губительны, чем сложные операции обработки и передача на большие расстояния аналогового сигнала.
Уже давно появились средства цифровой видеозаписи, позволяющие исключить критическую стадию аналого-цифрового преобразования. Весьма логично было бы вслед за этим избавиться и от всех промежуточных преобразований, оставив лишь одно – из цифры в аналог – в самом конце тракта, непосредственно перед передачей в эфир. Аналоговое телевещание пока что превалирует с большим перевесом, хотя постепенный переход на цифровое уже начинается, что позволит наконец полностью избавиться от лишних ЦАП’ови АЦП. Причем не только в студиях и на телецентрах, но и во многих случаях на приемной стороне: ведь такие распространенные на сегодня дисплеи, как плазменные панели и DLP-проекторы, являются цифровыми по своей сути. Несомненно, что и светодиодные дисплеи, которые в будущем наверняка вытеснят плазменные, жидкокристаллические и тем более кинескопные телевизоры, также будут цифровыми. Стопроцентная реализация потенциала цифрового дисплея возможно только при наличии полностью цифрового тракта.
… и конкретно SDI?
Итак, первоочередной целью, поставленной перед студиями, была организация распределительных кабельных сетей для передачи цифрового видео вещательного уровня качества без потерь. Естественно, физическая замена среды распространения – кабельных сетей – была бы связана с высокими капиталовложениями. Поэтому стояла задача адаптировать цифровые потоки под уже имеющиеся коммуникации коаксиального кабеля, которые долгие годы служили для передачи аналогового сигнала. При этом достаточно было частично заменить, а частично дополнить состав аппаратных комплексов, не вмешиваясь в конструктив зданий и помещений (перепрокладка кабелей – это по сути капремонт, а значит, не только деньги, но и время).
Однако просто оцифровать компонентный сигнал, с которым имеют дело в профессиональной сфере, недостаточно. К тому же, поскольку в эфир передается полный телевизионный сигнал, представляющий собой композитный видеосигнал плюс звук в форме частотно-модулированной поднесущей, значительная часть студийных магистралей имела не трех-, а однолинейную структуру. Значит, необходимо было разработать специальный цифровой формат видео, которым и стал SDI – Series Digital Interface, или последовательный цифровой интерфейс, требующий всего одного коаксиального кабеля для передачи трех сигналов – яркости и двух цветоразностных компонент. И обеспечивающий доставку видео без потерь на расстояния, типичные для студий и телецентров.
Какие проблемы стояли на пути создания формата SDI?
Основная проблема – большие массивы данных и соответственно скорости их передачи, неизбежно возникающие при оцифровке и без того достаточно высокочастотного видеосигнала. Спектр цифрового видео имеет очень большую протяженность в области высоких частот: это сотни мегагерц. Широкая полоса тракта необходима не только для обеспечения нужной скорости передачи, но и для сохранения по возможности изначально прямоугольной формы импульсов. При вырождении ее в синусоиду постепенно накапливается джиттер (дрожание фаз фронтов), возрастает количество ошибок, сигнал теряет помехоустойчивость, одно из главных преимуществ цифрового представления сигнала. Джиттер может наблюдаться в широкой полосе частот. Различают низкочастотный джиттер, или НЧ дрейф (drift, wander) ниже 10 Гц, который почти не влияет на качество сигнала (медленное изменение тактовой частоты) и высокочастотный, приводящий к деградации сигнала. Допустимое значение ВЧ-джитера составляет 0,2 х T: 740 пс для 270 Мбит/с (стандартное телевидение), 135 пс для 1,485 Гбит/с (ТВ высокой четкости), где T – длительность тактового импульса.
Рис. 1. Джиттер
На приемной части от джиттера полностью избавляются путем восстановления тактовой частоты данных (перетактирования, reclocking). Однако существуют пределы степени деградации формы сигнала, при превышении которых полное восстановление становится невозможным.
Коаксиальный кабель – практически идеальная среда распространения высокочастотных сигналов (при условии согласованности линии передачи по входам и выходам с компонентами тракта), однако и она накладывает определенные ограничения по частоте, и тем боле жесткие, чем длиннее линия передач. Это касается не только аналоговых, но и цифровых сигналов.
Значит, нужно либо довольствоваться малыми расстояниями, что не всегда возможно, либо сжимать цифровой поток. Алгоритмы эффективного сжатия, основанные на отбрасывании информации малой степени заметности, существуют и широко применяются, и все они предполагают сжатие с потерями: MPEG-2, MPEG-4, DV (Motion JPEG) и пр. Надо сказать, что сжатие (например, MPEG-2 для DVB) используется для вещания в эфир, при этом субъективное восприятие качества картинки при однократной декомпрессии сжатого сигнала на приемной стороне остается достаточно высоким, а в стандартный частотный диапазон одного аналогового канала удается уложить до 3-6 цифровых каналов. Незаменимо оно и для уплотнения информации на внешних носителях (DVD, цифровая магнитная запись, винчестер). Помимо собственно изображения, сжатые форматы позволяют записывать и передавать многоканальный звук, различные дополнительные материалы и пр. Но при многократных циклах сжатия и распаковки сигнала происходит необратимая потеря качества с накоплением характерных артефактов изображения. Поэтому в пределах студии передача сигнала должна осуществляться без сжатия или с неглубоким сжатием без потерь.
Итак, формат SDI позволил решить задачу передачи цифровых видеоданных внутри студий как без цифро-аналоговых и аналого-цифровых преобразований, так и без многократных сжатий и распаковок, максимально сохранив при этом преемственность коммуникаций (как коаксиальных, так и оптоволоконных) и аппаратных комплексов. Многие компоненты, такие, как обычные и матричные коммутаторы, усилители-распределители и пр., применявшиеся в аналоговом ТВ, при условии определенного запаса по полосе частот с успехом работают с сигналами SDI.
Характеристики формата SDI
Формат SDI соответствует Рекомендациям МСЭ-Р ВТ.656 и стандарту SMPTE-259M (Society of Motion Picture and Television Engineers – Общество инженеров в области техники кино и телевидения). Помимо стандартного телевидения, он применим также для телевидения высокой четкости (версия HD-SDI SMPTE-292M). Передача сигнала осуществляется согласно Рекомендации МСЭ-Р ВТ.601 (а также дополнению «В» для формата 16:9). Среда распространения – единичный коаксиальный кабель 75 Ом с терминалами BNC. Либо оптоволоконная линия передач (одномодовое волокно, длина волны 1310±40 нм) с лазерными передатчиком и приемником (Рекомендация МСЭ-Р BT.1367). Оптоволоконная линия терминируется разъемами ST.
Рис. 2. Физический интерфейс SDI: коаксиальный кабель, разъем BNC,
оптический разъем, лазерный передатчик
Затухание в линии не должно превышать 30 дБ/100 м на частоте 100 МГц (для стандартного телевидения) и 20 дБ/100м на частоте 750 МГц для ТВЧ. Соответственно примерные расстояния для передачи без ошибок составляют 280 м (СТВ) и 50 м (ТВЧ). С целью увеличения расстояний транспортировки, как и в случае с аналоговым видео, применяются повторители. Наилучшие результаты дают приборы с коррекцией амплитудной характеристики (подъем высоких частот), позволяющие в значительной степени восстановить форму импульсов. Еще лучше, если одновременно с восстановлением формы производится перетактирование сигнала.
Оптоволокно же дает возможность передавать данные без потерь более чем на 50 км.
Рис. 3. Число ошибок в сигнале SDI в зависимости от длины кабеля
(кабель Belden 8281)
Передача является односторонней, без квитирования (подтверждения о получении данных приемной стороной).
Передача каждой из трех компонент видео – Y, Cb, Cr – осуществляется последовательно в виде двоичных кодов. Вещательным стандартом является модель 4:2:2, предполагающая, что на цветоразностные компоненты приходится вдвое меньше отсчетов, чем на яркостную, и соответственно вдвое ниже разрешение по цветам по сравнению с яркостью. Фактически «4:2:2» означает, что из каждой четверки соседних пикселей в строке яркость кодируется для каждого, а цветоразностные компоненты – через один (первая двойка). Кроме этого, точно так же обстоят дела с соответствующими пикселями следующей строки (вторая двойка). Формула 4:4:4 означает равнозначность кодировки для все пикселей и строк (и по яркости, и по цветоразностным компонентам). А формула 4:2:0 означает, что информация о цвете передается не в каждой строке, а через строку.
Модель 4:2:2 хорошо согласуется с особенностями восприятия зрительного аппарата и применяется для того чтобы снизить объем данных. Однако существует возможность работы и с моделью 4:4:4, хотя и при меньших расстояниях передачи (физически реализуемая, хотя и выходит за рамки стандарта SDI). Это необходимо на стадии обработки по цвету, когда для корректного пересчета цифровых последовательностей требуется повышенное разрешение во избежание набега ошибки. Предусмотрена также передача оцифрованного в формате SDI композитного видеосигнала (модель 4:0:0), хотя на практике она применения не находит.
Данные кодируются с частотой выборки 13,5 МГц (яркость) или 6,75 МГц (цветоразностные компоненты). Разрешение составляет 10 бит для каждой компоненты (ранее применялось 8-битное кодирование, ныне устаревшее).
Передача сигнала стандартного телевидения происходит со скоростью потока 270 Мбит/с, для чего достаточно полосы канала в 250 МГц. В соответствии со спецификацией LVDS (Low Voltage Differential Signaling, или дифференциальная передача низкоуровневых сигналов) биты кодируются не напряжением, а перепадами уровней напряжения (размах его составляет 800±80 мВ). Это обеспечивает высокую помехозащищенность (по аналогии частотная модуляция аналогового сигнала меньше подвержена воздействию помех по сравнению с амплитудной). Поскольку важны не сами уровни, а только перепады, полярность сигнала значения не имеет, и поэтому в тракте с одинаковым успехом могут применяться как неинвертирующие, так и инвертирующие усилительные элементы.
Исходный цифровой поток скремблируется («перемешивается), на приемной же стороне производится его восстановление (дескремблирование). Эта операция применяется для более равномерного распределения энергии сигнала по всему его спектру, который приближается в результате к шумовому и создает меньше вредных наводок на соседние коммуникации.
Помимо собственно видео, в формате SDI возможна передача звука (стандартные 4 канала или больше) и временного кода.
Структура сигнала SDI
Для стандартного телевидения различают форматы SDI, соответствующие стандартам NTSC (60 полей/с, 525 строк в кадре) и PAL/SECAM (50/625).
Каждая строка в начале и конце имеет специальные маркеры, или метки SAV (Start of Active Video) и EAV (End of Active Video). Между метками SAV и EAV передаются собственно видеоданные (720 отсчетов сигнала яркости Y и по 360 отсчетов цветоразностных каналов Cr, Cb). Между окончанием предыдущей (EAV) и началом следующей строки (SAV) могут передаваться дополнительные данные, сюда же вставляются отсчеты каналов звукового сопровождения.
Рис. 4. Структура сигнала SDI
Рис. 5. Структура кадра SDI
Для ТВЧ структура сигнала SDI (в данном случае – HD SDI) остается прежней, изменяются только количество отсчетов в каждой строке и число строк в кадрах. Согласно стандарту SMPTE-292M передача ТВЧ осуществляется на скорости 1,485 Гбит/с при частоте кадров 24, 25, 30 Гц (прогрессивная развертка) или 50, 60 Гц (чересстрочная развертка). Существуют также версии формата HD SDI с частотами кадровой развертки 59,94, 29,97 и 23,976 Гц и скоростью потока 1,4835 Гбит/с, обеспечивающие совместимость различными вариантами NTSC.
Получение сигнала SDI
Если SDI получается из аналоговых композитного сигнала или S-Video, сначала эти сигналы декодируются и раскладываются на составляющие: яркость Y, а также цветоразностные сигналы U (или Cr) и V (или Cb). Уровни этих сигналов определяются следующими соотношениями:
Y = 0,299R+0,578G+0,114B; U = R-Y; V = B-Y, R – красный, G – зеленый, B – синий.
Затем каждая компонента оцифровывается и подается на кодер, в котором данные собираются в последовательности, соответствующей структуре SDI. Звук включается в структуру SDI (в промежутках между метками EAV и SAV) с помощью специальных устройств – эмбеддеров, на приемной же стороны он вновь извлекается из сигнала с помощью деэмбеддеров. Звуковое сопровождение может подаваться на вход эмбеддера в цифровом виде (по интерфейсу S/PDIF) либо в аналоговом.
Стандарт SMPTE-272M предусматривает возможность внедрения до 16 каналов цифрового звука с различными частотами дискретизации, разрядностями и способами синхронизации (всего 10 вариантов).
В SDI возможно ввести и другие данные, например телетекст. Это не предусмотрено стандартом, но физически реализуемо и часто применяется на практике.
Формат SDTI
Часто возникает потребность передачи сжатого оцифрованного видеосигнала. Для этого вполне можно использовать SDI, но снова возникает проблема лишних преобразований: декомпрессии (перед передачей) и повторного сжатия. Поэтому на базе SDI был создан специальный формат передачи сжатых данных – SDTI (Serial Digital Transport Interface), стандарт SMPTE-305M. Синоним SDTI – QSDI, принятый у разработчиков аппаратуры DVCAM. SDTI обеспечивает передачу сигнала быстрее, чем в реальном времени – несжатый сигнал передается со скоростью до 360 Мбит/с, а сжатый до 200 Мбит/ с, то есть в 4 раза быстрее, чем сжатый компонентный 4:2:2 (50 Мбит/с). Передача происходит быстрее реального времени. Стандарт предусматривает 8 каналов аудио, тайм-код и пр. В качестве среды распространения используется такой же коаксиальный кабель, как и в SDI, а также оптоволоконные линии. Первая версия формата – SDT – сочетала в себе основные особенности интерфейсов DVCAM и Betacam SX (Sony) и DVCPRO (Panasonic). SDTI обладает односторонней совместимостью с SDI (компоненты стандарта SMPTE-305M корректно работают с SMPTE-259M), что обеспечивает преемственность оборудования и дает возможность плавного перехода с одного формата на другой без глобальной замены.
Структура сигнала SDTI в целом та же, что и у SDI, но данные в области активного видео пакетируются. Между метками EAV и SAV (т.е. в служебной области) в каждой строке присутствуют специальные коды, оповещающие приемную сторону о том, что данная строка содержит информацию в формате SDTI.
SDI: последовательный цифровой интерфейс
Последовательный цифровой интерфейс SDI (serial digital interface) – это семейство цифровых видеоинтерфейсов, которые были первыми стандартизированы SMPTE (Обществом инженеров кино и телевидения) в 1989 году. Например, ITU-R BT.656 и SMPTE 259M определяют цифровые видеоинтерфейсы, используемые в телевизионном вещании. Соответствующий стандарт, известный как последовательный интерфейсы высокой четкости (HD-SDI), описан в стандарте SMPTE 292M; он обеспечивает номинальную скорость передачи данных в 1,485 Гбит/с.
Дополнительные стандарты SDI были введены для поддержки увеличивающихся разрешений видео (HD, UHD и более), частоты кадров, стереоскопического (3D) видео и глубины цвета. Двойной канал HD-SDI состоит из пары каналов SMPTE 292M и описан в стандарте SMPTE 372M в 1998 году; он обеспечивает номинальную скорость 2,970 Гбит/с и используется в приложениях (таких как цифровой кинотеатр или HDTV 1080P), которые требуют большей точности и разрешения, чем может обеспечить стандартное HDTV. 3G-SDI (описан в SMPTE 424M) состоит из одного последовательного канала 2,970 Гбит/с, который позволяет заменить собой двойной канал HD-SDI. 19 марта 2015 года были опубликованы стандарты 6G-SDI и 12G-SDI.
Эти стандарты используются для передачи несжатых, незашифрованных цифровых видеосигналов (опционально включающих в себя встроенный звук и временной код) между телевизионным оборудованием; они могут также использоваться для передачи пакетированных данных. Длина коаксиальных вариантов стандартов, как правило, не превышает 300 метров. Оптоволоконные варианты спецификации, такие как 297M, допускают передачу на дальние расстояния, ограниченные только максимальной длиной оптоволокна и повторителями. SDI и HD-SDI обычно доступны только в профессиональном видеооборудовании, поскольку различные лицензионные соглашения ограничивают использование незашифрованных цифровых интерфейсов, таких как SDI, что запрещает их использование в потребительском оборудовании. Несколько профессиональных видеокамер стандартного и высокого разрешения и все доступные потребительские камеры, работающие с несжатым видео, используют интерфейс HDMI.
Электрический интерфейс
Во всех стандартах интерфейса SDI используются (один или более) коаксиальные кабели с волновым сопротивлением 75 Ом и разъемами BNC. Это тот же тип кабеля, который использовался в оборудовании аналогового видео, что потенциально упрощает модернизацию (хотя при более высоких битрейтах и больших длинах могут потребоваться кабели более высокого качества). Амплитуда сигнала на выходе источника составляет 800 мВ (±10%) пик-пик; из-за затухания в кабеле на приемной стороне может быть измерено намного меньшее напряжение. Использование эквализации в приемнике делает возможной передачу по SDI 270 Мбит/с на расстояние свыше 300 метров без использования повторителей, но всё же предпочтительны более короткие кабели. Для скоростей для передачи видео в HD разрешении длина кабеля обычно ограничивается 100 метрами.
Последовательный цифровой интерфейс SDI использует разъемы BNC
Через SDI передаются несжатые сигналы цифровых компонентов. Данные кодируются в формате NRZI, а сдвиговый регистр линейной обратной связи используется для скремблирования данных, чтобы уменьшить вероятность того, что в передаваемой последовательности будут присутствовать длинные строки нулей или единиц. Данный интерфейс является самосинхронизирующимся и самотактирующимся. Кадрирование выполняется путем обнаружения специального шаблона синхронизации, который появляется в (нескремблированном) последовательном цифровом сигнале в виде последовательности из десяти единиц, следующих после двадцати нулей (в HD двадцать единиц следуют после сорока нулей); нигде в пределах полезных данных не допускается появление этого битового шаблона.
Стандарты
Стандарт | Название | Когда введен | Битрейты | Примеры форматов видео |
---|---|---|---|---|
SMPTE 259M | SD-SDI | 1989 | 270 Мбит/с, 360 Мбит/с, 143 Мбит/с и 177 Мбит/с | 480i, 576i |
SMPTE 344M | ED-SDI | 540 Мбит/с | 480p, 576p | |
SMPTE 292M | HD-SDI | 1998 | 1,485 Гбит/с и 1,485/1,001 Гбит/с | 720p, 1080i |
SMPTE 372M | Dual Link (двухканальный) HD-SDI | 2002 | 2,970 Гбит/с и 2,970/1,001 Гбит/с | 1080p60 |
SMPTE 424M | 3G-SDI | 2006 | 2,970 Гбит/с и 2,970/1,001 Гбит/с | 1080p60 |
SMPTE ST-2081 | 6G-SDI | 2015 | 6 Гбит/с | 2160p30 |
SMPTE ST-2082 | 12G-SDI | 2015 | 12 Гбит/с | 2160p60 |
SMPTE ST-2083* | 24G-SDI | 24 Гбит/с | 2160p120 |
* Рабочая группа 32NF-70 в процессе работы над стандартом ST-2083 для передачи по SDI данных со скоростью 24 Гбит/с.
Скорости передачи данных
Для передачи последовательного цифрового видеосигнала используется несколько скоростей передачи данных:
Другие интерфейсы
SMPTE 297-2006 описывает оптоволоконную систему для передачи последовательных (побитово) цифровых сигналов. Он предназначен для передачи сигналов SMPTE ST 259 (от 143 до 360 Мбит/с), сигналов SMPTE ST 344 (540 Мбит/с), сигналов SMPTE ST 292-1/-2 (1,485 Гбит/с и 1,485/1,001 Гбит/с) и сигналов SMPTE ST 424 (2,970 Гбит/с и 2,970/1,001 Гбит/с). В дополнение к спецификации оптических систем, ST 297 также определяет проведение испытаний безопасности лазера и маркировку всех оптических интерфейсов, указывающую на соответствие безопасности, применение и функциональную совместимость.
Формат данных
В приложениях SD и ED формат последовательных данных имеет ширину 10 бит, тогда как в приложениях HD ширина равна 20 бит, разделенных на два параллельных 10-битовых потока данных (известных как Y и C). SD поток данных устроен следующим образом:
Cb Y Cr Y’ Cb Y Cr Y’
в то время как HD потоки данных устроены так:
Y Y Y’ Y Y’ Y Y’ Y Y’ C Cb Cr Cb Cr Cb Cr Cb Cr
Для всех интерфейсов SDI (за исключением устаревших композитных кодировок) основной кодировкой цвета является YCbCr формат 4:2:2. Канал яркости (Y) кодируется в полной полосе частот (13,5 МГц в 270 Мбит/с SD,
75 МГц в HD), выборка двух каналов цветности (Cb и Cr) по горизонтали уменьшается, и они кодируются в уменьшенной вдвое полосе частот (6,75 или 37,5 МГц). Отсчеты Y, Cr и Cb совмещаются (выбираются в один и тот же момент времени), а отсчет Y’ получается в промежутке и находится по времени посередине между двумя соседними Y отсчетами.
Вышеприведенное описание отсчетов яркости Y относится и к отсчетам цветности C. Обозначения Cr и Cb далее относятся к «цветоразностным» сигналам красного и синего. В этой статье рассматривается только основная цветовая кодировка SDI, но возможны и другие цветовые кодировки при рассмотрении интерфейса в качестве общего 10-битного канала данных. Использование других цветовых кодировок, а также преобразование цветового пространства в и из цветового пространства RGB описано ниже.
Полезная нагрузка видео (а также полезная нагрузка вспомогательных данных) может использовать любое 10-битовое слово в диапазоне от 4 до 1019 (от 00416 до 3FB16) включительно; значения 0–3 и 1020–1023 (3FC16–3FF16) зарезервированы и не могут появляться где-либо в полезной нагрузке. Эти зарезервированные слова предназначены для двух целей; они используются как для пакетов синхронизации, так и для заголовков вспомогательных данных.
Пакеты синхронизации
Пакет синхронизации (известный как опорный временной сигнал или TRS (timing reference signal)) появляется непосредственно перед первым активным отсчетом в каждой строке и сразу после последнего активного отсчета (и перед началом области гашения по горизонтали (перед началом строчного гасящего импульса)). Пакет синхронизации состоит из четырех 10-битовых слов, первые три слова всегда одинаковы – 0x3FF, 0, 0; четвертое слово состоит из 3 битов флагов вместе с кодом исправления ошибок. В результате существует 8 различных вариантов пакетов синхронизации.
В HD-SDI и двухканальных интерфейсах пакеты синхронизации должны появляться одновременно в обоих потоках данных: и в Y, и в C (некоторая задержка между двумя кабелями в двухканальном интерфейсе допустима; оборудование, поддерживающее двойной канал, дожно буферизовать ведущий канал, чтобы позволить другому каналу догнать первый). В SD-SDI и расширенной версии интерфейса есть только один поток данных, и, следовательно, в один момент времени приходит только один пакет синхронизации. Формат пакетов синхронизации одинаков во всех версиях последовательного интерфейса SDI.
Биты флагов в четвертом слове (обычно называемом XYZ словом) называются H, F и V. Бит H указывает на начало строчного гасящего импульса; и биты синхронизации, идущие непосредственно перед областью гашения по горизонтали, должны иметь бит H, установленный в единицу. Такие пакеты обычно называются пакетами EAV (End of Active Video, конец активного видео). Аналогично, в пакете, появляющемся непосредственно перед началом активного видео, бит H установлен в 0; это SAV (Start of Active Video, старт активного видео) пакет.
Аналогично, бит V используется для указания начала области гашения по вертикали (кадрового гасящего импульса); EAV пакет с V=1 указывает, что следующая строка (строки считаются со старта EAV) является частью вертикального интервала гашения, а EAV пакет с V=0 указывает, что следующая строка является часть активного изображения.
Бит F используется в чересстрочном и в кадрово сегментированном форматах, чтобы указать, относится ли строка к первому или второму полю (или сегменту). В форматах прогрессивной развертки бит F всегда устанавливается в 0.
Счетчик строк и CRC
В последовательном интерфейсе SDI высокой четкости (и в двухканальном HD) предусмотрены дополнительные контрольные слов для повышения надежности интерфейса. В этих форматах четыре отсчета, непосредственно следующие за пакетами EAV (но не после SAV пакетов), содержат проверочное поле циклического избыточного кода и индикатор счетчика строк. Поле CRC предоставляет CRC для предыдущей строки (CRC вычисляются независимо для потоков Y и C) и может быть использовано для обнаружения битовых ошибок в интерфейсе. Поле счетчика строк показывает номер текущей строки.
В интерфейсах SD и HD не предусмотрены поля CRC и счетчика строк. Вместо этого, для CRC проверки данных может использоваться специальный дополнительный пакет данных, известный как EDH пакет.
Нумерация строк и отсчетов
Каждому отсчету в полученном потоке данных назначается нуникальные номера строки и отсчета. Во всех форматах первому отсчету, следующему за SAV пакетом, назначается номер отсчета 0; следующий отсчет – это отсчет 1; и так далее до XYZ слова в следующем SAV пакете. В интерфейсах SD, где есть только один поток данных, нулевой отсчет – это Cb отсчет; первый отсчет – это Y отсчет; второй отсчет – это Cr отсчет, а третий отсчет – это Y’ отсчет; далее шаблон повторяется. В интерфейсах HD каждый поток данных обладает собственной нумерацией отсчетов, поэтому нулевой отсчет Y потока – это Y отсчет; следующий отсчет – это Y’ отсчет, и так далее. Аналогично, нулевой отсчет в C потоке – это Cb, затем идет Cr, затем снова Cb.
Строки нумеруются последовательно, начиная с 1, вплоть до количества строк в кадре заданного формата (обычно 525, 625, 750 или 1125 (Sony HDVS)). Определение строки 1 несколько условно; тем не менее, она однозначно определяется соответствующими стандартами. В 525-строчных системах первая строка области гашения по вертикали (кадрового гасящего импульса) является строкой 1; тогда как в других чересстрочных системах (625 и 1125 строк) строка 1 – это первая строка после перехода бита F в ноль.
Обратите внимание, что строки считаются начальными в EAV, тогда как нулевой отсчет – это отсчет после SAV. Это приводит к некоторой путанице: первый отсчет в полученной строке в видео 1080i – это отсчет номер 1920 (первый EAV отсчет в этом формате), а конец строки – это следующий отсчет 1919 (последний активный отсчет в этом формате). Обратите внимание, что это поведение несколько отличается от аналоговых видеоинтерфейсов, где переход между строками считается выполненным на синхроимпульсе, который появляется примерно в середине строчного гасящего импульса (области гашения по горизонтали).
Нумерация каналов
Нумерация каналов касается только многоканальных интерфейсов. Первому (основному) каналу присваивается номер 1, последующим каналам назначаются номера, увеличиваемые на единицу; поэтому второй (вспомогательный) канал в двухканальной системе – это канал 2. Номер канала в заданном интерфейсе указывается в пакете VPID, расположенном в вертикальном пространстве дополнительных данных.
Обратите внимание, что уровень данных в двойном канале сконструирован таким образом, что основной канал может быть передан в одноканальный интерфейс и при этом создавать пригодное (хотя и несколько ухудшенное) видео. Вспомогательный канал обычно содержит такие данные, как дополнительные младшие разряды (в 12-битных форматах), несопоставленные отсчеты в сэмплированном видео 4:4:4 (поэтому основной канал всё еще содержит действительный 4:2:2), альфа-канал или каналы данных. Если вспомогательный канал в конфигурации 1080p с двойным каналом отсутствует, первый канал всё еще будет содержать действительный сигнал 1080i.
В случае с видео 1080860, 59,94 или 50 Гц в двойном канале, каждый канал содержит действительный сигнал 1080i с той же частотой полей. Первый канал содержит 1-ю, 3-ю и 5-ю строки нечетных полей и 2-ю, 4-ю, 6-ю и т.д. строки четных полей; а второй канал содержит четные строки нечетных полей и нечетные строки четных полей. Когда два канала объединяются, результатом является изображение с прогрессивной разверткой с более высокой частотой кадров.
Вспомогательные данные
Как и SMPTE 259M, SMPTE 292M поддерживает стандарт SMPTE 291M для вспомогательных данных. Вспомогательные данные предоставляются как стандартизированный транспорт для полезной нагрузки, не содержащей видео, в последовательном цифровом сигнале; они используются для вложенного звука, скрытых субтитров, временного кода и других видов метаданных. Вспомогательные данные обозначаются пакетом из трех слов, состоящим из 0, 3FF, 3FF (противоположно заголовку пакета синхронизации), за которым следует идентификационный код из двух слов, слово счетчика данных (указывающее на размер полезной нагрузки, равный 0–255 слов), реальная полезная нагрузка и одно слово контрольной суммы. Коды, запрещенные в полезной нагрузке видео, так же запрещены и в полезной нагрузке вспомогательных данных.
Конкретные применения вспомогательных данных включают в себя вложенный звук, EDH, VPID и SDTI.
В двухканальных приложениях вспомогательные данные чаще всего встречаются в основном канале; вспомогательный канал должен использоваться для вспомогательных данных только в том случае, если в основном канале нет места. Единственным исключением из этого правила является пакет VPID; действующий пакет VPID должны содержать оба канала.
Вложенный звук
Оба последовательных интерфейса и HD, и SD обеспечивают 16 каналов вложенного звука. Эти два интерфейса используют различные методы инкапсуляции аудио: SD использует стандарт SMPTE 272M, тогда как HD использует стандарт SMPTE 299M. В любом случае сигнал SDI может содержать вместе с видео до 16 вложенных аудиоканалов (8 пар) с аудио 48 кГц, 24 бит. Обычно аудио идет в формате PCM 48 кГЦ, 24 бит (20 бит в SD может быть расширено до 24 бит), что непосредственно совместимо с цифровым аудиоинтерфейсом AES3. Они помещаются в (горизонтальные, строчные) интервалы гашения, когда SDI сигнал не несет ничего полезного, поскольку приемник генерирует собственные сигналы гашения из TRS сигнала.
В двухканальных приложениях доступны 32 канала звука, так как каждая линия связи может содержать до 16 аудиоканалов.
SMPTE ST 299-2:2010 расширяет интерфейс 3G SDI, чтобы иметь возможность передавать 32 аудиоканала (16 пар) по одной линии связи.
Поскольку интерфейс стандартной разрешения не несет контрольной суммы CRC и другой проверки целостности данных, пакет EDH (Error Detection and Handling, обнаружение и обработка ошибок) может быть опционально помещен в вертикальный интервал видеосигнала. Этот пакет включает в себя значения CRC как для активного изображения, так и для всего поля (исключая те строки, в которых может происходить переключение, и которые не должны содержать полезных данных); оборудование может вычислить свои собственные значения CRC и сравнить их с принятыми CRC, чтобы обнаружить возможные ошибки.
EDH обычно используется только с интерфейсом стандартной четкости; наличие слов CRC в HD интерфейсе делает EDH пакеты ненужными.
Для описания видеоформата всё чаще используются пакеты VPID (Video Payload Identifier, идентификатор полезной нагрузки видео). В ранних версиях последовательного интерфейса SDI всегда можно было однозначно определить видеоформат, подсчитав количество строк и отсчетов между H и V переходами в TRS сигнале. С введением двухканальных интерфейсов и стандартов с сегментированными кадрами это становится невозможным; таким образом, стандарт VPID (определен в SMPTE 352M) обеспечивает способ однозначного определения формата полезной нагрузки видео.
Полезная нагрузка и гашение видео
Активная часть видеосигнала определяется как те отсчеты, которые следуют за SAV пакетом и предшествуют следующему EAV пакету; где соответстующие EAV и SAV пакеты имеют бит V, установленный в ноль. В активной части хранится информация о текущем изображении.
Кодирование цвета
В последовательном интерфейсе SDI возможно несколько цветовых кодировок. По умолчанию (и это наиболее распространенный случай) – это 10-битные линейно дискретизированные видеоданные, закодированные как 4:2:2 YCbCr (YCbCr – это цифровое представление цветового пространства YPbPr). Отсчеты видео сохраняются, как описано выше. Слова данных соответствуют уровням сигналов соответствующих видеокомпонентов, а именно:
Обратите внимание, что масштабирование каналов яркости и цветности не одинаково. Минимумы и максимумы этих диапазонов представляют собой предпочтительные значения пределов сигнала, хотя полезная нагрузка видео может выходить за пределы этих диапазонов (при условии, что в полезной нагрузке видео никогда не используются зарезервированные значения 0–3 и 1020–1023). Кроме того, соответствующий аналоговый сигнал также может выходить за границы этого диапазона.
Колориметрия
Поскольку и YPbPr, и YCbCr получены из цветового пространства RGB, требуется преобразование. В цифровом видео обычно используются три колориметрии:
Другие кодировки цвета
Двухканальные и 3 Гбит/с интерфейсы в дополнение к 4:2:2 YCbCr поддерживают другие кодирования цвета, а именно:
Области гашения по горизонтали и по вертикали
Для участков областей гашения по вертикали и по горизонтали, которые не используются для вспомогательных данных, рекомендуется присваивать отсчетам яркости кодовое слово 64 (40 hex), а отсчетам цветности – кодовое слово 512 (200 hex); оба этих значения соответствуют уровню 0 мВ. Допускается кодирование аналоговых данных в вертикальном интервале гашения (таких как временной код или тестовые сигналы) без прерывания интерфейса, но такое использование является нестандартным (для передачи метаданных предпочтительным средством являются вспомогательные данные). Однако преобразование сигналов аналоговой синхронизации и пакетной передачи в цифровой вид не рекомендуется; и в этом нет необходимости при использовании цифрового интерфейса.
У разных форматов изображений разные требования к цифровому гашению, например, все так называемые 1080-строчные HD форматы имеют 1080 активных строк, а общее количество строк составляет 1125, из которых оставшиеся входят в область гашения.
Поддерживаемые видеофоматы
Различные версии последовательного цифрового интерфейса SDI поддерживают множество видеоформатов.