opus или m4a что лучше

Фавориты сжатия с потерями: кто же лучше на битрейте 192 кбит/с?

Это наверное самый логичный шаг после обкатывания и отладки новой методики тестирования: взять кодеки с потерями, которые все считают одними из лучших, и посмотреть, кто кого? В сегодняшнее тестирование попали:

Могу сказать, что ради интереса я поверхностно прогнал старичков faac и nero для кодирования в AAC LC. Можно сказать, faac сдался сразу же, на частотах выше 6 кГц он вёл себя на порядок хуже конкурентов. А вот nero удивил, сухие цифры говорят, что он и по сей день прекрасен на частотах до 9500 Гц и даже вполне в паритете с современным Opus! Но, начиная с 13 кГц nero полностью проваливается и сдаёт все позиции конкурентам. Эти два кодека я всё же решил убрать из результатов тестирования. Вероятно, я сделаю обзор на них позже.

В будущем я также думаю сделать обзор, насколько в действительности модификация aoTuV улучшает качество оригинального кодека Ogg Vorbis.

Но давайте продолжим, кто же из 4 перечисленных претендентов на лучший кодек сможет отстоять своё звание?

Параметры исследования

Командные строки запуска кодеков:

Apple AAC LC afconvert

Ogg Vorbis libvorbis 1.3.6 aoTuV b6.03

Opus 1.3.1

LAME 3.100

Битрейты были подобраны так, чтобы размеры итоговых файлов были примерно одинаковыми: в диапазоне от 11.4 до 11.8 МБ. Оригинал был сжат более чем в 7 раз.

Результаты

Давайте начнём с самого интересного, анализа вносимых искажений. Не могу сказать, что нам открывается что-то поразительное, но, тем не менее, картина весьма занятная.

Искажения

opus или m4a что лучше. Смотреть фото opus или m4a что лучше. Смотреть картинку opus или m4a что лучше. Картинка про opus или m4a что лучше. Фото opus или m4a что лучше

Apple AAC LC называют одним из лучших потребительских AAC кодеков на сегодняшний день. И действительно, он прекрасно держится и проигрывает только технологичному Opus. Но у нас будет ещё одна важная рубрика, посмотрим, как он поведёт себя дальше. Говоря более детально, он хорошо себя показывает на частотах до 3.5 кГц, и до самого потолка, можно сказать, держится наравне с Ogg Vorbis, то слегка выигрывая, то проигрывая.

Ogg Vorbis уже довольно старый формат и на диапазоне самых важных, на мой взгляд, частот от 1 кГц до 4.3 кГц проигрывает всем в степени искажений. Тем не менее, на высоких частотах от 7кГц он с лёгкостью обходит другой ещё более почтенный кодек LAME.

LAME обладает одной из самых низких степеней искажений до 3.5 кГц, затем постепенно сдаёт позиции и проваливается на частотах 6 кГц и выше. Кодек, история которого начинается больше 20 лет назад даже сегодня показывает вполне достойные результаты.

Opus наконец выглядит безусловным фаворитом этой рубрики. Я думаю, вы тоже заметили, что я опускаю рассмотрение искажений на низких частотах, где этот кодек выглядит хуже всех, но, учитывая логарифмическую шкалу и порядки искажений в сотые доли процента, не стоит так сильно упирать на этот момент. Тем не менее, стоит отметить, Opus действительно ведёт себя заметно хуже других кодеков на частотах до 1 кГц, но это примерно 0.04% у других и 0.08% у Opus. Это достаточно низкие показатели в абсолютных величинах. На частотах выше, вплоть до 14 кГц, этому кодеку нет равных, он идёт с большим отрывом, затем ненадолго сравнивается с Apple AAC и снова уходит в отрыв на сверх-высоких частотах выше 16.5 кГц. Стоит сказать, что этот кодек меньше всего «зарезает» сверхвысокие частоты, хотя для среднестатистического человека с обычными наушниками эти частоты уже почти не слышимы.

Скорость кодирования

В этой рубрике кодировщик Ogg Vorbis работал в эмуляторе Wine, поэтому не будем брать в рассмотрение его слабый результат. Могу сказать, что без эмулятора кодировщики Ogg Vorbis весьма и весьма быстрые.

opus или m4a что лучше. Смотреть фото opus или m4a что лучше. Смотреть картинку opus или m4a что лучше. Картинка про opus или m4a что лучше. Фото opus или m4a что лучше

Кодеки отсортированы по скорости декодирования по возрастанию. Тем самым мне хотелось сделать акцент на бытовое применение кодека, так как зачастую именно с этой процедурой сталкиваются потребительские устройства вроде плееров и смартфонов.

Что ж, несмотря на всю свою технологичность, очевидно, что декодирование музыки в формате Opus будет требовать гораздо больших вычислительных ресурсов. Если сравнить с кодеком AAC Apple, то эта разница просто феноменальна и достигает 7 раз!

Что же касается декодеров Ogg Vorbis и LAME, они показывают себя наравне. Хм, здесь очень интересно, насколько оптимальный декодировщик встроен в Spotify, потому что, если результаты их плеера сравнимы с полученными выше, то Apple Music, вероятно, окажется намного более долгоиграющим на одном заряде. Стоит учитывать, что при тестировании использовались оригинальные и референсные декодеры, которые в других реализациях могут показать гораздо более высокие результаты. Впрочем, то же самое можно сказать и про Opus.

Итоги

Очень сложно вынести окончательный вердикт, так как, с одной стороны, Opus и правда справляется со своей задачей намного лучше конкурентов. Но, с другой, он выглядит очень требовательным к ресурсам. Учитывая всё, я думаю, что готов объявить результаты:

Надеюсь, исследование вышло интересным и позволит вам принять правильное решение в выборе подходящего кодека. До новых встреч в новых исследованиях!

Источник

Руководство по выбору форматов аудиофайлов: век сегодняшний и немножко прошлый (страница 2)

WAV: для тех, кому за…

Хранить сегодня музыку в WAV совершенно нецелесообразно. Да, это формат, «с которого есть пошла музыка в компьютере», но хранение в нем именно что нецелесообразно. Безусловно, если вы пишете музыку и храните сэмплы, именно в WAV их и надо хранить. Но слушать обычную музыку – не вижу смысла.

реклама

Про AIFF можно сказать все то же самое, только его делали для устройств Apple. Кто про него помнит вообще?

В общем-то, говорить серьезно о WAV в контексте данной статьи особого смысла нет.

FLAC, APE, ALAC и все-все-все – или просто lossless

Теперь, наконец, мы перейдем к форматам сжатия без потерь. Разумеется, на первом месте FLAC, который по распространенности и поддержке победил все остальные, а потом и потоптался. Нет, конечно, APE и ALAC очень даже живы. Но на стороне FLAC – популярность, популярность и еще раз популярность.

Сегодня это тоже важно, потому что, если ваше устройство поддерживает декодирование на аппаратном уровне – все играет с меньшей загрузкой ресурсов. В случае смартфонов это более чем актуально. Более того, lossless-форматы уже поддерживает большая часть домашней аудиотехники, как дешевых мини-систем, так и вполне серьезных устройств класса High End.

Чем же хороши lossless-форматы? Грубо говоря, это те же исходные WAV-файлы, но ужатые архиватором типа RAR. Это если очень грубо. Главное преимущество lossless-форматов – то, что из аудиопотока не удаляется никакая информация вовсе, как в MP3. То есть, на каком бы устройстве вы это ни проигрывали, можно быть уверенным, что вы слышите все, что только может выдать ваш аппарат. Что может – то и выдает, а что не может – то проблемы лично аппарата и никоим образом не самого файла.

Что же касается того, как lossless-форматы это делают – за этим опять же отсылаю вас к Википедии, где все подробно расписано. Смысл же моих пассажей в том, что FLAC – это та самая золотая середина между MP3 и WAV. То, что появилось вполне закономерно – тогда, когда объемы жестких дисков уже перестали быть камнем преткновения, и у всех наконец-то появилась возможность хранить Большие Файлы.

реклама

Форматы с другой планеты: WavPack, Opus, MPC и прочие страшные буквы

Не упомянуть о них нельзя. Сегодня в плеяде форматов аудиофайлов они занимают примерно то же место, которое занимал OGG в пору моего школьного возраста. То есть – оно есть, прикольно поэкспериментировать, а потом выбрать FLAC или MP3.

Нет, речь не идет о том, что все вышеперечисленное плохо. Что-то из этого даже сжимает лучше, чем MP3. Но! Вспомните (если кто из олдфагов) – чем закончилась в начале 1980-х борьба VHS и Betamax в сегменте домашнего видео? Полной и безоговорочной победой VHS! При худшем качестве картинки и всего остального! А почему? Потому что дешево по всем фронтам (как аппаратура, так и расходники), легко и отсутствует защита от копирования.

Примерно то же самое ожидает и «опусы» с WavPack – и плюс поддержка «железа» и софта сегодня. Проще говоря, эти форматы остались уделом энтузиастов. Можете попробовать и гордо хранить музыку в них, но при попытке скопировать на смартфон или плеер вы расстроитесь потому, что их никто не поддерживает и воспроизводить банально нечем. Не говоря уже про отсутствие аппаратной поддержки. Надо оно вам? Да, пусть это Betamax в мире цифрового звука. Но кому какое дело?

FLAC vs MP3

Да! Вот вы и дождались! Оно самое! Сколько же копий сломано на эту тему – не сосчитать. Приверженцы FLAC с пеной у рта доказывают, что слышно всё; приверженцы MP3 флегматично заявляют, что им и MP3 хватает, и они не слышат того, чего нет. Особо жестокие добавляют, что и в 128 кбит/с все отлично слышно. Фаны FLAC немедленно падают в обморок, и их отпаивают валокордином.

Истина, как водится, где-то посередине. И заключается она в том, что правы, в общем-то, все. Но – с различными «если» и «но».

Первое: отличие FLAC от MP3 вы услышите, если слон вам по ушам не потоптался, только на более-менее приличной аппаратуре. То есть на копеечных пластиковых колонках со встроенной в материнскую плату звуковой картой – не услышите. На дешевом смартфоне с наушниками за пять баксов – не услышите. И это мы говорим о глобальных отличиях.

Если же брать отличия высших битрейтов MP3 (256-320 кбит/с) от FLAC, то здесь вы отличия услышите (да и то – если у вас уши на месте) лишь на хорошей аппаратуре ценой от тысячи долларов за новый комплект – усилители и трехполосная напольная акустика как минимум. Если же вы не хотите отдельную систему Hi-Fi, можно этого добиться и на компьютере. Для этого необходимы внешний аудиоинтерфейс ценовой категории от 300-400 евро за подержанный экземпляр, акустика ценой в 300-350 евро за новый комплект и (очень желательно) цифровой оптический тракт.

Даже более того – если вы пустите звук по оптике со встроенного в системную плату решения, услышите разницу. Собственно, у меня все так и есть: звук пущен по оптическому каналу Toslink из дефолтового Realtek на оптический вход внешней «звуковухи» Edirol и затем выведен по обычным аналоговым RCA на скромную акустику ценой в 350 евро. И – отличия MP3 320 кбит/с от FLAC слышны «невооруженным ухом». Вывод прост: если вы хотите реально слышать разницу с FLAC и прочими APE, нет нужды разоряться на дорогущий «хай-фай», если вас устроит «все в компьютере».

Компромиссный вариант тут тоже прост. 99.9% пользователей не являются аудиофилами, поэтому им хранить музыку во FLAC есть смысл только с прикидкой на далекое будущее, когда будет больше денег, трава будет зеленее, а реки – чище. Нет, разумеется, если у вас места куры не клюют, тогда рекомендую хранить-таки музыку все же во FLAC. Во всех прочих случаях – MP3 320 кбит/с. Помимо места, делать выбор в пользу MP3 стоит тем, кто слушает музыку в Bluetooth-наушниках – не может еще даже кодек aptX передавать Диму Билана в сравнимом с проводным решением качестве.

Что касается звука со смартфона в наушниках, то уже сегодня можно купить недорогой смартфон с приличным звуковым трактом, а на AliExpress заказать за двадцать баксов прекрасные бюджетные внутриканальные наушники Tennmak Dulcimer, а для более продвинутых – Ostry KC06 за полтинник. А программные плееры даже на Windows Phone умеют играть FLAC и не грузить при этом систему.

Поэтому экономить в том случае, если вы любите хоть немного качественный звук, совершенно не стоит – флэшки сегодня копеечные, и разжиться парой-тройкой 32-гигабайтных microSD труда не составит. Затраты в этом случае, повторюсь, будут минимальными, а удовольствия получите больше.

реклама

Впрочем, если вас совсем не волнует качество звука, то вы можете это даже не читать.

Так что же делать?

Вполне допускаю, что после прочтения материала у вас шарики слегка заехали за ролики. Но если по пунктам…

Источник

Кодирование аудио с потерями. Что к чему?

Внимание: это старая версия статьи, новая доступна на моём сайте.

Эволюция кодирования аудио

На дворе 2011-й год, с момента появления первого MP3 кодировщика прошло уже 17 лет. Но то, что большинство из нас до сих пор спокойно слушает музыку в формате MP3 — вовсе не значит, что прогресс всё это время топтался на месте. И это касается не только развития алгоритма кодирования MP3, но и эволюции кодирования аудио с потерями вообще — в виде новых, более совершенных кодеков, действительно позволяющих получить лучшее качество при меньшем размере. Такие форматы как OGG Vorbis, AAC, WMA, Musepack давно оставили позади устаревший MP3 с его многочисленными ограничениями и недостатками.

Параллельно, всё большие обороты набирает кодирование без потерь (lossless). Но из-за больших объемов данных на сегодняшний день оно всё еще непригодно для полномасштабного использования — особенно для портативных устройств с ограниченным объемом памяти, для потокового вещания в сети, и просто для быстрого обмена музыкой в интернете (надо признать, что не у всех и не всегда под рукой есть 100-мегабитный доступ в интернет).

И так, MP3 устарел, и ему определенно созрела замена. Только как быть пользователю непосвященному, но желающему добиться максимально качественного звучания с минимальными затратами объемов памяти? Ведь альтернативных кодеков довольно много (как минимум 3 из них действительно достойны внимания): Apple продвигает с помощью своего iTunes Store формат AAC (Advanced Audio Coding — позиционируется как преемник MP3), Microsoft — свой собственный лицензируемый WMA (Windows Media Audio), кроме того, всё большую известность приобретает OGG Vorbis, а особо просветленные используют даже такой формат как Musepack. Который из этих кодеков выбрать?

Однозначного ответа на этот вопрос нет — и именно поэтому я пишу сию статью.

Как определиться?

Выбор того или иного кодека зависит от конкретной задачи. А именно:

1. От оборудования и ПО, с помощью которого будет воспроизводиться звук. Т.е. от наличия поддержки того или иного формата аудио, а также качества воспроизведения (им желательно руководствоваться при выборе битрейта).

2. От объема памяти, который будет выделен под конечный материал. Соответственно подбирается больший или меньший целевой битрейт/качество.

Ну и, конечно же, необходимо кроме формата и битрейта подобрать оптимальный кодировщик и параметры кодирования. При этом надо понимать, что различные форматы/кодеры по-разному проявляют себя на разных диапазонах битрейта.

Таким образом, алгоритм примерно следующий:

1) Выяснить, какие форматы поддерживает целевое устройство.
2) Определиться, сколько места вы сможете выделить под аудио материал, а также определить суммарную продолжительность аудио предназначенного для кодирования.
3) Вычислить нужный битрейт по формуле: битрейт = дисковое_пространство(в килобитах) / суммарная_продолжительность(в секундах).
4) В соответствии с битрейтом выбрать из поддерживаемых форматов оптимальный (об этом далее).
5) Подобрать наилучший кодер и параметры к нему.

Подробнее о наших героях

opus или m4a что лучше. Смотреть фото opus или m4a что лучше. Смотреть картинку opus или m4a что лучше. Картинка про opus или m4a что лучше. Фото opus или m4a что лучше

OGG Vorbis

opus или m4a что лучше. Смотреть фото opus или m4a что лучше. Смотреть картинку opus или m4a что лучше. Картинка про opus или m4a что лучше. Фото opus или m4a что лучше

Ogg Vorbis — это относительно новый универсальный формат аудио компрессии, официально вышедший летом 2002 года. Он принадлежит к тому же типу форматов, что и МР3, AAC, VQF и WMA, то есть к форматам компрессии с потерями. Психоакустическая модель, используемая в Ogg Vorbis, по принципам действия близка к МР3 и иже с ними, но и только — математическая обработка и практическая реализация этой модели в корне отличаются, что позволяет авторам объявить свой формат совершенно независимым от всех предшественников.
Главное неоспоримое преимущество формата Ogg Vorbis — это его полная открытость и свободность. Более того, в нем использована новейшая и наиболее качественная психоакустическая модель, из-за чего соотношение битрейт/качество значительно ниже, чем у других форматов. Как результат — качество звука лучше, но размер файла меньше.
В формате имеется большое количество достоинств. Например, формат Ogg Vorbis не ограничивает пользователя только двумя аудио каналами (стерео — левый и правый). Он поддерживает до 225 отдельных каналов с частотой дискретизации до 192kHz и разрядностью до 32bit (чего не позволяет ни один формат сжатия с потерями), поэтому Ogg Vorbis великолепно подходит для кодирования 6-ти канального звука DVD-Audio. К тому же, формат OGG Vorbis — sample accurate. Это гарантирует, что звуковые данные перед кодированием и после декодирования не будут иметь смещений или дополнительных/потерянных сэмплов относительно друг друга. Это легко оценить, когда вы кодируете non-stop музыку (когда один трек постепенно входит в другой) — в итоге сохранится целостность звука.
Возможностью потокового вещания сейчас никого не удивишь, но у этого формата она заложена с самых основ. Это дает формату достаточно полезный побочный эффект — в одном файле можно хранить несколько композиций с собственными тегами. При загрузке такого файла в плеер должны отобразиться все композиции, будто их загрузили из нескольких различных файлов.
Отдельно стоит упомянуть достаточно гибкую систему тегов. Заголовок тегов легко расширяется и позволяет включать тексты любой длины и сложности (например, текст песни), перемежающиеся изображениями (например, фотография обложки альбома). Текстовые теги хранятся в UTF-8, что позволяет писать хоть на всех языках одновременно и исключает возможные проблемы с кодировками. Это значительно удобнее различных ухищрений типа id3 тегов.
Ogg Vorbis по умолчанию использует переменный битрейт, при этом значения последнего не ограничены какими-то жесткими значениями, и он может варьироваться даже на 1kbps. При этом стоит заметить, что форматом жестко не ограничен максимальный битрейт, и при максимальных настройках кодирования он может варьироваться от 400kbps до 700kbps. Такой же гибкостью обладает частота дискретизации — пользователям предоставляется любой выбор в пределах от 2000Hz до 192000Hz.
Ogg Vorbis был разработан сообществом Xiphophorus для того, чтобы заменить все платные запатентованные аудио форматы. Несмотря на то, что это самый молодой формат из всех конкурентов МР3, Ogg Vorbis имеет полную поддержку на всех известных платформах (Windows, PocketPC, Symbian, DOS, Linux, MacOS, FreeBSD, BeOS и др.), а также большое количество аппаратных реализаций. Популярность на сегодняшний день значительно превосходит все альтернативные решения.
Стоит заметить, что Ogg Vorbis является всего лишь небольшой частью мультимедиа проекта Ogg Squish, в который также входят свободные кодировщики: Speex — для сжатия голоса; FLAC — для сжатия звука без потерь; Theora — для сжатия видео.

Musepack

При этом материал должен быть предварительно преобразован в моно и ресемплирован до частоты 22050 Гц (желательно ресемплером SoX). На выходе получим обычное Low Complexity AAC с битрейтом около 25 кбит/с.

Для музыки в этом диапазоне тоже есть варианты:

1) Nero AAC. Тут никаких преобразований не нужно:

На выходе — High Efficiency AAC v2 (с параметрическим стерео и синтезом ВЧ),

35 кбит/с. Прекрасный вариант для какого-нибудь интернет-радио. Только тут надо не забывать, что декодер в плеере должен поддерживать HE-AACv2, иначе получите полное отсутствие ВЧ и монофонию.

2) OGG Vorbis AoTuV — данная модификация libvorbis включает усовершенствование алгоритма кодирования с низкими битрейтами и, даже без технологии SBR, не сильно уступает HE-AACv2. Командная строка:

Полученные таким образом файлы должны быть полностью совместимы со стандартными декодерами OGG Vorbis. Битрейт — аналогичный — около 35 кбит/с.

3) WMA 10 Pro. Для таких случаев у Microsoft тоже есть что-то наподобие SBR (синтез ВЧ), звучит не так плохо, как могло бы. Правда битрейт чуть выходит за рамки — 48 кбит/с.

Учтите, что старые (особенно «железные») декодеры не поддерживают WMA 10. Для такого случая можно использовать WMA 9.2 (кодер тот же), правда, его качество на низких битрейтах значительно хуже.

Низкий битрейт,

Изначально я думал сразу перейти к более высоким скоростям. Но так как совсем недавно на hydrogenaudio.org прошло сравнение кодеров именно на этом битрейте, грех его пропустить.

1) QuickTime AAC — победитель (если не считать новоиспеченный Opus/CELT) того самого теста. Ниже указаны настройки для кодера QAAC:

На выходе имеем HE-AAC (с SBR, но без Parametric Stereo), что должно поддерживаться различными iPod’ами и тому подобным.

2) OGG Vorbis AoTuV — хоть и оказался довольно далеко от QAAC, но всё же:

3) И на всякий случай WMA 10 Pro:

Для старых декодеров — WMA 9 Standard:

Чуть выше,

А этот битрейт я рассматриваю уже из-за Vorbis.

1) Как показали тесты, лучше всего с ним справляется кодер OGG Vorbis AoTuV:

Используемый профиль — HE-AAC.

Стандарт де-факто, 128 кбит/с

Интересный факт: многие утверждают, что для MP3 128 кбит/с — «пограничный битрейт», с которого начинается неотличимое от оригинала качество. Пожалуй, это так… для пластмассовых китайских колонок с блатняком. Реально же этот порог находится где-то около 200 кбит/с, при чем новые форматы дают на этом битрейте более стабильное качество.

Современным кодерам эту планку в 128 кбит/с удалось занизить чуть ли не в два раза (опять же, по заявлениям разработчиков). Но, тем не менее, если у вас более-менее приличная акустика (или наушники), на сложных фрагментах разницу можно уловить и при 128 кбит/с.

Профиль — обычный AAC LC.

Для старых декодеров — WMA 9 Standard:

В этом диапазоне разница межу кодерами Nero, QuickTime AAC и Vorbis практически сходит на нет. Но здесь уже на сцену выходит тот самый Musepack. Как раз на этих битрейтах начинает проявляться его преимущество (за счет необычайно гибкого VBR режима, а также принципиально другого алгоритма сжатия):

Порог прозрачности:

То, о чем я говорил. При этом битрейте практически все кодеры дают прозрачный для большинства слушателей звук. И именно этот диапазон является оптимальным в плане размер/качество.

Кстати, у LAME MP3 в этом районе тоже находится подобный порог (VBR V2), но у этого кодека очень большие проблемы с пре-эхом (искажения предшествующие резким всплескам сигнала), а на слух часто ощущается Noise Shaping (шумы от ошибок квантования таким образом переносятся в высокочастотную область).

У таких же кодеков, как Vorbis, AAC и MPC на этом пороге начинается четкая прорисовка в композициях даже фоновых шумов.

WMA 9 Standard, максимальный битрейт воспринимаемый старыми декодерами:

Разумный максимум:

225 кбит/с повышение битрейта чаще всего уже не дает слышимого прироста качества, а размер файлов, естественно увеличивается. Но всё же, для особенно сложных композиций (и хорошей аппаратуры/ушей) существуют более высокие настройки качества. На этих битрейтах для таких кодеров как Museppack и Vorbis мне даже не удалось найти киллер-семплов (проблемные семплы, на которых явно проявляются недостатки алгоритма кодирования). И так:

Опережая ваши вопросы: да, для некоторых из этих кодеров существуют и более высокие настройки качества, но дальнейшее их повышение уже не имеет никакого смысла. Разве что вам действительно не важен объем занимаемый музыкой памяти, а поддержкой lossless ваше устройство не располагает.

Вот, собственно, и всё, чем я хотел с вами поделиться. Пробуйте, комментируйте, задавайте вопросы.

Источник

Опус про Opus. Новый кодек — прощай, MP3?

Почему так? Ведь кодирование с потерями — это неизбежное ухудшение качества звука. Простому обывателю вполне может показаться, что у MP3 давно есть альтернативы — FLAC, APE и прочие алгоритмы компрессии аудиоданных с возможностью идентичного восстановления волновой формы после декодирования. Суждение о том, что появление алгоритмов сжатия звука без потерь составит MP3 конкуренцию во всех отношениях, — очень поверхностно. Помимо качества звука, за которое так переживают любители музыкальных коллекций, существует еще немало других объективных причин, по которым MP3 не может быть забыт и заменен принципами сжатия без потерь.

Прежде всего, потому что форматы кодирования звука с потерями используются не только для музыки, но и для передачи голоса через Интернет. Главный козырь MP3 и других механизмов сжатия с потерями — эффективное использование каналов передачи. Чтобы организовать IP-телефонию, необходимо обеспечить внятную речь как можно большему числу абонентов. При этом качество звука уходит на второй план. Кроме этого, очень важна возможность «мгновенного» декодирования потока, без которого затрудняется синхронный обмен информацией. В данном случае использование (даже теоретически) алгоритмов сжатия без потерь приводило бы к сильным временным задержкам, и интерактивное общение было бы просто невозможным.

Тем не менее MP3 не лишен недостатков. Не секрет, что низкий битрейт «съедает» детали звука, наделяя его к тому же целым набором неприятных артефактов — призвуками, свистом и звоном, разного рода искажениями. При использовании MP3 в IP-телефонии наблюдаются большие временные задержки из-за необходимости дополнительной буферизации данных.

⇡#Opus: новое слово в цифровом звуке

Новый открытый кодек Opus лишен самых серьезных недостатков MP3, при этом он сохранил все достоинства «народного» кодека и даже приумножил их.

opus или m4a что лучше. Смотреть фото opus или m4a что лучше. Смотреть картинку opus или m4a что лучше. Картинка про opus или m4a что лучше. Фото opus или m4a что лучше

Структура Opus позволяет ему эффективно справляться со звуковыми артефактами. Для этого была предложена многоступенчатая архитектура обработки аудиосигнала. Основной аргумент, который говорит в пользу применения нового кодека для IP-телефонии, — низкая временная задержка.

Основную работу над созданием уникального алгоритма сжатия вели несколько человек: Jean-Marc Valin (Xiph.Org, Octasic, Mozilla Corporation), Koen Vos (Skype) и Timothy B. Terriberry (Xiph.Org, Mozilla Corporation). Не обошлось и без вездесущей Google — по словам самих создателей Opus, интернет-гигант оказал значительную поддержку при разработке и тестировании кодека.

opus или m4a что лучше. Смотреть фото opus или m4a что лучше. Смотреть картинку opus или m4a что лучше. Картинка про opus или m4a что лучше. Фото opus или m4a что лучше

Один из создателей кодека Opus — Jean-Marc Valin

Движок нового кодека основывается на двух независимых стандартах, предложенных Xiph.Org Foundation и Skype Technologies S.A. (принадлежит Microsoft). Новый кодек является гибридным решением, он сочетает в себе технологии кодеков CELT (Constrained Energy Lapped Transform) и SILK. Последний используется для реализации связи в Skype.

⇡#Как работает Opus

Принцип работы кодека не нов, но оригинален и главное — позволяет получить очень хороший результат на выходе. Поступивший сигнал кодируется SILK или CELT избирательно.

Первый движок (SILK) применяется для компрессии голоса, а также в тех случаях, когда требуется эффективно расходовать пропускную способность канала связи. Обрабатываемый аудиосигнал анализируется кодеком на предмет наличия человеческой речи. Голосовые составляющие отделяются от прочих звуков, после чего кодек выполняет анализ частотной характеристики звука, понижая уровень дискретизации для данных, содержащих голосовую информацию, то есть речь. Затем Opus исследует присутствующие шумы и оптимизирует сигнал для определенного битрейта. Далее кодек преобразовывает сигнал с помощью фильтра предварительной очистки. Используя речевые кадры, модуль предсказания частоты аудиосигнала вносит изменения в последующие кадры, после чего частотное квантование нормирует частоты человеческой речи. Далее следует важный этап обработки звука — устранение искажений, возникающих при недостаточно высоком битрейте. После этого используется модуль формирования шума квантования, который снижает шумы внутри рабочей полосы, вытесняя их за пределы рабочего диапазона. На заключительном этапе интервального кодирования SILK работает с дискретными величинами, которые могут принимать ограниченное число значений, — осуществляется покадровый вывод сигнала.

В процессе кодирования аудиоданных с высоким качеством, например музыки, задействуется модуль CELT. Его механизм схож с принципом работы наиболее популярных кодеков с потерями и завязан на дискретных косинусных преобразованиях, а также на «оптимизации» звука. Последняя состоит в том, что из сигнала удаляются составляющие, которые не несут полезной нагрузки для слуха человека, — до кодирования он их или не слышит, или слышит с большим трудом.

Если заглянуть в настройки кодирования, например в программе EZ CD Audio Converter (бывший Easy CD-DA Extractor), можно увидеть, что новый кодек предлагает выбрать режим сжатия — звук или музыку. Эта настройка и определяет приоритет того или иного алгоритма кодирования Opus.

opus или m4a что лучше. Смотреть фото opus или m4a что лучше. Смотреть картинку opus или m4a что лучше. Картинка про opus или m4a что лучше. Фото opus или m4a что лучше

Opus поддерживает частоты дискретизации от 8 до 48 кГц. Кодирование звука возможно в диапазоне битрейта 6—510 кбит/с. Длительность кадров варьируется от 2,5 до 20 мс.

Кодек осуществляет кодирование в режимах моно и стерео, используя технологию постоянного и переменного битрейта, а также поддерживает компрессию до 255 каналов.

⇡#Opus: наглядная победа

Универсальность структуры кодека Opus позволила ему на невысоком битрейте обойти самых главных конкурентов — Apple HE-AAC, Nero HE-AAC, Vorbis и AAC LC. На данной диаграмме вы можете наблюдать, насколько лучше параметры задержки у нового кодека по сравнению с конкурентами.

opus или m4a что лучше. Смотреть фото opus или m4a что лучше. Смотреть картинку opus или m4a что лучше. Картинка про opus или m4a что лучше. Фото opus или m4a что лучше

А это — график, демонстрирующий превосходство Opus над другими кодеками по качеству звука. Результаты тестирования говорят о том, что аудио, декодированное с помощью Opus, в большинстве случаев более полно восстанавливает исходную картину звука — на разных битрейтах и на разной частоте. Под терминами fullband stereo и narrowband подразумеваются граничные частоты дискретизации.

opus или m4a что лучше. Смотреть фото opus или m4a что лучше. Смотреть картинку opus или m4a что лучше. Картинка про opus или m4a что лучше. Фото opus или m4a что лучше

Говоря о достоинствах нового кодека, нужно отметить и стабильность его работы в разных условиях, что особенно важно при передаче данных в беспроводных сетях. Opus обладает гибким алгоритмом адаптации к изменению пропускной способности канала связи, поэтому качество звука остается неизменным, а сам кодек частично компенсирует потери, обеспечивая трансляцию без сбоев.

⇡#Софт для работы с Opus

Разработчики программного обеспечения торопятся выпустить обновления с поддержкой кодека Opus. Такие популярные утилиты для работы со звуком, как EZ CD Audio Converter, foobar2000, AIMP, VLC Media Player, уже могут работать с файлами в этом формате. Новый кодек принят на вооружение и при организации потокового вещания посредством Icecast, он включен в K-Lite Codec Pack и фильтры LAV.

В ближайших версиях альтернативной прошивки для портативных аудиоустройств Rockbox также появится поддержка Opus. Любители смогут слушать музыку и аудиокниги на плеерах iPod, Archos и прочих. На портативных устройствах под управлением Android также можно будет слушать аудио через Rockbox, установив соответствующее приложение RaaA (Rockbox as an Application).

На данный момент новый кодек уже поддерживается в разработках Mozilla — Firefox и Thunderbird. Очевидно, что поддержку Opus скоро можно будет увидеть и в других браузерах. В ближайшее время он появится и в Skype.

Opus: палки в колесах

Очевидное превосходство качества, которое показывает Opus при кодировании, еще не означает его безоговорочной победы. Данный кодек пока не избавился от всех багов и только в сентябре этого года прошел сертификацию в IETF (Internet Engineering Task Force) как стандарт аудиокодека для использования в Интернете.

Кроме того, новой разработке еще предстоит «пободаться» с многочисленными претензиями и судебными исками, которые следует ожидать в будущем. Opus имеет статус royalty-free, то есть за его использование не нужно платить никаких отчислений правообладателям. Появление такого продукта, понятное дело, невыгодно многим конкурентам.

Первые «бузотеры» уже высказались против нового кодека — компании Qualcomm и Huawei заявили о том, что новая разработка нарушает принадлежащие им патенты. Разработчики Opus дали комментарии по этому поводу, сообщив, что они не нарушили авторских прав и более того — они ожидали появления подобных заявлений и готовы отстаивать свою правоту.

⇡#Заключение

Спустя 20 лет существования MP3 человек все так же плохо слышит разницу между оригинальным звуком и звуком, который претерпел потери в результате компрессии. Тем не менее он всячески ищет способы улучшить качество оцифрованного звука и минимизировать потери при одинаковом битрейте.

Кодек Opus, безусловно, ждет большое будущее. Низкий уровень искажений, а также минимальные по сравнению с конкурирующими алгоритмами временные задержки — все это делает Opus идеальным для интеграции данной технологии в сфере IP-телефонии и трансляции речи.

Впрочем, скорее всего, такого размаха, который сопутствовал победоносному шествию MP3, «Опусу» вряд ли удастся достичь. В свое время появление кодека MP3 стало настоящей революцией в сфере хранения и передачи звука. Сегодня новый кодек может лишь предложить более эффективное использование каналов передачи на низких скоростях. Что же касается музыкальных предпочтений, то, полагаем, любители портативного звука останутся стоять на своем — звук должен быть без потерь. Да и сами разработчики это не отрицают.

В презентации Opus сказано буквально следующее: «Кодек может использоваться для любых целей, за исключением Lossless-сохранения (для этого используйте FLAC) и за исключением кодирования с ультранизким битрейтом (для этого используйте codec2)».

Аппаратная поддержка Opus будет обязательно. Ведь показатели у нового кодека отличные, а значит, в скором времени можно будет ожидать использования новой технологии в беспроводных наушниках и портативных плеерах, которые мы по-прежнему будем по старинке называть MP3-плеерами.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *