opus или aac что лучше

Кодирование аудио с потерями: рекомендации по выбору кодера и параметров

Эволюция кодирования аудио

На подходе 2018-й год, а это значит, что с момента появления первого MP3 кодировщика прошла уже почти четверть века (на данный момент даже истёк срок действия патента). Но то что большинство из нас до сих пор продолжает слушать музыку в формате MP3, вовсе не значит, что прогресс всё это время топтался на месте. И это касается не только развития алгоритма кодирования MP3, но и эволюции кодирования аудио с потерями вообще — в виде новых, более совершенных кодеков, действительно позволяющих получить лучшее качество при меньшем размере. Такие форматы, как OGG Vorbis, AAC, WMA, Musepack, давно оставили позади устаревший MP3 с его многочисленными ограничениями и недостатками.

Благодаря стремительному росту объема носителей данных всё большую распространённость обретает кодирование без потерь (lossless), но надо признать, что далеко не все на сегодняшний день успели разжиться парочкой жестких дисков на десяток терабайт, и картами Micro SDHC на сотни ГБ. Ещё одним (пожалуй, решающим) аргументом в пользу кодирования с потерями становится возможность потокового вещания в сети и быстрого обмена музыкой в интернете — не у всех и не всегда под рукой есть 100-мегабитный доступ в интернет.

Итак, возвращаясь к lossy, констатирую: MP3 устарел, и ему определенно созрела замена. Однако, как быть пользователю непосвященному, но желающему добиться максимально качественного звучания с минимальными затратами объемов памяти? Ведь альтернативных кодеков довольно много: Apple продвигает с помощью своего iTunes Store формат AAC (Advanced Audio Coding — позиционируется как преемник MP3), Microsoft — свой собственный лицензируемый WMA (Windows Media Audio), Xiph.Org предлагает нам свободный кодек OGG Vorbis. Кроме того, всё большую распространённость приобретает новый высокотехнологичный формат Opus (например, его уже давно используют сервисы IP-телефонии — Dischord, TeamSpeak и другие). Также не забываем о всё еще не сдающем свои позиции (с 2009-го года) новаторском формате Musepack. Так который из этих кодеков выбрать?

Однозначного ответа на этот вопрос нет — и именно поэтому я пишу эту статью.

Как определиться?

Выбор того или иного кодека зависит от конкретной задачи. А именно:

Таким образом алгоритм примерно следующий:

Подробнее о наших героях

opus или aac что лучше. Смотреть фото opus или aac что лучше. Смотреть картинку opus или aac что лучше. Картинка про opus или aac что лучше. Фото opus или aac что лучше

Развитие методов сжатия данных и психоакустики постепенно приводило к тому, что стандарт МР3 стал «тесным» для реализации новых идей в кодировании аудио. В результате, к 1997 году институтом Фраунгофера (Fraunhofer IIS), который в начале 90-х создал МР3, а также компаниями Dolby, AT&T, Sony и Nokia был разработан новый метод компрессии аудио Advanced Audio Coding (AAC), вошедший в стандарты MPEG-2 и MPEG-4. Основными отличиями от стандарта МР3 стали:

Благодаря этим особенностям, стандарт AAC способен достигать более гибкого и эффективного — а значит, и более качественного кодирования звука. В результате широкого распространения формата МР3, непритязательности большинства слушателей к качеству и определёных патентных ограничений, стандарт AAC до сих пор не приобрел сравнимой с МР3 популярности. Тем не менее, AAC является основным форматом в популярном интернет-магазине iTunes Store, плеерах iPod, iTunes, телефоне iPhone, игровых приставках PlayStation 3, Nintendo Wii и в цифровом радиовещании DAB+/DRM (Digital Radio Mondiale сейчас также включает поддержку Opus).

OGG Vorbis

opus или aac что лучше. Смотреть фото opus или aac что лучше. Смотреть картинку opus или aac что лучше. Картинка про opus или aac что лучше. Фото opus или aac что лучше

Ogg Vorbis — более новый универсальный формат аудиокомпрессии, официально вышедший летом 2002 года. Психоакустическая модель, используемая в Ogg Vorbis, по принципам действия близка к МР3 и иже с ними, но и только — математическая обработка и практическая реализация этой модели в корне отличаются, что позволяет авторам объявить свой формат совершенно независимым от всех предшественников.

Главное неоспоримое преимущество формата Ogg Vorbis — это его полная открытость и свободность. Более того, в нём использована более новая и качественная психоакустическая модель, из-за чего соотношение битрейт/качество значительно лучше, чем у предшественников.

В формате имеется большое количество достоинств. Например, формат Ogg Vorbis не ограничивает пользователя только двумя аудиоканалами (стерео — левый и правый). Он поддерживает до 225 отдельных каналов с частотой дискретизации до 192 кГц и разрядностью до 32 бит (чего ранее не позволял ни один формат сжатия с потерями), поэтому Ogg Vorbis великолепно подходит для кодирования 6-канального звука DVD-Audio. К тому же, формат OGG Vorbis — sample accurate. Это гарантирует, что звуковые данные перед кодированием и после декодирования не будут иметь смещений или дополнительных/потерянных сэмплов относительно друг друга. Это легко оценить, когда вы кодируете non-stop музыку (когда один трек постепенно входит в другой) — в итоге сохранится целостность звука.

Возможностью потокового вещания сейчас никого не удивишь, но у этого формата она заложена с самых основ. Это дает формату достаточно полезный побочный эффект: в одном файле можно хранить несколько композиций с собственными тегами. При загрузке такого файла в плеер должны отобразиться все композиции, будто их загрузили из нескольких различных файлов.

Отдельно стоит упомянуть достаточно гибкую систему тегов. Заголовок тегов легко расширяется и позволяет включать тексты любой длины и сложности (например, текст песни), перемежающиеся изображениями (например, фотография обложки альбома). Текстовые теги хранятся в UTF-8, что позволяет писать хоть на всех языках одновременно и исключает возможные проблемы с кодировками. Это значительно удобнее различных ухищрений вроде ID3 тегов.

Ogg Vorbis по умолчанию использует переменный битрейт, при этом значения последнего не ограничены какими-то жесткими рамками и он может варьироваться даже на 1 кбит/с. При этом форматом не ограничен и максимальный битрейт, при максимальных настройках кодирования он может достигать 400—700 кбит/с. Такой же гибкостью обладает частота дискретизации — пользователям предоставляется любой выбор в пределах от 2000 Гц до 192000 Гц.

Ogg Vorbis был разработан сообществом Xiph.Org для того, чтобы заменить все платные запатентованные аудиоформаты. Ogg Vorbis довольно скоро получил полную поддержку на всех известных платформах (Windows, Linux, MacOS, Andoroid и др.), а также большое количество аппаратных реализаций.

opus или aac что лучше. Смотреть фото opus или aac что лучше. Смотреть картинку opus или aac что лучше. Картинка про opus или aac что лучше. Фото opus или aac что лучше

Windows Media Audio — лицензируемый формат файла, разработанный компанией Microsoft для хранения и трансляции аудиоинформации.

Изначально формат WMA рекламировался как альтернатива MP3, но на сегодняшний день Microsoft противопоставляет ему формат AAC. Номинально формат WMA характеризуется хорошей способностью сжатия, что позволяет ему «обходить» формат MP3 и конкурировать по параметрам с форматами Ogg Vorbis и AAC. Но, как было показано независимыми тестами, а также субъективной оценкой, качество форматов всё-таки не является эквивалентным, а преимущество — даже перед MP3 — однозначным, как это утверждала компания Microsoft.

Musepack

opus или aac что лучше. Смотреть фото opus или aac что лучше. Смотреть картинку opus или aac что лучше. Картинка про opus или aac что лучше. Фото opus или aac что лучше

MusePack (mpp, mp+, mpc, MPEG+) — нелицензируемый формат файла для хранения аудиоинформации, распространяемый по GNU General Public License.

Качество кодирования MPC на высоких битрейтах (160 Кбит/с и выше) заметно (если не сказать значительно) выше качества, обеспечиваемого MP3.

opus или aac что лучше. Смотреть фото opus или aac что лучше. Смотреть картинку opus или aac что лучше. Картинка про opus или aac что лучше. Фото opus или aac что лучше

Opus — последнее слово в области lossy кодирования аудио. Сочетает в себе новейшие разработки — низколатентный кодек CELT от Xiph.Org и ориентированный на речь кодек SILK, разработанный Skype. Оба эти кодера в значительной степени модифицированы и благодаря этому очень эффективно взаимодействуют. Opus может не только незаметно переключаться между реализациями SILK и CELT, но также и работать в гибридном режиме — когда SILK кодирует диапазон до 8 кГц с линейным предсказанием, а CELT — всё что выше, с использованием МДКП.

Изначально Opus разрабатывался как кодер с очень низкой задержкой (в среднем 22.5 мс) и хорошей устойчивостью к потерям, предназначенный для онлайн трансляций и перформансов. Однако, благодаря основательному подходу разработчиков, Opus оказался достойным соперником для других кодеков и в области сжатия аудио для хранения.

На сегодня независимые тесты показывают однозначное превосходство Opus над всеми другими форматами в районе 64 и 96 кбит/с. Отдельные субъективные тесты также подтверждают превосходство кодека и на более высоких битрейтах (вплоть до 200 кбит/с, обеспечивающих абсолютную прозрачность — киллер-семплы не обнаружены до сих пор).

Opus отличается наиболее совершенной на сегодня психоакустической моделью и непревзойдённой гибкостью битрейта (от 1 до 256 кбит/с на канал, с приращением ±0.4 кбит/с). На сегодня он имеет довольно широкую и постоянно растущую программную поддержку (в частности, уже поддерживается некоторыми плеерами для Android OS).

Подбор формата, кодера и параметров

Теперь непосредственно к сути дела.

Чтобы облегчить вам выбор, я хотел бы поделиться своим опытом, полученным в ходе многочисленных сравнений, прослушиваний, а также на основе анализа результатов открытых слуховых тестов. Ниже я расскажу о наиболее подходящих для каждого отдельного случая кодерах, а также о правильном выборе параметров. Для конвертирования рекомендую использовать foobar2000 (подробно настройка конвертера описана здесь), собственно параметры указаны как раз для него. Кроме того, для foobar2000 есть большое количество полезных DSP, которые могут нам пригодиться для предварительной обработки аудио.

Для тех же, кто собирается конвертировать через консоль или другую программу: переменную %s (или знак «-») надо заменить на имя файла-источника (или аналогичную переменную), а %d — на имя выходного файла.

Обратите внимание, что для каждого диапазона битрейта указаны возможные варианты форматов: первый — самый приоритетный. Если же ваш плеер не поддерживает первый вариант — обратите внимание на следующий, и т. д. Также должен сразу сказать, что кодек WMA (в силу его закрытости и заброшенности разработчиком) особым качеством не отличается, но всё же в большинстве случаев лучше, чем MP3. Учитывая, что некоторые устройства из альтернатив поддерживают только WMA, я буду давать рекомендации для каждого из пяти описанных здесь форматов, включая Windows Media Audio.

Насчет битрейтов: надо понимать, что оптимальным режимом кодирования является т. н. True VBR, т. е. режим с целевым качеством, а не битрейтом. В идеале результатом является трек с переменным битрейтом, но постоянным качеством (не приравнивайте эти два понятия — более сложным фрагментам трека для поддержания качества нужно больше бит). Таким образом битрейт на выходе трудно предсказуем. Потому значения битрейтов ниже указаны только как примерные, по возможности — средние для большого количества композиций различной сложности.

Сверхнизкие битрейты (

Этот диапазон подходит для кодирования аудиокниг:

1) Это как раз один из случаев, для которых разрабатывался Opus:

2) Если поддержки Opus нет, то вот подобранная мною комбинация настроек Nero AAC:

при этом материал должен быть предварительно преобразован в моно и ресемплирован до частоты 22050 Гц (желательно, ресемплером SoX). На выходе получим обычное Low Complexity AAC с битрейтом около 25 кбит/с.

Для музыки в этом диапазоне тоже есть варианты:

1) Nero AAC. Тут никаких преобразований не нужно:

На выходе — High Efficiency AAC v2 (с параметрическим стерео и синтезом ВЧ),

35 кбит/с. Прекрасный вариант для интернет-радио и низкой пропускной способностью канала. Только тут надо не забывать, что декодер в плеере должен поддерживать HE-AACv2, иначе получите полное отсутствие ВЧ и монофонию.

2) Opus — довольно приличное звучание с полным и естественным (без синтеза, как у AAC) частотным диапазоном и стереопанорамой (благодаря чему он может звучать лучше на некоторых композициях).

3) OGG Vorbis AoTuV — чуть более сильные искажения, чем у Opus и частотный диапазон, обрезанный до 13 кГц. Командная строка:

Полученные таким образом файлы должны быть полностью совместимы со стандартными декодерами OGG Vorbis. Битрейт — аналогичный, около 35 кбит/с.

4) WMA 10 Pro. Для таких случаев у Microsoft тоже есть что-то наподобие SBR (синтез ВЧ), звучит не так плохо, как могло бы. Правда битрейт чуть выходит за рамки — 48 кбит/с.

Учтите, что старые (особенно «железные») декодеры не поддерживают WMA 10. Для такого случая можно использовать WMA 9.2 (кодер тот же), правда, его качество на низких битрейтах значительно хуже.

Низкий битрейт,

1) Opus — однозначный лидер на 64 кбит/с.

Обеспечивает натуральное кодирование как частотного диапазона, так и стереопанорамы, с вполне приемлемым уровнем искажений.

На выходе имеем HE-AAC (с SBR, но без Parametric Stereo).

3) OGG Vorbis AoTuV — хоть и оказался довольно далеко от QAAC, но всё же:

4) И на всякий случай WMA 10 Pro:

Для старых декодеров — WMA 9 Standard:

Чуть выше,

1) Как показали тесты, лучше всего с этим битрейтом справляется кодер Opus:

Стандарт де-факто, 128 кбит/с

Многие утверждают, что для MP3 128 кбит/с — «пограничный битрейт», с которого начинается неотличимое от оригинала качество, однако на самом деле это справедливо только для несложного материала (с не слишком широкой стереопанорамой, низким уровнем ВЧ и без транзиентов). Реально же, для подавляющего большинства треков, этот порог находится где-то около 200 кбит/с, причём новые форматы дают на этом битрейте более стабильное качество.

Современным кодерам эту планку в 128 кбит/с удалось занизить чуть ли не в два раза (опять же, по заявлениям разработчиков). Но, тем не менее, если у вас более-менее приличная акустика (или наушники), на сложных фрагментах разницу можно уловить и при 128 кбит/с.

Для старых декодеров — WMA 9 Standard:

В этом диапазоне разница межу кодерами AAC и Vorbis практически сходит на нет. Но здесь уже на сцену выходит Musepack. Как раз на этих битрейтах начинает проявляться его преимущество (за счет принципиально другого алгоритма сжатия). Что касается соперничества Musepack с Opus — в данном диапазоне битрейтов они находятся примерно на одном уровне качества. Однако в пользу Opus говорит его увеличивающаяся программная поддержка и перспективы дальнейшей разработки.

Порог прозрачности:

При этом битрейте практически все кодеры дают прозрачный для большинства слушателей звук. И именно этот диапазон является оптимальным в плане размер/качество.

Кстати, возвращаясь к MP3 (LAME): как я уже говорил, в этом районе (VBR V2) у него также находится определённый порого прозрачности, но у LAME MP3 очень большие проблемы с пре-эхом (искажения, предшествующие резким всплескам сигнала), а на слух часто ощущается Noise Shaping (шумы от ошибок квантования таким образом переносятся в высокочастотную область).

У таких же кодеков, как Vorbis, AAC и MPC, на этом пороге начинается четкая прорисовка в композициях даже фоновых шумов. Для Opus это порог абсолютной прозрачности, для которого я пока не смог найти киллер-семплов.

WMA 9 Standard, максимальный битрейт воспринимаемый старыми декодерами:

Разумный максимум:

Должен обратить ваше внимание: после

225 кбит/с повышение битрейта чаще всего уже не дает слышимого прироста качества, а размер файлов, естественно увеличивается. Но всё же, для особенно сложных композиций (и хорошей аппаратуры/ушей) существуют более высокие настройки качества. На этих битрейтах для таких кодеров как Musepack, Vorbis и Opus мне даже не удалось найти киллер-семплов (проблемные семплы, на которых явно проявляются недостатки алгоритма кодирования). Итак:

Опережая ваши вопросы: да, для некоторых из этих кодеров существуют и более высокие настройки качества, но дальнейшее их повышение уже не имеет никакого смысла. Разве что вам действительно не важен объем занимаемой музыкой памяти, а поддержкой lossless ваше устройство не располагает.

Информация от спонсора

Shift+7: доступные ответы на ваши вопросы. На нашем сайте вы сможете узнать, как сделать правильный выбор фотоаппарата. В статье рассматривается несколько вариантов бюджета, а также важнейшие характеристики, на которые следует обращать внимание.

Источник

Фавориты сжатия с потерями: кто же лучше на битрейте 192 кбит/с?

Это наверное самый логичный шаг после обкатывания и отладки новой методики тестирования: взять кодеки с потерями, которые все считают одними из лучших, и посмотреть, кто кого? В сегодняшнее тестирование попали:

Могу сказать, что ради интереса я поверхностно прогнал старичков faac и nero для кодирования в AAC LC. Можно сказать, faac сдался сразу же, на частотах выше 6 кГц он вёл себя на порядок хуже конкурентов. А вот nero удивил, сухие цифры говорят, что он и по сей день прекрасен на частотах до 9500 Гц и даже вполне в паритете с современным Opus! Но, начиная с 13 кГц nero полностью проваливается и сдаёт все позиции конкурентам. Эти два кодека я всё же решил убрать из результатов тестирования. Вероятно, я сделаю обзор на них позже.

В будущем я также думаю сделать обзор, насколько в действительности модификация aoTuV улучшает качество оригинального кодека Ogg Vorbis.

Но давайте продолжим, кто же из 4 перечисленных претендентов на лучший кодек сможет отстоять своё звание?

Параметры исследования

Командные строки запуска кодеков:

Apple AAC LC afconvert

Ogg Vorbis libvorbis 1.3.6 aoTuV b6.03

Opus 1.3.1

LAME 3.100

Битрейты были подобраны так, чтобы размеры итоговых файлов были примерно одинаковыми: в диапазоне от 11.4 до 11.8 МБ. Оригинал был сжат более чем в 7 раз.

Результаты

Давайте начнём с самого интересного, анализа вносимых искажений. Не могу сказать, что нам открывается что-то поразительное, но, тем не менее, картина весьма занятная.

Искажения

opus или aac что лучше. Смотреть фото opus или aac что лучше. Смотреть картинку opus или aac что лучше. Картинка про opus или aac что лучше. Фото opus или aac что лучше

Apple AAC LC называют одним из лучших потребительских AAC кодеков на сегодняшний день. И действительно, он прекрасно держится и проигрывает только технологичному Opus. Но у нас будет ещё одна важная рубрика, посмотрим, как он поведёт себя дальше. Говоря более детально, он хорошо себя показывает на частотах до 3.5 кГц, и до самого потолка, можно сказать, держится наравне с Ogg Vorbis, то слегка выигрывая, то проигрывая.

Ogg Vorbis уже довольно старый формат и на диапазоне самых важных, на мой взгляд, частот от 1 кГц до 4.3 кГц проигрывает всем в степени искажений. Тем не менее, на высоких частотах от 7кГц он с лёгкостью обходит другой ещё более почтенный кодек LAME.

LAME обладает одной из самых низких степеней искажений до 3.5 кГц, затем постепенно сдаёт позиции и проваливается на частотах 6 кГц и выше. Кодек, история которого начинается больше 20 лет назад даже сегодня показывает вполне достойные результаты.

Opus наконец выглядит безусловным фаворитом этой рубрики. Я думаю, вы тоже заметили, что я опускаю рассмотрение искажений на низких частотах, где этот кодек выглядит хуже всех, но, учитывая логарифмическую шкалу и порядки искажений в сотые доли процента, не стоит так сильно упирать на этот момент. Тем не менее, стоит отметить, Opus действительно ведёт себя заметно хуже других кодеков на частотах до 1 кГц, но это примерно 0.04% у других и 0.08% у Opus. Это достаточно низкие показатели в абсолютных величинах. На частотах выше, вплоть до 14 кГц, этому кодеку нет равных, он идёт с большим отрывом, затем ненадолго сравнивается с Apple AAC и снова уходит в отрыв на сверх-высоких частотах выше 16.5 кГц. Стоит сказать, что этот кодек меньше всего «зарезает» сверхвысокие частоты, хотя для среднестатистического человека с обычными наушниками эти частоты уже почти не слышимы.

Скорость кодирования

В этой рубрике кодировщик Ogg Vorbis работал в эмуляторе Wine, поэтому не будем брать в рассмотрение его слабый результат. Могу сказать, что без эмулятора кодировщики Ogg Vorbis весьма и весьма быстрые.

opus или aac что лучше. Смотреть фото opus или aac что лучше. Смотреть картинку opus или aac что лучше. Картинка про opus или aac что лучше. Фото opus или aac что лучше

Кодеки отсортированы по скорости декодирования по возрастанию. Тем самым мне хотелось сделать акцент на бытовое применение кодека, так как зачастую именно с этой процедурой сталкиваются потребительские устройства вроде плееров и смартфонов.

Что ж, несмотря на всю свою технологичность, очевидно, что декодирование музыки в формате Opus будет требовать гораздо больших вычислительных ресурсов. Если сравнить с кодеком AAC Apple, то эта разница просто феноменальна и достигает 7 раз!

Что же касается декодеров Ogg Vorbis и LAME, они показывают себя наравне. Хм, здесь очень интересно, насколько оптимальный декодировщик встроен в Spotify, потому что, если результаты их плеера сравнимы с полученными выше, то Apple Music, вероятно, окажется намного более долгоиграющим на одном заряде. Стоит учитывать, что при тестировании использовались оригинальные и референсные декодеры, которые в других реализациях могут показать гораздо более высокие результаты. Впрочем, то же самое можно сказать и про Opus.

Итоги

Очень сложно вынести окончательный вердикт, так как, с одной стороны, Opus и правда справляется со своей задачей намного лучше конкурентов. Но, с другой, он выглядит очень требовательным к ресурсам. Учитывая всё, я думаю, что готов объявить результаты:

Надеюсь, исследование вышло интересным и позволит вам принять правильное решение в выборе подходящего кодека. До новых встреч в новых исследованиях!

Источник

Кодирование аудио с потерями. Что к чему?

Внимание: это старая версия статьи, новая доступна на моём сайте.

Эволюция кодирования аудио

На дворе 2011-й год, с момента появления первого MP3 кодировщика прошло уже 17 лет. Но то, что большинство из нас до сих пор спокойно слушает музыку в формате MP3 — вовсе не значит, что прогресс всё это время топтался на месте. И это касается не только развития алгоритма кодирования MP3, но и эволюции кодирования аудио с потерями вообще — в виде новых, более совершенных кодеков, действительно позволяющих получить лучшее качество при меньшем размере. Такие форматы как OGG Vorbis, AAC, WMA, Musepack давно оставили позади устаревший MP3 с его многочисленными ограничениями и недостатками.

Параллельно, всё большие обороты набирает кодирование без потерь (lossless). Но из-за больших объемов данных на сегодняшний день оно всё еще непригодно для полномасштабного использования — особенно для портативных устройств с ограниченным объемом памяти, для потокового вещания в сети, и просто для быстрого обмена музыкой в интернете (надо признать, что не у всех и не всегда под рукой есть 100-мегабитный доступ в интернет).

И так, MP3 устарел, и ему определенно созрела замена. Только как быть пользователю непосвященному, но желающему добиться максимально качественного звучания с минимальными затратами объемов памяти? Ведь альтернативных кодеков довольно много (как минимум 3 из них действительно достойны внимания): Apple продвигает с помощью своего iTunes Store формат AAC (Advanced Audio Coding — позиционируется как преемник MP3), Microsoft — свой собственный лицензируемый WMA (Windows Media Audio), кроме того, всё большую известность приобретает OGG Vorbis, а особо просветленные используют даже такой формат как Musepack. Который из этих кодеков выбрать?

Однозначного ответа на этот вопрос нет — и именно поэтому я пишу сию статью.

Как определиться?

Выбор того или иного кодека зависит от конкретной задачи. А именно:

1. От оборудования и ПО, с помощью которого будет воспроизводиться звук. Т.е. от наличия поддержки того или иного формата аудио, а также качества воспроизведения (им желательно руководствоваться при выборе битрейта).

2. От объема памяти, который будет выделен под конечный материал. Соответственно подбирается больший или меньший целевой битрейт/качество.

Ну и, конечно же, необходимо кроме формата и битрейта подобрать оптимальный кодировщик и параметры кодирования. При этом надо понимать, что различные форматы/кодеры по-разному проявляют себя на разных диапазонах битрейта.

Таким образом, алгоритм примерно следующий:

1) Выяснить, какие форматы поддерживает целевое устройство.
2) Определиться, сколько места вы сможете выделить под аудио материал, а также определить суммарную продолжительность аудио предназначенного для кодирования.
3) Вычислить нужный битрейт по формуле: битрейт = дисковое_пространство(в килобитах) / суммарная_продолжительность(в секундах).
4) В соответствии с битрейтом выбрать из поддерживаемых форматов оптимальный (об этом далее).
5) Подобрать наилучший кодер и параметры к нему.

Подробнее о наших героях

opus или aac что лучше. Смотреть фото opus или aac что лучше. Смотреть картинку opus или aac что лучше. Картинка про opus или aac что лучше. Фото opus или aac что лучше

OGG Vorbis

opus или aac что лучше. Смотреть фото opus или aac что лучше. Смотреть картинку opus или aac что лучше. Картинка про opus или aac что лучше. Фото opus или aac что лучше

Ogg Vorbis — это относительно новый универсальный формат аудио компрессии, официально вышедший летом 2002 года. Он принадлежит к тому же типу форматов, что и МР3, AAC, VQF и WMA, то есть к форматам компрессии с потерями. Психоакустическая модель, используемая в Ogg Vorbis, по принципам действия близка к МР3 и иже с ними, но и только — математическая обработка и практическая реализация этой модели в корне отличаются, что позволяет авторам объявить свой формат совершенно независимым от всех предшественников.
Главное неоспоримое преимущество формата Ogg Vorbis — это его полная открытость и свободность. Более того, в нем использована новейшая и наиболее качественная психоакустическая модель, из-за чего соотношение битрейт/качество значительно ниже, чем у других форматов. Как результат — качество звука лучше, но размер файла меньше.
В формате имеется большое количество достоинств. Например, формат Ogg Vorbis не ограничивает пользователя только двумя аудио каналами (стерео — левый и правый). Он поддерживает до 225 отдельных каналов с частотой дискретизации до 192kHz и разрядностью до 32bit (чего не позволяет ни один формат сжатия с потерями), поэтому Ogg Vorbis великолепно подходит для кодирования 6-ти канального звука DVD-Audio. К тому же, формат OGG Vorbis — sample accurate. Это гарантирует, что звуковые данные перед кодированием и после декодирования не будут иметь смещений или дополнительных/потерянных сэмплов относительно друг друга. Это легко оценить, когда вы кодируете non-stop музыку (когда один трек постепенно входит в другой) — в итоге сохранится целостность звука.
Возможностью потокового вещания сейчас никого не удивишь, но у этого формата она заложена с самых основ. Это дает формату достаточно полезный побочный эффект — в одном файле можно хранить несколько композиций с собственными тегами. При загрузке такого файла в плеер должны отобразиться все композиции, будто их загрузили из нескольких различных файлов.
Отдельно стоит упомянуть достаточно гибкую систему тегов. Заголовок тегов легко расширяется и позволяет включать тексты любой длины и сложности (например, текст песни), перемежающиеся изображениями (например, фотография обложки альбома). Текстовые теги хранятся в UTF-8, что позволяет писать хоть на всех языках одновременно и исключает возможные проблемы с кодировками. Это значительно удобнее различных ухищрений типа id3 тегов.
Ogg Vorbis по умолчанию использует переменный битрейт, при этом значения последнего не ограничены какими-то жесткими значениями, и он может варьироваться даже на 1kbps. При этом стоит заметить, что форматом жестко не ограничен максимальный битрейт, и при максимальных настройках кодирования он может варьироваться от 400kbps до 700kbps. Такой же гибкостью обладает частота дискретизации — пользователям предоставляется любой выбор в пределах от 2000Hz до 192000Hz.
Ogg Vorbis был разработан сообществом Xiphophorus для того, чтобы заменить все платные запатентованные аудио форматы. Несмотря на то, что это самый молодой формат из всех конкурентов МР3, Ogg Vorbis имеет полную поддержку на всех известных платформах (Windows, PocketPC, Symbian, DOS, Linux, MacOS, FreeBSD, BeOS и др.), а также большое количество аппаратных реализаций. Популярность на сегодняшний день значительно превосходит все альтернативные решения.
Стоит заметить, что Ogg Vorbis является всего лишь небольшой частью мультимедиа проекта Ogg Squish, в который также входят свободные кодировщики: Speex — для сжатия голоса; FLAC — для сжатия звука без потерь; Theora — для сжатия видео.

Musepack

При этом материал должен быть предварительно преобразован в моно и ресемплирован до частоты 22050 Гц (желательно ресемплером SoX). На выходе получим обычное Low Complexity AAC с битрейтом около 25 кбит/с.

Для музыки в этом диапазоне тоже есть варианты:

1) Nero AAC. Тут никаких преобразований не нужно:

На выходе — High Efficiency AAC v2 (с параметрическим стерео и синтезом ВЧ),

35 кбит/с. Прекрасный вариант для какого-нибудь интернет-радио. Только тут надо не забывать, что декодер в плеере должен поддерживать HE-AACv2, иначе получите полное отсутствие ВЧ и монофонию.

2) OGG Vorbis AoTuV — данная модификация libvorbis включает усовершенствование алгоритма кодирования с низкими битрейтами и, даже без технологии SBR, не сильно уступает HE-AACv2. Командная строка:

Полученные таким образом файлы должны быть полностью совместимы со стандартными декодерами OGG Vorbis. Битрейт — аналогичный — около 35 кбит/с.

3) WMA 10 Pro. Для таких случаев у Microsoft тоже есть что-то наподобие SBR (синтез ВЧ), звучит не так плохо, как могло бы. Правда битрейт чуть выходит за рамки — 48 кбит/с.

Учтите, что старые (особенно «железные») декодеры не поддерживают WMA 10. Для такого случая можно использовать WMA 9.2 (кодер тот же), правда, его качество на низких битрейтах значительно хуже.

Низкий битрейт,

Изначально я думал сразу перейти к более высоким скоростям. Но так как совсем недавно на hydrogenaudio.org прошло сравнение кодеров именно на этом битрейте, грех его пропустить.

1) QuickTime AAC — победитель (если не считать новоиспеченный Opus/CELT) того самого теста. Ниже указаны настройки для кодера QAAC:

На выходе имеем HE-AAC (с SBR, но без Parametric Stereo), что должно поддерживаться различными iPod’ами и тому подобным.

2) OGG Vorbis AoTuV — хоть и оказался довольно далеко от QAAC, но всё же:

3) И на всякий случай WMA 10 Pro:

Для старых декодеров — WMA 9 Standard:

Чуть выше,

А этот битрейт я рассматриваю уже из-за Vorbis.

1) Как показали тесты, лучше всего с ним справляется кодер OGG Vorbis AoTuV:

Используемый профиль — HE-AAC.

Стандарт де-факто, 128 кбит/с

Интересный факт: многие утверждают, что для MP3 128 кбит/с — «пограничный битрейт», с которого начинается неотличимое от оригинала качество. Пожалуй, это так… для пластмассовых китайских колонок с блатняком. Реально же этот порог находится где-то около 200 кбит/с, при чем новые форматы дают на этом битрейте более стабильное качество.

Современным кодерам эту планку в 128 кбит/с удалось занизить чуть ли не в два раза (опять же, по заявлениям разработчиков). Но, тем не менее, если у вас более-менее приличная акустика (или наушники), на сложных фрагментах разницу можно уловить и при 128 кбит/с.

Профиль — обычный AAC LC.

Для старых декодеров — WMA 9 Standard:

В этом диапазоне разница межу кодерами Nero, QuickTime AAC и Vorbis практически сходит на нет. Но здесь уже на сцену выходит тот самый Musepack. Как раз на этих битрейтах начинает проявляться его преимущество (за счет необычайно гибкого VBR режима, а также принципиально другого алгоритма сжатия):

Порог прозрачности:

То, о чем я говорил. При этом битрейте практически все кодеры дают прозрачный для большинства слушателей звук. И именно этот диапазон является оптимальным в плане размер/качество.

Кстати, у LAME MP3 в этом районе тоже находится подобный порог (VBR V2), но у этого кодека очень большие проблемы с пре-эхом (искажения предшествующие резким всплескам сигнала), а на слух часто ощущается Noise Shaping (шумы от ошибок квантования таким образом переносятся в высокочастотную область).

У таких же кодеков, как Vorbis, AAC и MPC на этом пороге начинается четкая прорисовка в композициях даже фоновых шумов.

WMA 9 Standard, максимальный битрейт воспринимаемый старыми декодерами:

Разумный максимум:

225 кбит/с повышение битрейта чаще всего уже не дает слышимого прироста качества, а размер файлов, естественно увеличивается. Но всё же, для особенно сложных композиций (и хорошей аппаратуры/ушей) существуют более высокие настройки качества. На этих битрейтах для таких кодеров как Museppack и Vorbis мне даже не удалось найти киллер-семплов (проблемные семплы, на которых явно проявляются недостатки алгоритма кодирования). И так:

Опережая ваши вопросы: да, для некоторых из этих кодеров существуют и более высокие настройки качества, но дальнейшее их повышение уже не имеет никакого смысла. Разве что вам действительно не важен объем занимаемый музыкой памяти, а поддержкой lossless ваше устройство не располагает.

Вот, собственно, и всё, чем я хотел с вами поделиться. Пробуйте, комментируйте, задавайте вопросы.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *