Трешхолд в музыке что это
Компрессия в работе со звуком
Для чего нужна компрессия?
Компрессоры и лимитеры — это специализированные усилители, используемые для уменьшения динамического диапазона — промежутка, между самым тихим и самым громким уровнем трека. Использование компрессии при записи и живом миксе может сделать звук качественнее путем контроля максимальных уровней и поддержания более высокой средней громкости. Кроме того, большинство компрессоров — как аппаратных, так и программных — имеют своё фирменное звучание, которое способно привнести замечательный окрас и тон в «безжизненный» трек. Компрессия так же используется, когда необходимо сделать звук более естественным и понятным без добавления искажений, в результате чего ваш трек будет слушаться максимально «комфортно». С другой стороны, чрезмерное сжатие может погасить ту искру, которая делала запись живой. Для тех, кто не знаком с компрессорами, знание основ позволит начать долгий путь к пониманию, как компрессия работает, и использованию её в свою пользу.
Общие элементы управления и параметры компрессора
Вне зависимости от того, какой компрессор вы используйте, и является ли он аппаратным или плагинным, существуют некоторые общие параметры и элементы управления, которые вы будете использовать, что бы настраивать его работу. Ниже приведен ряд из основных элементов компрессора.
Threshold
«Колено» отображает переходы между сжатым и несжатым аудиосигналом. Как правило компрессоры предлагают одну из, или в некоторых случаях возможность переключения между обоими, настроек: «soft knee» или «hard knee”. Некоторые компрессоры позволяют вам выбрать любое положение между двумя этими типами настроек. Как вы можете видеть на рисунке, „soft knee“ обеспечивает более плавное и постепенное сжатие, чем «hard knee».
Attack Time
Речь идет о времени, которое потребуется сигналу, чтобы стать полностью скомпрессированным после превышения порогового уровня. Более быстрая атака, как правило, от 20 мкс до 800 мкс зависит от типа и марки устройства, в то время как более медленная — в диапазоне от 10 мс до 100 мс. Некоторые компрессоры представляют это значение как дБ/сек. Быстрое время атаки может создавать искажения, изменяемые природе медленных низкочастотных сигналов (например, если цикл на 100 Гц длится 10 мс, то у атаки в 1 мс будет время, что бы изменить форму волны, что и будет формировать искажения.
Release Time
Это значение буквально противоположно времени атаки. В частности, это время, которое требуется сигналу, что бы перейти обратно в исходное состояние. Release Time будет значительно больше, чем время атаки, и в целом составляет от 40-60 мс до 2-5 секунд, в зависимости от того, с каким прибором вы работаете. Это значение также может быть представлено в виде дБ в секунду. Нормальная работа компрессора будет заключаться в установке этого значения как можно меньшим, не создавая при этом эффект «раскачки», который вызывается цикличной активацией и деактивацией компрессии. Например, если «release time» выставлено слишком маленьким и компрессор циклирует между активным и неактивным состоянием, ваш основной сигнал — как правило, бас-гитара или бочка — будут модулировать шум, в результате чего появится эффект «дыхания».
Compression Ratio
Этот параметр часто остается неправильно понятым, но он просто показывает величину ослабления, которая применяется к сигналу. Вам будет предложен широкий диапазон доступных коэффициентов сжатия в зависимости от типа и производителя компрессора, который вы используете. «Compression Ratio» 1:1 представляет собой коэффициент «единичного усиления», или, иными словами, без ослабления. Эти значения выражаются в децибелах, так что соотношение 2:1 указывает на то, что сигнал, превышающий порог на 2 дБ, будет ослаблен до 1 дБ выше порогового значения, или сигнал, превышающий порог на 8 дБ, будет ослаблен до 4 дБ после порога, и т.д. Соотношение около 3:1 можно считать умеренным сжатием, 5:1 будет средним уровнем сжатия, 8:1 начинает ряд значений сильного сжатия, а значения от 20:1 и до ∞:1 считаются ограничивающими и могут быть использованы для обеспечения сигнала, не превышающего пороговый. На диаграмме ниже показаны коэффициенты сжатия, как они относятся к входным и выходным сигналам и как ваши настройки сжатия повлияют на общий сигнал.
Output Gain
Часто компрессоры воспринимаются как приборы, делающие сигнал громче. В действительности же все компрессивно-индуцированные ослабления уменьшают сигнал на выходе. Вот тут «output gain» и вступает в игру. Вы можете использовать выходной усилитель для нейтрализации ослабления сигнала после компрессии. Некоторые компрессоры обладают индикаторами “gain reduction”, что позволяет более точно применить выходное усиление.
Большая четверка: Распространенные типы компрессии
Тип компрессора, который вы выберите, так же сыграет большую роль в общем звучании эффекта. Некоторые из них будут иметь более быстрые значения “attack”/“release”, а некоторые придадут звуку интересный окрас и винтажную атмосферу. Это список из четырех наиболее известных типов компрессии и краткое описание того, чем они отличаются.
Ламповая компрессия
Вероятно, самый старый тип компрессии. Как правило, имеет более медленную реакцию, чем другие типы компрессии. Благодаря этому, лампа привносит различные окраски и «винтажный» звук, которые почти невозможно достичь с другими компрессиями. (Пример: Fairchild 670)
Оптическая компрессия
Оптическая компрессия влияет на динамику звукового сигнала с помощью световых и оптических элементов. С ростом амплитуды сигнала световые элементы испускают больше света, что приводит к «оптическим ловушкам», ослабляющим выходной сигнал. (Пример: LA-2A Classic Leveling Amplifier)
Компрессор на основе полевого транзистора эмулирует ламповое звучание с помощью транзисторной схемы. Они быстрые, чистые и надежные. (Пример: 1176LN Classic Limiting Amplifier)
VCA-компрессия
Компрессоры на основе усилителя, управляемого напряжением, используют твердотельные элементы или интегральные схемы. Они, как правило, дешевле, чем ламповые или оптические компрессоры. Они так же меньше окрашивают звук по сравнению с другими. (Пример: dbx® 160 Compressor / Limiter)
Советы и рекомендации
Вот несколько советов для работы с компрессорами. Это, конечно же, не правила, но мы надеемся, что они помогут вам при работе с этими чрезвычайно мощными приборами. Получайте удовольствие от опыта и экспериментируйте!
Принцип работы компрессора (Fl Studio)
Данная статья является частью цикла статей «Fl Studio»
Содержание
Введение [ править ]
Перед началом чтения статьи скачайте этот проект => проект.
Принцип работы [ править ]
В данной статье работа компрессора будет рассматриваться на применении плагина Fruity Compressor. Т.к. он является очень простым не столько со стороны понимания, сколько со стороны его внутреннего устройства. ВНИМАНИЕ! на других компрессорах установки которые здесь будут приводится могут работать не так как на Fruity Compressor именно из-за их внутренних особенностей, отличающихся от классического устройства работы компрессора. К примеру плагин Waves C1 comp будет показывать отличающиеся результаты от Fruity Compressor с точно такими же настройками!
В каждом компрессоре есть 5 параметров Threshold, Ratio, Attack, Release, Gain
Звук не постоянен и имеет разные значения громкости (амплитуды) в разный промежуток времени, к примеру как на картинке ниже. В самом начале сэмпла звук громкий и далее всё тише:
Но вам к примеру необходимо сделать эти тихие звуки также отчётливо слышимыми как и в начале. Вы конечно можете применить автоматизацию на громкость, делая тихие звуки громкими в ручную, но представьте если вам нужно сделать «ровным» по громкости не одно место в треке, а к примеру 100, сколько это у вас тогда займет времени? Или же можно 1 раз настроить компрессор и он сам сделает за вас всю работу.
Threshold, Ratio [ править ]
Четыре параметра Threshold, Ratio, Attack и Release взаимосвязаны между собой. Этими четырьмя параметрами вы даёте указание компрессору как себя вести.
Откройте 1й паттерн и послушайте звук его громкость ровно 0db, на этом звуке мы будем изучать работу компрессора.
Теперь перейдите на 3й паттерн, отключите на канале компрессор, затем прослушайте и посмотрите громкость звуков:
Attack [ править ]
С помощью атаки компрессора вы можете добавить острую атаку тускло-звучащему барабану (см. паттерн 5). Или же плотности вяло звучащему басу (см. паттерн 6).
Проще говоря параметр Attack это то время за которое компрессор начнёт действовать в полную силу. Иными словами, Attack это то время за которое параметр Ratio перейдет от значения 1 к установленному вами.
Release [ править ]
Release время по истечению которого компрессор перестанет сжимать звук см. картинку ниже (пример на паттерне 7).
Параметр Release работает следующим образом. После снижения громкости звука ниже порогового значения (Threshold), звук всё ровно сжимается на тоже количество дБ, что и при прохождении пороговой точки. К примеру в нашем случае звук компрессировался в соотношении Ratio = 5:1, после громкость звука опять стала ниже порога но сжатие прекратилось не сразу, теперь компрессор начинает действовать в обратную сторону в соответствии с параметром Release = 4000мс постепенно уменьшая силу сжатия. То есть если порог в нашем примере превышался на 10дБ (сигнал сжимался на 8 дБ), а после резко стал ниже, то сжатие всё ещё продолжается на всё те же 8 дБ (-10-8=-18) (синяя стрелка на картинке), и компрессор начинает постепенно (в течении 4000мс) уменьшать сжатие.
То есть если взять более сложный пример, где громкость звука не одной и той же громкости, то поочерёдно будут срабатывать то атака, то восстановление (даже если динамические изменения будут происходить выше порога). См. рис. ниже, как видно из рисунка, Attack вступает в действие когда громкость увеличивается, а Release когда громкость уменьшается.
Пример применения параметра Release можно посмотреть на паттерне 8.
Послушайте и посмотрите звук находящийся на этом паттерне, вы услышите что звуки примерно одной громкости, для сравнения отключите компрессор и вы услышите что разница между ними очень заметна. После этого у компрессора сделайте параметр Release = 1 и вы услышите, что эти звуки будут сильно разнится по громкости.
Первый рисунок (жёлтая линия) это график уменьшения сжатия со временем. Здесь отмена сжатия происходит практически мгновенно и следующий звук начинает компрессироваться по новой. Второй рисунок со значением Release = 673. Компрессор очень долго отменяет сжатие, и второй звук начинает звучать не с новой силой, а с остатками компрессии предыдущего звука. Если расстояние между звуками будет больше 673ms (пример на паттерне 9), то компрессия применится по новой.
Почему параметрам Attack и Release нельзя выставлять очень малые значения [ править ]
Если параметрам Attack и Release выставлять очень малые значения, то они начинают очень заметно работать с полу волнами.
Откройте паттерн 13, послушайте звук и посмотрите на их громкость. Громкость одинакова = 0дб. Затем включите компрессор и вы увидите что компрессируются они по разному. Это происходит потому что у них разная частота, попробуйте увеличить значение параметра Release и громкость станет примерно одинаковой.
Данные случаи происходят потому что компрессор работает с полу волнами звука см. рис ниже:
Первые жёлтые полосы это то как ведут себя параметры атаки и восстановления при очень малых значениях, последняя жёлтая линия это то как вело себя восстановление в первом случае (паттерн 12). Именно поэтому сигнал почти не сжимался, если увеличить частоту сигнала, то соответственно и полуволны станут короче, а это значит что компрессор не успеет так быстро восстановится (второй пример паттерн 13).
Замечание: рисунок очень сильно утрирован для улучшения понимания.
Как правило очень малые значения атаки и восстановления нежелательны так как могут заметно исказить звук.
Gain [ править ]
Limiter [ править ]
У Fruity Compressor есть особенность, он в любом случае работает как лимитер (даже если не задействован Ratio = 1:1 (Ratio = 1:1 компрессор бездействует)). Но лимитирует он только те звуки которые громче 0дб (см. пример на паттерне 11).
Компрессоры с графическим отображением [ править ]
Также существуют компрессоры с графическим отображением своей работы, рассмотрим для примера компрессор Waves C1 comp:
Хочется еще раз заметить, что тема компрессии довольно трудна для понимания, особенно если вы только начинаете изучать создание музыки на компьютере. Запомните эту статью и вернитесь к ней позже, когда у вас будет больше опыта. Если вы поняли не всё описанное в этой статье, то понимание придёт со временем (если конечно вы будете пользоваться компрессором). В компрессии главное практика.
Пред тем как применять компрессию подумайте, нужна ли она вообще в вашем случае. Компрессор это тонкий инструмент его не следует применять «просто так», им можно легко испортить звук. В этой статье в некоторых местах приводились экстремальные настройки компрессора, для более заметной работы, не стоит расценивать их как руководство к действию.
Трешхолд в музыке что это
Войти
Авторизуясь в LiveJournal с помощью стороннего сервиса вы принимаете условия Пользовательского соглашения LiveJournal
Лимитирование vs клипирование.
Лимитирование – это экстримальный подход к компрессии. Компрессия снижает уровень звукового давления выше определенного порога в некой пропорции, лимитирование же создано чтобы вообще не давать уровню подниматься выше этого порога. Лимитеры, как правило, имеют простейшие элементы управления как у компрессоров и функционально схожи с компрессорами с высоким ратио и быстрой атакой.
Лимитеры используются для ограничения пикового уровня звука (уровня, который машины «слышат») без воздействия на средний уровень (который слышит человек). Это позволяет сократить запас по уровню, необходимый для звука, так что его (звук) можно сделать громче, избежав искажений.
Альтернативой лимитированию является клипирование. Да, то самое клипирование, которого обычно звукорежиссеры стараются избежать при записи и при обработке записей. В большинстве случаев оно нежелательно, но в некоторых случаях может быть использовано целенаправленно и благотворно.
Тогда как лимитирование понижает уровень пиков используя «негативный» гейн, клипирование делает тоже самое, перегружая их. Если вы посмотрите на форму клипированного звука, вы увидите, что она выглядит так, будто ее верх и низ срезан. Это перегрузка. Так или иначе, если только пик перегружен, то это занимает очень краткий промежуток времени и не очень заметно.
Когда это происходит, избыточный уровень пиков трансформируется в гармоники. Да, пики становятся грязнее. Для некоторых стилей музыки это может быть подходящей заменой понижению гейна. Сила и мощь звука в таких случаях обычно сохраняется (или даже усиливается!), но за счет потери чистоты.
threshold
перен. преддверие, отправной пункт, начало;
to stumble on (или at) the threshold плохо начать (дело) switching
нижняя граница доходов, облагаемых налогом tax
минимальная сумма, не облагаемая налогом threshold граница
психол. порог (сознания)
перен. преддверие, отправной пункт, начало;
to stumble on (или at) the threshold плохо начать (дело)
Полезное
Смотреть что такое «threshold» в других словарях:
threshold — thresh‧old [ˈθreʆhəʊld, ʆəʊld ǁ oʊld] noun [countable] the level at which something belongs in a particular class or is affected by a particular rule: • Many large mortgages were taken out, on the assumption that interest rates would remain below … Financial and business terms
threshold — thresh·old 1 / thresh ˌhōld/ n: a point of beginning: a minimum requirement for further action; specif: a determination (as of fact or the existence of a reasonable doubt) upon which something else (as further consideration or a right of action)… … Law dictionary
Threshold — (engl. für „Schwelle“) bezeichnet einen Begriff aus der Teilchenphysik, siehe Schwellenergie einen Arbeitspunkt in MOS Transistoren (dt. Schwellspannung), siehe Metall Oxid Halbleiter Feldeffekttransistor einen Optimierungsalgorithmus, siehe… … Deutsch Wikipedia
Threshold — Thresh old, n. [OE. threswold, [thorn]reshwold, AS. [thorn]rescwald, [thorn]erscwald, [thorn]erscold, [thorn]rescold, fr. [thorn]rescan, [thorn]erscan, to thresh; akin to Icel. [thorn]reskj[ o]de, [thorn]r[ o]skuldr, Sw. tr[ o]skel, Dan.… … The Collaborative International Dictionary of English
threshold — O.E. þrescold, þærscwold, þerxold doorsill, point of entering, first element related to O.E. þrescan (see THRESH (Cf. thresh)), with its original sense of tread, trample. Second element of unknown origin and much transformed in all the Germanic… … Etymology dictionary
threshold — threshold. См. порог. (Источник: «Англо русский толковый словарь генетических терминов». Арефьев В.А., Лисовенко Л.А., Москва: Изд во ВНИРО, 1995 г.) … Молекулярная биология и генетика. Толковый словарь.
Threshold — [englisch, θreʃəʊld; wörtlich »Schwelle«], an bestimmten Effektgeräten (Flanger, Limiter, Noisegate u. a.) einstellbarer Pegel (Schwellwert), bei dessen Erreichen der beabsichtigte Effekt ausgelöst wird … Universal-Lexikon
threshold — is spelt with one h (contrast withhold), and the h is optionally silent or aspirated in speech … Modern English usage
Как я решал соревнование по машинному обучению data-like
Привет, Хабр. Недавно прошло соревнование от Тинькофф и McKinsey. Конкурс проходил в два этапа: первый — отборочный, в kaggle формате, т.е. отсылаешь предсказания — получаешь оценку качества предсказания; побеждает тот, у кого лучше оценка. Второй — онсайт хакатон в Москве, на который проходит топ 20 команд первого этапа. В этой статье я расскажу об отборочном этапе, где мне удалось занять первое место и выиграть макбук. Команда на лидерборде называлась «дети Лёши».
Соревнование проходило с 19 сентября до 12 октября. Я начал решать ровно за неделю до конца и решал почти фулл-тайм.
Краткое описание соревнования:
Летом в банковском приложении Тинькофф появились stories (как в Instagram). На story можно отреагировать лайком, дизлайком, скипнуть или просмотреть до конца. Задача предсказать реакцию пользователя на story.
Соревнование по большей части табличное, но в самих историях есть текст и картинки.
План рассказа
Метрика
Для проверки точности решений используется формула, нормированная на максимально возможный результат:
Какие данные есть:
Далее я подробно расскажу о каждом кусочке данных, как я его обрабатывал и какие признаки (далее фичи) извлекал.
Информация о пользователе
что есть изначально:
как фичи используем всё вышеперечисленное кроме job_title, т.к. предполагаем, что job_position_cd нормально описывает должность человека.
Транзакции
что есть изначально:
MCC — Merchant category code. Это стандартизованный код услуги, которую предоставляет получатель. Эта информация открыта, вот расшифровка. Эти коды можно удобно разбить на категории, например: entertainment, hotels и т.п.
Для каждого customer_id сопоставим следующие фичи:
Stories
Всего историй у нас 959.
что есть изначально:
выглядит json подобным образом:
Это такое дерево элементов, где каждый элемент описывается ключами: [‘guid’, ‘type’, ‘description’, ‘properties’, ‘content’]. В ‘content’ лежит список дочерних элементов. История состоит из страниц. На страницу накиданы фон, текст, картинки. Конструктора историй у нас не было, а самому отрисовать всё это достаточно сложно и не факт, что значительно поможет в дальнейшем.
Регулярками вытащим весь текст и соответствующий размер шрифта. Извлечём следующие фичи:
Реакции
что есть изначально:
Обработаем время и как фичи добавим:
Далее ещё добавится группа фичей исходя из данных по реакциям, а пока что идём в бой с этим арсеналом фичей делать бейзлайн.
Какую задачу мы решаем и как формировать предсказание?
Лучший подход, который использовал весь топ, следующий: cведём задачу к многоклассовой классификации, т.е. предсказываем вероятность каждой реакции. Считаем матожидание оценки для данной истории
:
Бинаризуем :
— наш ответ для объекта
, который может принимать значение
Модель
С самого начала и до конца я использовал CatBoost. Обусловлено это тем, что CatBoost из коробки строит полезные статистики для категориальных фичей. А статистика по пользователю — то, насколько он склонен к каким реакциям, и статистика по истории — то, как чаще всего не неё реагируют, являются самыми сильными фичами в этой задаче.
Как CatBoost работает с категориальными фичами хорошо объяснено в документации.
TLDR:
берём значение признака, например, один из customer_id, считаем процент случаев, когда этот customer отреагировал лайком, дизлайком, скипнул или просмотрел. Получим 4 числа. Заменяем customer_id на эти 4 числа и используем их как признаки. Делаем так для каждого customer_id.
Текущий результат
С текущими фичами, с неоптимизированным катбустом, на публичном лидерборде я занимал на тот момент 11 место с результатом 0.31209
Киллер фичи
В какой-то момент появилась гипотеза, что приложение может показывать истории чаще или реже в зависимости от того, как пользователь отреагировал на неё ранее. Давайте тогда добавим фичи, которые будут говорить:
Конечно же, эти фичи использовать в продакшне нельзя, т.к. их банально не будет на момент применения модели, но в соревновании любые средства хороши.
Итак, сказано — сделано. Получили 0.35657 на лидерборде.
Оптимизация модели
Перебирал параметры я с помощью байесовской оптимизации
Из интересного можно упомянуть параметр max_ctr_complexity, который отвечает за максимальное количество категориальных фичей, которые могут быть скомбинированы. Пример под спойлером.
Assume that the objects in the training set belong to two categorical features: the musical genre (“rock”, “indie”) and the musical style (“dance”, “classical”). These features can occur in different combinations. CatBoost can create a new feature that is a combination of those listed (“dance rock”, “classic rock”, “dance indie”, or “indie classical”).
Интересные наблюдения
CatBoost можно обучать на GPU, это заметно ускоряет обучение, но также вводит много ограничений, особенно касательно категориальных фичей. В этой задаче обучение на GPU давало результат сильно хуже, чем на CPU.
Важность фичей по мнению CatBoost. Во многом названия фичей говорят сами за себя, но некоторые, не самые очевидные, из топа, я поясню:
Картинка кликабельна.
Давайте посмотрим на распределение реакций с течением времени:
Т.е. в какой то момент распределение по реакциям сильно меняется.
Трешхолд предсказаний
На последнем шаге получения итоговых предсказаний добавим трешхолд:
В последней модели у меня было что-то около 66% единичек, если бинаризовать с трешхолдом равным 0. Оказалось, что действительно, уменьшение количества +1 давало сильный прирост качества. Оценивались только последние 3 посылки, поэтому я заслал предсказания лучшей модели с разными трешхолдами так, чтобы процент плюс единичек был примерно 62, 58 и 54.
По итогу на публичном лидерборде мой лучший результат был 0.37970.
Результаты соревнования
Как обычно принято в соревнованиях по машинному обучению, когда отправляешь предсказания в систему, результат оценивается только по части всей тестовой выборки. Обычно около 30%. Результаты для этой части отражаются на публичном лидерборде. По оставшейся части теста оценивается итоговый результат, который отображается после окончания соревнования на приватном лидерборде.
В конце соревнования на публичном лидерборде положение было таким:
На приватном лидерборде, по которому считались итоговые результаты, мне повезло и ребята по какой-то причине с первого места упали на 4ое. Вот итоговое положение.
Что не сработало
Выводы
Соревнование получилось интересным, поскольку объединяло много компонентов, таких как табличные данные, тексты и картинки. Было много пространства для исследований, много с чем ещё можно было бы экспериментировать. В общем, скучать не пришлось.