joint stereo что это

Joint Stereo

Совмещённое стерео

В стерео режиме MP3 формат может использовать Joint Stereo (JS) кодирование для увеличения коэффициента сжатия файла. Технологию Joint Stereo можно разделить на две: Intensity Stereo и Mid / Side Stereo

Intensity Stereo

Во многих среднечастотных Hi-Fi системах есть единственный сабвуфер. Однако, вы обычно не слышите, что звук идет именно оттуда, и ещё реже вы слышите, что звук идет от саттелитов. На самом деле, для очень низких и очень высоких частот, человеческое ухо не может распознать местоположение источника звука с полной точностью. MP3 формат может возпользоваться этим, при помощи режима Intensity Stereo (IS). Во время записи некоторые частоты, записанные как монофонический звук, следуют за некоторой дополнительной информацией для того, чтобы восстановить впоследствии минимум «объемности» звучания.

Mid / Side Stereo

Другая технология совместного стерео называется Mid / Side (M / S) Stereo. Когда левый и правый канал приблизительно одинаковы, тогда кодируется средний (L+R) и боковой (L-R) каналы, вместо левого и правого. Это позволяет уменьшить размер конечного файла за счет экономии битов для бокового канала. Во время воспроизведения, MP3 декодер восстанавливает левый и правый каналы.

Реализации

Во время сжатия в формат MP3, технологии совмещенного стерео могут варьироваться от фрейма к фрейму, включая обычное L / R стерео. Но, существует программное обеспечение, которое позволяет форсировать кодирование именно с помощью технологии Joint Stereo. Например, это позволяет делать кодер LAME.

Источник

Joint stereo что это

Описание: DSP-фильтры и всё что касается вывода звука

P.S. Совмещение ников забавное B)

В 90-е годы, когда все пользовались энкодером от Fraungopher, алгоритм joint stereo (впрочем, как и алгоритм VBR) были реализованы в этом энкодере ПРЕОТВРАТНО. Вместо нормальных полноценных стереодорожек получалась каша с взаимопроникновением каналов друг-в-друга и «перекрученной» фазой сигнала. Поэтому пользователи его так и называли: «Богомерзкий joint stereo». Но на спектрограмме такой сигнал выглядел более «насыщенным» и красивым.

И ещё (цитаты из технической литературы):

Существует несколько вариантов записи двухканального звука в MP3.

Наконец, на низких битрейтах (диапазон 96-128 кбит/с) начинается полный кошмар для уха аудиофила. Режим Joint Stereo, применение которого на данных битрейтах вполне оправдано, приводит либо к фазовым искажениям (своеобразная металлизированная «шепелявость», «мутации звука»), либо к смазанности стереопанорамы вместе с другими артефактами сильной компрессии (неестественность, «роботизированность» звука). При использовании режимов Stereo или Dual Channel на таких низких битрейтах уже элементарно не хватает информационной емкости потока для сохранения более-менее значимых сигналов из исходной записи. В результате качество хуже, чем при использовании Joint Stereo.

В GPSYCHO реализован и переменный битрейт (VBR, variable bitrate), и технология mid/side stereo, дающая иногда лучшие результаты, нежели технология объединенного стерео (joint stereo) и другие разработки, такие, как ABR (average bitrate), улучшенная квантизация и т. п.

Сущность технологии переменного битрейта (или VBR) заключается в увеличении битрейта в тех местах, где требуется более точная передача звука, и соответственно в его уменьшении, когда человеческое ухо менее чувствительно к потерям сжатия. При работе VBR указывается наименьший и наибольший битрейт, в рамках которых он будет изменяться при компрессии звука. Битрейт для какого-то определенного участка звука выбирается, естественно, самой программой автоматически. MP3-файл, закодированный с переменным битрейтом, занимает, как правило, меньше места и обладает лучшим качеством, в сравнении с той же композицией, сжатой с постоянным битрейтом.

Технология mid/side stereo дополняет систему объединенного стерео (joint stereo). Без их применения MP3-компрессор использует классическую схему стереосжатия, когда левый и правый канал звука сжимаются раздельно. При joint stereo кодируется общий поток звука для обоих каналов, а затем отдельно записываются различия в звучании правых и левых каналов. Обычно эти отличия минимальны, что позволяет достигать меньшего размера результирующего сжатого файла при сохранении высокого качества. Модель GPSYCHO добавляет технологию mid/side stereo, при которой анализируются не левый и правый канал, а средний и боковой. Для среднего канала отводится больше места, чем для бокового. Если звук имеет небольшие стереовариации, то в боковом канале будет появляться незначительное количество информации и использование mid/side stereo приводит к серьезным выигрышам в объеме сжатия. В противном случае, когда правый и левый канал сильно различаются, в боковом канале аудиопотока будет содержаться большое количество данных, и результат применения mid/side stereo проявится в виде шумов как в левом, так и в правом канале.

Источник

от нарисовал схему, специально для тех, кому все еще непонятно, «куда уходят байты. » (далее на мотив популярной песни «Куда уходит детство»)

И для тех, кто по-прежнему упорно жмет в 320 kbps в режиме Stereo или Dual Channel, и удивляется, почему же это звук такой плохой? По сравнению с J-Stereo (хоть на слух, хоть на сонограммах).

Эти люди предполагают, что при переключении из J-Stereo в Stereo канал собственно звука (а не стереоэффектов) чудесным образом расширяется вдвое (а битрейт вырастает до умопомрачительных размеров и начинает симолизировать собой прорыв человечества в Космос). Хотя на самом деле этот канал, наоборот, по сути становится почти вдвое меньше (кодируемая информация дублируется дважды, не считая стереоэффектов), что эквивалентно снижению эффективного битрейта.

— вот как думаете вы (переключая из J-Stereo в Stereo или Dual Channel)

Left Channel Right Channel

вот как это происходит на самом деле

Left Channel Right Channel

а это специально для тех, кто так ничего и не понял:

Источник

Про формат МР-3

Компрессия достигается при активном использовании известных особенностей человеческого слуха в плане восприятия аудиоинформации, что позволяет экономить на наименее значимых с точки зрения человеческого слуха деталях звучания. На проведенных тестах специально нанятые опытные прослушиватели не смогли различить звучание оригинального трека на CD и закодированного с коэффициентом сжатия 6:1.

Описание процесса кодирования

Подготовка к кодированию. Фреймовая структура

Перед кодированием исходный сигнал разбивается на участки, называемые фреймами, каждый из которых кодируется отдельно и помещается в конечном файле независимо от других. Последовательность воспроизведения определяется порядком расположения фреймов. Каждый фрейм может кодироваться с разными параметрами. Информация о них содержится в заголовке фрейма.

Начало кодирования

Кодирование начинается с того, что исходный сигнал с помощью фильтров разделяется на несколько, представляющих отдельные частотные диапазоны.

Работа психоакустической модели. Часть первая

Для каждого диапазона определяется величина маскирующего эффекта, создаваемого сигналом соседних диапазонов и сигналом предыдущего фрейма. Если она превышает мощность сигнала интересующего диапазона или мощность сигнала в нем оказывается ниже определенного опытным путем для данного диапазона порога слышимости, то данный диапазон не кодируется.

Работа психоакустической модели. Часть вторая

Для оставшихся данных для каждого диапазона определяется, сколькими битами на сэмпл мы можем пожертвовать, чтобы потери от дополнительного квантования были ниже величины маскирующего эффекта, соответственно чему и производится пожертвование. При этом учитывается, что потеря одного бита, ведет к внесению шума квантования величиной порядка 6 dB.

Завершение кодирования

После завершения работы психоакустической модели формируется итоговый поток, который дополнительно кодируется по Хаффману, на этом кодирование завершается.

На практике схема несколько сложнее, так как необходимо согласовываться с требованиями битрейта. В зависимости от кодера это приводит к релаксациям при повышении битрейта и ужесточению критериев при его понижении. Суть в том, что даже после обработки с помощью психоакустической модели оставшаяся аудиоинформация достаточно объемна, приходится идти на потери.

Кроме того, кодирование стереосигнала допустимо четырьмя различными методами:

1. Dual Channel

Каждый канал получает ровно половину потока и кодируется отдельно как моно сигнал. Рекомендуется на битрейтах от 256kbs (субъективно).

2. Stereo

Каждый канал кодируется отдельно, но когда кодер умудряется отбросить столько «лишнего» в одном канале, что код не заполняет полностью выделенный для данного канала объем, то кодер может использовать это место для кодирования другого канала. В документации говорится, что этим избегается кодирование «тишины» в одном канале, когда в другом есть сигнал.

Но документация, на мой взгляд, неясно объясняет, что именно происходит. Отсюда и рекомендация в предыдущем пункте.

Режим установлен по умолчанию в большинстве ISO-based кодеров, а также используется продукцией FhG IIS на битрейтах выше 192kbs. Применим и на более низких битрейтах порядка 128kbs-160kbs.

3. Joint Stereo ( MS Stereo )

Стереосигнал раскладывается на средний между каналами и разностный. При этом второй кодируется с меньшим битрейтом.

Это позволяет несколько увеличить качество кодирования в обычной ситуации, когда каналы по фазе совпадают. Но приводит и к резкому его ухудшению, если кодируются сигналы, по фазе не совпадающие. В частности, фазовый сдвиг практически всегда присутствует в записях, оцифрованных с аудиокассет, но встречается и на CD.

Режим выставлен по умолчанию продукцией FhG IIS для битрейтов от 112kbs до 192kbs.

4. Joint Stereo ( MS/IS Stereo )

Вводит еще один метод упрощения стереосигнала, повышающий качество кодирования на особо низких битрейтах. Состоит в том, что для некоторых частотных диапазонов оставляется уже даже не разностный сигнал, а только отношение мощностей сигнала в разных каналах. Понятно, для кодирования этой информации употребляется еще меньший битрейт.

При применении данного режима происходит потеря фазовой информации, а также имеет место меланхоличное превращение противофазного сигнала кодером в полное отсутствие оного (сигнала).

О граблях

Сразу следует заметить, что с оценкой качественности в головах большинства пользователей образовалась такая путаница, что распутать ее нелегко. Почему-то стало считаться, что мнение аудиофилов неприоритетно, а приоритетно мнение пользователей с никакой аппаратурой и соответствующим слухом. Некоторые также путают факт наличия низкого или высокого уровня шумов с высоким или низким качеством сигнала, такая прямолинейная оценка в принципе неверна, не только для MP3. Это лишь одна из характеристик традиционной аппаратуры, которую следует осторожно переносить на цифровое аудио.

Например, благодаря высокой скорости очень популярны кодеры от XingTech, хотя они обеспечивают самое грубое кодирование на любом фиксированном битрейте по сравнению с другими кодерами. При переменном битрейте каждый фрейм закодирован хуже, чем был бы при использовании других кодеров.

Проблема в том, что обо всем этом почти нигде не написано. Я имею в виду, на сайте производителя и других авторитетных.

Послужило основной причиной формирования и продолжает способствовать дальнейшему ухудшению ситуации то, что на традиционно устанавливаемой на компьютерах неважной аудиоаппаратуре, состоящей обычно из слабой аудиокарты и дешевых колонок, закодированные кодерами от XingTech MP3 звучат почти так же, как и сделанные любыми другими кодерами, а CD Audio звучит столь же неважно, как MP3 128kbs (сжатие 12:1). Поэтому последнему приписывается CD-качество, а кодеры от XingTech не перестают пользоваться популярностью.

В силу чего еще одной большой трудностью поначалу становится устоять перед соблазном использования в своей фонотеке таких популярных низких битрейтов, как 128kbs. Обычно забывают, что битрейты порядка 112kbs-128kbs по качеству применимы для трансляций и ознакомительного прослушивания, но не для создания архивов музыки качества CD Audio.

Кстати, речь в обзоре идет именно о кодировании CD Audio.

Несколько слов о разных битрейтах

Я, когда начинал разбираться с MP3, изначально искал именно и только полноценную замену CD Audio, с тем же качеством, но с меньшим объемом. Такую возможность MP3 дает. Любые же потери качества и нервов, пусть и с утешительным призом в виде дальнейшего уменьшения объема, меня всегда интересовали со знаком минус, и я пользуюсь и собираюсь продолжать пользоваться исключительно 320kbs MP3. Поясню, на чем основан мой выбор.

С другой стороны, те же тесты определили MP3 160kbs-192kbs как в большинстве случаев вполне приемлемые для хранения аудио на компьютере, например, в компьютерных играх, когда внимание отвлечено.

Таким образом, любой может свободно уменьшить объем имеющегося у него CD Audio более чем вчетверо, используя 320kbs, и быть спокойным за качество. Или легким аутотренингом внушить себе спокойствие и использовать MP3 256kbs, имея сжатие в шесть раз, но безопасность этого битрейта в плане сохранения качества убедительно доказана не была, хотя разница в любом случае не может быть большой. И тем не менее.

Так или иначе, используя MP3 256kbs и 320kbs, мы можем без особых проблем создавать свои обширные фонотеки на CDR.

С другой стороны, самым популярным был и остается битрейт 128kbs. При нем мы имеем скорее качество аудиокассеты, записанной на не самом лучшем магнитофоне, хотя и с очень низким уровнем шумов. Романтически настроенные разработчики даже назвали это «CD качеством», хотя решительность такого заявления вызывает некоторое удивление. Тем более, что результаты официальных тестов совсем другие.

Вскоре после того, как народ осознал, что попало ему в руки, в Сети самообразовались обширные залежи нелегальных MP3-файлов, кампанию борьбы с которыми недавно провела RIAA, а осенью 98-го начали выпускаться аппаратные плееры MP3, в том числе модели для авто. Хотя вначале RIAA пыталась и этому помешать. В итоге MP3 стал первым массово признанным форматом хранения аудио после CD-Audio, а RIAA срочно ищет формат, который бы не допускал нелегального распространения аудиотреков через Интернет, и при этом в головах многочисленных любителей музыки занял бы место MP3.

VBR & XingTech

Все сказанное выше о битрейтах относится к постоянным битрейтам.

Недавно в XingTech был разработан кодер, использующий технику переменного битрейта (VBR), то есть разные участки трека кодируются с разным битрейтом. Предполагается, что кодер должен выбирать битрейт индивидуально для разных участков трека, исходя из степени их сложности для кодирования. Это в значительной степени реабилитирует репутацию фирмы, которую та предыдущей серией своих MP3 кодеров изрядно подпортила (а также продолжает портить качеством своих кодеров при работе в режиме постоянного битрейта, который тоже сохранен).

Но из самой сути нововведения следует, что тестирование качественности такого кодера должно быть крайне затруднено. С чем мы и имеем дело в действительности. Приемлемых тестов так никто и не провел, хотя кодер вышел уже, можно считать, несколько месяцев назад. А их требуется много, так как возможно наличие слабых мест анализатора, приводящих к неверным решениям о достаточности выбранного битрейта. Особенно это касается тихих сигналов, которые все же важны, несмотря на все теоретические результаты. Учитывая вышесказанное и то, что сам алгоритм кодирования от Xing не является лучшим (грубо кодирует) по сравнению с аналогичными других производителей (хотя теперь и перестал подчистую резать частоты выше 16kHz), приходим к весьма скептическому настрою.

В целом, использование VBR в реализации XingTech аудиофилам не рекомендуется, по меньшей мере пока. Увеличение коэффициента сжатия не революционно, при этом можно напрасно извести массу нервов без существенной выгоды. Кодеры от XingTech стали известны благодаря своей скорости, достигаемой за счет посредственного кодирования, а разрекламированное повышение частоты среза с 16kHz до 20kHz, само собой, не устраняет погрешностей кодирования, что само по себе может служить достаточным основанием для рекомендации не пользоваться такими кодерами. Хотя раньше, когда частоты выше 16kHz в закодированном сигнале практически отсутствовали, было еще хуже.

Остается надеяться на выход поддерживающего VBR кодера от FhG IIS, хотя, полагаю, там все же предпочтут заняться более перспективными форматами. Также, конечно, возможна модификация кода ISO, даже понятно, в каком направлении. Только едва ли кто-нибудь будет этим заниматься.

Способы хранения MP3

Стандарт MP3 не определяет точного стандартного математического алгоритма кодирования, это целиком и полностью на совести разработчиков кодеров. Вместо этого он определяет общую схему процесса кодирования, а также формат закодированного фрейма. Сами последовательности фреймов могут передаваться потоком (streaming) или храниться в файлах.

MP3 файл, как и поток, состоит из последовательно расположенных фреймов, между которыми может содержаться произвольная информация. Главное, чтобы не было совпадений с сигнатурой начала фрейма, хотя плеер NAD способен справляться и с этим (но то, как он это делает, приводит к бессилию перед переменным битрейтом).

Часто к последовательности фреймов добавляют стандартный заголовок мета-аудиоформата WAV, и получается то, что называют WAV-MP3. Немного подробнее о последнем будет сказано ниже, когда будет описываться ACM pro codec. Еще чаще к MP3 файлу добавляется информационный блок ID3v2, содержащий информацию о исполнителе, жанре, названии композиции, и другую подобную информацию о треке. Он добавляется в конце файла. В середину пока никто ничего ставить не придумал. Хотя, вообще говоря, может представлять некоторый интерес вставка спецтега для VBR с информацией о том, в какой части трека мы, собственно, находимся.

Каков характер потерь?

Источник

Как правильно кодировать аудиофайлы в MP3, или Почему не все кодеки одинаково полезны

Не будем морщить носы — без MP3 сегодня никуда. WEB-презентация, автомобиль, телефон или другой портативный гаджет, когда в устройстве нет поддержки ни FLAC, ни Apple Lossless, не говоря уж о других редких форматах сжатия звуковых файлов. Но даже в этих непростых условиях можно оставаться требовательным слушателем, а степень деградации качества сигнала сделать осознанной.

Периодически возникают сообщения о новом кодеке, который-де побил старую «эмпетриху». Какие-то из них получают ограниченное распространение, например — Ogg Vorbis, другие остаются экзотикой. Тем не менее, не они, а именно MP3 остается в главном фокусе нашего интереса, как формат, по которому наблюдается полный консенсус среди всего воспроизводящего аудиооборудования. И вот вопрос, в каком битрейте его готовить?

Казалось бы, ответ очевиден — с емкостью носителей сейчас проблем не наблюдается. Гигабайт туда, гигабайт сюда — ставь 320 кбит/c и не разводи мелочную экономию со всякими VBR-режимами. Но не тут-то было. По сути, 320 кбит/c — это всего лишь формальный диаметр трубы, но что по ней течет и можно ли это пить, решается в другом месте.

320 кбит/с ≠ 320 кбит/с

Начнем с полевого теста. Мой портативный рекордер Sony PCM-D100 имеет две цепи АЦП: таким образом, можно одновременно фиксировать аудиосигнал как в PCM, так и MP3 формате. Его мы и установим на искомые 320 кбит/c, а PCM оформим в стандартные 16 бит/44 кГц. Из этого же РСМ-файла затем будем вручную перепаковывать файлы в 320 кбит/c, но уже по версиям того или иного кодера. Я намеренно выполнил запись одинокого инструмента (фортепиано) с высоким фоном окружающего шума, чтобы по изменению его характера можно было наглядно оценить прирост дополнительных артефактов.

Оригинальная PCM-запись 16 бит/44.1 кГц, выполненная рекордером Sony PCM-D100

Параллельная МР3-версия от рекордера Sony выглядит вполне адекватной. Характер шума становится немного более грубым, «зернистым». Спектрограмма показывает, что, в отличие от PCM-версии, высокие частоты фильтруются на 22 кГц, то есть практически в полушаге от потолка возможности дискретизации. Но в целом отличия от полноценной PCM-версии минимальные.

Дубликат MP3 320 кбит/c, выполненный непосредственно рекордером Sony PCM-D100

Одной из популярных оболочек для конвертирования является dBpowerAMP Music Converter. Он многое кодирует в обе стороны: WAVE, MP3, MP4, WMA, Ogg Vorbis, AAC, Monkeys Audio, FLAC. Даже ресемплингом занимается. Но нас интересует качество обработки в 320 кбит/c.

На странице настроек можно выбрать несколько алгоритмов: Lame, Fraunhofer и Helix. Сначала пробуем самый продвинутый Lame. Добросовестность кодирования ставим на Slow (High Quality) и никаких Joint Stereo.

Батюшки, а это что за новости? Спектр жестко отсечен по 19 кГц, а характер шума начиная от 16 кГц стал еще более грубым и чешуйчатым. Вот тебе и Slow (High Quality)… Может быть, старый-добрый Fraunhofer исправит ситуацию?

320 кбит/c по версии Lame 3.99 в оболочке dBpowerAMP — пресет Slow (High Quality)

Кошмар, а Fraunhofer вообще отчекрыжил все, начиная с 16 кГц. И это, замечу вам, те же самые 320 кбит/c, практически CD-качество по заверениям разработчиков. Что же тогда творится на 192 кбит/с? Кодер Helix не может ответить даже на этот вопрос, у него предельный битрейт 160 кбит/c, так что и смотреть его не будем.

320 кбит/c по версии кодера Fraunhofer

Посмотрим возможности популярного плеера Foobar2000. В нем используется кодек Lame предыдущей версии 3.98. Здесь следует напомнить, что любые программы, использующие Lame, хоть dBpowerAMP, хоть Foobar2000 — это, так называемые, front-end оболочки, то есть интерфейс к работе модуля. Сам же Lame довольно гибко управляется командной строкой, где можно указать прорву условий — битрейт, пресеты для VBR, ширину фильтров и прочее. Но для всего этого в Foobar следует создать отдельный кастомный пресет со списком задач командной строки. А мы пока смотрим работу кодера по умолчанию. В Foobar стоит простая шкала — Best Quality равно 320 кбит/с.

Этот вариант, конечно, оказался лучше Fraunhofer, но адаптивный фильтр по чуть-чуть надкусил спектр в районе 19 кГц. Психоакустическая модель определенно разбушевалась!

320 кбит/с по версии Lame 3.98 в оболочке Foobar2000 — пресет Best Quality

Я вообще не понимаю, почему в lossy-кодировании все кодеки первым делом набрасываются на высокие частоты, пускай и малослышимые? Энергии, «массы» аудиосигнала там, в отличие от басов, совсем немного. Экономия выходит на копейку, а все легкое и нежное из фонограммы выдувается. А потом, когда все это убрали из фонограммы, и получается тот MP3, который долго слушать довольно утомительно. Может лучше бы резали сначала инфраниз, стоит же рокот-фильтр в фонокорректорах, например, и никто не жалуется.

Найди правильную опцию

В моем dBpowerAMP стоит Lame 3.99. В разделе advanced можно увидеть суть командной строки Lame, которая по умолчанию выглядит следующим образом:

Эти символы обозначают постоянный битрейт 320 кбит/с, качество нойз-шейпинга и алгоритма обработки «2» — т.е. высокое, но еще не максимальное, которое обозначается цифрой «0». Функция «replaygain», которая снижает уровень сигнала для предотвращения клиппирования, не задействована. Но самая полезная опция — «-k», которая активирует обход фильтра, не только отсутствовала, но и действительно более не поддерживается в современных кодеках Lame.

Конспирологическая версия гласит, что возможность не трогать спектр отменили, чтобы избежать подделок под lossless-форматы. Оптимисты говорят, что, наоборот не в спектре счастье, да и психоакустическая технология была существенно доработана. Но я бы все-таки предпочел видеть все частоты на месте, максимально приближенными к оригиналу. В dBpowerAMP, как и многих других «оболочках», оказалось невозможно прописать кастомные настройки Lame.

Можно наткнуться на предания старых людей о том, что нынешние версии никуда не годятся, а все хорошее закончилось на 3.93.1. Кодер, который я нашел, не захотел работать в моем Foobar2000. Может у кого-то получится — дерзайте и сообщите в комментариях о результатах. Настройку компонентов можно посмотреть здесь.

Словом, эта карусель вокруг не такого уж и ценного формата сжатия данных начала откровенно надоедать. И тут коллега Максим Семейкин из журнала ProHighEnd напомнил мне о программе EAC, который в отсутствие необходимости я уже стал забывать, спасибо ему. Оказалось, что у EAC вполне дружественный интерфейс, где даже рассказывается, какие инструменты Lame собирается применить к вашему WAV-файлу, например:

Проклятый 3.93.1 так и не завелся, так что я плюнул и взял еще более древнюю версию 3.90.3, и, наконец выставил в командной строке EAC опции «–k» и «–q0». Вот этот вариант меня и устроил более всего.

Попробуйте мои или сделайте свои варианты. Возможно, у вас будут другие впечатления. Тестовые файлы можно забрать, послушать и изучить здесь.

Я вообще не понимаю, почему в lossy-кодировании все кодеки первым делом набрасываются на высокие частоты, пускай и малослышимые? Энергии, «массы» аудиосигнала там, в отличие от басов, совсем немного. Экономия выходит на копейку, а все легкое и нежное из фонограммы выдувается.

Там самая большая дельта (изменения по времени), соответственновсе паковщики работают с ней, отрезаешь по 16Кгц это вот сразу не думая на 30% уменьшил. И там сигнал не музыкальный а весьма стахастический, плохо поддающийся сжатиям мп3

ну какие 30 процентов? Все файлы в обзоре практически одинакового размера, а разница сами видите.

См теорему котельникова и следствия

паковщики работают по другой модели

конечно, но фундаментальные законы при этом сохраняются

значит законы опрокинуты вместе с фундаментом )

тогда поздравляю с открытием)))

я послушал все ваши файлы на Audio-Technica AT-PHA100 + Klipsch x20i, через прямой аутпут из f2k. Файлы звучат практически идентично(разве что lame398 чуть тише). Что еще раз говорит, за то, что кодеки срезают ненужный шум. Давайте сделаем тест мощных файлы.

не идентично, послушайте на колонках

во-первых немного разный характер фона

я бы хотел посмотреть на теже тесты с более насыщенными информацией файлами. Возможно, только лишь возможно, более новые версии кодеков намеренно срезают полосу шумов в 16+кГц, так как там действительно нет значимой информации.

Все таки мп3 построено на психоакустической модели сжатия, и как раз весь его смысл в том, чтобы отрезать лишнее.

срежут с информацией или без т.к. lowpass filter работает в установленном диапазоне

и на выходе 320кбит и никаких фильтров

insane использует joint stereo

вас не смущает, что алгоритм сам отключает jstereo, при сверке разницы каналов исходного файла? К тому же, в записях где стерео панорама не ощущается, больше битрейта уйдет на сохранение общей детализации. Помните, кодек ограничен в 320кбит и работает, чтобы поместить в этот «тунель» максимум информации.

поищите статьи по BMLD (Binaural Masking Level Depression)

делайте и выкладывайте сюда

я к тому, что в вашей статье вы искусственно заставили кодек работать в 2 дорожки по 160кбит, хотя в вашем конкретном файле ЛОГИЧНО применить jstereo и получить более детальный результат. Сейчас немного освобожусь и сделаю свой вариант пережатия.

Скорее «убрать» то не слышно или почти не слышно на бюджетных аудио системах.

Тем более на компьютере для которого он был предназначен изначально. имхо

ЗЫ На сколько я помню первые мп3 файлы не имели битрейта более 192 к.бит/сек.

на комплекте наушников с усилителем почти за 1300 евро разница едва уловима. И все же, в записи автора настолько мало контента, что обсуждать, на мой взгляд, нечего.

вы невнимательно считали посыл материала

я понял смысл материала. вы не поняли смысл МОЕГО посыла.

а паразитный звон после ЦАПа надо фильтровать, а Audio Note не фильтрует и всем нравится

и звукореж должен компрессануть динамику в 0 дб для мяска, а мы неблагодарные чего-то еще и бурчим

от разработчиков в первую очередь ждут оптимального размер файла и скорости кодирования

ну да, ведь именно поэтому форумы hydrogenaudio просто завалены обсуждениями качества того или иного подхода.

значит мой подход вот таков

алгоритм фраунхофер мне тоже не нравится, хотя по звучанию он тоже мало отличим от исходного файла. LAME работает лучше.

Как вам такой вариант сжатия? Lame3.1a2 vbr

спектрограммы оригинала и файла ниже. кодек смело дошел до 22кГц, что есть категорически хороший результат.

обрезает ваш insane, не выдумывайте

и по пиковым уровням есть ошибки

мы говорим сейчас о разнице в 0.37дб на частоте в 22кГц. При том, что файл в 7 раз меньше оригинала.

понятия не имею, что это за список

Выше выложил аудиофайл в Lame3.1vbr320кб в котором polyphase lowpass filter disable.

Предлагайте сложнее материалы, для большей наглядности.

Всё верно. Лэйм в последних версия полностью основывается на психоакустике.

Вот интересное тестирование кодеков. Lame3.100VBR оставляет позади 3.99

Господа, судя по этой статье и комментариям, у вас очень много свободного времени.

Не в наличии свободного времени дело!

Мне, например всегда были интересны сравнительные прослушивания разных звуковых форматов, о чём много писал в форуме на ixbt, например т ы р к

Esuro и ilan, вы вообще серьезно считаете, что кодер 3.99 такой умный и лучше меня знает, где есть полезный спектр с музыкой, а где нету и какие частоты мне следует слушать?

а можно мне положить с прибором (электронным!) на мнение кодера 3.99 и комьюнити гидрогена?

вот что делает ваш insane с записью с плотным спектром

Я кодирую сейчас в Lame 3.100Alpha2. 320кб в VBR. ключ пока не скажу))). спектр там не обрезается и отличий в своих mp3-воспроизводящих устройствах я не вижу.

а без mp3 до сих пор никуда. это единственный верный вывод в вашей статье.

Один из файлов был кодирован 3.1а2, второй 3.99.5. ключ одинаковый. Интересно любое мнение.

где это легко отключаемое, покажете?

я ведь готовя статью делал и vbr0 и если к данному пианино он отнесся гуманно, то на других файлах демонстрировал адское выгрызание спектра, поэтому для чистоты эксперимента я предпочел дальнейшую работу только с cbr320

По спектру оценивать сжатый с потерями(lossy) файл неверно.

P.S. попробуйте хотя-бы ключ -V0+ на Lame3.99.5 и Lame 3.100alpha2. в обоих случаях: polyphase lowpass filter disable

пусть развивается куда хочет, но про скорость кодирования в данном случае неинтересно и вообще проще уж лослесс юзать, чем ждать от lame новых откровений

Где юзать лоззлесс? У меня, допустим, в машине магнитолка окромя wma\mp3 никаких других сжатых форматов не читает. приходится в mp3 катать. и выхода другого никакого нет, кроме как выжимать из него максимум.

Спектр не убивается). всё с ним хорошо. Предлагаю больше слушать, чем смотреть на картинки. Но и по картинкам, как вы уже убедились, Лэйм может и не трогать естественную частоту среза.

а может и потрогать

Для кодирования(и всяческого преобразования аудиофаулов) пользуюсь програмулиной Xrecode.

YG, спасибо за Ваши измерения! Всегда интересно читать. Пожалуйста, продолжайте.

начнем с того, что количество людей забивающих свои классики apple lossless даже меньше, чем перебирающих пресеты lame

в слепом тесте вы ошибетесь между мр3 и рсм, самое чуткое ухо замыливается однообразным паттерном и адаптируется к некоему усредненному ощущению

в слепом тесте вы ошибетесь между мр3 и рсм

Не спорю. Как бы там не было, не лучше ли заведомо лучшим способом конвертировать? И я также думаю.

устаете ли вы больше с мр3-плейлистом по сравнению с обычным, и т.п.

Смотря что Вы имеете ввиду, если о количестве песен, то зачастую нет, при условии качественных ушей/колонок. Если про разное качество форматов, то никогда не сравниваю, когда слушаю) Я бы и мп3 не конвертировал, но мне проще скачать на флешку музыку и включить через проигрыватель, чем записывать каждый раз CD на болванку. А тут, тем более, ещё прирост качества.

Вы прямо у меня с языка фразу сняли!

Внешний кодировщик настроен правильно.

LAME 3.99.5 64bits (http://lame.sf.net)CPU features: SSE (ASM used), SSE2polyphase lowpass filter disabledEncoding to C:\Users\ADMINI

1\AppData\Local\Temp\xrecode2\52863235636.dummyEncoding as 44.1 kHz j-stereo MPEG-1 Layer III VBR(q=0)

Галку «Применить максимальный уровень. » можно и нужно снять.

этот пресет свыше 16 кгц напрямую не режет, но что-то другое химичит, где-то ослабляются частоты сильнее, где-то слабее

кроме того, немного меньше файл чем просто 320

Как обещал, сегодня у меня выходной и не торопясь послушал предложенные файлы.

Не зря немцы говорят, что первые впечатления, наиболее правильные!

Слушал с флэшки в рес 3067-ую ямаху, которая подключена с преаута фронтов в деноновского 2000мк4 уся в режиме мощника Power Amp на акустику Иллюминати Юниверсе, межблок тайваньский серебрянный литц и акустический тоже литцендрат медный кимбер 8TC.

Я не хочу, чтобы расценили как вброс, но я лично считаю, что чем выше уровень компонентов сетапа, тем слышнее любую разницу. Чтобы не показаться пустомелей, покажу ссылку, на пост о моём сетапе с фотками. Или т у т как сетап выглядит целиком.

рояль уже был оцифрован если что, на микрофон играла его запись

Роли не играет, я же писал о том, что формат mp3 звучит хуже чем исходник в wav.

Предлагаю-таки закодировать и послушать что-то посерьезнее шума помещения.

я же кодировал и вывешивал в каментах запись с плотным спектром.

видели что insane делает?

На плотных записях разницу, как правило, слышно сильнее.

Или для Вас они звучат одинаково?

Интересно, а чему призвали бы Вы доверять?

И потом, Вы не используете Ваш опыт совсем?

Или отталкиваетесь только от чужого, но авторитетного?

А про совет слушать самому, я так замечу, что даётся он как раз их добрых побуждений!

Ведь мы все разные, с разным восприятием звучания и разным представлением о его правильности!

В foobar2000 с параметрами командной строки:

Вот исходник, предложенный автором:

А вот его «сморщенная» версия:

ну и какая головная система в машине поддержит ваш ААС-неро? я же кажется специально все оговорил в начале статьи

а то, что 3.93.1 запустили это хорошо

и кстати киньте линк на версию 3.93 только чтобы там был ехешный файл а не батник

Внизу, после таблицы результатов.

Наткнулся на интересное обсуждение Lame:

В одинаковых условиях прослушивания(в заглушенной машине) разницы между lame3.100 и AudioCD нет.

дома mp3 не слушаю. стандарт, сам по себе, сильно мутнит звук.

. Ещё раз повторю: возможность кодировать с polyphase lowpass filter disabled в последних Lame ЕСТЬ. Надо просто сделать над собой усилие.

ОРИГИНАЛ

ТАКИМ ОБРАЗОМ:

т.е. эти ключи и есть путь к максимальному качеству? объясните зачем принудительно отключать jstereo?

месье знает толк в извращениях?

Ну это ладно то, субъективный анализ звука скачанных из Интернета файлов mp3 320 кбит/сек обозначил наличие в них большого числа слышимых искажений. К сожалению, в файле, полученном таким путем, почти никогда не присутствует информация о кодеке, и тем более, с какими параметрами или ключами он был использован. Догадываюсь, что они были не самые максимально допустимые. Ситуация напоминала таковую в эпоху магнитной записи, когда удавалось сравнить звук оригинала на CD (пусть и пиратском) и копии печально вспоминаемой ленте тип I (Fe). Хоть на Nakamichi пиши, все равно будут искажения. Особо отличившиеся экземпляры напоминали еще при этом дополнительно зажатый компадером Dolby B звук.

Посему эти споры будут бесконечные. Мой совет: бросьте это дело. Как там по Жванецкому:

Оставим mp3 для портатива, и для нетребовательных слушателей, для чего он и существует по сей день. Если бы другого не было, тогда пришлось бы кушать тюрю. А так, если есть выбор из mp3 и lossless, зачем отказывать себе в качестве? Конечно, найдутся те, кто будет говорить о «расходовании лишнего места на диске», но таким лишним будет и качественный усилитель, и колонки выше уровнем, лишь бы бухало в наушниках Sony с моторчиком на НЧ. Как я догадываюсь, если меломан переводит свою старую фонотеку из lossless или CD в mp3 «для экономии места», то потом он ее слушать не будет вообще, или не поймет, почему слушать не хочется. С другой стороны, если аудиофил много рассуждает об истинности «английского звука» своего любимого NAD, а сам слушает mp3, это вызывает сомнение: может, в консерватории что-то не то сложилось?

месье знает толк в извращениях?

Какие такие ваши выкладки? что в них хорошего?

Тут есть про ваш «аудиофильский» режим «стерео»:

Здесь тоже интересно: http://audiophilesoft.ru/forum/3-2-8#6949

Про «теплый мегаламповый» 3,93)))

Я кстати говоря полностью разделяю мнение уважаемого JaroslavS и сам подчёркивал, что для меня важна натуральность звучания, что и даёт в итоге комфортность прослушивания!

Одной из популярных оболочек для конвертирования является dBpowerAMP Music Converter. Сначала пробуем самый продвинутый Lame. Добросовестность кодирования ставим на Slow (High Quality) и никаких Joint Stereo.

-q0 (slowest, high quality)

-q9 (fastest, low quality)

Я не знаю, какой смысл заложен в наименование функций у Easy CD-DA Extractor, то ли это уровень сжатия, то ли это качество аудио материала на выходе. Что бы разобраться в этом, достаточно получить на выходе 3 разных файла с параметрами Highest, Normal, Fast и сравнить визуально спектры.

Для человека не просвещенного, в каком из скринов Maximus Panin качество лучше. Если объем информации в единицу времени один, значит в верхнем скрине получается освобождая место в верхних частотах больше информации передается в другом спектре?

Сжатие лучше на спектре 1, количество аудио информации больше на спектре 2.

Только авторизованные пользователи могут отвечать на вопросы, пожалуйста, войдите или зарегистрируйтесь.

Источник

joint stereo что это

Joint Stereo

Совмещённое стерео

Intensity Stereo

Mid / Side Stereo

Реализации

Joint stereo что это

Про формат МР-3

Описание процесса кодирования

Подготовка к кодированию. Фреймовая структура

Начало кодирования

Работа психоакустической модели. Часть первая

Работа психоакустической модели. Часть вторая

Завершение кодирования

1. Dual Channel

2. Stereo

3. Joint Stereo ( MS Stereo )

4. Joint Stereo ( MS/IS Stereo )

О граблях

Несколько слов о разных битрейтах

VBR & XingTech

Способы хранения MP3

Каков характер потерь?

Как правильно кодировать аудиофайлы в MP3, или Почему не все кодеки одинаково полезны

320 кбит/с ≠ 320 кбит/с

Найди правильную опцию

Комментарии