lossless на чем слушать

MP3 VS FLAC. Как услышать разницу?

Сохранить и прочитать потом —

Вместе с виниловыми пластинками и компакт-дисками наша фонотека всё чаще пополняется музыкальными файлами в МР3 и Flac. Многие считают эти два формата непримиримыми врагами, а кто-то уверен, что разница между ними невелика. Так ли это?

Пицца. Испечённая в настоящей дровяной печи, с лёгким запахом дымка, неповторимым вкусом двух сыров, сплавленных в единое целое. Этот ароматный хлебный блин, хрустящий по краям. Эта невероятно душистая начинка, одновременно играющая несколькими вкусами и запахами. Это праздник вкуса и сытности. Иногда так хочется пиццы, что берёшь обычный магазинный хлеб, тонко режешь, кладёшь сверху мелко порезанную ветчину, покрываешь сыром. И ставишь на пару минут в микроволновку. Конечно, этим можно наесться, но не будет того восторга, какой присутствует при поедании пиццы, приготовленной мастером.

Нет-нет, мы не собираемся печь фирменную пиццу или открывать итальянский ресторанчик. Этим наглядным примером мы показываем разницу между сжатым и несжатым форматами звука.

О форматах.

Немного истории. Формат MP3 (MPEG-1/2/2.5 Layer 3) появился в 1994 году. Помните те времена? О гигабайтах речь и не шла, сотни мегабайт стоили солидных денег, а многие ещё помнили легендарную фразу Билла Гейтса: «640 КБ памяти с избытком хватит любому компьютеру». И если достоверность этой фразы до сих пор подвергается сомнению, то уже в 94-м году никто не сомневался в том, что музыка будет распространяться через интернет, а файлы храниться на компьютере. Согласитесь, хранить всю свою фонотеку на жёстком диске и иметь возможность брать её с собой куда угодно – это отличная идея! Однако, на тот момент основным носителем «цифровой музыки» был CD.

Стандартный компакт-диск вмещает в себя 650 мегабайт или 74 минуты музыки с битрейтом 1411,2 кбит/с. Для того, чтобы сохранить в первозданном качестве с десяток альбомов в 94-м году требовалось иметь очень солидную сумму! Да и персональный компьютер стоил тогда немало, а основной задачей появившегося МР3 была возможность передавать звук через каналы с низкой пропускной способностью. По тем временам для передачи целого CD через интернет требовалось в лучшем случае несколько десятков часов. Поэтому перед разработчиками стояла задача сократить размер звукового файла насколько это возможно, избегая потерь при сжатии сигнала до минимума. Однако, технологии кодирования были ещё не совершенны, а процессоры не настолько быстры, поэтому было решено применить психоакустический метод, при котором теряется только часть звуковой информации. Например, все «тихие» звуки выше 17 кГц и все басы ниже 40 Гц. Разработчики установили несколько степеней сжатия таких файлов, взяв за основу измерения качества цифровой поток – чем больше информации передаётся в секунду времени, тем выше качество звука, но и больше размер файла. Максимальным битрейтом в МР3 принято считать 320 кбит/с, при котором звучание сбалансировано, а качество максимально близко к оригиналу.

И вот это самое «максимально близко» и не даёт покоя любителям хорошего звука до сих пор. Дело в том, что прослушивание музыки на качественной аппаратуре позволяет в полной мере почувствовать разницу между оригинальной записью и её MP3-версией даже при 320 кбит/с.

Положа руку на сердце, признаемся, что слушать музыку можно и при битрейте 64 кбит/с. Если хочется именно услышать любимую мелодию, то никакие преграды не страшны. Можно даже самому наиграть на ближайшем музыкальном инструменте, если есть навык, или послушать через динамик телефона. Однако, если хочется насладиться произведением, в котором будут сохранены все нюансы и заложенные эмоции, его интерпретацией звукорежиссёром и манерой игры исполнителей, то МР3 (как, собственно, и любой другой формат сжатия с потерями) не будет в радость, равно как и воспроизведение великолепно записанного и изданного CD на посредственном аппарате.

О том, как качественно воспроизвести сжатое аудио именно на высококлассном Hi-Fi задумались разработчики формата Flac. На самом деле FLAC (Free Lossless Audio Codec – «бесплатный аудиокодек для сжатия без потерь») появился всего лишь через 6 лет после МР3. Однако, технологии кодирования за это время ушли далеко вперёд, что позволило создать кодеки, сжимающие аудиосигнал без потерь. Конечно, сделать файл меньше, чем в МР3 не удалось, однако пользователи сейчас располагают на порядок более ёмкими хранилищами, поэтому пара сотен мегабайт на альбом – это сущая мелочь. Не правда ли?

Оба этих формата имеют довольно широкое распространение. Практически все операционные системы умеют воспроизводить их при помощи штатных или сторонних проигрывателей. МР3 поддерживает чуть ли не вся линейка звуковоспроизводящих устройств, в том числе и относящихся к классу High End. С Flac (и его аналогами) ситуация чуть иная – некоторые производители до сих пор упорно игнорируют этот способ сжатия. Как бы то ни было, у простого меломана всегда есть выбор между этими двумя форматами. Но, вместе с выбором появляются и вопросы, а услышит ли он разницу между Flac и МР3? Попробуем разобраться.

Мобильные устройства.

Для меломанов, предпочитающих прослушивание музыки на мобильных устройствах, разницы практически не будет. Современные смартфоны за редким исключениям оснащаются не самым качественным аудиотрактом. Тем более, если использовать штатные наушники-вкладыши или Bluetooth-колонку. В обоих случаях пропускная способность аудиотракта невелика, поэтому все записи будут бедны на микронюансы записи и динамику. Но! Производители постепенно изменяют эту ситуацию. Например, корейская компания LG наладила выпуск смартфона V20 со встроенным модулем Hi-Fi Quad DAC, имеющим декодеры для воспроизведения всех популярных аудиоформатов, в том числе аудиофильских и профессиональных. В комплекте со смартфоном поставляются высококачественные наушники Bang & Olufsen. Вот на этом устройстве разница между MP3 и Flac слышна достаточно хорошо. В остальных случаях меломану, желающему слушать музыку со своего телефона, пока что стоит присмотреться к внешнему специализированному ЦАП и наушникам. Например, линейка портативных усилителей для наушников FiiO со встроенным ЦАП вполне способна передать все нюансы записи во Flac, если её использовать вместе с хорошими накладными наушниками. Кстати, подойдут даже «вкладыши», но только не дешёвые, продающиеся на каждом углу, а произведённые серьёзными аудиобрендами.

Альтернатива? Да, возможна. Это не многофункциональное устройство, а высококачественный портативный аудиоплеер. В таком аппарате, как правило, установлен качественный цифро-аналоговый преобразователь, а в аудиотракте используются отборные компоненты. И вся конструкция подчинена одной цели – высококачественному воспроизведению звука. Поэтому, кроме, собственно говоря, музыкального плеера, в корпусе нет ничего, что бы помешало отличить Flac от МР3.

Домашний Hi-Fi.

Здесь всё гораздо прозаичнее. Отличить качественную фонограмму от некачественной можно на любом современном компоненте аудиосистемы. Причем, чем дороже система, тем более ярко выраженными и неприятными будут звуковые артефакты, присущие сжатым с потерями композициям. И тем ярче, выразительнее будет исполнение при воспроизведении файлов со сжатием без потерь. Если вы легко и сразу замечаете разницу между воспроизведением Flac и MP3, то компоненты домашней системы у вас хорошие. Ещё одним камнем преткновения, не позволяющим ощутить её, является проигрыватель. Файлы можно воспроизводить, напрямую подключив жёсткий диск с ними к дисковому или мультимедийному плеерам, а также к ряду ресиверов и усилителей, оборудованных встроенным USB-медиапроигрывателем. Как правило, в низкокачественном аппарате экономят на всём, поэтому элементная база там подвергается всевозможным помехам от рядом работающих блоков, а цифро-аналоговый преобразователь обрабатывает поток не на самом высоком уровне, допуская массу ошибок. Всё это сказывается на итоговом аналоговом сигнале, который после всего этого уже невозможно восстановить. Как если бы вы закрыли свои колонки полотенцем или подушкой. Кто знает, какой был бы сигнал без неё? А значит, мы опять приходим к тому, что отличить МР3 и Flac на такой системе будет невозможно. Выход? Использовать в своей домашней Hi-Fi системы только качественные компоненты – от источника и усилителя до акустики и даже кабелей.

То, что сейчас практически вся музыка хранится дома в качестве файлов, которые можно послушать либо на домашней системе, либо взять с собой и послушать в пути, в отпуске, на занятиях или где-то ещё, это отлично. Это прогресс, с которым надо считаться. Однако, не стоит забывать о том, что от музыки мы в первую очередь получаем удовольствие. Как и от хорошей пиццы. И не советуем вам отказывать себе в этих удовольствиях. Они – это показатель качества жизни и источник нашего позитивного настроения и положительных эмоций.

Источник

Lossless Audio в Apple Music: что это и как его послушать

Это правда звучит лучше?

В 2021 году в Apple Music появится 75 миллионов песен в формате Lossless Audio, который обещает побитовую точность воспроизведения, почти как на студии звукозаписи.

Что такое lossless

Музыкальные файлы сохраняют в специальных форматах — кодеках. Их основные характеристики:

На студии создают аудиозаписи с максимальным количеством делателей. При кодировании детали теряются, как при переносе «Моны Лизы» в цифровое изображение.

Простейшим цифровым аудиоформатом считается mp3, уровнем выше стоит AAC, еще выше — ALAC и Flac. Последние два как раз относятся к lossless, то есть к звуку без потерь. Считается, что при кодировании в эти форматы звучание трека и детали сохраняются.

Формат Flac предлагает разрядность до 32 бит и частоту до 655 кГц, его можно загрузить в любой Hi-Fi-плеер.

ALAC (Apple Lossless Audio Codec) — его аналог, разработанный Apple, он предоставляет разрядность до 24 бит и частоту до 192 кГц (Hi-Res Lossless).

Что слушать

Уже сейчас в Apple Music доступно 20 миллионов песен в формате Lossless Audio. Весь каталог сервиса — 75 миллионов — компания обещает выложить до конца года.

Всего в Apple Music доступно два формата качества без потерь:

Они доступны на следующих устройствах:

Все песни с повышенным качеством отмечаются отдельным значком.

Как включить

На чем слушать

При подборе усилителя обратите внимание, чтобы он подключался по Lightning (для iPhone), USB-C или 3,5 мм (для Macbook и iMac), так как использование дополнительных переходников испортит сигнал. Качество выходящего из ЦАП звука должно быть не ниже 24 бит при 192 кГц.

Наушники стоит подбирать исходя из характеристик усилителя или устройства, к которому они будут подключаться. Для портативных устройств это обычно 16–32 Ом. Например, ЦАП Fiio K3 способен выдать 32-битный звук при 192 кГц. При подключении наушников по 3,5 мм выходная мощность составит 120 мВт при сопротивлении 32 Ом. Если подключить к нему наушники с большим сопротивлением, то громкость заметно упадет, но если сопротивление будет 16 Ом, то мощность возрастет до 220 мВт.

Hi-Fi наушники для примера:

Могу ли я слушать lossless в наушниках Apple?

Источник

Apple ответила на самые популярные вопросы о Lossless в Apple Music

Несмотря на то что Apple уже официально объявила о появлении lossless-музыки в Apple Music, большая часть вопросов пользователей о новой инициативе компании осталась без ответа. Поэтому им приходится полагаться либо на здравый смысл, либо на прогнозы инсайдеров и аналитиков, что иногда прямо противоречит друг другу. Однако Apple нашла в себе силы и предоставила людям ответы на самые часто задаваемые вопросы о музыке в высоком качестве, которой предстоит появиться в Apple Music.

Lossless-музыка в Apple Music заявлена официально, но кое-что по-прежнему вызывает вопросы

В свойственной ей манере Apple опубликовала ответы на неудобные вопросы в глубинах своего сайта – всё-таки сознаваться кое в чём из этого, очевидно, неприятно ей самой. Ознакомиться с оригиналом можете по этой ссылке. Мы же представляем вашему вниманию перевод с разъяснениями некоторых аспектов, уточнять которые в Купертино почему-то посчитали излишним.

Есть ли разница между ALAC и AAC

Lossless-музыка в Apple Music представлена в трёх разрешениях

В июне в Apple Music появятся композиции в lossless в трёх разрешениях:

Apple намерена использовать собственную технологию сжатия звука без потерь, которая называется Apple Lossless Audio Codec (ALAC). Именно в этом формате будет кодироваться вся музыка в Apple Music в дополнение к AAC, который уже представлен на площадке. Однако Apple уверяет, что отличить ALAC от AAC очень сложно. Это будет под силу только меломанам с музыкальным слухом. Но и этого мало – необходимо задействовать специальное оборудование.

Как слушать lossless на iPhone

Lossless-композиции будут доступны в Apple Music только с выходом iOS 14.6 в июне. Поэтому, чтобы воспроизвести трек в высоком качестве на iPhone, нужно будет обязательно установить актуальную версию операционной системы, которая добавит смартфонам и планшетам Apple поддержку lossless.

Лучше всего слушать музыку в Lossless через проводные наушники и ЦАП

Для наилучшего качества звучания рекомендуется использовать проводные наушники либо колонки с поддержкой AirPlay 2, хоть такая возможность есть пока не у всех решений. Например, спикеры Sonos могут играть треки без сжатия прямо из коробки. Однако в обозримом будущем Apple планирует добавить поддержку lossless в HomePod – это официально.

Сколько места занимает музыка в lossless

Lossless-композиции по понятным причинам весят намного больше, чем обычные треки. Поэтому при трансляции они расходуют больше интернет-трафика, а при загрузке на устройство – занимают больше места. Однако уже загруженные треки так и останутся в исходном качестве.

Чтобы скачивать музыку в lossless, нужно включить соответствующий формат

Чтобы заменить их на lossless, придётся удалить старые, переключить в настройках Apple Music качество треков и загрузить повторно. Только тогда lossless-композиции станут доступны для прослушивания в режиме оффлайн.

Будут ли AirPods поддерживать lossless

Все AirPods – совместимы с lossless. Однако совместимость – это не то же самое, что поддержка. То есть наушники смогут проигрывать композиции без потерь, но это не значит, что от них стоит ждать высокого качества звука, характерного для ALAC. На выходе звучание будет ничем не отличаться от того, как если бы вы слушали обычную музыку в формате AAC.

AirPods совместимы с lossless-музыкой, но не способны раскрыть весь её потенциал

У AirPods Max ситуация немного лучше, чем у полностью беспроводных моделей. Благодаря подключению по Lightning-кабелю они смогут воспроизводить звук при 24 бит / 48 кГц, но все называют это суррогатным lossless, потому что наушники изначально разрабатывались как беспроводные и не имеют продвинутого цифро-аналогового преобразователя.

Нужен ли ЦАП для Apple Music

Для прослушивания lossless-композиций лучше всего использовать проводные наушники с внешним цифро-аналоговым преобразователем. Это внешний прибор, который переводит цифровой сигнал в аналоговый. Собственный переходник Apple с Lightning на 3,5 мм тоже является ЦАПом, но ограниченным.

Переходник с Lightning на 3,5мм — это тоже своего рода ЦАП, но не слишком продвинутый

Он поддерживает качество до 24 бит/48 кГц, а Hi-Res с 24 бит/192 кГц ему недоступен. Для воспроизведения музыки в таком разрешении потребуется специальный ЦАП наподобие того, что можно купить по этой ссылке. Он стоит не так дорого. Другое дело, что докупать его следует только в случае, если у вас уже есть более-менее вменяемые наушники.

Новости, статьи и анонсы публикаций

Свободное общение и обсуждение материалов

Лонгриды для вас

Apple запрещает использовать на iOS другие сервисы бесконтактной оплаты, кроме Apple Pay. Но, если разобраться, то появление Google Pay или даже Mir Pay на iOS только сделало бы всем лучше

Apple надоело терпеть негатив из-за своих клавиатур. Поэтому в компании решили сделать их модульными, позволив пользователям самостоятельно заменять повреждённые блоки, не обращаясь в сервисный центр

iPhone 13 только вышел, а мы уже почти всё знаем про iPhone 14, который будет выглядеть совершенно не так, как его предшественник. Кроме того, в следующем году из линейки исчезнет mini-модель, но ей на смену придёт доступный iPhone 14 Max

Даже в тех же Sony WH-1000XM4 на многих композициях слышны отличия loseless стриминга от Tidal от компрессированной музыки в Apple Music. Безусловно, зависит еще и от ушей прослушивающего.
Так что можно только поприветствовать, что loseless появится и у Apple. Если бы они серьезно считали что отличий нет — то и делать бы не стали.

Источник

FLAC вам в руки! Действительно ли lossless-магнитолы хорошо звучат?

Новое слово в кар-аудио – поддержка аудиофильского lossless-формата FLAC в автомагнитолах начального уровня. Крутым аудиофилом отныне может представить себя каждый – за смешные 3-4 тысячи рублей! Но вот способен ли среднестатистический автовладелец РЕАЛЬНО ощутить разницу между FLAC и высокобитным MP3? Колеса.ру проверили это на практике – автомобильный аудио-эксперт прослушал несколько популярных моделей магнитол, умеющих играть lossless, и вынес свой вердикт.

Отличия «резаной» музыки от «цельной»

Для введения в курс дела начнем с простейшей справки, которую знатоки аудиоформатов могут смело пропустить… Большинство из нас сегодня слушает музыку в машине в формате MP3. Это удобно – огромная фонотека помещается в кулаке, не боится царапин, ударов, грязи, элементарно пополняется и редактируется на домашнем компьютере и т.п. Формат MP3 устраивает почти всех – кроме тех, кто «загоняется» из-за его внутренней сущности…

А сущность состоит в том, что при сжатии музыкального потока из него по специальному алгоритму вырезаются те звуки и частоты, которые, как считают создатели алгоритма, ПОЧТИ не влияют на восприятие музыки слушателем. Вот это «почти» – и есть причина компромиссности формата MP3… На музыке клубных жанров разница едва заметна, но на хорошем качественном роке, инструментале, серьезном вокале и классике, проигрываемых через приличную акустическую систему, различие между «резаным» форматом MP3 и «нерезаным» исходником WAV способны ощутить многие.

MP3 не передает глубины и полноты звучания музыки, воспринимается как «бедный родственник» по сравнению с несжатыми форматами аудио. Это все, конечно, субъективные характеристики, и не каждый в силу физиологических особенностей слуха способен их вообще «распробовать», но факт есть факт – MP3 и прочие кодеки, сжимающие звук с потерями (WMA, AAC и другие), ухудшают качество музыки в угоду удобству её использования.

Альтернатива – форматы «без потерь», то, что принято называть lossless. Такие кодеки, как FLAC и APE, тоже сжимают музыку, но при воспроизведении оригинальные данные полностью восстанавливаются из сжатого состояния – в отличие от MP3, из которого сжимающие алгоритмы удаляют «лишние ноты» на свое усмотрение и без вашего ведома.

FLAC в автомобилях

Еще недавно послушать lossless в машине можно было в основном только на мультимедийных центрах на Android, поскольку для Android естественна возможность установки различных программ-плееров, читающие все форматы. Но качество звучания было под вопросом, ибо большинство производителей Android-магнитол – с сомнительной китайской родословной и белым пятном на месте истории бренда… Плюс серьезными ограничениями к распространению этих устройств являются высокая цена и двухдиновый формат, который тоже устраивает не всех.

И вот года полтора назад начали появляться первые FLAC-модели в сегменте бюджетных магнитол известных брендов – с хорошим качеством, однодиновой компоновкой и привычным «магнитольным» дизайном. Сегодня этот сегмент рынка фактически состоялся – ассортимент недорогих FLAC-устройств под всем известными марками типа Sony, Pioneer, Kenwood и т.п. уже изрядный. Соответственно, можно попытаться сделать некоторые выводы.

Главным из них будет ответ на вопрос – стало ли внедрение поддержки FLAC в массовые недорогие аппараты прорывом в эволюции кар-аудио, или lossless актуален лишь для серьезных, дорогих автомобильных аудио-систем, и простой пользователь в недорогом авто со штатной акустикой никаких внятных плюсов от FLAC не получит?

Что тестируем

Сегодня стоимость наиболее доступных автомагнитол с поддержкой FLAC крайне демократична, и эти гаджеты доступны любому – в начальном сегменте цены на них стартуют с отметки в 3 тысячи рублей. Посему подобная аппаратура наводит многих владельцев бюджетных автомобилей на мысль, что и в недорогой машине, со штатной ширпотребной акустикой можно существенно улучшить качество звучания, просто заменив магнитолу и используя высококачественный музыкальный исходник – FLAC вместо MP3.

Однако у тех, кто имеет достаточно глубокие познания в аудио-технике, возникают сомнения… Да, FLAC звучит безусловно лучше. Чисто академически с этим не поспоришь. Однако исходника как он есть мало – нужен хороший цифро-аналоговый преобразователь в автомагнитоле, качественный усилительный тракт, хорошая и правильно установленная акустика… Что из этого имеется в бюджетном автомобиле и бюджетной магнитоле? Да, скорее всего, ничего…

Соответственно, ставим вопрос ребром – если мы на недорогой машине, без финансовых вложений в замену штатной акустики и усилителей, без затрат на дополнительную шумоизоляцию и прочий «фарш» просто «махнем» родную MP3-магнитолу на устройство с поддержкой FLAC – даст ли это нам сколь-либо заметное невооруженным и нетренированным ухом улучшение качества звучания?

Чтобы найти ответ на этот вопрос, Колеса.ру взяли на тест три автомагнитолы, умеющие воспроизводить музыку формата FLAC, типичное бюджетное авто с дешевой штатной акустикой… и пригласили опытного эксперта по кар-аудио, попросив его поочередно прослушать на каждом устройстве два одинаковых аудиофайла – трек в формате MP3 320 кбит/с и тот же самый трек в формате FLAC.

Условия тестирования

Автомобиль:

Volkswagen Polo, штатная аудиосистема с четырьмя 6-дюймовыми динамиками с бумажными диффузорами и частоторасширяющими конусами

Источник

Психоакустика, lossless и что еще я знаю об аудио-стандартах

Относительно недавно попалось мне на глаза хоть и студенческое, но все-таки, на мой взгляд, интересное видео из «Курилки Гутенберга» под названием «Психоакустика: звуковые иллюзии». Видео вдохновило меня порыться уже в своих студенческих конспектах и материалах…

Признаюсь честно, я не очень любил предмет Audio Coding, будучи студентом TU Ilmenau на программе Communication and Signal Processing — стресс и юношеский максимализм делали свое темное дело. Однако, со стороны чаще я слышал противоположную точку зрения: «Классный предмет, че ты жалуешься? Один из ваших лекторов — сам Карлхайнц Брандербург — лови момент!»

Один из главных разработчиков формата MP3, если вы не узнали, позирует в наушниках. (источник изображения)

По прошествии времени я, конечно, пересмотрел свой взгляд на данный предмет. Знание на стыке цифровой обработки сигналов, биологии, физики и вычислительной техники — это же круто! Одна тема уже упомянутой психоакустики чего только стоит.

И вот однажды мне пришла в голову очередная авантюрная мысль, и я сказал себе: «Почему бы не написать научно-популярную статью про аудиокодинг? Так сказать, «для самых маленьких» — для таких же студентов, коим был и я»?

Структура статьи

Перечислим темы, о которых будем говорить.

Что ж, для матерых знатоков темы вряд ли найдется что-то новое, вещи довольно базовые, однако я буду рад дополнениям и корректировкам в комментариях! Всем заглянувшим заранее спасибо!

Введение

Я думаю, ни для кого из интересовавшихся темой аудиостандартов не секрет, что существуют в Мире две большие (и непримиримые между собой) парадигмы развития этих самых стандартов. А именно:

За первыми закрепилось звание тяжеловесных стандартов для меломанов. За вторыми стоит многолетняя практика применения: начиная от некачественных подборок музыки на дисках для MP3-плееров, кончая современными (достаточно качественными) потоковыми сервисами прослушивания музыки.

Если в двух словах, то первые стараются максимально точно воспроизвести исходный аудио-файл, убирая лишь избыточность (см. redundancy), а вторые на основе целой теории о том, как человек воспринимает звук, стараются максимально сжать исходный аудио-файл при минимально возможных потерях качества.

А теперь предлагаю поговорить об обеих концепциях чуть подробнее.

Перцептивные кодеки

Начнем со второй группы кодеков, а именно с их обобщенной схемы:

Рис. 1. Обобщенная структурная схема перцептивного кодирования.

Штука слегка специфичная, однако, людям работающим в сфере цифровой обработки сигналов, я думаю, знакомая. Нужен этот блок для того, чтобы разбить входной сигнал на диапазоны и через это иметь больше степеней свободы для компрессии.

Если кто-то интересуется тематикой могу предложить следующие ресурсы:

Это классика. Проходят данные темы обыкновенно в купе с азами теории информации, и потому по данной тематике есть целая база знаний из всевозможных семинаров на различных языках программирования (поэтому сегодня обсуждать подробно мы их не будем).

И вот по данному пункту хотелось бы поговорить более подробно. Ведь именно он и является основной точкой расхождения двух названных выше парадигм.

И начнем мы, так сказать, с самых основ — с биологии.

Анатомия — это ужас как интересно

Прежде чем говорить о том, как именно человек воспринимает звук, и какие математические модели под это можно подвести, поговорим о главном: что вообще позволяет человеку воспринимать звук?

Конечно же, слуховая система (auditory system)! А если быть точным, то преимущественно внутреннее и среднее ухо и их конкретные составляющие:

Рис. 2. Внутреннее строение человеческого уха.

Всё, вроде бы, интуитивно понятно, при условии некоторого багажа школьных знаний. Затруднение обычно вызывает только улитка: что значит эта заумная фраза: «индуцирует бегущие волны по длине базилярной мембраны»?

Как это ни парадоксально, но тут тоже всё достаточно просто. Во-первых, перечислим из чего состоит ушная улитка:

Барабанная перепонка передаёт звуковые колебания косточкам среднего уха;
косточки среднего уха передают колебания переимфе и эндолимфе;
под действием колебаний перелимфы и эндолимфы колеблется и базилярная мембрана;
из-за движений базилярной мембраны волосковые клетки вырабатывают сигналы, которые передаются нервным клеткам.

Подробнее предлагаю прочитать здесь и здесь.

Рис. 3. Внутреннее строение человеческого уха: базилярная мембрана в «развернутом» виде (ссылка на источник иллюстрации).

Благодаря форме базилярной мембраны (сужается к основанию) и тому, что к разным участкам данной мембраны подсоединяются клетки, отвечающие за восприятие разных частот, ушная улитка — это нелинейная система с частотной избирательностью.

А что если посмотреть на ушную улитку глазами цифровой обработки сигналов?

С точки зрения ЦОС, ушная улитка — это банк полосовых фильтров. При этом фильтры сильно перекрывают друг друга.

Рис. 4. Отклики тона в разных местах базилярной мембраны [1, c. 63].

Что изображено на рисунке:

Добрые люди нарисовали уже и полезные структурные схемы:

Рис. 5. Часть схемы модели восприятия (см. PEMO Model), касающаяся базилярной мембраны.

Перекрывающиеся фильтры показаны, на мой взгляд, очень наглядно.

В какой-то момент знание об ушной улитке, как о банке фильтров, решили как-то уложить в простую и доступную модель. В ходе ряда аудиторных экспериментов [1, c.82-85] ученые определили, что:

у частотных групп, на которые базилярной мембраной разбивается аудио-сигнал, фиксированная ширина полосы;

ширина полосы частотной группы зависит от средней частоты группы нелинейно.

Более того, для удобства, договорились считать, что фильтры нашей слуховой системы прямоугольные.

Всё вышеперечисленное в конечном итоге было обобщено в понятие шкалы Барков — шкалы критических диапазонов частот (см. RWTHxCA101 — Critical bands), ширина которых нелинейно зависит от средней частоты:

Рис. 6. Шкала Барков (источник).

Давайте, запомним этот факт, он нам еще пригодится.

Пока искал иллюстрации по шкале Барков наткнулся на это изображение:

bark scale by spooninglive

Хорошо, теперь мы чуть лучше представляем, что за система позволяет нам слышать. Более того мы выяснили, что органы слуха — это нелинейная частотно-избирательная система. Мы даже выяснили как устроена ее избирательность с точки зрения ширины критических диапазонов.

Но мы пока не говорили, одинаково ли мы слышим те или иные частоты. Быть может, есть какие-то подходящие эксперименты?

Порог в тишине

Конечно же, такие эксперименты есть. Более того, проведены такие эксперименты уже давно. Например, Эберхард Цвикер описывает один из них следующим образом [1, c. 63]:

Перед испытуемым, регистрирующим порог слышимости, ставится задача изменять при помощи переключателя уровень звукового давления так, чтобы с уверенностью отмечались моменты едва заметного появления и исчезновения звука. При этом перо самописца вычеркивает на бумаге зигзагообразную полосу, состоящую из вертикальных штрихов, в пределах которой окажутся те значения давления, для которых нет уверенности, был ли слышен звук или нет.

В конечном итоге, собрали 100 таких замеров от людей обоих полов в возрасте 20-25 лет и посчитали усредненные значения.

Рис. 7. Усредненные кривые порога слышимости для молодых испытуемых со здоровым слухом. [1, c. 64]

А потом медиана (кривая между 10% и 90% на рис. 7) была названа порогом слышимости (или «порогом в тишине«) и вошла в стандарты (в том числе и наш ГОСТ).

Рис. 8. Порог слышимости в тишине (threshold in quiet, hearing threshold), уровень риска повреждения органов слуха (risk of damage), уровень болевых ощущений (threshold of pain) (источник). Да, боль не предупреждает об опасности, а просто констатирует факт негативного влияния на слух.

Под это есть даже специальная формула:

где — это, как нетрудно догадаться, частота в килогерцах.

Проговорим суть порога слышимости ещё раз: чтобы какой-либо звук мог быть услышан, он должен превысить значение «порога в тишине». То есть эволюция все расставила так, что мы почти гарантированно услышим звуки вблизи 2-4 кГц, однако, почти так же гарантированно не услышим слишком низкие и слишком высокие частоты.

Порог в тишине в том виде, в котором он представлен на рисунке 5, актуален как правило для усредненной группы именно молодых людей. С возрастом восприятие высоких частот меняется:

В свое время этот факт, насколько я знаю, стал основой для тиражирования среди подростков ультразвукового сигнала вызова телефона: предполагалось, что взрослые (например, учителя) его слышать не будут, и поэтому не станут раздражаться на посторонние шумы. Ну, в годы моей молодости ничего, кроме «пыток» одноклассников раздражающим и назойливым звуком посреди урока со стороны кучки «пассионариев», эта идея не принесла…

Почему к данной кривой применяется словосочетание «в тишине»?

Потому что предполагается, что так люди воспринимают звук в отсутствии посторонних шумов. При появлении шума порог будет, как бы, «приподниматься». В случае широкополосного шума картина станет такой:

Рис. 8. Уровни порогов маскирования (термин обсудим ниже) белым шумом в зависимости от частоты тестового тона. Пунктиром отмечен уклон (slope) кривых на высоких частотах. [2, c. 62]

А в случае узкополосных шумов?

Маскинг (на пальцах)

В случае узкополосных шумов порог слышимости будет выглядеть так:

Рис. 9. Уровни, показывающие начало слышимости тестового тона, замаскированного тонами шириной критических диапазонов с центральными частотами 250 Гц, 1 кГц и 4 кГц и уровнем 60 дБ. [2, c. 64]

Быть может, моя следующая аналогия будет не совсем точной, но я вот смотрю на эту иллюстрацию и вижу, будто покрывало (порог слышимости) приподнимают снизу чем-то, вроде палки (тон) — и появляются скаты во все стороны (влияние на соседние частоты). И все, что под покрывалом, скрыто от наблюдателей. Замаскировано…

Этот феномен называют эффектом частотного маскирования (frequency masking). То есть шумы маскируют собой более слабые сигналы в частотной области.

Иными словами достаточно сильный тон влияет еще и на своих соседей. Выглядит это примерно так:

Рис. 10. Пример маскирования одного тона другим тоном более высокой частоты (источник).

То есть, иначе говоря, более сильный тон замаскировал своего более слабого соседа, и поэтому сосед перестал быть заметным для слуховой системы. Функция, которая определяет порог маскирования, называется функцией распространения (spreading function) и вычисляется на основе эмпирически полученных коэффициентов и шкалы Барков (формулы можно найти, например, в Википедии — см. Одновременная маскировка (Психоаккустика)).

Существует, к слову, и временное маскирование (маскирование во временной области): громкий сигнал маскирует собой как следующий за ним более слабый, так и предшествующий ему более слабый сигналы. Согласен, вторая часть утверждения звучит немного странно, но нужно все же держать в голове, что органы слуха и восприятия — это система со своей инерцией и задержками.

Возникает вопрос: зачем вообще тратить память на запись того, что в принципе не будет услышано?

Именно эта идея и стала базовой для перцептивных стандартов: удаляется не только избыточность на уровне эффективного кодирования, но и избыточность с точки зрения модели восприятия (irrelevance). Проводится такая «очистка» нерелевантных звуков на этапе квантования.

Подробно о процедуре квантования на основе психоаккустической модели можно прочитать здесь: Audio Coding Quantization and CodingMethods by Prof. Dr.-Ing. Karlheinz Brandenburg.

Суть состоит в том, что внутри каждого диапазона, полученного со входа банка фильтров, динамически вычисляется порог маскирования, и на его основе каждый отсчет квантуется и кодируется с таким шагом квантования, чтобы шум квантования оставался ниже некоторого допустимого порога.

А что же у lossless?

Если кратко, то данные форматы придерживаются двух основных принципов:

Структурная схема кодера выглядит так [3]:

Рис. 11. Lossless-кодер.

Сначала аудио-сигнал разбивается на фреймы (кадры) в целях достижения изменяемости: работа осуществляется не со всем тяжеловесным исходником, а только с его частью — с фреймом (не слишком большим, но и не слишком малым).

Далее идет первый этап избавления от избыточности — декорреляция отсчетов (сэмплов) внутри фреймов. Звучит немного заумно, но на практике ничего сложного. Проследим на примере самой, пожалуй, распространенной реализации — на примере кодирование с предсказанием (на основе линейных фильтров):

Рис. 12. Схема кодера с предсказанием.

Предиктор (предсказатель) высчитывает некоторое значение, предполагаемое на основе предыдущих отсчетов; исходя из него вычисляется ошибка предсказания e(n), и именно она сжимается дальше эффективными кодеками. За счет этого происходит некоторая экономия памяти без потери качества.

Здесь важно, чтобы кодер и декодер были абсолютно идентичными, вплоть до выбора метода округления (обычно выбирается стандарт из IEEE).

Рис. 13. Схема декодера с предсказанием.

Более подробно о предиктивном кодировании, а также о гибриде lossless с перцептивными подходами можно прочесть здесь: Prediction and Lossless Audio Coding Prof. Dr.-Ing. Karlheinz Brandenburg.

Вот такая лаконичная idea behind, в общем-то.

Мысли вслух (вместо послесловия)

Надеюсь смог хоть немного приоткрыть завесу идей, лежащих в основе. Рад буду вашим замечаниям и комментариям!

Слушайте хорошую музыку хорошего качества удобным для вас способом!

Литература

Цвикер Э., Фельдкеллер Р. Ухо как приемник информации //М.: Связь. – 1971.

Zwicker E., Fastl H. Psychoacoustics: Facts and models. – Springer Science & Business Media, 2013. – Т. 22.

M. Hans and R. W. Schafer, «Lossless compression of digital audio,» in IEEE Signal Processing Magazine, vol. 18, no. 4, pp. 21-32, July 2001.

Источник