flac формат что это такое

Что такое FLAC файл (Free Lossless Audio Codec)?

Файлы формата FLAC генерируется посредством алгоритма Free Lossless Audio Codec. Основное преимущество заключается в высоком качестве сжатия, особенно если сравнивать с не менее распространенным форматом МР3. Для воспроизведения FLAC файлов предварительно необходимо на ПК или смартфон установить специальные программы или же фильтры, поддерживающие этот формат. О том, что это за формат, зачем он нужен и чем превосходит аналоги в нашей сегодняшней статье.

Что такое FLAC формат и зачем он нужен?

FLAC (Free Lossless Audio Codec) – это свободный кодек, основная задача которого – сжатие аудиофайлов без потери качества. Особенность аудиокодека в том, что он в сравнении с большинством других свободных кодеков, не удаляет из аудиопотока никакой информации, рекомендуется использовать для прослушивания музыки на высококачественной звуковой аппаратуре. Для FLAC свойственно:

    потоковый формат; плагины для различных плееров, работа которых адаптирована под различные операционные системы; базовые кодеры/декодеры, представленные в виде библиотек; утилиту командной строки, предназначенной для обработки и редактирования метаданных; утилиту командной строки, предназначенной для сжатия/распаковки потоковой информации.

К разработке такого кодека программистов побудила необходимость качественно воспроизводить ранее сжатые аудиофайлы на высококлассном Hi-Fi. Появился этот кодек спустя 6 лет после появления MP3. Сделать файл меньше, чем в MP3 не удалось, но сегодня это уже не проблема, ведь практически каждый пользователь имеет в своем распоряжении довольно емкие хранилища.

Поддерживается FLAC подавляющим большинством современных устройств (смартфоны, компьютеры, планшеты, аудиосистемы и т.д.), имеет много разнообразных аппаратных реализаций.

Чем хорош формат FLAC?

Этот формат называют еще форма «без потерь». Это указывает на то, что ни один фрагмент исходной записи не будет удален или сжат (при условии, что задействована одна и та же битовая скорость).
В сравнении с другими свободными кодеками, например, WAV., FLAC весьма рационально использует пространство на носителе.

Алгоритм работы позволяет использовать большое разнообразие тегов, включая «незаконные», для маркировки файлов.

Как воспроизвести FLAC?

Выяснив, что это расширение FLAC, необходимо ознакомиться с вопросом, чем открыть FLAC на компьютере и любом другом устройстве.

Наибольшей популярностью пользуются сторонние программы VLC Player и Foobar 2000. Из штатных программ на компьютерах с ОС Windows можно воспользоваться Windows Media Player.

Важно! Трудностей в том, чем проигрывать FLAC, возникнуть не должно. Это настолько распространенный кодек, что воспроизводится практически всеми операционными системами при помощи сторонних или даже штатных проигрывателей.

Что лучше APE или FLAC?

Прежде чем приступить к сравнению, необходимо узнать, что собой представляет кодек АРЕ. Это тоже алгоритм сжатия без потерь. Преимущественно используется для хранения аудиофайлов, записанных с компакт-дисков. В процессе перезаписи сначала дублируется оригинальный WAV-файл, а затем архивируется в АРЕ.

Если сравнивать эти два кодека, то они очень похожи друг на друга. Пожалуй, единственное отличие в том, что FLAC более рационально использует пространство на носителе. В большинстве случаев это не так важно, но если доступны строго ограниченные пространства, то стоит отдать предпочтение Free Lossless Audio Codec.

Что лучше FLAC или WAV

Существует еще один аудиоформат без потерь, который получил название WAV. Это распространенный формат с большим потенциалом, на котором записаны все звуки операционной системы Windows.
Обратите внимание! Формат WAV сохраняет все 100% информации, при записи с СD-диска трансформирует ее в 16-битную 44,1 кГЦ.

Если сравнивать эти два формата, то можно сказать, что FLAC вобрал в себя все качества WAV, но, как и в предыдущем случае, он более рационально использует пространство. Также для маркировки файлов FLAC позволяет задействовать больше тегов, даже незаконные в ОС Виндовс.

Кодек WAV имеет превосходство над FLAC в плане редактирования, особенно DJ.

Так стоит ли использовать FLAC?

Тема достаточно сложная для восприятия, поэтому главные мысли мы решили кратко и максимально понятно изложить ниже:

    Если слушатель не сильно требователен к качеству звука, то лучше всего отдавать предпочтение аудиофайлам в формате МР3 с битрейтом 128 – 256 Кбит/с. Такую музыку в большом количестве выгружают в социальные сети «ВКонтакте» и «Одноклассники». Если качество звука имеет для слушателя значение, но звуковое оборудование не позволяет раскрыть весь потенциал независимых кодеков, то отдать предпочтение лучше трекам в формате МР3 с битрейтом 320 Кбит/с. Этот выбор позволяет воспроизводить любимую музыку на всех устройствах, и на качестве звучания это особо не отразится. Настоящим аудиофилам лучше отдавать предпочтение кодекам FLAC, APE, ALAC. Наиболее предпочтительный все же первый вариант, поскольку он не имеет никаких подводных камней. Неоспоримое преимущество FLAC в том, что даже спустя время при покупке качественного оборудования, он позволит из аудиоряда выжать максимум.

Существует большое разнообразие кодеков, все они имеют как преимущественные особенности, так и недостатки. Free Lossless Audio Codec – не исключение.

Источник

MP3, AAC, WAV, FLAC: рассказываем обо всех форматах аудиофайлов

Сохранить и прочитать потом —

flac формат что это такое

Организуя свою коллекцию цифровой музыки, можно утонуть в разнообразии форматов аудиофайлов. Почти каждый слышал об MP3, но что такое OGG, AIFF или MQA?

Если по прочтении списка у вас возникло подозрение, что все эти форматы для получения таких шикарных аббревиатур учились в разных университетах, мы поможем развеять его. В этом материале будет прояснена суть некоторых популярных музыкальных форматов, разница между ними и то, почему это важно знать.

Что бы вы ни слушали – MP3-файлы с низким битрейтом, чуть более качественные треки в AAC или Hi-Res-аудио во FLAC или WAV – настало время разобраться в том, что именно вы получаете в каждом случае и как выбрать оптимальный формат.

Давайте оценим плюсы и минусы каждого из них.

Краткий обзор форматов файлов и кодеков

flac формат что это такое

Чтобы не ходить вокруг да около, вначале мы приведем краткую памятку по всем форматам файлов и различиям между ними. Если захотите узнать больше, ниже вы найдете более подробное описание различий в размерах, качестве звука и совместимости.

AAC (не является форматом Hi-Res-аудио). Ставшая популярной благодаря Apple альтернатива формату MP3. Со сжатием и потерями, но с более высоким качеством звука. Используется для скачивания с iTunes и трансляции с Apple Music.

AIFF (Hi-Res). Альтернатива WAV от Apple с более полными метаданными. Не особенно популярный формат без сжатия и потерь с файлами большого размера.

DSD (Hi-Res). Однобитный формат, применяемый в Super Audio CD. Существует в вариантах с частотой дискретизации 2,8 МГц, 5,6 МГц и 11,2 МГц. Из-за использования кодека высокого качества в настоящее время не применяется для стриминга. Формат без сжатия.

FLAC (Hi-Res). Формат со сжатием без потерь с поддержкой частот дискретизации, совместимых с Hi-Res, и хранением метаданных; размер файлов вдвое меньше, чем у WAV. Благодаря отсутствию лицензионных отчислений считается лучшим форматом для скачивания и хранения альбомов в Hi-Res-аудио. Его главный недостаток – отсутствие поддержки устройствами Apple (и, следовательно, несовместимость с iTunes).

MP3 (не является форматом Hi-Res-аудио). Популярный формат со сжатием и потерями с малым размером файла и далеко не самым высоким качеством звучания. Удобен для хранения музыки на смартфонах и плеерах iPod.

MQA (Hi-Res). Формат со сжатием для хранения Hi-Res-файлов в более удобной для стриминга форме. Используется сервисом Tidal Masters для трансляций Hi-Res-аудио.

OGG (не является форматом Hi-Res-аудио). Иногда называется полным именем – Ogg Vorbis. Альтернатива MP3 и AAC с открытым кодом, не подпадающая под действие патентов. Этот формат с битрейтом 320 кбит/с используется в трансляциях Spotify.

WAV (Hi-Res). Стандартный формат, в котором записаны все CD. Отличное качество звука, но огромный размер файлов из-за отсутствия сжатия. Слабая поддержка метаданных (обложек, названий песен и исполнителей).

WMA Lossless (Hi-Res). Версия Windows Media Audio без сжатия, поддержку которой уже не часто можно встретить в смартфонах и планшетах.

Аудиофайлы со сжатием и без него

Вначале рассмотрим три категории, в которые можно сгруппировать все форматы аудиофайлов. Они определяются степенью сжатия данных и связанным с ним уровнем потерь качества звучания.

Если для сжатия аудио в вашем файле не применялся специальный алгоритм (или кодек), это приведет к двойному результату: во-первых, потерь качества звучания не будет, во-вторых, место на вашем жестком диске скоро закончится.

По своей сути запись в формате без сжатия полностью соответствует оригинальному аудиофайлу, в котором зафиксированы в цифровом представлении реальные звуковые сигналы.

WAV и AIFF можно назвать самыми популярными форматами аудиофайлов без сжатия. Оба они основаны на PCM (Pulse Code Modulation, импульсно-кодовой модуляции), широко известном механизме непосредственного преобразования аудиосигнала в цифровую форму. В WAV и в AIFF применяются схожие технологии, но методы хранения данных несколько различаются. В этих форматах можно записывать как файлы CD-качества, так и более высокого разрешения.

Формат WAV был разработан Microsoft и IBM, в силу чего применяется на платформах на базе Windows; он является стандартным форматом записи компакт-дисков.

Формат AIFF создан компанией Apple как альтернатива WAV; и хотя AIFF-файлы менее распространены, они обеспечивают более полную поддержку метаданных, позволяя хранить обложки альбомов, названия песен и тому подобную информацию.

Недостаток этих форматов – требование гигантских объемов памяти. Файлы CD-качества (16 бит, 44,1 кГц) занимают около 10 МБ дискового пространства на минуту звучания.

ALAC, FLAC, WMA Lossless: аудиоформаты без потерь

Все мы любим FLAC. Формат без потерь, файлы во FLAC (Free Lossless Audio Codec, бесплатный аудиокодек без потерь) по размеру почти вдвое меньше, чем в WAV или AIFF без сжатия с эквивалентной частотой дискретизации, однако в плане звучания никаких потерь качества не заметно. FLAC также поддерживает более высокое разрешение по сравнению с CD-качеством – до 32 бит и 192 кГц.

Помимо FLAC, есть и другие форматы без потерь – ALAC (Apple Lossless) и WMA Lossless (Windows Media Audio). Первый представляет собой отличную альтернативу для iOS и iTunes, хотя размер файлов чуть выше, чем у FLAC. Не все смартфоны и планшеты поддерживают его.

AAC и MP3: аудиоформаты с потерями

Кто не слышал про MP3? Все про него слышали. Этот самый распространенный аудиоформат удобен для хранения музыки на плеерах iPod или планшетах и поддерживается практически любыми устройствами. Однако для этого приходится жертвовать значительным объемом информации. Для того чтобы уменьшить размеры файлов на порядок по сравнению с записями в CD-качестве, необходимо отбросить значительный процент исходных данных, что приводит к потере качества звучания.

Битрейт, с которым записан MP3-файл, тоже влияет на качество звука. MP3 с битрейтом 128 кбит/с теряют больше информации, чем файлы с 320 кбит/с (это расшифровывается как «килобит в секунду», где каждый «бит», в сущности, представляет собой крохотный кусочек песни). Учитывая резкое снижение стоимости памяти, в наше время нет никаких причин слушать файлы с битрейтом 128 кбит/с; MP3 с 320 кбит/с имеют смысл при ограниченном объеме памяти, они также остаются стандартным форматом для скачивания файлов Интернет-магазинов.

Еще один формат с потерями, AAC (Advanced Audio Coding, усовершенствованное кодирование звука), также предполагает сжатие, как и MP3, но благодаря несколько более эффективным алгоритмам обеспечивает более качественный звук. AAC используется для скачивания с iTunes и трансляций с Apple Music (с битрейтом 256 кбит/с), а также в передачах с YouTube.

Формат Vorbis, нередко называемый Ogg Vorbis, чтобы подчеркнуть использование контейнера Ogg, представляет собой альтернативу MP3 и AAC с открытым кодом, не подпадающую под действие патентов. Этот формат с битрейтом 320 кбит/с используется в трансляциях Spotify.

Если вы планируете использовать форматы с потерей информации, учитывайте следующий факт: повышение числа «бит» обычно ведет к росту качества звучания, однако оно во многом зависит от эффективности кодека, с помощью которого выполняется преобразование файла. Если большая часть музыки в вашей коллекции закодирована с битрейтом 128 Кбит/с, то вы могли заметить, что, несмотря на принципиальное сходство звучания, из-за низкой эффективности кодека MP3-файлы, скорее всего, будут слушаться несколько хуже AAC или Ogg Vorbis.

Как насчет музыки в высоком разрешении?

flac формат что это такое

В отличие от HD-видео, для аудио высокого разрешения пока не разработано универсального стандарта.

Если не вдаваться в подробности, под этим термином обычно понимаются записи с более высокой частотой дискретизации и/или разрядностью, чем у CD (т.е. 16 бит/44,1 кГц). Примерами Hi-Res-аудио могут служить файлы с параметрами 16 бит/96 кГц или 24 бит/192 кГц.

Благодаря наличию дополнительной аудиоинформации Hi-Res-файлы звучат намного лучше в сравнении с компрессированными файлами, теряющими эту информацию в процессе сжатия. Эти форматы требуют больше места на диске, но их качество определенно стоит таких затрат.

К Hi-Res-аудио относятся форматы без сжатия, такие как AIFF и WAV, а также без потерь – FLAC и ALAC. DSD (отчасти нишевый формат, применявшийся в Super Audio CD) также входит в категорию Hi-Res-аудио, но его поддерживает гораздо меньшее число устройств. Если говорить о стриминге, то такие сервисы, как Tidal Masters, используют упаковщик MQA, позволяющий передавать по сетям файлы в высоком разрешении с использованием минимально возможной полосы пропускания сигнала.

Что касается воспроизведения форматов Hi-Res-аудио, то сегодня его поддерживает уже немало устройств. 24-разрядные файлы способны проигрывать беспроводные колонки Denon HEOS, а также портативные музыкальные плееры премиум-класса – такие как Cowon Plenue D2 и Astell & Kern A&norma SR15.

Кроме того, с Hi-Res-аудио совместимы большинство флагманских моделей смартфонов под Android – например, удостоенный высших оценок Samsung Galaxy S10+ – однако прослушать их на новеньком iPhone вам сходу не удастся. Мы нашли способы обойти это ограничение, но нельзя забывать о том, что файлы Hi-Res-аудио пока еще не настолько компактны, как их аналоги в форматах с потерями.

Какой аудиоформат будет лучшим для вас?

Выбор формата зависит от того, что вас больше волнует – объем памяти или качество звучания – а также от того, с каким устройством вы намерены его использовать.

Популярность MP3 сложилась в эпоху, когда стоимость дискового пространства была очень высока. Сегодня смартфоны, музыкальные плееры и ноутбуки оснащаются памятью внушительного объема, так что есть смысл обратить внимание на форматы с качеством выше, чем у CD.

Если же вы решили архивировать свои аудиофайлы, FLAC или другой формат без потерь может стать неплохим вариантом. Они представляют собой удачный компромисс между уровнем сжатия и качеством звучания, позволяя слушать высококачественную цифровую музыку и сэкономить дисковое пространство. Только не забудьте проверить совместимость выбранного формата и имеющихся устройств.

Подготовлено по материалам портала «What Hi-Fi?», март 2020 г.

Источник

Музыка в формате flac: особенности звукового кодека

flac формат что это такоеДолгие годы mp3 считался самым популярным форматом аудиофайлов. Но прошло время, и постепенно он перестал соответствовать потребностям современных любителей музыки. Его главным недостатком было не слишком высокое качество звука, поскольку сильная степень сжатия достигалась за счет частичной потери информации.

В наши дни на смену устаревшему mp3 пришел новый формат — flac. Он тоже сжимает исходную запись, однако при этом совсем не снижает ее качество. Именно поэтому flac с каждым днем становится все популярнее у меломанов и просто ценителей хорошего звука.

Общие сведения о формате

flac формат что это такоеСлово flac (флак) расшифровывается как Free Lossless Audio Codec. В переводе с английского это означает «бесплатный аудиокодек без потерь». Файлы этого формата можно легко узнать по расширению flac (например: my_music.flac).

В отличие от mp3, ogg, AAC и других распространенных форматов, flac позволяет записывать, а потом и воспроизводить звук без искажений. И если, допустим, скопировать музыку с CD-диска в этот формат, она ничем не будет отличать от оригинала, независимо от его битрейта или диапазона частот.

Сегодня flac — это один из самых популярных в мире форматов аудиозаписи. Больше всего его любят обладатели хорошей аудиоаппаратуры, которая позволяет в полной мере раскрыть возможности этого формата.

Однако формат подходит не только для повседневного прослушивания, но и для создания архивов и всевозможных подборок. Дело в том, что к flac-файлам с помощью тегов можно добавлять любые сведения о композиции: информацию об исполнителе, изображение обложки альбома, описание музыкального стиля и многое другое. Благодаря этому архивы можно как угодно сортировать и быстро находить нужные файлы.

В настоящее время flac поддерживают почти все платформы и основные операционные системы, включая Linux. Его воспроизводят самые популярные аудиопроигрыватели, а с помощью специальных программ его можно без труда конвертировать в mp3, ogg и другие форматы.

Кроме того, этот формат постепенно становится одним из стандартов европейского радиовещания. Его используют не только для передачи музыки в эфир, но и для записи звука в реальном времени.

История развития кодека

flac формат что это такоеПервоначально разработкой формата занимался только один человек — программист Джош Колсон. В январе 2001 года он выпустил бета-версию нового кодека, а уже спустя полгода, появилась стабильная версия. В 2003 году на новую разработку обратила внимание компания Xiph.Org. Она взяла проект под свою опеку и занялась его продвижением и финансированием.

В 2007 году кодек начал поддерживать метаданные в форматах AIFF и RIFF, а с 2013 года его стали использовать в качестве кодека для популярных файлов RF64 и Wave64. В 2014 году алгоритм был доработан, после чего значительно возросла скорость кодирования и декодирования аудиоданных.

Сегодня работа над проектом ведется сразу в нескольких направлениях. Он включает себя следующие компоненты:

Flac — это бесплатный кодек, поэтому исходный код всех этих разработок находится в открытом доступе. Им могут свободно пользоваться разработчики софта, что и стало одной из причин популярности этого формата.

Технические особенности

flac формат что это такоеСегодня существует множество аудиокодеков, где используется сжатие без потерь. Как правило, все они построены на популярных алгоритмах zip и gzip, которые повсеместно применяются для архивирования данных.

В отличие от них, flac использует собственный алгоритм, созданный специально для работы со звуковыми файлами. И если zip способен сжимать аудиофайл всего на 10−20%, то алгоритм flac уменьшает звуковые файлы почти в два раза. Однако лучше всего он работает с человеческим голосом, и в этом случае сжатие достигает 60%. Для сравнения: у формата mp3 эта цифра доходит до 80%, однако при этом заметно страдает качество звука.

Как именно работает алгоритм преобразования? Если не вдаваться в математические подробности, то сжатие файлов происходит в три этапа:

Лучше всего алгоритм сжимает блоки с похожими друг на друга семплами (например, с повторяющимися музыкальными фразами). При этом он обладает огромным преимуществом перед другими аналогичными форматами, поскольку умеет работать с потоковым аудио. А значит, он способен «на лету» кодировать звуковые файлы и декодировать сжатые сданные, что делает его превосходной альтернативой формату wav.

Какие параметры звука поддерживает flac? Википедия приводит следующие цифры:

Достоинства формата flac

У flac есть множество преимуществ как над классическими mp3-файлами, так и над другими форматами сжатия без потерь. Вот основные его достоинства:

Недостатки flac

Недостатков у этого формата мало, но они тоже есть. Вот некоторые из них:

Программы для воспроизведения файлов

flac формат что это такоеВ настоящий момент существует множество приложения для воспроизведения flac-файлов. При этом можно легко найти подходящее решение и для Windows, и для Linux, и уж тем более для OS X.

Самым популярным плеером для компьютеров и ноутбуков сегодня считается VLC media player. Он не только очень удобный, но и бесплатный — его свободно можно скачать с официального сайта.

Чтобы этот плеер смог автоматически проигрывать flac-файлы, нужно во время установки установить галочку напротив этого формата. Можно сделать это и после установки: для этого потребуется зайти в настройки, в раздел «Ассоциировать файлы». Теперь любой файл в формате flac будет воспроизводиться после двойного нажатия по нему указателем мыши.

Долгое время самым популярным в мире плеером был Winamp. И хотя сегодня он уже не так распространен, многие пользователи до сих пор предпочитают пользоваться именно им. К счастью, Winamp тоже можно настроить для воспроизведения flac-файлов, но для этого потребуется установиться специальный плагин для этого формата.

Некоторые предпочитают слушать музыку, используя стандартный Windows Media Player. Устанавливать его не требуется, поскольку он обычно уже входит в дистрибутив Windows. Однако, чтобы научить его воспроизводить флак-файлы, нужно скачать с сайта Microsoft специальные фильтры: CoreFLAC или Illiminable.

Существует множество виртуальных плееров, которые поддерживают flac-формат по умолчанию. К ним относятся Foobar 2000, Media Jukebox, KMPlayer, AIMP и некоторые другие программы.

Также flac-файлы умеют воспроизводить многие современные DVD-проигрыватели, причем не только с диска, но и с флешки. Чтобы в этом убедиться, перед покупкой нужно внимательно ознакомиться с характеристикой плеера.

Что делать, если прослушать flac-файл не на чем? В этом случае можно воспользоваться каким-нибудь популярным конвертером (например, Format Factory) и конвертировать файлы в формат mp3, который сегодня поддерживают все музыкальные программы и устройства. При этом желательно выставить максимальную частоту дискретизации, чтобы качество звучания не сильно пострадало.

Источник

Психоакустика, lossless и что еще я знаю об аудио-стандартах

Относительно недавно попалось мне на глаза хоть и студенческое, но все-таки, на мой взгляд, интересное видео из «Курилки Гутенберга» под названием «Психоакустика: звуковые иллюзии». Видео вдохновило меня порыться уже в своих студенческих конспектах и материалах…

Признаюсь честно, я не очень любил предмет Audio Coding, будучи студентом TU Ilmenau на программе Communication and Signal Processing — стресс и юношеский максимализм делали свое темное дело. Однако, со стороны чаще я слышал противоположную точку зрения: «Классный предмет, че ты жалуешься? Один из ваших лекторов — сам Карлхайнц Брандербург — лови момент!»

flac формат что это такое
Один из главных разработчиков формата MP3, если вы не узнали, позирует в наушниках. (источник изображения)

По прошествии времени я, конечно, пересмотрел свой взгляд на данный предмет. Знание на стыке цифровой обработки сигналов, биологии, физики и вычислительной техники — это же круто! Одна тема уже упомянутой психоакустики чего только стоит.

И вот однажды мне пришла в голову очередная авантюрная мысль, и я сказал себе: «Почему бы не написать научно-популярную статью про аудиокодинг? Так сказать, «для самых маленьких» — для таких же студентов, коим был и я»?

Структура статьи

Перечислим темы, о которых будем говорить.

Что ж, для матерых знатоков темы вряд ли найдется что-то новое, вещи довольно базовые, однако я буду рад дополнениям и корректировкам в комментариях! Всем заглянувшим заранее спасибо!

Введение

Я думаю, ни для кого из интересовавшихся темой аудиостандартов не секрет, что существуют в Мире две большие (и непримиримые между собой) парадигмы развития этих самых стандартов. А именно:

За первыми закрепилось звание тяжеловесных стандартов для меломанов. За вторыми стоит многолетняя практика применения: начиная от некачественных подборок музыки на дисках для MP3-плееров, кончая современными (достаточно качественными) потоковыми сервисами прослушивания музыки.

Если в двух словах, то первые стараются максимально точно воспроизвести исходный аудио-файл, убирая лишь избыточность (см. redundancy), а вторые на основе целой теории о том, как человек воспринимает звук, стараются максимально сжать исходный аудио-файл при минимально возможных потерях качества.

А теперь предлагаю поговорить об обеих концепциях чуть подробнее.

Перцептивные кодеки

Начнем со второй группы кодеков, а именно с их обобщенной схемы:

flac формат что это такое
Рис. 1. Обобщенная структурная схема перцептивного кодирования.

Штука слегка специфичная, однако, людям работающим в сфере цифровой обработки сигналов, я думаю, знакомая. Нужен этот блок для того, чтобы разбить входной сигнал на диапазоны и через это иметь больше степеней свободы для компрессии.

Если кто-то интересуется тематикой могу предложить следующие ресурсы:

Это классика. Проходят данные темы обыкновенно в купе с азами теории информации, и потому по данной тематике есть целая база знаний из всевозможных семинаров на различных языках программирования (поэтому сегодня обсуждать подробно мы их не будем).

И вот по данному пункту хотелось бы поговорить более подробно. Ведь именно он и является основной точкой расхождения двух названных выше парадигм.

И начнем мы, так сказать, с самых основ — с биологии.

Анатомия — это ужас как интересно

Прежде чем говорить о том, как именно человек воспринимает звук, и какие математические модели под это можно подвести, поговорим о главном: что вообще позволяет человеку воспринимать звук?

Конечно же, слуховая система (auditory system)! А если быть точным, то преимущественно внутреннее и среднее ухо и их конкретные составляющие:

Рис. 2. Внутреннее строение человеческого уха.

Всё, вроде бы, интуитивно понятно, при условии некоторого багажа школьных знаний. Затруднение обычно вызывает только улитка: что значит эта заумная фраза: «индуцирует бегущие волны по длине базилярной мембраны»?

Как это ни парадоксально, но тут тоже всё достаточно просто. Во-первых, перечислим из чего состоит ушная улитка:

Барабанная перепонка передаёт звуковые колебания косточкам среднего уха; flac формат что это такое
flac формат что это такоекосточки среднего уха передают колебания переимфе и эндолимфе; flac формат что это такое
flac формат что это такоепод действием колебаний перелимфы и эндолимфы колеблется и базилярная мембрана; flac формат что это такое
flac формат что это такоеиз-за движений базилярной мембраны волосковые клетки вырабатывают сигналы, которые передаются нервным клеткам.

Подробнее предлагаю прочитать здесь и здесь.

flac формат что это такое

Рис. 3. Внутреннее строение человеческого уха: базилярная мембрана в «развернутом» виде (ссылка на источник иллюстрации).

Благодаря форме базилярной мембраны (сужается к основанию) и тому, что к разным участкам данной мембраны подсоединяются клетки, отвечающие за восприятие разных частот, ушная улитка — это нелинейная система с частотной избирательностью.

А что если посмотреть на ушную улитку глазами цифровой обработки сигналов?

С точки зрения ЦОС, ушная улитка — это банк полосовых фильтров. При этом фильтры сильно перекрывают друг друга.

flac формат что это такое
Рис. 4. Отклики тона в разных местах базилярной мембраны [1, c. 63].

Что изображено на рисунке:

Добрые люди нарисовали уже и полезные структурные схемы:

flac формат что это такое

Рис. 5. Часть схемы модели восприятия (см. PEMO Model), касающаяся базилярной мембраны.

Перекрывающиеся фильтры показаны, на мой взгляд, очень наглядно.

В какой-то момент знание об ушной улитке, как о банке фильтров, решили как-то уложить в простую и доступную модель. В ходе ряда аудиторных экспериментов [1, c.82-85] ученые определили, что:

у частотных групп, на которые базилярной мембраной разбивается аудио-сигнал, фиксированная ширина полосы;

ширина полосы частотной группы зависит от средней частоты группы нелинейно.

Более того, для удобства, договорились считать, что фильтры нашей слуховой системы прямоугольные.

Всё вышеперечисленное в конечном итоге было обобщено в понятие шкалы Барков — шкалы критических диапазонов частот (см. RWTHxCA101 — Critical bands), ширина которых нелинейно зависит от средней частоты:

flac формат что это такое
Рис. 6. Шкала Барков (источник).

Давайте, запомним этот факт, он нам еще пригодится.

Пока искал иллюстрации по шкале Барков наткнулся на это изображение:

flac формат что это такое
bark scale by spooninglive

Хорошо, теперь мы чуть лучше представляем, что за система позволяет нам слышать. Более того мы выяснили, что органы слуха — это нелинейная частотно-избирательная система. Мы даже выяснили как устроена ее избирательность с точки зрения ширины критических диапазонов.

Но мы пока не говорили, одинаково ли мы слышим те или иные частоты. Быть может, есть какие-то подходящие эксперименты?

Порог в тишине

Конечно же, такие эксперименты есть. Более того, проведены такие эксперименты уже давно. Например, Эберхард Цвикер описывает один из них следующим образом [1, c. 63]:

Перед испытуемым, регистрирующим порог слышимости, ставится задача изменять при помощи переключателя уровень звукового давления так, чтобы с уверенностью отмечались моменты едва заметного появления и исчезновения звука. При этом перо самописца вычеркивает на бумаге зигзагообразную полосу, состоящую из вертикальных штрихов, в пределах которой окажутся те значения давления, для которых нет уверенности, был ли слышен звук или нет.

В конечном итоге, собрали 100 таких замеров от людей обоих полов в возрасте 20-25 лет и посчитали усредненные значения.

flac формат что это такое

Рис. 7. Усредненные кривые порога слышимости для молодых испытуемых со здоровым слухом. [1, c. 64]

А потом медиана (кривая между 10% и 90% на рис. 7) была названа порогом слышимости (или «порогом в тишине«) и вошла в стандарты (в том числе и наш ГОСТ).

flac формат что это такое

Рис. 8. Порог слышимости в тишине (threshold in quiet, hearing threshold), уровень риска повреждения органов слуха (risk of damage), уровень болевых ощущений (threshold of pain) (источник). Да, боль не предупреждает об опасности, а просто констатирует факт негативного влияния на слух.

Под это есть даже специальная формула:

flac формат что это такое

где flac формат что это такое— это, как нетрудно догадаться, частота в килогерцах.

Проговорим суть порога слышимости ещё раз: чтобы какой-либо звук мог быть услышан, он должен превысить значение «порога в тишине». То есть эволюция все расставила так, что мы почти гарантированно услышим звуки вблизи 2-4 кГц, однако, почти так же гарантированно не услышим слишком низкие и слишком высокие частоты.

Порог в тишине в том виде, в котором он представлен на рисунке 5, актуален как правило для усредненной группы именно молодых людей. С возрастом восприятие высоких частот меняется:

flac формат что это такое

В свое время этот факт, насколько я знаю, стал основой для тиражирования среди подростков ультразвукового сигнала вызова телефона: предполагалось, что взрослые (например, учителя) его слышать не будут, и поэтому не станут раздражаться на посторонние шумы. Ну, в годы моей молодости ничего, кроме «пыток» одноклассников раздражающим и назойливым звуком посреди урока со стороны кучки «пассионариев», эта идея не принесла…

Почему к данной кривой применяется словосочетание «в тишине»?

Потому что предполагается, что так люди воспринимают звук в отсутствии посторонних шумов. При появлении шума порог будет, как бы, «приподниматься». В случае широкополосного шума картина станет такой:

flac формат что это такое

Рис. 8. Уровни порогов маскирования (термин обсудим ниже) белым шумом в зависимости от частоты тестового тона. Пунктиром отмечен уклон (slope) кривых на высоких частотах. [2, c. 62]

А в случае узкополосных шумов?

Маскинг (на пальцах)

В случае узкополосных шумов порог слышимости будет выглядеть так:

flac формат что это такое

Рис. 9. Уровни, показывающие начало слышимости тестового тона, замаскированного тонами шириной критических диапазонов с центральными частотами 250 Гц, 1 кГц и 4 кГц и уровнем 60 дБ. [2, c. 64]

Быть может, моя следующая аналогия будет не совсем точной, но я вот смотрю на эту иллюстрацию и вижу, будто покрывало (порог слышимости) приподнимают снизу чем-то, вроде палки (тон) — и появляются скаты во все стороны (влияние на соседние частоты). И все, что под покрывалом, скрыто от наблюдателей. Замаскировано…

Этот феномен называют эффектом частотного маскирования (frequency masking). То есть шумы маскируют собой более слабые сигналы в частотной области.

Иными словами достаточно сильный тон влияет еще и на своих соседей. Выглядит это примерно так:

flac формат что это такое

Рис. 10. Пример маскирования одного тона другим тоном более высокой частоты (источник).

То есть, иначе говоря, более сильный тон замаскировал своего более слабого соседа, и поэтому сосед перестал быть заметным для слуховой системы. Функция, которая определяет порог маскирования, называется функцией распространения (spreading function) и вычисляется на основе эмпирически полученных коэффициентов и шкалы Барков (формулы можно найти, например, в Википедии — см. Одновременная маскировка (Психоаккустика)).

Существует, к слову, и временное маскирование (маскирование во временной области): громкий сигнал маскирует собой как следующий за ним более слабый, так и предшествующий ему более слабый сигналы. Согласен, вторая часть утверждения звучит немного странно, но нужно все же держать в голове, что органы слуха и восприятия — это система со своей инерцией и задержками.

Возникает вопрос: зачем вообще тратить память на запись того, что в принципе не будет услышано?

Именно эта идея и стала базовой для перцептивных стандартов: удаляется не только избыточность на уровне эффективного кодирования, но и избыточность с точки зрения модели восприятия (irrelevance). Проводится такая «очистка» нерелевантных звуков на этапе квантования.

Подробно о процедуре квантования на основе психоаккустической модели можно прочитать здесь: Audio Coding Quantization and CodingMethods by Prof. Dr.-Ing. Karlheinz Brandenburg.

Суть состоит в том, что внутри каждого диапазона, полученного со входа банка фильтров, динамически вычисляется порог маскирования, и на его основе каждый отсчет квантуется и кодируется с таким шагом квантования, чтобы шум квантования оставался ниже некоторого допустимого порога.

А что же у lossless?

Если кратко, то данные форматы придерживаются двух основных принципов:

Структурная схема кодера выглядит так [3]:

flac формат что это такое
Рис. 11. Lossless-кодер.

Сначала аудио-сигнал разбивается на фреймы (кадры) в целях достижения изменяемости: работа осуществляется не со всем тяжеловесным исходником, а только с его частью — с фреймом (не слишком большим, но и не слишком малым).

Далее идет первый этап избавления от избыточности — декорреляция отсчетов (сэмплов) внутри фреймов. Звучит немного заумно, но на практике ничего сложного. Проследим на примере самой, пожалуй, распространенной реализации — на примере кодирование с предсказанием (на основе линейных фильтров):

flac формат что это такое

Рис. 12. Схема кодера с предсказанием.

Предиктор (предсказатель) высчитывает некоторое значение, предполагаемое на основе предыдущих отсчетов; исходя из него вычисляется ошибка предсказания e(n), и именно она сжимается дальше эффективными кодеками. За счет этого происходит некоторая экономия памяти без потери качества.

Здесь важно, чтобы кодер и декодер были абсолютно идентичными, вплоть до выбора метода округления (обычно выбирается стандарт из IEEE).

flac формат что это такое

Рис. 13. Схема декодера с предсказанием.

Более подробно о предиктивном кодировании, а также о гибриде lossless с перцептивными подходами можно прочесть здесь: Prediction and Lossless Audio Coding Prof. Dr.-Ing. Karlheinz Brandenburg.

Вот такая лаконичная idea behind, в общем-то.

Мысли вслух (вместо послесловия)

Надеюсь смог хоть немного приоткрыть завесу идей, лежащих в основе. Рад буду вашим замечаниям и комментариям!

Слушайте хорошую музыку хорошего качества удобным для вас способом!

Литература

Цвикер Э., Фельдкеллер Р. Ухо как приемник информации //М.: Связь. – 1971.

Zwicker E., Fastl H. Psychoacoustics: Facts and models. – Springer Science & Business Media, 2013. – Т. 22.

M. Hans and R. W. Schafer, «Lossless compression of digital audio,» in IEEE Signal Processing Magazine, vol. 18, no. 4, pp. 21-32, July 2001.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *