Что значит частота дискретизации

Частота дискретизации

Чем выше частота дискретизации, тем более качественной будет оцифровка. Как следует из теоремы Котельникова для того чтобы однозначно восстановить исходный сигнал, частота дискретизации должна превышать наибольшую необходимую частоту сигнала в два раза.

Используемые частоты дискретизации звука

8 000 Гц	телефон, достаточно для речи, кодек Nellymoser;
11 025 Гц	—
22 050 Гц	радио;
44 100 Гц	используется в Audio CD;
48 000 Гц	DVD, DAT;
96 000 Гц	DVD-Audio (MLP 5.1);
192 000 Гц	DVD-Audio (MLP 2.0);
2 822 400 Гц	SACD Super audio CD 5.1 — максимальная на 2008 год.

Взаимосвязь качества звука и частоты дискретизации [ править ]

Преобразование аналогового сигнала в цифровой состоит из двух этапов: дискретизации по времени и квантования по амплитуде. Дискретизация по времени означает, что сигнал представляется рядом отсчетов (сэмплов), взятых через равные промежутки времени. Например, когда мы говорим, что частота дискретизации 44,1 кГц, то это значит, что сигнал измеряется 44 100 раз в течение одной секунды.

Основной вопрос на первом этапе преобразования аналогового сигнала в цифровой (оцифровки) состоит в выборе частоты дискретизации аналогового сигнала. Чем больше частота, тем точнее соответствует цифровой сигнал аналоговому. Однако пропорционально увеличению частоты возрастают:

Очевидно, что необходим компромисс. От выбора частоты дискретизации зависит частотный диапазон полученного цифрового звука и максимальная частота аналогового сигнала, правильно представленная в цифровом. Считается, что человек слышит частоты в диапазоне от 20 до 20 000 Гц. Согласно известной теореме Котельникова, для того, чтобы аналоговый (непрерывный по времени) сигнал можно было точно восстановить по его отсчетам, частота дискретизации должна быть как минимум вдвое больше максимальной звуковой частоты.

Звуковая частота, равная половине частоты дискретизации, называется частотой Найквиста и является максимальной частотой, которую данная цифровая система может правильно сохранить и воспроизвести. Таким образом, если реальный аналоговый сигнал, который мы собираемся преобразовать в цифровую форму, содержит частотные компоненты от 0 до 20 кГц, то частота дискретизации такого сигнала должна быть не менее 40 кГц. Сегодня самыми распространенными частотами дискретизации являютcя 44,1 кГц (CD) и 48 кГц (DAT).

Источник

Сага Его Величество Звук

§2. Второе вступление.

Естественный звук – аналоговый: упругие волны распространяются в упругих средах (твердые, жидкие, газообразные) и совершают в них механические колебания.
На звукозаписывающей студии аналоговый сигнал от исполнителя оцифровывается: механические колебания превращаются в электрические колебания тех же частот. Т.е. вместо разной плотности среды будет разное напряжение и направление течения тока.

Представим, что мы держим в руках болванку CD с записью группы Morcheeba 16 бит/44.1 кГц

или записанную на флешку оцифровку винила Джо Дассена Люксембургский сад в формате WAV 24 бит/192 кГц

Вставляем диск или флешку в магнитолу, цифИрки с них считываются и попадают – куда? Правильно, в цифро-аналоговый преобразователь. Он же просто «цап» =)
Стоп.
Для начала определимся, какая еда попадает в цап и что такое эти цифры 16 бит/44.1 кГц и 24 бит/192 кГц.

Как правило, если звук записывается на CD, то мы получаем цифру в виде 16 бит/44.1 кГц, где 16 бит это уровень квантования, 44.1 кГц это частота дискретизации (она же частота семплирования).
Если позволяет уровень звукозаписывающей аппаратуры, то запись может содержать цифру с уровнем до 24бит/96 кГц или даже 24бит/192 кГц (формат DVD-Audio).

Откуда берется уровень квантования?
Аналогово-цифровой преобразователь АЦП (тот, что в студии звукозаписи) делает замер амплитуды аналогового сигнала и записывает численное значение данного замера. Если АЦП может описать это значение в 16 битах (16-битное квантование), то это означает, что будет записано 65536 уровней сигнала (2 в 16 степени).

Если оборудование может кодировать звук с глубиной 24 бита, то значит будет записано 16 777 216 уровней сигнала (2 в 24 степени). По-простому, это как разрешение картинки в пикселях, чем больше, тем лучше.
Повышение битности звука нужно для:
— увеличения максимального динамического диапазона и для уменьшения шумов квантования
— повышения точности сигнала: чем больше разрядов – тем точнее измерение, тем ближе ступенчатая функция к оригиналу. Особое значение это имеет при оцифровке тихих звуков (любители классической музыки тут оживились =).

Откуда берется частота дискретизации?
Эта характеристика определяет, сколько замеров делается за одну секунду. Т.е. аналого-цифровой преобразователь АЦП делает определенное количество замеров уровня поступающего сигнала и записывает эти значения в 16 или 24 битах. Чем больше замеров в секунду он сделает, тем качественнее будет преобразование.
Теорема Котельникова (в англоязычной литературе – теорема Найквиста-Шеннона) гласит, что (сделайте лицо посерьезнее): если аналоговый сигнал имеет финитный (ограниченный по ширине) спектр, то он может быть восстановлен однозначно и без потерь по своим дискретным отсчётам, взятым с частотой, строго большей удвоенной верхней частоты.

Читайте также: Что значит цвет орхидеи

В переводе на нормально-человеческий язык, чтобы получить наиболее полную информацию о звуке в слышимом нашими ухами частотном диапазоне до 20-22 кГц, необходима дискретизация с частотой, не менее 44,1 кГц. Эта частота и используется в CD-Audio. Для DVD-Audio она достигает 192 кГц (зачем нам нужно слышать частоты, которые не слышат наши уши, поговорим как-нибудь в другой раз =).

Если вы еще с нами, то наверняка решили проверить теорию на практике, поставили Лепса мрЗ и увидели в проигрывателе те же заветные 44,1 кГц, а то и больше 44 или 48 кГц, и в чем тогда отличие от CD?! Отличие в потоке битов в секунду (битрейт). МРЗ даже со своими максимальными 320 kpbs всячески убивает глубину сцены и прочие вкусности звука, потому что эта МРаЗь получается путем перегонки через фильтр и отсекания якобы неслышимых частот. А CD запись это 1411 kbps, lossless меньше, 800-900, но это просто сжатие данных как в zip-архиве.

Источник

Частота дискретизации при оцифровке

Частота дискретизации – частота выборки отсчетов сигнала при оцифровке.

Частоту дискретизации еще называют частотой сэмплирования (sample rate).

Для большего понимания этого понятия давайте посмотрим на рисунок, на котором представлена форма волны сигнала.

Значения «O» представляет собой один отсчет – промежуток времени отдельно взятого сэмпла. А частота дискретизации показывает сколько отсчетов (сэмплов одинаковой продлжительности «O») взято за одну секунду.

Если оцифрованный сигнал имеет частоту дискретизации 48 кГц, то это означает, что каждая секунда этого сигнала разбита на 48000 отсчетов.

Например трэк продолжительностью 7 мин (420 секунд) с частотой сэмплирования 48 кГц будет иметь 20160000 отсчетов (420х48000).

Из выше сказанного можно сделать вывод, что чем больше частота дискретизации, тем выше качество аудиосигнала. Но при выборе больших значений sample rate при преобразовании аудиосигнала повышается интенсивность потока цифровых данных и нагрузка на цифровые процессы обработки информации, а также увеличивается объем результирующего файла.

Учитывая теорему Найквиста (в любой системе, осуществляющей дискретизацию по времени частота дискретизации должна быть как минимум в два раза больше чем наибольшая частота, которую необходимо передать) и то, что человек может слышать звук в диапазоне 20 – 20000 Гц, то можно сказать, что для качественного преобразования аналогового сигнала в цифровой будет достаточно использовать частоту дискретизации в 44,1 кГц (44100/2 = 22050).

Напоследок приведу несколько примеров использования частоты дискретизации звука.

— 8 000 Гц – телефон (частота достаточная для передачи речи);

Источник

Записывая звук, выбираем оптимальную частоту. Полезная информация

Не только новичкам, но и некоторым энтузиастам, занимающихся звуком много лет, покажется откровением тот факт, что банальный процесс записи сопровождается сложнейшими физическими явлениями. Одним из таковых называют дискретизацию. Согласно определению, она представляет собой процесс преобразования непрерывной функции в дискретную. Людям, далёким от науки, это понять сложно, тем более, здесь задействована квантовая физика – самая сложная из существующих на сегодняшний день. Но профессиональные звукорежиссёры, например, работающие в московской студии звукозаписи «Интервал», знают, что такое частота дискретизации звука, какая лучше применима в тех или иных случаях. Почему? Потому что от этого явления зависит конечное качество записываемой музыки. В кассетно-плёночный период эти нюансы, ввиду ограниченной технической оснащённости, опускались. Но в современном высокотехнологичном цифровом мире частота дискретизации звука имеет значение при создании музыки и демонстрации её слушателям.

Детализация понятий

Что такое разрядность и частота дискретизации, какая лучше? Ответ на данный вопрос, несмотря на сложность природы этих явлений, получить можно. При этом нет необходимости штудировать учебники по физике. Достаточно вспомнить, что советскими полуподпольными звукорежиссёрами, записывающими рок и другую музыку, эти показатели определялись на интуитивном уровне. Дискретизацию ещё называют сэмплированием. Это определение более понятно для музыкантов. Её частота подразумевает интенсивность процессов в тот момент, когда аналоговый сигнал преобразуется в цифровой. Среди них хранение данных, конвертация, и непосредственно оцифровка.

Частота дискретизации измеряется в герцах. Ориентиром в её изучении является теорема Котельникова. Её автор раскрывает суть дискретизации. Согласно теореме, она ограничивает интенсивность оцифрованного сигнала до половины собственной величины.

Частота дискретизации. В чём её значение для звукозаписи

Дискретизация по времени – это процесс, который непосредственно связан преобразованием аналогового сигнала в цифровой. Наряду с ней происходит квантование данных по амплитуде. Дискретизация по времени означает измерение сигнала в момент всей его передачи. В качестве единицы берётся один сэмпл. Если на словах это не совсем понятно, то на примере выглядит более убедительно. Допустим, частота дискредитации равняется 44100 Гц – та самая, которая применялась на аудио-CD. Это означает, что сигнал измеряется 44100 раз в течение одной секунды.

Аналоговый сигнал по своей насыщенности всегда превосходит цифровой. И его преобразование – это неизбежная потеря в качестве. Частота дискретизации служит своеобразным ориентиром: чем она выше, тем ближе качество цифрового звука к аналоговому. Это явственно просматривается в списке ниже. Он показывает, какая частота звука лучше. Изучая его, вы увидите непосредственную взаимосвязь дискретизации и качества трека:

Список чётко указывает на то, какая частота звука лучше. К тому же технологии на месте не стоят, и появляются новейшие форматы. Но прежде чем строить далеко идущие планы, следует учесть один очень весомый нюанс. Его суть проста: чем выше частота дискретизации, тем сложнее её достичь технологически. Для этого необходимо:

Учитывая вышеизложенную информацию, неудивительным является тот факт, что частота звука, равная 44100 Гц, продолжает оставаться наиболее востребованной и сегодня. Она десятилетиями удовлетворяет даже самые взыскательные запросы к качеству, и вместе с тем имеются все технические возможности для её достижения. Последний фактор является определяющим как для рядовых пользователей, так и для большинства звукозаписывающих студий. Даже зная, какая частота звука лучше, чтобы достигнуть её, необходимо позаботиться о технической оснащённости.

Источник

Цифровое представление аналогового аудиосигнала. Краткий ликбез

Дорогие читатели, меня зовут Феликс Арутюнян. Я студент, профессиональный скрипач. В этой статье хочу поделиться с Вами отрывком из моей презентации, которую я представил в университете музыки и театра Граца по предмету прикладная акустика.

Рассмотрим теоретические аспекты преобразования аналогового (аудио) сигнала в цифровой.
Статья не будет всеохватывающей, но в тексте будут гиперссылки для дальнейшего изучения темы.

Чем отличается цифровой аудиосигнал от аналогового?

Аналоговый (или континуальный) сигнал описывается непрерывной функцией времени, т.е. имеет непрерывную линию с непрерывным множеством возможных значений (рис. 1).

Цифровой сигнал — это сигнал, который можно представить как последовательность определенных цифровых значений. В любой момент времени он может принимать только одно определенное конечное значение (рис. 2).

Аналоговый сигнал в динамическом диапазоне может принимать любые значения. Аналоговый сигнал преобразуется в цифровой с помощью двух процессов — дискретизация и квантование. Очередь процессов не важна.

Дискретизацией называется процесс регистрации (измерения) значения сигнала через определенные промежутки (обычно равные) времени (рис. 3).

Квантование — это процесс разбиения диапазона амплитуды сигнала на определенное количество уровней и округление значений, измеренных во время дискретизации, до ближайшего уровня (рис. 4).

Дискретизация разбивает сигнал по временной составляющей (по вертикали, рис. 5, слева).
Квантование приводит сигнал к заданным значениям, то есть округляет сигнал до ближайших к нему уровней (по горизонтали, рис. 5, справа).

Эти два процесса создают как бы координатную систему, которая позволяет описывать аудиосигнал определенным значением в любой момент времени.
Цифровым называется сигнал, к которому применены дискретизация и квантование. Оцифровка происходит в аналого-цифровом преобразователе (АЦП). Чем больше число уровней квантования и чем выше частота дискретизации, тем точнее цифровой сигнал соответствует аналоговому (рис. 6).

Уровни квантования нумеруются и каждому уровню присваивается двоичный код. (рис. 7)

Количество битов, которые присваиваются каждому уровню квантования называют разрядностью или глубиной квантования (eng. bit depth). Чем выше разрядность, тем больше уровней можно представить двоичным кодом (рис. 8).

Данная формула позволяет вычислить количество уровней квантования:

Если N — количество уровней квантования,
n — разрядность, то

Обычно используют разрядности в 8, 12, 16 и 24 бит. Несложно вычислить, что при n=24 количество уровней N = 16,777,216.

При n = 1 аудиосигнал превратится в азбуку Морзе: либо есть «стук», либо нету. Существует также разрядность 32 бит с плавающей запятой. Обычный компактный Аудио-CD имеет разрядность 16 бит. Чем ниже разрядность, тем больше округляются значения и тем больше ошибка квантования.

Ошибкой квантований называют отклонение квантованного сигнала от аналогового, т.е. разница между входным значением и квантованным значением ()

Большие ошибки квантования приводят к сильным искажениям аудиосигнала (шум квантования).

Чем выше разрядность, тем незначительнее ошибки квантования и тем лучше отношение сигнал/шум (Signal-to-noise ratio, SNR), и наоборот: при низкой разрядности вырастает шум (рис. 9).

Разрядность также определяет динамический диапазон сигнала, то есть соотношение максимального и минимального значений. С каждым битом динамический диапазон вырастает примерно на 6dB (Децибел) (6dB это в 2 раза; то есть координатная сетка становиться плотнее, возрастает градация).

Ошибки квантования (округления) из-за недостаточного количество уровней не могут быть исправлены.

50dB SNR
примечание: если аудиофайлы не воспроизводятся онлайн, пожалуйста, скачивайте их.

Теперь о дискретизации.

Как уже говорили ранее, это разбиение сигнала по вертикали и измерение величины значения через определенный промежуток времени. Этот промежуток называется периодом дискретизации или интервалом выборок. Частотой выборок, или частотой дискретизации (всеми известный sample rate) называется величина, обратная периоду дискретизации и измеряется в герцах. Если
T — период дискретизации,
F — частота дискретизации, то

Чтобы аналоговый сигнал можно было преобразовать обратно из цифрового сигнала (точно реконструировать непрерывную и плавную функцию из дискретных, «точечных» значении), нужно следовать теореме Котельникова (теорема Найквиста — Шеннона).

Теорема Котельникова гласит:

Если аналоговый сигнал имеет финитный (ограниченной по ширине) спектр, то он может быть восстановлен однозначно и без потерь по своим дискретным отсчетам, взятым с частотой, строго большей удвоенной верхней частоты.

Вам знакомо число 44.1kHz? Это один из стандартов частоты дискретизации, и это число выбрали именно потому, что человеческое ухо слышит только сигналы до 20kHz. Число 44.1 более чем в два раза больше чем 20, поэтому все частоты в цифровом сигнале, доступные человеческому уху, могут быть преобразованы в аналоговом виде без искажении.

Но ведь 20*2=40, почему 44.1? Все дело в совместимости с стандартами PAL и NTSC. Но сегодня не будем рассматривать этот момент. Что будет, если не следовать теореме Котельникова?

Когда в аудиосигнале встречается частота, которая выше чем 1/2 частоты дискретизации, тогда возникает алиасинг — эффект, приводящий к наложению, неразличимости различных непрерывных сигналов при их дискретизации.

Как видно из предыдущей картинки, точки дискретизации расположены так далеко друг от друга, что при интерполировании (т.е. преобразовании дискретных точек обратно в аналоговый сигнал) по ошибке восстанавливается совершенно другая частота.

Аудиопример 4: Линейно возрастающая частота от

100 до 8000Hz. Частота дискретизации — 16000Hz. Нет алиасинга.

Аудиопример 5: Тот же файл. Частота дискретизации — 8000Hz. Присутствует алиасинг

Пример:
Имеется аудиоматериал, где пиковая частота — 2500Hz. Значит, частоту дискретизации нужно выбрать как минимум 5000Hz.

Следующая характеристика цифрового аудио это битрейт. Битрейт (bitrate) — это объем данных, передаваемых в единицу времени. Битрейт обычно измеряют в битах в секунду (Bit/s или bps). Битрейт может быть переменным, постоянным или усреднённым.

Следующая формула позволяет вычислить битрейт (действительна только для несжатых потоков данных):

Битрейт = Частота дискретизации * Разрядность * Количество каналов

Например, битрейт Audio-CD можно рассчитать так:
44100 (частота дискретизации) * 16 (разрядность) * 2 (количество каналов, stereo)= 1411200 bps = 1411.2 kbit/s

При постоянном битрейте (constant bitrate, CBR) передача объема потока данных в единицу времени не изменяется на протяжении всей передачи. Главное преимущество — возможность довольно точно предсказать размер конечного файла. Из минусов — не оптимальное соотношение размер/качество, так как «плотность» аудиоматериала в течении музыкального произведения динамично изменяется.

При кодировании переменным битрейтом (VBR), кодек выбирает битрейт исходя из задаваемого желаемого качества. Как видно из названия, битрейт варьируется в течение кодируемого аудиофайла. Данный метод даёт наилучшее соотношение качество/размер выходного файла. Из минусов: точный размер конечного файла очень плохо предсказуем.

Усреднённый битрейт (ABR) является частным случаем VBR и занимает промежуточное место между постоянным и переменным битрейтом. Конкретный битрейт задаётся пользователем. Программа все же варьирует его в определенном диапазоне, но не выходит за заданную среднюю величину.

При заданном битрейте качество VBR обычно выше чем ABR. Качество ABR в свою очередь выше чем CBR: VBR > ABR > CBR.

ABR подходит для пользователей, которым нужны преимущества кодирования VBR, но с относительно предсказуемым размером файла. Для ABR обычно требуется кодирование в 2 прохода, так как на первом проходе кодек не знает какие части аудиоматериала должны кодироваться с максимальным битрейтом.

Существуют 3 метода хранения цифрового аудиоматериала:

Несжатый (RAW) формат данных

Другой формат хранения несжатого аудиопотока это WAV. В отличие от RAW, WAV содержит заголовок файла.

Аудиоформаты с сжатием без потерь

Принцип сжатия схож с архиваторами (Winrar, Winzip и т.д.). Данные могут быть сжаты и снова распакованы любое количество раз без потери информации.

Как доказать, что при сжатии без потерь, информация действительно остаётся не тронутой? Это можно доказать методом деструктивной интерференции. Берем две аудиодорожки. В первой дорожке импортируем оригинальный, несжатый wav файл. Во второй дорожке импортируем тот же аудиофайл, сжатый без потерь. Инвертируем фазу одного из дорожек (зеркальное отображение). При проигрывании одновременно обеих дорожек выходной сигнал будет тишиной.

Это доказывает, что оба файла содержат абсолютно идентичные информации (рис. 11).

Кодеки сжатия без потерь: flac, WavPack, Monkey’s Audio…

При сжатии с потерями

акцент делается не на избежание потерь информации, а на спекуляцию с субъективными восприятиями (Психоакустика). Например, ухо взрослого человек обычно не воспринимает частоты выше 16kHz. Используя этот факт, кодек сжатия с потерями может просто жестко срезать все частоты выше 16kHz, так как «все равно никто не услышит разницу».

Другой пример — эффект маскировки. Слабые амплитуды, которые перекрываются сильными амплитудами, могут быть воспроизведены с меньшим качеством. При громких низких частотах тихие средние частоты не улавливаются ухом. Например, если присутствует звук в 1kHz с уровнем громкости в 80dB, то 2kHz-звук с громкостью 40dB больше не слышим.

Этим и пользуется кодек: 2kHz-звук можно убрать.

Кодеки сжатия с потерям: mp3, aac, ogg, wma, Musepack…

Источник