Цифровое представление аналогового аудиосигнала. Краткий ликбез
Дорогие читатели, меня зовут Феликс Арутюнян. Я студент, профессиональный скрипач. В этой статье хочу поделиться с Вами отрывком из моей презентации, которую я представил в университете музыки и театра Граца по предмету прикладная акустика.
Рассмотрим теоретические аспекты преобразования аналогового (аудио) сигнала в цифровой.
Статья не будет всеохватывающей, но в тексте будут гиперссылки для дальнейшего изучения темы.
Чем отличается цифровой аудиосигнал от аналогового?
Аналоговый (или континуальный) сигнал описывается непрерывной функцией времени, т.е. имеет непрерывную линию с непрерывным множеством возможных значений (рис. 1).

Цифровой сигнал — это сигнал, который можно представить как последовательность определенных цифровых значений. В любой момент времени он может принимать только одно определенное конечное значение (рис. 2).

Аналоговый сигнал в динамическом диапазоне может принимать любые значения. Аналоговый сигнал преобразуется в цифровой с помощью двух процессов — дискретизация и квантование. Очередь процессов не важна.
Дискретизацией называется процесс регистрации (измерения) значения сигнала через определенные промежутки (обычно равные) времени (рис. 3).
Квантование — это процесс разбиения диапазона амплитуды сигнала на определенное количество уровней и округление значений, измеренных во время дискретизации, до ближайшего уровня (рис. 4).
Дискретизация разбивает сигнал по временной составляющей (по вертикали, рис. 5, слева).
Квантование приводит сигнал к заданным значениям, то есть округляет сигнал до ближайших к нему уровней (по горизонтали, рис. 5, справа).

Эти два процесса создают как бы координатную систему, которая позволяет описывать аудиосигнал определенным значением в любой момент времени.
Цифровым называется сигнал, к которому применены дискретизация и квантование. Оцифровка происходит в аналого-цифровом преобразователе (АЦП). Чем больше число уровней квантования и чем выше частота дискретизации, тем точнее цифровой сигнал соответствует аналоговому (рис. 6).

Уровни квантования нумеруются и каждому уровню присваивается двоичный код. (рис. 7)
Количество битов, которые присваиваются каждому уровню квантования называют разрядностью или глубиной квантования (eng. bit depth). Чем выше разрядность, тем больше уровней можно представить двоичным кодом (рис. 8).

Данная формула позволяет вычислить количество уровней квантования:
Если N — количество уровней квантования,
n — разрядность, то
Обычно используют разрядности в 8, 12, 16 и 24 бит. Несложно вычислить, что при n=24 количество уровней N = 16,777,216.
При n = 1 аудиосигнал превратится в азбуку Морзе: либо есть «стук», либо нету. Существует также разрядность 32 бит с плавающей запятой. Обычный компактный Аудио-CD имеет разрядность 16 бит. Чем ниже разрядность, тем больше округляются значения и тем больше ошибка квантования.
Ошибкой квантований называют отклонение квантованного сигнала от аналогового, т.е. разница между входным значением и квантованным значением
(
)
Большие ошибки квантования приводят к сильным искажениям аудиосигнала (шум квантования).
Чем выше разрядность, тем незначительнее ошибки квантования и тем лучше отношение сигнал/шум (Signal-to-noise ratio, SNR), и наоборот: при низкой разрядности вырастает шум (рис. 9).

Разрядность также определяет динамический диапазон сигнала, то есть соотношение максимального и минимального значений. С каждым битом динамический диапазон вырастает примерно на 6dB (Децибел) (6dB это в 2 раза; то есть координатная сетка становиться плотнее, возрастает градация).
Ошибки квантования (округления) из-за недостаточного количество уровней не могут быть исправлены.
50dB SNR
примечание: если аудиофайлы не воспроизводятся онлайн, пожалуйста, скачивайте их.
Теперь о дискретизации.
Как уже говорили ранее, это разбиение сигнала по вертикали и измерение величины значения через определенный промежуток времени. Этот промежуток называется периодом дискретизации или интервалом выборок. Частотой выборок, или частотой дискретизации (всеми известный sample rate) называется величина, обратная периоду дискретизации и измеряется в герцах. Если
T — период дискретизации,
F — частота дискретизации, то
Чтобы аналоговый сигнал можно было преобразовать обратно из цифрового сигнала (точно реконструировать непрерывную и плавную функцию из дискретных, «точечных» значении), нужно следовать теореме Котельникова (теорема Найквиста — Шеннона).
Теорема Котельникова гласит:
Если аналоговый сигнал имеет финитный (ограниченной по ширине) спектр, то он может быть восстановлен однозначно и без потерь по своим дискретным отсчетам, взятым с частотой, строго большей удвоенной верхней частоты.
Вам знакомо число 44.1kHz? Это один из стандартов частоты дискретизации, и это число выбрали именно потому, что человеческое ухо слышит только сигналы до 20kHz. Число 44.1 более чем в два раза больше чем 20, поэтому все частоты в цифровом сигнале, доступные человеческому уху, могут быть преобразованы в аналоговом виде без искажении.
Но ведь 20*2=40, почему 44.1? Все дело в совместимости с стандартами PAL и NTSC. Но сегодня не будем рассматривать этот момент. Что будет, если не следовать теореме Котельникова?
Когда в аудиосигнале встречается частота, которая выше чем 1/2 частоты дискретизации, тогда возникает алиасинг — эффект, приводящий к наложению, неразличимости различных непрерывных сигналов при их дискретизации.

Как видно из предыдущей картинки, точки дискретизации расположены так далеко друг от друга, что при интерполировании (т.е. преобразовании дискретных точек обратно в аналоговый сигнал) по ошибке восстанавливается совершенно другая частота.
Аудиопример 4: Линейно возрастающая частота от
100 до 8000Hz. Частота дискретизации — 16000Hz. Нет алиасинга.
Аудиопример 5: Тот же файл. Частота дискретизации — 8000Hz. Присутствует алиасинг
Пример:
Имеется аудиоматериал, где пиковая частота — 2500Hz. Значит, частоту дискретизации нужно выбрать как минимум 5000Hz.
Следующая характеристика цифрового аудио это битрейт. Битрейт (bitrate) — это объем данных, передаваемых в единицу времени. Битрейт обычно измеряют в битах в секунду (Bit/s или bps). Битрейт может быть переменным, постоянным или усреднённым.
Следующая формула позволяет вычислить битрейт (действительна только для несжатых потоков данных):
Битрейт = Частота дискретизации * Разрядность * Количество каналов
Например, битрейт Audio-CD можно рассчитать так:
44100 (частота дискретизации) * 16 (разрядность) * 2 (количество каналов, stereo)= 1411200 bps = 1411.2 kbit/s
При постоянном битрейте (constant bitrate, CBR) передача объема потока данных в единицу времени не изменяется на протяжении всей передачи. Главное преимущество — возможность довольно точно предсказать размер конечного файла. Из минусов — не оптимальное соотношение размер/качество, так как «плотность» аудиоматериала в течении музыкального произведения динамично изменяется.
При кодировании переменным битрейтом (VBR), кодек выбирает битрейт исходя из задаваемого желаемого качества. Как видно из названия, битрейт варьируется в течение кодируемого аудиофайла. Данный метод даёт наилучшее соотношение качество/размер выходного файла. Из минусов: точный размер конечного файла очень плохо предсказуем.
Усреднённый битрейт (ABR) является частным случаем VBR и занимает промежуточное место между постоянным и переменным битрейтом. Конкретный битрейт задаётся пользователем. Программа все же варьирует его в определенном диапазоне, но не выходит за заданную среднюю величину.
При заданном битрейте качество VBR обычно выше чем ABR. Качество ABR в свою очередь выше чем CBR: VBR > ABR > CBR.
ABR подходит для пользователей, которым нужны преимущества кодирования VBR, но с относительно предсказуемым размером файла. Для ABR обычно требуется кодирование в 2 прохода, так как на первом проходе кодек не знает какие части аудиоматериала должны кодироваться с максимальным битрейтом.
Существуют 3 метода хранения цифрового аудиоматериала:
Несжатый (RAW) формат данных
Другой формат хранения несжатого аудиопотока это WAV. В отличие от RAW, WAV содержит заголовок файла.
Аудиоформаты с сжатием без потерь
Принцип сжатия схож с архиваторами (Winrar, Winzip и т.д.). Данные могут быть сжаты и снова распакованы любое количество раз без потери информации.
Как доказать, что при сжатии без потерь, информация действительно остаётся не тронутой? Это можно доказать методом деструктивной интерференции. Берем две аудиодорожки. В первой дорожке импортируем оригинальный, несжатый wav файл. Во второй дорожке импортируем тот же аудиофайл, сжатый без потерь. Инвертируем фазу одного из дорожек (зеркальное отображение). При проигрывании одновременно обеих дорожек выходной сигнал будет тишиной.
Это доказывает, что оба файла содержат абсолютно идентичные информации (рис. 11).
Кодеки сжатия без потерь: flac, WavPack, Monkey’s Audio…
При сжатии с потерями
акцент делается не на избежание потерь информации, а на спекуляцию с субъективными восприятиями (Психоакустика). Например, ухо взрослого человек обычно не воспринимает частоты выше 16kHz. Используя этот факт, кодек сжатия с потерями может просто жестко срезать все частоты выше 16kHz, так как «все равно никто не услышит разницу».
Другой пример — эффект маскировки. Слабые амплитуды, которые перекрываются сильными амплитудами, могут быть воспроизведены с меньшим качеством. При громких низких частотах тихие средние частоты не улавливаются ухом. Например, если присутствует звук в 1kHz с уровнем громкости в 80dB, то 2kHz-звук с громкостью 40dB больше не слышим.
Этим и пользуется кодек: 2kHz-звук можно убрать.
Кодеки сжатия с потерям: mp3, aac, ogg, wma, Musepack…
Цифровой аудиоформат 24/192, и почему в нем нет смысла. Часть 2 [Перевод]
Сохранить и прочитать потом —
Прим. перев.: Это перевод второй (из четырех) частей развернутой статьи Кристофера «Монти» Монтгомери (создателя Ogg Free Software и Vorbis) о том, что, по его мнению, является одним из наиболее распространенных и глубоко укоренившихся заблуждений в мире меломанов.
Частота 192 кГц считается вредной
Музыкальные цифровые файлы с частотой 192 кГц не приносят никакой выгоды, но всё же оказывают кое-какое влияние. На практике оказывается, что их качество воспроизведения немного хуже, а во время воспроизведения возникают ультразвуковые волны.
И аудиопреобразователи, и усилители мощности подвержены влиянию искажений, а искажения, как правило, быстро нарастают на высоких и низких частотах. Если один и тот же динамик воспроизводит ультразвук наряду с частотами из слышимого диапазона, то любая нелинейная характеристика будет сдвигать часть ультразвукового диапазона в слышимый спектр в виде неупорядоченных неконтролируемых нелинейных искажений, охватывающих весь слышимый звуковой диапазон. Нелинейность в усилителе мощности приведет к такому же эффекту. Эти эффекты трудно заметить, но тесты подтвердили, что оба вида искажений можно расслышать.
График выше показывает искажения, полученные в результате интермодуляции звука частотой 30 кГц и 33 кГц в теоретическом усилителе с неизменным коэффициентом нелинейных искажений (КНИ) около 0.09%. Искажения видны на протяжении всего спектра, даже на меньших частотах.
Неслышимые ультразвуковые волны способствуют интермодуляционным искажениям в слышимом диапазоне (светло-синяя зона). Системы, не предназначенные для воспроизведения ультразвука, обычно имеют более высокие уровни искажений, около 20 кГц, дополнительно внося вклад в интермодуляцию. Расширение диапазона частот для включения в него ультразвука требует компромиссов, которые уменьшат шум и активность искажений в пределах слышимого спектра, но в любом случае ненужное воспроизведение ультразвуковой составляющей ухудшит качество воспроизведения.
Все эти способы нацелены на решение одной проблемы, но только 4 способ имеет какой-то смысл.
Если вам интересны возможности вашей собственной системы, то нижеследующие сэмплы содержат: звук частотой 30 кГц и 33 кГц в формате 24/96 WAV, более длинную версию в формате FLAC, несколько мелодий и нарезку обычных песен с частотой, приведенной к 24 кГц так, что они полностью попадают в ультразвуковой диапазон от 24 кГц до 46 кГц.
Предположим, что ваша система способна воспроизводить все форматы с частотами дискретизации 96 кГц [6]. При воспроизведении вышеуказанных файлов, вы не должны слышать ничего, ни шума, ни свиста, ни щелчков или каких других звуков. Если вы слышите что-то, то ваша система имеет нелинейную характеристику и вызывает слышимые нелинейные искажения ультразвука. Будьте осторожны при увеличении громкости, если вы попадете в зону цифрового или аналогового ограничения уровня сигнала, даже мягкого, то это может вызвать громкий интермодуляционный шум.
В целом, не факт, что нелинейные искажения от ультразвука будут слышимы на конкретной системе. Вносимые искажения могут быть как незначительны, так и довольно заметны. В любом случае, ультразвуковая составляющая никогда не является достоинством, и во множестве аудиосистем приведет к сильному снижению качества воспроизведения звука. В системах, которым она не вредит, возможность обработки ультразвука можно сохранить, а можно вместо этого пустить ресурс на улучшение качества звучания слышимого диапазона.
Недопонимание процесса дискретизации
Теория дискретизации часто непонятна без контекста обработки сигналов. И неудивительно, что большинство людей, даже гениальные доктора наук в других областях, обычно не понимают её. Также неудивительно, что множество людей даже не осознают, что понимают её неправильно.
Дискретизированные сигналы часто изображают в виде неровной лесенки, как на рисунке выше (красным цветом), которая выглядит как грубое приближение к оригинальному сигналу. Однако такое представление является математически точным, и когда происходит преобразование в аналоговый сигнал, его график становится гладким (голубая линия на рисунке).
Наиболее распространенное заблуждение заключается в том, что, якобы, дискретизация – процесс грубый и приводит к потерям информации. Дискретный сигнал часто изображается как зубчатая, угловатая ступенчатая копия оригинальной идеально гладкой волны. Если вы так считаете, то можете считать, что чем больше частота дискретизации (и чем больше бит на отсчет), тем меньше будут ступеньки и тем точнее будет приближение. Цифровой сигнал будет все больше напоминать по форме аналоговый, пока не примет его форму при частоте дискретизации, стремящейся к бесконечности.
По аналогии, множество людей, не имеющих отношения к цифровой обработке сигналов, взглянув на изображение ниже, скажут: «Фу!» Может показаться, что дискретный сигнал плохо представляет высокие частоты аналоговой волны, или, другими словами, при увеличении частоты звука, качество дискретизации падает, и частотная характеристика ухудшается или становится чувствительной к фазе входного сигнала.
Это только так выглядит. Эти убеждения неверны!
Комментарий от 04.04.2013: В качестве ответа на всю почту, касательно цифровых сигналов и ступенек, которую я получил, покажу реальное поведение цифрового сигнала на реальном оборудовании в нашем видео Digital Show & Tell, поэтому можете не верить мне на слово.
Все сигналы частотой ниже частоты Найквиста (половина частоты дискретизации) в ходе дискретизации будут захвачены идеально и полностью, и бесконечно высокая частота дискретизации для этого не нужна. Дискретизация не влияет на частотную характеристику или фазу. Аналоговый сигнал может быть восстановлен без потерь – таким же гладким и синхронным как оригинальный.
С математикой не поспоришь, но в чем же сложности? Наиболее известной является требование ограничения полосы. Сигналы с частотами выше частоты Найквиста должны быть отфильтрованы перед дискретизацией, чтобы избежать искажения из-за наложения спектров. В роли этого фильтра выступает печально известный сглаживающий фильтр. Подавление помехи дискретизации, на практике, не может пройти идеально, но современные технологии позволяют подойти к идеальному результату очень близко. А мы подошли к избыточной дискретизации.
Частоты дискретизации свыше 48 кГц не имеют отношения к высокой точности воспроизведения аудио, но они необходимы для некоторых современных технологий. Избыточная дискретизация (передискретизация) – наиболее значимая из них [7].
Идея передискретизации проста и изящна. Вы можете помнить из моего видео «Цифровое мультимедиа. Пособие для начинающих гиков», что высокие частоты дискретизации обеспечивают гораздо больший разрыв между высшей частотой, которая нас волнует (20 кГц) и частотой Найквиста (половина частоты дискретизации). Это позволяет пользоваться более простыми и более надежными фильтрами сглаживания и увеличить точность воспроизведения. Это дополнительное пространство между 20 кГц и частотой Найквиста, по существу, просто амортизатор для аналогового фильтра.
На рисунке выше представлены диаграммы из видео «Цифровое мультимедиа. Пособие для начинающих гиков», иллюстрирующие ширину переходной полосы для ЦАП или АЦП при частоте 48 кГц (слева) и 96 кГц (справа).
Это только половина дела, потому что цифровые фильтры имеют меньше практических ограничений в отличие от аналоговых, и мы можем завершить сглаживание с большей точностью и эффективностью. Высокочастотный необработанный сигнал проходит сквозь цифровой сглаживающий фильтр, который не испытывает проблем с размещением переходной полосы фильтра в ограниченном пространстве. После того, как сглаживание завершено, дополнительные дискретные отрезки в амортизирующем пространстве просто откидываются. Воспроизведение передискретизированного сигнала проходит в обратном порядке.
Это означает, что сигналы с низкой частотой дискретизации (44.1 кГц или 48 кГц) могут обладать такой же точностью воспроизведения, гладкостью АЧХ и низким уровнем наложений, как сигналы с частотой дискретизации 192 кГц или выше, но при этом не будет проявляться ни один из их недостатков (ультразвуковые волны, вызывающие интермодуляционные искажения, увеличенный размер файлов). Почти все современные ЦАП и АЦП производят избыточную дискретизацию на очень высоких скоростях, и мало кто об этом знает, потому что это происходит автоматически внутри устройства.
ЦАП и АЦП не всегда умели передискретизировать. Тридцать лет назад некоторые звукозаписывающие консоли использовали для звукозаписи высокие частоты дискретизации, используя только аналоговые фильтры. Этот высокочастотный сигнал потом использовался для создания мастер-дисков. Цифровое сглаживание и децимация (повторная дискретизация с более низкой частотой для CD и DAT) происходили на последнем этапе создания записи. Это могло стать одной из ранних причин, почему частоты дискретизации 96 кГц и 192 кГц стали ассоциироваться с производством профессиональных звукозаписей.
16 бит против 24 бит
Хорошо, теперь мы знаем, что сохранять музыку в формате 192 кГц не имеет смысла. Тема закрыта. Но что насчет 16-битного и 24-битного аудио? Что же лучше?
16-битное аудио с импульсно-кодовой модуляцией действительно не полностью покрывает теоретический динамический звуковой диапазон, который способен слышать человек в идеальных условиях. Также есть (и будут всегда) причины использовать больше 16 бит для записи аудио.
Ни одна из этих причин не имеет отношения к воспроизведению звука – в этой ситуации 24-битное аудио настолько же бесполезно, как и дискретизация на 192 кГц. Хорошей новостью является тот факт, что использование 24-битного квантования не вредит качеству звучания, а просто не делает его хуже и занимает лишнее место.
Примечания к Части 2
6. Многие из систем, которые неспособны воспроизводить сэмплы 96 кГц, не будут отказываться их воспроизводить, а будут незаметно субдискретизировать их до частоты 48 кГц. В этом случае звук не будет воспроизводиться совсем, и на записи ничего не будет, вне зависимости от степени нелинейности системы.
7. Передискретизация – не единственный способ работы с высокими частотами дискретизации в обработке сигналов. Есть несколько теоретических способов получить ограниченный по полосе звук с высокой частотой дискретизации и избежать децимации, даже если позже он будет субдискретизирован для записи на диски. Пока неясно, используются ли такие способы на практике, поскольку разработки большинства профессиональных установок держатся в секрете.
8. Неважно, исторически так сложилось или нет, но многие специалисты сегодня используют высокие разрешения, потому что ошибочно полагают, что звук с сохраненным содержимым за пределами 20 кГц звучит лучше. Прямо как потребители.
Что такое звук: его громкость, кодирование и качество
Еще рассмотрим дискретизацию, форматы и мощность звука. Но сначала дадим определение музыки, как упорядоченному звуку — противоположность неупорядоченному хаотическому, который мы воспринимаем, как шум.
Что такое звук
Даже при разговоре вы слышите своего собеседника потому, что он воздействует на воздух. Также, когда вы играете на музыкальном инструменте, бьете ли вы по барабану или дергаете струну, вы производите этим колебания определенной частоты, которой в окружающем воздухе производит звуковые волны.
Звуковые волны бывают упорядоченные и хаотические. Когда они упорядоченные и периодические (повторяются через какой-то промежуток времени), мы слышим определенную частоту или высоту звука.
То есть мы можем определить частоту, как количество повторения события в заданный промежуток времени. Таким образом, когда звуковые волны хаотичны, мы воспринимаем их как шум.
Но когда волны упорядочены и периодически повторяются, то мы можем измерить их количеством повторяющихся циклов в секунду.
Частота дискретизации звука
Частота дискретизации звука — это количество измерений уровня сигнала за 1 секунду. Герц (Гц) или Hertz (Hz) — это научная единица измерения, определяющая количество повторений какого-то события в секунду. Эту единицу мы будем использовать!

Наверное, вы очень часто видели такую аббревиатуру — Гц или Hz. Например, в плагинах эквалайзеров. В них единицами измерения являются герцы и килогерцы (то есть 1000 Гц).
Давайте я открою плагин эквалайзера и покажу вам как это выглядит. Вам, наверное, знакомы эти цифры.
С помощью эквалайзера вы можете ослаблять или усиливать определенные частоты в пределах слышимого человеком диапазона.
Здесь у меня запись звуковой волны, которая была сгенерирована на частоте 1000 Гц (или 1 кГц). Если увеличить масштаб и посмотреть на ее форму, то мы увидим, что она правильная и повторяющиеся (периодическая).

В одной секунде здесь происходит тысяча повторяющихся циклов. Для сравнения, давайте посмотрим на звуковую волну, которую мы воспринимаем как шум.

Тут нет какой-то конкретной повторяющейся частоты. Также нет определенного тона или высоты. Звуковая волна не упорядочена. Если мы взглянем на форму этой волны, то увидим, что в ней нет ничего повторяющегося или периодического.
Давайте перейдем в более насыщенную часть волны. Мы увеличиваем масштаб и видим, что она не постоянная.

Из-за отсутствия цикличности мы не в состоянии услышать какую-то определенную частоту в этой волне. Поэтому мы воспринимаем ее как шум.
Смертельный уровень звука
Стоит сразу сказать, что по нормативным нормам, безопасным уровнем громкости шума считается не более 55 дБ (децибел) днем и 40 дБ ночью. Даже при длительном воздействии на слух, этот уровень не нанесет вреда.
| Уровни громкости звука | ||
|---|---|---|
| (дБ) | Определение | Источник |
| 0 | Совсем не лышно | |
| 5 | Почти не слышно | |
| 10 | Почти не слышно | Тихий шелест листьев |
| 15 | Еле слышно | Шелест листвы |
| 20 — 25 | Едва слышно | Шепот человека на расстоянии 1 метр |
| 30 | Тихо | Тиканье настенных часов (допустимый максимум по нормам для жилых помещений ночью с 23 до 7 часов) |
| 35 | Довольно слышно | Приглушенный разговор |
| 40 | Довольно слышно | Обычная речь (норма для жилых помещений днем с 7 до 23 часов) |
| 45 | Довольно слышно | Разговор |
| 50 | Отчетливо слышно | Пишущая машинка |
| 55 | Отчетливо слышно | Разговор (европейская норма для офисных помещений класса А) |
| 60 | Шумно | (норма для контор) |
| 65 | Шумно | Громкий разговор (1м) |
| 70 | Шумно | Громкие разговоры (1м) |
| 75 | Шумно | Крик и смех (1м) |
| 80 | Очень шумно | Крик, мотоцикл с глушителем |
| 85 | Очень шумно | Громкий крик, мотоцикл с глушителем |
| 90 | Очень шумно | Громкие крики, грузовой железнодорожный вагон (7м) |
| 95 | Очень шумно | Вагон метро (в 7 метрах снаружи или внутри вагона) |
| 100 | Крайне шумно | Оркестр, гром (по европейским нормам, это максимально допустимое звуковое давление для наушников) |
| 105 | Крайне шумно | В старых самолетах |
| 110 | Крайне шумно | Вертолет |
| 115 | Крайне шумно | Пескоструйный аппарат (1м) |
| 120-125 | Почти невыносимо | Отбойный молоток |
| 130 | Болевой порог | Самолет на старте |
| 135 — 140 | Контузия | Взлетающий реактивный самолет |
| 145 | Контузия | Старт ракеты |
| 150 — 155 | Контузия, травмы | |
| 160 | Шок, травма | Ударная волна от сверхзвукового самолета |
| 165+ | Разрыв барабанных перепонок и легких | |
| 180+ | Смерть | |
Скорость звука в км в час и метры в секунду
Скорость звука — это скорость распространения волн в среде. Ниже даю таблицу скоростей распространения в различных средах.
| 0 ºС | м/с | км/ч |
|---|---|---|
| Воздух | 331 | 1191.6 |
| Водород | 1284 | 4622.4 |
| Азот | 334 | 1202.4 |
| Аммиак | 415 | 1494.0 |
| Ацетилен | 327 | 1177.2 |
| Гелий | 965 | 3474.0 |
| Железо | 5950 | 21420.0 |
| Золото | 3240 | 11664.0 |
| Кислород | 316 | 1137.6 |
| Литий | 6000 | 21600.0 |
| Метан | 430 | 1548.0 |
| Угарный газ | 338 | 1216.8 |
| Неон | 435 | 1566.0 |
| Ртуть | 1383 | 4978.0 |
| Стекло | 4800 | 17280.0 |
| Углекислый газ | 259 | 932.4 |
| Хлор | 206 | 741.6 |
Скорость звука в воздухе намного меньше чем в твердых средах. А скорость звука в воде намного выше, чем в воздухе. Составляет она 1430 м/с. В итоге, распространение идет быстрее и слышимость намного дальше.
Мощность звука
Мощность звука — это энергия, которая передается звуковой волной через рассматриваемую поверхность за единицу времени. Измеряется в (Вт). Бывает мгновенное значение и среднее (за период времени).
Давайте продолжим работать с определениями из раздела теория музыки!
Высота и нота
Высота — это музыкальный термин, который обозначает почти тоже самое, что и частота. Исключение составляет то, что она не имеет единицы измерения. Вместо того чтобы определять звук количеством циклов в секунду в диапазоне 20 — 20 000 Гц, мы обозначаем определенные значения частот латинскими буквами.
Музыкальные инструменты производят периодические звуковые волны правильной формы, которые мы называем тонами или нотами.
Давайте посмотрим на звуковую волну в 1 кГц. Сейчас я увеличу масштаб, и вы увидите каково расстояние между циклами.

Теперь давайте взглянем на волну в 500 Гц. Тут частота в 2 раза меньше и расстояние между циклами больше.

Теперь возьмем волну в 80 Гц. Тут будет еще шире и высота намного ниже.

Мы видим взаимосвязь между высотой звука и формой его волны.
Давайте я покажу вам еще один пример!
Ниже волна в 440 Гц. Это стандарт в мире музыке для настройки инструментов. Соответствует он ноте ля.

Мы слышим только основной тон (чистую звуковую волну). Если увеличить масштаб, то увидим, что она периодическая.
А теперь давайте посмотрим на волну той же частоты, но сыгранную на пианино.

Посмотрите, она тоже периодическая. Но в ней есть небольшие дополнения и нюансы. Все они в совокупности и дают нам понятие о том, как звучит пианино. Но помимо этого, обертона обуславливают и тот факт, что одни ноты будут иметь большее сродство к данной ноте чем другие.
Для примера можно сыграть туже ноту, но на октаву выше. По звучанию будет совсем иначе. Однако она будет родственной предыдущей ноте. То есть это та же нота, только сыгранная на октаву выше.
Такая родственная связь двух нот в разных октавах обусловлена наличием обертонов. Они постоянно присутствуют и определяют насколько близко или отдаленно определенные ноты связаны друг с другом.
[bctt tweet=»Традиционной нотации высота ноты обуславливает ее расположение на нотном стане или нотоносце.» username=»Muzrock_com»]
Сейчас я покажу вам с помощью нотного редактора. Здесь мы видим, как записывается нота ля.
Помимо традиционного представления нот на нотном стане, в современных музыкальных редакторах вы можете встретить другую систему записи и редактирования нот. Чаще всего она представляет собой пианинную сетку или таблицу.
Слева мы видим клавиатуру пианино. А справа, соответствующие каждой ноте, прямоугольники.
В принципе, такая система не отличается от классической выше. Просто способ представления высоты нот реализован по-другому. Точно также, когда мы говорим 440 Гц или ля, мы имеем одну и ту же высоту или частоту звука.
Свойства и качество звука
Свойства звука — это его физические особенности, которые можно измерить. Сюда входит частота колебаний, их продолжительность и амплитуда. Еще относится и состав колебаний. То есть сочетание простейших колебаний в сложное.
А вот отражение физических свойств в наших ощущениях (то, что мы чувствуем) называется качеством звука. Сюда относится высота и длительность звука. А также громкость и тембр.
Высота звука зависит от частоты колебаний. Чем чаще колебания, тем выше звук. Чем реже колебания, тем ниже звук.
Длительность зависит от продолжительности колебаний.
Громкость зависит от амплитуды колебаний. Например, после удара по гитарной струне, можно увидеть, что она начнет колебаться в разные стороны. Чем шире эти колебания, тем громче звук. Ширина этого размаха называется амплитудой колебаний.
Если сильно ударим по струне, то амплитуда будет большой. Соответственно, мы услышим громкий звук. Если легонько тронем пальцем струну, то амплитуда будет маленькой. В таком случае, звук будет тихим.
Тембр — это обертоновая окраска звука. Она позволяет нам различать звуки одной высоты, но исполненные разными инструментами или голосами.
Кодирование звука
Кодирование звука — это процесс преобразования колебаний воздуха в колебания электрического тока с последующей дискретизацией аналогового сигнала. То есть такое кодирование необходимо нам для дальнейшей работы со звуком уже на компьютере.
А поскольку мы на ПК не можем работать с аналоговым сигналом, в таком случае мы должны преобразовать его в цифровой. Так мы можем к примеру, с помощью специальных компьютерных программ для создания звука работать с самим сигналом.
Для преобразования сигнала используются специальные аналого-цифровые преобразователи (АЦП). В компьютере это обычно звуковые карты.
Форматы звука
Форматы звука предназначены для представления аудио данных с последующим хранением на электронных носителях. Есть три основные группы:
Теперь вы знаете, что такое звук и каковы его характеристики. Также мы дополнительно рассмотрели такие понятия, как частота, высота и нота. А также как они соотносятся друг с другом.

















