Семь цифровых «картриджей» Audiolab
Вам наверняка доводилось слышать рекомендации по различным головкам для виниловых проигрывателей: мол, эта достаточно универсальна, а эта особенно хороша для старых джазовых изданий… Что-то подобное неминуемо должно было появиться и в «эпоху цифрового аудио».
Что такое «цифровой фильтр» и для чего его ставят в ЦАП?
Преобразование потока цифровых аудиоданных (нулей и единиц) в непрерывный музыкальный сигнал — дело деликатное. Каждый цифровой отсчет должен быть преобразован в определенный уровень напряжения с высокой точностью, а ошибки в этом процессе заметно ухудшают звучание, делая его чересчур резким или, наоборот, размытым или окрашенным.
К несчастью человеческое ухо очень восприимчиво к искажениям и шумам квантования в аудиосистемах. Когда звуковой сигнал восстановлен из цифровых данных, гармонические искажения присутствуют в широком спектре, как в четных, так и нечетных обертонах.
Теоретически можно подавать на ЦАП отсчеты прямо при считывании. Однако при этом многократно возрастают требования к аналоговому фильтру, который должен быть столь крутым, чтобы как ножом отрезать цифровой шум за пределами слышимого спектра. Но аналоговые крутые фильтры высоких порядков катастрофически искажают фазовую характеристику, поэтому в звучании пропадает ощущение глубины сцены, снижается детальность, падает уровень высоких частот. Кроме того, точность исполнения аналоговых фильтров всегда ограничена допусками на производство радиоэлементов.

Выручают точные и стабильные по своей сути так называемые цифровые фильтры из нескольких FIR-звеньев (Finite Impulse Response или КИХ – конечная импульсная характеристика). Обычно каждое звено удваивает частоту выборки. Промежуточные отсчеты вычисляются в реальном времени и должны быть завершены в течение одного периода дискретизации! Отсюда повышенные требования к процессору, к его быстродействию и точности. И все же в вычислениях может накапливаться ошибка при последовательном округлении промежуточных данных.
В поисках идеала
Не секрет, что слушатели могут иметь и имеют (!) различные предпочтения в звучании и в музыке. Мы уже упоминали, ситуацию с выбором головок звукоснимателей для разных музыкальных жанров. Так и здесь – часто «стандартный» цифровой фильтр может не удовлетворять конкретного слушателя. И здесь пора вернуться к разработке Audiolab.

Итак, идеального фильтра не существует — что-то лечим, что-то калечим — либо фазу, либо линейность. Существует несколько алгоритмов подготовки цифрового потока. Цифро-аналоговые преобразователи Audiolab M-DAC и Q-DAC предлагают целых семь вариантов фильтрации! А дальше вы сами определитесь — какой считать универсальным, а какой хорош для жанровых фонограмм. По времени отклика (rise time) фильтры условно можно объединить в три группы:
Slow (медленные)
1) Optimal transient
2) Optimal transient XD
3) Optimal transient DD
Medium (средней скорости)
4) Slow roll off
Fast (быстрые)
5) Sharp roll off
7) Optimal Spectrum
Оптимальный переход
Audiolab акцентирует внимание на фильтре Optimal Transient (оптимальная переходная характеристика импульса) и его подварианты XD и DD. Главная особенность группы Slow заключается в устранении паразитных колебаний перед фронтами импульса. Формально с точки зрения базовых технических замеров при активации Optimal Transient параметры сигнала немного ухудшаются. Спад кривой получается очень пологим, остается «цифровой мусор». Тем не менее после Optimal Transient саунд субъективно воспринимается на слух как наиболее реалистичный, мягкий на высоких частотах и по-настоящему вовлекающий. Что говорят слушатели?

Наиболее интересным считается Optimal Transient XD, который в своей группе позволяет получить наиболее ровный тональный баланс, оптимальную насыщенность и детальность. Вариант DD несколько усиливает глубину звучания, немного укрупняя музыкальные образы. Базовая версия Optimal Transient уступает своим производным, обеспечивая более мягкий и менее детальный звук. Этот вариант хорошо проявит себя на записях с резкой цифровой подачей материала.
Крутой спад
Что касается фильтров Slow Rolloff и Sharp Rolloff, то первый отличается плавным спадом АЧХ, но имеет «мягкий» удельный коэффициент затухания и значительно меньший «звон». Фильтр Sharp Rolloff характеризуется крутым спадом и обладает стандартным алгоритмом фильтрации, т.е. типичными промышленными характеристиками: спад в –6 дБ на 1/2 Fs.
Звучание после Sharp Rolloff приметно прибавкой баса, но при этом несколько страдает его проработка. По своему характеру этот фильтр напоминает звук CD-проигрывателей средней Hi-Fi-категории с ровной АЧХ вплоть до 20 кГц при проигрывании обычных CD-записей (16 бит/44,1 Гц). Верхние частоты при этом кажутся более резкими, присутствуют паразитные колебания до и после фронтов импульса. Сцена несколько зажата, ей может не хватает «воздуха». Данную версию рекомендуется использовать ностальгирующим по CD-плеерам 90-х, а для ценителей звучания с аналоговым характером подойдет Slow Rolloff, который немного выдвигает СЧ на передний план. Одна из его особенностей также заключается в более ровной, чуть смягченной подаче ВЧ-диапазона. Помимо этого, фильтр Slow Rolloff также может похвастаться отличными техническими параметрами.
Фазовый минимализм
Фильтр Minimum Phase (минимально-фазовый, т.е. с минимальными фазовыми искажениями) дает возможность получить плавное затухание, аналогичное Slow Rolloff, но характеризуется отсутствием паразитных колебаний («звона») перед фронтами импульса. Хорошо прорабатывается НЧ- и СЧ-диапазоны. Саунд при этом становится гармоничным, более плотным и собранным на басах, но менее выразительным и четким в высокочастотном диапазоне.

Выбор
При воспроизведении CD-дисков с обработкой с Optimal Transient обеспечивается весьма пологий спад по ВЧ, что выражается в более теплом характере звука. Как уже отмечалось, Optimal Transient не показывают рекордных характеристик при измерении, особенно в плане подавления помех дискретизации, но отличаются более «аналоговым поведением», что положительно отражается на звучании. Т.е. в данном случае недостаток становится достоинством. Одним из важных аспектов является то, что данные фильтры фактически полностью убирают цифровой «звон».

В категории Medium (среднее время установления отклика) находится единственный фильтр Slow Rolloff, который тоже отличается превосходными характеристиками. Его можно рассматривать как усредненную настройку между крайними подходами обработки цифрового сигнала.
Фильтры группы Fast имеют самое малое время установления отклика, обеспечивают наиболее четкие и резкие ВЧ и самый яркий звук, а также обладают лучшими техническими параметрами.
И еще напомним об одной фирменной примочке Audiolab. Модель M-DAC оснащена декоррелятором D3E, задача которого состоит в фильтрации различных гармоник, которые проявляются в процессе квантования. Благодаря D3E звучание становится чище, хотя изменения здесь не так явно заметны. Все это с учетом широкого выбора фильтров делает конвертеры Audiolab всеядными по отношению к любому музыкальному жанру.
Тема: Цифровой фильтр ЦАП
Опции темы
Известно, что джиттер должен быть минимальным, что генератор должен находиться не на отдельной плате, а рядом с ЦАП и т.д. Но в данном случае не буду об этом.
Хотелось заострить внимание на дальнейший путь цифровых данных, после их получения от транспорта. А следующим звеном будет, конечно же, ЦФ. И вот тут начинается самое интересное.
Заглянуть внутрь микросхем с ЦФ мы не можем. Можно попробовать проанализировать результаты повышения частоты дискретизации при использовании различных программ.
Чем я и занимался некоторое время. Проанализировал результаты программного апсемлера SoX в Foobar, два апсемплера Audition (версии 3 и CS6) и даже писал собственный апсемплер.
Почему я обратил внимание на ЦФ? Потому что меня всегда смущал тот факт, что после ЦФ (апсемплера) никакого битперфекта не остается в и помине! И это жестокая правда жизни.
В принципе, все наши старания и радения за битперфект транспорта, разбиваются в пух и прах внутри микросхемы цифрового фильтра.
Сначала я думал, что невозможно осуществить повышение дискретизации методом вставки только лишь промежуточных отсчетов, сохраняя оригинальные, и не получить при этом зеркальный спектр.
И все опыты это подтверждали.
Когда приобрел у Serg138 ЦАП NOS (без ЦФ), я получил возможность сравнивать звук с различными передискретизациями. Ощущения следующие:
ЦАП без ЦФ выдает живую звуковую картину, звук четкий, образы цельные, но грязновато и достаточно жестко.
При использовании программных передискретизаторов:
Все эти передискретизаторы делали звук более гладким, прилизанным и в тоже время на звук одевалась какая то пелена.
И вот на днях я смог сделать передискретизацию, сохраняющую нетронутыми исходные отчеты и с полным отсутствием зеркальных частот. Оказывается это возможно!
Тогда какого черта?! Какого черта лысого нужно намеренно искажать то, что стараниями транспорта без искажений доставлено к ЦАП?!
Ну и напоследок.
Правильно передискретизированный звук на порядок лучше звучит, чем всякие SoX и подобные. Звук легкий, чистый, гладкий, детальный, в общем обалденный!
Это мое мнение, на суд публики представлю при первом удобном случае.
Осталось сравнить его с железным передискретизатором на SM5842, чем и займусь в ближайшем будущем.
Dac filter что это
Чтобы понять, что вообще такое Digital Filter, и почему он так влияет на Sound Color, коротко о том, как звук вообще хранится в цифровом виде, и что происходит, когда ЦАП пытается вернуть «цифру» к жизни, преобразовывая её обратно в аналоговый сигнал.
Короткий ликбез по преобразованию аналог-цифра-аналог
Понятно, что записать непрерывный аналоговый сигнал вот так сходу в виде ноликов и единичек невозможно. Поэтому он сначала «разбивается» на отдельные отсчёты – просто с определённой периодичностью засекается уровень сигнала. Например, 44100 или 48000 раз в секунду, 96000 или вовсе 192000 раз в секунду. Ничего эти цифры не напоминают? Ба! Да это же как раз и есть частота дискретизации!
Итак, на первом этапе вместо непрерывного сигнала получили частокол отсчётов. Теперь уровень каждого из них уже можно закодировать двоичным числом, т. е. в виде последовательностей ноликов и единичек. Чаще всего длина таких последовательностей – 16 или 24 знака. Да-да, те самые биты, которые указываются, когда мы говорим о разрешении цифрового сигнала.
Не будем отвлекаться на технические тонкости хранения «цифры», а сразу перейдём к тому, как превратить её обратно в непрерывный аналоговый сигнал. ЦАП работает по прямо противоположному принципу, и для начала каждую двоичную последовательность снова превращает в отсчёт нужного уровня. Получается опять частокол отсчётов, смутно уже напоминающий форму аналогового сигнала.
Но нам такой сигнал ещё не нужен, в его спектре много лишнего – он простирается на много десятков килогерц вверх. Сигнал нужно «сгладить» – выделить из всего этого спектра только полезную «звуковую» часть. Вот это как раз и делает тот самый Digital Filter. Фактически, это просто фильтр нижних частот, и от его реализации зависит то, как зазвучит ЦАП в конечном итоге.
Sound Colors в процессоре CarDSP Velvet Lite
Вот теперь можно перейти и к самому «железу». А точнее – к реализации фильтров в ЦАП. Это оказалось удобнее всего сделать на примере процессора CarDSP версии Velvet Lite. Про саму процессорную часть говорить не буду, речь сейчас не о ней.
ЦАП в этой версии CarDSP построен на чипе AK4458. Он принадлежит к линейке, которую сам производитель Asahi Kasei объединяет под общей концепцией Velvet Sound (что, собственно, и дало название версии процессора). К ней принадлежат несколько серий чипов – АК445х и АК449х. Кстати, ЦАП на базе АК4490 я и сам использую в своём тестовом тракте.
Все ЦАП этого семейства имеют несколько режимов работы выходных фильтров. Обычно производители не заморачиваются и выбирают какой-то один из них, но CarDSP Velvet Lite как раз тем и интересен, что пользователю предоставляется выбор. Менять режимы выходных фильтров можно просто переставляя джамперы на плате.
Каждое из положений джампера указано здесь же, так что лишних мануалов не потребовалось.
Впрочем, названия поначалу тоже мало о чём рассказали, пришлось лезть на официальный сайт Asahi Kasei. И вот какую табличку я там обнаружил. Достаточно коротко и, в общем-то, неплохо отражает суть:
Каждый фильтр может быть реализован по-разному и иметь разные характеристики. В частности, импульсный отклик – в одних случаях переходные процессы практически отсутствуют, в других – заметны сильнее и тоже имеют разный характер. В CarDSP реализованы четыре режима. В скобках – вольный перевод описания из таблички:
Slow Roll-off (минимальные переходные процессы, звучание близко к оригинальному)
Sharp Roll-off (переходные процессы предваряют импульс и следуют за ним, что делает звучание более напористым)
Super Slow Roll-off (практически полное отсутствие переходных процессов, предельно натуральное звучание)
Short Delay Sharp Roll-off (переходные процессы следуют за импульсом, это даёт более насыщенное звучание баса)
Разный импульсный отклик придаёт звучанию тот или иной характер – это и есть суть технологии Sound Color Digital Filter (SCDF). И для слуха, как показало прослушивание, далеко не всегда есть смысл гнаться за идеальными картинками и циферками. Но об этом чуть позже.
Попытки увидеть разницу
С картинками, признаюсь, я мучился долго. Поскольку речь идёт именно о переходных процессах, наиболее правильным представлялось посмотреть, как ЦАП обращается с прямоугольными импульсами. Но, поразмыслив над методиками, от этого было решено отказаться. В подробности вдаваться не буду, нюансов слишком много.
В итоге начал мучить Clio, тем более, что в пределах 20-20000 Гц он умеет очень многое. Анализ гармонических искажений не дал ровным счётом ничего. Вернее, разница была, и форма графиков была даже довольна стабильна. Но пытаться сделать какие-то выводы по ним выглядели пустой затеей. Если кому интересно, вышло вот так:
Зато другая зависимость оказалась более наглядной. Чем отличаются фильтры разных типов? Правильно, кроме всего прочего – фазовыми характеристиками. Вот на графиках фазы разница и проявилась. Масштаб, конечно, пришлось заметно растянуть, но тут нужно учесть, что Clio видит всё до частоты немногим больше 22 кГц, а в фильтрах ЦАП основная веселуха начинается гораздо выше. Тем не менее, тенденция уже прослеживается чётко.
И тут может возникнуть вопрос. А нужно ли вообще уделять внимание всему этому хозяйству, если формально разница видна только там, где звук уже давно перешёл в ультразвук? Отвечаю однозначно – нужно. Потому что графики показывают разницу на так называемом «стационарном» сигнале. Характер же реального музыкального сигнала ближе к импульсному, и на нём переходные процессы слышны даже когда «стационарные» графики ничего не показывают. В общем, уши – по прежнему самый лучший измерительный прибор.
Тракт составил следующим образом. В качестве источника использовал Blu-Ray-транспорт Sony BDP-S765, процессор подключил к нему по коаксиалу. Регулировка громкости – средствами самого CarDSP. Дальше – старые добрые межблочники The Chord Indigo Plus и усилитель Genesis Dual Mono, недавно прогретый после профилактики с лёгкими доработками (усилитель одного из первых поколений, в своё время он трудился в лаборатории Car&Music). Акустические кабели – бессменные E.O.S. TA-11. Акустика – полочники PSB Synchrony One B на кастомных гранитных подставках. В общем, ещё не лютый многомиллионный топ, но разница в режимах процессора слышна хорошо.
Режим 1. Slow Roll-off
Описание: «Минимальные переходные процессы, звучание близко к оригинальному»
Первый режим использовал в качестве отправной точки, поэтому сразу же описать характер звучания довольно сложно. Для начала можно сказать одно – звуковая картинка рисуется красиво, объёмно, послезвучия живые, звучание прозрачное. Деталей много, но ничто не выпячивается, слушать легко и приятно. Действительно нейтрально, как и обещает описание.
Режим 2. Sharp Roll-off
Описание: «Переходные процессы предваряют импульс и следуют за ним, это даёт более напористое звучание»
Скажу сразу, этот режим для меня оказался в аутсайдерах. Да, в звуке всё есть, ничто не потеряно, но вместо живописной картинки – печатная репродукция. Вроде бы всё присутствует, детальность хорошая, но появляется ощущение то ли искусственности, то ли грубости. Объём сцены чувствуется хорошо, но по сравнению с первым вариантом звучание воспринимается упрощённо, не так просторно. Потом я несколько раз снова возвращался к этому режиму, но. нет, не то.
Режим 3. Super Slow Roll-off
Описание: «Практически полное отсутствие переходных процессов, предельно натуральное звучание»
Если бы я не посмотрел потом в описание, то, наверное, никогда бы не назвал этот режим «правильным». Признаюсь, звучание показалось до безобразия нейтральным и уж слишком скучным. Да, объём звуковой сцены рисуется хорошо, но мозг постоянно сигнализирует о том, что в звуке чего-то не хватает. Из-за этого появляется ощущение какой-то упрощённости и отстранённости. Без грубости, как во втором режиме, но вот скучно.
Режим 4. Short Delay Sharp Roll-off
Описание: «Переходные процессы следуют за импульсом, это даёт более насыщенное звучание баса»
После третьего режима в звук снова возвращается масштабность. И этот режим уж точно интереснее, чем второй. В целом, по ощущениям я бы поставил его на один уровень с первым. Как говорится, «плюс-минус». На роке он показался более драйвовым, а вот на классике, джазе и блюзе, особенно с вокалом, первый воспринимается как-то деликатнее. По басу, кстати, таких уж радикальных различий не заметил. Может, акустика не позволила, а может, ещё какие факторы повлияли.
В последующем я неоднократно сравнивал первый и четвёртый режимы, именно они мне понравились больше остальных. И вот что было замечено. Если в первом звучание парило целиком в пространстве за акустикой, то в четвёртом ощущения полной отвязки от источников звука всё же не было. На некоторых треках за счёт едва уловимых акцентов на крайних образах звучание казалась шире, но это же иногда приводило и к «рассыпанию» остальных образов в пространстве. В этом смысле в первом режиме звуковая картинка пространственно получалась более цельной, а при длительном прослушивании слух воспринимал звучание как-то естественнее и комфортнее.
Так уж вышло, что прослушивание я начал проводить вслепую – поначалу не особо вникая в то, какое положение джампера какому режиму соответствует. Просто переставлял и слушал. Этот процесс длился не один день, я слушал разную музыку в разное время дня (это тоже влияет на слуховое восприятие), делал «подходы» с внимательным прослушиванием, переключая режимы на одном и том же треке, или слушал систему на протяжении дня просто в фоновом режиме, примечая общую комфортность. В общем, постарался оценить всесторонне.
Потом же, когда услышанное было сопоставлено с описаниями из даташитов Asahi Kasei, вывод оказался неожиданным – чтобы слух воспринимал звучание естественно и комфортно, импульсный отклик не обязан быть идеальным. Самый, казалось бы, «правильный» режим с минимальными переходными процессами оказался пусть и довольно хорошим, но субъективно не самым интересным.
Предположу, что внесение в сигнал лёгкой «неточности» импульсного отклика включает в работу какие-то психоакустические факторы, задействует в слуховом восприятии определённые механизмы. А может быть, имитирует для слуха то, что было потеряно при цифровой записи изначально, получается что-то вроде дизеринга (Википедия в помощь, шум тоже может быть полезным). Но и увлекаться этим тоже не нужно, избыточное «посыпание» сигнала переходными процессами приводит к прямо противоположному эффекту – резкой потери естественности звучания. В общем, очень тонкая и интересная тема. Истина, как всегда, где-то посередине.
Вопросы о ЦАПах: чипы и фильтры, мультибит, музыкальность и апскейлинг
На прошедшей онлайн-встрече было задано множество интересных и полезных вопросов о ЦАПах и цифровом сигнале. По итогам я сделал конспект-расшифровку наиболее важных из них, и по некоторым моментам дал расширенное объяснение. Будем считать, что получился своего рода FAQ по актуальному состоянию цифровых технологий в аудиокультуре.
На какие технические характеристики нужно обращать внимание при выборе ЦАПов — в порядке важности (силе влияния на звук), если можно так структурировать?
Ответ зависит от того, в какой вы точке вы находитесь. У вас уже что-то есть и нужен апгрейд — или вообще ничего нет? По ЦАПам можно посмотреть иерархию производителя. Если в линейке он такой один и стоит при этом не три копейки, то очевидно, что у производителя вся надежда только на него и это его предел возможностей. Т.е. производитель вложился в эту единственную модель.
Если же таких ЦАПов в линейке несколько, очевидно, что в младших моделях кое-что будет слабеньким — возможно, даже умышленно. Хотя по железной себестоимости разброс у пяти аппаратов может быть не таким и значительным.
Бывает, что производитель полагает, что он крепко упахался по теме и хочет разложить свои яички по всем корзинам. Поэтому он выстраивает свою линейку таким образом, чтобы сначала зацепить покупателей младших моделей чувством причастности к хорошему авторитетному бренду. Затем после обсуждения на форумах, где все щеголяют более дорогими аппаратами, человек настраивается в будущем занять более высокую ступеньку в этой иерархии.
Мне больше импонирует первый подход с минимальным количеством вариантов. ЦАП — это не колонка, которая может быть большого или маленького литража. Или усилитель, который должен выдавать много тока как сварочный аппарат. Здесь идет тихая тонкая работа — все это может работать хоть от батареек. Вот и сделайте одну модель на совесть!
Изучите все возможности чипа-конвертера, все его ключи, которые регулируют его работу и фильтрацию, поставьте лучший клок с минимальным джиттером, нормальные операционные усилители, исключите грязь питания. Хотя, повторюсь, для аудиолюбителей и в том числе журналистов второй вариант кажется более увлекательным — больше фактуры, можно посмаковать и поболтать о разнице начинок.
Приводимые технические параметры битности и дискретности принципиального значения не имеют. Если речь не идет о каком-то старье, сейчас даже дешевые чипы обеспечивают полную поддержку Hi-Res-аудио. Если на нем написано 32 бит или 24 бит — все это неважно. Официальной 32-битной музыки не бывает. Важно, какой у вас дальше обвес и была ли конструкция спроектирована адекватным человеком.
В чем разница выбора ЦАПа для CD и для FLAC и т.п., или они универсальны, кроме очевидного, типа необходимости порта USB в случае с FLAC с компьютера?
В CD-проигрывателях передача сигнала на ЦАП осуществляется в рамках одной платы, поэтому там используется протокол i2s. В нем синхронизация подается по отдельной линии. Его поддерживают все аудиочипы. Многие аудиофилы верят, что это самый лучший цифровой протокол на планете, но убедительных технических доказательств этому феномену пока не представлено. Случаи i2s-входов на внешних ЦАПах весьма редки. Причина банальна — стандартом не предусмотрено кабельное соединение для i2s. Поэтому некоторые Hi-Fi производители в частном порядке пытаются городить какие-то свои схемы на базе BNC, DIN, HDMI и др. С понятными итогами совместимости для этих агрегатов.
Поэтому если вы захотите вытащить из CD-транспорта PCM-код на внешний конвертер — понадобится кабель и SPDIF-протокол. Кабели — оптика или коаксиал, либо (реже) AES на разъеме XLR или BNC. Протокол SPDIF не использует отдельную шину, он содержит в себе тактовый сигнал синхронизации и ограничен параметрами 24 бит/192 кГц. SPDIF-ресивер на ЦАПе будет настраиваться строго по тактовой частоте транспорта, каков бы он ни был — хорош или плох.
USB-передача аудио — как это ни странно, находится ближе к старинному i2s, потому что фактически транслируется сигнал на i2s-шину в чипе ЦАПа. Здесь также существует возможность передачи до 32 бит и выделенный канал синхронизации. Первые USB-приемники имели синхронизацию с началом первого фрейма, но современные USB-ЦАП теперь владеют собственным клоком, и поэтому передача аудио по USB называется асинхронной. Подробнее можно почитать здесь.
Всегда интересовало выражение «музыкальный» ЦАП. Можно ли так характеризовать ЦАПы — и если да, то какие есть критерии «музыкальности»?
Не могу поручиться за каждого, кто злоупотребляет подобными терминами. В одних случаях подразумевается, что устройство принадлежит к аудиобренду High End, чей имидж обусловлен такой выраженной эмоциональной составляющей ее идеолога. Например, Питер Квортруп из Audio Note.
В других случаях этот термин могут приписывать мультибитным чипам — особенно, если они еще и работают в NOS-режиме, сглаживая высокочастотный диапазон. Окраска, ламповая или высокочастотная — все это может давать повод назвать такой ЦАП меломанским.
Предлагаю заодно рассмотреть и обратный вариант — почему некоторые слушатели обвиняют чипы ESS Sabre в антимузыкальности, хотя измерения у них такие, что не снились никаким «филипсам».
Какой чип ЦАПа лучше: AKM или ESS? Какие у них достоинства и недостатки?
В дешевых реализациях я бы избегал ESS. Если мы решим что-то выяснить с настройками чипов ESS, то обнаружим, что сделать это весьма непросто. В отличие от других производителей — Texas Instruments, Analog Devices или Asahi Kasei, — чипы ESS не имеют открытых кодов спецификаций.
Поэтому сразу предупреждаю самодельщиков не связываться наобум с «сейбрами». Это прибор с потенциально хорошими показателями, но сложный — и не все производители понимают, с чем имеют дело. Иногда некоторые не догадываются ставить сумматор из-за балансных выходов на чипе.
Внутренняя архитектура модулятора Sabre мультибитная и работает с блоками по 5 бит, усредняя значения. Математика Hyperstream на деле оказалась более чувствительной к смещению постоянного тока и вызывает рост интермодуляционных искажений в определенной области.
И это будет происходить, если вы используете цифровой аттенюатор перед ЦАПом. Интермодуляционные искажения более выражены для слуха, чем THD, но реже попадают в спецификации. А в западных пабликах это явление теперь так и зовут — ESS Hump.
Части производителей (таким, как Benchmark) удалось победить этот «горб», но у большинства проблема сохранилась. Так что сами видите — необходимо понимание работы ЦАПа в разных режимах.
Часто говорят о частоте дискретизации, но редко о битности. Насколько в реальности повышение глубины до 24 или 32 бит — это хорошо? Например, если частота остается 44,1 — улучшится ли звук, став 24-битным вместо 16 бит?
Чтобы понимать битовую глубину (или разрядность), сперва определимся, что они описывают и как работают. В бинарном коде бит будет либо 1, либо 0. Дальше с увеличением битности варианты кодирования растут по экспоненте. Напомню апокриф с изобретателем шахмат, которого правитель спросил о награде.
Шахматист смиренно попросил начать с одного зернышка на первой клетке и удваивать их количество на следующей. В общем, через несколько дней подсчетов правитель и казначеи поняли, что над ними издеваются. Потому что такого количества зерна не собрать, даже если осушить океаны и засеять всю землю. 64 клетки в шахматах — посмотрите на инженерном калькуляторе, сколько будет 2 в 64 степени. Это и есть 64 бит пшеницы.
При оцифровке (т.е. квантовании) истинные уровни всегда будут где-то между двумя соседними значениями кода. 16-битный звук описывается в пределах 65 536 значений. 24-битный звук, то есть 2 в 24 степени — уже описывается 17 миллионами вариантов уровня. Ну и как полагаете, какая сетка более точно опишет оттенки аналогового сигнала?
Еще один важный момент — редактирование цифрового сигнала. При изменении уровней, эквализации и другой обработке все процедуры для уменьшения ошибок квантования желательно вести в более высокой битности, чем оригинал. Поэтому на железном оборудовании в самом конце 80-х сначала появились шины 20 бит разрядности, затем и 24. В современных DAW-комплексах, да и просто компьютерных аудиоредакторах или даже регулировки громкости в плеерах типа Foobar внутренний пересчет потока ведется в 32 бит с плавающей точкой. DSP-процессоры могут использовать еще более высокие показатели — 64 бит, как на той шахматной доске.
Для тиража финальный микс опрокидывают обратно в 24 бит — либо по старинке в 16. В 32-битном формате музыку не издают. Нет смысла: огромный объем, ни SPDIF, ни FLAC 32 бит не поддерживает. Некоторые аудиофилы утверждают, что нет смысла и в 24-битной музыке. Мне так не кажется.
Дело в том, что для конвертации 32-битного проекта в 16-битную форму нужна инъекция сглаживающего шума. Так снимаются ошибки квантования при отбросе младших битов. Работает функция дизеринга (dither). И при переводе из 32 в 24 бит его величина настолько незначительна, что им даже можно пренебречь. Так что вмешательство в оригинальный сигнал при такой конвертации куда более щадящее, и имеет смысл предпочитать более близкие к оригиналу 24-битные миксы — даже если у них «обычная» частота дискретизации 44,1 кГц.
Если при воспроизведении 16-битный контент попадает на 24- или 32-битный ЦАП — ничего страшного. Просто младшие разряды останутся с нулями. А вот когда наоборот приходят 24 бит на старый 16-битный ЦАП, младшие 8 бит будут отброшены. Из-за транкейта ошибок квантования искажений в итоге станет больше.
Мультибитные ЦАПы — зачем они вообще нужны?
Мультибитные аппараты появились не нарочно, чтобы порадовать аудиофилов. Такая уж получилась технология — другой тогда еще не было. Хотя некоторые любители винтажа сейчас задним числом говорят, что такой ее сделали нарочно, чтобы отвадить потребителей от пластинок. Они же утверждают про «аналоговость» звучания мультибитных ЦАПов, с чем я не вполне согласен и на незнакомой системе вряд ли угадаю — вот это точно играет ЦАП на лестничной R-2R матрице. Если же намеренно ввести себя в аудиофильский транс и долго и изнурительно сравнивать, то я бы назвал мультибитный почерк иначе — жанровой «выразительностью».
Такой конвертер при грамотной реализации демонстрирует пластичность НЧ-диапазона, подчеркнет контур вокала или инструмента на акустических записях. Можно допустить, что у дельта-сигм при более уверенной и насыщенной «высоте» сцены, акустический тембр выглядит более постным и диффузным. Но, повторюсь, эта разница не в стиле «небо и земля».
В 80-90-х было выпущено множество CD-плееров с мультибитными чипами и грязноватым, утомительным звуком. Обвязка ведь тоже играет роль. К тому же не забывайте, что, например, DSD — это чистейшая дельта-сигма, однобитная. И у этой концепции вполне себе мягкий аналоговый (или псевдоаналоговый, как вам будет угодно) почерк.
Какие есть разновидности FIR-фильтров?
Информация по ним общеизвестна. Самый старый называется фазолинейным. После такого фильтра в волне будут паразитные колебания до и после импульса. В основном, сейчас применяют минимально фазовые — у него все колебания отложены на потом, после импульса. И эти флуктуации более выражены, чем у фазолинейного.
Если вы, как инженер, желаете уменьшить колебания, то ослабляете фильтр, делаете крутизну его спада мягче. Подобные фильтры называют уже не Sharp, а Slow. Они имеют спад на ВЧ. Если ваша система достаточно звонкая и прозрачная, Slow-фильтры ничего не испортят — мне они нравятся больше, чем Sharp.

Периодически поднимается тема апскейлинга частоты и битности цифрового сигнала. Насколько он нужен?
Если мы говорим не о записи, а о предварительном ресемплировании на более высокую частоту, то его цель — конвертировать и отфильтровать сигнал вне пределов человеческого слуха, сместить эту спорную область повыше. Но при пересчете такого сигнала на более высокий порядок тоже нарушается фаза. Так что оценивать успех этой процедуры придется вам на слух на конкретном устройстве. Лично мне это кажется лишней нагрузкой на процессор.
Самые современные и крутые ЦАПы поддерживают DSD1024 и апскейлинг PCM до 32 бит/768 кГц. Не убивает ли звук апскейлинг входящего сигнала до максимальных значений? Есть ли смысл (реальный прирост в качестве звука) в хранении и прослушивании DSD выше, чем DSD256?
Эта поддержка абстрактна и просто показывает вычислительные возможности. В идеале эти характеристики более приближены к аналоговому звуку с бесконечно затухающим спектром и бесконечной битностью. Но на практике никто не собирается записывать звук в таких форматах.
Вся кино- и музыкальная техника, а также персонал, который ее обслуживает, вполне удовлетворены частотами дискретизации 44,1 и 48 кГц. На эти частоты настроены и плагины обработки. Редко, когда используется 96 кГц на финальной стадии микширования, но сам мультритрек зачастую опять в 44,1. Нам может не нравиться такое положение дел в звукозаписи, но это данность. Что выросло, то выросло.
Есть ли разница в том, как техника воспроизводит разные представления одного и того же цифрового сигнала. Например, контейнеры без сжатия или со сжатием (без потерь)? Меняется ли что-то в разных версиях аудиоформатов? Например, FLAC был впервые представлен в 2001 году и пересматривался с тех пор десятки раз.
Сравнивал — ничего принципиального не заметил. Я знаю, что некоторые аудиофилы предпочитают не паковать в lossless-форматы, так как якобы без сжатия техника играет более «непринужденно». Те измерения, которые я провожу, не указывают на разницу при скармливании оригинального PCM или сжатого без потерь (архивированного) файла.
И я еще не дошел до той стадии паранойи, чтобы сравнивать версии FLAC. Это просто архиватор — какая-то версия жмет эффективнее, какая-то хуже. Он не трогает целостность потока, и у аудио в принципе не такая уж плотность данных, чтобы как-то переживать о нагрузке на современные чипы. Если не ошибаюсь, с какой-то поры все изменения версий FLAC затрагивали в основном кодировку тэгов. Но, опять же, находятся отдельные слушатели, которые скажут, что без тэгов файл звучит лучше.
Какое место у формата DSD в современной индустрии и есть ли у него будущее?
Будущего в современной индустрии звукозаписи у такого формата нет, поскольку в нем невозможно редактировать материал. Остается нишевое потребление. И если кому-то нравится звук DSD, то в него можно архивировать мастер-ленты с финальным миксом, что иногда и делается. И не забывайте, что в основе многих SACD, звучание которых вам нравится, использовались обычные записи PCM-рекордеров 16 бит/44,1 кГц.
На какую характеристику стоит обратить внимание в ЦАПах при построении настольной системы?
На коммутацию между ЦАПом и вашими активными колонками. Балансное подключение приветствуется. Также приветствуется USB-драйвер от XMOS или Amanero. Он должен обеспечивать нормальное ASIO-подключение.









