Что такое dsd формат аудио
DSD формат аудио | Простое объяснение | Прочтите это сейчас >
Конвертация HD аудио файлов
1. Параметры DSD
Аббревиатура | Direct Stream Digital |
---|---|
Метод кодирования аудио данных | сигма-дельта модуляция (читайте подробности и смотрите видео) |
Битовая разрядность | 1 бит или выше (читайте подробности о качестве звука) |
Частота дискретизации | DSD 64 (2.8 МГц), DSD 128 (5.6 МГц, double), DSD 256 (11.2 МГц, quad), etc. (читайте подробности) |
Количество каналов | Стерео и многоканальный |
Носители | SACD оптический диск, включая hybrid SACD (с CD-аудио слоем), компьютерные файлы [SACD ISO (риппинг альбомов с SACD) и DSF, DFF, CUE+DSF/DFF] (читайте подробности) |
Спецификация | «Scarlet book» (1999) |
Использование | Производство музыки, домашнее hifi/hiend аудио |
Direct Stream Digital является обним из аудиофильских форматов высокого разрешения (high resolution audio). Он был создан для улучшения динамического диапазона CD-аудио в слышимой частотной области звука.
Читайте далее о вопросах качества звука (шум, битовая глубина, полоса, частота дискретизации DSD audio по сравнению с PCM).
2. 1-бит и шум
Как правило, этот формат имеет битовую глубину 1 бит. Поэтому уровнень шума значителен из-за ошибок квантования.
Нойз-шейпинг (НШ) спектра 1-битного сигнала.
Сигма-дельта модуляция
Когда такая 1-битная запись проигрывается, низко-частотный фильтр вырезает «усиленный» высокочастотный шум.
Таким образом, уровень шума 1-битного сигнала после нойз-шейпинга (сигма-дельта модуляции) становится сравнимым с уровнем шума мультибитного сигнала PCM (импульсно-кодовая модуляция).
То есть 1-битная сигма-дельта модуляция может иметь разрешение аудио одинаковое с мультибитным сигналом. Читайте подробности и смотрите видео здесь
3. Частоты дискретизации
Также в качестве основы может быть использовано 48000 кГц. С технической точки зрения не существует ограничения на частоту дискретизации сигма-дельта модулированного сигнала. Но возможно возникновение проблем с совместимостью.
4. Перегрузка и устойчивость
Когда разрабатывается сигма-дельта модулятор, инженеры обращают особое внимание на:
Для решения этих проблем разработчики могут варьировать:
Эти параметры должны рассматриваться в связи друг с другом.
Битовая глубина
Увеличение битового разрешения уменьшает шумы квантования (шумы ошибки квантования).
Нойз-шейпинг
Нойз-шейпинг «выталкивает» энергию ошибки квантования из слышимого диапазона.
Для «выталкивания» большего количества энергии нужно более крутой нойз-шейпинг.
Более крутой нойз-шейпинг увеличивает вероятность срыва стабильности работы сигма-дельта модулятора при перегрузке на входе.
Когда модулятор в нестабильном состоянии, на его выходе отсутствует сигнал или генерируются колебания.
После срыва стабильности модулятор должен быть принудительно перезапущен.
Устойчивость сигма-дельта модулятора к перегрузке
Частота дискретизации
Более высокая частота дискретизации уменьшает уровень спектра ошибки квантования. Потому, что энергия шума распределяется в более широкой полосе. Это позволяет использовать более пологий нойз-шейпинг.
Частота дискретизации и уровень шума квантования
В правой и левой частях изображения площади фигур шума одинаковы. Но фигура, более растянутая по горизонтальной оси, дает более низкий уровень шума.
Увеличение частоты дискретизации позволяет снизить уровень шума в полосе слышимого звука. Это позволяет уменьшить крутизну нойз-шейпинга и увеличить устойчивость модулятора к перегрузке.
Resume
Мы можем видеть, что более низкий уровень шума и более высокая устойчивость модулятора к перегрузке на входе могут быть достигнуты разными путями.
5. DSD в цифрах
Профессиональные аудио модуляторы имеют уровень шума в слышимом звуковом диапазоне для частот дискретизации:
Уровень шума в слышимом диапазоне почти не зависит от демодулятора. Но уровень шума должен быть максимально подавлен вне этой полосы. Так как ультразвуковой шум может привести к интермодуляционным искажениям.
Читайте о DSD vs DSF vs DFF >
6. DSD vs PCM
Direct Stream Digital (сигма-дельта модуляция) очень похожа на импульсно-кодовую модуляцию (PCM), но форма спектра уровня шумов квантования изменена для уменьшения уровня шума в звуковом диапазоне.
Также возможно применение нойз-шейпинга для обычной PCM. Но разница заключена в запасе полосы для «выталкивания» энергии шума из звукового диапазона.
DSD против PCM
PCM имеет меньший резерв полосы (выше звукового диапазона), чем сигма-дельта модуляция, и это обусловлено более высокой битовой глубиной и переходной полосой выходного фильтра ЦАП (цифрово-аналогового преобразователя).
Нойз-шейпинг также может быть использован и для импульсно-кодовой модуляции.
Таким образом, формат сам по себе не имеет преимуществ. Но его реализация может иметь различия в качестве звука.
Читайте подробности здесь >
Посмотрите статью с инфографикой DSD против FLAC >
Читайте статью о ЦАП >
7. Форматы сжатия DSD
SACD диск может быть конвертирован без потерь (losslessly) в SACD ISO файл [1], [2], [3].
SACD ISO файл может быть распакован без потерь в DSF или DFF файлы.
Читайте подробности о файлах DSF и DFF.
1-битные аудио файлы (DSF, DFF, SACD ISO) и диски могут быть сжаты по размеру с помощью метода DST (Direct Stream Transfer).
Также 1-битное аудио может вещаться через сеть.
Несжатое DSD64 требует пропускную способность 2.7 Мбит/с = 44100 Гц * 64 / 1024 / 1024.
Источники, носители Direct Stream Digital
Также связка индексного файла CUE и DSF/DFF аудио файла может содержать 1-битный альбом.
8. DSD проигрыватели
Для вопроизведения DSD на компьютере используются программные аудио плееры. Они могут проигрывать один или несколько 1-битных форматов файлов. Аппаратные DSD проигрыватели могут проигрывать как оптические SACD диски, так и файлы DSF, DFF.
1-битные файлы могут быть воспроизведены непосредственно через DSD ЦАП/проигрыватель или конвертированы в PCM «на лету» для проигрывания с помощью PCM ЦАП. О конвертировании SACD читайте здесь
1-битное проигрывание может быть реализовано через специальный ASIO-драйвер (программные) под Windows, включая DoP (DSD over PCM) формат упаковки аудио (пример).
Оптический SACD диск может быть проигран на аппаратном плеере. Автор не располагает информацией о доступных SACD-приводах для обычных компьютеров, чтобы воспроизводить SACD оптические диски.
Стерео проигрыватель может на лету конвертировать (downmix) многоканальный звук в стерео. Как альтернатива, многоканальные файлы могут быть предварительно конвертированы в стерео. Это позволяет сэкономить ограниченное место на жестком диска портативного проигрывателя аудио (DAP). Даунмикс является обработкой с потерями. Его качество зависит от конкретной реализации.
Читайте еще об аудио плеерах здесь > и здесь >
9. DSD конвертеры
DSD конвертеры предназначены для:
Прочитайте как работают DSD аудио конвертеры здесь >
Список конвертеров (конвертируют все или некоторые виды DSD файлов [DSF, DFF, SACD ISO])
10. Редактирование DSD
Читайте основную статью о редактировании DSD >
DSD редактирование достаточно сложный процесс по причине модулирующего шума в области высоких частот. Нелинейные обработки могут привести к слышимым продуктам интермодуляционных искажений ультразвукового шума.
В настоящее время автор не располагает информацией о «естественной» (native) обработке аудио 1-бит (например: изменение уровня, ресемплинг и пр.) без конвертации 1-бит в мильтибитный формат и обратно. Кроме слияния/разрезания аудио файлов.
Редактирование DSD
PCM в данном контексте может быть рассмотрено, как «мультибитное DSD». Импульсно-кодовая модуляция не обязательно обозначает «24 бит / 352 кГц» и т.п. Автор рекоммендует использовать 32- or 64-bit float (с плавающей запятой) форматы. Рассматриваемый PCM содержит высокочастотный модуляционный шум. Но, для конвертирования этого «мультибитного DSD» в 1-бит необходима модуляция с нойз шейпингом.
Потери при редактировании с 1-бит/мультибит преобразованием примерно сравнимы с ресемплингом.
Звукозаписывающие студии могут распространять DSD записи без редактирования.
Также существует DXD формат. Это PCM (как правило, «24 bit / 352 kHz» и т.п.) с высокими частотами дискретизации, битовыми разрешениями и «наследственным» высокочастотным шумом DSD. К сожалению, этот шум может привести к слышимым продуктам нелинейных искажений. рекомендуется вырезать (фильтровать) этот шум перед нелинейными обработками.
Цифровой звук: DSD vs PCM
Цифровой звук. Как же много мифов крутится вокруг этой фразы. Сколько споров возникало между любителями удобства и качества цифры и приверженцами «живого воздушного» винилового звука помноженного на «тёплое ламповое» звучание. Кроме того, есть немало споров и между любителями «цифры»: достаточно ли 16х44.1 или нужно 24х192? Что лучше: мультибит или дельта-сигма? CDDA или SACD? PCM или DSD? В этой статье я попробую простым языком изложить азы цифрового звука, а так же более подробно остановлюсь на сравнении двух типов кодирования аналогового сигнала в цифровой: DSD и PCM.
Для начала ответим на вопрос, что есть цифровой звук? Чем он отличаются от аналогового? Если говорить кратко, математическим языком, аналоговый звуковой сигнал — непрерывная функция, цифровой звуковой сигнал — дискретная функция. Что это значит?
Аналоговый сигнал
Если нарисовать в воображении график синусоиды (именно так в чаще всего изображают звуковую волну): то, как бы мы его не увеличивали, стараясь рассмотреть все детали, — всегда будем видеть плавную гладкую линию: это аналоговый звуковой сигнал (рис. 1).
Рис. 1. Аналоговый сигнал
Аналоговый звук (запись) имеет множество параметров, с помощью которых можно оценить его качество. Рассмотрим три самых важных: частотный диапазон, динамический диапазон, искажения.
Частотный диапазон — набор частот, содержащихся в звуке. Принято считать, что частотный диапазон человеческого слуха 20… 20.000 Гц (иногда указывается 16 — 22.000 Гц). Сам по себе частотный диапазон музыки никакого интереса в плане оценки качества не представляет (к примеру, частотный диапазон все того же взлетающего самолета будет очень широк, а вокальной партии тенора — намного уже). Качественным параметром, скажем, наушников является потенциальный частотный диапазон, а оценивается он с помощью амплитудно-частотной характеристики (АЧХ). Идеальная АЧХ — прямая линия на всем диапазоне частот слуха – означает, что источник звука не усиливает и не ослабляет какие-то отдельные частоты, а значит извлекаемый звук совпадает с оригиналом.
Рис. 2. АЧХ MP3 файла 256 kbps
Динамический диапазон (ДД) — разность между самым тихим и самым громким звуком. Измеряется громкость в децибелах (дБ). Принято считать, что максимальная громкость, не наносящая травм человеку — это 130 дБ — звук взлетающего самолета, а минимальная слышимая громкость — 5… 10 дБ — на уровне шелеста листьев в маловетреную погоду. Естественно, что шелест листьев на фоне взлетающего самолета разобрать будет невозможно, да и слушать музыку с уровнем 130 дБ крайне неприятно. Поэтому принято считать, что комфортный ДД для прослушивания музыки — 80… 100 дБ.
Искажения – не что иное, как отклонение сигнала от оригинала.
Принципы представления звука в цифровом виде
Что же происходит при оцифровке аналогового звука? Не будем углубляться в технические аспекты, разберем все, как говорится, на бумаге: для этого нарисуем нашу воображаемую «идеальную» синусоиду и будем измерять величину сигнала через равные промежутки времени (этот процесс называется дискретизацией или квантованием): мы получим некий последовательный набор значений — это и будет наш цифровой сигнал, полученный методом импульсно-кодовой модуляции (PCM) (рис. 3).
Рис. 3. Преобразование аналогового сигнала в PCM
Два основных параметра качества PCM сигнала — это частота и разрядность. Частота — это количество измерений за одну секунду, чем их больше — тем с большей точностью передаётся сигнал. Частота измеряется в герцах: 44100 Hz, 192000 Hz и др. Разрядность — количество возможных значений величины сигнала (точность передачи величины). Чем больше вариантов — тем больше точность сигнала. Разрядность измеряется в битах: 16 bit (65.536 возможных значений, ДД 96 дБ), 24 bit (16.777.216 значений, ДД 144 дБ) и др.
Рис. 4. Преобразование аналогового сигнала в DSD
Такой вид представления цифрового звука называется импульсно-плотностной модуляцией, чаще всего для него используется аббревиатура DSD. Фактически, единственный качественный параметр такого сигнала — частота. Но так как частоты используются очень высокие (от 2.822.400 Hz), такие цифры сложно запомнить, принято делить частоту DSD сигнала на 44.100 Hz. Полученное число и является показателем качества: DSD64 (ДД 120 дБ), DSD128, DSD256 и т.д.
Восстановление аналогового сигнала из «цифры»
Но оцифровка аналогового сигнала – это полдела. Для прослушивания цифровой музыки нужно выполнить обратное преобразование. Для начала рассмотрим, каким образом превратить в звук цифровой DSD поток. Как мы уже знаем, этот поток представляет из себя высокочастотный (2,8 МГц и более) двухуровневый сигнал, средняя величина этого сигнала меняется со звуковой частотой. То есть, если подходить к решению задачи максимально просто, — нужно отфильтровать все высокочастотные составляющие DSD потока, оставив только полезный звуковой сигнал (частоты до 20. 22 кГц). Делается это с помощью аналогового фильтра низкой частоты (ФНЧ). Простейший ФНЧ – это RC цепочка. Сигнал полученный, после прохождения этой цепочки, показан на рис. 5.
Рис. 5. Восстановление аналогового сигнала из DSD
Как видим, полученный график лишь отдаленно напоминает исходную синусоиду. Но не забываем, что мы «применили» простейший фильтр, улучшая схему фильтра можно добиться практически полного отсутствия высокочастотного шума и получить аналоговый звук с хорошими качественными показателями.
Для восстановления аналогового сигнала из цифрового PCM недостаточно только лишь аналогового ФНЧ, нужно предварительно расшифровать цифровые данные, для этого используются цифро-аналоговые преобразователи (ЦАПы). Бывают они разных типов, но описывать их все в задачи данной статьи не входит. Остановимся на 2-х самых распространённых типах в звуковой технике. Во-первых, это так называемый ЦАП лестничного типа (его ещё называют мультибитным). Как вы, наверное, догадались, такой ЦАП преобразует PCM поток цифровых данных в поток величин звукового сигнала, которые на графике выглядят как лестница (рис. 6). Как и в случае DSD, обязательно использование аналогового фильтра для сглаживания «ступенек».
Рис. 6. Восстановление аналогового сигнала из PCM
Зачастую, в таких преобразователях используется промежуточная передискретизация цифрового PCM сигнала в более высокие значения частоты (например, 192 кГц): это уменьшает «ступеньки», что позволяет упростить схему аналогового фильтра.
Второй тип ЦАП – дельта-сигма – использует передискретизацию в ещё большие значения частоты с одновременным уменьшением разрядности до одного бита. Ничего не напоминает? Это же знакомый нам DSD сигнал! Как далее обработать такой сигнал и превратить его в аналоговый, мы уже рассматривали выше.
Применение PCM и DSD, достоинства/недостатки
Где же мы можем встретить каждый из способов кодирования? PCM формат очень распространён: CDDA диски, DVD Audio, файлы MP3, FLAC, ALAC, AAC, звук в фильмах, и далее, и далее, проще сказать, когда не-PCM. Super Audio CD диски, DSD диски, файлы DSF, DFF — это DSD формат. Что же всё-таки лучше? При воспроизведении какого формата мы получим более качественный звук?
В статьях, посвященных DSD формату, описано множество преимуществ перед PCM, но все ли описываемые преимущества верны или это мифы, придуманные для обывателей, не разбирающихся в технической составляющей, чтобы отвоевывать рынок, плотно занятый PCM форматом? Давайте кратенько пройдемся по списку.
Рис. 7. Динамический диапазон / шум при преобразовании между DSD и PCM
О формате SACD/DSD. Описание технологии, воспроизведение, конвертирование
В качестве продолжения цикла статей об экзотических алгоритмах кодирования и носителях аудиоданных (уже можно почитать про DVD-Audio, HDCD и DTS/DTS-CD) хочу рассказать о таком интересном стандарте, как SACD.
1. SACD диски. Формат DSD
Super Audio Compact Disc — как и Audio CD — результат сотрудничества компаний Sony и Philips. Разработка стандарта была завершена в 1999 году — через 17 лет после выхода Red Book (CDDA).
SACD представляет собой оптический диск с высокой плотностью данных, по физическим размерам и объёму данных соответствующий диску DVD. Также у DVD и SACD совпадает длина волны считывающего лазера — 650 нм против 780 у CDDA (именно увеличение частоты позволило увеличить плотность питов и, как следствие, объём носителя). Одной из отличительных особенностей SACD является использование золота в качестве отражающего слоя (вместо алюминия). Это увеличивает отражающую способность, долговечность дисков, но также обуславливает их высокую стоимость.
Особый интерес представляет собой содержимое диска — данные в формате Direct Stream Digital. DSD — это однобитный поток с очень высокой частотой дискретизации: стандартные файлы DSD64 имеют частоту семлирования 2822,4 кГц (в 64 раза больше частоты для CDDA). По сути это тот самый поток, который получается на выходе сигма-дельта АЦП.
Особенностью сигма-дельта АЦП является кодирование не абсолютного значения уровня сигнала в конкретный момент времени, а его приращения.
Схема сигма-дельта АЦП
На выходе этого АЦП мы получаем нули и единицы, следующие с очень высокой частотой. Причем уровень сигнала пропорционален сумме закодированных за единицу времени приращений (1 означает «+1», а 0 — «-1»).
Подробнее об алгоритме работы данного АЦП можно почитать здесь. Вкратце — такой способ квантования позволяет получить широкий динамический диапазон (около 120 дБ) и очень низкий уровень шумов в слышимом диапазоне частот — за счет формовки шума (noise shaping) они вытесняются в сверхзвуковую область и могут быть легко отфильтрованы. Также, благодаря многократному превышению частоты Найквиста, такой способ помогает избежать фазовых задержек в области верхней граничной частоты (однако степень влияния этого фактора на качество звучания точно не установлено) и уменьшить влияние джиттера.
Итак, главным преимуществом SACD является отсутствие необходимости в так называемой децимации — понижении частоты дискретизации — ведь в действительности это промежуточное преобразование происходит в случае со всеми остальными форматами аудио, использующими PCM (CDDA, DVD-A). Т. е. при оцифровке студийной записи на выходе АЦП мы фактически получаем DSD поток, затем его приходится преобразовывать в PCM с повышенной разрядностью, но более низкой частотой дискретизации, что уже представляет собой алгоритм с потерями. И — что самое интересное — при воспроизведении, непосредственно перед цифро-аналоговым преобразованием (а, как известно, в аудиотехнике используется именно дельта-сигма ЦАП), частоту дискретизации всё равно придется повышать, выполняя преобразование в тот самый 1-битный DSD формат, в котором данные были сняты с АЦП.
Таким образом SACD позволяет хранить аудио в «первозданном» виде, и в таком же виде подавать их при воспроизведении на ЦАП. Отсутствие промежуточной децимации упрощает схемотехнику устройств и позволяет добиться более высоких показателей качества.
Примечание: к сожалению, ко всему вышесказанному нужно добавить большую «ложку дёгтя»: во многих случаях на студиях звукозаписи для мастеринга записей всё же используется промежуточное преобразование в PCM. Несмотря на то, что в 2000 году был разработан формат DSDIFF (расширение файлов *.dff), предназначенный для записи, редактирования и мастеринга аудио непосредственно в DSD представлении, его возможности весьма ограничены, и на многих студиях для сведения и мастеринга используется формат Digital eXtreme Definition. DXD по сути представляет собой стандартизированный PCM аудио с очень высокой частотой — 352.8 или 384 кГц и разрядностью 24 или 32 бит. Этот формат был придуман и использовался для мастеринга записей с высоким разрешением на студиях звукозаписи Pyramix (Merging Technologies), производивших SACD. Таким образом, для большинства SACD и DSD дисков исходником является именно DXD.
Существуют различные вариации стандартов SACD/DSD — с разной степенью оверсемплинга. Они обозначаются цифрой, равной отношению частоты дискретизации DSD к частоте дискретизации CDDA (44.1 kHz). SACD использует формат DSD64 (2822.4 kHz/ 44.1 kHz = 64), также разработаны и новые спецификации DSD128, DSD256 и DSD512, дополнительно увеличивающие частоту в 2, 4 и 8 раз. Таким образом мы получаем максимальную частоту 22579,2 кГц для DSD512, однако найти такие записи очень сложно, и далеко не все DSD-ЦАП их поддерживают. Кроме того, есть разрешения DSD, базирующиеся на частоте 48 кГц: например, 48kHz based DSD128 будет иметь частоту не 2822.4, а 3072 кГц, и т. д.
SACD поддерживает конфигурацию каналов 2.0 и 5.1, причем на одном SACD могут содержаться две дорожки — стерео и многоканальная. Многоканальная дорожка обязательно представляется в сжатом виде (сжатие без потерь; для стерео — опционально), так называемом DST формате (Direct Stream Transfer), который обеспечивает сжатие в 2—3 раза.
Так же, как и DVD, SACD бывают одно- и двухслойные. На однослойных SACD может содержаться CDDA слой для обратной совместимости с проигрывателями без поддержки технологии SACD (такие диски называются гибридными).
2. Защита SACD от копирования. Распространение аудио в формате DSD
Все SACD диски обладают специальной защитой (на физическом уровне), которая позволяет считывать SACD слой только лицензированным производителем устройствам, которые оснащены специальным ключом. Тем не менее, в интернете можно найти раздачи SACD рипов. Снятие рипов выполняется с помощью PlayStation 3 (или подходящего проигрывателя со специальной прошивкой) и специальной программы SACD Ripper для ПК. Рип представляет собой так называемый SACD-R образ (как правило в формате ISO). Этот образ можно записать (тем же ImgBurn, например) на DVD диск и далее слушать на стационарном SACD проигрывателе.
Таким образом мы видим, что технология SACD не включает в себя ничего принципиально нового — по сути это поток данных с АЦП, записанный на носитель вроде DVD. Весомое различие между SACD и DVD диском (кроме защиты от копирования) заключается лишь в размере сектора — 2064 вместо 2048 байт. Похоже, что этот трюк был придуман в коммерческих целях, и во многом именно поэтому ни один оптический привод для ПК не читает SACD диски.
Кроме SACD дисков DSD аудио также может распространяться и в виде файлов, в том числе записанных на так называемый DSD disc. Спецификация была разработана Sony и представляет собой DVD или Blue-ray носитель с файлами формата DSF (DSD Storage Facility), содержащими стерео звук. Многоканальное аудио стандартном не поддерживается, хотя формат DSF открытый и вполне может содержать многоканальное аудио, которое будут читать программные плееры (например, foobar2000). Минусом Sony DSF, как контейнера для хранения DSD, является отсутствие поддержки DST сжатия. Для поддержки DST сжатия следует использовать более сложный контейнер Philips DSDIFF, о котором было сказано ранее.
3. Как воспроизвести SACD?
Воспроизвести SACD диск на приводе ПК, как я уже сказал, невозможно, поэтому далее я буду рассматривать исключительно воспроизведение образов (SACD-R, DSD-Disc).
3.1 Воспроизведение на устройствах с поддержкой DSD
Если Вы счастливый обладатель звуковой карты / ЦАП с поддержкой DSD, поздравляю — вы сможете успешно воспользоваться преимуществами Super Audio CD. Как настроить правильный вывод DSD — я расскажу ниже.
3.1.1 Native DSD и DoP
Существует два варианта доставки DSD потока на ЦАП: native («родной») DSD и DoP (DSD over PCM). В первом варианте поток поступает на карту именно в том виде, о котором шла речь выше — с очень высокой частотой дискретизации и разрядностью 1 бит. Второй же вариант был разработан для совместимости с существующими PCM-транспортами (чтобы не сочинять новые алгоритмы передачи, а использовать уже имеющиеся для PCM) и представляет собой простое мультиплексирование высокочастотного 1-битного потока в 24-битный PCM с более низкой частотой, в котором старшие 16 бит содержат фрагмент DSD потока, а младшие 8 — специальный DoP-маркер, служебную информацию, говорящую, что данные являются не обычным PCM, а упакованным DSD потоком. Так, для передачи стандартного DSD64 с частотой 2822.4 кГц используется PCM формата 24 бит 176.4 кГц, который легко можно передать по USB, S/P-DIF и другим привычным интерфейсам. С повышением частоты DSD, соответственно, повышается и частота PCM-носителя. Так как поддержка PCM с частотой 705,6 кГц весьма скудная, то проигрывание DSD256 через DoP уже, как правило, не представляется возможным. Также нужно отметить, что процесс мультиплексирования/демультиплексирования самый что ни на есть простой и не предполагает никаких потерь информации/качества. Приведу пример в десятичной системе: представьте, что у вас есть значения 2, 5, 3, 6, 9, 0 и т. д., и вы называете их своему товарищу по-очереди — это обычная передача. Теперь представьте, что Вы условились читать имеющиеся значения «пачками», трехзначными числами — 253, 690 и т. д. — а товарищ будет по-прежнему записывать цифры по отдельности — это и есть мультиплексирование/демультиплексирование. Более чем просто, не правда ли?
3.1.2 Настройка foobar2000
Итак, приступим к настройке воспроизведения. Наш инструментарий для воспроизведения SACD образов (имеющих формат ISO) включает в себя последние версии foobar2000 с плагинами SACD Decoder, DSD Processor и ASIO-драйвером DSD Transcoder (скачать можно там же, одним архивом с foo_input_sacd), а также ASIO-драйвер ASIO Proxy, который может нам понадобиться вместо DSD Transcoder в некоторых случаях.
Теперь нужно определиться, что мы имеем в плане оборудования. В моём распоряжении на данный момент находится USB-ЦАП iFI nano iDSD. Итак, смотрим в спецификацию и видим, что наше устройство поддерживает PCM вплоть до 384 кГц и DSD вплоть до 12.4 МГц. Таким образом, это означает поддержку всех форматов PCM (в спецификации это не указано, но карта поддерживает разрядность до 32-бит), включая DXD, поддержку DSD64 и DSD128 через DoP или native DSD, а также, дополнительно, поддержку DSD256 — только через native DSD (в последней версии прошивки добавлена поддержка вывода DSD256 также и в режиме DoP).
Вот, как выглядят настройки SACD декодера в нашем случае:
Настройки SACD декодера для DSD вывода
Здесь мы включили декодирование в формате DSD и включили использование DSD Processor. Кстати, если вы хотите, чтоб в плеере работали визуализации, можете установить декодирование в формате DSD+PCM, однако помните, что это негативно отразится на производительности. Остальные настройки:
Editable tags — включает возможность редактирования тегов. При этом новые теги пишутся не в файл образа, а в XML файлы в папке foobar2000/sacd_metabase.
Store tags with ISO — если включено, XML файл со значениями тегов сохраняется в той же папке, что и ISO образ.
Linked 2CH/MCH Tags — создаёт связь между тегами стерео и многоканальной версий трека, так что изменения в одном варианте влекут изменения и для второго.
Edited Master Playback — включает воспроизведение оригинальной мастер-записи, включая участки, которые не были включены при разметке SACD-диска. При этом фактическое время звучания некоторых треков может быть на несколько секунд больше, что может привести к неверному отображению текущей позиции воспроизведения.
Настройки DSD процессора для iFi nano iDSD
DSD процессор нам нужен для того, чтобы сконвертировать неподдерживаемые форматы DSD в максимальный поддерживаемый. Кстати говоря, с сожалением отмечу, что по данным разработчика для преобразования DSD->DSD используется промежуточное преобразование в PCM (хотя и весьма качественное). Для nano iDSD я включил конвертацию DSD512 в DSD256 с использованием SDM Type D — максимально качественный фильтр 5-го порядка, использующий расчеты в 64-битном формате с плавающей точкой. Для интересующихся различиями между разными типами сигма-дельта модуляторов — SDM Type A/B/C/D — привожу таблицу:
Sample&Hold выключено (эта опция включает упрощение алгоритма за счет использования интерполяции нулевого порядка, что помогает снизить нагрузку на процессор, но негативно отражается на качестве).
Настройки DSD Transcoder для iFi nano iDSD
Тут я просто установил вывод всех форматов DSD в режиме native. Параметр Transition отвечает за добавление тишины в начало треков, его можно увеличить, если вы заметите, что треки начинают звучать не сразу. Параметр Sample position override необходим, если в плеере некорректно отображается позиция воспроизведения (прошедшее/оставшееся время).
Далее осталось только выбрать вывод DSD на транскодер:
Кстати говоря, выбранная разрядность здесь роли не играет, т. к. конвертер глубины бит при DSD выводе не используется.
3.1.3 Проверка работоспособности настроек
Как видите, семпл воспроизводится, а в панели iFi (панель устройства ASIO можно открыть двойным кликом по названию в списке устройств ASIO — см. выше) отображается частота нативного DSD256.
3.1.4 Настройка для нескольких DSD устройств
Это всё хорошо, но только если вы пользуетесь для воспроизведения DSD только одним устройством. А что делать, если устройств несколько, и у них разная поддержка DSD (например, один ЦАП поддерживает DSD256, а другой — нет) — ведь в таком случае нужно будет постоянно менять настройки DSD процессора? В этом случае на помощь приходит ASIO Proxy и Custom channel mappings в foobar2000. Установите драйвер ASIO Proxy и затем добавьте новый пресет для ASIO, перейдя в настройках в Playback->Output->ASIO и нажав Add new в разделе Custom channel mappings. В открывшемся окне выберите драйвер foo_dsd_asio и введите подходящее название:
После этого нажмите Configure — появится окно настройки ASIO Proxy.
Настройки ASIO Proxy для iFi nano iDSD
Как видите, ASIO Proxy совмещает в себе функционал DSD транскодера и DSD процессора, позволяя настроить все параметры индивидуально для каждого устройства. Для своего ЦАП я выбрал настройки аналогичные приведённым ранее.
Обратите внимание: в ASIO Proxy кроме стандартных режимов DSD и DoP есть еще специальные режимы DoP для ЦАП-ов dCS и exD.
После сохранения настроек осталось выбрать устройство вывода DSD: ASIO: iFi nano iDSD custom и убедиться, что воспроизведение работает. Так и есть, панель iFI по-прежнему отображает частоту 11289.6 кГц.
Теперь можно аналогично создать новые пресеты ASIO с установками для любого другого ЦАП — затем останется лишь переключать при необходимости устройства вывода.
3.1.5 Устранение проблем
Если вы настроили всё согласно моей инструкции и спецификации своего устройства, но DSD поток не воспроизводится или воспроизводится с искажениями/щелчками, то попробуйте следующее:
Если плеер (или вся система) тормозит и/или наблюдаются искажения, обратите внимание на загруженность процессора, в частности на то, сколько процессорных ресурсов потребляет foobar2000 (можно посмотреть в Диспетчере задач Windows). Если плеер слишком перегружает систему — попробуйте убрать из него лишние визуализации. Также большую нагрузку на процессор при старте трека может давать Waveform Seekbar, т. к. он дополнительно декодирует и анализирует всю запись (попробуйте временно удалить плагин).
Если воспроизведение идёт с щелчками или искажениями: откройте панель вашего ASIO устройства (для этого поставьте воспроизведение на стоп, зайдите в Preferences->Playback->Output->ASIO и дважды щёлкните по названию ASIO драйвера) и проверьте настройки буфера вывода. Например, драйвер iFi пишет, когда размер буфера вывода не соответствует выбранному режиму и текущей частоте дискретизации:
Чтобы увидеть это предупреждение, нужно открыть панель устройства во время воспроизведения DSD, но чтобы изменить настройки воспроизведение обязательно нужно остановить.
Если вы испытываете проблемы с выводом DSD и видите такое предупреждение, увеличьте буфер вывода. Чтобы проверить, действительно ли проблема в буфере — установите максимально безопасный режим (Extra Safe) и увеличивайте размер буфера до тех пор, пока во время проигрывания не перестанет отображаться предупреждение. Даже если у вас другая панель — всё равно попробуйте увеличить буфер, часто это помогает от щелчков и искажений.
Поменяйте режим вывода DSD на DoP (или наоборот) — возможно, с одним из них драйвер работает лучше.
Обновите драйвер и (после обновления драйвера) прошивку (Firmware) вашего ЦАП — это может помочь, если проблемы воспроизведения связаны с каким-то багом в ПО. За последними драйверами/прошивками и инструкциями обращайтесь на сайт производителя устройства.
3.2 Настройка декодирования и вывода в PCM
Если пока Вы не располагаете DSD-совместимым устройством — что ж, не беда, можно просто преобразовать DSD в PCM с высоким разрешением. Также декодирование в PCM понадобится, если вам необходимо выполнять дополнительную обработку потока с помощьюб DSP (как я писал выше, при выводе DSD потока все обработчики отключаются).
Настройки SACD декодера для вывода PCM
В настройках декодера можно задать целевую частоту дискретизации и алгоритм преобразования DSD в PCM. Multistage является SSE-оптимизированным алгоритмом и использует плавающую точку с одинарной (32fp) или двойной (64fp) точностью. Direct метод является более медленным (примерно на 40% медленнее Multistage) и выполняет фильтрацию частот выше 30 кГц. Installable FIR режим позволяет загрузить одну из приложенных к плагину предустановок ФНЧ, давая таким образом возможность выбирать граничную частоту.
Спектр аудио 192 кГц, полученного алгоритмом Multistage (64fp). На графике виден высокий уровень шума в сверхзвуковом диапазоне, обусловленный нойз-шейпингом
Лично я советую выбрать режим Direct (64fp, 30kHz LF), чтобы исключить интермодуляции от ультразвуковых частот, и максимальную частоту дискретизации, а в DSP (обязательно в самое начало цепочки) поставить SoX ресемплер до опорной частоты звуковой карты (её, в свою очередь, установить максимальной). Касаемо настроек — рекомендую почитать мою статью про качественный вывод звука.
Воспроизведение SACD-R в foobar2000. В плейлист загружены сжатые в DST стерео и 5.1 дорожки (битрейт отображается для декодированного DSD). На ВЧ шум на спектрограмме отсутствует, т. к. использован 30 кГц ФНЧ
4. Конвертирование SACD
Конвертирование SACD и DSD ничем не отличается от преобразования того же Hi-Res рипа 24/192 или т.п., единственное что предварительно необходимо настроить декодер для вывода PCM (или DSD+PCM), причем достаточно переключить в одни из этих режимов, настроить необходимые параметры, после чего можно вернуть режим вывода DSD — во время конвертирования декодер будет работать в режиме PCM. Всё остальное уже описано в статье Преобразование аудио высокой разрядности в 16 бит/44.1 кГц стерео.