
요 몇달 오디오에 빠져 주구장창 음악만 듣다 내린 결론 “CD음질이면 충분하다” “16bit 44.1kHz면 충분, 최대 24bit까지는 감사할 따름. DSD는 필요없는, 저장공간 낭비”, “320 mp3도 충분하긴 한데 FLAC으로 들으면 좀 더 고음이 시원한 느낌”
업데이트 날짜: 2021년 7월 26일
소개:
DSD(Direct Stream Digital)는 하이엔드 디지털 오디오 분야에서 큰 주목을 받고 있습니다. 간소화된 인코딩 및 디코딩 방식과 초고주파 샘플링은 타의 추종을 불허하는 성능을 약속합니다. 하지만 이것이 우리가 진정으로 기다려온 기술일까요, 아니면 단순한 마케팅 과장일까요? 이 블로그에서는 과장된 부분과 기술적 사실을 구분해 보겠습니다. DSD의 장점과 PCM(pulse-code modulation )의 장점을 각각 설명드리겠습니다.
오디오 애호가 업계의 과장된 마케팅, 신화, 그리고 전설과 상반되는 이 블로그의 주장을 믿어야 할지 확신이 서지 않는다면, 블로그 말미에 있는 참고 자료를 확인해 보세요.
"24비트의 환상" 에 대한 제 다른 블로그 글도 참고해 보시면 좋을 것입니다 .
간략한 역사:
1857년, 에두아르 레옹 스콧 드 마르탱빌(Édouard-Léon Scott de Martinville)은 음파를 그래픽으로 기록할 수 있는 포노그래프를 발명했습니다.
1877년 초, 샤를 크로스(Charles Cros)는 사진 제판 방식을 이용하여 그 과정을 역으로 적용하는 방법을 고안했습니다. 이 방법은 스타일러스로 따라 그릴 수 있는 홈을 만들어 진동을 발생시키고, 이 진동을 다이어프램에 전달하여 음파를 재현하는 것이었습니다.
1877년 말, 토머스 에디슨은 크로스의 이론을 활용하여 실린더 축음기를 발명했고, 이로써 음악 애호가들은 처음으로 집에서 녹음된 음악을 감상할 수 있게 되었습니다. 현대적인 실린더 축음기를 상상해 보세요. 접선 트래킹 방식… 아크 오차 없음… 스케이팅 오차 없음(Tangential tracking…no arc error…no skating error). 완벽한 개념이었죠.

1887년, 에밀 베를리너(Emile Berliner)는 기술적으로 열등한 디스크 축음기를 발명했습니다. 디스크는 휘어지고, 아치 오류와 스케이팅 오류가 발생했습니다. 접선 트래킹 방식의 에디슨 실린더 플레이어와는 비교할 수 없을 정도로 성능이 떨어졌습니다.
하지만 디스크는 실린더보다 생산 비용이 훨씬 저렴하고, 매장의 진열대에 깔끔하게 진열할 수 있으며, 더 큰 표지 그림과 해설을 넣을 수 있기 때문에 표준이 되었습니다. 이로써 음반 산업은 최적의 음질보다는 소비자의 편의성과 이윤 극대화에 더 치중하는 긴 역사를 시작하게 되었습니다.
디지털 혁명도 마찬가지였습니다. 필립스와 소니는 1979년 소비자용 디지털 포맷의 새로운 표준을 공동 개발했습니다. 필립스는 20cm 디스크를 원했지만, 소니는 더 작은 휴대용 기기에서 재생할 수 있는 12cm 디스크를 고집했습니다. 1980년 두 회사는 CD-DA 표준인 레드북을 발표했고, 이로써 대중적인 디지털 음악 시대가 열렸습니다. 디지털 시대 초기에는 음반 업계에서 CD가 "타협된 디스크(compromised disk)"의 약자라고 농담 삼아 부르기도 했습니다.
1980년대 초, 디지털 녹음이 보편화되면서 스튜디오들은 비용 절감을 위해 아날로그에서 디지털로 전환했습니다. 스튜디오 입장에서는 장비 비용이 절감되고, 녹음 및 보관 공간이 줄어들었으며, 후반 작업에서 믹싱과 편집이 훨씬 쉬워졌습니다. 하지만 소비자 입장에서는 큰 이점이 없었습니다. 초기 디지털 녹음은 대부분 해상도가 낮아 귀가 피로해질 정도로 자극적인 소리를 들려주었기 때문입니다.

PCM에서 DSD로의 전환도 마찬가지였습니다. 1990년대 초, 소니는 아날로그 마스터를 보관할 수 있는 미래 지향적이면서도 저렴한 매체를 원했습니다. 1995년, 그들은 아날로그 신호를 디지털로 직접 변환하여 1비트 신호를 저장하면 상상할 수 있는 모든 소비자용 디지털 포맷으로 출력할 수 있을 것이라고 결론지었습니다. (LOL ... 나중에 소니가 이 결정으로 어떻게 실수를 저질렀는지 설명하겠습니다.) 이 새로운 1비트 기술은 크리스털의 새로운 1비트 2.8MHz 비트 스트림 DAC 칩의 모니터링 핀에서 출력함으로써 구현되었습니다.
이후 소니의 소비자 사업부는 DSD 기술을 접하고 필립스와 협력하여 SACD 포맷을 개발했습니다. 물론 SACD가 구상된 시점부터 시장에 출시될 때까지 DAC 칩 제조업체들은 샘플링 속도를 64fs에서 128fs(더블 레이트 DSD)로, 비트 해상도를 1비트에서 고해상도 5비트 DSD 포맷으로 발전시켰습니다. 만약 SACD 포맷이 DSD64가 아닌 DSD128이었고, 비트 해상도가 1비트가 아닌 5비트였다면 성능 면에서 엄청난 차이가 발생했을 것입니다. 아쉽네요.
DVD, SACD, DSD 포맷이 개발되기 훨씬 전, 비트 스트림 DAC 칩은 훨씬 고가의 R-2R 멀티비트 DAC 칩을 대체하는 저렴한 대안으로 소비자 시장에 출시되었습니다. 비트 스트림 DAC 칩은 PCM 입력을 DSD로 변환한 다음 다시 아날로그로 변환하는 내장 알고리즘을 가지고 있습니다. 결과적으로 음질은 다소 떨어지지만 비용은 크게 절감할 수 있었습니다.
비트 스트림 DAC 기술 덕분에 오늘날 우리가 비디오 포맷에 내장하는 7.1채널 오디오가 개발될 수 있었습니다. 또한 이 기술 덕분에 전자제품 제조업체들은 저렴한 전원 공급 장치를 사용한 소형 케이스의 DVD 플레이어를 70달러 미만의 가격으로 출시할 수 있었습니다. 결국, 오디오 순수주의자들은 설 자리를 잃었습니다.
반면, 멀티비트 R-2R DAC 칩은 싱글비트 DAC 칩보다 제조 비용이 훨씬 많이 들 뿐만 아니라 훨씬 크고 정교한 전원 공급 장치도 필요합니다. 7.1채널 R-2R 멀티 디스크 플레이어를 제작한다면 비트 스트림 기술을 사용하는 것보다 비용이 몇 배나 더 많이 들고 크기도 몇 배나 더 커질 것입니다. 이는 분명 일반 소비자가 원하는 바가 아닙니다.
요컨대, 음반 산업은 음질에 대한 순수주의자들을 희생시키면서까지 이윤 극대화와 대중적 인기를 위한 결정을 끊임없이 내려왔습니다. 역사 수업은 여기까지입니다.
DSD 기술과 PCM 기술 비교:
PCM 녹음은 16비트 또는 24비트로 시중에 판매되며, 샘플링 속도는 44.1kHz부터 192kHz까지 다양합니다. 가장 일반적인 형식은 16비트, 44.1kHz 샘플링 속도의 레드북 CD입니다. DSD 녹음은 1비트, 2.8224MHz 샘플링 속도로 시중에 판매됩니다. 이 형식은 SACD에 사용되며 DSD64 또는 단일 속도 DSD라고도 합니다.
최근에는 DSD128, DSD256, DSD512와 같은 고해상도 1비트 DSD 포맷이 있으며, 5비트에서 8비트 델타-시그마 디코딩을 사용하는 와이드 DSD 포맷도 있는데, 이에 대해서는 나중에 설명하겠습니다. 이러한 포맷들은 녹음 스튜디오용으로 개발되었으며, 시중에 판매되는 음반 중 극히 일부만을 차지합니다.
DSD와 PCM의 해상도를 직접적으로 비교할 수는 없지만, 여러 전문가들이 비교를 시도해 왔습니다. 한 전문가들은 1비트 2.8224MHz DSD64 SACD의 해상도가 20비트 96kHz PCM과 유사하다고 추정합니다. 또 다른 전문가들은 1비트 2.8224MHz DSD64 SACD가 20비트 141.12kHz PCM 또는 24비트 117.6kHz PCM과 같다고 추정합니다.
다시 말해, DSD64 SACD는 16비트 44.1kHz 레드북 CD보다 해상도가 훨씬 높고, 24비트 88.2kHz PCM 녹음과 거의 같은 해상도를 가지며, 24비트 176.4kHz PCM 녹음보다는 해상도가 낮습니다.
DSD와 PCM은 모두 "양자화"되어 있습니다. 즉, 숫자 값이 아날로그 신호를 근사화하도록 설정됩니다. DSD와 PCM 모두 양자화 오류가 있습니다. DSD와 PCM 모두 선형성 오류가 있습니다. 또한 DSD와 PCM 모두 출력 단계에서 필터링이 필요한 양자화 잡음이 있습니다. 다시 말해, 어느 쪽도 완벽하지 않습니다.
PCM은 아날로그 신호의 진폭을 일정한 간격(모눈종이와 유사)으로 샘플링하여 인코딩하며, 각 샘플은 디지털 스텝 범위 내에서 가장 가까운 값으로 양자화됩니다. 스텝 범위는 녹음의 비트 심도에 따라 결정됩니다. 16비트 녹음은 65,536 스텝, 20비트 녹음은 1,048,576 스텝, 24비트 녹음은 16,777,216 스텝을 가집니다.
양자화에 사용되는 비트 수가 많을수록 또는 샘플링 속도가 높을수록 이론적인 해상도가 높아집니다. 예를 들어, 16비트 44.1kHz 레드북 CD는 초당 28,901,376개의 샘플링 포인트(44,100 x 65,536)를 가지고 있습니다. 반면 24비트 192kHz 녹음은 초당 32,212,254,000,000개의 샘플링 포인트(192,000 x 16,777,216)를 가지고 있습니다. 즉, 24비트 192kHz 녹음은 16비트 44.1kHz 녹음보다 이론적인 해상도가 111,455배 이상 높습니다. 결코 작은 차이가 아닙니다.
그렇다면 왜 HD 녹화 영상의 음질이 동일한 마스터를 사용한 16비트 44.1kHz 녹화 영상보다 아주 약간 나은 수준에 그치는 걸까요? 이 블로그 뒷부분에서 이론적 해상도와 실제 해상도의 차이에 대해 설명하겠습니다.
DSD는 펄스 밀도 변조(PDM) 방식을 사용하여 음악을 인코딩하는데, 이는 2.8224MHz의 샘플링 속도로 단일 비트 값을 순차적으로 저장하는 방식입니다. 이는 레드북 CD의 샘플링 속도인 44.1kHz보다 64배 빠르지만, 해상도는 16비트의 32,768분의 1에 불과합니다.


위 그림은 PCM을 이중 축 양자화 방식으로, DSD를 단일 축 양자화 방식으로 나타낸 것으로, DSD 재생 정확도가 PCM보다 클럭 정확도에 훨씬 더 의존하는 이유를 보여줍니다. 물론, 각 비트의 전압 정확도는 DSD에서도 PCM만큼 중요하므로 기준 전압의 안정화는 두 방식의 변환기 모두에서 똑같이 중요합니다.
물론 상용 DSD64 SACD 및 16비트 44.1kHz PCM 녹음보다 몇 배 높은 해상도로 이루어지는 녹음 과정 중 클럭킹의 정확도는 재생 중 DSD 또는 PCM의 클럭킹 정확도보다 훨씬 더 중요합니다.
DSD128(더블 레이트 DSD, 샘플링 속도 5.6448MHz), DSD256(쿼드 레이트 DSD, 샘플링 속도 11.2896MHz), DSD512(옥튜플 레이트 DSD, 샘플링 속도 22.5792MHz)와 같이 더 높은 샘플링 속도를 사용하는 다른 DSD 포맷도 있습니다. 대부분의 최신 A/D 및 D/A 델타-시그마 변환기는 5비트에서 8비트까지 병렬 디코딩을 통해 멀티비트 DSD를 지원합니다. 이러한 고해상도 DSD 포맷은 모두 일반 소비자용이 아닌 스튜디오용으로 개발되었지만, 일부 소규모 업체에서 이러한 포맷으로 녹음물을 판매하기도 합니다.
참고로, 더블, 쿼드, 옥토플 DSD는 44.1kHz 배수 및 48kHz 배수 샘플링 속도를 모두 지원하여 DSD64 SACD 및 44.1kHz 레드북(둘 다 44.1kHz 배수) 또는 96kHz 및 192kHz 고화질 PCM 포맷(둘 다 48kHz 배수)으로 100% 동일 분할할 수 있습니다.
물론 스튜디오에서 48kHz 멀티플 포맷을 44.1kHz 멀티플 포맷으로 또는 그 반대로 변환할 때 양자화 오류가 발생합니다. 안타깝게도 이는 DSD64 마스터를 기반으로 제작된 24비트 192kHz HD 리마스터링 버전에서 흔히 발생하는 문제입니다. 소니를 비롯한 여러 회사가 90년대 중반 아날로그 마스터를 아카이빙할 때 사용했던 방식과 유사합니다. DSD64 마스터에서 생성할 수 있는 최적의 HD PCM 포맷은 24비트 88.2kHz입니다. 88.2kHz를 초과하거나 48kHz로 나누어 떨어지는 샘플링 속도는 보간해야 하므로 음질이 좋지 않습니다. 하지만 소비자들은 예전 명곡들을 24비트 192kHz 버전으로 듣고 싶어 하기 때문에, 음반사들은 이러한 문제점을 알고 있음에도 불구하고 이를 제공하고 있습니다.
문제점:
PCM과 DSD 모두 완벽하지 못한 세 가지 주요 영역이 있는데, 바로 양자화 오류, 양자화 잡음, 그리고 비선형성(quantization errors, quantization noise, and non-linearity)입니다.
양자화 오류는 여러 가지 방식으로 발생할 수 있습니다. 디지털 녹음 초기에는 해상도가 너무 낮아서 발생하는 오류가 가장 흔했습니다. 그래프 용지의 교차점을 생각해 보세요. 비트의 소수점 단위로 양자화할 수 없고, 샘플링 속도의 소수점 단위로도 양자화할 수 없습니다. 비트 심도와 샘플링 속도의 교차점에 해당하는 값으로만 양자화할 수 있습니다. 아날로그 신호의 값이 두 양자화 값 사이에 있을 경우, 디지털 녹음은 원음의 음량을 낮추거나 높이고, 주파수를 느리게 또는 빠르게 재생성하여 원곡의 박자, 음정, 진폭을 왜곡합니다. 이로 인해 부자연스럽고 불규칙한 배음이 발생하여 초기 디지털 녹음에서 흔히 나타나는 거칠고 피로감을 주는 소리가 됩니다. 아래 그림에서 파란색 실선은 실제 음악 파형을 나타내고, 검은색 점은 가장 가까운 양자화 값을 나타냅니다.

현대의 샘플링 속도는 사람의 귀를 속일 만큼 충분히 높지만, 한 포맷에서 다른 포맷으로 변환할 때 여전히 양자화 오류가 발생합니다. 예를 들어, 소니가 1995년에 아날로그 마스터 라이브러리를 DSD64로 아카이빙하기로 결정했을 때, 이 마스터들이 미래에도 문제없이 모든 소비자 포맷을 재생할 수 있을 것이라고 생각한 것은 오산이었습니다. 사실, 이 마스터들은 44.1kHz로 나누어 떨어지는 포맷만 제대로 재생할 수 있었습니다. 따라서 DSD64 마스터 파일을 기반으로 제작된 모든 최신 96kHz 또는 192kHz 녹음에는 양자화 오류가 포함되어 있습니다.
이것이 바로 제가 음반 산업에 대해 분노하는 여러 가지 이유 중 하나입니다. 44.1kHz가 덜 중요한 오디오 주파수 대역에 에일리어싱 오류를 유발하도록 설계된 표준이었다면, 왜 48kHz의 배수를 사용하기 시작했을까요? 최신 HD 소비자 포맷으로 88.2kHz와 176.4kHz를 사용했더라면 이 모든 문제를 피할 수 있었을 겁니다. 24비트 352.8kHz 스튜디오 포맷인 DXD는 44.1kHz로 나누어떨어지는데, 도대체 어떤 멍청이가 96kHz와 192kHz HD 오디오를 끼워 넣어 이 문제를 복잡하게 만든 걸까요?
48kHz 배수를 사용하는 실제 이유는 비디오와의 최적 동기화와 관련이 있습니다. 따라서 DVD와 블루레이의 7.1채널 오디오에 24비트 96kHz 포맷과 같은 영화 사운드트랙을 내장하는 것은 타당합니다. 하지만 모든 음악 음반의 90% 이상이 레드북 CD나 DSD64 SACD처럼 44.1kHz로 판매되는 상황에서, 최적의 HD 포맷인 88.2kHz와 176.4kHz 대신 96kHz나 192kHz로 HD 음악을 제공하는 것은 다소 어불성설입니다. 그러나 순진한 소비자들은 샘플링 속도가 높을수록 음질이 더 좋다고 잘못 생각하기 때문에 192kHz가 176.4kHz보다 더 좋다고 믿고, 음반 회사들은 이를 마케팅에 활용하고 있습니다.
양자화 잡음은 불가피합니다. 어떤 디지털 포맷으로 변환하든 초음파 잡음이 발생합니다. 비트 수가 많을수록 잡음 레벨은 낮아집니다. 잡음 레벨은 비트당 약 6dB씩 낮아집니다. 따라서 1비트 DSD는 16비트 PCM보다 훨씬 더 많은 초음파 잡음을 가지고 있습니다. 이것이 바로 5비트에서 8비트 병렬 델타-시그마 디코딩을 사용하는 광대역 DSD 포맷이 개발된 이유 중 하나입니다. PCM에서는 샘플링 주파수에서 발생하는 상당한 잡음을 처리해야 합니다. 이것이 바로 소니와 필립스가 레드북 CD를 44.1kHz로 샘플링하도록 설계한 이유입니다. 이 주파수는 인간의 고주파 가청 한계인 20kHz의 두 배가 넘습니다.
PCM 녹음에는 샘플링 주파수 주변에 양자화 잡음이 존재하기 때문에, 44.1kHz 녹음에는 사람의 가청 한계인 20kHz보다 한 옥타브 높은 주파수의 양자화 잡음이 포함됩니다. 이 양자화 잡음을 제거해야 하므로 모든 DAC는 출력단에 저역 통과 필터를 갖추고 있습니다. 양자화 잡음이 가청 한계보다 한 옥타브 높을 뿐이므로, 사용되는 필터는 원하는 고주파수를 걸러내지 않도록 매우 가파른 기울기를 갖습니다. 이러한 가파른 기울기를 가진 저역 통과 디지털 필터는 일반적으로 "벽돌 벽(brick wall)" 필터라고 불립니다. 따라서 44.1kHz PCM을 88.2kHz 또는 176.4kHz로 업샘플링하여 재생하는 것이 유리할 수 있습니다.
초기 레드북 CD 플레이어의 고음역대에서 들리는 왜곡을 유발하는 "브릭 월(brick wall)" 필터에 대한 이야기를 많이 듣지만, 사실 그것은 초기 레드북 CD와 플레이어의 고음역대가 부자연스럽게 들리는 이유의 극히 일부분에 불과했습니다. 초기 디지털 음원의 거칠고 부자연스러운 고음역대는 대부분 "브릭 월" 필터 때문이 아니라 전원 공급 장치나 녹음 과정의 결함 때문이었습니다.
죄송하지만, 많은 오디오 애호가들이 믿는 것과는 달리, 어린아이 중 20kHz 이상의 주파수를 들을 수 있는 사람은 천 명 중 한 명도 채 되지 않으며, 40세 이상에서는 15kHz 이상의 주파수를 들을 수 있는 사람이 거의 없습니다.
물론 DSD64는 완전히 다른 이야기입니다. 25kHz 이상에서는 양자화 노이즈가 급격히 증가하여 훨씬 더 정교한 필터 및/또는 노이즈 셰이핑 알고리즘이 필요합니다. 아래 그림을 참조하십시오. DSD64 출력을 단순한 저역 통과 필터로 필터링하면 위상/시간이 왜곡되고 가청 주파수 대역에서 상당히 불쾌한 아티팩트가 발생합니다. 해결책은 노이즈를 가청 주파수보다 낮은 주파수 대역이나 더 높은 샘플링 속도로 이동시키는 노이즈 셰이핑 알고리즘입니다. 이것이 바로 더블레이트 DSD 및 쿼드레이트 DSD 포맷이 탄생한 이유입니다. 또한 JRiver 와 같은 고급 플레이어 소프트웨어가 더블레이트 DSD 출력을 제공하는 이유이기도 합니다. DSD64를 DSD128 또는 DSD256으로 업샘플링하는 플레이어 소프트웨어를 사용하면 디지털 아티팩트가 가청 주파수보다 높은 옥타브로 이동되어 더욱 정교한 노이즈 셰이핑 알고리즘과 덜 강력한 디지털 필터를 사용할 수 있으므로 성능이 크게 향상됩니다. 이처럼 극도로 높은 샘플링 주파수 때문에 DSD 재생에서는 PCM 녹음보다 초정밀 클럭킹이 훨씬 더 중요합니다.

지터는 클럭킹의 부정확성으로 인해 발생하는 재생 주파수의 불일치를 의미합니다. 그 결과 음악의 박자와 음정이 왜곡되는 현상이 나타납니다. 주파수 불일치 패턴은 종종 비정상적인 홀수 고조파 주파수를 가진 아날로그 파형을 생성할 수 있으며, 이는 흔히 "디지털 피로 증후군"으로 알려진 청취 피로감을 유발합니다. 아래 두 그래프에서 가로축은 시간축의 불일치를, 세로축은 진폭축의 불일치를 나타냅니다.


지터는 컨버터의 클럭 속도가 일정하지 않을 때 발생하며, 비선형성은 컨버터의 기준 전압이 일정하지 않을 때 발생할 수 있습니다. 이것이 바로 "슈퍼 클럭"이나 "펨토 클럭"과 같은 용어가 많이 사용되는 이유입니다. 클럭이 정확할수록 아날로그 출력도 더 정확해집니다. 모조 오디오(Mojo Audio)의 미스틱(Mystique) 과 같은 초고성능 R-2R DAC가 제로 크로싱에서 최상위 비트(MSB)의 전압을 조정하여 선형성을 최적화하는 방식 또한 이와 같은 맥락입니다.
순수 DSD의 신화:
마케팅 과장 광고에도 불구하고, 소비자들이 접할 수 있는 순수 DSD 녹음은 거의 없습니다. 이는 최근까지 DSD 파일을 편집, 믹싱, 마스터링할 수 있는 방법이 없었기 때문입니다. 따라서 시중에 판매되는 대부분의 순수 DSD 녹음은 후반 작업 없이 DSD로 직접 녹음된 것입니다. DSD 편집, 믹싱, 마스터링을 지원하는 새로운 스튜디오 소프트웨어 패키지가 몇 가지 있지만, 업계에서는 매우 드물고 주로 소규모 부티크 녹음 회사에서 사용됩니다. 실제로 대부분의 DSD 녹음은 PCM으로 편집, 믹싱, 마스터링된 후 다시 DSD로 변환됩니다. 아래 그림과 같은 마케팅 과장 광고 속 DSD 변환 과정은 이론상으로만 존재할 뿐입니다. 맙소사… 비밀이 탄로났네요.

순수 디지털 DSD 녹음에는 여러 세대와 음질 수준이 있습니다. 가장 음질이 떨어지는 DSD 녹음은 오래된 PCM 마스터를 사용한 것입니다. 이러한 PCM 마스터는 해상도가 낮을 뿐만 아니라 최신 PCM 녹음에 비해 양자화 오류가 훨씬 크고 선형성도 떨어집니다. 원본 마스터보다 더 나은 음질을 얻을 수는 없으므로, 이러한 DSD 녹음은 원본 저해상도 PCM 마스터와 비슷하거나 더 나쁜 음질을 제공합니다. 가장 순수한 DSD 녹음은 5비트에서 8비트 와이드 DSD(실제로는 5비트에서 8비트 병렬 델타-시그마 인코딩)로 녹음된 최신 DSD 마스터를 사용한 것입니다.

위의 흐름도에서 볼 수 있듯이, 시중에 판매되는 대부분의 DSD 녹음 파일은 후반 작업(편집, 믹싱, 마스터링)을 위해 PCM 형식으로 변환해야 합니다. 이러한 변환 과정에서 양자화 노이즈 및/또는 양자화 오류가 녹음 파일에 추가됩니다. 이러한 이유로 청취 가능한 해상도가 낮은 24비트 및 와이드 DSD 포맷이 매우 높은 샘플링 속도로 개발되었습니다. 편집, 믹싱, 마스터링 과정에서 해상도가 높을수록, 녹음 파일을 시중에서 판매되는 포맷으로 다운샘플링할 때 청취 가능한 주파수 대역의 디지털 노이즈가 줄어듭니다.
현재 와이드 DSD를 편집, 믹싱, 마스터링에 사용하는 레코딩 스튜디오 중 DSD가 사실상 구식 포맷이기 때문에 진정한 DSD로 편집, 믹싱, 마스터링할 수 있는 소프트웨어로 업그레이드할 가능성은 매우 낮습니다. 소니조차도 더 이상 DSD와 SACD를 지원하지 않습니다. 레코딩 스튜디오들이 앞으로 업그레이드할 가능성이 높은 최신 포맷은 MQA입니다. MQA는 스트리밍에 있어 DSD나 PCM보다 훨씬 뛰어난 압축률을 제공하며, 24비트 88.2kHz와 같은 PCM 포맷으로 디코딩됩니다. Qobuz 나 Tidal 과 같은 HD 음악 스트리밍 서비스들이 초고화질 콘텐츠에 MQA를 도입하는 이유도 바로 이 때문입니다. MQA 압축 기술의 등장으로 PCM은 HD 음악 포맷으로서 빠르게 자리매김하고 있습니다.
DSD와 PCM에 대한 또 다른 흔한 마케팅 오해는 블라인드 테스트에서 DSD와 PCM을 비교했을 때 PCM은 청취 피로감을 유발하고 DSD는 아날로그적인 음질을 가진다는 공통된 의견이 나왔다는 것입니다. 이는 완전히 허위 마케팅으로 밝혀졌습니다. 이러한 마케팅 거짓말이 확산된 한 가지 방법은 DSD64와 16비트 44.1kHz PCM을 같은 디스크에 담은 하이브리드 SACD를 출시한 것입니다. DSD64 트랙은 16비트 44.1kHz 트랙보다 해상도가 30배 이상 높아 DSD가 PCM보다 음질이 더 좋다는 비교를 가능하게 했습니다. 하지만 최근 블라인드 테스트 결과 고해상도 PCM과 DSD는 통계적으로 구별할 수 없다는 것이 입증되었습니다. 거의 모든 DSD 녹음이 PCM으로 편집, 믹싱, 마스터링되었다는 점을 고려하면 당연한 결과입니다.
다음으로 DAC 칩 작동 방식의 차이점이 있습니다. 대부분의 최신 DAC 칩은 네이티브 DSD를 디코딩하는 델타-시그마 방식입니다. R-2R DAC 칩은 네이티브 PCM을 디코딩합니다. 델타-시그마 DAC에서 PCM 파일을 재생하거나 R-2R DAC에서 DSD 파일을 재생하려면 파일을 실시간으로 변환해야 합니다.
대부분의 최신 델타-시그마 DAC 칩은 PCM, DSD, Wide-DSD를 포함한 여러 파일 형식을 디코딩할 수 있습니다. PCM을 디코딩할 때, 델타-시그마 DAC 칩은 먼저 이를 칩의 기본 형식인 DSD로 변환해야 합니다. DSD가 PCM보다 성능이 우수하다는 일반적인 오해는 네이티브 DSD 델타-시그마 DAC에 내장된 실시간 PCM-DSD 변환기의 품질이 좋지 않기 때문이기도 합니다. R-2R 래더 DAC 칩은 PCM 형식만 디코딩할 수 있기 때문에 일부 DAC 제조업체는 DAC 입력단에 DSD를 PCM으로 변환하는 칩이나 FPGA를 사용합니다. 하지만 어떤 R-2R DAC 칩도 자체적으로 DSD를 디코딩할 수는 없습니다.
거의 모든 경우에 DAC 칩이 디코딩하는 네이티브 포맷으로 음악 파일을 재생하는 것을 권장합니다. R-2R DAC 칩의 경우 PCM, 델타-시그마 DAC 칩의 경우 DSD입니다. 시중에는 PCM을 더블레이트 DSD로 실시간 변환하는 기능을 갖춘 플레이어 소프트웨어가 여러 종류 있습니다. HQ Player는 현재 시판되는 가장 정교한 플레이어 소프트웨어 중 하나입니다. HQ Player는 실시간 PCM-DSD 변환은 물론, DSD를 더블레이트, 쿼드레이트, 옥튜플레이트, 심지어 더 높은 레이트의 DSD 포맷으로 실시간 업샘플링하도록 설정할 수 있습니다. PCM을 DSD로 변환하고 최소 쿼드레이트 DSD로 업샘플링할 수 있는 플레이어 소프트웨어를 사용하는 것이 좋습니다.
요약:
와, 정말 놀라운 이야기네요, 그렇죠?
사람들이 PCM과 DSD 간의 음질 차이를 느낀다고 주장할 때, 이는 단순히 포맷 자체의 차이 때문이 아니라, 대부분 디지털 리마스터링 품질이나 사용하는 DAC가 디코딩하는 네이티브 포맷의 차이 때문입니다. 델타-시그마 DAC는 네이티브 DSD를 디코딩하고, R-2R DAC는 네이티브 PCM을 디코딩합니다.
대부분의 음원은 고가의 오디오 시스템보다는 차량용 스테레오나 휴대용 기기에서 최상의 음질을 내도록 제작된다는 점을 명심하십시오. 아티스트와 프로듀서들이 최종 믹스를 승인하기 전에 MP3 플레이어나 차량용 스테레오로 트랙을 들어보는 것은 잘 알려진 사실입니다.
녹음 음질은 배포 형식이나 해상도보다 훨씬 더 중요한 역할을 합니다. 하지만 이윤을 극대화하기 위해 많은 현대 음반 스튜디오 경영진은 후반 작업에서 오류를 편집하도록 요구하며, 이로 인해 원본 마스터 테이프의 음질이 크게 저하됩니다. 따라서 이러한 녹음이 어떤 형식으로 출시되든 음악은 항상 평범한 수준으로 들릴 수밖에 없습니다. 원본 마스터 테이프의 음질보다 더 나은 성능을 구현할 수는 없기 때문입니다.
반면, 제가 가장 좋아하는 디지털 음원 중 일부는 1950년대 아날로그 녹음을 디지털 방식으로 마스터링한 것입니다. 이러한 녹음들은 대부분 여러 음악가들이 한 방에서 한 번의 테이크로 트랙당 녹음하고 후반 작업 편집을 거치지 않은 형태로 이루어졌습니다. 구식 돌비 이전 시대의 60dB 다이내믹 레인지 마스터 테이프의 한계로 인해 배경 소음이 훨씬 크지만, 다른 어떤 방식으로도 재현할 수 없는 자연스러운 음색과 현장감 있는 하모닉을 고스란히 간직하고 있습니다.
참고 자료:
http://www.lavryengineering.com/lavry-white-papers/
http://www.highendnews.info/technology/oversampling_and_bitstream_metho.htm
http://www.grimmaudio.com/site/assets/files/1088/dsd_myth.pdf
http://bitperfectsound.blogspot.com/2014/12/dst-compression.html
http://www.soundonsound.com/sos/sep07/articles/digitalmyths.htm
http://www.digitalpreservation.gov/formats/fdd/fdd000230.shtml
https://en.wikipedia.org/wiki/Direct_Stream_Digital
http://hometheaterreview.com/super-audio-compact-disc-sacd/
http://en.antelopeaudio.com/blog/
http://benchmarkmedia.com/blogs/news/15121729-audio-myth-24-bit-audio-has-more-resolution-than-16-bit-audio
참고: 이 블로그에 사용된 많은 그래픽은 참고 자료에서 가져온 그래픽을 각색한 것입니다.
'Daily' 카테고리의 다른 글
| 윔앰프 프로, 수고했다! (0) | 2026.01.09 |
|---|---|
| 20년 넘은 스피커 - Britz 2100S (0) | 2026.01.08 |
| Zen Can Signature (0) | 2025.12.28 |
| Speaker Level to RCA Converter (0) | 2025.12.24 |
| 북셀프의 절대강자 ~ Polk XT15 (0) | 2025.12.19 |