HOME > レビュー > 【海上忍のAV注目キーワード辞典】第19回:「量子化ビット数」と「サンプリング周波数」の基本

ハイレゾ音源の重要ワード

【海上忍のAV注目キーワード辞典】第19回:「量子化ビット数」と「サンプリング周波数」の基本

2013/02/07 海上 忍
  • Twitter
  • FaceBook
  • LINE

【第19回:ハイレゾ音源】

■「ハイレゾ音源」とは

ハイレゾ音源とは「High Resolution」、すなわち解像度の高い音源のこと。明確な定義はないものの、デジタルかつCDを上回る情報量の音楽ソースを指すことが一般的だ。CDの仕様はサンプリング周波数が44.1kHZ、量子化ビット数が16ビットであり、それを上回る水準の音源が広義のハイレゾ音源と考えて差し支えない。ただし、ハイレゾ音源を扱う音楽ダウンロードサイトの水準を見ると、サンプリング周波数が96kHz以上、量子化ビット数が24ビット以上のものを「ハイレゾ音源」と呼ぶことが多いようだ。

e-onkyo musicやKRIPTON HQM STOREなどのハイレゾ音源配信サイトが存在している

ハイレゾ音源は、それ以下の水準の音源(CDや圧縮音源)に比べデータ量がはるかに多い。44.1kHz/16ビットのCDと比較すると、96kHz/24bitは約3倍、192kHz/24bitは約6.5倍のデータ量となる。ファイルサイズに置き換えていえば、音楽CDクオリティの曲が10メガバイトだったとすると、96kHz/24bitは30メガバイト、192kHz/24bitは65メガバイトということになる。

そのファイルサイズの大きさゆえに、ハイレゾ音源は再生環境を選ぶ。96kHz/24bitの音源でも、容量が数ギガバイト程度のポータブルオーディオでは、十数曲も保存すれば容量が不足してしまう。データ量がその2倍以上となる192kHz/24bitはなおのこと。96kHz/24bitの曲を再生できるポータブルアンプなど、ハイレゾ対応を標榜した携帯型再生機器も増えつつあるが、まだ現状では自宅で楽しむリッチな音楽ソースであると言えるかもしれない。

最大192kHz/24bit音源再生に対応するiriverブランド“Astell&Kern”「AK100」

サウンドファイルが圧縮されているかどうか、という違いもある。音楽の圧縮技術には、高域音など一部のデータをカットすることで高い圧縮効果を得る「非可逆(ロッシー)圧縮」と、理論的には損失がなくオリジナルの情報を維持する「可逆(ロスレス)圧縮」の2種類があるが(関連記事:連載第11回「可逆圧縮(ロスレス)」)、高音質が大命題となるハイレゾ音源の場合、前者という選択肢は考えにくい。むしろ、符号化を伴わない無加工のデータ(PCM)が指向され、ロスレスは許容範囲、という雰囲気が強い。

■「量子化ビット数」と「サンプリング周波数」

ハイレゾ音源では、サンプリング周波数を見れば、時間に対しどれだけ細かく音を計測(サンプリング)しているかがわかる。CDの44.1kHzとは1秒間に44,100回サンプリングしているという意味で、96kHzならば9,6000、192kHzならば192,000のデータを持つことになる。

そのデータで再現可能な最高の周波数は「ナイキスト周波数」と呼ばれ、サンプリング周波数の半分となる。逆にいえば、10,000Hzまでの周波数を含む信号は、最高周波数の2倍の20,000Hzでサンプリングすれば、元の波形を復元できる、つまりオリジナルに近い音を再現できることになる。音楽CDのサンプリング周波数は44.1kHzなので、理論的には22,050Hzまでの音を記録可能というわけだ。

ハイレゾ音源のサンプリング周波数は、96kHzや192kHzなどとCDに比べてはるかに高い水準に設定されている。人間の可聴域は20Hzから16,000Hzあたりとされているが、その範囲を大きく超えてサンプリングしたデータを持つことで、録音したホールの雰囲気やボーカリストの息づかいなど、音のディテールや臨場感を再現することが可能になるのだ。

「量子化ビット数」も重要な意味を持つ。ビット数が大きいほど情報の解像度(分解能)が増し、それだけ各音の細かい描写が可能となるからだ。有り体にいえば、ビット数が大きいほど解像感が高い緻密な音を楽しめることになる。

たとえば、1ビットでは「0か1か」の2段階でしか表現できないが、2ビットでは「00」と「01」、「10」と「11」の4段階を表現でき、そのぶん微細な表現が可能になる。4ビット(16段階)、そして8ビット(256段階)と増すごとにその桁数は多くなり、16ビットでは65,536段階になる。それが24ビットでは16,777,216段階、そのぶん音の振幅を細やかに記録/再現できるようになるというわけだ。

音の波形データで扱える最大音と最小音の比率(ダイナミックレンジ)は、量子化ビット数で決まる。リニアPCMの場合、ビット数に対し2倍の音圧比に相当する6dB(正確には6.02)を乗じると、有効なダイナミックレンジを得られるのだ。具体的には、量子化ビット数が16ビットならば96dB、24ビットならば144dBとなる。人間の聴覚が持つダイナミックレンジは120dB程度といわれているため、ハイレゾ音源ならば微小な音から強大な音まで、幅広く対応できることになる。ハイレゾ音源でホールの雰囲気や楽器の余韻を感じられるのは、このダイナミックレンジの高さにも理由があるのだ。

この記事をシェアする

  • Twitter
  • FaceBook
  • LINE