SSブログ

AACファイルの再圧縮 ~アトモスフィア系のようなサウンドの裏側~ [サウンド解析]

 iTMSやiPodではもうお馴染みのAACファイルについて。私は3世代目のiPodとiPod nanoを現在所有していて、nanoの方はロスレス専用にしています。3世代目のiPodは15Gなので、あと100曲くらい入れたらもう満杯です(泣)。これでもアルバムから厳選しつつチマチマと溜めてきたのに・・・。新しいのも出そうなのに60GBのを手に入れようと思案中。

 さてさて、AACファイルを一度CD-Rに焼くと、AACコーデックの再生状態でAIFFもしくはWAVのPCMオーディオファイル(実際にはcdaファイルですが)としてバックアップ可能です。これを再度AACに変換するとどうなるか!?というと、もちろん多少劣化します。

 劣化というと語弊があるか・・・。それほど顕著な変化はないので変質と言った方がいいかもしれません。

 じゃあ、再変換前のAACをPCMオーディオファイルにしたものと、再変換後のAACをPCMオーディオファイルにしたものとどれくらい変質の差があるのか調べてみることに。ただし、音楽ソースによってこの結果はかなり違うものになるので、あくまでもご参考程度に。

 曲ソースはbpm104のボーカル物。再変換前のものを位相を逆相にして再変換後のものを同時に再生してみることに。

 全く同一の音なら無音になるのですが、やはり多少変質するので音は聴こえます。

 音の特徴はというと、あくまでも漠然とした感じで実際に計測していませんが、2kHzを中心とした-6dB/octくらいのスロープのHPFを通して、さらに細かいバンド幅のフィルターバンクを動的にスウィープさせたような音がキラキラと、特に5kHzから上は顕著にキラキラ聞こえます。中低域はほとんど耳に感じることがありません。

 マーカス・ミラーの音についてもフィルターバンクについて語りましたが、あれはあくまでも静的に通すだけで周波数を可変的にスウィープさせたりしないEQ的な意味ですが、今回のフィルターバンクの動的という意味は、細かい帯域で分割された各周波数バンドをLFOによって可変的に周波数を動かしたような音、という意味でのフィルターバンクという意味です。

 で、さらにこのキラキラ感のある音は歌が聴こえている時は、ほぼ完全にボーカル部分はキャンセルされたように音が出てくるため、耳に付く部分は元のソースの忠実性を保とうとしているのが分かります。

 驚いたのは、ボーカルが無い部分だと、他に耳に付く音が今度はキャンセリングされたように、とにかく忙しく音が変わるわけです。

 ここで周波数分布がコロコロ変わっているということは、あくまでもこの実験で耳に聴こえてくる帯域が変質しているという意味なのでお間違いのないように。

 細かいフィルターを通過させて、半ばグラニュラータイプのシンセサイザーの音のようにキラキラしたサウンドはまさにアトモスフィア系(笑)。正直、良いサンプル素材にもなります(笑)。

 ただ、高音域がこれだけ聴こえているとなると、実際には変質しているであろう再変換AACが、なぜ実際にはそれほど大きな違いを感じないのかが不思議です。グラニュラー系のサウンドを連想させるということは、周波数を抽出するバンド幅がそれぞれ非常に細かく、なおかつ抽出時間が非常に短い時間で可変しながら人間の耳をごまかしながら聴かせているのだなぁとあらためて感心してしまったわけです。興味のある方は一度サンプラーに取り込んでみてください。結構良い音です(笑)。

 位相差を利用して差分を抽出した音(キラキラサウンド)は、原音と比較すると全体的にかなり音量は小さく、低域部はほとんど聴こえてきません(ソースにもよりますが)。このような位相差を利用した抽出が本来はキモなのかもしれません。人間は高域の位相差には確かに曖昧ですから。結構騙されてしまっているのだなあと実感です。