2020年12月31日木曜日

動画編集者がまず最初に学ぶべき音量の問題

自分は解説動画が大好きで、毎日1本は何か無いかと世界各地を探し回っている。そこで問題がある。題材も解説も素晴らしいのに、音楽や効果音が大きすぎて耳障りで見るのをやめてしまう動画があまりに多すぎる。

デジタルデータの音量はdBFSという単位で管理される。そして、0dBFSが最大の音量であり、そこから相対値として、どれだけ音量をさげるかという調整が一般的である。

ひとまずRMSやLUFSなどコンプリミッタを使用した加工(音圧)は無視する。

解説動画に限らず、アニメや映画など発言と音楽と効果音が重なる場合、少なくとも発言を聞かせる意図ならば、発言とその他の音量差は12dB程度が望ましい。これは発言を100%とした場合、音楽が50%以下の音量である。

また、定位(Pan)という音の左右の位置も関係する。同じ音量でも、発言が真ん中で、それ以外の音が左右から聞こえるなら人間は位置関係で音声を把握しやすくなる。ただし、iPhoneやiPadのような小さく狭いスピーカだと思うほどの効果は得られないので、やはり根本的に音量を調節するのが先だろう。

音響のプロは、絶対的な音量差を作りながら、更に発言してる間だけ音楽などが小さくなる加工をしている。これらはサイドチェインやダッキングと言われるもので、映画の予告などで台詞の時だけ音楽が極端に小さくなるあれである。しかし、それは必ずしも素人向けの編集ソフトに常備されてる手段とは限らないので、まずは、絶対的な音量差を動画編集者が把握するところから始めるべき。

更に、等ラウドネス曲線に準じて、高音は聞こえやすく目立つのであえてさげる、人の声と重なる音程をさげるなど、音声認識に配慮した加工はいくらでもあり、またいくらでもやらなければならない。

誰でも動画を編集して公開できるのは素晴らしい時代だと思う。しかし、代償として無知どころか鈍感な素人が、視覚や聴覚を破壊しかねない産業廃棄物を量産してプロの仕事と同等に並んでるのが常態化しているのは明らかな問題だ。

例えば画像や映像の色や形にはちゃんと反応して、あるいは過剰反応するのに、聞こえてる音の位置(定位)や音程や音量に無頓着な人間が多すぎる。

話を戻すと、そもそも解説動画に音楽は不要であり、音声だけで聞いてる消費者に対して誘導するための効果音がささやかながらあれば良いだけ。結局のところインターネットはいつから受動的で怠惰で軽薄なメディアになったのか?に書いたように、無頓着な消費者をいかに騙して釣り上げるかが最優先とされる資本主義の商品として、以上の改善を望む事自体が間違っているのだろうか。