SONY α1の動画性能を分かり易く解説する
2021/02/09:発行
はじめに
ソニー初のフラッグシップ機となるSONY α1が発表されました。
8K動画に対応したSONY α1
早速EOS R5の動画性能と比べてみようと思ったのですが、XAVC HS 8K だの、AVC/H.264だの10bit 4:2:0 だの、Long GOPだのと、聞き慣れない単語だらけで、何が何だかさっぱり分かりません。
そんな訳で、α1のスペック表を元にこれらの単語を分かり易く整理してお伝えしたいと思います。
これからカメラを使って動画を撮ってみたいと思われる方は、必見です。
α1の動画性能
先ずはソニーの公式HPから、α1の動画の説明を抜き出してみます。
これを他社機とも比較できる様に、代表的な動画撮影モードである8K60P、4K120P、4K60Pを抜き出してまとめたのが、以下の表になります。
種類 | 8K30P | 4K120P | 4K60P |
動画サイズ (画素数) |
8K UHD (7680×4320) |
4K UHD (3840×2160) |
4K UHD (3840×2160) |
ガンマ補正 | S-Log1,2,3、Movie、Still、ITU709、HLG2等 | ||
撮影範囲 (クロップ) |
8.6K オーバーサンプリング |
10%クロップ | 全画素 |
カラーサンプリング | 4:2:0 | 4:2:2 4:2:0 |
4:2:2 4:2:0 |
ビット深度 | 10bit | 10bit | 10bit |
記録フォーマット | XAVC HS | XAVC HS XAVC S |
XAVC HS XAVC S XAVC S-I |
フレーム内圧縮 | H.265 | H.265 H.264 |
H.265 H.264 |
フレーム間圧縮 | Long GOP | Long GOP | All I Long GOP |
ダイナミックレンジ | 15+ストップ(S-Log3時) | ||
HDMI出力 | 4:2:0 8bit | 可 | 可 |
プロキシー動画 | FHD(1920×1080) HD(1280×720) |
FHD(1920×1080) HD(1280×720) |
N/A |
連続撮影時間 | 30分 | 不明 | 不明 |
この表を上から順番に見ていけば、α1の動画性能を完全にご理解頂けると思います。
動画サイズ
先ずは動画サイズです。
ここで呼ぶ動画サイズとは、動画の縦横の画素数と思って頂ければと思います。
UHDTVにおけるモニターの解像度(画素数)
当然ながら、8K動画も4K動画も縦横の画素数は決まっているのですが、ややこしい事にこの8K、4Kと呼ばれるものには、実は2種類存在するのです。
それが、下の表にありますITU(International Telecommunication Union)規格とDCI(Digital Cinema Initiatives)規格です。
サイズ\規格 | ITU | DCI |
8K | 8K or 8K UHD 16:9 (4320x7680) |
8K DCI 17:9 (4320x8192) |
4K | 4K or 4K UHD 16:9 (2160x3840) |
4K DCI 17:9 (2160x4096) |
我々が普段目にするテレビやモニターは全て表左側のITU規格のもので、単に4K(8K)もしくは4K UHD(8K UHD)と呼ばれます。
ULTRA HD(High Definition)との記述がある見慣れた4K動画のマーク
一方それとは別に、ハリウッドのシネマ業界が作ったITU規格より横長の4K DCIとか8K DCIと呼ばれるサイズがあるのです。
ちなみにSONY α1の場合、ITU規格にのみ対応していますが、キヤノンのEOS R5は両方の規格に対応しています。
ガンマ補正
次はガンマ補正です。
ガンマ補正とは、本来画像信号の入出力レベルの関係はリニア(直線)が理想なのですが、入出力機器の都合やら、画像の用途によって下の図の青線や赤線の様に非直線にする事です。
最近よく耳にするLog撮影とかLog収録というのは、このガンマ補正の一つに当たります。
撮影範囲(クロップ)
撮影範囲とは、下の図にあります様に動画撮影時に写せる範囲になります。
横長の動画は静止画の上下がカットされる
写真の縦横比は3:2なのに対して、動画の縦横比は16:9(DCIの場合17:9)になりますので、横幅が同じであれば必然的に上下はカットされる事になります。
とは言え、上の図の場合水平方向の画角は静止画と変わりませんので、動画の撮影範囲としてはこれが理想形です。
ところが画像処理の都合で、動画の種類によっては以下の様にクロップされる事があります。
α9の動画撮影範囲
α1の特徴説明によれば、8K動画時は8.6Kのオーバーサンプリングとありますので恐らく水平方向はクロップされていないと思われますが、クロップ無しとは書かれていませんので、念のために操作性説明書で確認した方が良いかもしれません。
カラーサンプリング
カラーサンプリングとは、色情報の間引き方を表しており、4:2:0とか4:2:2とか書かれているアレです。
静止画の場合、色をRGBの3色で表すのが一般的ですが、動画の場合YCbCrと呼ばれる輝度(Y)、青方向色相(Cb)、赤方向色相(Cr)の順に表します。
CbCrで表した色表現マップ
なお上の図にあります様に、青方向色相(Cb)、赤方向色相(Cr)と言っても色を表す縦横の座標軸を表しているのであって、青っぽい色とか赤っぽい色を指している訳ではない事にご注意願います。
そして、4:4:4とはこの三つの色情報が隣接する4画素(1ブロック)全てにあるのに対して、4:2:2とは輝度情報(Y)は4画素分あるものの、青方向色相(Cb)と赤方向色相(Cr)の情報は2画素分しかない、すなわち半分に間引かれているという事を指します。
これを表にすると以下の様になります。
種類 | 内容 |
4:4:4 | 隣接する4画素の色情報を間引かず全て記録する方式。 |
4:2:2 | 一般的な業務用ビデオに採用されている方式。 4:4:4に対して輝度情報以外は半分に間引かれるのでデータ量は1+1/2+/1/2=2になり、4:4:4(1+1+1=3)に比べてデータ量は2/3になる。 |
4:2:0 | 家庭用ビデオで一般的な方式。 4:2:0と聞くと赤方向色相の情報が無い様に思ってしまうが、実際には青系と赤方向色相の情報を半分に間引き、更にそれを交互に記録している。 このためデータ量は1+1/2+0=3/2になり、4:4:4(1+1+1=3)に比べてデータ量は半分になる。 |
4:1:1 | DVで採用された方式。 4:2:0と同様に、4:4:4に対してデータ量は半分になる。 |
この間引きはデータ量を一気に2/3とか半分にするので、さぞかし画質は低下するだろうと思われるかもしれませんが、人の視覚は輝度の変化に敏感で色の変化には鈍感である事から、殆ど劣化は気になりません。
誰が考えたか知りませんが、ウマイ手を考えたものです。
なおブロックの大きさは異なりますが、静止画のJPEGファイルも同じ手法でデータの圧縮を行なっています。
また色信号を間引くと聞くと、何となく色味が変化する様な印象を持ちますが、実際は色が大きく変化する部分の解像度が低下する事になります。
このためクロマキーの様に背景から人物を抜き取る場合には、4:2:0より4:2:2の方が綺麗に抜き取る事ができます。
また動きの激しい動画や、色の変化の大きな動画は間違いなく4:2:2の方が有利ですが、そうでなければ4:2:0でも殆ど問題ありません。
α1の場合、8K動画は4:2:0で、4K動画は4:2:2に対応しています。
ビット深度
ビット深度とは撮像素子で読み込んだ電気信号をA/D変換した際のビット数を表します。
ですので、ビット数が多いほど諧調性が滑らかになります。
ビット数が多いほど諧調性が滑らかになる
実際、上の図をご覧頂きます様に、4ビット(8諧調)や5ビット(16諧調)では濃度の変わり目が分かりますが、8ビット(256諧調)になると滑らかになっているのが分かります。
ですので、10ビット(1024諧調)になれば、8ビットより4倍諧調が滑らかになります。
かと言って、ビット数を徒(いたず)に増やしても、上の様に黒と白の濃度が決まっている場合、見た目は全く変わらずにデータ量だけが増えていく事になります。
このため今のカメラやモニターの性能からすれば、8bitもあれば十分だと思って間違いありません。
もし更に諧調性を豊かにしたいのでしたら、単にビット数だけを増やすのではなく、カメラが取り込める明るさの幅(ダイナミックレンジ)も拡げる必要があります。
記録フォーマット
記録フォーマットは動画の記録形式を指します。
静止画におけるRAWファイルとJPEGファイルの様なものだと思って頂ければと思います。
ソニーの場合、下の表の様にXAVC SやXAVC HSとかありますが、いずれもソニー独自の規格(ただしファイル形式はMP4)です。
記録方式 | 特徴 | 用途 |
XAVC HS 8K/4K |
圧縮効率の高いHEVC(H.265)コーデックを使用しており、XAVC S方式と比べると同じデータ容量でより高画質の動画を記録可能。 映像の圧縮にLong GOPを採用。 |
視聴用 |
XAVC S 4K/FHD |
業務用の動画用フォーマットXであるAVCをベースに、一般向けに取り扱いやすいMP4形式で記録するために開発されたフォーマット。 映像の圧縮に、H.264とLong GOPを採用。 |
標準 |
XAVC S-I 4K/FHD | 映像の圧縮にIntra圧縮方式を採用しており、Long GOP圧縮に比べて編集に適する。 | 編集用 |
注:Intra/Long GOPは映像圧縮方式です。映像の圧縮を1フレーム毎に行っているのがIntra圧縮で、圧縮を複数フレームにまたがって行うのがLong GOP圧縮です。編集時のレスポンスや自由度はIntra圧縮の方が優れていますが、圧縮効率はLong GOP圧縮の方が優れています。 |
名称から察するに、XAVCとはeXtremely Advanced Video Codingでしょう。
他社と同じ汎用性の高いMP4フォーマットに統一すれば良いのにと思うのですが、作った以上意地でも使い続けるのかもしれません。
昔からソニーは独自規格が大好きで、ビデオのベータでVHSに負け、iPodが出てもMDプレーヤーにこだわり続け、更にはSDカードが普及してもメモリースティックを使い続けたのを思い出します。
フレーム内圧縮(動画コーデック)
フレーム内圧縮とは、MPEG-4 AVC/H.264とかMPEG-H HEVC/H.265とか呼ばれる、意味不明のあれです。
通常は動画コーデックと呼ばれますが、本書では分かり易い様にフレーム内圧縮と呼ぶ事にします。
このMPEG-4 AVCとかMPEG-H HEVCと言うのは、国際標準化機関のひとつであるITU-Tにおける呼び名で、一方H.264とかH.265というのはISO/IECにおける呼び名で、両者が共同で策定したので中身は全く同じ物です。
3大国際標準策定機関
この3組織が共同で策定したので、各カメラメーカーも敬意を表して、長い名称を使っているという訳です。
当然ながら日本政府も日本の民間企業も、この規格の策定に関わっています。
ついでにお伝えしますと、MPEGとは、ISO/IECのMoving Picture Experts Groupを指し、 AVCがAdvanced Video Coding、HEVCがHigh Efficiency Video Codingの略になります。
これで、この意味不明な長い名称のいわく因縁について、何となくご理解頂けましたでしょうか。
そんな訳で本書では、この二つを短くH.264とH.265と呼ぶ事にします。
前置きがすっかり長くなってしまいましたが、ではこの二つがどう違うかと言えば、H.264は1フレーム(1画面)内で扱う圧縮用ブロックの大きさは16x16ピクセルに固定なのに対して、H.265は最小8x8ピクセルから最大64x64ピクセルまで可変できます。
このため、色の変化の大きい個所(上の図のバイクやヤシの木の葉っぱ部分)は、従来より小さなブロックとして扱かえるので、よりきめ細かな表現が可能になります。
一方、同じ色の領域(青い空の部分)は大きな1ブロックとして扱えるので、データ量の削減が可能になるという訳です。
結果的にH.265は、H.264に対して画質は向上しながらデータ量は概ね半分になります。
またH.264は4Kまでしか対応していないため、8K動画は必然的にH.265になります。
ちなみに前述しましたカラーサンプリングの間引きとどう違うかと言いますと、以下の様になります。
カラーサンプリング | フレーム内圧縮 |
隣接する4画素内で間引き。 | H.264の場合、256(16x16)画素内で圧縮。 H.265の場合、64(8x8)画素から4096(64x64)画素内で圧縮。 |
カラーサンプリングとフレーム内圧縮の違い
なおWin10でH.265で圧縮された動画を見るためには、MSから「HEVCビデオ拡張機能」を120円で購入する必要があります。
ただしPCの処理能力によっては、コマ落ちする事が良くあります。
フレーム間圧縮
前述したカラーサンプリングとフレーム内圧縮は、1フレーム(1画面)内の間引きもしくは圧縮でしたが、次はフレーム間の圧縮です。
この場合、3枚の画像の中で見比べて画像が変化していない部分はそのままで、変化している部分(下の図の濃い部分)だけを記録すれば、データ量を大幅に削減できます。
これをソニーでは、Long GoPと呼び、キヤノンではIPBと呼ぶ様です。
一方フレーム間圧縮をしないのをAll-Intraと呼び、データ量が多くなるものの、画質はLong GoPより多少良くなりエンコードしないで済む分編集が楽になります。
どちらが良いかと言えば、視聴するだけならLong GoPやIPBで、後で編集したいのならばAll-Intraという訳です。
まとめ
それではまとめです。
①動画には一般的なITU規格(16:9)と、それより横幅の広いシネマ用のDCI規格(17:9)がある。
②Log撮影とは、ガンマ補正の一つである。
③動画の撮影範囲は、静止画の横幅と一致するのが理想ではあるが、画像処理の関係でクロップされる場合がある。
④4:2:2とか4:2:0と呼ばれるのは、カラーサンプリングの方法を表しており、4:2:0より4:2:2の方が色の境界が滑らかに表現される。
⑤ビット深度とは、撮像素子で読み込んだ電気信号をA/D変換した際のビット数を表し、数値が大きいほど諧調が滑らかになる。
⑥記録フォーマットとは動画の記録形式を指しており、ソニーの場合XAVC Sが標準、XAVC HSが視聴用、XAVC S-Iが編集用と言える。
⑦H.264とかH.265と呼ばれるのは1フレーム内の圧縮方法を示しており、H.265の方が圧縮率が高い上に画質は良いが、再生するPCに負担が掛かる。
⑧Long GoPとかAll-Intraと呼ばれるのは、フレーム間圧縮をするかしないかを示し、当然Long GoPの方がデータ量が少なくなるものの、編集に時間が掛かる。
この様な説明で、少しはお役に立ちましたでしょうか。