技術解説 - 映像品質評価法

映像品質評価法

まえがき
1. 映像品質の主観評価法
1.1. 映像品質に影響を与える要因
1.2. 映像品質劣化の知覚
1.3. 主観評価法の国際標準化
1.4. 主観評価の実験条件
(1) 評価環境
(2) 評価映像
(3) 評価者
1.5. 代表的な主観評価法
(1) ACR法 (Absolute Category Rating)
(2) ACR-HR法 (Absolute category rating with hidden reference)
(3) DCR法 (Degradation Category Rating)
(4) PC法 (Pair Comparison)
(5) DSCQS法 (Double Stimulus Continuous Quality Scale)
(6) SSCQE法 (Single Stimulus Continuous Quality Evaluation)
(7) SAMVIQ法 (Subjective Assessment Methodology for Video Quality)
2. 映像品質の客観評価法
2.1. 客観評価の必要性
2.2. 従来の客観評価尺度
2.3. 客観評価法の分類
2.4. 客観評価法の国際標準化動向
(1) 標準化組織
(2) 映像品質客観評価モデル
おわりに

まえがき

IP ネットワークのブロードバンド化や映像符号化／映像信号処理技術の発展に伴い、映像配信サービスやテレビ電話サービス等の映像通信サービスが普及してきています。お客様に経済的かつ快適な映像通信サービスを提供するためには、サービス提供前の品質設計及びサービス提供中の品質管理が重要です。これを実現するためには、サービスを利用するお客様が体感する品質（QoE: Quality of Experience）を効率的に評価する手法が必要となります。

映像通信サービスの品質評価は、人間が品質を判断する主観品質評価が基本となりますが、品質評価・設計の効率化や品質監視・管理への適用のためには、映像通信サービスに関する物理的な特徴量からQoE を推定する客観品質評価技術が有効です。

本解説ページでは、デジタル映像に対する代表的な主観品質評価技術と客観品質評価技術について説明していきます。

1. 映像品質の主観評価法

本章では、映像品質の主観評価法について説明します。

1.1. 映像品質に影響を与える要因

映像通信サービスの品質に影響を与える要因は、素材映像の品質要因からユーザ端末の品質要因まで様々な要因が存在します。映像配信サービスを例として、主要な映像品質劣化の要因を図1.1.1に示します。

素材映像の品質要因には、映像撮影条件（フォーカス、明るさ、コントラスト等）やカメラ性能等があります。次に、この素材映像を符号化しますが、ここでは、符号化方式（MPEG2、MPEG4、H.264等）として何を使うのか、どのような符号化パラメータで符号化するのかが品質を左右します。符号化パラメータの具体例としては、符号化ビットレート（映像信号の圧縮率）、空間解像度（VGA、QVGA、CIF、QCIF等）、時間解像度（フレームレート）等があります。符号化した映像データをIPネットワークで伝送する際には、ネットワークが輻輳することによってIPパケットの転送遅延時間が揺らいだり、IPパケットが欠落（パケット損失）し、映像品質を低下させる要因となります。最後に、ユーザ端末では、復号処理、端末やディスプレイ能力等により実現される映像品質は影響を受けます。

1.2. 映像品質劣化の知覚

次に、各種品質要因がどのような映像品質劣化としてユーザに知覚されるかについて述べます。

従来のテレビ放送等のアナログ映像では、品質劣化の発生は定常的であり、徐々に品質が低下したのに対して、デジタル映像では、品質劣化は空間的・時間的に非定常に発生し、一旦乱れ（破綻）、途切れ、停止等の異常が発生すると、極端な劣化が起こるのが特徴です。表1.2.1に示すように、映像通信サービスの品質を劣化させる要因は、空間的ひずみと時間的ひずみに大別されます。空間的ひずみは画質や画面解像度の低下を引き起こすものであり、モザイク状に発生する歪（ブロック歪）の発生が代表的・特徴的な品質劣化です。また、時間的ひずみはフレームレートの低下やフリーズが代表例であり、映像の動きの滑らかさが失われ、ギクシャクして見えるのが特徴的な品質劣化です。さらに、映像の乱れ（破綻）など、時空間的に発生するひずみも存在します。

表1.2.1 代表的な映像品質劣化
歪の種類		劣化の見え方	符号化劣化	伝送劣化
空間的ひずみ	解像度低下・ぼけ	細かい模様や輪郭がぼけ、精細度が低下	○
	ブロック歪	モザイク・幾何学パターンの歪	○	○
	偽輪郭	明るさや色が緩やかに変化する部分に生じる偽の輪郭	○
時間的ひずみ	ジャーキネス	動きの滑らさが失われ、ギクシャクして見える	○	○
	フリッカ	輝度レベルが変動し、ちらついて見える	○
	動きぼけ	動いている領域がぼけて見える	○
	途切れ／フリーズ	再生が途切れる／画面が停止する		○
時空間的ひずみ	モスキートノイズ	エッジや色の変化の激しい部分で起こるノイズ（蚊が飛び回るように見えるノイズ）	○
	エッジビジネス	エッジ部分がザラザラして、ちらついて見える	○
	乱れ（破綻）	画面の一部または全体的に原形を留めない程の歪		○

1.3. 主観評価法の国際標準化

映像通信サービスのQoEを評価する最も基本的な手法が「主観品質評価法」です。主観品質評価法は、人間が映像の刺激を受けて、個々人の主観的判断に基づいて品質評価を行う視覚心理実験であり、評価映像の提示方法や適切な評価尺度の選択、観視環境の調整などの実験計画立案・実施において、専門知識や評価設備が必要となります。

このため、国際標準化機関であるITU（International Telecommunication Union）では、再現性のある品質評価結果を得ることを目的として、観視環境や観視条件を規定し、映像の主観品質評価に係わる方法論を勧告化しています。映像品質評価法に関する主要なITU-T/R勧告の一覧を表1.3.1に示します。ITU-R（Radiocommunications Sector）勧告BTシリーズにおいてTV映像の主観品質評価法が整備され、これを通信用途（ケーブルTV用／マルチメディア用）にも適用したITU-T（Telecommunication Standardization Sector）勧告J/Pシリーズが存在します。

表1.3.1 映像品質の主観評価に係わる主要なITU勧告
勧告番号	タイトル
BT.500	TV映像品質の主観評価法
P.910	マルチメディアアプリケーション映像の主観品質評価法
J.140	デジタルケーブルTV映像の主観品質評価法
BT.710	HDTV映像の主観品質評価法
BT.1129	SDTV映像の主観品質評価法
BT.802/BT.1210	主観評価で用いる標準映像

1.4. 主観評価の実験条件

再現性のある品質評価結果を得るためには、評価環境等の実験条件を規定する必要があります。ここでは、評価環境、評価映像、評価者について説明します（評価手法については次節でふれます）。

(1) 評価環境
(2) 評価映像
(3) 評価者

(1)評価環境

映像品質を評価する際の周辺環境（観視条件）は、ITU-R BT.710やBT.1129等で規定されています。主な条件を表1.4.1に示します。このため、評価実験ではこれらの環境を実現できる専用の部屋（品質評価ブース）が必要になります。評価の邪魔にならないよう、外部騒音を遮断できること（騒音30dBA以下）も重要です。図1.4.1は、HDTV映像の品質評価実験の風景です。

表1.4.1 観視条件(ITU-R BT.710からの抜粋)
項目	値
視距離（距離／画面高）	3
モニタのピーク輝度	150～250 cd/m²
ビームカットオフ状態での管面輝度のピーク輝度に対する比	≦0.02
完全暗室内での黒レベルの輝度の白ピークの輝度に対する比	約0.01
モニタ背景輝度の画像のピーク輝度に対する比	約0.15
その他の場所の室内照明	低いこと
背景の色度	D₆₅
上記仕様を満たす背景の立体角	53度(高)×83度(幅)
評価者の配置	画面中心から±30度以内
モニタサイズ	30インチ以上

(2)評価映像

符号化映像の品質は、映像コンテンツの絵柄（精細度）や動き量に依存します。このため、例えば、各種符号化方式の実現品質を比較評価するためには、同じ評価映像を用いることが必要となります。このため、精細度や動き量、カメラワーク等、様々な映像の特徴量を考慮した評価映像セットが国際標準化でも規定されています。

例えば、我々のプロジェクトでHDTV映像の品質評価を実施する場合、ITU-R BT.1210に規定され、映像情報メディア学会から刊行されている標準動画像を多く用いています。当該動画像は全部で70種類あり、利用目的に応じて総合画質評価用21種類、特定項目評価用49種類に分かれています。

(3)評価者

同じ映像を観視した場合でも、個々人が体感する品質（主観品質）は様々です。評価結果のばらつきを少なくするために、１つの映像について多くの評価者の採点が必要になります。ITU-R勧告BT.500-11では、評価者は15名以上の非専門家（日常業務としてTV映像の画質に関わる業務に従事しておらず、評価経験が豊富でない人）とすることと規定されています。私たちは１回の主観品質評価実験に対して通常24名以上の評価者の方々に評価試験へのご協力をお願いしています。

1.5. 代表的な主観評価法

ここでは、デジタル映像品質評価で用いられる代表的な主観評価方法を説明します。

(1) ACR法 (Absolute Category Rating)
(2) ACR-HR法 (Absolute category rating with hidden reference)
(3) DCR法 (Degradation Category Rating)
(4) PC法 (Pair Comparison)
(5) DSCQS法 (Double Stimulus Continuous Quality Scale)
(6) SSCQE法 (Single Stimulus Continuous Quality Evaluation)
(7) SAMVIQ法 (Subjective Assessment Methodology for Video Quality)

(1)ACR法 (Absolute Category Rating)

ITU-T勧告P.910で規定されるACR法は単一刺激法（Single Stimulus Method）とも呼ばれ、通信サービスの品質評価に最も広く用いられる評価法の1つです。図1.5.1に示すように、ACR法では評価者は10秒程度の評価映像を観視した後、続く10秒以内に表1.5.1に示す5段階品質尺度により評価を行います。評価結果は評価者の各カテゴリへの投票率を評点で重み付けした「平均オピニオン評点（MOS: Mean Opinion Score）」で表します。映像品質評価値がその前に観視した映像の品質に影響を受ける順序効果がある（非常に悪い品質の映像を観視した後に軽微な品質劣化の映像を観視すると良いと評価されたり、逆に非常に良い品質の映像を観視した後に軽微な品質劣化の映像を観視すると悪いと評価されたりする）ため、評価映像の提示順序をランダマイズして評価者毎に変化させたり、異なる提示順序で繰り返し評価するなどの対処が必要となります。

ACR法では品質評価基準が存在しないため、評価結果は実験で取り扱う評価映像の品質の変化範囲（評価実験の枠組み）に強く影響を受けます。そのため、異なる評価実験の結果を比較評価する際には注意が必要です。複数機関でACR法による評価を実施する際には、予め各機関で品質の変化範囲を統一する等の対処が施されています。

表1.5.1 5段階品質尺度
評点	評定語
5	非常に良い（Excellent）
4	良い（Good）
3	普通（Fair）
2	悪い（Poor）
1	非常に悪い（Bad）

ここで、MOSによる品質指標例について説明します。ACR法で得られたMOS特性の例を図1.5.2に示します。MOS＝3.5という値は、「3：普通」以上と評価する人の割合が約90％となります。逆に言うと、「2：悪い」以下と評価する人の割合は約10％となります。このため、MOS≧3.5を満足させるようにサービス品質を設計することにより、品質が悪いと感じる人を10％以下に抑えることができます。また、MOS＝2.5という値は、「3：普通」以上と評価する人の割合が約50％、あるいは「2：悪い」以下と評価する人の割合が約50％となる値です。このMOS＝2.5を「許容限」と呼ぶこともあります。

(2)ACR-HR法 (Absolute category rating with hidden reference)

ITU-T勧告P.910で規定されるACR-HR法は、評価に用いる映像のコンテンツの違いが評価値に与える影響を取り除くため、ACR法で得られた評価結果に対して評価映像と基準映像（レファレンス映像）の評点の差を次式により算出・評価する手法です。評価値はDMOS(differential quality score)と表現します。

DMOS＝｛評価映像の評点｝－｛基準映像の評点｝＋5

但し、基準映像の品質は、映像品質関連業務に従事するエキスパートが「5点：非常に良い」あるいは「4点：良い」と判断する品質であることと定められています。

映像品質客観評価手法を検討しているVQEG（Video Quality Experts Group：映像品質専門家会合）においても、本評価手法が度々用いられています。

(3)DCR法 (Degradation Category Rating)

ITU-T勧告P.910で規定されるDCR法では、図1.5.3に示すように、品質評価の基準となるレファレンス映像と評価映像を対にして評価者に提示し（共に10秒程度）、続く10秒程度の時間内に表1.5.2に示す5段階妨害尺度により評価を行います。品質評価の最初に必ずレファレンス映像を観視し、この映像品質を基準として続く評価映像の品質を評価することから、ACR法で見られる順序効果がある程度抑えられます。評価結果はACR法と同様に平均オピニオン評点で表しますが、ACR法で導出したMOSと区別するため、DMOS（Degradation MOS）と呼ばれることがあります。

DMOS評価では評価の比較対象が存在するため、ACR法に比べて劣化がより敏感に評価されます。そのため、比較的劣化が小さい評価対象系の評価ではACR法よりもDCR法の方が適していると言えます。ただし、DMOS評価では１つの評価対象の品質を評価するのに2つの映像の観視が必要なため、同じ条件数の評価値を得るためにはACR法の約2倍の時間を要します。DCR法では、DMOS＝4.5を「検知限」、DMOS＝3.5を「許容限」、DMOS＝2.5を「我慢限」として品質の基準を与えることがあります。

なお、DCR法は、二重刺激妨害尺度法（DSIS法：Double　Stimulus　Impairment　Scale　Method）、もしくはEBU(European Broadcasting Union) 法とも呼ばれます。

表1.5.2 5段階妨害尺度
評点	評定語
5	劣化が認められない（Imperceptible）
4	劣化が認められるが気にならない（Perceptible, but not annoying）
3	劣化が認められ、わずかに気になる（Slightly annoying）
2	劣化が認められ、気になる（Annoying）
1	劣化が認められ、非常に気になる（Very annoying）

(4)PC法 (Pair Comparison)

ITU-T勧告P.910で規定されるPC法では、図1.5.4に示すように、評価映像を“対”にして評価者に提示し（共に10秒程度）、後者の評価映像の品質を前者のそれと比較し、続く10秒以内にどちらの評価映像の品質が良かったかを判断したり、表1.5.3に示す7段階比較尺度等により評価を行ったりします。どちらを先に観視して評価するかにより評価結果に順序効果が現れるため、同じ評価映像の対を用いた評価でも、提示順序を変えて評価を行うことが望まれます。PC法では評価映像同士を直接比較して評価するため、細かい品質の差を検出することが可能となりますが、品質評価結果が相対評価値として得られることや、ACR法やDCR法よりも多くの評価時間を要する（評価映像の組合せの数が多い）といった特徴があります。

表1.5.3 7段階比較尺度
評点	評定語
-3	非常に悪い（Much Worse）
-2	悪い（Worse）
-1	やや悪い（Slightly Worse）
0	同じ（About the Same）
+1	やや良い（Slightly Better）
+2	良い（Better）
+3	非常に良い（Much Better）

(5)DSCQS法 (Double Stimulus Continuous Quality Scale)

ITU-R勧告BT.500-11で規定されるDSCQS法は二重刺激連続品質尺度法と呼ばれ、テレビジョン放送に関わるシステムや伝送路の品質評価に多く用いられてきました。DSCQS法は品質条件がフルレンジで揃わないときに特に有効であり、基準画像と比べた評価画像の品質差と、評価画像の絶対品質を同時に評価できることが特徴です。

DSCQS法では図1.5.5に示すように、基準映像と符合化等の何らかの処理が施された評価映像を対にして2回提示し、2回目の提示時に両映像に対する評価を行います。一対で提示する映像のどちらが基準画像であるかは評価者に教えずにランダムに変えられます。

評価者は、図1.5.6に示すように5つに分類されたカテゴリ（5段階品質尺度のカテゴリと同様）に基づき、両映像に対する品質評価値を連続尺度上にマークします。評価尺度を0～100に正規化し（尺度の最大値が100、最小値が0）、条件毎に得られた一対（基準映像と評価映像）の映像に対し、両映像の評価値の差（基準映像の評価値から評価映像の評価値を差し引いた値）を計算します．この「画質差」を評価者で平均した値がDSCQS値です。DSCQS値は画質の差により導出された値であるため、値が小さいほど品質が良く（基準映像に近い品質）、値が大きいほど品質が悪いことを示しています。

(6)SSCQE法 (Single Stimulus Continuous Quality Evaluation)

デジタル映像は、コンテンツに依存して品質劣化が時間変動します。このため、多くの映像シーンを用いて評価を行うことが求められますが、DSCQS法などを用いて多くの映像の品質評価を実施するためには、膨大な時間が必要となります。また、お客様が家庭で映像を観視する場合のように、基準映像が存在しない場合の評価法を規定することが求められてきました。ITU-R勧告BT.500-11で規定されるSSCQE法は、基準映像を用いずに、連続的に主観品質を評価する方法であり、評価者は映像を観ながらスライダ（評点記録装置）を動かして評価を行います。なお、スライダには以下の要件が求められます。

スライダにバネが用いられていないこと
机に固定されていること
評価スライドの範囲は10cm以内であること
0.5秒ごとに1つの評価値を記録すること

SSCQE法を用いた評価の流れを図1.5.7に示します。1つの評価映像（プログラムセグメント：PS）は、ニュース、ドラマ、スポーツ等の番組から選定され、1番組に1つの評価条件（品質パラメータ：QP、帯域等）を与えて評価者に提示されます。PSの時間長は5分以上とします。テストセッション（TS）は、1つ以上のPSとQPのランダムな組み合わせから成り、各TSに全てのPS条件およびQP条件を含むように計画します（PSとQPの全ての組み合わせを含む必要はありません）。TSの時間長は30～60分とされています。試験全体（テストプレゼンテーション：TP）でPSとQPの全ての組み合わせを含むように設計します。

SSCQE法により得られた評点の時系列データを評価者の平均品質を取ることによって、番組毎、品質パラメータ毎、テストセッション毎の品質の時間変動を見ることができます。しかし、安定した評価結果を得るためには、評価値入力のための十分な事前訓練が必要であったり、品質判定の遅延時間が評価者毎に異なるため、得られた評価値を適切に補正することが必要です。高精度な品質評価を実現するためにはいくつか課題が残されています。

(7)SAMVIQ法 (Subjective Assessment Methodology for Video Quality)

従来の映像品質評価はテレビジョン放送の映像を主要評価対象としてきましたが、近年、パソコンやモバイル端末向けの映像配信サービスの普及に伴い、様々な映像フォーマットや観視環境に対応可能な品質評価手法の開発が求められてきました。ITU-R勧告BT.1788で規定されるSAMVIQ法は、パソコン画面上で基準映像あるいは評価映像を再生できる評価環境を整え、評価者は自らの意思で映像を再生しながら評点を入力していく手法です。図1.5.8にSAMVIQ法の評価画面構成例を示します。映像の評価順序や観視回数は評価者に委ねられており、各評価映像を比較・確認しながら評価することができるため、再現性が高く、安定した評価値が得られる効果が期待されています。

2. 映像品質の客観評価法

本章では、映像品質の客観評価法について説明します。

2.1. 客観評価の必要性

快適な映像通信サービスを経済的なネットワークで提供するためには、お客様が実感するサービス品質(QoE)に基づいた品質設計・管理が必要になりますが、そのベースとなる技術がQoEを定量化する品質評価技術です。

品質評価技術は、評価者による心理評価による主観品質評価が基本となりますが、その実施には多大な時間・労力、専用の評価設備が必要となるため、サービスの品質評価・設計の効率化や品質監視・管理への適用が困難です。

このため、メディア信号やサービス／通信に係わる物理的な特徴量（符号化レート、IPパケット転送時間／揺らぎやIPパケット損失率、等）から主観品質を推定する客観品質評価技術の開発が強く求められています。

この客観品質評価技術を映像通信サービスの設計・構築･運用の各フェーズで活用することにより、お客様にとって満足できるサービスを提供することができます（図2.1.1）。

2.2. 従来の客観評価尺度

アナログ映像の品質を表す客観評価尺度に、ピーク信号対雑音比「PSNR（Peak Signal to Noise Ratio）」があります。PSNRは、評価基準となる映像（基準映像）がとり得る最大画素値の自乗値と、基準映像の画素値と評価対象の映像（評価映像）の画素値の差分自乗平均値をデシベルで表現した値です。動画像の品質を表現する場合は、映像フレーム毎に算出したPSNRの平均値とする場合が多く見られます。

PSNRは、アナログ映像に発生する品質劣化を捉えるQoE尺度として用いられてきました。デジタル映像の圧縮・伝送技術の高度化に伴い、画質劣化が多種多様となると共に、コンテンツの空間的・時間的な特徴により映像品質劣化の知覚のされ方が大きく変化しました。このため、QoEとPSNRの対応関係は低くなり、QoEを表す客観品質評価尺度としてPSNRを用いることは不適切であることが一般的な見解となっています。

デジタル映像の各種品質劣化の特徴量を捉えるパラメータとしては、ANSI（American National Standards Institute）規格T1.801.03などがありますが、ここで定めるパラメータもある特徴量を捉える指標に過ぎず、PSNRと同様にQoEを推測するための尺度としては十分とは言えません。

2.3. 客観評価法の分類

ユーザが体感する映像メディア品質の客観評価法は、評価に利用する情報に応じて３種類に分類されます。ITU-T勧告J.143にこの分類が規定されています。本節では各評価法の概念を示し、その用途や使用上のメリット・デメリットについて解説します（図2.3.1）。

1)Full Reference (FR) モデル

FRモデルは、符号化や伝送損失により歪みが生じた劣化映像の情報と、それらの歪みが存在しない原映像の情報を比較し、劣化映像の品質を客観評価する方法です。FRモデルでは原映像と劣化映像の比較が可能であるため、高い精度の客観評価が可能となります。ただし情報量が非常に大きい原映像が客観評価に必要となるため、原映像の取得に多大なコストを必要とする環境（例えば映像の視聴者宅など）には適用が難しくなります。このようなFRモデルの特徴を反映して、映像をネットワークに送り出すヘッドエンドにおける品質管理への適用などが期待されています。

2)Reduced Reference (RR) モデル

RRモデルは、符号化や伝送損失により歪みが生じた劣化映像の情報と、それらの歪みが存在しない原映像から抽出した特徴量情報を利用し、劣化映像の品質を客観評価する方法です。RRモデルでは原映像の特徴量と劣化映像信号が利用であるため、FRモデルには及ばないものの、比較的高い精度の客観評価が可能となります。ただし、客観評価に原映像の特徴量とは言え、原画像情報が必要となるため、特徴量情報を伝送する手段が別途必要となります。このようなRRモデルの特徴を反映して、ネットワーク拠点間の品質比較などへの適用が期待されています。

3)No Reference (NR) モデル

NRモデルは、符号化や伝送損失により歪みが生じた劣化映像の情報のみから、劣化映像の品質を客観評価する方法です。NRモデルでは客観評価に原映像情報が必要無いため、非常に多くの環境で適用が可能です。しかし、原映像情報を利用できないため、FRモデルやRRモデルに比べると客観評価の精度は低下します。このようなNRモデルの特徴を反映して、視聴者宅内における映像再生端末の常時品質監視などへの適用が期待されています。

2.4. 客観評価法の国際標準化動向

ここでは、客観評価法の国際標準化動向を説明します。

(1) 標準化組織
(2) 映像品質客観評価モデル

(1)標準化組織

映像メディア品質を含むマルチメディア品質の客観評価法の国際標準化は、ITU-T (International Telecommunication Union - Telecommunication standardization sector) 及びITU-R (同-Radiocommunication sector) において行われています。ITU-TとITU-R内部における標準化組織の関係を図2.4.1に示します。

ITU-T SG12 (Study Group 12)は通信サービスの品質全般を研究している組織であり、ITU-T における「QoSと性能」に関するリードSGとして各SG間の調整も行っています。またITU-T SG9は、ケーブルテレビジョンネットワークに関する研究をしている組織であり、そのミッションにはケーブルテレビジョンサービスの品質評価法に関する勧告の標準化が含まれています。更に、放送サービスに関してはITU-R SG6 が主管しており、特に品質に関してはWP 6Qと呼ばれるWorking Partyを中心に検討されています。マルチメディア品質の客観評価法を確立するためには、ITU-T SG9が検討している映像品質客観評価法とSG12 が検討している音声品質客観評価法の双方を統合する必要があること、また通信と放送の融合を視野に両分野の専門家が共同で品質評価技術の標準化に取り組む必要があることから、ITU-T内にJRG-MMQA (Joint Rapporteurs' Group on Multimedia Quality Assessment) が、ITU-T/R 横断的にVQEG (Video Quality Experts Group:http://www.its.bldrdoc.gov/vqeg/) が設立され、各組織の緊密な連携の下、国際標準化が進められています。

(2)映像品質客観評価モデル

映像メディアの客観品質評価技術は、利用シーンや入力情報の違いにより、以下の５つに分類されて検討されています．具体的には、図2.4.2.1に示すように、Ⅰメディアレイヤモデル、Ⅱパケットレイヤモデル、Ⅲビットストリームレイヤモデル、Ⅳハイブリッドモデル、Ⅴプランニングモデルです．表2.4.2.1に各モデルの特徴を示します。

図2.4.2.1 映像メディアの客観品質評価法の入力情報（プランニングモデルを除く）

表2.4.2.1 各種客観品質評価モデルの特徴
分類	メディアレイヤモデル	パケットレイヤモデル	ビットストリームモデル	ハイブリッドモデル	プランニングモデル
入力	映像画素信号	パケットヘッダ情報	パケットヘッダ・ペイロード情報	左記の組合せ	ネットワークや端末の品質設計・管理パラメータ
用途	符号化品質管理端末機器の性能比較	エンド端末組込型ユーザ品質管理品質劣化要因切り分け	コンテンツ属性を加味した品質管理 (利用シーン/取得可能な品質情報に応じてモデルを使い分ける)		机上のサービス品質設計・管理
技術一覧	ITU-T J.144(SDTV, FR) ITU-T J.247(QCIF-VGA, FR) ITU-T J.246(QCIF-VGA, RR) ITU-T J.249(SDTV, RR) ITU-T J.341(HDTV, FR)	IETF RFC4445 MDI ITU-T P.NAMS(検討中)	ITU-T P.NBAMS(検討中)	ITU-T J.bitvqm(検討中)	ITU-T G.1070(TV電話サービス用) ITU-T G.OMVAS(検討中)

Ⅰメディアレイヤモデル

メディアレイヤモデルは、映像メディア信号を用いて品質劣化を定量化することで主観品質を推定するモデルで、コーデックのパラメータチューニングやサービス品質の実力把握などに利用できます。現在までに国際標準化が完了しているメディアレイヤモデルは、（A）ITU-T勧告J.144として標準化され、テレビジョン映像（SDTV）を評価対象としたFRモデル、（B）ITU-T勧告J.247として標準化され、PC・携帯端末向けの映像（QCIF～VGA）を評価対象としたFRモデル、（C）ITU-T勧告J.246として標準化され、PC・携帯端末向けの映像（QCIF～VGA）を評価対象としたRRモデル、(D) ITU-T勧告J.249として標準化され、テレビジョン映像（SDTV）を評価対象としたRRモデル、(E)ITU-T勧告J.341として標準化され、ハイビジョン映像（HDTV）を評価対象としたFRモデルです。

Ⅱパケットレイヤモデル

パケットレイヤモデルは、IPやRTPなどのパケットのヘッダ情報のみを用いて主観品質を推定するモデルとして分類されています。メディアレイヤモデルのようにメディア信号を復号しないことから、処理負荷が非常に軽く、サービス提供中に実現品質を把握する「インサービス品質管理」への適用が期待されています。メディア情報を用いず品質を推定するため、特に映像・オーディオメディア品質のコンテンツ依存性を考慮した評価は本質的に困難です。このため、取り扱うコンテンツ属性の仮定や、符号化方式などの各種システム情報を事前に得ておくことが必要になります。ITU-T SG12では本技術の標準化を議論しており、2012年の勧告化を目指しています。この勧告案は暫定的にP.NAMS（Non-intrusive parametric model for the Assessment of performance of Multimedia Streaming）と呼ばれています。

Ⅲビットストリームレイヤモデル

ビットストリームレイヤモデルは、パケットのヘッダ情報に加えて、復号前の符号化ビット系列情報（ペイロード情報）を用いて主観品質を推定するモデルです。ペイロード情報までを利用することにより、パケットレイヤモデルでは扱えなかったコンテンツ依存性を考慮した評価の実現が期待されています。パケットレイヤモデルよりも演算量が多くなることから、ユーザ端末等への実装を考えた場合にはCPU負荷等に配慮する必要があります。また、ペイロード情報が暗号化されている場合は暗号化の解除が必要になることから、パケットレイヤモデルとビットストリームモデルは、適用するサービスの仕様に応じて使い分けていく必要があります。ITU-T SG12では本技術の標準化を議論しており、2012年の勧告化を目指しています。この勧告案は暫定的にP.NBAMS（Non-intrusive Bit-stream-layer Assessment of Multimedia Streaming）と呼ばれています。

Ⅳハイブリッドモデル

ハイブリッドモデルは、上記の3つのモデルを組み合わせて構成することで、簡易かつ精度良く主観品質を推定するアプローチで、インサービス品質管理などにおいて取得可能な情報を最大限利用するためのモデルです。ITU-T SG9では本技術の標準化を行うべく基礎検討を開始しており、2012年の勧告化を目指しています。この勧告案は暫定的にJ.bitvqm （Hybrid perceptual/bit-stream models for objective video quality measurements）と呼ばれています。

Ⅴパラメトリックプランニングモデル

前述までの客観品質評価モデルが、メディア信号、パケット情報、ビットストリーム情報などを入力として主観品質を推定するモデルであったのに対して、パラメトリックプランニングモデルは、ネットワークや端末の品質設計・管理パラメータ（例えば、符号化ビットレートやパケット損失率など）を入力として主観品質を推定するモデルです。評価対象となる符号化方式やシステム毎に主観品質評価特性を予め求め、データベース化しておく必要がありますが、サービス設計段階において机上で効率的に品質設計ができるメリットがあります。ITU-T SG12では本技術の標準化を議論しており、この勧告案は暫定的にG.OMVAS（Opinion Model for Video and Audio Streaming applications）と呼ばれています。

おわりに

本解説記事では、映像品質の主観品質評価法及び客観品質評価法について概説しました。主観品質評価法は国際標準化された勧告が既に多く整備されており、現在は客観品質評価法の標準化審議が活発に行われています。今後数年間で様々な客観品質評価技術が標準化される予定です。ここで取り上げた客観品質評価法が規定されることにより、映像通信サービスを受けるお客様が体験する品質をサービス提供中に把握することが可能となるため、効率的なサービス運用管理の実現が期待されています。さらに将来的には下記記事の実現を目指すべく、我々は研究活動を継続していく予定です。

なお、ITU-TやVQEGの取組みの最新情報は「国際標準化動向」のページを参照下さい。また、本解説記事では2D映像を対象としましたが、近年3D映像関連サービスが非常に注目を集めており、国際標準化の動きも活発になりつつあります。3D映像に関しては主観品質評価法の整備から検討が必要となり、単なる「画質」だけではなく、「立体感」などのような臨場感や、「疲労感」などの生体影響をどのように評価するのかについて議論が開始されています．この最新検討動向についても、本サイトにて紹介していきます。