符号化・ストリーミングコンサルティング概要

概要
業務実績

動画や音声を圧縮する符号化技術や、圧縮されたデータをネットワークの特性に応じて伝送するストリーミング技術の分野で、お客さまの研究開発や事業化などにかかわる課題をコンサルティングベースで解決します。

サービスメニュー

お客さまがお持ちの課題に対し、動画・音声符号化のエキスパートが最適な解決方法をご提案いたします。お客さまの事業フェーズ（研究、開発、実用化）にあわせて、技術評価や技術開発、ソフトウェア開発、高速化、システム構築といったさまざまなサービスを提供しております。

サービスメニュー

技術コンサルティング技術調査・技術評価システム構築	技術開発・研究開発ソフトウェア開発ライセンス供与

課題解決の流れ（例）

技術分野

動画像符号化技術

動画像符号化とは、静止画、動画像などのデジタルデータを圧縮する技術であり、テレビ放送、インターネットを利用したストリーミング、Web/ビデオ会議、蓄積メディア（例えば、DVD、Blu-ray等の光ディスクやハードディスク）など、私たちの生活に欠かせない製品やサービスに用いられている重要な技術です。

2013年に国際標準規格となったH.265/HEVC（以下HEVC）はMPEG-2の4倍、H.264の2倍の圧縮率を実現する技術です。日本では、4K、8K（それぞれフルハイビジョンの4倍、16倍の画面画素数）放送といった超高精細度テレビジョン放送に使用されています。

2020年には現在最新の国際標準規格であるH.266/VVC （以下VVC）が勧告されました。VVCはHEVCよりもさらに高い圧縮率を実現するための規格で、4K/8K動画ストリーミングや、HDR（High Dynamic Range）動画、360度パノラマ動画などの多様なシチュエーションに対応し、今後の普及が期待されます。

AV1（AOMedia Video 1）は動画ストリーミングやWebブラウザ開発を行う複数の企業により設立されたAlliance for Open Media（AOMedia）により策定された符号化規格です。特許が複雑化し、使用量や契約手続きに課題があるHEVCを代替することを目的として策定され、ロイヤリティフリーの技術を使用しながらもHEVCよりも30%程度高い圧縮効率を実現しています。一般的な動画ストリーミングサービスやWebブラウザで選択できる符号化方式の一つとして広まっています。

当社では長年様々な符号化方式における研究・開発に携わってきました。アプリケーションに合ったプロファイルの検討、検証ソフトウェア開発など多数の実績がございます。

左右スクロールで表全体を閲覧できます

符号化方式	MPEG-2	H.264/MPEG-4 AVC	H.265/HEVC
規格化団体	ISO/IEC MPEG	ISO/IEC, ITU-T VCEG, MPEG	ISO/IEC, ITU-T JCT-VC
用途例	デジタル放送、DVD	CSデジタル放送、動画ストリーミングサービス、 Blu-ray Disc	4K/8KTV放送、モバイル端末への動画配信
ビットレート	4～15Mbps	10kbps～240Mbps	128kbps～800Mbps
圧縮率	1/12～1/50	1/20～1/100	～1/200
変換	8×8 DCT	整数精度 4×4 DCT 整数精度 8×8 DCT	4×4、8×8、16×16、32×32 DCT、4×4 DST
イントラ予測	DC係数予測	4×4ブロック9通り 8×8ブロック9通り 16×16ブロック4通り	4×4、8×8、16×16、32×32、64×64ブロック　それぞれ35通り
ピクチャ構造	I/P/Bピクチャ	I/B/Pピクチャ複数参照フレーム	I/B/Pピクチャ複数参照フレーム
動き補償ブロックサイズ	16×16ブロック	16×16、16×8、8×16、8×8、8×4、4×8、4×4ブロック	64×64、64×32、32×64、64×48、64×16、48×64、16×64、32×32、32×16、16×32、32×24、32×8、24×32、8×32、16×16、16×8、8×16、16×12、16×4、12×16、4×16、8×8、8×4、4×8ブロック
動きベクトル精度	1/2画素精度	1/4画素精度	1/4画素精度
ループフィルタ	なし	デブロッキングフィルタ	デブロッキングフィルタ、SAO
エントロピー符号化	2次元VLC	CAVLC, CABAC	CABAC
インターレース対応	フレーム/フィールド適応動きベクトル補償、フレーム/フィールド適応DCT、Dual Prime予測	マクロブロックフレーム/フィールド適応符号化、ピクチャフレーム/フィールド適応符号化	対応

左右スクロールで表全体を閲覧できます

符号化方式	H.266/VVC	AV1
規格化団体	ISO/IEC, ITU-T JVET	AOMedia
用途例	4K/8K動画ストリーミング、 HDR動画、360度パノラマ動画、マルチビュー動画	動画ストリーミングサービス、モバイル端末への動画配信
ビットレート	128kbps~800Mbps	1.5~800Mbps
圧縮率	～1/400	～1/260
変換	NxM(N,M: 4, 8, 16, 32, 64) DCT-II, DCT-VIII, DST-VII, LFNST	NxM(N,M: 4, 8, 16, 32, 64) ※1:1, 1:2, 2:1, 1:4, 4:1に限る DCT, ADST(DST-IV), flipADST
イントラ予測	NxM(N,M: 4, 8, 16, 32, 64)ブロックそれぞれ67通り, MRL, MIP, ISP, CCLM	NxM(N,M: 8, 16, 32, 64)ブロックそれぞれ60通り ※1:1, 1:2, 2:1, 1:4, 4:1に限る
ピクチャ構造	I/B/Pピクチャ複数参照フレーム	intra/uni-directional/bi-directional 複数参照フレーム
動き補償ブロックサイズ	64x64, 64x32, 32x64, 64x48, 64x16, 48x64, 16x64, 32x32, 32x16, 16x32, 32x24, 32x8, 24x32, 8x32, 16x16, 16x8, 8x16, 16x12, 16x4, 12x16, 4x16, 8x8, 8x4, 4x8ブロック	NxM(N,M: 4, 8, 16, 32, 64)ブロック ※1:1, 1:2, 2:1, 1:4, 4:1に限るク
動きベクトル精度	1/16画素精度 affine変換	1/8画素精度 affine変換
ループフィルタ	デブロッキングフィルタ、 SAO、ALF	デブロッキングフィルタ、 CDEF、LRU、超解像フィルタ
エントロピー符号化	CABAC	adaptive multi-symbol arithmetic coder,
インターレース対応	対応	非対応

動画像符号化方式（国際標準規格）の比較（みずほリサーチ&テクノロジーズ調べ）

*DCT (Discrete Cosine Transform)
*DCT (Discrete Cosine Transform)
*DST (Discrete Sine Transform)
*LFNST (Low Frequency Non-Separable Transform)
*MRL (Multiple Reference Line)
*ISP (Intra Sub-Partition)
*CCLM (Cross-Component Linear Model prediction)
*DC (Direct Current)
*SAO (Sample Adaptive Offset)
*ALF (Adaptive Loop Filter)
*CDEF (Constrained Directional Enhancement Filter)
*LRU (Loop-Restoration Unit)
*VLC (Variable Length Coding)
*CAVLC (Context-based Adaptive Variable Length Coding)
*CABAC (Context-based Adaptive Binary Arithmetic Coding)

動画像符号化における符号化特性は主に、画質と圧縮効率そして符号化時間によって決まりますが、これらの特性は相互に密接に関係しています。動画像符号化を使用する場面ごとに、求められる特性を明らかにし、多数の技術の組み合わせや適用方法を最適化することが、エンコーダー、デコーダー開発では求められます。以下では、例として録画放送、生放送、ストレージへの格納の場合に分けて、求められる特性と符号化の機能について説明します。

1録画放送

テレビの録画放送やインターネットのストリーミング配信などでは、符号化の処理時間やリアルタイム性よりも画像の品質が重視されます。そのため、処理時間の長い複雑な機能により高圧縮率を実現し、より高品質な配信を実施しています。

2生放送

テレビの生放送やインターネットの生配信では、リアルタイム性が重視されるため、符号化時間に制約があり、時間が掛かる符号化機能の使用は制限されます。また、インターネット配信では、視聴者側の回線状況や視聴デバイスに合わせて、動的に適切なビットレートのストリームに切り替える仕組みが必要となるため、符号化を行うサーバ上では同時に複数の解像度やビットレートで符号化を行えるようなシステム構成を取っています。

3ストレージへの動画データ格納

HDDやDVD、Blu-rayなどのストレージに動画を格納する場合、処理量やリアルタイム性よりも圧縮効率が重視されます。例えば、地上デジタル放送のレコーダーではMPEG-2で符号化された地上デジタル放送を受信し、これを一度復号し動画に戻した上で、再度HEVCなどのより高圧縮な符号化規格で符号化することにより、画質を落とさずに圧縮効率を高めることができるため、より長時間の動画を保存することが可能となります。

このように、利用シーンに応じて適切な条件で符号化を行うことで、符号化時の処理量や圧縮率を目的に合ったバランスで実施することができます。

当社は、お客さまのニーズを満たすエンコーダーの研究・開発を多数行ってきました。機能ごとの符号化性能に与える影響を検証するためのソフトウェア開発や、用途に応じた符号化パラメータの検討など、様々な符号化規格で、目的に特化した性能を持つエンコーダーの検討・開発も可能です。。

音声符号化技術

音声符号化技術の利用例としては、国際標準規格であるG.723、G.726、G.729などが採用されたIP電話、また、同じく国際標準規格であるAAC（Advanced Audio Coding、先進的音響符号化）が採用されたデジタル放送やDVDなどがよく知られています（下表参照）。

左右スクロールで表全体を閲覧できます

国際標準規格	G.723、G.726	G.729	MP3（MPEG-1 layer3）	AAC（MPEG-2、MPEG-4）	ALS（MPEG-4）
用途例	IP電話	IP電話	携帯型音楽プレーヤー	超高精細度テレビジョン放送、DVD、携帯型音楽プレーヤー	超高精細度テレビジョン放送、インターネット音楽配信、音楽編集ソフトウェア
対象周波数	8kHz	8kHz	32、44.1、48kHz	8～96kHz	任意 (44.1、48、96、192kHz等)
主ビットレート	16、24、 32、40kbps	8kbps	32～192kbps	32～288kbps	-
遅延時間	0.125msec	25msec	約50msec	約50msec	約50msec
圧縮技術	ADPCM	CS-ACELP	サブバンド符号化、 MDCT、ハフマン符号化、聴覚心理モデル	サブバンド符号化、 MDCT、ハフマン符号化、聴覚心理モデル、TNS	線形予測、長期予測、エントロピー符号化、マルチチャンネル符号化、ゴロム・ライス符号

音声符号化方式（国際標準規格）の比較（みずほリサーチ&テクノロジーズ調べ）

*PCM (Pulse Code Modulation)
*ADPCM (Adaptive Differential Pulse Code Modulation)
*CS-ACELP (Conjugate Structure and Algebraic Code Excited Linear Prediction)
*MDCT (Modified Discrete Cosine Transform)
*TNS (Temporal Noise Shaping)

G.723、G.726、G.729、MP3やAACといった音声符号化技術は非可逆圧縮であり、人間の聴覚特性を利用することで、多少の劣化を伴うものの、非常に高い圧縮率を誇ります。そのため、低速な通信回線での音声通信や、保存領域が比較的乏しい携帯型オーディオプレーヤー等で利用されています。ALS (Audio Lossless Coding)は、原信号と復号した信号が完全に一致する可逆圧縮の一つです。スタジオ編集現場における中間作業ファイルの保存や伝送、ハイレゾリューションオーディオ^*のような高音質オーディオファイルのインターネット配信などで可逆性が求められることから、実用化が進められています。なお、映像符号化の項目でも紹介した超高精細度テレビジョン放送における符号化方式として、基本サービスではAAC、高音質サービスではALSが使用されています。

*サンプリング周波数および量子化ビット数のいずれかがCDスペック(44.1kHz/16bit)を超えているオーディオデータ

音声符号化の原理は音響の圧縮と声（スピーチ）の圧縮で大きく異なります。人間の聴覚の特性に基づいて、識別できない情報を削減する点は同じですが、声の圧縮では、さらに人間の声帯の仕組みを利用することによって、音響の圧縮方式よりも低いビットレートを実現できるように工夫されています。

当社は動画像符号化や音声符号化の技術分野において、お客さまの研究、開発および事業化を支援するためのさまざまなサービスメニューをご用意しています。

研究フェーズやプロトタイプシステムなど比較的小規模なソフトウェアの開発フェーズにあるお客さまに対しては、符号化アルゴリズムの考案、アルゴリズムの性能評価、アルゴリズムを実装したソフトウェアの開発などで、お客さまの研究開発のスピードアップに貢献します。特に、画像データの処理では避けて通れない高速化の課題に対しては、アセンブラ言語、マルチスレッドやGPUを用いた実装で対応することが可能です。

また、より規模の大きなシステム開発や事業化のフェーズにあるお客さまに対しては、事業性評価、採用技術の選定などのコンサルティングサービスから、システムの設計・開発・運用までをフルサポートすることができます。

左右スクロールで表全体を閲覧できます

キーワード	MPEG-1、MPEG-2、MPEG-4、H.264(MPEG-4 AVC)、 H.265(HEVC)、H.265(VVC)、4K・8K放送、G.723、G.729、ALS、AAC、多重化(MUX、DMUX)、トランスコーディング、高速化（マルチスレッド、GPU、MMX、SSE、SSE2等）

符号化・ストリーミングコンサルティング 概要

サービスメニュー

技術分野

動画像符号化技術

1録画放送

2生放送

3ストレージへの動画データ格納

音声符号化技術