ページの先頭です

符号化・ストリーミングコンサルティング 概要

動画や音声を圧縮する符号化技術や、圧縮されたデータをネットワークの特性に応じて伝送するストリーミング技術の分野で、お客さまの研究開発や事業化などにかかわる課題をコンサルティングベースで解決します。

サービスメニュー

符号化・ストリーミング分野において、お客さまの事業フェーズ(研究、開発、事業化)にあわせたさまざまなサービスを提供します。

符号化・ストリーミングにかかわる研究・開発・事業化支援イメージ

符号化・ストリーミングにかかわる研究・開発・事業化支援イメージ

技術分野

符号化

符号化とは、静止画、動画像、音声などのデジタルデータを圧縮する技術であり、放送、携帯電話、インターネットを利用した映像や音楽のダウンロードサービス、IP電話、蓄積メディア(例えば、DVD、Blu-ray等の光ディスクやハードディスク)など、私たちの生活に欠かせない製品やサービスに用いられている重要な技術です。

動画像符号化技術の身近な利用例としては、国際標準規格のMPEG-2が採用されたデジタル放送やDVD、また、同じく国際標準規格であるH.264/MPEG-4 AVC(以下、H.264)が採用されたワンセグメント放送や地上デジタル放送のIP再送信などがあります(下表参照)。

左右スクロールで表全体を閲覧できます

国際標準規格 MPEG-2(MP@ML) H.264/MPEG-4 AVC
(High Profile)
H.265 HEVC
(Main Profile)
用途例 デジタル放送、DVD ワンセグメント放送、一部のCSデジタル放送、地上デジタル放送のIP再送信、Blu-ray Disc 超高精細度テレビジョン放送、モバイル端末への動画配信等
ビットレート 4~15Mbps 10kbps~240Mbps 128kbps~800Mbps
圧縮率 1/12~1/50 1/20~1/100 ~1/200
変換 8×8 DCT 整数精度 4×4 DCT
整数精度 8×8 DCT
4×4、8×8、16×16、32×32 DCT、4×4 DST
イントラ予測 DC係数予測 4×4ブロック9通り
8×8ブロック9通り
16×16ブロック4通り
4×4、8×8、16×16、32×32、64×64ブロック それぞれ35通り
ピクチャ構造 I/P/Bピクチャ I/P/Bピクチャ
複数参照フレーム
I/P/Bピクチャ
複数参照フレーム
動き補償ブロックサイズ 16×16ブロック 16×16、16×8、8×16、8×8、8×4、4×8、4×4ブロック 64×64、64×32、32×64、64×48、64×16、48×64、16×64、32×32、32×16、16×32、32×24、32×8、24×32、8×32、16×16、16×8、8×16、16×12、16×4、12×16、4×16、8×8、8×4、4×8ブロック
動きベクトル精度 1/2画素精度 1/4画素精度 1/4画素精度
ループフィルタ なし デブロッキングフィルタ デブロッキングフィルタ
サンプルアダプティブオフセット
エントロピー符号化 2次元VLC CAVLC
CABAC
CABAC
インターレース対応 フレーム/フィールド適応動きベクトル補償、フレーム/フィールド適応DCT、 Dual Prime予測 マクロブロックフレーム/フィールド適応符号化、ピクチャフレーム/フィールド適応符号化 対応

動画像符号化方式(国際標準規格)の比較(みずほリサーチ&テクノロジーズ調べ)

  • *DCT(Discrete Cosine Transform、離散コサイン変換)
  • *DST(Discrete Sine Transform、離散サイン変換)
  • *DC(Direct Current、変換係数の直流成分)
  • *VLC(Variable Length Coding、可変長符号化)
  • *CAVLC(Context-based Adaptive Variable Length Coding、コンテキスト適応型可変長符号化)
  • *CABAC(Context-based Adaptive Binary Arithmetic Coding、コンテキスト適応型2値算術符号化)

新たに国際標準規格となったH.265(HEVC)はMPEG-2の4倍、H.264の2倍の圧縮率を実現する技術です。日本では、4K、8K(それぞれフルハイビジョンの4倍、16倍の画面画素数)放送といった超高精細度テレビジョン放送での導入が予定されており、2014年6月から開始した4K試験放送では、実際にHEVCが使用されています。また、動画配信サイトや、スマートフォンでの対応も始まっており、今後さらなる普及が見込まれています。なお策定当初の基本規格では、色差フォーマット4:2:0、ビット深度8、10ビットを対象としていましたが、2014年10月に多くの映像フォーマットを想定した拡張規格が策定されました。拡張規格には、色差フォーマット4:2:2、4:4:4や、10ビット以上のビット深度の対応(Range extensions)だけでなく、伝送レートに応じた動的な画像品質の変更を可能にするスケーラブル符号化(Scalable extensions)や、多視点符号化についての規格が追加されました。

イメージ図
図. 適応的なブロック分割による符号化

動画像符号化の基本的な原理は、(1)イントラ予測(近傍の画素情報を利用して圧縮する方法)、(2)インター予測(前後フレームの画素情報を利用して圧縮する方法)、(3)エントロピー符号化(シンボルの出現頻度によって割り当てる符号のビット数を変化させる圧縮の方法)の3つです。イントラ予測、インター予測、エントロピー符号化等を組み合わせたハイブリッド符号化を、前述のMPEG-2では固定サイズに分割したブロック単位で、H.264、HEVCでは、右図のようにシーンに応じて適切なサイズに分割したブロック単位で行うことによって高い圧縮率が実現されています。

音声符号化技術の利用例としては、国際標準規格であるG.723、G.726、G.729などが採用されたIP電話、また、同じく国際標準規格であるAAC(Advanced Audio Coding、先進的音響符号化)が採用されたデジタル放送やDVDなどがよく知られています(下表参照)。

左右スクロールで表全体を閲覧できます

国際標準規格 G.723、G.726 G.729 MP3(MPEG-1 layer3) AAC(MPEG-2、MPEG-4) ALS(MPEG-4)
用途例 IP電話 IP電話 携帯型音楽プレーヤー 超高精細度テレビジョン放送、DVD、携帯型音楽プレーヤー 超高精細度テレビジョン放送、インターネット音楽配信、音楽編集ソフトウェア
対象周波数 8kHz 8kHz 32、44.1、48kHz 8~96kHz 任意
(44.1、48、96、192kHz等)
主ビットレート 16、24、32、40kbps 8kbps 32~192kbps 32~288kbps -
遅延時間 0.125msec 25msec 約50msec 約50msec 約50msec
圧縮技術 ADPCM CS-ACELP サブバンド符号化、MDCT、ハフマン符号化、聴覚心理モデル サブバンド符号化、MDCT、ハフマン符号化、聴覚心理モデル、TNS 線形予測、長期予測、エントロピー符号化、マルチチャンネル符号化、ゴロム・ライス符号

音声符号化方式(国際標準規格)の比較(みずほリサーチ&テクノロジーズ調べ)

  • *PCM(Pulse Code Modulation、パルス変調符号化)
  • *ADPCM(Adaptive Differential Pulse Code Modulation、適応型差分PCM )
  • *CS-ACELP(Conjugate Structure and Algebraic Code Excited Linear Prediction、共役構造代数符号励振線形予測)
  • *MDCT(Modified Discrete Cosine Transform、変形離散コサイン変換)
  • *TNS(Temporal Noise Shaping、時間領域雑音整形)

G.723、G.726、G.729、MP3やAACといった音声符号化技術は非可逆圧縮であり、人間の聴覚特性を利用することで、多少の劣化を伴うものの、非常に高い圧縮率を誇ります。そのため、低速な通信回線での音声通信や、保存領域が比較的乏しい携帯型オーディオプレイヤー等で利用されています。ALS(Audio Lossless Coding)は原信号と復号した信号が完全に一致する可逆圧縮の一つであり、スタジオ編集現場における中間作業ファイルの保存や伝送、ハイレゾリューションオーディオ*のような高音質オーディオファイルのインターネット配信等で可逆の特性が求められ、実用化が進められています。なお、映像符号化の項目でも紹介した超高精細度テレビジョン放送における音声符号化方式として、基本サービスではAAC、高音質サービスではALSの導入が予定されています。

  • *サンプリング周波数および量子化ビット数のいずれかがCDスペック(44.1kHz/16bit)を超えているオーディオデータ

音声符号化の原理は音響の圧縮と声(スピーチ)の圧縮で大きく異なります。人間の聴覚の特性に基づいて、識別できない情報を削減する点は同じですが、声の圧縮では、さらに人間の声帯の仕組みを利用することによって、音響の圧縮方式よりも低いビットレートを実現できるように工夫されています。

当社は動画像符号化や音声符号化の技術分野において、お客さまの研究、開発および事業化を支援するためのさまざまなサービスメニューを持っています。
研究フェーズやプロトタイプシステムなど比較的小規模なソフトウェアの開発フェーズにあるお客さまに対しては、符号化アルゴリズムの考案、アルゴリズムの性能評価、アルゴリズムを実装したソフトウェアの開発などで、お客さまの研究開発のスピードアップに貢献します。特に、画像データの処理では避けて通れない高速化の課題に対しては、アセンブラ言語、マルチスレッドやGPUを用いた実装で対応することが可能です。

また、より規模の大きなシステム開発や事業化のフェーズにあるお客さまに対しては、事業性評価、採用技術の選定などのコンサルティングサービスから、システムの設計・開発・運用までをフルサポートすることができます。

左右スクロールで表全体を閲覧できます

キーワード MPEG-1、MPEG-2、MPEG-4、H.264(MPEG-4 AVC)、H.265(HEVC)、4K・8K放送、G.723、G.729、多重化(MUX、DMUX)、トランスコーディング、高速化(マルチスレッド、GPU、MMX、SSE、SSE2等)

ストリーミング

符号化された動画像や音声のデータをネットワークで流通させるために、ストリーミング技術は欠くことのできない重要な技術です。特に、IP電話やIPTVなどリアルタイム性が重要視されるIPネットワーク上のサービスにおいては、ストリーミングにおけるさまざまな技術を駆使する必要があります。

インターネットや社内LAN (Local Area Network)などのIPネットワーク上でデータを通信する際には、データをIPパケットに格納します。このIPパケットを送受信するための代表的なプロトコルとして、TCP (Transmission Control Protocol)とUDP (User Datagram Protocol)の2つがあります。TCPには受信側へのパケットの到着を保証する機能があるため、データの欠損が許されないようなサービスでの利用に適しています。その反面、リアルタイム性が求められるようなサービスには向いていません。一方、UDPは受信側へのパケットの到着を保証しないという欠点はあるものの、テレビ電話や放送などリアルタイム性が求められるサービスには向いています。

UDPを採用した場合には、パケットロスやパケットの入れ替わりが発生した場合の対応を上位のアプリケーションで行わなければなりません。例えば、エラー耐性と呼ばれる技術では、パケットロスが発生した場合でも、受信側で、ある程度データを復元できるように、重要な情報を複数のパケットに分散するなどして送ります。エラー耐性技術の一つであるエラー訂正技術では、パケットロスが発生した際でも受信側でデータを復元できるように、送信する情報に冗長性を持たせます。FEC(Forward Error Correction、前方誤り訂正)はエラー訂正技術の代表的な例です。また、欠損した画像や音声のデータを他のデータで補完するエラーコンシールメントと呼ばれる技術もあります。さらに、パケットロスをなるべく発生させないようにするための技術もあります。輻輳制御は、ネットワークの混み具合(輻輳の度合い)を監視しながら、伝送レートを調節する技術です。輻輳制御を行うことによって、ネットワークが込み合っているときには低い伝送レートで送信し、ネットワークが空いてきたら高い伝送レートで送信することが可能になります。

当社は、上述したようなストリーミングに関する技術を多数保有しており、お客さまの課題を解決するためのさまざまな方策を提案することができます。特に、符号化とストリーミングを組み合わせて、新規サービスや、既存サービスの4K・8K, ALS対応といった高精細、高音質化等の研究、開発、事業化を検討されているお客さまには、最適なソリューションを提供することができます。

左右スクロールで表全体を閲覧できます

キーワード TCP/IP、 UDP/IP、 RTP、 RTCP、 H.323、 マルチキャスト、 エラー訂正、 エラー耐性、 輻輳制御、 NGN(次世代ネットワーク)

お問い合わせ

担当:情報通信研究部
電話:03-5281-5289

関連情報

おすすめソリューション

蓄積された技術・ノウハウとコンサルティングベースの課題解決アプローチによりお客さまの計算処理に関わる高速化ニーズにお応えします。

ページの先頭へ