JP2020120188A - メディア符号化方法および装置 - Google Patents

メディア符号化方法および装置 Download PDF

Info

Publication number
JP2020120188A
JP2020120188A JP2019007878A JP2019007878A JP2020120188A JP 2020120188 A JP2020120188 A JP 2020120188A JP 2019007878 A JP2019007878 A JP 2019007878A JP 2019007878 A JP2019007878 A JP 2019007878A JP 2020120188 A JP2020120188 A JP 2020120188A
Authority
JP
Japan
Prior art keywords
encoding
media
parameter set
analysis
media data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019007878A
Other languages
English (en)
Other versions
JP7310148B2 (ja
Inventor
浩一 二瓶
Koichi Nihei
浩一 二瓶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2019007878A priority Critical patent/JP7310148B2/ja
Publication of JP2020120188A publication Critical patent/JP2020120188A/ja
Application granted granted Critical
Publication of JP7310148B2 publication Critical patent/JP7310148B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Closed-Circuit Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】ネットワーク環境を考慮し、できる限り高いメディア解析精度が得られるようにメディアデータを符号化するメディア符号化方法および装置を提供する。【解決手段】ネットワークを通して符号化メディアデータを伝送する通信システムにおけるメディア符号化装置10が、メディアデータを符号化パラメータセットに従って符号化し、符号化メディアデータを出力する符号化器102と、メディアデータの符号化ビットレートの上限値とメディアデータの解析方法に関する情報とを入力する入力部106及び107と、解析方法および符号化ビットレートの上限値の条件下で複数の符号化パラメータセット候補を生成し、複数の符号化パラメータセット候補ごとに解析精度を算出し、算出された解析精度がより高い符号化パラメータセット候補を、符号化器へ与える前記符号化パラメータセットとして決定する符号化パラメータセット決定部104及び105と、を有する。【選択図】図1

Description

本発明はメディアデータの解析機能を有する通信システムに係り、特に符号化されたメディアデータを受信した受信側での解析精度の向上を企図したメディア符号化方法および装置に関する。
近年、画像、映像、音声等のメディアデータを解析する技術の進歩が著しい。メディア解析技術は、防犯・防災のための監視システムだけでなく、車両の運転支援や自動運転等のさまざまな分野への適用が進められている。特にメディアデータがネットワークを通して伝送される場合、データ量を圧縮する符号化技術は不可欠である。その際、受信側で十分高いメディア解析精度を得るには、復号されたメディアデータのメディア品質を高くする必要がある。
受信側のメディア解析精度を確保する技術としては、受信機からの通知に応じて、送信機が符号化パラメータを適応的に変更する方法が提案されている。たとえば、特許文献1に開示された方法によれば、受信側は、車両の走行状態に応じて画像認識処理を切り替え、切替後の画像認識処理に対応する符号化制御情報を送信側へ通知する。送信側は、通知された符号化制御情報に従ってエンコーダの符号化パラメータを変更する。これにより、受信側は、走行状態に適した画像認識を可能にする符号化データを受信することができ、画像認識率を高めることができる。
また、符号化技術の近年の代表例としては、スケーラブル符号化(階層符号化)が知られている。今日のネットワーク環境は、光ファイバ等の高速通信路や携帯端末等の比較的低速の無線通信路が混在している。スケーラブル符号化は、このようなネットワーク環境において、受信側の性能に応じた効率的な符号化を可能とする。このようなスケーラブル符号化を用いた映像配信システムの一例が特許文献2に記載されている。特許文献2では、スケーラブル符号化を制御することで、画面全体の最低画質を一定に維持しつつユーザが所望する領域を高画質圧縮する方法が開示されている。
特開2013−239995号公報 国際公開第WO2015/190078号
上述した特許文献1に記載された方法は、送信側の符号化パラメータを受信側からの通知に応じて適応的に変更する。この場合、ネットワーク環境の劣化により、受信側の画像認識精度が大幅に低下するという問題が生じうる。たとえば、受信側からの通知に従って所定の符号化パラメータで符号化したときに、その符号化映像ストリームのビットレートがネットワーク帯域を上回る場合がありうる。この場合、映像データの部分的なロスが発生し、その結果、受信側で画像認識を行う映像にブロックノイズ等の乱れが生じて認識精度が大きく低下してしまう。
また、特許文献2に記載された符号化通信システムでは、効率的な階層符号化方法が提案されているが、ネットワーク環境の劣化による受信側の解析精度の劣化対策については検討されていない。
本発明の目的は、ネットワーク環境を考慮し、できる限り高いメディア解析精度が得られるようにメディアデータを符号化するメディア符号化方法および装置を提供することにある。
本発明の一態様によれば、ネットワークを通して符号化メディアデータを伝送する通信システムにおけるメディア符号化装置が、メディアデータを符号化パラメータセットに従って符号化し、前記符号化メディアデータを出力する符号化器と、前記メディアデータの符号化ビットレートの上限値と前記メディアデータの解析方法に関する情報とを入力する入力部と、前記解析方法および前記符号化ビットレートの上限値の条件下で複数の符号化パラメータセット候補を生成し、前記複数の符号化パラメータセット候補ごとに解析精度を算出し、前記算出された解析精度がより高い符号化パラメータセット候補を、前記符号化器へ与える前記符号化パラメータセットとして決定する符号化パラメータセット決定部と、を有する。
本発明の他の態様によれば、ネットワークを通して符号化メディアデータを伝送する通信システムにおけるメディア符号化方法において、符号化器がメディアデータを符号化パラメータセットに従って符号化し、前記符号化メディアデータを出力し、符号化パラメータ決定部が、前記メディアデータの符号化ビットレートの上限値と前記メディアデータの解析方法に関する情報とを入力し、前記解析方法および前記符号化ビットレートの上限値の条件下で複数の符号化パラメータセット候補を生成し、前記複数の符号化パラメータセット候補ごとに解析精度を算出し、前記算出された解析精度がより高い符号化パラメータセット候補を、前記符号化器へ与える前記符号化パラメータセットとして決定する。
本発明の更に別の態様によれば、ネットワークを通して符号化メディアデータを伝送する通信システムにおけるメディア符号化装置としてコンピュータを機能させるプログラムが、メディアデータを符号化パラメータセットに従って符号化し、前記符号化メディアデータを出力する機能と、前記メディアデータの符号化ビットレートの上限値と前記メディアデータの解析方法に関する情報とを入力し、前記解析方法および前記符号化ビットレートの上限値の条件下で複数の符号化パラメータセット候補を生成する機能と、前記複数の符号化パラメータセット候補ごとに解析精度を算出する機能と、前記算出された解析精度がより高い符号化パラメータセット候補を、前記符号化器へ与える前記符号化パラメータセットとして決定する機能と、を前記コンピュータに実現する。
本発明によれば、使用する解析方法と与えられたビットレート上限の中で、解析精度がより高くなる符号化パラメータセットを選択することができるので、ネットワーク環境を考慮し、できる限り高いメディア解析精度を得ることができる。
図1は本発明の第1実施形態によるメディア符号化装置の概略的構成を示すブロック図である。 図2は図1に示すメディア符号化装置の全体的動作を示すフローチャートである。 図3は図1に示すメディア符号化装置における符号化パラメータ算出部の動作を示すフローチャートである。 図4は図3に示す符号化パラメータ算出動作により生成される符号化パラメータ候補に対する解析精度の一例を示すテーブルである。 図5は本発明の第2実施形態によるメディア符号化装置の概略的構成を示すブロック図である。 図6は図5に示すメディア符号化装置における符号化パラメータ算出部の動作を示すフローチャートである。 図7は図6における符号化パラメータ算出動作により生成される符号化パラメータ候補に対する解析精度の一例を示すテーブルである。 図8は本発明の第3実施形態によるメディア符号化装置の概略的構成を示すブロック図である。 図9は第3実施形態における階層符号化について説明するための模式図である。 図10Aは第2実施形態において選択された符号化パラメータセットを使用した場合のフレーム当たりの情報量を示すグラフである。 図10Bは階層符号化による符号化パラメータセットを使用した場合のフレーム当たりの情報量を示すグラフである。 図11は図9に示すメディア符号化装置における符号化パラメータ算出部の動作を示すフローチャートである。 図12は本発明の第4実施形態によるメディア符号化装置の概略的構成を示すブロック図である。 図13は図12に示すメディア符号化装置の全体的動作を示すフローチャートである。 図14は本発明の第5実施形態によるメディア符号化装置の概略的構成を示すブロック図である。 図15は上記各実施形態によるメディア符号化装置とメディア解析装置とがネットワーク接続されたメディア解析システムの概略的構成図である。
<実施形態の概要>
本発明の実施形態によれば、使用する解析方法と与えられたビットレート上限の中で、解析精度が最も高くなる符号化パラメータセットを選択する。これによりビットレート上限が低い場合であっても、制限されたビットレートの範囲内で高い精度のメディア解析が可能となる。以下、本発明の実施形態について図面を参照しながら詳細に説明する。
1.第1実施形態
1.1)構成
図1に例示するように、本発明の第1実施形態によるメディア符号化装置10は、メディアデータ入力部101と、符号化部102と、出力部103と、符号化パラメータ算出部104と、解析精度算出部105と、解析方法入力部106と、ビットレート入力部107から構成される。メディア符号化装置10において、符号化パラメータ算出部104および解析精度算出部105は、後述するように、本実施形態における符号化パラメータセット決定部を構成する。
メディアデータ入力部101は、例えばカメラやマイク等の入力装置やストレージ装置などに接続され、映像や音声といったメディアデータを入力する。
符号化部102は、メディアデータ入力部101により入力されたメディアデータを、符号化パラメータ算出部104で算出したパラメータを用いて符号化する。例えばメディアデータが映像の場合には、H.264、H.265、モーションJPEG(Joint Photographic Experts Group)といった映像符号化方式を用いて符号化する。メディアデータが音声の場合には、G.711、AMR(Adaptive Multi-Rate)、AAC(Advanced Audio Coding)といった音声符号化方式を用いて符号化する。
出力部103は符号化されたメディアデータを出力するためのインタフェースである。例えば、出力部103は、有線LAN(Local Area Network)、無線LAN、LTE(Long Term Evolution)等のセルラネットワークの通信インタフェースであってもよい。あるいは、出力部103はメディア符号化装置10のスロットあるいはUSB(Universal Serial Bus)等のインタフェースであってもよい。すなわち、スロットに記憶装置を装着してもよいし、あるいはUSB等のインタフェースに外部記憶装置を着脱可能に接続してもよい。
符号化パラメータ算出部104は、解析方法入力部106およびビットレート入力部107から入力された条件に基づいて符号化パラメータセット候補を生成し解析精度算出部105へ出力する。解析精度算出部105から各候補に対する解析精度を入力すると、符号化パラメータ算出部104は、そのなかで解析精度が最も高くなる符号化パラメータセットを決定して符号化部102へ指示する。符号化パラメータ算出部104の符号化パラメータセット決定機能は、メディア符号化装置10のプロセッサ(CPU(Central Processing Unit)等)上で、図示しないメモリに格納されたプログラムを実行することにより実現することも可能である。
解析精度算出部105は、符号化パラメータ算出部104から符号化パラメータセット候補を入力し、各セット候補に対する解析精度(あるいはその予測値)を算出して符号化パラメータ算出部104へ返す。解析精度算出部105には、解析方法に対応する解析精度計算式が予め用意されていてもよいし、あるいは、符号化パラメータセット候補に対する解析精度の予測値が学習により生成され、保持されていてもよい。解析精度算出部105の機能は、メディア符号化装置10のプロセッサ上で、図示しないメモリに格納されたプログラムを実行することにより実現することも可能である。
解析方法入力部106は、受信側で採用されるメディア解析方法あるいは実際に使用する解析エンジン等を識別する情報を入力する。入力方法としては、メディア符号化装置10あるいはそれを搭載した情報処理装置が有するタッチパネル等の入出力デバイス(図示せず)を用いる方法や、出力部103が通信インタフェースであれば、受信側からメッセージを受け取る方法などが考えられる。メディアデータが映像の場合、解析方法は、たとえば顔認識、物体認識、物体の動き認識等を示す。メディアデータが音声であれば、解析方法は、音声認識、話者認識等を示す。これらの解析方法の場合、解析精度算出部105が算出する解析精度は、例えば正しく認識できる割合(認識率)あるいはその予測値である。
ビットレート入力部107は、メディアデータの符号化ビットレートの上限値の入力を受け付ける。入力方法は解析方法入力部106の場合と同様である。符号化ビットレートの上限値は、出力部103が接続しているネットワークの物理帯域、受信装置(図示せず)との間で過去に計測した通信速度から算出するか、あるいは統計データに基づく未来の通信速度の予測値として算出してもよい。また、他のアプリケーションの使用分を考慮して、これらの値に対して0以上1以下の規定値を掛けた値や、規定値を引いた値としてもよい。ビットレート上限値は、数百ミリ秒から数十秒程度の周期で、あるいは、ネットワーク状態の変動を検知したタイミングで、変更してもよい。メディア符号化装置10に接続された外部記憶装置に出力する場合には、外部記憶装置の容量または残容量、保存するデータ長(時間)をもとに算出してもよい。例えば、外部記憶装置の容量が1GB (Gigabyte)、保存すべきデータ長が1時間であれば、ビットレート上限値は、1 [GB] × 1,000 [MB(Megabyte)/GB] × 8 [bit/byte] / 3,600 [second] = 2.222 [Mbps (Migabit per second)] になる。
以下、図2〜図4を参照しながら、本実施形態によるメディア符号化装置10の動作について説明する。
1.2)動作
<メディア符号化>
図2に例示するように、メディアデータ入力部101からメディアデータが入力されると(動作S201)、符号化パラメータ算出部104は、解析方法入力部106およびビットレート入力部107から解析方法およびビットレートをそれぞれ読み込む(動作S202、S203)。続いて、符号化パラメータ算出部104は、後述する手順で符号化パラメータセットを決定し、符号化部102へ指示する(動作S204)。
符号化部102は、符号化パラメータ算出部104により指示された符号化パラメータセットを用いて、メディアデータ入力部101から受け取ったメディアデータを符号化し(動作S205)、出力部103へ渡す。出力部103は、符号化部102から受け取った符号化されたメディアデータを出力する(動作S206)。メディア符号化装置10の動作が停止される(動作S207のYES)まで、上記動作S201〜S206が繰り返される(動作S207のNO)。
なお、解析方法およびビットレートが変更されない場合には、直前の符号化パラメータセットをそのまま使用することができる。したがって、解析方法あるいはビットレートの入力値が変更された場合のみ、動作S202〜S204を実行するように制御することもできる。
<符号化パラメータセット決定>
次に、上述した符号化パラメータセット決定動作S204のより詳細な動作を図3および図4を参照しながら説明する。
図3に例示するように、符号化パラメータ算出部104は、解析方法およびビットレートをそれぞれ入力すると(図2の動作S202、S203)、入力した解析方法およびビットレートに基づいて、後述するように符号化パラメータセットの候補を生成する(動作S301)。続いて、生成した符号化パラメータセット候補の各々を解析精度算出部105へ出力することで、各候補に対する解析精度の推定値を得る(動作S302、S303)。すべての符号化パラメータセットに対する解析精度を取得すると、符号化パラメータ算出部104は、解析精度が最も高くなる符号化パラメータセットを決定し、符号化部102へ出力する(動作S304)。
解析精度算出部105には、解析精度を算出するための関数fが予め定義されていてもよい。あるいは、ディープラーニング等を用いて、符号化パラメータセット候補と解析精度aとの対応を予め学習しておき、入力された値に対する解析精度aの予測値を出力してもよい。
以下、メディアデータが映像の場合を一例として、符号化パラメータセット決定方法を示す。この例では、ビットレート入力部107から入力されたビットレートの上限が1.5Mbpsであり、変更可能な符号化パラメータが映像のビットレートとフレームレートであるものとする。一般に映像のビットレートが高くなるほど画質が向上し、解析精度も向上するため、ビットレートは入力された上限値である1.5Mbpsに固定する。また、フレームレートは1〜30の間の値とする。1〜30の間のすべての整数を候補としてもよいが、特にフレームレートの高い領域では、少しの違いであれば画質への影響は小さいため、すべてのフレームレートを候補とせずに、代表的な値をサンプリングしてもよい。これにより、演算量の低減が可能となり、処理能力の低い端末でも利用可能となる。図4に示す例では、符号化パラメータセットの候補が11種類のビットレート・フレームレートの組からなるものとする。
図4に例示するように、解析精度算出部105は、11種類の符号化パラメータセット候補の各々に対して解析精度(の予測値)を生成する。たとえば、解析精度を計算式で算出できる場合には、解析精度算出部105に解析精度を算出する関数fを定義することができる。関数fは、解析方法(解析エンジンの種類)をk、ビットレートをrb、フレームレートをrf、解析精度をaとしたとき、
a = f(k, rb, rf)
で定義される。したがって、解析精度算出部105は、解析方法kと符号化パラメータセット候補(rb、rf)とが与えられると、上記式を用いて解析精度(の予測値)aを算出することができる。計算式ではなくディープラーニング等を用いて、符号化パラメータセット候補(rb、rf)と解析精度aとの対応を予め学習し、解析精度テーブルとして保持しても良い。与えられた符号化パラメータセット候補(rb、rf)に従って解析精度テーブルをサーチすることで対応する解析精度の予測値aを出力することができる。
こうして得られた各候補に対する解析精度を比較することで、最も精度が高くなる符号パラメータを決定することができる。図4に示す例では、解析精度a=90%が最も高くなるので、7番目の符号化パラメータセット(1.5Mbps/10fps(frame per second))が決定される。
なお、H.264とモーションJPEGといった複数の符号化方法が利用できる場合には、符号化方法eを解析精度算出部105の関数fのパラメータに追加し、関数fを
a = f(k, rb, rf, e)
と定義してもよい。この場合、eを変更したケースも符号化パラメータセットの候補に追加される。あるいは、上述したように、符号化方法eを変更した符号化パラメータセット候補と解析精度aとの対応を予め解析精度テーブルに格納して解析精度aを算出してもよい。
1.3)効果
上述したように、本発明の第1実施形態によれば、使用する解析エンジンにおいて、与えられたビットレート上限で、変更可能な符号化パラメータ毎に符号化パラメータセット候補を生成する。そして、符号化パラメータセット候補毎に解析精度を算出し、その中で最も高い解析精度を示す符号化パラメータセットを符号化に用いるパラメータセットとして決定する。そのため、ビットレート上限が低い場合であっても、制限されたビットレートの範囲内で最も高い精度のメディア解析が可能となる。
2.第2実施形態
本発明の第2実施形態によれば、複数種類の解析エンジンを同時に使用する点で第1実施形態と異なる。従って、本実施形態によるメディア符号化装置10Aは、第1実施形態によるメディア符号化装置10と基本的な構成は同様であるが、符号化パラメータセット決定部の機能が異なる。以下、同一機能を有するブロックには同一参照番号を付して説明は簡略化し、第1実施形態と異なる構成および機能について主に説明する。
2.1)構成
図5に例示するように、本実施形態によるメディア符号化装置10Aは、メディアデータ入力部101と、符号化部102と、出力部103と、符号化パラメータ算出部104Aと、解析精度算出部105Aと、解析方法入力部106と、ビットレート入力部107から構成される。メディア符号化装置10Aにおいて、符号化パラメータ算出部104Aおよび解析精度算出部105Aは、後述するように、本実施形態における符号化パラメータセット決定部を構成する。
本実施形態では、解析方法入力部106から複数(n個)の解析エンジンの種類k(1)〜k(n)と、それぞれの解析エンジンの重みw(1)〜w(n)が入力される(nは2以上の整数)。解析精度算出部105Aには、それぞれの解析エンジンの種類k(i)に対応する解析精度算出のための関数fiが予め用意されているものとする。
2.2)動作
メディア符号化装置10Aの全体的動作は図2に示す通りである。以下、本実施形態による符号化パラメータセット決定動作(図2のS204に対応する動作)を図6および図7を参照しながら説明する。
図6に例示するように、符号化パラメータ算出部104Aは、入力した解析方法k(i)およびビットレートrbに基づいて、上述したように符号化パラメータセットの候補を生成する(動作S301)。なお、iは1以上n以下の任意の整数である。続いて、符号化パラメータ算出部104Aは、解析方法k(i)と生成した符号化パラメータセット候補の各々とを解析精度算出部105Aへ出力し、各候補に対する解析精度の推定値a(i)を得る(動作S302A、S303A)。
各解析方法k(i)での各符号化パラメータセットに対する解析精度a(i)を取得すると、符号化パラメータ算出部104Aは、各解析精度a(i)に当該解析エンジンの重みw(i)を乗じた値の重み付き和を計算し、当該重荷付け和を解析精度aとする。符号化パラメータ算出部104Aは、当該解析精度aが最も高くなる符号化パラメータセットを決定し、それを符号化部102へ出力する(動作S304A)。各解析エンジンk(i)に対応する重みw(i)を相対的に変更することで、符号化するメディアデータの用途に応じた解析精度に設定可能である。
以下、メディアデータが映像の場合を一例として、本実施形態による符号化パラメータセット決定方法を示す。この例では、上述した第1実施形態と同様に、ビットレート入力部107から入力されたビットレートの上限が1.5Mbpsであり、変更可能な符号化パラメータが映像のビットレートとフレームレートであるものとする。また、図7に示す例では、符号化パラメータセットの候補が11種類のビットレート・フレームレートの組からなるものとする。
説明の煩雑化を避けるために、一例として、解析エンジンをk(1)、k(2)の2種類(n=2)とし、それぞれの重みw(1)=0.6、w(2)=0.4とする。また、それぞれの解析エンジンに対応した解析精度a1およびa2を算出するための関数f1、f2が以下のように定義されているものとする。
a1 = f1(k1, rb, rf)
a2 = f2(k2, rb, rf)
解析精度算出部105Aは、符号化パラメータ算出部104Aから解析エンジンの種類を示す値k(i)、ビットレートrb、フレームレートrfを与えられると、上記関数f1およびf2を用いて、それぞれの解析精度a1およびa2を算出する。これらの解析精度a1およびa2は、それぞれ対応する重みw(1)=0.6およびw(2)=0.4が乗算され、その結果が加算されることで、解析精度aを得る:
a = 0.6 a1 + 0.4 a2。
こうして符号化パラメータセットの各々に対して解析精度aが得られると、これらの解析精度aのうち最も高い解析精度を示すパラメータセットを符号化器102へ与える符号化パラメータセットとして決定する。なお、上記関数f1、f2を定義する代わりに、第1実施形態で述べたように解析精度テーブルを用意して解析精度a1およびa2を算出してもよい。
図7に示す例において、解析エンジン1は、フレームレートが上昇するに従って解析精度が向上するが、フレームレートを上げ過ぎると1フレームあたりの情報量が低下し解析精度が低下する特性を有する。このような解析エンジン1としては、例えば物体の動き認識エンジンがある。解析エンジン2はフレームレートが低くフレーム当たりの情報量が大きいほど解析精度が向上する特性があり、例えば顔認識エンジンである。
こうして得られた各候補に対する解析精度aを比較することで、最も精度が高くなる符号パラメータセットを決定することができる。図7に示す例では、解析精度a=76%が最も高くなるので、5番目の符号化パラメータセット(1.5Mbps/5fps)が決定される。
本実施形態では、解析エンジンを2種類(n=2)としたが、3種類以上の解析エンジンを用いる場合であっても、同様の方法で最適なパラメータセットを選択できる。
2.3)効果
上述したように、本発明の第2実施形態によれば、複数の解析エンジンの各々について推定された解析精度の重み付き和が最大になるようにパラメータセットを選択する。これにより、単一のメディアデータに対して複数の解析エンジンを適用する場合の解析精度を向上させることができる。特に、各解析エンジンk(i)の重みw(i)を変更することで、用途に応じたパラメータセットの選択が可能になるという利点がある。
3.第3実施形態
本発明の第3実施形態によるメディア符号化装置は、基本的な構成および動作に関しては、上述した第2実施形態と同様であるが、階層符号化技術を用いてメディアデータを符号化し、階層符号化のパラメータセットを決定する点で異なる。以下、同一機能を有するブロックには同一参照番号を付して説明は簡略化し、第2実施形態と異なる構成および機能について主に説明する。
3.1)構成
図8に例示するように、本実施形態によるメディア符号化装置10Bは、メディアデータ入力部101と、階層符号化部102Bと、出力部103と、符号化パラメータ算出部104Bと、解析精度算出部105Bと、解析方法入力部106と、ビットレート入力部107から構成される。階層符号化部102Bは、次に述べるように、メディアデータを基本階層およびL階層(Lは1以上n以下の整数)の拡張階層に符号化する。
図9に模式的に示すように、階層符号化では、入力されたメディアデータを基本階層0と拡張階層1〜Lとに符号化する。拡張階層は基本階層の品質を向上させるための差分データであり、使用する拡張階層数を増やすほどデータ量(ビットレート)が増大するがメディア品質は向上する。映像の階層符号化の場合、H.264の拡張規格であるH.264/SVC、H.265(HEVC: High Efficiency Video Coding)の拡張規格であるSHVC(Scalable HEVC)などが階層映像符号化規格として定められている。音声の場合、AACの拡張規格であるAAC−SSR(Scalable Sampling Rate)などが階層音声符号化規格として定められている。
符号化パラメータ算出部104Bおよび解析精度算出部105Bは、本実施形態における符号化パラメータセット決定部を構成する。解析精度算出部105Bには、複数(n個)の解析エンジンk(1)〜k(n)にそれぞれ対応した解析精度算出のための関数f1〜fnが予め用意されているものとする。また、符号化パラメータ算出部104Bは、解析方法入力部106から複数の解析エンジンの種類を入力し、ビットレート入力部17からビットレートの上限値を入力する。
<符号化パラメータセットの比較>
図10Aは、上述した第2実施形態で選択した符号化パラメータセットでの情報量を例示したものであり、図10Bは、本実施形態における階層符号化を使用した場合の符号化パラメータセットでの情報量を例示したものである。ビットレートはどちらも1.5Mbpsとする。
図10Aに示すように、本発明の第2実施形態において決定された符号化パラメータセット(1.5Mbps/5fps;図7参照)では、平均して1フレームあたり0.3Mbitの情報量となる。
これに対して、階層数2の階層符号化を使用する本実施形態によれば、図10Bに例示するように、基本階層が1.25Mbps/5fps、拡張階層1が0.25Mbps/1fpsの組み合わせであれば、先頭フレームの情報量は基本階層と拡張階層1とを合わせて0.5Mbitとなる。したがって、フレームレートが低いほど(すなわち、1フレームあたりの情報量が多いほど)解析精度の向上する解析エンジンが先頭フレームを解析することで、その解析精度が大きく向上するものと期待できる。先頭フレーム以外の情報量は若干減少するものの、この程度の低下では解析精度の大幅な低下はないと考えられるため、結果的に解析精度の重み付き和の向上が期待できる。
3.2)動作
メディア符号化装置10Bの全体的動作は図2に示す通りであり、本実施形態による符号化パラメータセット決定動作は図2の動作S204に対応する。本実施形態によれば、予め定めた条件に基づいて、符号化パラメータセットの候補を生成し、各候補に対して解析精度の重み付き和を算出し、最も高くなったパラメータセットを出力する。以下、本実施形態による符号化パラメータセット決定動作について、図11を参照しながら説明する。
図11において、階層数jを最小値1から最大値L+1の間で順次設定する(動作S401)。ここで、L+1は1以上n以下の整数であり、nは解析エンジン数である。最大値を解析エンジン数nとすれば、階層数jを最小値1から最大値nまでの間で1ずつ増やしながら、以下の動作S402〜S404を繰り返す。
まず、階層数jにおける階層のビットレートの組み合わせ候補(以下、BR組合せ候補pという。)を順次選択する(動作S402)。例えば、階層数j=2でビットレート(BR)の上限値が1.5Mbpsの場合、所定のBR単位で複数のBR組合せ候補pを生成することができる。たとえば、0.25Mbps単位であれば、候補p=(基本階層0のBR,拡張階層1のBR)と表記して、
候補p1=(0.75Mbps,0.75Mbps)、
候補p2=(1.0Mbps,0.5Mbps)、
候補p3=(1.25Mbps,0.25Mbps)、
を生成できる。あるいは、基本階層0のビットレートを0.1Mbpsから0.1Mbps単位で増加させながら、複数のBR組合せ候補を生成してもよい。このように生成されたBR組合せ候補から一つの候補を順次選択する。
続いて、設定された階層数jと選択されたBR組合せ候補pの条件下で、各階層への解析エンジンの割当て候補(以下、E割当て候補qという。)を順次選択する(動作S403)。例えば、階層数j=2で解析エンジン数n=3の場合、どの階層にどの解析エンジンを割り当てるかで複数のE割当て候補qを生成しうる。1つの階層に複数の解析エンジンを割り当てるともできる。たとえば、基本階層0に解析エンジンE1およびE2を割り当て、拡張階層1に解析エンジンE3を割り当てることも可能である。各階層に少なくとも一つの解析エンジンを割り当てることで、すべての割当て候補を生成してもよい。
上述したように、設定された階層数j、選択されたBR組合せ候補pおよびE割当て候補qの条件下で、解析精度が最も高くなるようにフレームレートFR(j,p,q)を決定する(動作S404)。フレームレートは、第1実施形態で述べたように、変更可能な範囲のすべての整数を候補としてもよいが、代表的な値を候補としてサンプリングしてもよい。なお、階層数jが2以上の場合、解析精度は、拡張階層以下のすべての階層を使用したものとして算出する(図9参照)。また、二つ以上の解析エンジンが割り当てられた階層については、第2実施形態と同様に、重み付き和が最大となるフレームレートを求める。
以上述べたように、全てのE割当て候補qについて解析精度が最も高くなるフレームレートを決定すると(S403、S404)、次のBR組合せ候補pを選択して(動作S402)、動作S403およびS404を繰り返し、全てのBR組合せ候補pが完了すると、階層数jをインクリメントして(動作S401)、上記動作S402〜S404を繰り返す。
こうして、各候補に対するフレームレートFRが算出されると、上記第2実施形態で述べたように解析精度を算出し、各階層で得られた解析精度あるいは複数の解析エンジンを使用する場合はそれらの解析精度の重み付き和が最も高くなるパラメータセット(階層数j、各階層のビットレートBRおよびフレームレートFR、各階層に割り当てる解析エンジンE)を決定する(動作S405)。
3.3)効果
上述したように、本発明の第3実施形態によるメディア符号化装置10Bは、階層符号化技術を用いて符号化を行う場合にも、上記第2実施形態と同様に、各階層で得られた解析エンジンの解析精度あるいは複数の解析エンジンの各々について推定された解析精度の重み付き和が最大になるように階層符号化パラメータセットを選択する。これにより、階層符号化メディアに対して複数の解析エンジンを適用する場合の解析精度を向上させることができる。
4.第4実施形態
本発明の第4実施形態によるメディア符号化装置は、第1〜第3実施形態によるメディア符号化装置と基本的な構成は同様であるが、メディア解析部を有する点で異なる。本実施形態によるメディア符号化装置は、メディア解析を行い、その結果を用いて符号化パラメータセット決定を行う。したがって、本実施形態は、メディア符号化装置の処理能力が比較的高い場合に適用することができる。以下、同一機能を有するブロックには同一参照番号を付して説明は簡略化し、第1〜第3実施形態と異なる構成および機能について主に説明する。
4.1)構成
図12に例示するように、本実施形態によるメディア符号化装置10Cは、メディアデータ入力部101と、符号化部102と、出力部103と、符号化パラメータ算出部104Cと、解析精度算出部105Cと、解析方法入力部106と、ビットレート入力部107と、メディア解析部108と、から構成される。メディア解析部108は、メディアデータ入力部101および符号化部102からそれぞれ入力されたメディアデータおよび符号化後のメディアデータを取得し、メディアデータの特徴量を符号化パラメータ算出部104Cへ出力する。メディア符号化装置10Cにおいて、符号化パラメータ算出部104C、解析精度算出部105Cおよびメディア解析部108は、後述するように、本実施形態における符号化パラメータセット決定部を構成する。
4.2)動作
図13に例示するように、メディア符号化装置10Cは、図2に示す全体的動作をほぼ同じであるが、メディア解析部108によるメディアデータ解析動作(動作S501)を実行した後に、符号化パラメータセット決定動作(動作S502)を実行する点が異なっている。
メディア解析部108は、メディアデータ入力部101からメディアデータを、符号化部102から符号化後のメディアデータをそれぞれ入力し、メディアデータの特徴量cを算出する。特徴量cは、画面の明るさ、動きの大きさなどである。画面の明るさは、入力されたメディアデータの各ピクセルの明度の平均値等を用いて算出することが可能である。また、動きの大きさは、メディアデータの時間差分あるいはフレーム間の差分情報に基づいて符号化されたデータから、動きベクトル情報を抽出することで算出可能である。算出された特徴量cは符号化パラメータ算出部104Cへ通知される。
符号化パラメータ算出部104Cは、メディア解析部108から受け取った特徴量を用いて符号化パラメータセットを決定する。以下、メディアデータが映像の場合を一例として、符号化パラメータセット決定動作について説明する。
解析精度算出部105Cは、すでに述べたように、解析精度を計算式で算出できる場合には、解析精度を算出する関数fが定義されている。関数fは、解析方法(解析エンジンの種類)をk、ビットレートをrb、フレームレートをrf、映像の特徴量をc、解析精度をaとしたとき、
a = f(k, rb, rf, c)
で定義される。したがって、解析精度算出部105は、解析方法kと符号化パラメータセット候補(rb、rf)と特徴量cが与えられると、上記式を用いて解析精度(の予測値)aを算出することができる。
計算式ではなくディープラーニング等を用いて、符号化パラメータセット候補(rb、rf)と特徴量cと解析精度aとの対応を予め学習してテーブルに格納しておき、入力された値に対応する解析精度aの予測値を出力してもよい。
また、H.264とモーションJPEGといった複数の符号化方法が利用できる場合には、符号化方法eを解析精度算出部105の関数fのパラメータに追加し、関数fを
a = f(k, rb, rf, e, c)
と定義してもよい。この場合、eを変更したケースも符号化パラメータセットの候補に追加される。
<動作例>
本実施形態によるメディア符号化装置10Cの動作の一例として、解析エンジンk1が顔認識、解析エンジンk2が物体の動きトラッキングの場合を説明する。この場合、解析エンジンk1およびk2のそれぞれに対応した解析精度a1およびa2は、以下の解析精度関数f1、f2を用いて算出するものとする。
a1 = f1(k1, rb, rf, c)
a2 = f2(k2, rb, rf, c)
解析エンジンk1(顔認識)に対応する関数f1は、特徴量cが顔を十分に認識できないほど明るい(白飛び)あるいは暗い(黒つぶれ)画像を示す場合(例えば逆光時)、有効な顔認識が行えないので、解析精度a1の値は、rbやrfの値が変化しても固定値、例えばゼロとなる。これに対して、解析エンジンk2(物体の動きトラッキング)に対応する関数f2は、同様の特徴量cに対しては解析精度a2の値に影響しない。このような解析エンジンk1およびk2を受信側で使用する場合、解析精度a1およびa2の重み付き和が最も高くなるパラメータセットを符号化パラメータセットとして決定する。これによって、解析エンジンk2による物体の動きトラッキングに適した符号化パラメータセットを設定することができる。
逆に、解析エンジンk2による物体の動きトラッキングは、動きが小さい映像では重要性が小さくなり、解析エンジンk1(顔認識)の方が、低いフレームレートでも有効に機能する。したがって、特徴量cが動きの小さい画像を示す場合、解析エンジンk2(物体の動きトラッキング)に対応する関数f2は、解析精度a2の値は、rbやrfの値が変化しても固定値、例えばゼロとなる。このような動きが小さい映像の場合には、解析精度a1およびa2の重み付き和が最も高くなる符号化パラメータセットを決定することで、解析エンジンk1による顔認識に適した符号化パラメータセットを設定することができる。
なお、メディア解析部108の機能を解析精度算出部105Cに設けることもできる。すなわち、メディアデータ自体をパラメータとして、解析精度算出部105Cが特徴量を算出してもよい。
4.3)効果
本発明の第4実施形態によれば、メディアの特徴量を考慮することで、複数の解析エンジンの重み付き解析精度の和をさらに向上させることが可能となる。上述したように、ある解析エンジンが暗い映像ではビットレートを上げても解析精度が向上しない特性を有する場合、暗い映像でも有効に機能する解析エンジンに適した符号化パラメータセットとすることで解析精度の重み付き和が向上する。同様に、動きの小さい場合には、フレームレートが低くても高い解析精度となる解析エンジンに適した符号化パラメータセットとすることで解析精度の重み付き和が向上する。
5.第5実施形態
上述した第1〜第4実施形態によるメディア符号化装置(10、10A、10Bあるいは10C)は、Raspberry Pi(登録商標)などの小型コンピュータや、スマートフォン等の情報通信装置によって実現されうる。
図14に例示するように、情報通信装置600は、上記各実施形態の符号化パラメータセット決定部をプロセッサ109およびプログラムメモリ110により実装する。プロセッサ109はプログラムメモリ110から図2に示す全体的動作を制御するプログラムと、その中の符号化パラメータセット決定動作(S204)を制御するプログラムと、を読み出して実行する。符号化パラメータセット決定動作(S204)は、上述した第1〜第4実施形態で説明した通りである。プロセッサ109は、情報通信装置600の動作を制御するプロセッサであってもよいし、メディア符号化装置の動作を制御するプロセッサであってもよい。また、符号化部(102、102B、102C)の機能もプロセッサがプログラムを実行することにより実現することができる。
6.システム構成
図15に例示するように、情報通信装置601とサーバ602とがネットワーク603を通して接続された通信システムを考える。情報通信装置601は、上述した各実施形態によるメディア符号化装置604を有する。サーバ602はデータセンタ等に設置され、メディア復号装置605およびメディア解析装置606を有する。ネットワーク603は、例えば携帯電話網とインターネットとの組み合わせである。メディア解析装置606はサーバ602のプロセッサ上で映像解析プログラムを動作させることで実現できる。
メディア符号化装置604は、上述したように、メディア解析装置606のデータ解析に適した形にメディアデータを符号化して送信する。サーバ602では、メディア復号装置605が受信信号をメディアデータに復号し、それをメディア解析装置606が解析する。したがって、メディア符号化装置604の処理能力が低い場合でも精度を大きく下げることなくメディア解析が可能となる。
また、メディア符号化装置604の処理能力が比較的高い場合には、第4実施形態のようにメディア解析部108を設けることで、メディアの特徴量cを算出し、より適した符号化パラメータセットを決定することで、解析精度の更なる向上が可能となる。
7.付記
上述した実施形態および実施例の一部あるいは全部は、以下の付記のようにも記載されうるが、これらに限定されるものではない。
(付記1)
メディアデータを符号化する符号化部と、
前記メディアデータの符号化ビットレートの上限値を入力するビットレート入力部と、
前記メディアデータの解析方法を入力する解析方法入力部と、
前記符号化部に設定する符号化パラメータセットを決定する符号化パラメータ算出部と、
前記解析方法と前記符号化パラメータセットを入力し、前記解析方法における解析精度を算出する解析精度算出部を有し、
前記符号化パラメータ算出部は、前記符号化パラメータセットの候補を複数生成し、前記解析精度算出部を用いて前記候補に対する前記解析精度を算出し、算出した前記解析精度をもとに前記符号化部に設定する前記符号化パラメータセットを決定することを特徴とするメディア符号化装置。
(付記2)
付記1に記載のメディア符号化装置であって、
前記メディアデータが映像データであり、前記符号化パラメータセットが前記映像データのビットレートとフレームレートを含み、
前記符号化パラメータセットの候補は、各々前記フレームレートが異なり、
前記符号化パラメータ算出部は、前記符号化パラメータセットの候補の中で、解析精度が最も高くなる前記符号化パラメータセットを出力することを特徴とするメディア符号化装置。
(付記3)
付記1または2に記載のメディア符号化装置であって、
前記メディアデータが映像データであり、前記解析精度算出部は、前記解析方法と、前記映像データのビットレートとフレームレートが入力されると、前記解析方法における解析精度を出力することを特徴とするメディア符号化装置。
(付記4)
付記2または3に記載のメディア符号化装置であって、
前記符号化パラメータセットが、さらに符号化方法を含み、
前記符号化パラメータセットの候補は、各々前記フレームレートと前記符号化方法が異なることを特徴とするメディア符号化装置。
(付記5)
付記3または4に記載のメディア符号化装置であって、
前記解析精度算出部は、前記解析方法と、前記映像データのビットレートとフレームレートと、前記符号化方法が入力されると、前記解析方法における解析精度を出力することを特徴とするメディア符号化装置。
(付記6)
付記1〜5のいずれかに記載のメディア符号化装置であって、
前記解析方法入力部から複数の解析方法と前記各解析方法の重みが入力され、
前記符号化パラメータ算出部は、前記解析精度の重み付き和が最も高くなる前記符号化パラメータセットを出力することを特徴とするメディア符号化装置。
(付記7)
付記6に記載のメディア符号化装置であって、
前記符号化部は階層符号化技術を使ってメディアデータを符号化し、
前記符号化パラメータセットが、階層数と、各階層のビットレートとフレームレートを含み、
前記符号化パラメータ算出部は、前記解析精度の重み付き和が最も高くなる前記符号化パラメータセットおよび前記各解析方法の前記階層への割り当てを出力することを特徴とするメディア符号化装置。
(付記8)
付記1〜7に記載のメディア符号化装置であって、
前記メディアデータ入力部から入力されたメディアデータ、または、前記符号化部で符号化されたメディアデータの特徴量を算出するメディア解析部を有し、
前記解析精度算出部は、前記メディア解析部での解析結果を用いて前記解析精度を算出することを特徴とするメディア符号化装置。
(付記9)
付記8に記載のメディア符号化装置であって、
前記メディアデータが映像データであり、前記解析精度算出部は、前記解析方法と、前記映像データのビットレートとフレームレートと、前記メディア解析部が出力した前記特徴量が入力されると、前記解析方法における解析精度を出力することを特徴とするメディア符号化装置。
(付記10)
付記1〜9のいずれかに記載のメディア符号化装置を有する第1情報通信装置と、
前記第1情報通信装置とネットワークを通して接続され、前記第1情報通信装置から受信したメディアデータを解析する前記解析方法に対応した解析エンジンを有する第2情報通信装置と、
からなる通信システム。
(付記11)
符号化部がメディアデータを符号化し、
ビットレート入力部が、前記メディアデータの符号化ビットレートの上限値を入力し、
解析方法入力部が、前記メディアデータの解析方法を入力し、
解析精度算出部が、前記解析方法と前記符号化パラメータセットを入力し、前記解析方法における解析精度を算出し、
符号化パラメータ算出部が、前記符号化パラメータセットの候補を複数生成し、前記解析精度算出部を用いて前記候補に対する前記解析精度を算出し、算出した前記解析精度をもとに前記符号化部に設定する前記符号化パラメータセットを決定する、
ことを特徴とするメディア符号化方法。
(付記12)
ネットワークを通して符号化メディアデータを伝送する通信システムにおけるメディア符号化装置としてコンピュータを機能させるプログラムであって、
符号化部がメディアデータを符号化し、
ビットレート入力部が、前記メディアデータの符号化ビットレートの上限値を入力し、
解析方法入力部が、前記メディアデータの解析方法を入力し、
解析精度算出部が、前記解析方法と前記符号化パラメータセットを入力し、前記解析方法における解析精度を算出し、
符号化パラメータ算出部が、前記符号化パラメータセットの候補を複数生成し、前記解析精度算出部を用いて前記候補に対する前記解析精度を算出し、算出した前記解析精度をもとに前記符号化部に設定する前記符号化パラメータセットを決定する、
機能を前記コンピュータに実現するプログラム。
本発明は、監視カメラ、車載カメラ等で撮影した映像・音声の記憶媒体への保存、または、撮影した映像・音声を監視センターへ配信する映像配信システムにおけるメディア符号化に適用できる。
10、10A、10B、10C、604 メディア符号化装置
101 メディアデータ入力部
102、102B、102C 符号化部
103 出力部
104、104A、104B、104C 符号化パラメータ算出部
105、105A、105B、105C 解析精度算出部
106 解析方法入力部
107 ビットレート入力部
108 メディア解析部
109 プロセッサ
110 プログラムメモリ

Claims (10)

  1. ネットワークを通して符号化メディアデータを伝送する通信システムにおけるメディア符号化装置であって、
    メディアデータを符号化パラメータセットに従って符号化し、前記符号化メディアデータを出力する符号化器と、
    前記メディアデータの符号化ビットレートの上限値と前記メディアデータの解析方法に関する情報とを入力する入力部と、
    前記解析方法および前記符号化ビットレートの上限値の条件下で複数の符号化パラメータセット候補を生成し、前記複数の符号化パラメータセット候補ごとに解析精度を算出し、前記算出された解析精度がより高い符号化パラメータセット候補を、前記符号化器へ与える前記符号化パラメータセットとして決定する符号化パラメータセット決定部と、
    を有するメディア符号化装置。
  2. 請求項1に記載のメディア符号化装置であって、
    前記符号化パラメータセット決定部が前記解析方法の解析精度を予め用意された関数式あるいは解析精度テーブルを用いて算出するメディア符号化装置。
  3. 請求項1または2に記載のメディア符号化装置であって、
    前記メディアデータが映像データであり、前記符号化パラメータセットが前記映像データのビットレートとフレームレートを含み、
    前記符号化パラメータセット決定部が前記複数の符号化パラメータセット候補を前記フレームレートが異なるように生成するメディア符号化装置。
  4. 請求項3に記載のメディア符号化装置であって、
    前記符号化パラメータセットが符号化方法を更に含み、
    前記符号化パラメータセット決定部が前記複数の符号化パラメータセット候補を前記フレームレートおよび前記符号化方法の少なくとも一つが異なるように生成するメディア符号化装置。
  5. 請求項1−4のいずれかに記載のメディア符号化装置であって、
    前記入力部が複数の解析方法と各解析方法の重みを入力し、
    前記符号化パラメータセット決定部が、前記複数の解析方法の各々の解析精度の重み付き和が最も高くなる符号化パラメータセット候補を前記符号化パラメータセットとして決定するメディア符号化装置。
  6. 請求項1−5のいずれかに記載のメディア符号化装置であって、
    前記符号化部が前記メディアデータを階層符号化し、
    前記入力部が複数の解析方法と各解析方法の重みを入力し、
    前記符号化パラメータセットが、前記階層符号化の階層数と、各階層のビットレートと、前記解析方法の各階層への割当てと、を含み、
    前記符号化パラメータ決定部が、各階層のビットレートの組合せ候補ごと、および前記複数の解析方法の各階層への割当て候補ごとに解析精度を算出し、前記算出された解析精度がより高い符号化パラメータセット候補を、前記符号化器へ与える前記符号化パラメータセットとして決定するメディア符号化装置。
  7. 請求項1−6のいずれかに記載のメディア符号化装置であって、
    前記メディアデータまたは前記符号化メディアデータからメディア特徴量を算出するメディア解析部を更に有し、
    前記符号化パラメータ決定部が、前記メディア特徴量に基づいて、前記複数の符号化パラメータセット候補ごとに解析精度を算出するメディア符号化装置。
  8. 請求項7に記載のメディア符号化装置であって、
    前記メディアデータが映像データであり、 前記符号化パラメータ決定部が、前記解析方法と、前記映像データのビットレートおよびフレームレートと、前記メディア特徴量とに基づいて前記解析方法における解析精度を算出するメディア符号化装置。
  9. ネットワークを通して符号化メディアデータを伝送する通信システムにおけるメディア符号化方法であって、
    符号化器がメディアデータを符号化パラメータセットに従って符号化し、前記符号化メディアデータを出力し、
    符号化パラメータ決定部が、
    前記メディアデータの符号化ビットレートの上限値と前記メディアデータの解析方法に関する情報とを入力し、前記解析方法および前記符号化ビットレートの上限値の条件下で複数の符号化パラメータセット候補を生成し、
    前記複数の符号化パラメータセット候補ごとに解析精度を算出し、
    前記算出された解析精度がより高い符号化パラメータセット候補を、前記符号化器へ与える前記符号化パラメータセットとして決定する、
    メディア符号化方法。
  10. ネットワークを通して符号化メディアデータを伝送する通信システムにおけるメディア符号化装置としてコンピュータを機能させるプログラムであって、
    メディアデータを符号化パラメータセットに従って符号化し、前記符号化メディアデータを出力する機能と、
    前記メディアデータの符号化ビットレートの上限値と前記メディアデータの解析方法に関する情報とを入力し、前記解析方法および前記符号化ビットレートの上限値の条件下で複数の符号化パラメータセット候補を生成する機能と、
    前記複数の符号化パラメータセット候補ごとに解析精度を算出する機能と、
    前記算出された解析精度がより高い符号化パラメータセット候補を、前記符号化器へ与える前記符号化パラメータセットとして決定する機能と、
    を前記コンピュータに実現するプログラム。

JP2019007878A 2019-01-21 2019-01-21 メディア符号化方法および装置 Active JP7310148B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019007878A JP7310148B2 (ja) 2019-01-21 2019-01-21 メディア符号化方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019007878A JP7310148B2 (ja) 2019-01-21 2019-01-21 メディア符号化方法および装置

Publications (2)

Publication Number Publication Date
JP2020120188A true JP2020120188A (ja) 2020-08-06
JP7310148B2 JP7310148B2 (ja) 2023-07-19

Family

ID=71891288

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019007878A Active JP7310148B2 (ja) 2019-01-21 2019-01-21 メディア符号化方法および装置

Country Status (1)

Country Link
JP (1) JP7310148B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2022091326A1 (ja) * 2020-10-30 2022-05-05

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011234033A (ja) * 2010-04-26 2011-11-17 Panasonic Corp 監視カメラおよび監視システム
JP2013030852A (ja) * 2011-07-26 2013-02-07 Nippon Telegr & Teleph Corp <Ntt> スケーラブル映像符号化装置及び方法及びプログラム
JP2014220732A (ja) * 2013-05-10 2014-11-20 株式会社リコー 情報処理装置、情報処理方法およびプログラム
US20160057432A1 (en) * 2014-08-25 2016-02-25 Renesas Electronics Corporation Image communication apparatus, image transmission apparatus, and image reception apparatus

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011234033A (ja) * 2010-04-26 2011-11-17 Panasonic Corp 監視カメラおよび監視システム
JP2013030852A (ja) * 2011-07-26 2013-02-07 Nippon Telegr & Teleph Corp <Ntt> スケーラブル映像符号化装置及び方法及びプログラム
JP2014220732A (ja) * 2013-05-10 2014-11-20 株式会社リコー 情報処理装置、情報処理方法およびプログラム
US20160057432A1 (en) * 2014-08-25 2016-02-25 Renesas Electronics Corporation Image communication apparatus, image transmission apparatus, and image reception apparatus
JP2016046707A (ja) * 2014-08-25 2016-04-04 ルネサスエレクトロニクス株式会社 画像通信装置、画像送信装置および画像受信装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JENS-RAINER OHM, ET AL.: "SVC Requirements Specified by MPEG (ISO/IEC JTC 1 / SC 29 / WG 11)", JOINT VIDEO TEAM (JVT) OF ISO/IEC MPEG & ITU-T VCEG (ISO/IEC JTC1/SC29/WG11 AND ITU-T SG16 Q.6) 14TH, vol. JVT-N026, JPN6023005550, 20 April 2005 (2005-04-20), pages 1 - 31, ISSN: 0004988105 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2022091326A1 (ja) * 2020-10-30 2022-05-05
WO2022091326A1 (ja) * 2020-10-30 2022-05-05 富士通株式会社 サーバ、制御方法、および制御プログラム
JP7400991B2 (ja) 2020-10-30 2023-12-19 富士通株式会社 サーバ、制御方法、および制御プログラム

Also Published As

Publication number Publication date
JP7310148B2 (ja) 2023-07-19

Similar Documents

Publication Publication Date Title
JP7229261B2 (ja) ビデオ符号化のビットレート制御方法、装置、機器、記憶媒体及びプログラム
CN103650509B (zh) 基于照相机和背景运动的参考帧缓冲区的自适应配置
EP3008903B1 (en) Screen map and standards-based progressive codec for screen content coding
CN114556429A (zh) 针对点云压缩的预测编码
KR101717915B1 (ko) 동적 생성 그래픽 자원들에 대한 압축 기술들
JP5461419B2 (ja) 画素予測値生成手順自動生成方法、画像符号化方法、画像復号方法、それらの装置、それらのプログラム、およびこれらのプログラムを記録した記録媒体
KR101650742B1 (ko) 인터-레이어 인트라 모드 예측
WO2010037310A1 (zh) 多路视频通信方法与系统
CN110248192B (zh) 编码器切换、解码器切换、屏幕分享方法和屏幕分享系统
WO2013000304A1 (zh) 环路滤波编解码方法及装置
JP2015508954A (ja) オブジェクト検出情報に基づく符号化
CN112866746A (zh) 一种多路串流云游戏控制方法、装置、设备及存储介质
WO2013165812A1 (en) Data transfer reduction during video broadcasts
KR20230028250A (ko) 강화 학습 기반 속도 제어
JP2016506165A (ja) インターレイヤの動きデータ継承
JP5774623B2 (ja) スケーラブルビデオ伝送のレート最適化
JP2020120188A (ja) メディア符号化方法および装置
US10051281B2 (en) Video coding system with efficient processing of zooming transitions in video
JP2020150512A (ja) メディア符号化方法および装置
WO2023169424A1 (zh) 编解码方法及电子设备
CN116437088A (zh) 图像缓存区的更新方法、装置、服务器及存储介质
CN113099241B (zh) 参考帧列表更新方法、装置、设备以及存储介质
JP6781445B1 (ja) 情報処理方法
JP6497874B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP6005292B2 (ja) ビデオ符号化及び復号のためのヒストグラム分割ベースのローカル適応フィルタ

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230403

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230619

R151 Written notification of patent or utility model registration

Ref document number: 7310148

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151