本発明はビデオ符号化の分野に関し、より詳細には、1つまたは複数のオーバーレイを有するビデオを符号化することに関する。
ビデオを表示するとき、多くの場合、オーバーレイをビデオに対して適用することが望ましい。たとえば、監視シナリオでは、ビデオがいつキャプチャされたかを示すタイムスタンプを有することが有用である。いくつかの異なるカメラからのビデオが、制御センターなど、1つのロケーションにおいて閲覧され得る場合、オペレータは、たとえば、「カメラ5」または「ローディングドック(Loading dock)」を指示する、ラベルが表示される場合、特定のビデオシーケンスがどこでキャプチャされたかをより容易に位置特定し得る。ビデオ分析がビデオに対して実行される場合、イベントのインジケータが、オーバーレイの形式で適用され得る。一例として、オブジェクト検出アルゴリズムが人間を検出した場合、その人間を囲むバウンディングボックスが、オーバーレイとしてビデオに対して適用され得る。ロゴタイプの形式でのオーバーレイが、ブロードキャスティングにおいて広く使用され、監視など、他の適用例においても使用され得る。そのようなロゴタイプは、しばしば、静的であるが、たとえば、キャプチャされたシーンが静的である場合でも、ビデオストリームが依然としてライブであることを指示するために、動的であり得る。同様に、サブタイトルが、オーバーレイとして適用され得る。オーバーレイの別の適用例は、あるビデオストリームが別のビデオストリームの前に表示される、ピクチャインピクチャである。
オーバーレイは、異なるやり方でビデオに適用され得る。1つの共通の手法は、オーバーレイが適用されるべきであるピクセルロケーションにおいて、キャプチャされたビデオのピクセルデータをオーバーレイのピクセルデータと置き換えることである。これは、それらのピクセルロケーションにおける元のピクセルデータが失われることを意味する。
ブロードキャスティングでは、フィルムまたはTVショーなど、元のビデオシーケンスは、通常、たとえば、テレビ局ロゴタイプによって後で覆われるエリアが重要でないようなやり方でキャプチャされるので、オーバーレイの適用は通常、問題がない。ビデオシーケンスはまた、概して、オーバーレイなしに制作会社から入手可能である。監視など、他の適用例では、シーン中のイベントはほとんど筋書きがなく、興味深い詳細またはオブジェクトが、オーバーレイによって覆われることになるエリアに出現し得る。時々、これは、オペレータにとって単に厄介なことになるが、科学捜査使用の場合、これは重大であり得る。
この問題の1つの解決策は、オーバーレイを伴うビデオシーケンスとオーバーレイを伴わないビデオシーケンスの両方を送信および記憶することである。しかしながら、十分な画像品質が維持されるべきである場合、送信帯域幅が、このことを実現不可能にし得る。さらに、同じビデオシーケンスの2つのバージョンの記憶は、記憶容量に関する要件を増加させ、記憶容量は、しばしば、監視またはモニタリングシステムのコストの大部分を担う。
それゆえに、オーバーレイを伴うビデオを符号化するための改善された方法およびシステムが必要である。
本発明の目的は、オーバーレイによって覆われたビデオデータにアクセスすることを可能にする、ビデオを符号化する方法を提供することである。
本発明の目的は、許容できる画像品質を維持しながら、帯域幅および記憶域要件を制限することを可能にする、オーバーレイを伴うビデオを符号化する方法を提供することでもある。
本発明の別の目的は、符号化されたビデオの科学捜査使用性を改善する、オーバーレイを伴うビデオを符号化するためのシステムを提供することである。
また別の目的は、送信帯域幅または記憶容量の必要を過度に増加させることなしに、有用なビデオの提供を可能にする符号化システムを提供することである。
第1の態様によれば、これらおよび他の目的は、ビデオデータを符号化する方法によって、全体的にまたは少なくとも部分的に達成され、本方法は、第1の入力画像フレームと第2の入力画像フレームとを含む画像シーケンスを受信することと、画像シーケンスに適用されるべきオーバーレイを受信することであって、オーバーレイが、ピクチャ要素と、ピクチャ要素を第1の入力画像フレームおよび第2の入力画像フレーム中に配置するための空間座標とを含む、オーバーレイを受信することと、空間座標に従ってピクチャ要素を第1の入力画像フレームおよび第2の入力画像フレームに追加し、それにより、第1の生成された画像フレームと第2の生成された画像フレームとを含むオーバーレイされた画像シーケンスを生成することと、オーバーレイを伴わない出力画像フレームと、オーバーレイを伴う対応する出力画像フレームとを含んでいるビデオストリームを符号化することとを含み、第1の入力画像フレームは、第1の出力画像フレームを形成するためにイントラフレーム(intra-frame)として符号化され、第2の入力画像フレームは、第2の出力画像フレームを形成するために第1の出力画像フレームを参照してインターフレーム(inter-frame)として符号化され、第1の生成された画像フレームは、第1のオーバーレイされた出力画像フレームを形成するために第1の出力画像フレームを参照してインターフレームとして符号化され、第2の生成された画像フレームは、第2のオーバーレイされた出力画像フレームを形成するためにインターフレームとして符号化され、第2の生成された画像フレームの第1の部分は、第1のオーバーレイされた出力画像フレームを参照して符号化され、第2の生成された画像フレームの第2の部分は、第2の出力画像フレームを参照して符号化される。そのような方法は、効率的な様式でオーバーレイを伴うビデオおよびオーバーレイを伴わないビデオを送信することを可能にする。オーバーレイを伴うフレームまたはオーバーレイを伴わないフレームのどちらを参照フレームとして使用すべきかを賢明に選択することによって、オーバーレイを伴うビデオとオーバーレイを伴わないビデオが、単に、別個に符号化された場合に生じたであろうビットレート増加が抑制され得る。
第1の出力画像フレームおよび第1のオーバーレイされた出力画像フレームは両方とも、第1のピクチャ順序カウントで符号化され得、第2の出力画像フレームおよび第2のオーバーレイされた出力画像フレームは両方とも、第2のピクチャ順序カウントで符号化され得る。このようにして、デコーダは、出力画像フレームとオーバーレイされた出力画像フレームとが同じフレームのバージョンであることを通知され得る。
本方法のいくつかの変形態では、第1の出力画像フレームおよび第2の出力画像フレームは各々、非表示インジケータを伴って符号化される。このようにして、符号化されたシーケンスが、オーバーレイを伴わない画像フレームをも含んでいるにもかかわらず、オーバーレイを伴う画像フレームのみが表示されることになる。使用されるビデオ圧縮規格に応じて、非表示インジケータは、「表示無し(no display)SEIメッセージ」または「非表示(non-display)フラグ」など、異なる形式をとり得る。
第2の生成されたフレームの第1の部分は、ピクチャ要素の少なくとも一部分を含んでいることがある。したがって、第2の生成されたフレームのマクロブロックまたはピクセルグループが、オーバーレイが適用される場所に位置する場合、そのマクロブロックまたはピクセルグループは、第1のオーバーレイされた出力画像フレームを参照して符号化され得る。これは、特にオーバーレイが静的である場合、第1の生成されたフレームと第2の生成されたフレームとの間の時間的冗長性を利用する。第1の部分は、マクロブロックまたは対応するコーディングユニット、あるいはいくつかのそのようなマクロブロックまたはコーディングユニットであり得る。
第2の生成されたフレームの第2の部分は、オーバーレイの空間座標の外側にあり得る。したがって、第2の生成されたフレームのマクロブロックまたはピクセルグループが、オーバーレイが適用されない場所に位置する場合、そのマクロブロックまたはピクセルグループは、第2の出力画像フレームを参照して符号化され得る。これによって、符号化された第2の出力画像が使用され、符号化された第2の出力画像は、オーバーレイを除いて、第2のオーバーレイされた出力画像フレームと概して同一であり、したがって、符号化作業が繰り返される必要がないので、符号化が効率的であり得る。第1の部分について論じられたのと同様に、第2の部分は、マクロブロックまたは対応するコーディングユニット、あるいはいくつかのそのようなマクロブロックまたはコーディングユニットであり得る。
いくつかの変形態では、本方法は、画像シーケンスに適用されるべき追加のオーバーレイを受信することであって、追加のオーバーレイが、追加のピクチャ要素と、追加のピクチャ要素を第1の入力画像フレームおよび第2の入力画像フレーム中に配置するための追加の空間座標とを含む、追加のオーバーレイを受信することと、追加の空間座標に従って追加のピクチャ要素を第1の入力画像フレームおよび第2の入力画像フレームに追加し、それにより、第1の追加の生成された画像フレームと第2の追加の生成された画像フレームとを含む追加のオーバーレイされた画像シーケンスを生成することとをさらに含み、オーバーレイを伴わない出力画像フレームとオーバーレイを伴う対応する出力画像フレームとを含んでいるビデオストリームを符号化することが、さらに、追加のオーバーレイを伴う対応する出力画像フレームを符号化することを含み、第1の追加の生成された画像フレームは、第1の追加のオーバーレイされた出力画像フレームを形成するために第1の出力画像フレームを参照してインターフレームとして符号化され、第2の追加の生成された画像フレームは、第2の追加のオーバーレイされた出力画像フレームを形成するためにインターフレームとして符号化され、第2の追加の生成された画像フレームの第1の部分は、第1の追加のオーバーレイされた出力画像フレームを参照して符号化され、第2の追加の生成された画像フレームの第2の部分は、第2の出力画像フレームを参照して符号化される。ビデオシーケンスに対して適用される任意の数の異なるオーバーレイを符号化するために、同じ原理が使用され得ることがわかり得る。
第2の追加の生成されたフレームの第1の部分は、追加のピクチャ要素の少なくとも一部分を含んでいることがある。ただ1つのオーバーレイを伴うビデオを符号化するときと同様に、これは、追加のオーバーレイの効率的な符号化を可能にする。
同様に、第2の追加の生成されたフレームの第2の部分は、追加のオーバーレイの追加の空間座標の外側にあり得る。1つのオーバーレイの場合のように、これは、符号化作業を制限することを可能にする。
第2の態様によれば、上述の目的は、ビデオ符号化システムによって、全体的にまたは少なくとも部分的に達成され、ビデオ符号化システムは、第1の入力画像フレームおよび第2の入力画像フレームを含む画像シーケンスを受信するように構成された画像受信機と、画像シーケンスに適用されるべきオーバーレイを受信するように構成されたオーバーレイ受信機であって、オーバーレイが、ピクチャ要素と、ピクチャ要素を第1の入力画像フレームおよび第2の入力画像フレーム中に配置するための空間座標とを含む、オーバーレイ受信機と、空間座標に従ってピクチャ要素を第1の入力画像フレームおよび第2の入力画像フレームに追加し、それにより、第1の生成された画像フレームと第2の生成された画像フレームとを含むオーバーレイされた画像シーケンスを生成するように構成されたオーバーレイアプリケータと、オーバーレイを伴わない出力画像フレームと、オーバーレイを伴う対応する出力画像フレームとを含んでいるビデオストリームを符号化するように構成されたエンコーダとを備え、第1の入力画像フレームは、第1の出力画像フレームを形成するためにイントラフレームとして符号化され、第2の入力画像フレームは、第2の出力画像フレームを形成するために第1の出力画像フレームを参照してインターフレームとして符号化され、第1の生成された画像フレームは、第1のオーバーレイされた出力画像フレームを形成するために第1の出力画像フレームを参照してインターフレームとして符号化され、第2の生成された画像フレームは、第2のオーバーレイされた出力画像フレームを形成するためにインターフレームとして符号化され、第2の生成された画像フレームの第1の部分は、第1のオーバーレイされた出力画像フレームを参照して符号化され、第2の生成された画像フレームの第2の部分は、第2の出力画像フレームを参照して符号化される。そのようなシステムは、オーバーレイを伴う画像およびオーバーレイを伴わない画像のシーケンスを符号化することを可能にし、したがって、オーバーレイによって覆われた場合に失われるであろうビデオデータが、依然としてアクセス可能である。本システムは、有用な画像品質を維持しながら、帯域幅および記憶域要件の過度の増加を回避することをも可能にする。
ビデオ符号化システムのいくつかの実施形態では、エンコーダは、第1の出力画像フレームおよび第2の出力画像フレームの各々を非表示インジケータを伴って符号化するように構成される。したがって、符号化されたビデオシーケンスが、オーバーレイを伴う画像フレームならびにオーバーレイを伴わない画像フレームを含んでいる場合でも、オーバーレイを伴う画像フレームのみが表示される。オーバーレイを伴わない画像フレームは、後で使用するために、依然として記憶され得る。上述のように、非表示インジケータは、使用されるビデオ圧縮規格に応じて様々なやり方で実装され得る。
いくつかの実施形態では、オーバーレイ受信機は、画像シーケンスに適用されるべき追加のオーバーレイを受信するようにさらに構成され、追加のオーバーレイは、追加のピクチャ要素と、追加のピクチャ要素を第1の入力画像フレームおよび第2の入力画像フレーム中に配置するための追加の空間座標とを含み、オーバーレイアプリケータは、追加の空間座標に従って追加のピクチャ要素を第1の入力画像フレームおよび第2の入力画像フレームに追加し、それにより、第1の追加の生成された画像フレームと第2の追加の生成された画像フレームとを含む追加のオーバーレイされた画像シーケンスを生成するようにさらに構成され、エンコーダは、追加のオーバーレイを伴う対応する出力画像フレームをさらに含んでいるビデオストリームを符号化するように構成され、第1の追加の生成された画像フレームは、第1の追加のオーバーレイされた出力画像フレームを形成するために第1の出力画像フレームを参照してインターフレームとして符号化され、第2の追加の生成された画像フレームは、第2の追加のオーバーレイされた出力画像フレームを形成するためにインターフレームとして符号化され、第2の追加の生成された画像フレームの第1の部分は、第1の追加のオーバーレイされた出力画像フレームを参照して符号化され、第2の追加の生成された画像フレームの第2の部分は、第2の出力画像フレームを参照して符号化される。そのようなシステムは、1つまたは複数の追加のオーバーレイを適用することが望まれるときにも、オーバーレイを伴うおよびオーバーレイを伴わないビデオシーケンスの効率的な符号化を可能にする。
第3の態様によれば、上述の目的は、第1の態様による符号化システムと、復号システムとを備えるビデオ送信システムによって、全体的にまたは少なくとも部分的に達成され、復号システムは、符号化システムから符号化されたビデオストリームを受信するように構成されたビデオ受信機と、符号化されたビデオストリームを復号するように構成されたデコーダとを備える。そのようなビデオ送信システムは、オーバーレイを伴うビデオデータおよびオーバーレイを伴わないビデオデータを効率的なやり方で送信する可能性を提供し、オーバーレイによって隠されるであろうビデオデータへのアクセスを可能にする。
デコーダは、エンコーダについて上述されたことと同様に、非表示インジケータを伴う第1の出力画像および第2の出力画像を復号するように構成され得る。
ビデオ送信システムは、トランスコーダをさらに備え得、トランスコーダはデコーダを備え、トランスコーダは、オーバーレイを伴わない復号された画像フレームを含んでいる第1の復号されたビデオストリームを形成するために、第1の出力画像フレームおよび第2の出力画像フレームを復号することと、オーバーレイを伴う復号された画像フレームを含んでいる第2の復号されたビデオストリームを形成するために、第1のオーバーレイされた出力画像フレームおよび第2のオーバーレイされた出力画像フレームを復号することとを行うように構成される。これは、オーバーレイを伴うビデオシーケンスとオーバーレイを伴わないビデオシーケンスを、別個に扱うことを可能にする。たとえば、オーバーレイを伴わない第1の復号されたビデオストリームは、可能な、後の科学捜査使用のために記憶され得、オーバーレイを伴う第2の復号されたビデオストリームは、たとえば、制御センターに送信され得、オペレータに表示され得る。いくつかのシナリオでは、第1の復号されたビデオストリームは、オーバーレイを伴わないビデオストリームを見る必要があるユーザに送信され得、第2の復号されたビデオストリームは、オーバーレイを伴うビデオストリームを見るべきであるユーザに送信され得る。
第4の態様によれば、上述の目的は、第2の態様による符号化システムを備えるカメラによって、全体的にまたは少なくとも部分的に達成される。
本発明の適用可能性のさらなる範囲は、以下の発明を実施するための形態から明らかになろう。しかしながら、本発明の範囲内の様々な変更および修正が、発明を実施するための形態から当業者に明らかになるので、発明を実施するための形態および具体的な例は、本発明の好ましい実施形態を示すが、例示として与えられるものにすぎないことを理解されたい。
それゆえに、説明されるデバイスおよび説明される方法は変わり得るので、本発明は、そのようなデバイスの具体的な構成要素部分、またはそのような方法のステップに限定されないことを理解されたい。本明細書で使用される用語は、特定の実施形態を説明するためのものにすぎず、限定するものではないことも理解されたい。本明細書および添付の特許請求の範囲において使用される、冠詞「a」、「an」、「the」、および「said」は、コンテキストが別段に明白に規定しない限り、要素のうちの1つまたは複数があることを意味するものとすることに留意されなければならない。したがって、たとえば、「1つの(an)オブジェクト」または「その(the)オブジェクト」への言及は、数個のオブジェクトなどを含み得る。その上、「備える、含む(comprising)」という単語は、他の要素またはステップを除外しない。
次に、例として、および添付の概略図を参照しながら、本発明がより詳細に説明される。
シーンの画像の図である。
オーバーレイが適用された図1の画像の図である。
入力画像フレームのシーケンスと、対応するオーバーレイされた画像シーケンスとの概略表現の図である。
図3中の画像フレームに対応するオーバーレイを伴う出力画像フレームとオーバーレイを伴わない出力画像フレームとを含んでいる、符号化された画像ストリームの概略表現の図である。
図2のオーバーレイされた画像の区分の例の図である。
変形態による、ビデオを符号化する方法のフローチャートである。
図6における方法の一部のフローチャートである。
ビデオ符号化システムの一実施形態のブロック図である。
図5の場合のようなビデオ符号化システムを有するカメラのブロック図である。
ビデオ送信システムの一実施形態のブロック図である。
図1では、画像1が示されており、図2では、対応する画像1’が示されており、オーバーレイ10が画像1’に適用されている。以下でさらに説明されるように、オーバーレイ10は、ピクチャ要素11と、ピクチャ要素11が画像1’中のどこに適用されるべきであるかを指定する空間座標とを含む。ピクチャ要素11は、テキストストリングなどのいくつかの異なるフォーマットで、ベクトルベースのフォーマットで、またはビットマップとして受信され得る。示された例では、オーバーレイ10は静的であり、ピクチャ要素11は、テキスト、「Cam1」であり、オペレータに対して画像をキャプチャするカメラを識別する。さらに、この例では、追加のオーバーレイ20もあり、追加のオーバーレイ20は、追加のピクチャ要素21と、画像1’中のどこに追加のピクチャ要素21を適用するかを指定する追加の空間座標とを含む。追加のオーバーレイ20は動的であり、追加のピクチャ要素21は、画像1’がキャプチャされた時間を表示する。示されたオーバーレイの数は決して限定するものではないことと、本発明は1つまたは複数のオーバーレイとともに使用され得ることに、留意されたい。2つまたはそれ以上のオーバーレイの場合、それらのオーバーレイが静的なオーバーレイまたは動的なオーバーレイの任意の組合せであり得ることにも留意されたい。
以下では、少なくとも1つのオーバーレイを伴うビデオシーケンスの符号化が説明される。このコンテキストでは、オーバーレイを伴わない画像1は、第1の入力画像フレーム1と呼ばれ、オーバーレイを伴う対応する画像1’は、オーバーレイを第1の入力画像フレーム1に追加することによってオーバーレイを伴う画像1’が生成されるので、第1の生成された画像フレーム1’と呼ばれることになる。
図3は、第1の入力画像フレーム1と、第2の入力画像フレーム2と、第3の入力画像フレーム3とを含む画像のシーケンスを例示する。図6を参照すると、この画像シーケンスは、ステップS1において受信される。また、第1の生成された画像フレーム1’と、第2の生成された画像フレーム2’と、第3の生成された画像フレーム3’とを含む、オーバーレイを伴う画像の対応するシーケンスが示されている。オーバーレイ10および追加のオーバーレイ20は、ステップS2において受信される。
生成された画像フレーム1’、2’、3’は、空間座標および追加の空間座標によって規定されたロケーションにおいてピクチャ要素11および追加のピクチャ要素20を入力画像フレーム1、2、3に追加することによって、生成される。図6では、これは、ステップS3として指示されている。静的なオーバーレイ10は、各生成された画像1’~3’中で同じであるが、動的なオーバーレイ20は、画像キャプチャ中の時間の経過に従って、生成された画像ごとに変わる。
オーバーレイを伴うおよびオーバーレイを伴わないビデオシーケンスを送信および記憶することを可能にするために、ビデオシーケンスは、画像フレームを表すために必要とされるビット数を低減するために、符号化される。符号化は、様々なビデオ圧縮規格に従って、たとえば、H.264またはH.265規格に従って行われ得る。本発明によれば、符号化は、特に、オーバーレイを伴うビデオシーケンスの効率的な符号化を可能にし、オーバーレイを伴わないビデオシーケンスへのアクセスをも許可するように修正される。図6では、符号化は、ステップS4として指示されている。符号化のより詳細な例示のために、図7への参照が行われる。
図4中の画像フレーム間の矢印は、特定の画像フレーム1~3または生成された画像フレーム1’~3’を符号化するためにどの参照フレームが使用されるかを指示する。
次に、図3~図7を参照しながら、本発明による符号化の一例が説明される。図4は、図3に類似するが、符号化された画像フレームを示している。入力画像フレーム1~3および生成された画像フレーム1’~3’を符号化するとき、第1の入力画像フレーム1は、イントラフレームとして、すなわち他の画像フレームへの参照なしに符号化される(S41)。この符号化されたフレームは、第1の出力画像フレーム1Eと呼ばれることになる。これは、使用されたビデオ圧縮規格に従って通常行われるのと同じやり方で行われる。第1の生成された画像フレーム1’は、参照フレームとして第1の出力画像フレームの復号されたバージョンを用いてインターフレームとして符号化され(S42)、第1のオーバーレイされた出力フレーム1’Eを形成する。オーバーレイ10および追加のオーバーレイ20を除いて、第1の生成された画像フレーム1は、第1の入力画像フレームと同一である。したがって、オーバーレイのいずれをも含んでいない、第1の生成された画像フレーム1’の部分について、スキップブロックを使用してインターフレーム符号化が有利に行われ得、これは、符号化されたマクロブロックのデータが参照フレームからコピーされることを意味する。オーバーレイを含んでいる、第1の生成された画像1’の部分を、インターコーディング(inter-coding)を使用して、すなわちPブロックとして符号化することも可能であるが、第1の入力画像フレームがオーバーレイを含んでいないので、オーバーレイのエリアおよび追加のオーバーレイのエリアにおいて、マクロブロックをイントラコーディング(intra-coding)によって、すなわちIブロックとして符号化することが、たいていの場合、より効率的であろう。第1の生成された画像フレームのインターフレーム符号化は、通常と同じやり方で行われる。
第2の入力画像フレーム2は、第1の出力画像フレーム1の復号されたバージョンを参照してインターフレームとして符号化され(S43)、第2の出力画像フレーム2Eを形成する。これも、圧縮規格について通常通り行われる。
第2の生成された画像フレーム2’は、インターフレームとして符号化され(S44)、第2のオーバーレイされた出力フレーム2’Eを形成する。第1の入力画像フレーム1および第2の入力画像フレーム2、および第1の生成された画像フレーム1’とは異なり、第2の生成された画像フレーム2’は、2つの参照フレームを使用して符号化される。参照フレームの選択は、第2の生成された画像フレーム2’の異なる部分について、異なる。図5を参照すると、第2の生成された入力フレーム2’は、2つの部分、すなわち、オーバーレイが位置する第1の部分Aと、オーバーレイがない第2の部分Bとに分割される。分割は、様々なやり方で行われ得る。図5aでは、第2の生成された画像フレーム2’は、単に2つに等分される。図5bでは、第1の部分Aは、画像フレームの上部の細長い部分である。図5cでは、第1の部分Aは、2つのエリア、すなわち、各オーバーレイを囲むエリアからなり、図5dでは、第1の部分Aは、オーバーレイ10の一部を含んでいるマクロブロックであり、第2の部分Bは、オーバーレイを含んでいないマクロブロックである。
以下では、第1の部分Aが、オーバーレイ10のエリア中のマクロブロックであり、第2の部分Bが、オーバーレイがない画像のエリア中の、すなわち、空間座標および追加の空間座標の外側のマクロブロックであることが仮定される。第1の部分Aを符号化するとき、第1のオーバーレイされた出力フレーム1’Eは、ステップS441において指示されているように、参照フレームとして使用される。第1の部分Aは、オーバーレイ10の少なくとも一部を含んでいるので、特に、オーバーレイ10が静的である場合には、第1の部分Aは、第2の出力画像フレーム2Eよりも第1のオーバーレイされた出力フレーム1’Eの対応する部分に類似する可能性がある。第1の入力画像フレーム1が第2の入力画像フレーム2とは大きく異なるように、シーン中に多くの動きがある場合、特に、第1の部分Aの小さい部分のみがオーバーレイ10によって覆われた場合には、参照フレームとして第2の出力画像フレーム2Eを使用することがより効率的であり得る。これは、フレームごとに変わる多くのピクセルがあるので、追加のオーバーレイ20など、オーバーレイが動的である場合の事例でもあり得る。したがって、第1の部分Aがオーバーレイ10によって部分的にのみ覆われた場合に選択が行われ得、したがって、第1のオーバーレイされた出力フレーム1’Eであろうと第2の出力画像フレーム2Eであろうと、最小ビットレートを生じる可能性が最も高い参照フレームが選択され得る。
第2のオーバーレイされた画像フレーム2’の第2の部分Bを符号化するとき、第2の出力画像フレーム2Eが、ステップS442に指示されているように参照として使用される。第2の部分はオーバーレイ10、20の外側にあるので、第2の部分は、第2の出力画像フレーム2Eの対応する部分と本質的に同一であるはずである。
符号化は、次いで、第3の入力画像フレーム3および第3の生成された画像フレーム3’について同じやり方で続く。したがって、第3の出力画像フレームは、参照フレームとして第2の出力画像フレーム2Eを使用して、インターフレームとして符号化される。第3の生成された画像フレーム3’も、インターフレームとして符号化されるが、画像フレームの異なる部分について異なる参照フレームを用いる。第2のオーバーレイされた出力画像フレーム2’Eは、オーバーレイ10または追加のオーバーレイ20の一部を含んでいる、第3の生成された画像フレームのマクロブロックを符号化するとき、参照として使用され、第3の出力画像フレーム3Eは、オーバーレイ10および追加のオーバーレイの外側に位置するマクロブロックを符号化するときに、参照フレームとして使用される。
符号化は、ピクチャグループ(group of pictures)、手短に言えばGOPの終端に達するまで、このように続く。ピクチャグループの長さは、GOP長とも呼ばれ、これは、固定されるか、ユーザによって設定されるか、または動的に制御され得る。新しいGOPが開始されるとき、符号化は、ステップS41において指示されているように、イントラフレームからもう一度開始し、そのGOPの終端に達するまで、ステップS42、S43、S44、S441、およびS442におけるようにインターフレームが続く。
上記で説明された方法では、同じストリーム中のオーバーレイを伴う画像フレームおよびオーバーレイを伴わない画像フレームを符号化することが可能である。オーバーレイを伴う画像を符号化するための2つの異なる参照フレームの使用は、2つのバージョンの各画像フレームを符号化するために必要とされるビット数を制限する。示された例では、2つのオーバーレイがあるが、本方法は、1つ、または3つ以上のオーバーレイが使用される場合に、等しく適用可能である。
符号化されたビデオシーケンスが、たとえば、制御センターにおいてリアルタイムで表示されるべきであるとき、または記録から再生されるべきであるとき、所望の画像を表示するために異なる手段がとられ得る。たとえば、H.265規格は、非表示フラグのサポートを有する。これは、画像フレームが符号化されるとき、画像フレームが非表示フラグでマークされ得、適合デコーダがその画像フレームを復号するとき、適合デコーダが非表示フラグを読み取り、したがってその画像フレームが表示されないことを意味する。本発明がH.265コーデックにおいて実装される場合、この特徴は、オーバーレイされた出力画像フレームのみが、復号後に表示されることを確実にするために使用され得る。したがって、各出力画像フレーム1E~3Eは、非表示フラグを伴って符号化される。これによって、符号化および復号されたビデオシーケンスは、オーバーレイを伴う画像およびオーバーレイを伴わない画像を含んでいるが、オーバーレイを伴う画像のみが表示される。
非表示フラグをサポートしない、H.264など、ビデオ圧縮規格もある。そのような場合、出力画像フレーム1E~3Eが非表示フラグを伴って符号化された場合、規格H.264デコーダは、意図されたようにこれらを扱わない。したがって、非表示フラグを扱うようにプログラムされた、修正されたデコーダが使用される必要がある。
次に、図8を参照しながら、本発明の一実施形態による符号化システムが説明される。画像受信機81を有する、符号化システム80が示されている。画像受信機81は、上記で説明されたように、第1の入力画像フレームと第2の入力画像フレームとを含む画像シーケンスを受信するように構成される。符号化システムは、オーバーレイ受信機82とオーバーレイアプリケータ83とをさらに備える。オーバーレイ受信機82は、画像シーケンスに適用されるべきオーバーレイを受信するように構成され、オーバーレイは、ピクチャ要素と、ピクチャ要素を第1の入力画像フレームおよび第2の入力画像フレーム中に配置するための空間座標とを含む。オーバーレイアプリケータ83は、空間座標に従ってピクチャ要素を第1の入力画像フレームおよび第2の入力画像フレームに追加し、それにより、第1の生成された画像フレームと第2の生成された画像フレームとを含むオーバーレイされた画像シーケンスを生成するように構成される。ビデオ符号化システム80はエンコーダ84をも備え、エンコーダ84は、オーバーレイを伴わない出力画像フレームと、オーバーレイを伴う対応する出力画像フレームとを含んでいるビデオストリームを符号化するように構成される。上記で説明されたように、符号化するとき、エンコーダは、第1の出力画像フレームを形成するためにイントラフレームとして第1の入力画像フレームを符号化することと、第2の出力画像フレームを形成するために第1の出力画像フレームを参照してインターフレームとして第2の入力画像フレームを符号化することと、第1のオーバーレイされた出力画像フレームを形成するために第1の出力画像フレームを参照してインターフレームとして第1の生成された画像フレームを符号化することと、第2のオーバーレイされた出力画像フレームを形成するためにインターフレームとして第2の生成された画像フレームを符号化することとを行うように構成され、第2の生成された画像フレームの第1の部分は、第1のオーバーレイされた出力画像フレームを参照して符号化され、第2の生成された画像フレームの第2の部分は、第2の出力画像フレームを参照して符号化される。ビデオ符号化システム80は、上記で説明された本方法に従って動作され得、したがって、動作はここでさらに説明されない。
図9を参照すると、符号化システム80は、カメラ90に組み込まれ得る。カメラ90は、レンズ91と、画像をキャプチャするための画像センサー92と、画像を処理するための画像プロセッサ93とを有する。カメラ90は他の構成要素も備え得るが、他の構成要素は本発明に関連しないので、他の構成要素は、図9に示されておらず、ここで説明されないことを諒解されたい。ビデオ符号化システム80は、カメラに組み込まれる必要はなく、別個のユニットとして構成されるか、または別のデバイスに組み込まれ得ることに留意されたい。
図10を参照すると、本発明の一実施形態による送信システム100が説明される。ビデオ送信システム100は、上記で説明されたビデオ符号化システム80と、復号システム101とを備える。復号システム101は、符号化システム80から、符号化されたビデオストリームを受信するように構成されたビデオ受信機102と、符号化されたビデオストリームを復号するように構成されたデコーダ103とを備える。
復号されたビデオシーケンスは、閲覧されるか、またはデコーダのロケーションに直接記憶され得る。符号化システム80が、出力画像フレームを非表示フラグを伴って符号化したかどうかにかかわらず、デコーダは、非表示フラグを伴う出力画像フレームを復号するように構成され得る。
デコーダ103は、トランスコーダ104の一部であり得、トランスコーダ104は、オーバーレイを伴わない復号された画像フレームを含んでいる第1の復号されたビデオストリームを形成するために、第1の出力画像フレームおよび第2の出力画像フレームを復号し、オーバーレイを伴う復号された画像フレームを含んでいる第2の復号されたビデオストリームを形成するために、第1のオーバーレイされた出力画像フレームおよび第2のオーバーレイされた出力画像フレームを復号するように構成される。トランスコーダ104はリエンコーダ105をさらに備え、リエンコーダ105は、第1の復号されたビデオストリームおよび第2の復号されたビデオストリームの各々を別個に符号化し、第1の再符号化されたビデオストリームおよび第2の再符号化されたビデオストリームを形成するように構成される。たとえば、第1の再符号化されたビデオストリームは、記憶デバイス106に記憶され得、第2の再符号化されたビデオストリームは、たとえば、制御センターにおいて、ディスプレイ107上に表示され得る。ディスプレイ107は、ビデオ管理システムに接続され得る。図10では、ビデオ送信システムの構成要素を接続するネットワーク108が示されている。これは、ローカルネットワークまたはワイドエリアネットワークであり得る。一例として、符号化システム80は第1のロケーションに位置し得、符号化されたビデオストリームは、ネットワーク108を介してトランスコーダ104に送信され得る。トランスコーダ104は、第1のロケーションから離れた第2のロケーションに位置し得る。記憶デバイス106およびディスプレイ107は、トランスコーダ104とコロケートされるか、または第3のロケーションに位置し得る。さらに、記憶デバイス106とディスプレイ107とは、異なるロケーションに位置し得る。送信システム100の異なるユーザが、ユーザに与えられたアクセス権に応じて、第1の復号または再符号化されたビデオストリームまたは第2の復号または再符号化されたビデオストリームへのアクセスを与えられ得る。たとえば、セキュリティセンターにおけるオペレータは、第2の復号または再符号化されたビデオストリームへのアクセスのみを有し得るが、警察官は、第1の復号または再符号化されたビデオストリームへのアクセスを有し得る。
当業者は、多くのやり方で上記で説明された実施形態を修正し、依然として、上記の実施形態に示されているような本発明の利点を使用することができることが諒解されよう。一例として、入力画像フレームは、可視光またはIRを採用するカメラ、サーマルカメラあるいはToFカメラなど、任意の種類のカメラを使用してキャプチャされていることがある。カメラはデジタルカメラであり得る。カメラは、デジタル化ユニットに接続されたアナログカメラであり得る。入力画像は、カメラから直接受信され得るか、または入力画像は、前にキャプチャされ、それらが符号化される前に記憶されていることがある。
出力画像フレームおよびオーバーレイされた出力画像フレームは連続的に番号を付けられ得、したがって、出力画像フレームは奇数を与えられ、オーバーレイされた出力画像フレームは偶数を与えられ、またはその逆もある。デコーダは、出力画像フレームまたはオーバーレイされた出力画像フレームのいずれかを示すために奇数番号のフレームのみまたは偶数番号のフレームのみを表示するように命令され得る。
本発明の方法は、プロセッサによって実行されるソフトウェアとして実装され得る。プロセッサは、中央処理ユニット(CPU)、グラフィックス処理ユニット(GPU)、集積回路中に実装されたカスタムメイドの処理デバイス、ASIC、FPGA、または個別構成要素を含む論理回路要素など、任意の種類のプロセッサであり得る。
符号化システムおよび送信システムは、ハードウェア、ファームウェア、またはソフトウェア、あるいはそれらの任意の組合せとして実装され得る。
したがって、本発明は、示された実施形態に限定されるべきでないが、添付の特許請求の範囲によってのみ定義されるべきである。