WO2023017578A1

WO2023017578A1 - 映像信号を合成する装置、方法及びプログラム

Info

Publication number: WO2023017578A1
Application number: PCT/JP2021/029618
Authority: WO
Inventors: 稔久藤原; 達也福井; 亮太椎名; 央也小野
Original assignee: 日本電信電話株式会社
Priority date: 2021-08-11
Filing date: 2021-08-11
Publication date: 2023-02-16
Also published as: JPWO2023017578A1; US20240283890A1

Abstract

本開示は、非同期映像の映像入力から、その合成映像出力までの時間を低遅延化することを目的とする。　本開示は、非同期で入力された複数の映像信号を、１つの画面に表示される映像信号に合成する装置であって、前記１つの画面は、前記複数の映像信号よりも多い複数のサブ画面で構成され、前記複数のサブ画面のうちの各映像信号の出力遅延が少なくなるようなサブ画面に前記複数の映像信号を配置し、前記複数の映像信号を合成する、装置及び方法である。

Description

映像信号を合成する装置、方法及びプログラム

　本開示は、複数の映像入力信号から、画面を１つに合成し、出力する、映像合成装置に関する。

　近年、多くの映像デバイスが利用されている。このような多くの映像デバイスの映像には、多様な画素数（解像度）、フレームレート等が利用されている。この映像デバイスの映像信号は、規格によって、物理的な信号、コントロール信号等に差異があるものの、１画面をそのフレームレート分の１の時間を使って伝送する。例えば、１秒間に６０フレームの映像信号であれば、１／６０秒、すなわち約１６．８ミリ秒を掛けて１画面の映像を伝送する（以下、６０ｆｐｓ（Ｆｒａｍｅ　ｐｅｒ　Ｓｅｃｏｎｄ））。

　これらの映像の利用方法には、テレビ会議など、複数のカメラをカメラの数よりも少ないモニタで表示するような形態がある。このよう場合、複数の映像を、例えば１つの画面上に分割表示することや、ある映像画面中に、その他の映像画面縮小表示などをしてはめ込むことなどの、画面合成を行う。

　通常、映像信号のタイミングは同期されておらず、合成する他の映像信号のタイミングが異なることから、信号をメモリなどに一時的にバッファリングしてから、合成する。結果として、合成画面の出力には遅延が発生する。

　遠隔地などでの合奏等をこのような画面合成を行うテレビ会議で行うことを想定すると、この合成に関わる遅延は、その実現性を大きく損なう。例えば、１秒間に１２０拍の曲（以下、１２０ＢＰＭ（Ｂｅａｔ　Ｐｅｒ　Ｍｉｎｕｔｅ））であれば、１拍の時間は、６０／１２０秒＝５００ミリ秒である。仮にこれを、５％の精度で合わせることが必要であるとすると、５００ｘ０．０５＝２５ミリ秒以下にカメラで撮影して表示するまでの遅延を抑える必要がある。

　カメラで撮影して表示するまでには、実際には、合成に関わる処理以外に、カメラでの画像処理時間、モニタでの表示時間、伝送に関わる時間などの、その他の遅延も含む必要がある。結果として、従来技術では、遠隔地で相互に映像を見ながらの合奏等のタイミングが重視される用途での、協調作業は困難である。

　そこで、低遅延要求が厳しい協調作業に対して、複数拠点などの複数画面を合成するシステムで、非同期映像の映像入力から、その合成映像出力までの時間を低遅延化するシステムの提供が必要である。

ＶＥＳＡ　ａｎｄ　Ｉｎｄｕｓｔｒｙ　Ｓｔａｎｄａｒｄｓ　ａｎｄ　Ｇｕｉｄｅｌｉｎｅｓ　ｆｏｒ　Ｃｏｍｐｕｔｅｒ　Ｄｉｓｐｌａｙ　Ｍｏｎｉｔｏｒ　Ｔｉｍｉｎｇ　（ＤＭＴ），　Ｖｅｒｓｉｏｎ　１．０，　Ｒｅｖ．　１３，　Ｆｅｂｒｕａｒｙ　８，　２０１３

　本開示は、非同期映像の映像入力から、その合成映像出力までの時間を低遅延化することを目的とする。

　本開示の装置及び方法は、
　非同期で入力された複数の映像信号を、１つの画面に表示される映像信号に合成する装置であって、
　前記１つの画面は、前記複数の映像信号よりも多い複数のサブ画面で構成され、
　前記複数のサブ画面のうちの各映像信号の出力遅延が少なくなるようなサブ画面に前記複数の映像信号を配置し、前記複数の映像信号を合成する。

　本発明の装置はコンピュータとプログラムによっても実現でき、プログラムを記録媒体に記録することも、ネットワークを通して提供することも可能である。本開示のプログラムは、本開示に係る装置に備わる各機能部としてコンピュータを実現させるためのプログラムであり、本開示に係る装置が実行する方法に備わる各ステップをコンピュータに実行させるためのプログラムである。

　本開示は、非同期映像の映像入力から、その合成映像出力までの時間を低遅延化することができる。

映像信号に含まれる画面の情報の一例を示す。本開示のシステム構成例を示す。４つの入力フレームから１つの出力フレームへの合成例を示す。１つの画面を分割したサブ画面の一例を示す。入力フレーム及び出力フレームの一例を示す。サブ画面への配置例を示す。入力フレーム及び出力フレームの一例を示す。サブ画面への配置例を示す。映像合成装置の構成例を示す。

　以下、本開示の実施形態について、図面を参照しながら詳細に説明する。なお、本開示は、以下に示す実施形態に限定されるものではない。これらの実施の例は例示に過ぎず、本開示は当業者の知識に基づいて種々の変更、改良を施した形態で実施することができる。なお、本明細書及び図面において符号が同じ構成要素は、相互に同一のものを示すものとする。

　図１に、映像信号に含まれる画面の情報の一例を示す。画面の情報は、画面を横方向に１つの走査線２１毎に走査して、順次下の走査線２１を走査することで伝送される。この走査には、表示画面２４の他、ブランキング部分２２、また、ボーダ部分２３などのオーバヘッド情報／信号を含む。ブランキング部分２２に、制御情報や音声情報など、映像情報以外の情報を含む場合もある（例えば、非特許文献１参照。）。

　図２に、本開示のシステム構成例を示す。本開示では、一例として、４つの映像信号Ｖ１～Ｖ４が映像合成装置１０に入力され、映像合成装置１０が１つの画面２０に表示される映像信号に合成して出力する例を示す。映像信号では１画面をそのフレームレート分の１の時間を使って伝送する。例えば、１秒間に６０フレームの映像信号であれば、１／６０秒、すなわち約１６．７ミリ秒を掛けて１画面の映像信号を伝送する（以下、６０ｆｐｓ（Ｆｒａｍｅ　ｐｅｒ　Ｓｅｃｏｎｄ））。映像信号に含まれる各時点での１画面の情報を「フレーム」と称し、映像合成装置１０に入力される各映像信号の１画面の情報を「入力フレーム」、映像合成装置１０から出力される合成された１画面の情報を「出力フレーム」と称する。

　図３に、４つの異なるタイミングの映像を入力とし、１画面に合成して出力する例を図に示す。映像合成装置１０が、全ての入力映像画面を読み込んでから、合成し、出力する形態の場合を考える。この場合、フレーム時間をＴ＿ｆ、合成処理時間をＴ＿ｐとすると、出力フレームは、最初の入力フレームの入力時点から最大で、２Ｔ＿ｆ＋Ｔ＿ｐ遅れることとなる。例えば、６０ｆｐｓの映像を考えると、２フレーム時間以上、すなわち３３．３ミリ秒以上の遅延が合成後の映像には、含まれる可能性があるということである。

　図４に、本実施形態の画面２０の一例を示す。本実施形態では、画面２０を３×３の９つのサブ画面に分割した例を示す。本開示では、図２に示す１つの画面２０は、複数の映像信号Ｖ１～Ｖ４よりも多い、５以上のサブ画面で構成される。分割した画面のうち同一の走査線上に配置されている横方向の画面を１のグループとし、そのグループを「サブ画面グループ」と称する。例えば、映像合成装置１０が入力１～４の４つの映像信号を合成する場合、横方向に並んでいるサブ画面Ｄ１－１、Ｄ１－２及びＤ１－３をサブ画面グループＧ１とし、横方向に並んでいるサブ画面Ｄ２－１、Ｄ２－２及びＤ２－３をサブ画面グループＧ２とし、横方向に並んでいるサブ画面Ｄ３－１、Ｄ３－２及びＤ３－３をサブ画面グループＧ２とする。つまり、出力フレームのデータは、上部に配置されているサブ画面グループＧ１から先に出力され、続いてサブ画面グループＧ２及びＧ３が出力される。

　本開示は、複数の非同期の映像を入力し、それらの画像を合成するシステムであって、入力タイミングの早い順に、出力遅延が少なくなるよう画面２０の上部から下部にかけて配置することを特徴とする。特に、出力分割画面数が、入力フレーム数より多く、画面２０のなかで入力フレームの出力として利用しない領域があってもよいことを特徴とする。

　図５及び図６に、本開示の画面合成例を示す。図５及び図６は、４つの入力フレームについて、その入力タイミングの早い順に並べ、それらを合成した出力フレームの出力タイミングを示している。この例では、上からサブ画面グループＧ１～Ｇ３までがあり、各サブ画面グループには、それぞれ最大３つの画面を出力できる。サブ画面グループは、任意の数設定することができ、また、サブ画面グループ内の分割画面も任意の数（ｎ＞＝１）を設定できる。また、これらは入力フレーム数に応じて動的に変更することができる。

　図５及び図６において、入力１，２はサブ画面グループＧ１の出力が完了する時間ｔ４までにデータの入力が完了できることから、サブ画面グループＧ１へ出力する。例えば、図６に示すように、サブ画面グループ画面Ｇ１の左から、入力１、２の配置とすることができる。ただし、この配置は、同一サブ画面グループＧ１内で任意である。この例ではサブ画面グループＧ１の最も右側のサブ画面Ｄ１－３は何も表示されないブランクである。

　入力３はサブ画面グループＧ２の出力が完了する時間ｔ５までにデータの入力が完了できることから、サブ画面グループＧ２へ出力する。例えば、図６に示すように、サブ画面グループ画面Ｇ２の最も左側のサブ画面Ｄ２－１に配置とすることができる。ただし、この配置は、同一サブ画面グループＧ２内で任意である。この例ではサブ画面グループＧ２の中央と最も右側のサブ画面Ｄ２－２及びＤ２－３はブランクである。

　入力４はサブ画面グループＧ３の出力が完了する時間ｔ６までにデータの入力が完了できることから、サブ画面グループＧ３へ出力する。例えば、図６に示すように、サブ画面グループ画面Ｇ３の最も左側のサブ画面Ｄ３－１に配置とすることができる。ただし、この配置は、同一サブ画面グループＧ３内で任意である。この例ではサブ画面グループＧ３の中央と最も右側のサブ画面Ｄ３－２及びＤ３－３はブランクである。

　このように画面配置することで、それぞれの入力フレームに対して、最短の遅延で合成画面として出力することが可能となる。サブ画面グループを多数に分割するほど、より細かい粒度で合わせることができる。

　最も遅延が短くなるサブ画面グループへの画面配置が困難な場合は、段階的に、より遅延が短くなるサブ画面グループへ画面配置をすることもできる。例えば、図７に示すように、入力１～４のフレームがすべて同じ入力タイミングで合った場合、サブ画面グループＧ１には３つの画面までしか配置することができない。このような場合は、図８に示すように、１つを近いサブ画面グループＧ２に配置して出力することができる。図では入力４のみをサブ画面グループＧ２へ配置している。これにより平均的な遅延を削減することができる。

　入力映像および出力映像のクロック同士がずれている場合、同じ画面フレームレートであったとしても、徐々に、その画面フレームを経るごとに、各入力フレームと出力フレームのタイミングは変化していく。本開示の方法は、サブ画面グループの出力タイミングに間に合う映像信号を、サブ画面グループに含まれるいずれかのサブ画面に配置するため、このような変化に対しても、最短の遅延となるよう画面配置を都度変化させることができる。

　図９に、本実施形態に係る映像合成装置１０の構成例を示す。本実施形態に係る映像合成装置１０は、検出部１０１、クロスバスイッチ１０２、アップダウンコンバータ１０３、バッファ１０４、画素合成部１０５を備える。図は４入力１出力であるが、任意の数の入出力でも構わない。

　１０１は、Ｎ個の入力に対して、フレーム時間内の入力順を検出する機能部である。
　１０２は、クロスバスイッチであり、１０１からの入力順序の検出結果順に並べ替え出力する機能である。
　１０３は画素数を任意の大きさに拡大縮小を行う、アップダウンコンバータである。
　１０２と１０３は入力（ａ，ｂ，ｃ，ｄ，…）に対して逆に接続しても構わない。すなわち入力ａ，ｂ，ｃ，ｄから１０３で拡大縮小を行い、その後１０２、入力順に並べ替え出力しても構わない。
　１０４は、バッファである。１０３または１０２の入力をバッファリングして、任意の順序で出力することができる。
　１０５は、画素合成部である。出力の全体画面のうち、出力する順に１０４から画素データを読み出し、合成して出力する。このタイミングは、前記による。１０５は、任意のコントロール信号を画面のブランキング部に付加しても構わない。

　本開示の映像合成装置１０は、コンピュータとプログラムによっても実現でき、プログラムを記録媒体に記録することも、ネットワークを通して提供することも可能である。

（本開示の効果）
　本開示に係るシステムは、非同期の映像入力信号に対して、合成後の出力までの遅延時間を短縮することができる。これにより、複数拠点等の複数画面を合成するシステムで低遅延要求が厳しく且つ特に特定の入力に対する低遅延要求がより厳しい協調作業が可能となる。

（本開示のポイント）
　複数拠点の映像を合成して表示するシステムで、合奏のような低遅延要求が厳しい協調作業では、合成処理の低遅延化が必要である。本開示は、複数の非同期の映像を入力し、それらの画像を合成するシステムであって、入力タイミングの早い順に、出力遅延が少なくなるよう画面２０の上部から下部にかけて配置する。これにより、本開示は、複数拠点等の複数画面を合成するシステムにおいて、低遅延要求が厳しい協調作業が可能となる。

　本開示は情報通信産業に適用することができる。

１０：映像合成装置
２０：画面
２１：走査線
２２：ブランキング部分
２３：ボーダ部分
２４：表示画面
１０１：検出部
１０２：クロスバスイッチ
１０３：アップダウンコンバータ
１０４：バッファ
１０５：画素合成部

Claims

　非同期で入力された複数の映像信号を、１つの画面に表示される映像信号に合成する装置であって、
　前記１つの画面は、前記複数の映像信号よりも多い複数のサブ画面で構成され、
　前記複数のサブ画面のうちの各映像信号の出力遅延が少なくなるようなサブ画面に前記複数の映像信号を配置し、前記複数の映像信号を合成する、
　装置。
　前記複数の映像信号を、映像信号の入力タイミングの早い順に、前記複数のサブ画面のうちの上部から下部にかけて配置する、
　請求項１に記載の装置。
　前記１つの画面の一部を構成するサブ画面グループごとに、前記複数の映像信号に含まれる映像信号を出力し、
　前記サブ画面グループの出力タイミングに間に合う映像信号を、前記サブ画面グループに含まれるいずれかのサブ画面に配置する、
　請求項１又は２に記載の装置。
　前記サブ画面グループは、画面の同一の走査線上に配置されているサブ画面の集合である、
　請求項３に記載の装置。
　非同期で入力された複数の映像信号を、１つの画面に表示される映像信号に合成する方法であって、
　前記１つの画面は、前記複数の映像信号よりも多い複数のサブ画面で構成され、
　前記複数のサブ画面のうちの各映像信号の出力遅延が少なくなるようなサブ画面に前記複数の映像信号を配置し、前記複数の映像信号を合成する、
　方法。
　請求項１から４のいずれかに記載の装置に備わる各機能部としてコンピュータを実現させるためのプログラム。