JP2008258779A - テレビ会議装置、制御方法、およびプログラム - Google Patents
テレビ会議装置、制御方法、およびプログラム Download PDFInfo
- Publication number
- JP2008258779A JP2008258779A JP2007096752A JP2007096752A JP2008258779A JP 2008258779 A JP2008258779 A JP 2008258779A JP 2007096752 A JP2007096752 A JP 2007096752A JP 2007096752 A JP2007096752 A JP 2007096752A JP 2008258779 A JP2008258779 A JP 2008258779A
- Authority
- JP
- Japan
- Prior art keywords
- area
- image
- pinp
- region
- video conference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
【課題】ユーザに操作の煩わしさを感じさせることなく、親画面内の適切な位置に子画面を重畳する。
【解決手段】顔検出部104は、送受信の対象の画像のうちの1の画像から、顔が投影された領域である顔領域を重要性の高い領域として検出し、スコア計算部105は、1の画像の領域において、送受信の対象の画像のうちの、他の1の画像を重畳する領域であるPinP領域を、顔領域に基づいて決定する。また、PinP画像生成部106は、1の画像のPinP領域に、他の1の画像を重畳することにより、1の画像を親画面とするとともに、他の1の画像を子画面としたPinP画像を生成し、表示制御部108は、そのPinP画像を、モニタ14aに表示させる。本発明は、例えば、テレビ会議装置に適用することができる。
【選択図】図3
【解決手段】顔検出部104は、送受信の対象の画像のうちの1の画像から、顔が投影された領域である顔領域を重要性の高い領域として検出し、スコア計算部105は、1の画像の領域において、送受信の対象の画像のうちの、他の1の画像を重畳する領域であるPinP領域を、顔領域に基づいて決定する。また、PinP画像生成部106は、1の画像のPinP領域に、他の1の画像を重畳することにより、1の画像を親画面とするとともに、他の1の画像を子画面としたPinP画像を生成し、表示制御部108は、そのPinP画像を、モニタ14aに表示させる。本発明は、例えば、テレビ会議装置に適用することができる。
【選択図】図3
Description
本発明は、テレビ会議装置、制御方法、およびプログラムに関し、特に、例えば、ユーザに操作の煩わしさを感じさせることなく、親画面内の適切な位置に子画面を重畳することができるようにしたテレビ会議装置、制御方法、およびプログラムに関する。
例えば、2以上のテレビ会議装置を通信回線を介して接続し、各テレビ会議装置間でテレビ会議を行うテレビ会議システムでは、各テレビ会議装置において、カメラにより会議室などの様子が撮像され、その撮像により得られた撮像画像を相互に送受信することで、テレビ会議が行われる。
例えば、2以上のテレビ会議装置のうちの1のテレビ会議装置においては、ユーザが、1のテレビ会議装置の操作に用いるリモートコマンダを操作することにより、他のテレビ会議装置から受信した第1の撮像画像内のある領域(位置)を、PinP(picture in picture)用のPinP領域に決定すると、そのPinP領域に、1のテレビ会議装置のカメラで撮像され、他のテレビ会議装置に送信される第2の撮像画像が重畳(合成)されることにより、第1の撮像画像を親画面とするとともに、第2の撮像画像を子画面とするPinP画像が生成され、1のテレビ会議装置のモニタに表示される。
これにより、1のテレビ会議装置のユーザは、他のテレビ会議装置側の様子を、親画面によって確認し、かつ、他のテレビ会議装置に送信される、1のテレビ会議装置側の様子を、子画面によって確認することができる。
なお、特許文献1には、親画面に表示する画像の種類と、親画面内の子画面に表示する画像の種類とが選択されると、その選択に基づいて、親画面に対する子画面の画面表示構成を切り替える技術が開示されている(特に、特許文献1の[0020]および[0027]段落を参照)。
また、複数の画像から1の画像を生成する方法として、例えば、特許文献2には、各端末からの画像の中から、いくつかの画像を選択して合成することにより1の合成画面を生成する方法が開示されている(特に、特許文献1の[0009]段落を参照)。
特開2000−350175号公報
特開平08−149440号公報
ところで、例えば、上述したように、他のテレビ会議装置側の様子が映った第1の撮像画像を親画面とし、かつ、1のテレビ会議装置側の様子が映った第2の撮像画像を子画面とするPinP画像を表示する場合において、子画面を重畳する親画面のPinP領域は、子画面を重畳する領域として、適切な領域であることが望ましい。
即ち、例えば、親画面の、テレビ会議の相手の顔が映っている領域がPinP領域となっている場合には、相手の表情を確認することができないため、そのような領域は、子画面を重畳する領域(PinP領域)として、適切な領域であるとは言い難い。
そして、親画面の、テレビ会議の相手の顔が映っている領域などの、PinP領域とすることが不適切な領域がPinP領域となっている場合には、ユーザは、例えば、背景のみが映っている領域などの、PinP領域とすることが適切な領域を、PinP領域とするように、リモートコマンダを操作する必要があった。
また、特許文献1では、上述したように、親画面に表示する画像の種類と子画面に表示する画像の種類とが選択されると、その選択に基づいて、親画面に対する子画面の画面表示構成が切り替えられるが、その画面表示構成が、親画面内の適切な領域以外の領域に子画面が重畳される画面表示構成である場合には、ユーザは、親画面内の適切な領域に子画面が重畳されるように、リモートコマンダを操作する必要があった。
本発明は、このような状況に鑑みてなされたものであり、ユーザに操作の煩わしさを感じさせることなく、親画面内の適切な位置に子画面を重畳することができるようにするものである。
本発明の一側面のテレビ会議装置、またはプログラムは、画像を送受信することにより行われるテレビ会議に使用されるテレビ会議装置、または画像を送受信することにより行われるテレビ会議に使用されるテレビ会議装置として、コンピュータを機能させるプログラムであり、送受信の対象の画像のうちの1の画像から、重要性の高い領域である重要領域、または重要性の低い領域である非重要領域を検出する検出手段と、前記1の画像の領域において、送受信の対象の画像のうちの、他の1の画像を重畳する領域であるPinP(picture in picture)領域を、前記重要領域または前記非重要領域に基づいて決定する決定手段と、前記1の画像の前記PinP領域に、前記他の1の画像を重畳することにより、前記1の画像を親画面とするとともに、前記他の1の画像を子画面としたPinP画像を生成するPinP画像生成手段と、前記PinP画像を、画像を表示する表示手段に表示させる表示制御手段とを備えるテレビ会議装置、またはテレビ会議装置として、コンピュータに機能させるプログラムである。
前記検出手段では、顔を含む領域である顔領域、動きがある領域である動き領域、または、エッジを含む領域であるエッジ領域を、前記重要領域として検出することができる。
前記決定手段では、前記1の画像内の、前記PinP領域の候補である複数の候補領域それぞれに対して、重要性の度合いを表すスコアを、前記重要領域または前記非重要領域に基づいて算出し、そのスコアに基づいて、複数の候補領域のうちの1の候補領域を、前記PinP領域に決定することができる。
前記検出手段では、明るさが暗い領域である暗領域、またはアクティビティが低い領域である単調領域を、前記非重要領域として検出することができる。
前記検出手段では、他のテレビ会議装置から受信した前記1の画像から、前記重要領域または前記非重要領域を検出することができ、前記PinP画像生成手段では、前記1の画像の前記PinP領域に、前記他のテレビ会議装置に送信する前記他の1の画像を重畳することにより、前記1の画像を親画面とするとともに、前記他の1の画像を子画面としたPinP画像を生成することができる。
本発明の一側面の制御方法は、画像を送受信することにより行われるテレビ会議に使用されるテレビ会議装置を制御する制御方法であり、送受信の対象の画像のうちの1の画像から、重要性の高い領域である重要領域、または重要性の低い領域である非重要領域を検出し、前記1の画像の領域において、送受信の対象の画像のうちの、他の1の画像を重畳する領域であるPinP領域を、前記重要領域または前記非重要領域に基づいて決定し、前記1の画像の前記PinP領域に、前記他の1の画像を重畳することにより、前記1の画像を親画面とするとともに、前記他の1の画像を子画面としたPinP画像を生成し、前記PinP画像を、画像を表示する表示手段に表示させるステップを含む。
本発明の一側面においては、送受信の対象の画像のうちの1の画像から、重要性の高い領域である重要領域、または重要性の低い領域である非重要領域が検出され、前記1の画像の領域において、送受信の対象の画像のうちの、他の1の画像を重畳する領域であるPinP領域が、前記重要領域または前記非重要領域に基づいて決定される。また、前記1の画像の前記PinP領域に、前記他の1の画像を重畳することにより、前記1の画像を親画面とするとともに、前記他の1の画像を子画面としたPinP画像が生成されて表示される。
本発明によれば、ユーザに操作の煩わしさを感じさせることなく、親画面内の適切な位置に子画面を重畳することができる。
以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書又は図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書又は図面に記載されていることを確認するためのものである。従って、明細書又は図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
本発明の一側面のテレビ会議装置、またはプログラムは、
画像を送受信することにより行われるテレビ会議に使用されるテレビ会議装置(例えば、図3のテレビ会議装置11a)、または画像を送受信することにより行われるテレビ会議に使用されるテレビ会議装置として、コンピュータを機能させるプログラムであり、
送受信の対象の画像のうちの1の画像(例えば、図2の受信画像42)から、重要性の高い領域である重要領域、または重要性の低い領域である非重要領域を検出する検出手段(例えば、図3の顔検出部104)と、
前記1の画像の領域において、送受信の対象の画像のうちの、他の1の画像(例えば、図2の送信画像41)を重畳する領域であるPinP(picture in picture)領域を、前記重要領域または前記非重要領域に基づいて決定する決定手段(例えば、図3のスコア計算部105)と、
前記1の画像の前記PinP領域に、前記他の1の画像を重畳することにより、前記1の画像を親画面とするとともに、前記他の1の画像を子画面としたPinP画像(例えば、図2のPinP画像43)を生成するPinP画像生成手段(例えば、図3のPinP画像生成部106)と、
前記PinP画像を、画像を表示する表示手段(例えば、図3のモニタ14a)に表示させる表示制御手段(例えば、図3の表示制御部108)と
を備えるテレビ会議装置、またはテレビ会議装置として、コンピュータを機能させるプログラムである。
画像を送受信することにより行われるテレビ会議に使用されるテレビ会議装置(例えば、図3のテレビ会議装置11a)、または画像を送受信することにより行われるテレビ会議に使用されるテレビ会議装置として、コンピュータを機能させるプログラムであり、
送受信の対象の画像のうちの1の画像(例えば、図2の受信画像42)から、重要性の高い領域である重要領域、または重要性の低い領域である非重要領域を検出する検出手段(例えば、図3の顔検出部104)と、
前記1の画像の領域において、送受信の対象の画像のうちの、他の1の画像(例えば、図2の送信画像41)を重畳する領域であるPinP(picture in picture)領域を、前記重要領域または前記非重要領域に基づいて決定する決定手段(例えば、図3のスコア計算部105)と、
前記1の画像の前記PinP領域に、前記他の1の画像を重畳することにより、前記1の画像を親画面とするとともに、前記他の1の画像を子画面としたPinP画像(例えば、図2のPinP画像43)を生成するPinP画像生成手段(例えば、図3のPinP画像生成部106)と、
前記PinP画像を、画像を表示する表示手段(例えば、図3のモニタ14a)に表示させる表示制御手段(例えば、図3の表示制御部108)と
を備えるテレビ会議装置、またはテレビ会議装置として、コンピュータを機能させるプログラムである。
本発明の一側面の制御方法は、
画像を送受信することにより行われるテレビ会議に使用されるテレビ会議装置(例えば、図3のテレビ会議装置11a)を制御する制御方法であり、
送受信の対象の画像のうちの1の画像(例えば、図2の受信画像42)から、重要性の高い領域である重要領域、または重要性の低い領域である非重要領域を検出し(例えば、図5のステップS34)、
前記1の画像の領域において、送受信の対象の画像のうちの、他の1の画像(例えば、図2の送信画像41)を重畳する領域であるPinP領域を、前記重要領域または前記非重要領域に基づいて決定し(例えば、図5のステップS35)、
前記1の画像の前記PinP領域に、前記他の1の画像を重畳することにより、前記1の画像を親画面とするとともに、前記他の1の画像を子画面としたPinP画像(例えば、図2のPinP画像43)を生成し(例えば、図5のステップS36)、
前記PinP画像を、画像を表示する表示手段(例えば、図3のモニタ14a)に表示させる(例えば、図5のステップS37)
ステップを含む。
画像を送受信することにより行われるテレビ会議に使用されるテレビ会議装置(例えば、図3のテレビ会議装置11a)を制御する制御方法であり、
送受信の対象の画像のうちの1の画像(例えば、図2の受信画像42)から、重要性の高い領域である重要領域、または重要性の低い領域である非重要領域を検出し(例えば、図5のステップS34)、
前記1の画像の領域において、送受信の対象の画像のうちの、他の1の画像(例えば、図2の送信画像41)を重畳する領域であるPinP領域を、前記重要領域または前記非重要領域に基づいて決定し(例えば、図5のステップS35)、
前記1の画像の前記PinP領域に、前記他の1の画像を重畳することにより、前記1の画像を親画面とするとともに、前記他の1の画像を子画面としたPinP画像(例えば、図2のPinP画像43)を生成し(例えば、図5のステップS36)、
前記PinP画像を、画像を表示する表示手段(例えば、図3のモニタ14a)に表示させる(例えば、図5のステップS37)
ステップを含む。
以下、図面を参照して、本発明の実施の形態について説明する。
図1は、本発明を適用したテレビ会議システムの一実施の形態の構成例を示す図である。
図1のテレビ会議システムは、マイクロホン12a、カメラ13a、モニタ14a、およびスピーカ15aが接続されたテレビ会議装置11aと、マイクロホン12b、カメラ13b、モニタ14b、およびスピーカ15bが接続されたテレビ会議装置11bとにより構成される。
テレビ会議装置11aは、マイクロホン12aから供給される音声と、カメラ13aから供給される画像を、テレビ会議装置11bに送信する。また、テレビ会議装置11aは、テレビ会議装置11bから送信されてくる音声や画像を受信し、音声を、スピーカ15aに供給するとともに、画像を、モニタ14aに供給する。
マイクロホン12aは、テレビ会議装置11a側のユーザの発話などによる音声を集音し、テレビ会議装置11aに供給する。
カメラ13aは、テレビ会議装置11a側のユーザなどを撮像し、その撮像により得られる画像を、テレビ会議装置11aに供給する。
モニタ14aは、テレビ会議装置11aから供給される画像を表示する。
スピーカ15aは、テレビ会議装置11aから供給される音声を出力する。
リモートコマンダ16aは、テレビ会議装置11a側のユーザなどによって操作され、その操作に対応した操作信号を、赤外線等によって、テレビ会議装置11aに送信する。
テレビ会議装置11b乃至リモートコマンダ16bは、テレビ会議装置11a乃至リモートコマンダ16aそれぞれと同様に構成される。
以上のように構成されるテレビ会議システムでは、テレビ会議装置11aと11bは、例えば、インターネット網やLAN(local area network)などのネットワークを介して接続され、テレビ会議装置11aと11bとの間で、画像および音声をやりとりすることでテレビ会議が行われる。
即ち、例えば、テレビ会議装置11aは、テレビ会議装置11a側のユーザの発話などによる音声をマイクロホン12aにより集音、またはテレビ会議装置11a側のユーザなどをカメラ13aにより撮像することで得られる音声または画像を、通信相手のテレビ会議装置11bに送信する。また、テレビ会議装置11aは、通信相手のテレビ会議装置11bから送信されてくる画像や音声を受信し、画像をモニタ14aに表示するとともに、音声をスピーカ15aから出力する。
なお、テレビ会議装置11bも、テレビ会議装置11aと同様の処理を行う。
図2は、図1のテレビ会議装置11aが行う処理の概略を説明する図である。
テレビ会議装置11aのカメラ13aでは、テレビ会議装置11a側のユーザなどが撮像され、テレビ会議装置11aは、カメラ13aにより撮像された画像を、送信画像41として、テレビ会議装置11bに送信する。一方、テレビ会議装置11bのカメラ13bでも、テレビ会議装置11b側のユーザなどが撮像され、テレビ会議装置11bは、カメラ13bにより撮像された画像を、テレビ会議装置11aに送信する。テレビ会議装置11aは、テレビ会議装置11bからの画像を、受信画像42として受信する。
テレビ会議装置11aは、通信相手のテレビ会議装置11bから受信した受信画像42から、例えば、顔が投影されている領域を、重要性の高い領域である重要領域として検出し、その重要領域に基づいて、受信画像42において、カメラ13aにより撮像された送信画像41を重畳(合成)するPinP領域を決定する。さらに、テレビ会議装置11aは、受信画像42のPinP領域に、カメラ13aにより撮像された送信画像41を重畳することにより、受信画像42を親画面とするとともに、送信画像41を子画面としたPinP画像43を生成してモニタ14aに表示する。
図3は、テレビ会議装置11aの第1実施の形態の構成例を示すブロック図である。
なお、テレビ会議装置11bは、テレビ会議装置11aと同様に構成され、同様の処理を行うので、以下では、テレビ会議装置11bについての説明は省略する。
図3のテレビ会議装置11aは、デコーダ103、顔検出部104、スコア計算部105、PinP画像生成部106、縮小部107、表示制御部108、エンコーダ109、受光部110、および制御部111により構成される。
デコーダ103は、テレビ会議装置11bから送信されてくる、テレビ会議装置11bが所定の符号化方式で画像と音声を符号化したデータを受信し、所定の符号化方式に対応する復号方式で画像と音声に復号する。
そして、デコーダ103は、画像を、受信画像として、顔検出部104およびPinP画像生成部106に供給し、音声をスピーカ15aに供給する。
顔検出部104は、デコーダ103から供給された受信画像から、重要性の高い領域である重要領域として、顔が投影された領域である顔領域を検出する。
即ち、顔検出部104は、受信画像から、肌色の領域や、目、眉、鼻などが投影された領域を検出し、その検出により得られる、受信画像内の、肌色の領域や、目、眉、鼻などの位置に基づいて、人の顔である確率が大である領域を、顔領域とみなして検出する。
また、顔検出部104は、顔領域を検出することで得られる、受信画像内の顔領域の位置(領域)を表す顔領域情報を、スコア計算部105に供給する。
スコア計算部105は、顔検出部104からの顔領域情報に基づいて、PinP領域を決定する。
即ち、例えば、スコア計算部105は、顔検出部104からの顔領域情報に基づいて、受信画像の領域において、PinP領域の候補である複数の候補領域のうちの、1の候補領域をPinP領域に決定する。具体的には、スコア計算部105は、顔検出部104からの顔領域情報に基づいて、候補領域が重要領域としての顔領域を含む度合いを表すスコアを、複数の候補領域それぞれに対して算出し、スコアが最小である候補領域、つまり、重要領域をなるべく含まない候補領域をPinP領域に決定する。
また、スコア計算部105は、PinP領域に決定された候補領域、つまり、PinP領域の位置を表すPinP領域情報を、PinP画像生成部106に供給する。
さらに、スコア計算部105は、送信画像の大きさをPinP領域の大きさに一致させるように、送信画像を縮小するときの縮小率を求め、縮小部107に供給する。
PinP画像生成部106には、上述したように、デコーダ103から受信画像が供給されるとともに、スコア計算部105からPinP領域情報が供給される他、縮小部107から所定の縮小率で縮小された縮小後の送信画像が供給される。
PinP画像生成部106は、スコア計算部105からのPinP領域情報に基づいて、デコーダ103からの受信画像内のPinP領域を認識し、そのPinP領域に縮小部107からの送信画像を重畳することによりPinP画像を生成して、表示制御部108に供給する。
縮小部107には、カメラ13aにより撮像されてテレビ会議装置11bに送信される画像が、送信画像として、カメラ13aから供給される。
縮小部107は、カメラ13aから供給された送信画像を、スコア計算部105から供給された縮小率で縮小し、縮小後の送信画像を、PinP画像生成部106に供給する。
表示制御部108は、PinP画像生成部106から供給されたPinP画像をモニタ14aに供給して表示させる。
エンコーダ109には、マイクロホン12aから、マイクロホン12aにより集音された音声が供給され、カメラ13aから、カメラ13aにより撮像された画像が送信画像として供給される。エンコーダ109は、カメラ13aからの送信画像と、マイクロホン12aからの音声とを、所定の符号化方式により符号化し、テレビ会議装置11bに送信する。
受光部110は、赤外線などの無線を介して送信されてくる、リモートコマンダ16aの操作に応じた操作信号を受信(受光)し、制御部111に供給する。
制御部111は、テレビ会議装置11aを構成するデコーダ103や、顔検出部104、スコア計算部105,PinP画像生成部106、縮小部107、表示制御部108、エンコーダ109、受光部110の各ブロックを制御する。
また、例えば、制御部111は、受光部110からの操作信号に応じて、各ブロックを制御する。
図4は、図3のスコア計算部105が、複数の候補領域のうちの1の候補領域をPinP領域に決定する第1のPinP領域決定処理を説明する図である。
図4上側は、親画面となる受信画像42を示している。
図4上側において、受信画像42には、2人の人物(顔)と机とが映っている。また、図4上側では、受信画像42内の、左上、右上、左下、右下の4つの矩形の領域が、候補領域201A,201B,201C,201Dとなっている。
図4下側は、スコア計算部105が、候補領域201A乃至201Dそれぞれに対して算出するスコアの一覧であるスコアテーブルを示している。
図4下側では、候補領域201A,201B,201C,201Dそれぞれに対しての、候補領域が重要領域としての顔領域を含む度合いを表すスコアが「45」、「20」、「0」、「0」になっている。
スコア計算部105は、例えば、候補領域において、重要領域としての顔領域が占める割合(パーセンテージ)を、その候補領域のスコアとして算出する。従って、例えば、候補領域すべてが顔領域になっている場合、その候補領域のスコアは最大のスコア「100」となり、候補領域に顔領域が含まれない場合、その候補領域のスコアは最小のスコア「0」となる。
図4では、候補領域201Aのうちの45パーセントの領域が顔領域になっており、このため、候補領域201Aのスコアは、「45」になっている。
また、候補領域201Bについては、20パーセントの領域が顔領域になっており、このため、候補領域201Bのスコアは「20」になっている。
さらに、候補領域201Cと201Dには、顔領域が含まれないため、候補領域201Cおよび201Dのスコアは、いずれも「0」になっている。
以上のように、候補領域201A乃至201Dのスコアが、それぞれ「45」、「20」、「0」、「0」である場合、最小のスコア「0」の候補領域201Cまたは201Dが、PinP領域に決定される。
なお、スコア計算部105では、例えば、候補領域201A,201B,201C,201Dの順番で優先順位をつけておき、最小のスコアの候補領域が複数存在する場合には、その最小のスコアの複数の候補領域のうちの、優先順位がより高い候補領域を、PinP領域として決定することができる。この場合、図4では、最小のスコア「0」の候補領域201Cまたは201Dのうちの、優先順位が高い候補領域201Cが、PinP領域に決定される。
次に、図5のフローチャートを参照して、受信画像内のPinP領域に送信画像を重畳したPinP画像を生成するPinP画像生成処理を説明する。
ステップS31において、マイクロホン12aは、テレビ会議装置11a側のユーザの発話などによる音声を集音し、エンコーダ109に供給する。また、ステップS31において、カメラ13aは、テレビ会議装置11a側のユーザなどを撮像し、その撮像により得られる画像を、送信画像として、縮小部107およびエンコーダ109に供給する。
ステップS31の処理の終了後、処理は、ステップS32に進み、エンコーダ109は、カメラ13aからの送信画像と、マイクロホン12aからの音声とを、所定の符号化方式により符号化し、テレビ会議装置11bに送信して、処理は、ステップS33に進む。
ステップS33において、デコーダ103は、テレビ会議装置11bから送信されてくる、テレビ会議装置11bが所定の符号化方式で画像と音声を符号化したデータを受信し、所定の符号化方式に対応する復号方式で画像と音声に復号する。また、ステップS33において、デコーダ103は、画像を、受信画像として、顔検出部104およびPinP画像生成部106に供給し、音声をスピーカ15aに供給する。
スピーカ15aは、デコーダ103から供給される音声を出力する。
その後、処理は、ステップS33からステップS34に進み、顔検出部104は、デコーダ103から供給された受信画像から、重要領域としての顔領域を検出する。また、ステップS34において、顔検出部104は、受信画像から検出した顔領域の顔領域情報を、スコア計算部105に供給する。
ステップS34の処理の終了後、処理は、ステップS35に進み、スコア計算部105は、顔検出部104からの顔領域情報に基づいて、受信画像内の、例えば、図4に示した4つの候補領域201A乃至201Dのうちの、1の候補領域をPinP領域に決定する。また、ステップS35において、スコア計算部105は、PinP領域に決定された候補領域、つまり、PinP領域の位置を表すPinP領域情報を、PinP画像生成部106に供給する。
さらに、スコア計算部105は、送信画像の大きさをPinP領域の大きさに一致させるように、送信画像を縮小するときの縮小率を求め、縮小部107に供給する。
縮小部107は、カメラ13aからステップS31で供給された送信画像を、スコア計算部105から供給された縮小率で縮小し、縮小後の送信画像を、PinP画像生成部106に供給する。
その後、処理は、ステップS35からステップS36に進み、PinP画像生成部106は、スコア計算部105からのPinP領域情報に基づいて、デコーダ103からの受信画像内のPinP領域を認識し、そのPinP領域に縮小部107からの送信画像を重畳することによりPinP画像を生成する。さらに、ステップS36では、PinP画像生成部106は、PinP画像を表示制御部108に供給して、処理は、ステップS37に進む。
ステップS37において、表示制御部108は、PinP画像生成部106から供給されたPinP画像をモニタ14aに供給して表示させて、処理は、終了される。
以上のように、図5のPinP画像生成処理では、テレビ会議装置11aの送受信の対象の画像のうちの、例えば、テレビ会議装置11bから送信されてくる受信画像から、重要領域としての顔領域を検出し、その顔領域に基づいて、受信画像の領域におけるPinP領域を決定する。そして、PinP領域に、テレビ会議装置11aの送受信の対象の画像のうちの、例えば、テレビ会議装置11bに送信する送信画像を重畳することにより、受信画像を親画面とするとともに、送信画像を子画面としたPinP画像を生成し、モニタ14aに表示させる。
従って、ユーザが、リモートコマンダ16aを操作して、送信画像が重畳されるPinP領域を決定しなくても、受信画像の、顔がなるべく映っていない、画像の重畳に適切な領域に、送信画像を重畳することができる。
ここで、図3のテレビ会議装置11aにおいては、顔領域を重要領域として、通信相手のテレビ会議装置11bから供給された受信画像内の顔領域に基づいて、複数の候補領域それぞれのスコアを算出し、そのスコアに基づいて、複数の候補領域のうちの1の候補領域をPinP領域に決定したが、その他、例えば、受信画像内の顔領域の他、受信画像内の動きがある領域である動き領域や、受信画像内のエッジがある領域であるエッジ領域を重要領域として、その重要領域に基づいて、複数の候補領域それぞれのスコアを算出し、そのスコアに基づいて、複数の候補領域のうちの1の候補領域をPinP領域に決定することができる。
そこで、図6を参照して、顔領域、動き領域、およびエッジ領域を重要領域として検出し、その重要領域に基づいて、複数の候補領域それぞれのスコアを算出して、それらのスコアに基づいて、複数の候補領域のうちの1の候補領域をPinP領域に決定することでPinP画像を生成するテレビ会議装置11aを説明する。
図6は、テレビ会議装置11aの第2実施の形態の構成例を示すブロック図である。
なお、図中、図3の場合に対応する部分については同一の符号を付してあり、以下、その説明は、適宜省略する。
即ち、図6のテレビ会議装置11aは、動き検出部301およびエッジ検出部302が新たに設けられている他は、図3の場合と同様に構成される。
動き検出部301には、デコーダ103から受信画像が供給される。動き検出部301は、デコーダ103から供給された受信画像内の、重要領域としての動き領域を検出する。
即ち、動き検出部301は、例えば、デコーダ103から供給された所定のフレームの受信画像と、その所定のフレームの1フレーム前の前フレームの受信画像との、同一の位置の画素同士の画素値の差分をとり、差分値を得る。また、動き検出部301は、差分値が、所定のフレームの受信画像のノイズレベルよりも大である所定のフレームの受信画像の画素の領域を、動き領域として検出し、その動き領域の位置を表す動き領域情報を、スコア計算部105に供給する。
なお、所定のフレームの受信画像のノイズレベルは、デコーダ103から供給された所定のフレームの受信画像に基づいて、動き検出部301により算出される。
エッジ検出部302には、デコーダ103から受信画像が供給される。エッジ検出部302は、デコーダ103から供給された受信画像から、重要領域としての、顔や机の輪郭などのエッジがある領域であるエッジ領域を検出し、そのエッジ領域の位置を表すエッジ領域情報を、スコア計算部105に供給する。
なお、図6の実施の形態では、スコア計算部105には、顔検出部104から顔領域情報が供給される他、動き検出部301から動き領域情報が供給されるとともに、エッジ検出部302からエッジ領域情報が供給される。
スコア計算部105は、顔領域情報、動き領域情報、およびエッジ領域情報に基づいて、複数の候補領域それぞれに対して、候補領域が顔領域を含む度合いを表すスコアである顔領域スコア、候補領域が動き領域を含む度合いを表すスコアである動き領域スコア、および候補領域がエッジ領域を含む度合いを表すスコアであるエッジ領域スコアを算出する。
さらに、スコア計算部105は、顔領域スコア、動き領域スコア、およびエッジ領域スコアすべてを加算し、その加算結果により得られるトータルスコアのうちの、トータルスコアが最小の候補領域をPinP領域に決定する。
次に、図7は、図6のスコア計算部105が、複数の候補領域のうちの1の候補領域をPinP領域に決定する第2のPinP領域決定処理を説明する図である。
図7上側は、図4上側の場合と同様に、親画面となる受信画像42を示しており、図4上側の受信画像42と同一の符号を付してある。なお、図7上側の受信画像42は、上述した図4上側の受信画像42と同一の画像であるため、説明は省略する。
また、図7下側は、図6のスコア計算部105が、受信画像42内の4つの候補領域201A乃至201Dそれぞれに対して算出するスコアの一覧であるスコアテーブルを示している。
図7下側では、候補領域201A,201B,201C,201Dそれぞれに対しての顔領域スコアが「45」、「20」、「0」、「0」になっている。
また、図7下側では、候補領域201A,201B,201C,201Dそれぞれに対しての動き領域スコアが「50」、「40」、「5」、「20」になっており、候補領域201A,201B,201C,201Dそれぞれに対してのエッジ領域スコアが「25」、「15」、「2」、「15」になっている。
スコア計算部105は、例えば、候補領域において、重要領域としての顔領域が占める割合を、その候補領域の顔領域スコアとして算出し、重要領域としての動き領域が占める割合を、その候補領域の動き領域スコアとして算出する。さらに、スコア計算部105は、例えば、候補領域において、重要領域としてのエッジ領域が占める割合を、その候補領域のエッジ領域スコアとして算出する。
そして、スコア計算部105は、候補領域の顔領域スコア、動き領域スコア、およびエッジ領域スコアすべてを加算し、トータルスコアを求める。
図7では、候補領域201Aのうちの45パーセントの領域が顔領域に、候補領域201Aのうちの50パーセントの領域が動き領域に、候補領域201Aのうちの25パーセントの領域がエッジ領域に、それぞれなっている。
このため、候補領域201Aの顔領域スコア、動き領域スコア、およびエッジ領域スコアは、それぞれ、「45」、「50」、「25」になっており、その結果、候補領域201Aのトータルスコアは、「120」(=45+50+25)になっている。
なお、複数の候補領域201A乃至201Dにおいて、顔領域、動き領域、エッジ領域それぞれが同一の領域となることを妨げない。従って、例えば、ある候補領域内の10パーセントの所定の領域が、顔領域、動き領域、およびエッジ領域である場合が存在し、この場合、ある候補領域の顔領域スコア、動き領域スコア、およびエッジ領域スコアは、それぞれ、「10」、「10」、「10」になり、その結果、候補領域のトータルスコアは、「30」(=10+10+10)になる。
また、図7では、候補領域201Bのうちの20パーセントの領域が顔領域に、候補領域201Bのうちの40パーセントの領域が動き領域に、候補領域201Bのうちの15パーセントの領域がエッジ領域に、それぞれなっている。
このため、候補領域201Bの顔領域スコア、動き領域スコア、およびエッジ領域スコアは、それぞれ、「20」、「40」、「15」になっており、その結果、候補領域201Bのトータルスコアは「75」(=20+40+15)になっている。
さらに、候補領域201Cのうちの0パーセントの領域が顔領域に、候補領域201Cのうちの5パーセントの領域が動き領域に、候補領域201Cのうちの2パーセントの領域がエッジ領域に、それぞれなっている。
このため、候補領域201Cの顔領域スコア、動き領域スコア、およびエッジ領域スコアは、それぞれ、「0」、「5」、「2」になっており、その結果、候補領域201Cのトータルスコアは「7」(=0+5+2)になっている。
また、候補領域201Dのうちの0パーセントの領域が顔領域に、候補領域201Dのうちの20パーセントの領域が動き領域に、候補領域201Dのうちの15パーセントの領域がエッジ領域に、それぞれなっている。
このため、候補領域201Dの顔領域スコア、動き領域スコア、およびエッジ領域スコアは、それぞれ、「0」、「20」、「15」になっており、その結果、候補領域201Dのトータルスコアは「35」(=0+20+15)になっている。
上述したように、スコア計算部105は、トータルスコアが最小である候補領域をPinP領域に決定するので、図7に示したように、候補領域201A乃至201Dのトータルスコアが、それぞれ「120」、「75」、「7」、「35」である場合、最小のトータルスコア「7」の候補領域201Cが、PinP領域に決定される。
次に、図8は、図7で説明した第2のPinP領域決定処理により決定された、受信画像42におけるPinP領域としての候補領域201Cに、送信画像41を重畳したPinP画像43を示す図である。
以上のように、第2のPinP領域決定処理では、テレビ会議装置11aの送受信の対象の画像のうちの、例えば、テレビ会議装置11bから送信されてくる受信画像42から検出された重要領域としての、顔領域、動き領域、およびエッジ領域に基づいて、候補領域201A乃至201Dそれぞれに対して、顔領域スコア、動き領域スコア、およびエッジ領域スコアを算出し、それらのスコアすべてを加算することで得られるトータルスコアに基づいて、候補領域201A乃至201Dのうちの1の候補領域を、PinP領域に決定する。
そして、テレビ会議装置11aでは、第2のPinP領域決定処理により決定されたPinP領域に、テレビ会議装置11aの送受信の対象の画像のうちの、例えば、テレビ会議装置11bに送信する送信画像41を重畳することにより、受信画像42を親画面とするとともに、送信画像41を子画面としたPinP画像43を生成し、モニタ14aに表示させる。
従って、ユーザが、リモートコマンダ16aを操作して、送信画像が重畳されるPinP領域を決定しなくても、受信画像の、顔、動きおよびエッジのある部分がなるべく映ってない、画像の重畳に適切な領域に、送信画像を重畳することができる。
また、第2のPinP領域決定処理では、重要領域の種類を、顔領域の1種類から、顔領域、動き領域、およびエッジ領域の3種類に増やしたので、複数の候補領域のうちの、より適切な1の候補領域がPinP領域として決定される。
ここで、例えば、受信画像に映っている人物などが頻繁に移動する場合には、複数の候補領域それぞれのトータルスコアが頻繁に変化し、そのトータルスコアの変化により、PinP領域として決定される候補領域が頻繁に変化してしまう。
この場合、PinP領域が頻繁に変化するPinP画像が生成されてしまい、ユーザにとって非常に見にくいPinP画像となってしまう。
従って、スコア計算部105では、一旦、複数の候補領域のうちの、1つの候補領域がPinP領域に決定された後は、PinP領域が、その1つの候補領域から他の候補領域に変化しにくくなるようにすることができる。
なお、テレビ会議装置11aにおいて、PinP領域が、他の候補領域に変化しにくくなるようにするかどうかは、例えば、ユーザがリモートコマンダ16aを操作することにより設定することができる。
PinP領域を変化しにくくする方法としては、例えば、PinP領域に決定された候補領域や、その候補領域以外の候補領域のトータルスコアを操作し、その後、トータルスコアが最小の候補領域を、PinP領域に決定する方法がある。
図9は、そのようにしてPinP領域を決定する第3のPinP領域決定処理を説明する図である。
図9上側は、親画面となる受信画像342を示している。
図9上側において、受信画像342には、1人の人物(顔)と机とが映っている。また、図9上側では、受診画像342内の、左上、右上、左下、右下の4つの矩形の領域が、候補領域401A,401B,401C,401Dとなっている。
図9中央は、スコア計算部105が、上述した第2のPinP領域決定処理により、候補領域401A乃至401Dそれぞれに対して算出するスコアの一覧であるスコアテーブルを示している。
図9中央では、候補領域401A,401B,401C,401Dそれぞれに対しての顔領域スコアが「45」、「0」、「0」、「0」になっている。
また、図9中央では、候補領域401A,401B,401C,401Dそれぞれに対しての動き領域スコアが「50」、「0」、「5」、「0」になっており、候補領域401A,401B,401C,401Dそれぞれに対してのエッジ領域スコアが「25」、「0」、「2」、「10」になっている。
さらに、図9中央では、候補領域401A,401B,401C,401Dそれぞれに対しての、顔領域スコア、動き領域スコア、およびエッジ領域スコアすべてを加算することで得られるトータルスコアが「120」、「0」、「7」、「10」になっている。
従って、第2のPinP領域決定処理では、トータルスコアが、それぞれ「120」、「0」、「7」、「10」の候補領域401A乃至401Dのうちの、最小のトータルスコア「0」の候補領域401Bが、PinP領域に決定される。
一方、第3のPinP領域決定処理では、例えば、PinP領域に決定された候補領域のトータルスコアが、最小のトータルスコアでなくなった場合に、PinP領域が他の候補領域に変化しにくくなるように、PinP領域に決定された候補領域を除く候補領域すべてのトータルスコアが操作される。
即ち、前回の第3のPinP領域決定処理において、候補領域401A乃至401Dのうちの、例えば、候補領域401Cのトータルスコアが最小になり、候補領域401CがPinP領域に決定された場合、今回の第3のPinP領域決定処理において、図9中央に示したスコアテーブルが得られ、従って、前回の第3のPinP領域決定処理でPinP領域に決定された候補領域401Cのトータルスコアが最小でなくなったとき、今回の第3のPinP領域決定処理では、図9下側のスコアテーブルに示すように、前回の第3のPinP領域決定処理でPinP領域に決定された候補領域401C以外の候補領域401A,401B,401Dのそれぞれに対して、PinP領域を変化しにくくするためのスコア(以下、適宜、領域移動スコアという)として、例えば、「20」が加算される。
ここで、領域移動スコアの値は、例えば、ユーザが、リモートコマンダ16aを操作することにより設定することができる。
以上のように、第3のPinP領域決定処理では、トータルスコアに領域移動スコアが加算された後、トータルスコアが最小の候補領域がPinP領域に決定される。
従って、今回の第3のPinP領域決定処理において、顔領域スコア、動き領域スコア、およびエッジ領域スコアとして、図9中央に示したスコアテーブルの値が得られた場合でも、最終的に得られる候補領域401A乃至401Dのトータルスコアは、図9下側のスコアテーブルに示すように、それぞれ、「140」、「20」、「7」、「30」となり、候補領域401Cのトータルスコア「7」が最小となる。
その結果、今回の第3のPinP領域決定処理では、前回の第3のPinP領域決定処理でPinP領域に決定された候補領域401Cが、再び、PinP領域に決定される。
次に、図10は、図9で説明した第3のPinP領域決定処理により決定された、受信画像342におけるPinP領域としての候補領域401Cに、送信画像41を重畳したPinP画像343を示す図である。
第2のPinP領域決定処理では、PinP領域が、例えば、候補領域401Cから候補領域401Bに変化するような、PinP領域の変化が生じやすい。
一方、第3のPinP領域決定処理では、PinP領域が、例えば、候補領域401Cから候補領域401Bに変化するような、PinP領域の変化が抑制される。
従って、PinP領域が頻繁に変化する、ユーザにとって見にくいPinP画像が生成されることを防止することができる。
上述したPinP画像生成処理(図5)や第1乃至3のPinP領域決定処理(図4、図7、または図9)は、専用のハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。PinP画像生成処理や第1乃至3のPinP領域決定処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
図11は、プログラムを実行することにより上述したPinP画像生成処理や第1乃至3のPinP領域決定処理を行うコンピュータの構成例を示すブロック図である。
CPU(Central Processing Unit)901は、ROM(Read Only Memory)902、または記憶部908に記憶されているプログラムに従って各種の処理を実行する。RAM(Random Access Memory)903には、CPU901が実行するプログラムやデータなどが適宜記憶される。これらのCPU901、ROM902、およびRAM903は、バス904により相互に接続されている。
CPU901にはまた、バス904を介して入出力インタフェース905が接続されている。入出力インタフェース905には、キーボード、マウス、マイクロホンなどよりなる入力部906、モニタ、スピーカなどよりなる出力部907が接続されている。CPU901は、入力部906から入力される指令に対応して各種の処理を実行する。そして、CPU901は、処理の結果を出力部907に出力する。
入出力インタフェース905に接続されている記憶部908は、例えばハードディスクからなり、CPU901が実行するプログラムや各種のデータを記憶する。通信部909は、インターネットやローカルエリアネットワークなどのネットワークを介して外部の装置と通信する。
入出力インタフェース905に接続されているドライブ910は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア911が装着されたとき、それらを駆動し、そこに記録されているプログラムやデータなどを取得する。取得されたプログラムやデータは、必要に応じて記憶部908に転送され、記憶される。
コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを格納するプログラム記録媒体は、図11に示すように、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア911、または、プログラムが一時的もしくは永続的に格納されるROM902や、記憶部908を構成するハードディスクなどにより構成される。プログラム記録媒体へのプログラムの格納は、必要に応じてルータ、モデムなどのインタフェースである通信部909を介して、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の通信媒体を利用して行われる。
入出力インタフェース905に接続されている撮像部912は、撮像を行い、その結果得られる画像を、入出力インタフェース905およびバス904を介して、CPU901に供給する。また、撮像部912は、撮像により得られる画像を、入出力インタフェース905を介して、通信部909に供給し、他のコンピュータに送信させる。
なお、本明細書において、プログラム記録媒体に格納されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
なお、本実施の形態において、スコア計算部105により、PinP領域とされることをユーザが望まない所定の候補領域がPinP領域に決定されたときには、ユーザは、リモートコマンダ16aを操作することにより、PinP領域とされることをユーザが所望する他の候補領域をPinP領域に変更することができる。
このとき、テレビ会議装置11aでは、PinP領域に決定された所定の候補領域と、PinP領域に変更された他の候補領域とが、どのような領域であるかを検出し、PinP領域とされることをユーザが望まない領域と、PinP領域とされることをユーザが所望する領域とを学習することで、その学習結果に基づいて、PinP領域を決定するようにすることができる。
また、本実施の形態においては、例えば、テレビ会議装置11aが、通信相手のテレビ会議装置11bから送信されてくる受信画像内のPinP領域に、テレビ会議装置11aがテレビ会議装置11bに送信する送信画像を重畳することによりPinP画像を生成したが、テレビ会議装置11aに複数のカメラが設けられている場合には、複数のカメラのうちの1のカメラから出力される第1の送信画像内のPinP領域に、複数のカメラのうちの他のカメラから出力される第2の送信画像を重畳することによりPinP画像を生成することもできる。
さらに、例えば、テレビ会議装置11bから複数の受信画像が送信されてくる場合には、テレビ会議装置11aは、複数の受信画像のうちの1の受信画像内のPinP領域に、他の受信画像を重畳することによりPinP画像を生成することができる。
即ち、例えば、テレビ会議装置11aにおいては、送受信の対象の画像を対象としてPinP画像を生成することができる。
また、本実施の形態において、2つのテレビ会議装置11aと11bとにより構成されるテレビ会議システムについて説明したが、3以上のテレビ会議装置により構成されるテレビ会議システムについても本発明を適用することができ、例えば、3以上のテレビ会議装置のうちの1のテレビ会議装置は、その1のテレビ会議装置を除く2以上のテレビ会議装置からの受信画像や、1のテレビ会議装置が送信する送信画像を対象としてPinP画像を生成することができる。
さらに、本実施の形態においては、PinP画像において、1の子画面を表示させることとしたが、複数の子画面を表示させるようにしてもよい。
また、本実施の形態では、候補領域として、4つの候補領域を採用したが、候補領域の個数は、4つに限定されるものではなく、複数であればいくつであってもよい。候補領域の個数をどのようにするかは、例えば、ユーザがリモートコマンダ16aを操作することにより設定することができる。
さらに、上述した本実施の形態では言及しなかったが、例えば、カメラ13aが、予め設定された撮像方向の位置であるプリセットポジションとなるように回転駆動された場合には、PinP画像において、予め設定された位置に、子画面を表示させるようにすることができる。
また、受信画像からの重要領域の検出は、受信画像の各フレームを対象に行っても良いし、一部のフレームだけを対象に行っても良い。
重要領域の検出の対象とする一部のフレームとしては、例えば、一定のフレーム数ごとのフレームを採用することができる。
一定のフレーム数ごとのフレームのみを、重要領域の検出の対象とする場合には、重要領域の検出の対象としないフレームについては、そのフレームの間近の、重要領域を検出済みのフレームと同一の位置に重要領域が存在するとみなして、重要領域を検出することができる。この場合、受信画像の各フレームを重要領域の検出の対象とする場合と比較して、処理量を軽減させることができる。
また、本実施の形態においては、受信画像から、顔領域や、動き領域、エッジ領域などの重要領域を検出することにより、複数の候補領域それぞれに対して、候補領域が重要領域を含む度合いを表すスコアを算出し、そのスコアが最小の候補領域をPinP領域としてPinP画像を生成したが、例えば、受信画像から、重要性の低い非重要領域を検出することにより、複数の候補領域それぞれに対して、候補領域が非重要領域を含まない度合いを表すスコアを算出し、そのスコアが最小の候補領域、つまり、非重要領域をなるべく多く含む候補領域をPinP領域としてPinP画像を生成することもできる。
なお、非重要領域としては、例えば、画素の画素値のばらつきの度合いを表すアクティビティが低い領域である単調領域や、明るさが暗い領域である暗領域などを採用することができる。
ここで、アクティビティが、単調領域であると判定されるための単調領域閾値以下である領域が、単調領域として検出され、例えば、模様が単調な壁や机などが単調領域となる。
また、画素の輝度値が、明るさが暗いと判定されるための暗領域閾値以下である領域が、暗領域として検出され、例えば、机などの遮蔽物の陰となる部分が暗領域となる。
さらに、その他、例えば、受信画像から、重要領域および非重要領域を検出することにより、複数の候補領域それぞれに対して、候補領域が重要領域を含む度合いを表すスコアと、候補領域が非重要領域を含まない度合いを表すスコアとを算出し、その2つのスコアを加算することで得られるトータルスコアが最小の候補領域、つまり、重要領域をなるべく含まないで、非重要領域をなるべく多く含む候補領域をPinP領域としてPinP画像を生成するようにしてもよい。
また、本実施の形態では、PinP領域を決定する方法として、複数の候補領域のうちの、1の候補領域をPinP領域に決定する方法を説明したが、その他の方法として、例えば、受信画像における所定の領域をPinP領域に決定する方法を採用することができる。
受信画像における所定の領域をPinP領域に決定する方法としては、例えば、重要領域以外の領域や非重要領域をなるべく多く含む領域をPinP領域に決定したり、重要領域以外の領域や非重要領域内の領域をPinP領域に決定する方法が考えられる。
ここで、重要領域以外の領域や非重要領域内の領域をPinP領域に決定する場合、PinP画像では、重要領域以外の領域や非重要領域内の領域にのみ子画面が表示されるため、重要領域が子画面によって隠れることがないPinP画像を表示することができる。
なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
11a,11b テレビ会議装置, 103 デコーダ, 104 顔検出部, 105 スコア計算部, 106 PinP画像生成部, 107 縮小部, 108 表示制御部, 109 エンコーダ, 301 動き検出部, 302 エッジ検出部
Claims (7)
- 画像を送受信することにより行われるテレビ会議に使用されるテレビ会議装置において、
送受信の対象の画像のうちの1の画像から、重要性の高い領域である重要領域、または重要性の低い領域である非重要領域を検出する検出手段と、
前記1の画像の領域において、送受信の対象の画像のうちの、他の1の画像を重畳する領域であるPinP(picture in picture)領域を、前記重要領域または前記非重要領域に基づいて決定する決定手段と、
前記1の画像の前記PinP領域に、前記他の1の画像を重畳することにより、前記1の画像を親画面とするとともに、前記他の1の画像を子画面としたPinP画像を生成するPinP画像生成手段と、
前記PinP画像を、画像を表示する表示手段に表示させる表示制御手段と
を備えるテレビ会議装置。 - 前記検出手段は、顔を含む領域である顔領域、動きがある領域である動き領域、または、エッジを含む領域であるエッジ領域を、前記重要領域として検出する
請求項1に記載のテレビ会議装置。 - 前記決定手段は、前記1の画像内の、前記PinP領域の候補である複数の候補領域それぞれに対して、重要性の度合いを表すスコアを、前記重要領域または前記非重要領域に基づいて算出し、そのスコアに基づいて、複数の候補領域のうちの1の候補領域を、前記PinP領域に決定する
請求項1に記載のテレビ会議装置。 - 前記検出手段は、明るさが暗い領域である暗領域、またはアクティビティが低い領域である単調領域を、前記非重要領域として検出する
請求項1に記載のテレビ会議装置。 - 前記検出手段は、他のテレビ会議装置から受信した前記1の画像から、前記重要領域または前記非重要領域を検出し、
前記PinP画像生成手段は、前記1の画像の前記PinP領域に、前記他のテレビ会議装置に送信する前記他の1の画像を重畳することにより、前記1の画像を親画面とするとともに、前記他の1の画像を子画面としたPinP画像を生成する
請求項1に記載のテレビ会議装置。 - 画像を送受信することにより行われるテレビ会議に使用されるテレビ会議装置を制御する制御方法において、
送受信の対象の画像のうちの1の画像から、重要性の高い領域である重要領域、または重要性の低い領域である非重要領域を検出し、
前記1の画像の領域において、送受信の対象の画像のうちの、他の1の画像を重畳する領域であるPinP領域を、前記重要領域または前記非重要領域に基づいて決定し、
前記1の画像の前記PinP領域に、前記他の1の画像を重畳することにより、前記1の画像を親画面とするとともに、前記他の1の画像を子画面としたPinP画像を生成し、
前記PinP画像を、画像を表示する表示手段に表示させる
ステップを含む制御方法。 - 画像を送受信することにより行われるテレビ会議に使用されるテレビ会議装置として、コンピュータを機能させるプログラムにおいて、
送受信の対象の画像のうちの1の画像から、重要性の高い領域である重要領域、または重要性の低い領域である非重要領域を検出する検出手段と、
前記1の画像の領域において、送受信の対象の画像のうちの、他の1の画像を重畳する領域であるPinP領域を、前記重要領域または前記非重要領域に基づいて決定する決定手段と、
前記1の画像の前記PinP領域に、前記他の1の画像を重畳することにより、前記1の画像を親画面とするとともに、前記他の1の画像を子画面としたPinP画像を生成するPinP画像生成手段と、
前記PinP画像を、画像を表示する表示手段に表示させる表示制御手段と
して、コンピュータを機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007096752A JP2008258779A (ja) | 2007-04-02 | 2007-04-02 | テレビ会議装置、制御方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007096752A JP2008258779A (ja) | 2007-04-02 | 2007-04-02 | テレビ会議装置、制御方法、およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008258779A true JP2008258779A (ja) | 2008-10-23 |
Family
ID=39981941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007096752A Withdrawn JP2008258779A (ja) | 2007-04-02 | 2007-04-02 | テレビ会議装置、制御方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008258779A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002085354A (ja) * | 2000-09-07 | 2002-03-26 | Ge Medical Systems Global Technology Co Llc | 情報表示方法および装置、記録媒体並びに超音波撮影装置 |
WO2010058591A1 (ja) * | 2008-11-20 | 2010-05-27 | パナソニック株式会社 | 画像表示装置、テレビ会議装置、及び画像表示方法 |
JP2010206745A (ja) * | 2009-03-06 | 2010-09-16 | Brother Ind Ltd | 通信端末装置、表示制御方法、表示制御プログラム |
JP2013017125A (ja) * | 2011-07-06 | 2013-01-24 | Ricoh Co Ltd | 撮像装置及び撮像装置のモニタリング画像の表示方法 |
JP2014072839A (ja) * | 2012-10-01 | 2014-04-21 | Fujitsu Ltd | 画像処理装置、方法、及びプログラム |
US9300914B2 (en) | 2014-03-27 | 2016-03-29 | Brother Kogyo Kabushiki Kaisha | Computer readable recording medium and terminal apparatus |
WO2023067940A1 (ja) | 2021-10-21 | 2023-04-27 | ソニーグループ株式会社 | 情報処理装置、情報処理システム及び情報処理方法 |
-
2007
- 2007-04-02 JP JP2007096752A patent/JP2008258779A/ja not_active Withdrawn
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002085354A (ja) * | 2000-09-07 | 2002-03-26 | Ge Medical Systems Global Technology Co Llc | 情報表示方法および装置、記録媒体並びに超音波撮影装置 |
JP4615105B2 (ja) * | 2000-09-07 | 2011-01-19 | ジーイー・メディカル・システムズ・グローバル・テクノロジー・カンパニー・エルエルシー | 超音波撮影装置 |
WO2010058591A1 (ja) * | 2008-11-20 | 2010-05-27 | パナソニック株式会社 | 画像表示装置、テレビ会議装置、及び画像表示方法 |
JP2010206745A (ja) * | 2009-03-06 | 2010-09-16 | Brother Ind Ltd | 通信端末装置、表示制御方法、表示制御プログラム |
JP2013017125A (ja) * | 2011-07-06 | 2013-01-24 | Ricoh Co Ltd | 撮像装置及び撮像装置のモニタリング画像の表示方法 |
JP2014072839A (ja) * | 2012-10-01 | 2014-04-21 | Fujitsu Ltd | 画像処理装置、方法、及びプログラム |
US9300914B2 (en) | 2014-03-27 | 2016-03-29 | Brother Kogyo Kabushiki Kaisha | Computer readable recording medium and terminal apparatus |
WO2023067940A1 (ja) | 2021-10-21 | 2023-04-27 | ソニーグループ株式会社 | 情報処理装置、情報処理システム及び情報処理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022017369A (ja) | 角度分離されたサブシーンの合成およびスケーリング | |
US9860486B2 (en) | Communication apparatus, communication method, and communication system | |
JP2008258779A (ja) | テレビ会議装置、制御方法、およびプログラム | |
US8237771B2 (en) | Automated videography based communications | |
US8274544B2 (en) | Automated videography systems | |
EP2893700B1 (en) | Generating and rendering synthesized views with multiple video streams in telepresence video conference sessions | |
CN107113391B (zh) | 信息处理装置和方法 | |
US8654131B2 (en) | Video image processing apparatus and video image processing method | |
JP2006041887A (ja) | 情報処理装置および方法、記録媒体、並びにプログラム | |
JP2007173952A (ja) | コンテンツ再生システム、再生装置および方法、提供装置および提供方法、プログラム、並びに記録媒体 | |
JP2011166641A (ja) | 撮像装置 | |
JP2010087907A (ja) | 映像合成表示装置、映像表示システム及び映像表示方法 | |
JP2023001324A (ja) | 映像コーディングを行うコンピュータプログラム | |
JP7334470B2 (ja) | 映像処理装置、ビデオ会議システム、映像処理方法、およびプログラム | |
JP2005303736A (ja) | ビデオ会議システムにおける映像表示方法、ビデオ会議システムに用いられる利用者端末、及びビデオ会議システムに用いられる利用者端末用プログラム | |
JP5483012B2 (ja) | テレビ電話機能付きテレビジョン | |
JP2004056488A (ja) | 画像処理方法、画像処理装置および画像通信装置 | |
JP2008236679A (ja) | テレビ会議装置、制御方法、およびプログラム | |
WO2017150238A1 (ja) | 表示制御装置、表示制御方法、及び、プログラム | |
EP4106326A1 (en) | Multi-camera automatic framing | |
TW201639347A (zh) | 視線校正(二) | |
JP2011118632A (ja) | 発話の予備動作検出及び伝達方法及び装置及びプログラム | |
JP2010004480A (ja) | 撮像装置、その制御方法及びプログラム | |
WO2022000158A1 (en) | Videoconference user interface layout based on face detection | |
JP4054775B2 (ja) | ビデオ会議システムにおける映像表示方法及び映像表示制御方法、ビデオ会議システムに用いられる利用者端末及びサーバコンピュータ、並びにビデオ会議システムに用いられる利用者端末用プログラム及びサーバコンピュータ用プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20100706 |