JP4832869B2 - 通信端末およびその表示方法 - Google Patents

通信端末およびその表示方法 Download PDF

Info

Publication number
JP4832869B2
JP4832869B2 JP2005344752A JP2005344752A JP4832869B2 JP 4832869 B2 JP4832869 B2 JP 4832869B2 JP 2005344752 A JP2005344752 A JP 2005344752A JP 2005344752 A JP2005344752 A JP 2005344752A JP 4832869 B2 JP4832869 B2 JP 4832869B2
Authority
JP
Japan
Prior art keywords
display
screen
area
communication terminal
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005344752A
Other languages
English (en)
Other versions
JP2007150917A (ja
Inventor
空悟 守田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Corp
Original Assignee
Kyocera Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Corp filed Critical Kyocera Corp
Priority to JP2005344752A priority Critical patent/JP4832869B2/ja
Priority to US12/095,489 priority patent/US8487956B2/en
Priority to PCT/JP2006/323857 priority patent/WO2007063922A1/ja
Publication of JP2007150917A publication Critical patent/JP2007150917A/ja
Application granted granted Critical
Publication of JP4832869B2 publication Critical patent/JP4832869B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Mobile Radio Communication Systems (AREA)

Description

本発明は、携帯電話機等の通信端末およびその表示方法に係り、特に、多地点通信可能な通信端末およびその表示方法に関するものである。
多地点通信としての代表としては、テレビ会議システムがある。テレビ会議システムでは、MCU(Multi-point Control Unit)を介して複数の端末が接続する。MCUは、多数の端末から送られてきた画像データを1つの画面上に分割合成し、音声データとともに、各々の端末に送信することにより、多地点をつないだテレビ会議を実現する。
基本的に、各拠点の画像を1つの画像に分割合成する場合、
(1)1つの画像を等分割する場合(たとえば4分割、9分割)と、
(2)1つ大きな画像領域を取り、残りの領域を等分割に分割して合成する場合と、
がある(たとえば6分割)。
(1)の場合、MCUで結んでいる拠点からの画像が同じ面積を使って合成される。
(2)の場合、話している拠点を大きな面積を割り当て、残りの拠点からの画像を残りの等分割された領域に割り当てて、合成する。
いずれの場合でも、テレビ会議システムでは、大画面のモニタを用いて行うために、複数の拠点の画像を1つの画像に分割合成しても、個々の拠点を映す画像のサイズは充分な大きさを有し、一人で映っている分には、その人の顔が認識困難になるということはない。テレビ会議システムとしては、たとえば特許文献1,2等に開示されている。
図1(A)〜(E)は、一般的なテレビ会議システムにおける多値点通信時のパーソナルコンピュータ(PC)等の端末の表示画面例を示す図である。
図1の例においては、画面1を先に決められた枠(四角形)のウィンドゥに分割する。
たとえば、画面1は1つの大きなウィンドゥ(四角形)2と複数の小さなウィンドゥ(四角形)3−1〜3−5から形成され、話し手を大きなウィンドゥ2に表示する。
この場合、ウィンドゥのサイズ、および分割数は固定的であり、撮像された画像をそのまま表示しているため、撮影の状態に応じて、顔の大きさが変動する。
一般的なPCのウィンドゥ制御の場合、マウスでウィンドゥをドラッグすることにより、ウィンドゥのサイズの変更、ウィンドゥの選択を自由に行うことが可能である。
ところで、携帯電話機等の携帯通信端末は、音声通話だけでなく、メール、Webアクセス、ゲーム、カメラ、テレビ電話、メディアプレィア、ラジオ、テレビなど年々高機能化されている。
現行、携帯通信端末でのテレビ電話は、発呼時に、テレビ電話で接続することを選択するものである。
しかしながら、パケット通信への対応が進むことにより、音声通話自体がパケット通信に対応したVoIPが使用され、通話中にカメラを起動し、音声および映像での通話に切り替えたり、また逆に、カメラを停止し、音声通話のみにしたりといった使い方が主要となる。さらに、通話中の相手に、自端末に保存している文書(ex. メール)、住所データ、画像(静止画像、動画像)、音声などを送って、(通話相手にて自動的に再生され、)同時に観たり、Webサイトを同時に観たりすることが可能となる。
このように、高機能化により携帯通信端末がIP化された場合、同時に複数の相手(サーバを含む)と通信を行うことが可能となる。
この場合、一つの端末で複数のスクリーンを取り扱う必要がある。複数のスクリーンを取り扱う方法としては、(PDAなどで)ページめくり的に取り扱う方法がある。
特開平06−141310号公報 特開平06−141311号公報
ところで、たとえば携帯IP-TV電話では、画面のサイズが小さいため、複数人で、画像ありの通話を行った場合、一人ひとりの顔の大きさが小さくなる。
PCのウィンドゥのように、ユーザがウィンドゥを動かしたら、サイズを変えたりできるようにするには、画面サイズ、および操作キーに制限があり、困難である。
また、複数人が同程度で話した場合、スクリーンが対応できない。
さらに、音量に応じて、スクリーンサイズを設定した場合、無駄な空間を増加させたり、画面内に全スクリーンを表示しきれなくなったりする問題を有している。
具体的には、全スクリーンの音量が小さい場合、小さいスクリーンが画面上を浮遊することになる。一方、全スクリーンが音量最大の場合、表示スクリーンの合計面積が画面面積を超えるという問題を有する。
これに対して、局所的に合計面積を画面面積に規格化することによって、画面内に収まらせることは可能であるが、次時刻におけるスクリーン位置の再配置(移動)が不連続的になる。
本発明の目的は、ユーザが操作することなく、音量の大きさや表示すべき表示画像エリア(スクリーン)の数等の状況に応じて適応的に、最適に表示画像エリア(スクリーン)のサイズ、位置を更新することができ、しかも表示画像エリアの再配置(移動)が連続的になり、異なる形状であっても最適なサイズで配置することが可能となる通信端末およびその表示方法を提供することにある。
本発明の第1の観点は、受信した画像データおよび音声データを再生する通信端末であって、画像を表示する表示手段と、前記表示手段に特定のエリアを抽出されて表示すべき複数の画像の各々を表示する複数の表示エリアを形成可能で、少なくとも画像の表示エリア中心間を結ぶ線分、基準形状の厚さ、音声の大きさに基づいて、前記表示エリアの表示倍率を算出し、当該表示倍率に基づいて表示エリアの移動、新規生成を制御して、前記表示手段の表示画面上に複数の表示エリアを形成する制御手段とを有する。
好適には、前記制御手段は、前記表示エリア中心から画面境界に垂直に接した点に、音声の大きさ(V(k)=0)、厚さ(Lm(k,i)=0)を設定し、表示倍率(R(i,k))を算出する。
好適には、前記制御手段は、前記表示エリアを、表示倍率(R(i))を最も大きくする位置に移動する。
前記制御手段は、表示倍率(R(k))を最も大きくする位置に、新規表示エリアの中心を生成する。
好適には、前記制御手段は、基準形状面積を等しくする。
好適には、前記制御手段は、基準形状にて形成したスクリーン間に分離線を引き、前記分離線にて分離されたエリアを新たな表示エリアとする。
好適には、前記表示すべき画像に関する情報は、送信側装置からの受信情報に含まれ、前記制御手段は、前記受信情報に基づいて表示倍率算出し、表示エリアの移動、新規生成を制御する。
本発明の第2の観点は、受信した画像データ、音声データを再生する通信端末の表示方法であって、特定のエリアを抽出されて表示すべき複数の画像の表示エリア中心間を結ぶ線分、基準形状の厚さ、音声の大きさに基づいて、前記表示エリアの表示倍率を算出し、当該表示倍率に基づいて表示エリアの移動、新規生成を制御して、表示画面上に複数の表示エリアを形成し、表示すべき画像を含む複数の表示エリアを表示する。
本発明によれば、ユーザが操作することなく、音量の大きさや表示すべき表示画像エリア(スクリーン)の数等の状況に応じて適応的に、最適に表示画像エリア(スクリーン)のサイズ、位置を更新することができ、しかも表示画像エリアの再配置(移動)が連続的になり、異なる形状であっても最適なサイズで配置することが可能となる。
以下、本発明の実施形態を図面に関連付けて説明する。
図2および図3は、本発明の実施形態に係る携帯通信端末の構成例を示す図であって、図2はエンコード装置を示すブロック図であり、図3はデコード装置を示すブロック図である。
本携帯通信端末10は、送信元となるエンコード装置20と、受信側とあるデコード装置30とを有し、多地点通信可能に構成される。
エンコード装置20は、符号化した音声データ、画像データを、受信側端末に対する指示情報や画像の天地情報等を付加してパケットとしてネットワークに送信する機能を有する。
音声データおよび画像データに付加される送信元の指示情報は、指示された画像の送信元の識別する情報(たとえ、IPアドレス、MACアドレス)と、受信した画像上の位置を示す位置情報とを含む。
送信元となるエンコード装置20は、送信元は、画面上、指示した位置にスクリーン(スクリーンについては後で詳述する)が存在する場合、対応する指示情報、スクリーン情報、音量情報を生成し、同通信中の相手に対して送出する機能を有する。
図2のエンコード装置20は、マイクロフォン等からなる音声入力部201、デジタルカメラ等の画像入力部202、キー入力等が可能な操作部203、音声入力部201により入力される音声データを符号化する音声符号化処理部204、画像入力部202から入力され所定エリアに切り出された画像データを符号化する画像符号化処理部205、撮像画像に関連付けた天地情報に基づいて、撮像画像の天地を受信側の表示部の画面(端末画面)の天地と一致するように補正する天地補正部206、撮像画像から顔のエリアを検出、抽出する顔エリア検出部207、顔エリア検出部207にて検出された顔エリアに基づいて使用するスクリーン(表示すべき表示画像エリア)を判別しスクリーン情報を生成するスクリーン判別部208、スクリーン判別部208の判定に基づいて受信画像から該当するエリアを切り出す切り出し部209、音声入力部201による入力音量を計測し音量情報を生成する入力音量計測部210、操作部203の入力情報に基づいて端末を制御する端末制御部211、端末制御部211の指示に基づいて指示情報や天地情報、スクリーン情報、音量情報等を含む制御情報を生成する制御情報生成部212、画像・映像を記憶する記憶部213、符号化された音声データおよび画像データ、制御情報、端末制御部211の指示に基づいて記憶部213から読み出された画像・映像データを送信パケットとして生成する送信パケット生成部214、およびネットワークと無線通信可能で生成された送信パケットをネットワークを介して通信相手の端末やサーバに送信するネットワークインタフェース(I/F)215を有する。
デコード装置30は、通信相手(送信元)のエンコード装置20から送信されネットワークを介して受信した音声データ、画像データを再生する機能を有する。
デコード装置30は、たとえば多地点通信を行っている場合に、受信画像の制御情報に基づいて特定エリアである顔を含む画像を、使用するスクリーン(サイズが制御された表示エリア)を選択して表示し、音声を発する機能を有する。
デコード装置30は、このスクリーンの表示に際し、デッドゾーンをなくした円形(楕円形を含む概念である)ウィンドゥにて分割する機能を有する。
円形(楕円形)ウィンドウに分割するように構成したのは、以下の理由による。
一般的に、画面の分割は、長方形で行っていた。人間の顔は基本的に楕円形であり、長方形の四隅はデットゾーンとなる。このデッドゾーンが、顔を表示するエリアを結果的に狭く(小さく)している。
よって、本実施形態においては、このデッドゾーンをなくした円形(楕円形)ウィンドゥにて分割するように構成している。
また、デコード装置30は、マルチスクリーンを表示する機能を有し、スクリーン中心間を結ぶ線分、基準形状の厚さ、音声の大きさに基づいて、スクリーンの表示倍率を算出し、この表示倍率に基づいてスクリーンの移動、新規生成を制御することにより、画面上に複数のスクリーンを最適に形成する機能を有する。
具体的な処理については、後で図面に関連付けて詳述する。
図3のデコード装置30は、ネットワークと無線通信可能で送信元から送信された音声データ、画像(映像)データ、制御情報や指示情報、スクリーン情報、音量情報等を含むパケットを受信するネットワークインタフェース(I/F)301、キー入力等が可能な操作部302、ネットワークインタフェース301で受信されたパケットを解析し、音声データ、画像データ、送信元アドレス、制御情報(天地情報や指示情報等)を抽出する受信パケット解析部303、受信パケット解析部303により抽出された音声データを復号する音声復号処理部304、受信パケット解析部303により抽出された映像データを復号する映像復号処理部305、映像復号処理部305により復号された映像データ、送信元アドレス、制御情報、スクリーン情報、サイズ情報、天地情報に基づいて表示すべきスクリーン(表示ウィンドウ)のサイズや表示形態を制御する表示画像制御部306、音声復号処理部304により復号された音声の音量を修正する音量修正部307、音量修正部307で修正された音量で発音するスピーカ等の音声出力部308、表示画像制御部306によりサイズや表示形態が制御された画像を補正する画像補正部309、画像補正部309を介した画像を表示するLCD等の表示部(画像出力部)310、および操作部302からの入力情報に基づいて表示画像制御部306に制御情報(天地情報)を与える自端末制御部311を有する。
なお、エンコード装置20とデコード装置30は、操作部203と302、ネットワークインタフェース210と301、端末制御部211と自端末制御部311は共用することが可能である。
以下に、本実施形態の特徴部分である表示画像制御部306のより具体的な構成および機能、並びにスクリーンの具体的な構成や表示形態例について順を追って説明する。
図3の表示画像制御部306は、受信パケット解析部303により供給される制御情報に基づいてスクリーン情報、サイズ情報、天地情報、および指示情報を抽出する制御情報解析部3061、スクリーン情報に基づいて映像復号処理部305で復号された映像に対してマスキングを行うマスキング処理部3062、サイズ情報に基づいて表示すべきスクリーン(表示画像エリア)の表示倍率を算出する表示倍率算出部3063、表示倍率算出部3063で算出された表示倍率に従ってマスキング処理後の画像を縮小・拡大する縮小・拡大処理部3064、表示倍率算出部3063で算出された表示倍率および天地情報に従って表示位置を算出する表示位置算出部3065、および表示位置算出部3065にて得られた表示部310上の位置に縮小・拡大処理部3064にて得られた画像をマッピングするマッピング処理部3066を有する。
本実施形態の表示画像制御部306によりサイズおよび表示形態が制御されるスクリーンは、1つの画面上に複数のスクリーンを表示するマルチスクリーンとして表示される。
本実施形態の表示倍率算出部3063において、スクリーンは、スクリーンの表示位置を示す中心位置座標(P(i))、スクリーンの形状を示す基準形状(Unit(i))、スクリーンに対応付けられた音声の大きい(V(i))、スクリーンを画面上に表示する際の表示倍率(R(i))とを有し、表示倍率(R(i))は、周囲のスクリーンの中心位置座標(P(j))と結ぶ線分(L(i,j))と、その線分上の基準形状の厚さ(Lm(i,j),Lm(j,i))、および、音声の大きさ(V(i),V(j))に基づいて算出しされた仮表示倍率(R(i,j))の内、最も小さい値をする。
表示倍率算出部3063において、スクリーン中心から画面境界に垂直に接した点に、音声の大きさ(V(k)=0)、厚さ(Lm(k,i)=0)を設定し、表示倍率(R(i,k))を算出する。
また、スクリーンは、表示倍率(R(i))を最も大きくする位置に移動する。
また、スクリーンは、表示倍率(R(k))の最も大きい位置に、新規スクリーンの中心を生成する。
また、基準形状は、面積を等しくする。
さらにまた、基準形状にて形成したスクリーン間に分離線を引き、前記分離線にて分離されたエリアを新たなスクリーンとする。
次に、本実施形態に係る表示画像制御部306によりサイズおよび表示形態が制御されるスクリーンの表示倍率の算出、新規スクリーンの生成位置の算出、スクリーンの移動位置の算出等についてより具体的に説明する。
図4に示すように、各スクリーン40は、基準形状(Unit)を有する。表示部310の画面上へのスクリーン40は、基準形状(Unit)を表示倍率(R)に従って、拡大・縮小して表示する。
表示倍率(R)の算出
表示倍率算出部3063は、スクリーンiとスクリーンjとの中心間の距離(L(i,j))、各スクリーンの中心から前記方向への基準形状(Unit)における厚さ(Lm(i,j)、Lm(j,i))を算出し、および、各スクリーンに表示する内容における受信した音声の大きさ(V(i),V(j))に基づいて、スクリーンiにおけるスクリーンjからの算出される表示倍率(R(i,j))を以下の通りに算出する。
Figure 0004832869
周囲に存在するスクリーン間の表示倍率を算出し、次式のように、その表示倍率の内、最も小さい値を実際の表示倍率(R(i))とする。
Figure 0004832869
新規のスクリーンの生成位置の算出
表示倍率算出部3063は、画面上に仮の中心を配し、各中心において、表示倍率(Rmin)を算出する。各表示倍率(R)の内、最も大きい値を取る位置を新規のスクリーンの生成の中心位置とする。
Figure 0004832869
Figure 0004832869
この条件を満たす中心(P(k))を新規スクリーンの中心位置とする。
スクリーンの移動位置の算出
各スクリーンは、現在(t)の位置から一定距離内(集合I)の各位置において、表示倍率(R)を算出し、表示倍率の内、最も大きな値を取る位置を次時刻(t+Δt)における中心位置とする。
Figure 0004832869
Figure 0004832869
この条件を満たす中心(P(t+Δt))に移動する。
スクリーン位置は、時間経過に伴い、画面上を移動していく。このため、新規のスクリーンの生成においては、画面上の空き位置全てに対して演算を行う必要はない。つまり、画面上の何点かに対して、新規生成位置の判定を行い、その結果により位置を配置したとしても、時間経過とともに、表示倍率がもっとも大きい位置に移動していく。これにより、生成における演算負荷を低減することが可能となる。
随時、スクリーンの位置関係は変動していくため、表示倍率(R(*))算出における基準形状の厚さ(Lm(*))は、その時の方向に対して算出する必要がある。
この厚さ算出に関しては、(複雑な形状に対して)中心から対象方向へデジタル直線を引くことにより、算出することが可能となる。ただし、これは演算負荷の増加となる。これに対しては、各基準形状に対して、各角度に対する厚さを前もって算出したテーブルを参照することにより、表示倍率演算時の演算負荷を低減することが可能となる。
画面の四方の壁処理
各スクリーン40は、四方の壁との間に以下の演算規則に従って、表示倍率(R)を算出する。
図5に示すように、スクリーンの中心から壁に垂直に落とした点を算出上の壁の中心とし、中心間の線分(L(i,k))、基準形状(Unit)における厚さ(Lm(i,k),Lm(k,i))と、およびスクリーンの受信した音声の大きさ(V(i),V(k))を算出する。この時、壁における、音声の大きさは(V(k)=0)、基準形状の厚さ(Lm(k,i)=0)として、前述の表示倍率(R)の算出と同様に算出を行う。
各々のスクリーン40において、表示倍率(R(i))を算出する場合、周囲のスクリーンとの表示倍率(R(i,j)と同様に、壁との表示倍率(R(i,k))を算出し、この内、最も小さい値を実際に表示する際の表示倍率(R(i))とする
基準形状を楕円形とするスクリーン(S(0),S(1))において、音声の大きさ(V(0),V(1))の比を変化させた例を図6(A)〜(C)に示す。
図6(A)〜(C)において、左から、音声の大きさの比(V(0):V(1))が、1:1、2:1、3:1の場合である。このように、音量に大きさに応じて、適応的にスクリーンサイズを変動することが可能となる。
基準形状を楕円形とするスクリーン(S(0),S(1),S(2),S(3))において、画面上に形成するスクリーン数を増減した例を図7(A)〜(C)に示す。
図7(A)〜(C)において、左から、スクリーン数=2、3、4の場合である。
このように、スクリーン数の数に応じて、適応的にスクリーンサイズを変動させ、画面内に全てのスクリーンを形成することが可能となる。
基準形状を楕円形とするスクリーン(S(0),S(1),S(2),S(3))において、画面上に形成するスクリーン数を増減しつつ、そのうち1つのスクリーンの音声の大きさを他のスクリーンの音声の大きさの倍にした例を図8(A)〜(C)に示す。
図8(A)〜(C)において、左から、スクリーン数=2、3、4の場合であり、音声の大きさの比(V(0):V(1))が2:1、比(V(0):V(1):V(2))が2:1:1、比(V(0):V(1):V(2):V(3))が2:1:1:1の場合である。
このように、スクリーン数の数に応じて、適応的にスクリーンサイズを変動させ、画面内に全てのスクリーンを形成することが可能となる。これは、スクリーン(S(0))に映っている人が発言をしている例であり、このように、一人が発言している場合、その人のスクリーンのみが、その大きさに応じて適応的にスクリーンサイズを拡大・縮小することが可能となる。
基準形状を楕円形とするスクリーンS(0),S(1),S(2),S(3))において、画面上に形成するスクリーン数を増減しつつ、そのうち1つのスクリーンの音声の大きさを他のスクリーンの音声の大きさを1/2倍にした例を図9(A)〜(C)に示す。
図9(A)〜(C)において、左から、スクリーン数=2、3、4の場合であり、音声の大きさの比(V(0):V(1))が2:1、比(V(0):V(1):V(2))が2:1:2、比(V(0):V(1):V(2):V(3))が2:1:2:2の場合である。
このように、スクリーン数の数に応じて、適応的にスクリーンサイズを変動させ、画面内に全てのスクリーンを形成することが可能となる。これは、スクリーン(S(0))に映っている人以外が発言をしている例であり、このように、複数の人が発言している場合でも、状況に合わせて、適応的にスクリーンサイズを拡大・縮小することが可能となる。
基準形状が、楕円形(S(oval))、円形(S(circle))、長方形(S(rectangle))が混在している場合(音声の大きさは等しい)の例を図10(A)〜(D)に示す。
図10(A)〜(D)において、左から、長方形と楕円形、円形と楕円形、円形と長方形、下方が円形と楕円形と長方形の場合を示している。
基準形状は、形状が異なっても、面積を同等に設定することにより、各スクリーンは、適応的にスクリーンサイズを調整し、音声の大きさが等しい場合、視覚的に各々のスクリーンサイズが等しく表示することが可能となる。
さらに、本実施形態においては、スクリーン外のデッドゾーンを低減することから、図11(A)〜(C)に示すように、各スクリーンの間にエリアの分離線(太線)を形成し、前記分離線に基づいたエリアは各スクリーンの表示エリアとする。これにより、スクリーン数の増減と、各スクリーンの音声の大きさの増減に適応しつつ、画面を最大限に分割利用することが可能となる。
図11(A)〜(C)の例は、音声の大きさの比(V(0):V(1))が2:1、比(V(0):V(1):V(2))が2:1:1、比(V(0):V(1):V(2):V(3))が2:1:1:1の場合である。
次に、上述したようサイズおよび表示形態が制御される表示部310におけるスクリーン表示制御について、図12から図16に関連付けて説明する。
本実施形態においては、前述したように、デッドゾーンをなくした円形(楕円形)ウィンドゥにて分割する。
図12および図13に示すように、スクリーン上に表示する画像は、送信側(エンコード装置側)、ないし受信側(デコード装置側)において、画像から顔の特徴点を抽出し、これに基づいて、顔エリア算出を行う。この顔エリアがスクリーンにて包含されるように画像を切り出し、スクリーンにマッピングする。
図12および図13に示すように、受信画像から、顔の特徴点111を検索し、輪郭抽出を行って顔を抽出する。そして、一度、顔エリアを抽出した場合、動きベクトルに応じて顔エリアの追従を行って、切り出しを行う。
本実施形態においては、図2および図3に関連つけた図14に示すように、エンコード装置20側(符号化側)にて、顔エリアを検出し、検出した顔エリアを包含するとともに、顔以外のエリアが最小になるように円形のスクリーンを選択する。円形のスクリーンを包含する四角形エリアを送信画像として切り出し、これを符号化し、スクリーン情報、マイクなどの入力音声の音量情報とともにパケットとして送出する。
エンコード装置20において、図15に示すように、撮像画像に対して、符号化部分は一部分である。網掛けの部分は、切り落とし部分であり、符号化の対象から削除している。結果的に伝送する画像データの容量は削減される。
また、図16に示すように、撮像されている内容を解析し、撮像内容に応じて、スクリーン形状を変える場合において、適用可能である。
図16の例においては、人が撮像されていると判断された場合、スクリーン形状を楕円形にし、それ以外の場合はスクリーン形状を長方形にした場合である。
図16に例においては、顔エリアの面積が一定値以上の場合、受信画像を「人物画像」と判別する。顔エリアの面積が一定値以下の場合、受信画像を「非人物画像」と判別する。
「人物画像」と判別した場合、円形スクリーンとする。「非人物画像」と判別した場合、四角形スクリーンとする。「非人物画像」であっても、同送信元からの音圧に応じて、表示サイズを変動させる。
そして、図14に示すように、デコード装置30においては、受信データから映像復号処理部305にて復号された受信画像を、制御情報解析部3061で抽出されたスクリーン情報に基づいてマスキングする。
また、表示倍率算出部3063において、サイズ情報に基づき表示倍率を算出し、縮小・拡大処理部3064において算出した倍率に従ってマスキングされた画像が縮小、拡大する。一方、表示位置算出部3065において、算出された表示倍率に従って表示位置を算出し、算出した表示位置に縮小または拡大された画像を含むスクリーンを表示部310に表示する。
個々で、多地点通信を行う場合であって、端末機を図2および図3に示す構成とした場合における処理に負荷について考察する。
デコード装置30側で台数Nに増大した場合の処理は、次のようになる。
Onew=N×(マスキング処理+縮小・拡大処理+マッピング処理+表示倍率算出+表示位置算出)
これに対して、デコード装置側において、本実施形態の送信側(エンコード装置側)の処理をデコード装置側において行うように構成した場合の処理は次のようになる。
Oold=N×(天地補正処理+顔エリア検出+スクリーン判定+切り出し処理+サイズ算出+縮小・拡大処理+表示倍率算出+表示位置算出+マッピング処理)
処理の差を観ると、図2および図3に示す構成の方が、次に示す分、負荷が軽減されていることになる。
Osub=Oold−Onew
=N×(天地補正処理+顔エリア検出+スクリーン判定+切り出し処理+サイズ算出−マスキング処理)
この内、処理負荷のほとんどは、「顔エリア検出」となる。
送信側(エンコード装置側)では、次に示す分だけ負荷が増加している。
Enew=天地補正処理+顔エリア検出+スクリーン判定+切り出し処理+サイズ算出
しかし、この負荷は接続する台数には依存しない。
以上説明したように、本実施形態によれば、送信元となるエンコード装置20は、送信元は、画面上、指示した位置にスクリーンが存在する場合、対応する指示情報、スクリーン情報、音量情報を生成し、同通信中の相手に対して送出する機能を有し、デコード装置30は、マルチスクリーンを表示する機能を有し、スクリーン中心間を結ぶ線分、基準形状の厚さ、音声の大きさに基づいて、スクリーンの表示倍率を算出し、この表示倍率に基づいてスクリーンの移動、新規生成を制御することにより、画面上に複数のスクリーンを最適に形成する機能を有することから、スクリーンのサイズが、音量の大きさ、およびスクリーン数に応じて、適応的にサイズを変動させることができる。
また、スクリーンの動きが連続的になり、異なる形状であっても、最適なサイズに配置することが可能となる利点がある。
その結果、複数端末の接続時であっても、通話中の相手を確認しやすく、また、画像(スクリーン)は重ならないように制御されることから、会話している全員の状態が一目で確認することができる。また、新たな参加人にも容易に対応することができる。
一般的なテレビ会議システムにおける多値点通信時のパーソナルコンピュータ(PC)等の端末の表示画面例を示す図である。 本発明の実施形態に係る携帯通信端末の構成例を示す図であって、エンコード装置を示すブロック図である。 本発明の実施形態に係る携帯通信端末の構成例を示す図であって、デコード装置を示すブロック図である。 表示倍率の算出処理を説明するための図である。 画面四方の壁処理を説明するための図である。 基準形状を楕円形とするスクリーン(S(0),S(1))において、音声の大きさ(V(0),V(1))の比を変化させた例を示す図である。 基準形状を楕円形とするスクリーン(S(0),S(1),S(2),S(3))において、画面上に形成するスクリーン数を増減した例を示す図である。 基準形状を楕円形とするスクリーン(S(0),S(1),S(2),S(3))において、画面上に形成するスクリーン数を増減しつつ、そのうち1つのスクリーンの音声の大きさを他のスクリーンの音声の大きさの倍にした例を示す図である。 基準形状を楕円形とするスクリーンS(0),S(1),S(2),S(3))において、画面上に形成するスクリーン数を増減しつつ、そのうち1つのスクリーンの音声の大きさを他のスクリーンの音声の大きさを1/2倍にした例を示す図である。 基準形状が、楕円形(S(oval))、円形(S(circle))、長方形(S(rectangle))が混在している場合(音声の大きさは等しい)の例を示す図である。 各スクリーンの間にエリアの分離線(太線)を形成し、前記分離線に基づいたエリアは各スクリーンの表示エリアとする例を示す図である。 スクリーン表示制御について説明するための図であって、受信画像から顔エリアの抽出処理の説明図である。 スクリーン表示制御について説明するための図であって、受信画像から顔エリアの抽出処理後の切り出し処理の説明図である。 本実施形態の動作を模式的に示す図である。 本実施形態の動作を説明するための図であって、送信側における撮像画像の送信エリア例を示す図である。 スクリーン表示制御について説明するための図であって、顔エリアの面積に応じた処理の説明図である。
符号の説明
10・・・携帯通信端末、20・・・エンコード装置、201・・・音声入力部、202・・・画像入力部、203・・・操作部、204・・・音声符号化処理部、205・・・画像符号化処理部、206・・・天地補正部、207・・・顔エリア検出部、208・・・スクリーン判定部、209・・・切り出し処理部、210・・・入力音量計測部、211・・・端末制御部、212・・・制御情報生成部、213・・・記憶部、214・・・送信パケット生成部、215・・・ネットワークインタフェース(I/F)、30・・・デコード装置、301・・・ネットワークインタフェース(I/F)、302・・・操作部、303・・・受信パケット解析部、304・・・音声復号処理部、305・・・映像復号処理部、306・・・表示画像制御部、307・・・音量修正部、308・・音声出力部、309・・・画像補正部、310・・・表示部(画像出力部)、311・・・自端末制御部、3061・・・制御情報解析部、3062・・・マスキング処理部、3063・・・表示倍率算出部、3064・・・縮小・拡大処理部、3065・・・表示位置算出部、3066・・・マッピング処理部。

Claims (8)

  1. 受信した画像データおよび音声データを再生する通信端末であって、
    画像を表示する表示手段と、
    前記表示手段に特定のエリアを抽出されて表示すべき複数の画像の各々を表示する複数の表示エリアを形成可能で、少なくとも画像の表示エリア中心間を結ぶ線分、基準形状の厚さ、音声の大きさに基づいて、前記表示エリアの表示倍率を算出し、当該表示倍率に基づいて表示エリアの移動、新規生成を制御して、前記表示手段の表示画面上に複数の表示エリアを形成する制御手段と
    を有する通信端末。
  2. 前記制御手段は、前記表示エリア中心から画面境界に垂直に接した点に、音声の大きさ(V(k)=0)、厚さ(Lm(k,i)=0)を設定し、表示倍率(R(i,k))を算出する
    請求項1記載の通信端末。
  3. 前記制御手段は、前記表示エリアを、表示倍率(R(i))を最も大きくする位置に移動する
    請求項1または2に記載の通信端末。
  4. 前記制御手段は、表示倍率(R(k))を最も大きくする位置に、新規表示エリアの中心を生成する
    請求項1から3のいずれか一に記載の通信端末。
  5. 前記制御手段は、基準形状面積を等しくする
    請求項1から4のいずれか一に記載の通信端末。
  6. 前記制御手段は、基準形状にて形成したスクリーン間に分離線を引き、前記分離線にて分離されたエリアを新たな表示エリアとする
    請求項1から5のいずれか一に記載の通信端末。
  7. 前記表示すべき画像に関する情報は、送信側装置からの受信情報に含まれ、
    前記制御手段は、前記受信情報に基づいて表示倍率算出し、表示エリアの移動、新規生成を制御する
    請求項1から6のいずれか一に記載の通信端末。
  8. 受信した画像データ、音声データを再生する通信端末の表示方法であって、
    特定のエリアを抽出されて表示すべき複数の画像の表示エリア中心間を結ぶ線分、基準形状の厚さ、音声の大きさに基づいて、前記表示エリアの表示倍率を算出し、
    当該表示倍率に基づいて表示エリアの移動、新規生成を制御して、表示画面上に複数の表示エリアを形成し、
    表示すべき画像を含む複数の表示エリアを表示する
    通信端末の表示方法。
JP2005344752A 2005-11-29 2005-11-29 通信端末およびその表示方法 Expired - Fee Related JP4832869B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005344752A JP4832869B2 (ja) 2005-11-29 2005-11-29 通信端末およびその表示方法
US12/095,489 US8487956B2 (en) 2005-11-29 2006-11-29 Communication terminal, system and display method to adaptively update a displayed image
PCT/JP2006/323857 WO2007063922A1 (ja) 2005-11-29 2006-11-29 通信端末および通信システム、並びに通信端末の表示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005344752A JP4832869B2 (ja) 2005-11-29 2005-11-29 通信端末およびその表示方法

Publications (2)

Publication Number Publication Date
JP2007150917A JP2007150917A (ja) 2007-06-14
JP4832869B2 true JP4832869B2 (ja) 2011-12-07

Family

ID=38211752

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005344752A Expired - Fee Related JP4832869B2 (ja) 2005-11-29 2005-11-29 通信端末およびその表示方法

Country Status (1)

Country Link
JP (1) JP4832869B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8390665B2 (en) * 2009-09-03 2013-03-05 Samsung Electronics Co., Ltd. Apparatus, system and method for video call
JP5740972B2 (ja) * 2010-09-30 2015-07-01 ソニー株式会社 情報処理装置および情報処理方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05103324A (ja) * 1991-10-09 1993-04-23 Mitsubishi Electric Corp 多地点テレビ会議制御装置
JPH08298653A (ja) * 1995-04-25 1996-11-12 Canon Inc テレビ会議システム及びその端末装置
JP2005303736A (ja) * 2004-04-13 2005-10-27 Ntt Communications Kk ビデオ会議システムにおける映像表示方法、ビデオ会議システムに用いられる利用者端末、及びビデオ会議システムに用いられる利用者端末用プログラム

Also Published As

Publication number Publication date
JP2007150917A (ja) 2007-06-14

Similar Documents

Publication Publication Date Title
JP4994646B2 (ja) 通信端末および通信システム、並びに通信端末の表示方法
US8487956B2 (en) Communication terminal, system and display method to adaptively update a displayed image
US11356488B2 (en) Frame synchronous rendering of remote participant identities
US9894320B2 (en) Information processing apparatus and image processing system
EP2811739B1 (en) Terminal, image communication control server, and system and method for image communication using same
US7508413B2 (en) Video conference data transmission device and data transmission method adapted for small display of mobile terminals
US11102450B2 (en) Device and method of displaying images
US20080062252A1 (en) Apparatus and method for video mixing and computer readable medium
JP2005123804A (ja) コミュニケーションシステム及び方法
US11553157B2 (en) Device and method of displaying images
JP4973908B2 (ja) 通信端末およびその表示方法
WO2018061173A1 (ja) Tv会議システム、tv会議方法、およびプログラム
JP2005328484A (ja) テレビ会議システム、情報処理装置及び情報処理方法並びにプログラム
JP4990520B2 (ja) 通信端末およびその表示方法
JP5274750B2 (ja) 通信端末およびその表示方法
CN113315927B (zh) 视频处理方法和装置、电子设备和存储介质
JP2005303736A (ja) ビデオ会議システムにおける映像表示方法、ビデオ会議システムに用いられる利用者端末、及びビデオ会議システムに用いられる利用者端末用プログラム
JP4832869B2 (ja) 通信端末およびその表示方法
JP2011082867A (ja) 通信装置及び通信会議システム
JP2004258819A (ja) 電子コミュニケーション支援サーバ
JP4926464B2 (ja) 通信端末およびその表示方法
JP2010004573A (ja) 通信端末およびその表示方法
JP2008306475A (ja) 音声・画像会議装置
JP2014153747A (ja) 画像複雑度に基づいてキャラクタ表示を制御するプログラム、情報機器及び方法
JP4850509B2 (ja) 通信端末装置及び通信端末装置における画像表示方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080902

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110830

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110921

R150 Certificate of patent or registration of utility model

Ref document number: 4832869

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140930

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees