JP2007150921A - 通信端末および通信システム、並びに通信端末の表示方法 - Google Patents

通信端末および通信システム、並びに通信端末の表示方法 Download PDF

Info

Publication number
JP2007150921A
JP2007150921A JP2005344756A JP2005344756A JP2007150921A JP 2007150921 A JP2007150921 A JP 2007150921A JP 2005344756 A JP2005344756 A JP 2005344756A JP 2005344756 A JP2005344756 A JP 2005344756A JP 2007150921 A JP2007150921 A JP 2007150921A
Authority
JP
Japan
Prior art keywords
image
display area
size
screen
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005344756A
Other languages
English (en)
Other versions
JP4994646B2 (ja
Inventor
Kugo Morita
空悟 守田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Corp
Original Assignee
Kyocera Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Corp filed Critical Kyocera Corp
Priority to JP2005344756A priority Critical patent/JP4994646B2/ja
Priority to PCT/JP2006/323857 priority patent/WO2007063922A1/ja
Priority to US12/095,489 priority patent/US8487956B2/en
Publication of JP2007150921A publication Critical patent/JP2007150921A/ja
Application granted granted Critical
Publication of JP4994646B2 publication Critical patent/JP4994646B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

【課題】状況に応じて適応的に、最適に表示画像エリアのサイズ、位置を更新することができ、しかも表示画像エリアの再配置が連続的になり、受信側では即座にその画像を大きく見せることが可能となり、送信側、受信側にて同タイミングで再生することが可能な通信端末および通信システム、並びに通信端末の表示方法を提供する。
【解決手段】通信端末10は、スクリーン中心間を結ぶ線分、基準形状の厚さ、音声の大きさに基づいて、スクリーンの表示倍率を算出し、この表示倍率に基づいてスクリーンの移動、新規生成を制御することにより、画面上に複数のスクリーンを最適に形成し、通信情報として、同一端末からの別セッションは、同一端末の下位情報として付加し、画像を表示する表示エリアサイズは、最も下位に位置する情報にかかわる表示エリアを注目すべき表示エリアと判断し、対応する表示エリアに制御する機能を有する。
【選択図】図15

Description

本発明は、携帯電話機等の通信端末およびその表示方法に係り、特に、多地点通信可能な通信端末および通信システム、並びに通信端末の表示方法に関するものである。
多地点通信としての代表としては、テレビ会議システムがある。テレビ会議システムでは、MCU(Multi-point Control Unit)を介して複数の端末が接続する。MCUは、多数の端末から送られてきた画像データを1つの画面上に分割合成し、音声データとともに、各々の端末に送信することにより、多地点をつないだテレビ会議を実現する。
基本的に、各拠点の画像を1つの画像に分割合成する場合、
(1)1つの画像を等分割する場合(たとえば4分割、9分割)と、
(2)1つ大きな画像領域を取り、残りの領域を等分割に分割して合成する場合と、
がある(たとえば6分割)。
(1)の場合、MCUで結んでいる拠点からの画像が同じ面積を使って合成される。
(2)の場合、話している拠点を大きな面積を割り当て、残りの拠点からの画像を残りの等分割された領域に割り当てて、合成する。
いずれの場合でも、テレビ会議システムでは、大画面のモニタを用いて行うために、複数の拠点の画像を1つの画像に分割合成しても、個々の拠点を映す画像のサイズは充分な大きさを有し、一人で映っている分には、その人の顔が認識困難になるということはない。テレビ会議システムとしては、たとえば特許文献1,2等に開示されている。
図1(A)〜(E)は、一般的なテレビ会議システムにおける多値点通信時のパーソナルコンピュータ(PC)等の端末の表示画面例を示す図である。
図1の例においては、画面1を先に決められた枠(四角形)のウィンドゥに分割する。
たとえば、画面1は1つの大きなウィンドゥ(四角形)2と複数の小さなウィンドゥ(四角形)3−1〜3−5から形成され、話し手を大きなウィンドゥ2に表示する。
この場合、ウィンドゥのサイズ、および分割数は固定的であり、撮像された画像をそのまま表示しているため、撮影の状態に応じて、顔の大きさが変動する。
一般的なPCのウィンドゥ制御の場合、マウスでウィンドゥをドラッグすることにより、ウィンドゥのサイズの変更、ウィンドゥの選択を自由に行うことが可能である。
ところで、携帯電話機等の携帯通信端末は、音声通話だけでなく、メール、Webアクセス、ゲーム、カメラ、テレビ電話、メディアプレィア、ラジオ、テレビなど年々高機能化されている。
現行、携帯通信端末でのテレビ電話は、発呼時に、テレビ電話で接続することを選択するものである。
しかしながら、パケット通信への対応が進むことにより、音声通話自体がパケット通信に対応したVoIPが使用され、通話中にカメラを起動し、音声および映像での通話に切り替えたり、また逆に、カメラを停止し、音声通話のみにしたりといった使い方が主要となる。さらに、通話中の相手に、自端末に保存している文書(ex. メール)、住所データ、画像(静止画像、動画像)、音声などを送って、(通話相手にて自動的に再生され、)同時に観たり、Webサイトを同時に観たりすることが可能となる。
このように、高機能化により携帯通信端末がIP化された場合、同時に複数の相手(サーバを含む)と通信を行うことが可能となる。
この場合、一つの端末で複数のスクリーンを取り扱う必要がある。複数のスクリーンを取り扱う方法としては、(PDAなどで)ページめくり的に取り扱う方法がある。
特開平06−141310号公報 特開平06−141311号公報
ところで、たとえば携帯IP-TV電話では、画面のサイズが小さいため、複数人で、画像ありの通話を行った場合、一人ひとりの顔の大きさが小さくなる。
PCのウィンドゥのように、ユーザがウィンドゥを動かしたら、サイズを変えたりできるようにするには、画面サイズ、および操作キーに制限があり、困難である。
また、複数人が同程度で話した場合、スクリーンが対応できない。
さらに、音量に応じて、スクリーンサイズを設定した場合、無駄な空間を増加させたり、画面内に全スクリーンを表示しきれなくなったりする問題を有している。
具体的には、全スクリーンの音量が小さい場合、小さいスクリーンが画面上を浮遊することになる。一方、全スクリーンが音量最大の場合、表示スクリーンの合計面積が画面面積を超えるという問題を有する。
これに対して、局所的に合計面積を画面面積に規格化することによって、画面内に収まらせることは可能であるが、次時刻におけるスクリーン位置の再配置(移動)が不連続的になる。
また、送信側である撮影者がカメラをパーンなどして被写体を変える場合、その被写体を受信側である相手に見せたいがためである。その際に、必ずしも撮影者は話しているとは限らない。このため、パーンした後に、何かしら話さないといけないことになる。例えば、何を購入してくれば良いか選択してもらうために、画像を送っている場合、絶えず撮影者が話しをしつづけることはできない。
しかし、受信した画像自体はその間絶えず視認できる大きさのスクリーンである必要がある。
さらに、通話中に送ったファイルは、その会話中、注目するべきファイルであり、表示、再生した内容は、視認できる大きさのスクリーンである必要がある。
従来の接続において、2者通話から3者通話へ移行する場合、双方に接続する端末が、双方と接続するメディアを変更し、メディアミキシングとして動作する。スクリーン制御は、メディアミキシングを行う端末が行うことになる。
つまり、スクリーンを表示する端末では、制御できない。この場合に、ファイル(画像、音声)の同期再生、webアクセスを一緒に行うとした場合、それに合わせたメディア変更を、その度に行う必要がある。
本発明の目的は、ユーザが操作することなく、音量の大きさや表示すべき表示画像エリア(スクリーン)の数等の状況に応じて適応的に、最適に表示画像エリア(スクリーン)のサイズ、位置を更新することができ、しかも表示画像エリアの再配置(移動)が連続的になり、受信側では即座にその画像を大きく見せることが可能となり、送信側、受信側にて同タイミングで再生することが可能な通信端末および通信システム、並びに通信端末の表示方法を提供することにある。
本発明の第1の観点は、画像データおよび音声データを送受信可能で、受信した画像データおよび音声データを再生可能な通信端末であって、画像を表示する表示手段と、前記表示手段に特定のエリアを抽出されて表示すべき画像を表示する複数の表示エリアを形成可能で、受信音量に基づいて表示すべき画像のサイズを制御する制御手段と、を有し、前記制御手段は、通信情報として、同一端末からの別セッションは、同一端末の下位情報として付加し、画像を表示する表示エリアサイズは、最も下位に位置する情報にかかわる表示エリアを注目すべき表示エリアと判断し、対応する表示エリアに制御する。
好適には、前記制御手段は、他の表示エリアは最小にする。
本発明の第2の観点は、画像データおよび音声データを送受信可能で、受信した画像データおよび音声データを再生可能な複数の通信端末間で通信を行う通信システムであって、前記通信端末は、画像を表示する表示手段と、前記表示手段に特定のエリアを抽出されて表示すべき画像を表示する複数の表示エリアを形成可能で、受信音量に基づいて表示すべき画像のサイズを制御する制御手段と、を有し、前記制御手段は、通信情報として、同一端末からの別セッションは、同一端末の下位情報として付加し、画像を表示する表示エリアサイズは、最も下位に位置する情報にかかわる表示エリアを注目すべき表示エリアと判断し、対応する表示エリアに制御する。
好適には、ファイル表示、再生に関して、送信側にて、同期再生を要求した場合、同ファイルを転送するとともに、再生開始時間の情報を送出し、送信側、受信側では、前記再生開始時間に従って、前記ファイルを再生する。
好適には、通話機能と、撮像機能と、を有し、通話時に、撮像機能の操作に基づいて、撮像画像のストリーミング送信の有無を表示し、許可された場合、現在通話している通話先に、ストリーミングの再生要求を送出し、受信側が再生を許可した場合に、当該再生許可に基づいて、ストリーミング配信を開始し、受信側の前記制御手段は、新たなスクリーンを生成し、受信ストリーミングを再生する。
好適には、通話機能と、撮像機能と、を有し、通話時に、撮像機能にて静止画像を撮影した場合、静止画像の送信有無を表示し、許可された場合、現在通話している通話先に、画像の再生要求を送出し、受信側が再生を許可した場合に、当該再生許可に基づいて、画像を送出し、受信側の前記制御手段は新たな表示エリアを生成し、受信画像を再生する。
好適には、送信側にて、再生表示エリアを閉じた場合、その旨を受信側に送出し、前記閉じた表示エリアに対応する情報を再生している表示エリアを閉じ、対応する情報を削除する。
好適には、端末数N(N≧1)と同時通話している第1のグループと、端末数M(M≧1)と同時通話している第2のグループと、を有し、双方と通話接続している端末において、双方のグループを1つのグループとする場合、一方のグループに、発呼元情報と、認証キー、暗号キーから構成される着呼要求と送出し、他方のグループに、送信先情報と、認証キー、暗号キーから構成される発呼要求を送出し、発呼要求を受信した端末は、前記発呼要求に記載の情報に基づいて、発呼し、着呼要求を受信した端末は、着呼が、前記着呼要求に記載の情報と一致するかを判定し、一致する場合、接続を行う。
好適には、前記制御手段は、画面上において、同じ同時通話のグループに所属する表示エリアは、表示エリア外枠の色、太さを同色にする。
好適には、前記制御手段は、着信があった場合、着信相手の番号に対応する画像をメモリから読み出し、新たに表示エリア上に生成し、前記表示エリアは、外枠の色を着信用に振り分けた色にし、外枠を大小振幅し、また色が濃淡変動または点滅させる。
好適には、前記制御手段は、自端末で撮像した画像を表示する表示エリアのサイズは、自端末の音声入力手段にて入力された音声に依存せず、一定の大きさとし、他の表示エリアの挙動演算に対しては、前記表示エリアの外枠は、画面の外枠における壁と同等の扱いとする。
好適には、前記制御手段は、自端末にて取得した音声を送出している表示エリアの外枠の色と、音声を送出していない表示エリアの外枠の色とが異なるように制御する。
好適には、前記制御手段は、前時刻の受信側の表示エリアサイズに基づいて、送信画像の符号化率を制御する。
好適には、同一画像を受信再生する受信側の表示エリアサイズに応じて、画面に対しての占有率が最も大きいサイズに合わせて符号化して、Iピクチャ、Pピクチャ、およびBピクチャの全てを送出し、送出したサイズより小さいサイズに対しては、符号化データから、Bピクチャを除いたIピクチャ、Pピクチャを送出し、さらに小さいサイズに対しては、符号化データから、Pピクチャ、Bピクチャを除いたIピクチャのみを送出し、さらに小さいサイズに対しては、符号化データから、Pピクチャ、Bピクチャを除き、Iピクチャを間引いたデータを送出する。
好適には、前記制御手段は、表示エリアサイズが、アップサンプリングにて、視覚的に不快感を与えるノイズを生成しない範囲の場合、同一のサイズとして取り扱う。
好適には、前記制御手段は、表示エリアサイズの変動に伴う、符号化サイズの変動は、Iピクチャ単位で取り扱う。
好適には、表示エリアサイズの変動に伴い、符号化サイズの変動は、予測画像を現在のサイズにサンプリングし、フレーム間予測を行い、受信側では、同様に予測画像をサンプリングし、復号する。
本発明の第3の観点は、画像データおよび音声データを送受信可能で、受信した画像データおよび音声データを再生可能な通信端末の表示方法であって、表示手段に特定のエリアを抽出されて表示すべき画像を表示する複数の表示エリアを形成するステップと、受信音量に基づいて表示すべき画像のサイズを制御するステップと、を有し、通信情報として、同一端末からの別セッションは、同一端末の下位情報として付加し、画像を表示する表示エリアサイズは、最も下位に位置する情報にかかわる表示エリアを注目すべき表示エリアと判断し、対応する表示エリアに制御する。
本発明によれば、ユーザが操作することなく、音量の大きさや表示すべき表示画像エリア(スクリーン)の数等の状況に応じて適応的に、最適に表示画像エリア(スクリーン)のサイズ、位置を更新することができ、しかも表示画像エリアの再配置(移動)が連続的になり、異なる形状であっても最適なサイズで配置することが可能となる。
また、送信者が見せたい画像ファイルを送信した際に、送信者が何ら新たな操作を追加することなく、(また、送信者が声を発すことなく、)受信側では即座にその画像(スクリーンサイズ)を大きく見せることが可能となる。
また、ファイルと一緒に再生開始時刻の情報を送出することにより、送信側、受信側にて同タイミングで再生することが可能となる。
2者から3者の場合、双方に接続する端末から双方に認証キーを発行し、これに基づいて即座に接続することが可能となる。
以下、本発明の実施形態を図面に関連付けて説明する。
図2および図3は、本発明の実施形態に係る携帯通信端末の構成例を示す図であって、図2はエンコード装置を示すブロック図であり、図3はデコード装置を示すブロック図である。
本携帯通信端末10は、送信元となるエンコード装置20と、受信側とあるデコード装置30とを有し、多地点通信可能に構成される。
エンコード装置20は、符号化した音声データ、画像データを、受信側端末に対する指示情報や画像の天地情報等を付加してパケットとしてネットワークに送信する機能を有する。
音声データおよび画像データに付加される送信元の指示情報は、指示された画像の送信元の識別する情報(たとえ、IPアドレス、MACアドレス)と、受信した画像上の位置を示す位置情報とを含む。
送信元となるエンコード装置20は、送信元は、画面上、指示した位置にスクリーン(スクリーンについては後で詳述する)が存在する場合、対応する指示情報、スクリーン情報、音量情報を生成し、同通信中の相手に対して送出する機能を有する。
図3のエンコード装置20は、マイクロフォン等からなる音声入力部201、デジタルカメラ等の画像入力部202、キー入力等が可能な操作部203、音声入力部201により入力される音声データを符号化する音声符号化処理部204、画像入力部202から入力され所定エリアに切り出された画像データを符号化する画像符号化処理部205、撮像画像に関連付けた天地情報に基づいて、撮像画像の天地を受信側の表示部の画面(端末画面)の天地と一致するように補正する天地補正部206、撮像画像から顔のエリアを検出、抽出する顔エリア検出部207、顔エリア検出部207にて検出された顔エリアに基づいて使用するスクリーン(表示すべき表示画像エリア)を判別しスクリーン情報を生成するスクリーン判別部208、スクリーン判別部208の判定に基づいて受信画像から該当するエリアを切り出す切り出し部209、音声入力部201による入力音量を計測し音量情報を生成する入力音量計測部210、操作部203の入力情報に基づいて端末を制御する端末制御部211、端末制御部211の指示に基づいて指示情報や天地情報、スクリーン情報、音量情報等を含む制御情報を生成する制御情報生成部212、画像・映像を記憶する記憶部213、符号化された音声データおよび画像データ、制御情報、端末制御部211の指示に基づいて記憶部213から読み出された画像・映像データを送信パケットとして生成する送信パケット生成部214、およびネットワークと無線通信可能で生成された送信パケットをネットワークを介して通信相手の端末やサーバに送信するネットワークインタフェース(I/F)215を有する。
デコード装置30は、通信相手(送信元)のエンコード装置20から送信されネットワークを介して受信した音声データ、画像データを再生する機能を有する。
デコード装置30は、たとえば多地点通信を行っている場合に、受信画像の制御情報に基づいて特定エリアである顔を含む画像を、使用するスクリーン(サイズが制御された表示エリア)を選択して表示し、音声を発する機能を有する。
デコード装置30は、このスクリーンの表示に際し、デッドゾーンをなくした円形(楕円形を含む概念である)ウィンドゥにて分割する機能を有する。
円形(楕円形)ウィンドウに分割するように構成したのは、以下の理由による。
一般的に、画面の分割は、長方形で行っていた。人間の顔は基本的に楕円形であり、長方形の四隅はデットゾーンとなる。このデッドゾーンが、顔を表示するエリアを結果的に狭く(小さく)している。
よって、本実施形態においては、このデッドゾーンをなくした円形(楕円形)ウィンドゥにて分割するように構成している。
また、デコード装置30は、マルチスクリーンを表示する機能を有し、スクリーン中心間を結ぶ線分、基準形状の厚さ、音声の大きさに基づいて、スクリーンの表示倍率を算出し、この表示倍率に基づいてスクリーンの移動、新規生成を制御することにより、画面上に複数のスクリーンを最適に形成する機能を有する。
本実施形態の通信端末は、通信情報として、同一端末からの別セッションは、同一端末の下位情報として付加し、画像を表示する表示エリアサイズは、最も下位に位置する情報にかかわる表示エリアを注目すべき表示エリアと判断し、対応する表示エリアに制御する機能を有する。
具体的な処理については、後で図面に関連付けて詳述する。
図3のデコード装置30は、ネットワークと無線通信可能で送信元から送信された音声データ、画像(映像)データ、制御情報や指示情報、スクリーン情報、音量情報等を含むパケットを受信するネットワークインタフェース(I/F)301、キー入力等が可能な操作部302、ネットワークインタフェース301で受信されたパケットを解析し、音声データ、画像データ、送信元アドレス、制御情報(天地情報や指示情報等)を抽出する受信パケット解析部303、受信パケット解析部303により抽出された音声データを復号する音声復号処理部304、受信パケット解析部303により抽出された映像データを復号する映像復号処理部305、映像復号処理部305により復号された映像データ、送信元アドレス、制御情報、スクリーン情報、サイズ情報、天地情報に基づいて表示すべきスクリーン(表示ウィンドウ)のサイズや表示形態を制御する表示画像制御部306、音声復号処理部304により復号された音声の音量を修正する音量修正部307、音量修正部307で修正された音量で発音するスピーカ等の音声出力部308、表示画像制御部306によりサイズや表示形態が制御された画像を補正する画像補正部309、画像補正部309を介した画像を表示するLCD等の表示部(画像出力部)310、および操作部302からの入力情報に基づいて表示画像制御部306に制御情報(天地情報)を与える自端末制御部311を有する。
なお、エンコード装置20とデコード装置30は、操作部203と302、ネットワークインタフェース215と301、端末制御部211と自端末制御部311は共用することが可能である。
以下に、本実施形態の特徴部分である表示画像制御部306のより具体的な構成および機能、並びにスクリーンの具体的な構成や表示形態例について順を追って説明する。
図3の表示画像制御部306は、受信パケット解析部303により供給される制御情報に基づいてスクリーン情報、サイズ情報、天地情報、および指示情報を抽出する制御情報解析部3061、スクリーン情報に基づいて映像復号処理部305で復号された映像に対してマスキングを行うマスキング処理部3062、サイズ情報、スクリーン情報に基づいて表示すべきスクリーン(表示画像エリア)の表示倍率を算出す表示倍率算出判定部3063、表示倍率算出判定部3063で算出された表示倍率に従ってマスキング処理後の画像を縮小・拡大する縮小・拡大処理部3064、表示倍率算出判定部3063で算出された表示倍率および天地情報に従って表示位置を算出する表示位置算出部3065、および表示位置算出部3065にて得られた表示部310上の位置に縮小・拡大処理部3064にて得られた画像をマッピングするマッピング処理部3066を有する。
本実施形態の表示画像制御部306は、1つ以上のスクリーンが局所領域にて継続的に動き続ける状態にあるか否かを判定する振動状態判定機能を有する。
この振動状態判定機能は、一定期間(n)において、スクリーン個数の変動がなく、各スクリーンの音声の大きさの変動がなく、さらに、スクリーンの位置の変動があり、変動が閾値(Pthresh0)以下であり、スクリーンの表示倍率の変動が閾値(Rthresh0)以下である場合、振動状態にあると判定し、振動状態中、前記期間中の表示倍率の二乗総和値(R)が最も大きい状態の配置に固定する。
また、本実施形態の表示画像制御部306は、スクリーンの安定状態にあるか否かを判定する安定状態判定機能を有する。
この安定状態判定機能は、一定期間(m)において、スクリーン個数の変動がなく、各スクリーンの音声の大きさの変動がなく、さらに、スクリーンの位置の変動が閾値(Pthresh1)以下であり、スクリーンの表示倍率の変動が閾値(Rthresh1)以下である場合、安定状態にあると判定する。
また、安定状態判定機能は、一定期間において、スクリーン個数の変動がなく、各スクリーンの音声の大きさの変動がなく、さらに、スクリーンの位置の変動が閾値(Pthresh1)以下であり、スクリーンの表示倍率の二乗総和比が閾値(Rthresh2)以下である場合、局所安定状態にあると判定する。
また、本実施形態の表示画像制御部306は、スクリーンの安定状態判定機能にて、安定と判断された場合に、スクリーンの位置配置の再配置を促す攪拌処理機能を有する。
この攪拌処置機能は、画面上に仮の中心を配し、各中心における表示倍率の内、先に選択しておらず、最も小さい値を取得する位置を攪拌用のスクリーンの中心とし、一定期間、攪拌用のスクリーンを生成、更新し、消滅することによって、攪拌を行う。
攪拌処理の実行回数(S)が閾値(Sthresh)を越える場合、安定状態にあると判断し、攪拌処理を停止する。
本実施形態の表示画像制御部306によりサイズおよび表示形態が制御されるスクリーンは、1つの画面上に複数のスクリーンを表示するマルチスクリーンとして表示される。
以下に、本実施形態の表示画像制御部306の表示倍率算出判定部3063、表示位置算出部3065の処理を中心にしてマルチスクリーンの表示制御について説明する。
本実施形態の表示倍率算出判定部3063において、スクリーンは、スクリーンの表示位置を示す中心位置座標(P(i))、スクリーンの形状を示す基準形状(Unit(i))、スクリーンに対応付けられた音声の大きい(V(i))、スクリーンを画面上に表示する際の表示倍率(R(i))とを有し、表示倍率(R(i))は、周囲のスクリーンの中心位置座標(P(j))と結ぶ線分(L(i,j))と、その線分上の基準形状の厚さ(Lm(i,j),Lm(j,i))、および、音声の大きさ(V(i),V(j))に基づいて算出しされた仮表示倍率(R(i,j))の内、最も小さい値をする。
表示倍率算出判定部3063において、スクリーン中心から画面境界に垂直に接した点に、音声の大きさ(V(k)=0)、厚さ(Lm(k,i)=0)を設定し、表示倍率(R(i,k))を算出する。
また、スクリーンは、表示倍率(R(i))を最も大きくする位置に移動する。
また、スクリーンは、表示倍率(R(k))の最も大きい位置に、新規スクリーンの中心を生成する。
また、基準形状は、面積を等しくする。
さらにまた、基準形状にて形成したスクリーン間に分離線を引き、前記分離線にて分離されたエリアを新たなスクリーンとする。
次に、本実施形態に係る表示画像制御部306によりサイズおよび表示形態が制御されるスクリーンの表示倍率の算出、新規スクリーンの生成位置の算出、スクリーンの移動位置の算出等についてより具体的に説明する。
図4に示すように、各スクリーン40は、基準形状(Unit)を有する。表示部310の画面上へのスクリーン40は、基準形状(Unit)を表示倍率(R)に従って、拡大・縮小して表示する。
表示倍率(R)の算出
表示倍率算出判定部3063は、スクリーンiとスクリーンjとの中心間の距離(L(i,j))、各スクリーンの中心から前記方向への基準形状(Unit)における厚さ(Lm(i,j)、Lm(j,i))を算出し、および、各スクリーンに表示する内容における受信した音声の大きさ(V(i),V(j))に基づいて、スクリーンiにおけるスクリーンjからの算出される表示倍率(R(i,j))を以下の通りに算出する。
Figure 2007150921
周囲に存在するスクリーン間の表示倍率を算出し、次式のように、その表示倍率の内、最も小さい値を実際の表示倍率(R(i))とする。
Figure 2007150921
新規のスクリーンの生成位置の算出
表示倍率算出判定部3063は、画面上に仮の中心を配し、各中心において、表示倍率(Rmin)を算出する。各表示倍率(R)の内、最も大きい値を取る位置を新規のスクリーンの生成の中心位置とする。
Figure 2007150921
Figure 2007150921
この条件を満たす中心(P(k))を新規スクリーンの中心位置とする。
スクリーンの移動位置の算出
各スクリーンは、現在(t)の位置から一定距離内(集合I)の各位置において、表示倍率(R)を算出し、表示倍率の内、最も大きな値を取る位置を次時刻(t+Δt)における中心位置とする。
Figure 2007150921
Figure 2007150921
この条件を満たす中心(P(t+Δt))に移動する。
スクリーン位置は、時間経過に伴い、画面上を移動していく。このため、新規のスクリーンの生成においては、画面上の空き位置全てに対して演算を行う必要はない。つまり、画面上の何点かに対して、新規生成位置の判定を行い、その結果により位置を配置したとしても、時間経過とともに、表示倍率がもっとも大きい位置に移動していく。これにより、生成における演算負荷を低減することが可能となる。
随時、スクリーンの位置関係は変動していくため、表示倍率(R(*))算出における基準形状の厚さ(Lm(*))は、その時の方向に対して算出する必要がある。
この厚さ算出に関しては、(複雑な形状に対して)中心から対象方向へデジタル直線を引くことにより、算出することが可能となる。ただし、これは演算負荷の増加となる。これに対しては、各基準形状に対して、各角度に対する厚さを前もって算出したテーブルを参照することにより、表示倍率演算時の演算負荷を低減することが可能となる。
画面の四方の壁処理
各スクリーン40は、四方の壁との間に以下の演算規則に従って、表示倍率(R)を算出する。
図5に示すように、スクリーンの中心から壁に垂直に落とした点を算出上の壁の中心とし、中心間の線分(L(i,k))、基準形状(Unit)における厚さ(Lm(i,k),Lm(k,i))と、およびスクリーンの受信した音声の大きさ(V(i),V(k))を算出する。この時、壁における、音声の大きさは(V(k)=0)、基準形状の厚さ(Lm(k,i)=0)として、前述の表示倍率(R)の算出と同様に算出を行う。
各々のスクリーン40において、表示倍率(R(i))を算出する場合、周囲のスクリーンとの表示倍率(R(i,j)と同様に、壁との表示倍率(R(i,k))を算出し、この内、最も小さい値を実際に表示する際の表示倍率(R(i))とする
基準形状を楕円形とするスクリーン(S(0),S(1))において、音声の大きさ(V(0),V(1))の比を変化させた例を図6(A)〜(C)に示す。
図6(A)〜(C)において、左から、音声の大きさの比(V(0):V(1))が、1:1、2:1、3:1の場合である。このように、音量に大きさに応じて、適応的にスクリーンサイズを変動することが可能となる。
基準形状を楕円形とするスクリーン(S(0),S(1),S(2),S(3))において、画面上に形成するスクリーン数を増減した例を図7(A)〜(C)に示す。
図7(A)〜(C)において、左から、スクリーン数=2、3、4の場合である。
このように、スクリーン数の数に応じて、適応的にスクリーンサイズを変動させ、画面内に全てのスクリーンを形成することが可能となる。
基準形状を楕円形とするスクリーン(S(0),S(1),S(2),S(3))において、画面上に形成するスクリーン数を増減しつつ、そのうち1つのスクリーンの音声の大きさを他のスクリーンの音声の大きさの倍にした例を図8(A)〜(C)に示す。
図8(A)〜(C)において、左から、スクリーン数=2、3、4の場合であり、音声の大きさの比(V(0):V(1))が2:1、比(V(0):V(1):V(2))が2:1:1、比(V(0):V(1):V(2):V(3))が2:1:1:1の場合である。
このように、スクリーン数の数に応じて、適応的にスクリーンサイズを変動させ、画面内に全てのスクリーンを形成することが可能となる。これは、スクリーン(S(0))に映っている人が発言をしている例であり、このように、一人が発言している場合、その人のスクリーンのみが、その大きさに応じて適応的にスクリーンサイズを拡大・縮小することが可能となる。
基準形状を楕円形とするスクリーンS(0),S(1),S(2),S(3))において、画面上に形成するスクリーン数を増減しつつ、そのうち1つのスクリーンの音声の大きさを他のスクリーンの音声の大きさを1/2倍にした例を図9(A)〜(C)に示す。
図9(A)〜(C)において、左から、スクリーン数=2、3、4の場合であり、音声の大きさの比(V(0):V(1))が2:1、比(V(0):V(1):V(2))が2:1:2、比(V(0):V(1):V(2):V(3))が2:1:2:2の場合である。
このように、スクリーン数の数に応じて、適応的にスクリーンサイズを変動させ、画面内に全てのスクリーンを形成することが可能となる。これは、スクリーン(S(0))に映っている人以外が発言をしている例であり、このように、複数の人が発言している場合でも、状況に合わせて、適応的にスクリーンサイズを拡大・縮小することが可能となる。
基準形状が、楕円形(S(oval))、円形(S(circle))、長方形(S(rectangle))が混在している場合(音声の大きさは等しい)の例を図10(A)〜(D)に示す。
図10(A)〜(D)において、左から、長方形と楕円形、円形と楕円形、円形と長方形、下方が円形と楕円形と長方形の場合を示している。
基準形状は、形状が異なっても、面積を同等に設定することにより、各スクリーンは、適応的にスクリーンサイズを調整し、音声の大きさが等しい場合、視覚的に各々のスクリーンサイズが等しく表示することが可能となる。
さらに、本実施形態においては、スクリーン外のデッドゾーンを低減することから、図11(A)〜(C)に示すように、各スクリーンの間にエリアの分離線(太線)を形成し、前記分離線に基づいたエリアは各スクリーンの表示エリアとする。これにより、スクリーン数の増減と、各スクリーンの音声の大きさの増減に適応しつつ、画面を最大限に分割利用することが可能となる。
図11(A)〜(C)の例は、音声の大きさの比(V(0):V(1))が2:1、比(V(0):V(1):V(2))が2:1:1、比(V(0):V(1):V(2):V(3))が2:1:1:1の場合である。
次に、表示形態例について説明する。
図12に示すように、顔エリアの面積が一定値以上の場合、受信画像を「人物画像」と判別する。顔エリアの面積が一定値以下の場合、受信画像を「非人物画像」と判別する。
「人物画像」と判別した場合、円形スクリーンとする。「非人物画像」と判別した場合、四角形スクリーンとする。「非人物画像」であっても、同送信元からの音圧に応じて、表示サイズを変動させる。
図13に示すように、顔として判定されたエリアが複数ある場合であって、個数が一定値以下の場合、面積の大きいほうを優先し、個数が一定値以上の場合、非人物と同様、四角形スクリーンで表示する。
図14に示すように、切り出しエリアが、受信画像から、顔が出て行った場合(はみ出し場合)、動きベクトルから切り出し可能なエリアを推定し、円形スクリーン(ウィンドウ)を見えている部分だけにする。
推定された顔エリアのサイズに対する画面上に残っている顔画像の比が一定値以下になった場合、その顔を対象外とする。
次に、以上の機能を有する通信端末10を用いた多地点通信処理について説明する。
本実施形態においては、通信情報として、同一端末からの別セッションは、同一端末の下位情報として付加し、スクリーンサイズは、最も下位に位置する(最後に付加した)情報にかかわるスクリーンを注目すべきスクリーンと判断し、対応するスクリーンサイズにする。他のスクリーンは最小にする。
ファイル表示、再生に関して、送信側にて、同期再生を要求した場合、同ファイルを転送するとともに、再生開始時間の情報を送出し、送信側、受信側では、前記再生開始時間に従って、前記ファイルを再生する。
通話時に、カメラを起動(などの操作)に基づいて、カメラによる撮像画像のストリーミング送信の有無を表示し、操作者が許可した場合、現在通話している相手に、ストリーミングの再生要求を送出し、受信側が再生を許可した場合に、これに基づいて、ストリーミング配信を開始し、受信側では新たなスクリーンを生成し、受信ストリーミングを再生する。
また、通話時に、カメラにて静止画像を撮影した場合、静止画像の送信有無を表示し、操作者が許可した場合、現在通話している相手に、画像の再生要求を送出し、受信側が再生を許可した場合に、これに基づいて、画像を送出し、受信側では、新たなスクリーンを生成し、受信画像を再生する。
送信側にて、再生スクリーンを閉じた場合、その旨を受信側に送出し、閉じたスクリーンに対応する情報を再生しているスクリーンを閉じ、対応する情報を削除する。
端末数(人数N(N≧1))と同時通話している第1のグループと、端末数(人数M(M≧1))と同時通話している第2のグループと、双方と通話接続している端末において、双方のグループを1つのグループとする場合、一方のグループに、発呼元情報(電話番号、IPアドレス、MACアドレス、その他端末を識別可能な識別子etc)と、認証キー、暗号キーから構成される着呼要求と送出し、他方のグループに、送信先情報(電話番号、IPアドレス、MACアドレス、その他端末を識別可能な識別子etc)と、認証キー、暗号キーから構成される発呼要求を送出し、発呼要求を受信した端末は、前記発呼要求に記載の情報に基づいて、発呼し、着呼要求を受信した端末は、着呼が、前記着呼要求に記載の情報(発呼元情報、認証キー、暗号キー)と一致するかを判定し、一致する場合、接続を行う。
また、画面上において、同じ同時通話のグループに所属するスクリーンは、スクリーン外枠の色、太さを同色にする。
着信があった場合、着信相手の番号に対応する画像をメモリから読み出し、新たにスクリーン上に生成し、前記スクリーンは、外枠の色を着信用に振り分けた色にし、外枠を大小振幅し、また色が濃淡変動させる(ないし点滅)。
自端末のカメラにて撮像した画像を表示するスクリーンのサイズは、自端末のマイクにて入力された音声に依存せず、一定の大きさとし、他のスクリーンの挙動演算に対しては、前記スクリーンの外枠は、画面の外枠における壁と同等の扱いとする。
また、自端末のマイクロフォンにて取得した音声を送出しているスクリーンの外枠の色を濃くし、音声を送出していないスクリーンの外枠の色を薄くする(また、太さを変化させる)。
前時刻の受信側のスクリーンサイズに基づいて、送信画像の符号化率を制御する。
また、同一画像を受信再生する受信側のスクリーンサイズに応じて、画面に対しての占有率が最も大きいサイズに合わせて符号化し、全部(Iピクチャ、Pピクチャ、Bピクチャ)を送出し、これより小さいサイズに対しては、符号化データから、Bピクチャを除いたIピクチャ、Pピクチャを送出する。
さらに、小さいサイズに対しては、符号化データから、Pピクチャ、Bピクチャを除いたIピクチャのみを送出し、さらに小さいサイズに対しては、符号化データから、Pピクチャ、Bピクチャを除き、Iピクチャを間引いたデータを送出する。
また、スクリーンサイズが、アップサンプリングにて、視覚的に不快感を与えるノイズを生成しない範囲(たとえば面積比2倍以下)の場合、同一のサイズとして取り扱う。
スクリーンサイズの変動に伴う、符号化サイズの変動は、Iピクチャ単位で取り扱う。
スクリーンサイズの変動に伴い、符号化サイズの変動は、予測画像を現在のサイズにアップサンプリング(ないしはダウンサンプリング)し、フレーム間予測を行い、受信側では、同様に予測画像をアップサンプリング(ないしはダウンサンプリング)し、復号する。
以上の機能を有する通信端末10を用いた多地点通信処理について、図15〜図19に関連つけて具体的に説明する。
図15は、本実施形態に係る基本的な通信処理例を示す図である(S101〜S108)。
本実施形態においては、前述したように、通信情報として、同一の端末からの別セッションは、同一端末の下位情報として付随する。最も下位に位置する(最後に付加した)情報にかかわるスクリーンのサイズを、注目すべきスクリーンとして制御し、他のスクリーンは最小のサイズにする。
ファイル再生に関しては、送信側にて、(同期)再生を要求した場合、同ファイルを転送するとともに、再生タイミングを同期化させるために、データ再生可能なデータ容量を送信した際に、再生開始時間の情報を送出し、送信側、受信側では、前記再生開始時間に従って、再生を開始する。
送信側にて、再生スクリーンを閉じた場合、受信側においても、再生スクリーンを閉じる。通信情報として確保していたメモリを開放する。
送信側、受信側にて、再生を停止した場合、その旨の情報を、同様に再生スクリーンを立ち上げている他の端末に送出し、前記情報を受信した端末では、再生スクリーン上に停止した旨を表示の上、再生を停止する。
通話開始時においては、音声通話(VoIP)を基本とし、端末の操作に基づき、カメラから撮像された映像を別のセッションとして送出する。
電話番号、ないしアドレス(通話相手の特定する識別子)に付随して、起動時に同時にカメラの起動、および撮像映像送信用のセッションを張るか否かの情報を蓄積し、前記情報に基づいて、通話時の映像送信の処理を行う。
ファイルが音楽などのファイルの場合、再生用のアプリケーションをスクリーン内に表示する。スクリーンサイズは、音量に依存しない。
図16は、webサイトを開いている際の通信処理例を示す図である(S111〜S118)。
webサイトを開いている際に、共有(ないし、送信)を選択した場合、webサイトのアドレスを送出する。
受信側では、webサイトを受信すると、webサイトアクセス用の情報を同一セッションの付属情報として連結し、新しいスクリーン上にて、アクセスしたwebサイトを表示する。最後に付属した情報である場合、webサイトの表示用のスクリーンのサイズを音声比に対応させた大きさに設定する。他のスクリーンは最小のサイズにする。
音ファイルを送信とした場合、音ファイルと、再生タイミングを送出し、送信側、受信側にて、前記再生タイミングに合わせて、音ファイルを再生する(同期再生を要求している場合)。
受信側では、音ファイルに対して、表示する画像、情報などの付属情報がない場合、再生用のソフトを操作可能なサイズにて、新たなスクリーン上に表示する。他のスクリーンは最小のサイズにする。
図17は、webサイトのアドレス送出に対して、受信側が拒否をした場合の通信処理例を示す図である(S121〜S125)。
webサイトのアドレス送出に対して、受信側が拒否をした場合に、送信側は、現在表示中のwebサイトを画像保存し、再度、画像としての送信を試みる。
受信側にて、画像受信を許可した場合に、画像が送出され、受信側にて、新たなスクリーン上に画像を再生される。
なお、以上、画像ファイル、音声ファイル、webサイトなどの送出、受信に関しては、先に再生要求にて、送信元のアドレスと、それに伴う接続ポートの確認、および認証キー、暗号化キーなどの交換などを行っておくことにより、関係ない端末から送出されてきたファイル(ストリーミングなどを含む)、webサイトの再生を行うことを排除する。
これにより、関係端末からの不特定多数への広告、勧誘などの情報配信を排除することが可能となる。また、音声通話している相手であっても、送信要求に対して、拒否を行うことを可能とすることにより、不要と推測される情報の受信を防ぐことが可能となる。
なお、送信側、受信側にて、選択的にスクリーンを選択することにより、スクリーンサイズをコントロールすることも可能となる。
図18は、通信処理時のスクリーンの表示形態例を示す図である。
スクリーンの外枠は、一緒に通話をしているグループに所属するスクリーンは、同一の色とする。
異なるグループの場合、スクリーンの外枠は、基本的には異なる色とする。
音声を送っていないグループの場合、そのグループに所属するスクリーンの外枠は、音声を送信していないことが明示的に分かるように通常と異なる色(たとえば淡色化する)ないし太さにする。
また、スクリーン内の画像が淡色化、霧がかかったような画像など、変化させる。
着信があった場合には、着信が明示的に分かるように、スクリーンを変化させる。たとえば、スクリーンのサイズを大きく、小さく振動、外枠の色を点滅させる。
第3者の通話への参加は、双方と通信を行っている端末から操作を行う。既存のグループに対して、着呼要求(発呼元を識別する識別子、認証キー)を送出するとともに、新規に参加する端末に対して、発呼要求(発呼先を識別する識別子、認証キー)を送出する。
新規に参加する端末は、前記発呼要求に従って、記載された発呼先に発呼する。既存の端末は、前記新規の端末からの発呼に対して、着呼動作を行い、認証キーが一致している場合、接続する。
認証キーが異なる場合、即座に切断する。接続が完了した場合、接続を促した端末は、新規参加端末からの接続完了の情報に基づいて、新規端末を参加完了と判断する。なお、既存端末においては、前記着呼動作における認証キーに基づいて、同グループへの参加完了とする。
自端末のカメラにて撮像した画像を画面上に表示する場合、スクリーンのサイズは、音声に依存せずに、一定の大きさとする。なお、自端末の映像であることが明示的に分かるように、スクリーンの外枠の色、太さを設定する。また、他のスクリーンのサイズ演算においては、自スクリーンの外枠を壁と同様の扱いにする。
図19は、前時間の受信側のスクリーンサイズ情報に基づいて、送信画像の符号化率を制御する通信処理例を示す図である。
前時間の受信側のスクリーンサイズ情報に基づいて、送信画像の符号化率を制御することにより、受信端末にて受信する符号量の合計が著しく大きくなることを防ぐ。
受信側のスクリーンサイズに応じて、2つ以上にサイズに分類する。サイズの最も大きいサイズに合わせて符号化する。小さいサイズに対しては、符号化データを間引いて送信する。
たとえば、サイズの最も大きさサイズに対しては、Iピクチャ(フレーム内符号化)、Pピクチャ(フレーム間順方向予測符号化)、Bピクチャ(フレーム間双方向予測符号化)全てを送出する。
これに対して、1つ下のサイズに対しては、Bピクチャを間引く、更に小さいサイズに対しては、Bピクチャ、Pピクチャを間引くことによって、送信する符号量を低減する。また、符号化する画像のサイズに対しては、受信側のスクリーンの最大サイズに合わせるのではなく、最大サイズに対して、アップサンプリングすることによって、最大サイズのスクリーンにて視覚的に補間可能なサイズなサイズに抑える(たとえば、アップサンプリングを面積比2倍以下に押さえることにより、アップサンプリングによるエイリアシングを低減することが可能である)。
実際には、顔画像を送出する場合は、全撮像画像の内、顔のエリアのみを符号化することにより、背景などの送信上、不要エリアを削減することにより、符号化効率を上げることが可能となる。
換言すれば、符号化する画像において、顔が大きくなり、変化分の大きい背景が少なくなることにより、符号量を増大させる高周波成分を低減させ、結果的に符号量を低減することが可能となる。
結果的に送信側の符号化処理の負担を増大させることなく、個々の端末に送出する符号化データを生成することが可能であるとともに、個々の端末にて受信する符号化データ容量の増大を抑え、ネットワークへの負荷の増大を低減することが可能となる。
図19(1)では、ユーザ端末UAのユーザが一人話している状態であり、ユーザ端末UB、UCにおけるユーザ端末UAのスクリーンサイズは、同じ程度に大きい。
このため、このサイズに合わせて、ユーザ端末UAは符号化した画像を送出する。
これに対しては、ユーザ端末UBのスクリーンは、ユーザ端末UAでは、中ぐらいの大きいであるのに対して、ユーザ端末UCでは、非常に小さい。このため、ユーザ端末UA用とユーザ端末UC用の画像データとして送出する。ユーザ端末UA用の方が大きいため、これに合わせて符号化する。ユーザ端末UCに対しては、Iピクチャのみ(ないしは、更にIピクチャをも間引いた)符号化データを送出する。
図19(3)の場合、ユーザ端末UB、UCにおけるユーザ端末UAのスクリーンサイズは、アップサンプリングして再生しても視覚的に(ノイズによる)不快感が発生しないと判断した場合、小さい方のサイズに合わせて符号化データを送出する。
同様に、ユーザ端末UA、UBにおけるユーザ端末UCのスクリーンサイズにおいても、同様に、アップサンプリングして再生しても視覚的に(ノイズによる)不快感が発生しないと判断した場合、小さい方のサイズに合わせて符号化データを送出する。
再生スクリーンのサイズが、差異がアップサンプリングにて吸収可能な範囲(ex.面積比2倍以内)である場合、同一のサイズとし、小さい方のスクリーンサイズに合わして符号化処理を行う。
スクリーンサイズの変動に伴う符号化方式に対応して、Iピクチャ(フレーム内符号化)単位に、スクリーンサイズの変更を行う。
また、Pピクチャ(フレーム間順方向予測符号化)でのスクリーンサイズの変動がある場合、予測画像を現在のサイズ変更した画像に合わせてアップサンプリング、ないしダウンサンプリングし、この間でフレーム間予測処理を行う。受信側では、同様に、予測画像をアップサンプリング、ないしダウンサンプリングして、復号する。
以上説明したように、本実施形態によれば、送信元となるエンコード装置20は、送信元は、画面上、指示した位置にスクリーンが存在する場合、対応する指示情報、スクリーン情報、音量情報を生成し、同通信中の相手に対して送出する機能を有し、デコード装置30は、マルチスクリーンを表示する機能を有し、スクリーン中心間を結ぶ線分、基準形状の厚さ、音声の大きさに基づいて、スクリーンの表示倍率を算出し、この表示倍率に基づいてスクリーンの移動、新規生成を制御することにより、画面上に複数のスクリーンを最適に形成し、通信情報として、同一端末からの別セッションは、同一端末の下位情報として付加し、画像を表示する表示エリアサイズは、最も下位に位置する情報にかかわる表示エリアを注目すべき表示エリアと判断し、対応する表示エリアに制御する機能を有することから、スクリーンのサイズが、音量の大きさ、およびスクリーン数に応じて、適応的にサイズを変動させることができる。
また、スクリーンの動きが連続的になり、異なる形状であっても、最適なサイズに配置することが可能となる利点がある。
また、送信者が見せたい画像ファイルを送信した際に、送信者が何ら新たな操作を追加することなく、(また、送信者が声を発すことなく、)受信側では即座にその画像(スクリーンサイズ)を大きく見せることが可能となる。
また、ファイルと一緒に再生開始時刻の情報を送出することにより、送信側、受信側にて同タイミングで再生することが可能となる。
2者から3者の場合、双方に接続する端末から双方に認証キーを発行し、これに基づいて即座に接続することを可能とする。
一般的なテレビ会議システムにおける多値点通信時のパーソナルコンピュータ(PC)等の端末の表示画面例を示す図である 本発明の実施形態に係る携帯通信端末の構成例を示す図であって、エンコード装置を示すブロック図である。 本発明の実施形態に係る携帯通信端末の構成例を示す図であって、デコード装置を示すブロック図である。 表示倍率の算出処理を説明するための図である。 画面四方の壁処理を説明するための図である。 基準形状を楕円形とするスクリーン(S(0),S(1))において、音声の大きさ(V(0),V(1))の比を変化させた例を示す図である。 基準形状を楕円形とするスクリーン(S(0),S(1),S(2),S(3))において、画面上に形成するスクリーン数を増減した例を示す図である。 基準形状を楕円形とするスクリーン(S(0),S(1),S(2),S(3))において、画面上に形成するスクリーン数を増減しつつ、そのうち1つのスクリーンの音声の大きさを他のスクリーンの音声の大きさの倍にした例を示す図である。 基準形状を楕円形とするスクリーンS(0),S(1),S(2),S(3))において、画面上に形成するスクリーン数を増減しつつ、そのうち1つのスクリーンの音声の大きさを他のスクリーンの音声の大きさを1/2倍にした例を示す図である。 基準形状が、楕円形(S(oval))、円形(S(circle))、長方形(S(rectangle))が混在している場合(音声の大きさは等しい)の例を示す図である。 各スクリーンの間にエリアの分離線(太線)を形成し、前記分離線に基づいたエリアは各スクリーンの表示エリアとする例を示す図である。 スクリーン表示制御について説明するための図であって、顔エリアの面積に応じた処理の説明図である。 スクリーン表示制御について説明するための図であって、顔判定されたエリアが複数ある場合の対応処理の説明図である。 スクリーン表示制御について説明するための図であって、切り出しエリアが受信画像からはみ出した場合の対応処理の説明図である。 本実施形態に係る基本的な通信処理例を示す図である。 webサイトを開いている際の通信処理例を示す図である。 webサイトのアドレス送出に対して、受信側が拒否をした場合の通信処理例を示す図である。 通信処理時のスクリーンの表示形態例を示す図である。 前時間の受信側のスクリーンサイズ情報に基づいて、送信画像の符号化率を制御する通信処理例を示す図である。
符号の説明
10・・・携帯通信端末、20・・・エンコード装置、201・・・音声入力部、202・・・画像入力部、203・・・操作部、204・・・音声符号化処理部、205・・・画像符号化処理部、206・・・天地補正部、207・・・顔エリア検出部、208・・・スクリーン判定部、209・・・切り出し処理部、210・・・入力音量計測部、211・・・端末制御部、212・・・制御情報生成部、213・・・記憶部、214・・・送信パケット生成部、215・・・ネットワークインタフェース(I/F)、30・・・デコード装置、301・・・ネットワークインタフェース(I/F)、302・・・操作部、303・・・受信パケット解析部、304・・・音声復号処理部、305・・・映像復号処理部、306・・・表示画像制御部、307・・・音量修正部、308・・音声出力部、309・・・画像補正部、310・・・表示部(画像出力部)、311・・・自端末制御部、3061・・・制御情報解析部、3062・・・マスキング処理部、3063・・・表示倍率算出判定部、3064・・・縮小・拡大処理部、3065・・・表示位置算出部、3066・・・マッピング。

Claims (22)

  1. 画像データおよび音声データを送受信可能で、受信した画像データおよび音声データを再生可能な通信端末であって、
    画像を表示する表示手段と、
    前記表示手段に特定のエリアを抽出されて表示すべき画像を表示する複数の表示エリアを形成可能で、受信音量に基づいて表示すべき画像のサイズを制御する制御手段と、を有し、
    前記制御手段は、
    通信情報として、同一端末からの別セッションは、同一端末の下位情報として付加し、画像を表示する表示エリアサイズは、最も下位に位置する情報にかかわる表示エリアを注目すべき表示エリアと判断し、対応する表示エリアに制御する
    通信端末。
  2. 前記制御手段は、他の表示エリアは最小にする
    請求項1記載の通信端末。
  3. 前記制御手段は、着信があった場合、着信相手の番号に対応する画像をメモリから読み出し、新たに表示エリア上に生成し、前記表示エリアは、外枠の色を着信用に振り分けた色にし、外枠を大小振幅し、また色が濃淡変動または点滅させる
    請求項1または2記載の通信端末。
  4. 前記制御手段は、自端末で撮像した画像を表示する表示エリアのサイズは、自端末の音声入力手段にて入力された音声に依存せず、一定の大きさとし、他の表示エリアの挙動演算に対しては、前記表示エリアの外枠は、画面の外枠における壁と同等の扱いとする
    請求項1から3のいずれか一に記載の通信端末。
  5. 前記制御手段は、自端末にて取得した音声を送出している表示エリアの外枠の色と、音声を送出していない表示エリアの外枠の色とが異なるように制御する
    請求項1から4のいずれか一に記載の通信端末。
  6. 前記制御手段は、前時刻の受信側の表示エリアサイズに基づいて、送信画像の符号化率を制御する
    請求項1から5のいずれか一に記載の通信端末。
  7. 画像データおよび音声データを送受信可能で、受信した画像データおよび音声データを再生可能な複数の通信端末間で通信を行う通信システムであって、
    前記通信端末は、
    画像を表示する表示手段と、
    前記表示手段に特定のエリアを抽出されて表示すべき画像を表示する複数の表示エリアを形成可能で、受信音量に基づいて表示すべき画像のサイズを制御する制御手段と、を有し、
    前記制御手段は、
    通信情報として、同一端末からの別セッションは、同一端末の下位情報として付加し、画像を表示する表示エリアサイズは、最も下位に位置する情報にかかわる表示エリアを注目すべき表示エリアと判断し、対応する表示エリアに制御する
    通信システム。
  8. ファイル表示、再生に関して、送信側にて、同期再生を要求した場合、同ファイルを転送するとともに、再生開始時間の情報を送出し、送信側、受信側では、前記再生開始時間に従って、前記ファイルを再生する
    請求項7記載の通信システム。
  9. 通話機能と、
    撮像機能と、を有し、
    通話時に、撮像機能の操作に基づいて、撮像画像のストリーミング送信の有無を表示し、許可された場合、現在通話している通話先に、ストリーミングの再生要求を送出し、受信側が再生を許可した場合に、当該再生許可に基づいて、ストリーミング配信を開始し、受信側の前記制御手段は、新たなスクリーンを生成し、受信ストリーミングを再生する
    請求項7または8記載の通信システム。
  10. 通話機能と、
    撮像機能と、を有し、
    通話時に、撮像機能にて静止画像を撮影した場合、静止画像の送信有無を表示し、許可された場合、現在通話している通話先に、画像の再生要求を送出し、受信側が再生を許可した場合に、当該再生許可に基づいて、画像を送出し、受信側の前記制御手段は新たな表示エリアを生成し、受信画像を再生する
    請求項7または8記載の通信システム。
  11. 送信側にて、再生表示エリアを閉じた場合、その旨を受信側に送出し、前記閉じた表示エリアに対応する情報を再生している表示エリアを閉じ、対応する情報を削除する
    請求項7から10のいずれか一に記載の通信システム。
  12. 端末数N(N≧1)と同時通話している第1のグループと、
    端末数M(M≧1)と同時通話している第2のグループと、を有し、
    双方と通話接続している端末において、双方のグループを1つのグループとする場合、
    一方のグループに、発呼元情報と、認証キー、暗号キーから構成される着呼要求と送出し、
    他方のグループに、送信先情報と、認証キー、暗号キーから構成される発呼要求を送出し、
    発呼要求を受信した端末は、前記発呼要求に記載の情報に基づいて、発呼し、
    着呼要求を受信した端末は、着呼が、前記着呼要求に記載の情報と一致するかを判定し、一致する場合、接続を行う
    請求項7から10のいずれか一に記載の通信システム。
  13. 前記制御手段は、画面上において、同じ同時通話のグループに所属する表示エリアは、表示エリア外枠の色、太さを同色にする
    請求項12記載の通信システム。
  14. 前記制御手段は、着信があった場合、着信相手の番号に対応する画像をメモリから読み出し、新たに表示エリア上に生成し、前記表示エリアは、外枠の色を着信用に振り分けた色にし、外枠を大小振幅し、また色が濃淡変動または点滅させる
    請求項7から13のいずれか一に記載の通信システム。
  15. 前記制御手段は、自端末で撮像した画像を表示する表示エリアのサイズは、自端末の音声入力手段にて入力された音声に依存せず、一定の大きさとし、他の表示エリアの挙動演算に対しては、前記表示エリアの外枠は、画面の外枠における壁と同等の扱いとする
    請求項7から13のいずれか一に記載の通信システム。
  16. 前記制御手段は、自端末にて取得した音声を送出している表示エリアの外枠の色と、音声を送出していない表示エリアの外枠の色とが異なるように制御する
    請求項7から15のいずれか一に記載の通信システム。
  17. 前記制御手段は、前時刻の受信側の表示エリアサイズに基づいて、送信画像の符号化率を制御する
    請求項7から16のいずれか一に記載の通信システム。
  18. 同一画像を受信再生する受信側の表示エリアサイズに応じて、画面に対しての占有率が最も大きいサイズに合わせて符号化して、Iピクチャ、Pピクチャ、およびBピクチャの全てを送出し、
    送出したサイズより小さいサイズに対しては、符号化データから、Bピクチャを除いたIピクチャ、Pピクチャを送出し、
    さらに小さいサイズに対しては、符号化データから、Pピクチャ、Bピクチャを除いたIピクチャのみを送出し、
    さらに小さいサイズに対しては、符号化データから、Pピクチャ、Bピクチャを除き、Iピクチャを間引いたデータを送出する
    請求項7から16のいずれか一に記載の通信システム。
  19. 前記制御手段は、表示エリアサイズが、アップサンプリングにて、視覚的に不快感を与えるノイズを生成しない範囲の場合、同一のサイズとして取り扱う
    請求項18記載の通信システム。
  20. 前記制御手段は、表示エリアサイズの変動に伴う、符号化サイズの変動は、Iピクチャ単位で取り扱う
    請求項18または19記載の通信システム。
  21. 表示エリアサイズの変動に伴い、符号化サイズの変動は、予測画像を現在のサイズにサンプリングし、フレーム間予測を行い、受信側では、同様に予測画像をサンプリングし、復号する
    請求項7から20のいずれか一に記載の通信システム。
  22. 画像データおよび音声データを送受信可能で、受信した画像データおよび音声データを再生可能な通信端末の表示方法であって、
    表示手段に特定のエリアを抽出されて表示すべき画像を表示する複数の表示エリアを形成するステップと、
    受信音量に基づいて表示すべき画像のサイズを制御するステップと、を有し、
    通信情報として、同一端末からの別セッションは、同一端末の下位情報として付加し、画像を表示する表示エリアサイズは、最も下位に位置する情報にかかわる表示エリアを注目すべき表示エリアと判断し、対応する表示エリアに制御する
    通信端末の表示方法。
JP2005344756A 2005-11-29 2005-11-29 通信端末および通信システム、並びに通信端末の表示方法 Expired - Fee Related JP4994646B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005344756A JP4994646B2 (ja) 2005-11-29 2005-11-29 通信端末および通信システム、並びに通信端末の表示方法
PCT/JP2006/323857 WO2007063922A1 (ja) 2005-11-29 2006-11-29 通信端末および通信システム、並びに通信端末の表示方法
US12/095,489 US8487956B2 (en) 2005-11-29 2006-11-29 Communication terminal, system and display method to adaptively update a displayed image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005344756A JP4994646B2 (ja) 2005-11-29 2005-11-29 通信端末および通信システム、並びに通信端末の表示方法

Publications (2)

Publication Number Publication Date
JP2007150921A true JP2007150921A (ja) 2007-06-14
JP4994646B2 JP4994646B2 (ja) 2012-08-08

Family

ID=38211756

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005344756A Expired - Fee Related JP4994646B2 (ja) 2005-11-29 2005-11-29 通信端末および通信システム、並びに通信端末の表示方法

Country Status (1)

Country Link
JP (1) JP4994646B2 (ja)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009157141A1 (en) * 2008-06-23 2009-12-30 Canon Kabushiki Kaisha Communication apparatus, method for controlling communication apparatus, and program
JPWO2009093557A1 (ja) * 2008-01-25 2011-05-26 シャープ株式会社 マルチ画面表示装置
US9344680B2 (en) 2013-12-27 2016-05-17 Brother Kogyo Kabushiki Kaisha Server and non-transitory computer readable medium storing program for remote conference
US9420028B2 (en) 2013-12-27 2016-08-16 Brother Kogyo Kabushiki Kaisha Remote conference system and non-transitory computer readable medium storing program for remote conference
JP2018174479A (ja) * 2017-03-31 2018-11-08 キヤノンマーケティングジャパン株式会社 画像表示システム、画像表示システムの制御方法、情報処理装置、情報処理装置の制御方法、及びプログラム
JP2019197520A (ja) * 2018-05-07 2019-11-14 アップル インコーポレイテッドApple Inc. 複数参加者ライブ通信ユーザインターフェース
US10599297B2 (en) 2017-09-29 2020-03-24 Apple Inc. User interface for multi-user communication session
US10630939B2 (en) 2018-05-07 2020-04-21 Apple Inc. Multi-participant live communication user interface
JP2021076866A (ja) * 2021-02-04 2021-05-20 ヤマハ株式会社 収音制御システム及び収音制御システムの制御方法
US11079913B1 (en) 2020-05-11 2021-08-03 Apple Inc. User interface for status indicators
US11128792B2 (en) 2018-09-28 2021-09-21 Apple Inc. Capturing and displaying images with multiple focal planes
US11360634B1 (en) 2021-05-15 2022-06-14 Apple Inc. Shared-content session user interfaces
US11431891B2 (en) 2021-01-31 2022-08-30 Apple Inc. User interfaces for wide angle video conference
US11770600B2 (en) 2021-09-24 2023-09-26 Apple Inc. Wide angle video conference
US11893214B2 (en) 2021-05-15 2024-02-06 Apple Inc. Real-time communication user interface
US11907605B2 (en) 2021-05-15 2024-02-20 Apple Inc. Shared-content session user interfaces

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6269609B2 (ja) 2015-07-28 2018-01-31 株式会社リコー 情報処理装置、画像表示方法、通信システム、プログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05103324A (ja) * 1991-10-09 1993-04-23 Mitsubishi Electric Corp 多地点テレビ会議制御装置
JPH07200472A (ja) * 1993-12-13 1995-08-04 Internatl Business Mach Corp <Ibm> 通信会議をサポートするシステム及び方法
JPH08298653A (ja) * 1995-04-25 1996-11-12 Canon Inc テレビ会議システム及びその端末装置
JPH09233446A (ja) * 1996-02-27 1997-09-05 Nec Corp テレビ会議システム
JP2002218424A (ja) * 2001-01-12 2002-08-02 Mitsubishi Electric Corp 映像表示制御装置
JP2005303736A (ja) * 2004-04-13 2005-10-27 Ntt Communications Kk ビデオ会議システムにおける映像表示方法、ビデオ会議システムに用いられる利用者端末、及びビデオ会議システムに用いられる利用者端末用プログラム
JP2005348144A (ja) * 2004-06-03 2005-12-15 Sharp Corp 情報端末装置、共有メディアデータ提示方法、および共有メディアデータ提示プログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05103324A (ja) * 1991-10-09 1993-04-23 Mitsubishi Electric Corp 多地点テレビ会議制御装置
JPH07200472A (ja) * 1993-12-13 1995-08-04 Internatl Business Mach Corp <Ibm> 通信会議をサポートするシステム及び方法
JPH08298653A (ja) * 1995-04-25 1996-11-12 Canon Inc テレビ会議システム及びその端末装置
JPH09233446A (ja) * 1996-02-27 1997-09-05 Nec Corp テレビ会議システム
JP2002218424A (ja) * 2001-01-12 2002-08-02 Mitsubishi Electric Corp 映像表示制御装置
JP2005303736A (ja) * 2004-04-13 2005-10-27 Ntt Communications Kk ビデオ会議システムにおける映像表示方法、ビデオ会議システムに用いられる利用者端末、及びビデオ会議システムに用いられる利用者端末用プログラム
JP2005348144A (ja) * 2004-06-03 2005-12-15 Sharp Corp 情報端末装置、共有メディアデータ提示方法、および共有メディアデータ提示プログラム

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2009093557A1 (ja) * 2008-01-25 2011-05-26 シャープ株式会社 マルチ画面表示装置
US8761670B2 (en) 2008-06-23 2014-06-24 Canon Kabushiki Kaisha Communication apparatus, method for controlling communication apparatus, and program
WO2009157141A1 (en) * 2008-06-23 2009-12-30 Canon Kabushiki Kaisha Communication apparatus, method for controlling communication apparatus, and program
US9344680B2 (en) 2013-12-27 2016-05-17 Brother Kogyo Kabushiki Kaisha Server and non-transitory computer readable medium storing program for remote conference
US9420028B2 (en) 2013-12-27 2016-08-16 Brother Kogyo Kabushiki Kaisha Remote conference system and non-transitory computer readable medium storing program for remote conference
JP2018174479A (ja) * 2017-03-31 2018-11-08 キヤノンマーケティングジャパン株式会社 画像表示システム、画像表示システムの制御方法、情報処理装置、情報処理装置の制御方法、及びプログラム
US10599297B2 (en) 2017-09-29 2020-03-24 Apple Inc. User interface for multi-user communication session
US11435877B2 (en) 2017-09-29 2022-09-06 Apple Inc. User interface for multi-user communication session
US10866703B2 (en) 2017-09-29 2020-12-15 Apple Inc. User interface for multi-user communication session
JP6998353B2 (ja) 2018-05-07 2022-01-18 アップル インコーポレイテッド 複数参加者ライブ通信ユーザインターフェース
US10630939B2 (en) 2018-05-07 2020-04-21 Apple Inc. Multi-participant live communication user interface
JP2020039139A (ja) * 2018-05-07 2020-03-12 アップル インコーポレイテッドApple Inc. 複数参加者ライブ通信ユーザインターフェース
US10904486B2 (en) 2018-05-07 2021-01-26 Apple Inc. Multi-participant live communication user interface
US11849255B2 (en) 2018-05-07 2023-12-19 Apple Inc. Multi-participant live communication user interface
JP2019197520A (ja) * 2018-05-07 2019-11-14 アップル インコーポレイテッドApple Inc. 複数参加者ライブ通信ユーザインターフェース
US11399155B2 (en) 2018-05-07 2022-07-26 Apple Inc. Multi-participant live communication user interface
CN110457104A (zh) * 2018-05-07 2019-11-15 苹果公司 多参与者实时通信用户界面
US11895391B2 (en) 2018-09-28 2024-02-06 Apple Inc. Capturing and displaying images with multiple focal planes
US11128792B2 (en) 2018-09-28 2021-09-21 Apple Inc. Capturing and displaying images with multiple focal planes
US11079913B1 (en) 2020-05-11 2021-08-03 Apple Inc. User interface for status indicators
US11513667B2 (en) 2020-05-11 2022-11-29 Apple Inc. User interface for audio message
US11431891B2 (en) 2021-01-31 2022-08-30 Apple Inc. User interfaces for wide angle video conference
US11467719B2 (en) 2021-01-31 2022-10-11 Apple Inc. User interfaces for wide angle video conference
US11671697B2 (en) 2021-01-31 2023-06-06 Apple Inc. User interfaces for wide angle video conference
JP7111202B2 (ja) 2021-02-04 2022-08-02 ヤマハ株式会社 収音制御システム及び収音制御システムの制御方法
JP2021076866A (ja) * 2021-02-04 2021-05-20 ヤマハ株式会社 収音制御システム及び収音制御システムの制御方法
US11449188B1 (en) 2021-05-15 2022-09-20 Apple Inc. Shared-content session user interfaces
US11822761B2 (en) 2021-05-15 2023-11-21 Apple Inc. Shared-content session user interfaces
US11893214B2 (en) 2021-05-15 2024-02-06 Apple Inc. Real-time communication user interface
US11360634B1 (en) 2021-05-15 2022-06-14 Apple Inc. Shared-content session user interfaces
US11907605B2 (en) 2021-05-15 2024-02-20 Apple Inc. Shared-content session user interfaces
US11928303B2 (en) 2021-05-15 2024-03-12 Apple Inc. Shared-content session user interfaces
US11812135B2 (en) 2021-09-24 2023-11-07 Apple Inc. Wide angle video conference
US11770600B2 (en) 2021-09-24 2023-09-26 Apple Inc. Wide angle video conference

Also Published As

Publication number Publication date
JP4994646B2 (ja) 2012-08-08

Similar Documents

Publication Publication Date Title
JP4994646B2 (ja) 通信端末および通信システム、並びに通信端末の表示方法
US8487956B2 (en) Communication terminal, system and display method to adaptively update a displayed image
JP6022618B2 (ja) ビデオテレフォニーに関する関心領域抽出
KR100972369B1 (ko) 비디오 전화기를 위한 관심 영역 처리
US7508413B2 (en) Video conference data transmission device and data transmission method adapted for small display of mobile terminals
EP2761809B1 (en) Method, endpoint, and system for establishing a video conference
US9024997B2 (en) Virtual presence via mobile
ES2327288T3 (es) Sistema, metodo y nodo para limitar el numero de flujos de audio en u teleconferencia.
WO2012075937A1 (zh) 视频通话方法及可视电话
JP2005123804A (ja) コミュニケーションシステム及び方法
EP1139663A2 (en) Communication method, communication service apparatus, communication terminal device and communication system
JP4973908B2 (ja) 通信端末およびその表示方法
JP5274750B2 (ja) 通信端末およびその表示方法
JP2007251501A (ja) テレビ会議システム及びテレビ会議方法
JP4990520B2 (ja) 通信端末およびその表示方法
JP4832869B2 (ja) 通信端末およびその表示方法
JP2008067078A (ja) 携帯端末装置
JP2008306475A (ja) 音声・画像会議装置
JP2005348144A (ja) 情報端末装置、共有メディアデータ提示方法、および共有メディアデータ提示プログラム
JP4926464B2 (ja) 通信端末およびその表示方法
JP2005110045A (ja) 情報処理装置及びその方法
JP2023026844A (ja) 録画システム、録画再生装置、画像処理方法
JP2010004573A (ja) 通信端末およびその表示方法
KR20120004148A (ko) 적응적 화질 개선이 가능한 화상 통화 송수신 방법 및 이를 이용하는 화상 통화 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080902

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110524

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110906

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120117

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120319

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120417

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120509

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150518

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees