JP2007180657A - 通信端末装置及び通信端末装置における画像表示方法 - Google Patents

通信端末装置及び通信端末装置における画像表示方法 Download PDF

Info

Publication number
JP2007180657A
JP2007180657A JP2005374049A JP2005374049A JP2007180657A JP 2007180657 A JP2007180657 A JP 2007180657A JP 2005374049 A JP2005374049 A JP 2005374049A JP 2005374049 A JP2005374049 A JP 2005374049A JP 2007180657 A JP2007180657 A JP 2007180657A
Authority
JP
Japan
Prior art keywords
luminance
image
communication terminal
sound
volume
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005374049A
Other languages
English (en)
Other versions
JP4850509B2 (ja
Inventor
Katsuhiko Shimizu
克彦 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Corp
Original Assignee
Kyocera Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Corp filed Critical Kyocera Corp
Priority to JP2005374049A priority Critical patent/JP4850509B2/ja
Priority to US12/095,489 priority patent/US8487956B2/en
Priority to PCT/JP2006/323857 priority patent/WO2007063922A1/ja
Publication of JP2007180657A publication Critical patent/JP2007180657A/ja
Application granted granted Critical
Publication of JP4850509B2 publication Critical patent/JP4850509B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】ユーザの集中を妨げることなく視覚的効果によって話者を判別することを容易にする。
【解決手段】複数の通信相手の画像及び音声を受信し、表示手段に前記各画像を表示すると共に前記音声を発音する通信端末装置において、前記表示手段における前記各画像が占める領域の大きさに基づいて、前記各領域の輝度の上限値を設定する上限設定手段と、前記上限値を超えない範囲で前記各領域の輝度を制御する輝度制御手段とを備えるようにする。これにより、複数人の画像S(0)〜S(3)を一画面に表示して音声と共に再生するにあたり、各画像が占める領域の輝度を制御して、例えば話者S(2)の輝度を聞き手の輝度に対して相対的に高くすることによって、話者S(2)に注目が集まるようにし、視覚的に話者を特定しやすくする。
【選択図】図3

Description

本発明は、通信端末装置及び通信端末装置における画像表示方法に関する。
従来、多地点通信を実現する技術として、テレビ会議システムがある。テレビ会議システムでは、多数の端末から送られてきた画像データを一画面に表示し、音声データと共に各々の端末へ送信することにより、多地点を繋ぐテレビ会議を実現する。
このようなテレビ会議システムでは、例えば4名で会議を行う場合には、画面を縦横に2分割して4等分にするが、これでは話者を判別し難いので、話者を視覚的に判り易くするために、特許文献1や特許文献2のような技術が考え出されている。特許文献1に記載の技術は、話者を表示する領域(スクリーン)の表示面積を他の会議参加者を表示する領域(スクリーン)よりも大きくするものであり、特許文献2に記載の技術は、話者のスクリーンの明るさを他の会議参加者のスクリーンの明るさよりも明るくするものである。
上記のように、テレビ会議システムでは、会議参加者の人数に応じて画面を矩形に分割しているが、これでは、会議参加者の人数によっては、画面の分割が困難になり、場合によっては画面に使用されない部分が生じてしまい、画面を有効活用できないという問題がある。
また、話者のスクリーンを他の会議参加者のスクリーンよりも大きくする場合、他の会議参加者のスクリーンが話者のスクリーンに覆われないように表示させ続けようとすると、他の会議参加者のスクリーンの面積は小さくすることになるが、その際、これらの大きさの異なる各スクリーンを好適に配置することは困難である。更に、話者が入れ替わると、各スクリーンの大小関係を更新することになるが、各スクリーンが矩形であると、各スクリーンの大きさを連続的に変化させつつ、大きさが変わった各スクリーンを好適に再配置することは、困難であるだけでなく視覚的に煩わしい。
本出願人は、上述のような問題を解決しようとする技術として、特許文献3〜8を出願している。これらの技術では、会議参加者の顔部分を楕円形状に切り出してスクリーンとし、各スクリーンを一画面に表示している。そして、各会議参加者が発する音声の大きさに応じて各スクリーンの表示面積を変化させることにより、話者が大きく表示されるようにするとともに、他の会議参加者の画像を好適に配置するようにしている。
一方、携帯電話機等の携帯端末装置は、多機能化が進んでおり、近年は、上述のテレビ会議システムのような複数人で顔を見ながら話すことができる機能の開発が進められている。携帯端末装置においては、画面も操作部も小型化されていることから、他の画面及び操作部が充実したシステムに比べて、手動の操作によらず自動的に各スクリーンの大きさや配置を制御することの重要度は高い。
特開平6−141310号公報 特開平6−141311号公報 特願2005−344296号公報 特願2005−344752号公報 特願2005−344753号公報 特願2005−344754号公報 特願2005−344755号公報 特願2005−344756号公報
ところで、話者は、必ずしも一人であるとは限らない。例えば、企画や研究成果を発表する会議等の場合には、発表者が主たる話者となり、他の会議参加者は主に聞き手となるが、聞き手は、相槌や質問等の発言を行うことがある。このような場合、上記従来例によって、聞き手が相槌を打つ度に、話者が入れ替わったとしてスクリーンの大きさが入れ替わったり発表者及び聞き手のスクリーンが明滅したりするのでは、視覚的に煩わしく、ユーザの会議への集中が阻害されて好ましくない。
更に、上記従来例では、スクリーンの大きさに無関係に輝度制御を行った場合、大きいスクリーンでは消費電流が大きく増加し、バッテリー駆動等の通信端末装置の電池の持ちに悪影響を与え、例えば通話可能時間が短くなる等の不都合を生じさせる恐れがある。
つまり、特許文献1、2のような従来技術は、固定的に設置して用いられるテレビ会議システムを前提に考えられたものであり、輝度制御を行う場合に消費電流に対する配慮を行っていない。バッテリー駆動等の通信端末装置では、表示デバイスでの消費電流を一定値以下に抑える等、電池の持ち(通話可能時間等)への影響を抑える配慮が必要である。
本発明は、上述した事情に鑑みてなされたもので、話者を判別し易いように各通信相手の画像を表示するにあたり、ユーザの集中を妨げないように各通信相手の画像を表示することを目的とする。
上記課題を解決するために、本発明では、通信端末装置に係る第1の手段として、複数の通信相手の画像及び音声を受信し、表示手段に前記各画像を表示すると共に前記音声を発音する通信端末装置において、前記表示手段における前記各画像が占める領域の大きさに基づいて、前記各領域の輝度の上限値を設定する上限設定手段と、前記上限値を超えない範囲で前記各領域の輝度を制御する輝度制御手段とを備えるものを採用した。
また、通信端末装置に係る第2の手段として、上記第1の手段において、前記輝度制御手段は、前記音声の大きさに基づいて、当該音声と共に受信された前記画像が占める前記領域の輝度を制御するものを採用した。
通信端末装置に係る第3の手段として、上記第1又は2の手段において、前記上限設定手段は、前記表示手段に許容される消費電流を超えない範囲で輝度の上限値を設定し、前記輝度制御手段は、前記領域の輝度の制御にあたって、前記領域の大きさを加味するものを採用した。
通信端末装置に係る第4の手段として、上記第1から3の何れかの手段において、前記音声の大きさに基づいて、当該音声と共に受信された前記画像が占める前記領域の大きさを変更する表示面積制御手段を更に備えるものを採用した。
通信端末装置に係る第5の手段として、上記第1から4の何れかの手段において、前記表示手段の各画素は、自発光素子によって構成されているものを採用した。
更に、本発明では、通信端末装置における画像表示方法に係る第1の手段として、複数の通信相手の画像及び音声を受信し、表示手段に前記各画像を表示すると共に前記音声を発音する通信端末装置における画像表示方法であって、前記表示手段における前記各画像が占める領域の大きさに基づいて、前記各領域の輝度の上限値を設定し、前記上限値を超えない範囲で前記各領域の輝度を制御する方法を採用した。
また、通信端末装置における画像表示方法に係る第2の手段として、上記第1の手段において、前記音声の大きさに基づいて、当該音声と共に受信された前記画像が占める前記領域の輝度を制御する方法を採用した。
通信端末装置における画像表示方法に係る第3の手段として、上記第1又は2の手段において、前記表示手段に許容される消費電流を超えない範囲で輝度の上限値を設定し、前記領域の輝度の制御にあたって、前記領域の大きさを加味する方法を採用した。
通信端末装置における画像表示方法に係る第4の手段として、上記第1から3の何れかの手段において、前記音声の大きさに基づいて、当該音声と共に受信された前記画像が占める前記領域の大きさを変更する方法を採用した。
更に、本発明では、通信端末装置に係る第6の手段として、複数の通信相手の画像及び音声を受信して前記画像を前記音声と共に再生する通信端末装置において、前記音声の大きさに基づいて前記通信相手の発言の開始及び終了を検出し、前記画像を再生する際の輝度を当該画像と共に受信した前記音声の大きさに基づいて設定し、前記発言が終了した際には、前記輝度を前記発言の持続時間に応じて減衰させるものを採用した。
また、通信端末装置に係る第7の手段として、上記第6の手段において、前記発言が終了した際には、前記輝度を、前記発言の持続時間が長いほど速く、前記発言の持続時間が短いほど遅く、減衰させるものを採用した。
本発明によれば、複数人の画像を一画面に表示して音声と共に再生するにあたり、各画像から抽出した特定の領域の輝度を制御することができるので、例えば話者の輝度を聞き手の輝度に対して相対的に高くすることによって話者を特定しやすくでき、輝度を高くするにあたって、領域の大きさに基づいて設定した上限値を超えないようにすることにより、大きく表示されていて十分な注目を得ている領域を更に明るく光らせることによる電力の浪費を防止することができる。
以下、本発明の一実施形態について図面及び数式を参照して説明する。図1及び図2は、本発明の通信端末装置の実施の一形態である携帯電話機の要部の構成例を示す図であって、図1はエンコード装置を示すブロック図であり、図2はデコード装置を示すブロック図である。
携帯電話機は、送信元となるエンコード装置10と、受信側となるデコード装置20とを有し、多地点通信可能に構成されている。
エンコード装置10は、音声入力部101、画像入力部102、操作部103、音声符号化処理部104、画像符号化処理部105、端末制御部106、制御情報生成部107、送信パケット生成部108、及びネットワークI/F(インタフェース)109を備えている。
音声入力部101は、マイクロフォン等からなる。画像入力部102は、デジタルカメラ等からなる。操作部103は、キーを備え、ユーザによる入力を受け付ける。音声符号化処理部104は、音声入力部101により入力される音声データを符号化する。画像符号化処理部105は、画像入力部102により入力される画像データを符号化する。端末制御部106は、操作部103の入力情報に基づいて携帯電話機を制御する。制御情報生成部107は、端末制御部106が携帯電話機に対して行う制御に基づいて制御情報を生成する。
送信パケット生成部108は、音声符号化処理部104が符号化した音声データ、画像符号化処理部105が符号化した画像データ、制御情報生成部108が生成した制御情報を送信パケットとして生成する。ネットワークI/F109は、ネットワークを介して、送信パケット生成部108が生成した送信パケットを通信相手の携帯電話機やサーバに送信する。
デコード装置20は、ネットワークI/F201、操作部202、受信パケット解析部203、音声復号処理部204、画像復号処理部205、画像制御部206、音量修正部207、音声出力部208、画像補正部209、画像出力部210(表示手段)、及び自端末制御部211を備えている。
ネットワークI/F201は、音声データ、画像データ、制御情報等を含むパケットを通信相手の携帯電話機やサーバから受信する。操作部202は、キーを備え、ユーザによる入力を受け付ける。受信パケット解析部203は、ネットワークI/F201が受信したパケットを解析し、音声データ、画像データ、制御情報等を抽出する。音声復号処理部204は、受信パケット解析部203により抽出された音声データを復号する。画像復号処理部205は、受信パケット解析部203により抽出された画像データを復号する。
画像制御部206は、画像復号処理部205により復号された画像データ、制御情報、音声復号処理部204により復号された音声データに基づいて、画像データに基づいた画像を画像出力部210に表示する際の表示位置、表示サイズ、輝度等を制御する。音量修正部207は、音声復号処理部204により復号された音声の音量を修正する。音声出力部208は、スピーカ等であり、音量修正部207で修正された音量で音声データに基づいた音声を発音する。画像補正部209は、画像制御部206により制御された画像データを補正する。画像出力部210は、各画素を有機EL(electro-luminescence)素子(自発光素子)で構成したものであり、画像補正部209で補正された画像データに基づいて複数の通信相手の画像を表示する。自端末制御部211は、操作部202からの入力情報に基づいて、画像制御部206に、自端末の天地情報等の制御情報を与える。
なお、エンコード装置10とデコード装置20においては、操作部103と操作部202、ネットワークI/F109とネットワークI/F201、端末制御部106と自端末制御部211は共用することが可能である。
以下に、画像制御部206について説明する。画像制御部206は、天地補正部2061、顔エリア検出部2062(抽出手段)、スクリーン判定部2063、切り出し処理部2064、サイズ・輝度算出部2065(上限設定手段、輝度制御手段、表示面積制御手段)、縮小・拡大処理部2066、表示位置算出部2067、マッピング処理部2068を有する。
天地補正部2061は、画像復号処理部205にて復号された画像データに関連付けられた天地情報に基づいて、画像データの天地を画像出力部210の画面の天地と一致するように補正する。顔エリア検出部2062は、画像データから顔のエリアを検出し抽出する。スクリーン判定部2063は、顔エリア検出部2062にて検出された顔エリアを含むように、話者を表示するスクリーンに表示すべき領域を判定する。切り出し処理部2064は、スクリーン判定部2063の判定に基づいて、画像データから該当する領域を切り出す。サイズ・輝度算出部2065は、音声データの音量に応じて、スクリーンの表示サイズと、スクリーンを画像出力部210に表示させる際の輝度とを算出する。縮小・拡大処理部2066は、サイズ・輝度算出部2065の算出結果に基づいて、切り出し処理部2064にて切り出した画像データを縮小・拡大する。表示位置算出部2067は、縮小・拡大処理部2066にて縮小・拡大された画像データの表示位置を算出する。マッピング処理部2068は、表示位置算出部2067にて得られた画像出力部210上の位置に、縮小・拡大処理部2066にて得られた画像データをマッピングする。
スクリーン判定部2063は、顔エリア検出部2062にて顔エリアが検出された場合、スクリーン形状として、この顔エリアを包含し顔エリア以外の部分を最小とする楕円形を選択する。また、スクリーン判定部2063は、顔エリア検出部2062にて、顔エリアが検出されなかった場合、画像を風景と判定し、矩形を選択する。
サイズ・輝度算出部2065は、音声データの音量、及び過去に受信した音声データの音量に基づいて、スクリーンのサイズ及び輝度を算出する。以下に、本実施形態の特徴部分であるスクリーンの輝度の算出について説明する。
図3は、テレビ会議中の画像出力部210の画面の正面図である。ここでは、説明を解り易くするために、企画や研究成果の発表のように、1人が主たる話者であり、他は主に聞き手となっている場合を例とした。
画面には、S(0)〜S(3)の4つのスクリーンが表示されている。これらのスクリーンS(j)の大小関係は、今回の会議参加者の関係性を視覚的に判り易くするために固定されている。即ち、大きいスクリーンS(0)は、主たる話者である企画や研究成果の発表者が表示されるスクリーンであり、小さい3つのスクリーンS(1)〜S(3)は、3人の聞き手それぞれが表示されるスクリーンである。
スクリーンS(j)には、面積R(j)、画面1上での輝度L(j)、音量V(j)をという3種類の値がそれぞれ対応付けられている。各スクリーンS(j)が得るべき注目度をA(j)とすると、発言中の人物が表示されているスクリーンS(j)が注目を集めるのが望ましいので、各注目度A(j)の比が各音量V(j)の比に等しくなるように制御する。このことは、式(1)で表される。
A(1):A(2): … :A(n−1):A(n)
=V(1):V(2): … :V(n−1):V(n) …(1)
また、注目度A(j)は、面積R(j)が大きいほど高くなり、輝度L(j)が高いほど高くなると考えられるので、面積R(j)と輝度L(j)との積とする。このことは、式(2)で表される。
A(j)=R(j)×L(j) …(2)
そして、式(1)及び式(2)より、式(3)が得られる。
R(0)×L(0):R(1)×L(1): …
… :R(n−1)×L(n−1):R(n)×L(n)
=V(0):V(1): … :V(n−1):V(n) …(3)
ここで、式(3)から各輝度L(j)の比を求めるために、V(j)/R(j)=pとすると、式(4)が得られる。
L(0):L(1): … :L(n−1):L(n)
=p:p: … :pn−1:p …(4)
ここで、画像出力部210には、輝度の初期値Liniが規定されている。上記の輝度L(j)のうち、最小のものをLmin=α×Lini(αは定数)と表し、輝度Lminと他の輝度L(j)との比をpmin:pと表すと、他の輝度L(j)は、式(5)で表される。
L(j)=(p/pmin)×α×Lini …(5)
ここで、画像出力部210の各画素を構成する有機EL素子は、一般的に、電流値で輝度が決まる。即ち、輝度L(j)は単位面積あたりの電流値I(j)に比例する。輝度がLiniのときの単位面積あたりの電流値をIiniとすると、式(5)から式(6)が得られる。
I(j)=(p/pmin)×α×Iini …(6)
そして、これにより、画像出力部210が消費する電流値の合計Wは、式(7)で表される。
Figure 2007180657
ここで、画像出力部210には、許容できる最大の電流値Wmaxが規定されている。従って、W≦Wmaxであるので、定数αは、式(8)で表される。
Figure 2007180657
このαを用いて各スクリーンS(j)の輝度を設定することにより、各スクリーンS(j)が得るべき注目度A(j)に応じた輝度設定としつつ、画像出力部210が消費する電流値Wを許容できる最大の電流値Wmax以下に抑えることが可能となる。
なお、最小の輝度LminがLiniを超えることがないように、α≦1という条件を加えてもよい。
さて、図3に示す例に上記の式をあてはめると、まず、この例において、各スクリーンS(j)の面積R(j)の比は、
R(0):R(1):R(2):R(3)=2:1:1:1
である。そして、スクリーンS(0)に表示されている人物とスクリーンS(2)に表示されている人物とが発言中であるとして、各スクリーンS(j)の音量V(j)の比が、
V(0):V(1):V(2):V(3)=2:1:2:1
であるとすると、式(3)より、
2L(0):L(1):L(2):L(3)=2:1:2:1
上記の式より、
2L(0):L(1)=2:1
2L(0):L(2)=2:2
2L(0):L(3)=2:1
であるので、即ち、
L(0):L(1)=1:1
L(0):L(2)=1:2
L(0):L(3)=1:1
となり、つまり、
L(0):L(1):L(2):L(3)=1:1:2:1
である。
上記の式より、輝度を最小とするスクリーンS(j)の輝度をα×Lini(α≦1)とすると、
L(0)=L(1)=L(3)=α×Lini
L(2)=2α×Lini
である。
上記の式より、輝度がLiniのときの単位面積あたりの電流値をIiniとすると、
I(0)=I(1)=I(3)=α×Iini
I(2)=2α×Iini
上記の式及び式(7)より、画像出力部210が消費する電流値の合計は、
W=R(0)×I(0)+R(1)×I(1)+R(2)×I(2)+R(3)×I(3)
=α×Iini(R(0)+R(1)+2R(2)+R(3))
W≦Wmaxであるので
α≦W/(Iini(R(0)+R(1)+2R(2)+R(3))) 且つ α≦1
上記の式よりαを決定することができ、各スクリーンS(j)に設定すべき輝度を決定することができる。
サイズ・輝度算出部2065は、上述の式中の音量V(j)として、音声復号処理部204から入力される音声データの音量を図4及び図5のように輝度算出用に加工したものを用いている。
図4及び図5は、音量の経時変化を表すグラフである。これらのグラフにおいては、音声復号処理部204から入力される音声データの音量(入力音量)Vreceiveを実線で示し、この音量を基に輝度算出用に加工した音量(加工音量)Vdisplayを破線で示した。
輝度算出に加工音量Vdisplayを用いる理由は、入力音量Vreceiveによって輝度を算出するようにすると、輝度が安定せず、ちらついて見えるという問題が起こり、また、相槌等の短い発言のときには、輝度が上昇してから下降するまでの時間が短いので、輝度が高くなっている時間が短く、どのスクリーンS(j)に表示されている人物が発言したのか認識しにくいという問題が起こるためである。
そこで、加工音量Vdisplayは、発言中は入力音量Vreceiveを平均化したものとし、発言終了後は発言中の加工音量Vdisplayから緩やかに減衰させたものとしている。また、発言終了後の減衰は、発言継続時間が短いほど緩やかにしている。
図4は、相槌等の短い発言の場合のものであり、図5は、所定時間以上の長さの発言の場合のものである。図4及び図5において、Tspeakは話している期間(発声期間)、Tsilentは沈黙している期間(静音期間)である。また、Vlevelは所定間隔で設定された音量の閾値である。また、図4(a)及び図5(a)は、発言中の音量が高めの場合、図4(b)及び図5(b)は、発言中の音量が低めの場合を表している。
図6及び図7のフローチャートに従って、発言継続時間に応じた加工音量Vdisplayの算出手法について説明する。このチャートに従った処理により、入力音量Vreceive及び加工音量Vdisplayの変化に基づいて、立上り状態(state1)、立下り(継続)状態(state2)、安定状態(state3)に振り分けられ、それぞれの状態に適する式によって、加工音量Vdisplayが算出される。
tは現在時刻、Vreceive(t)は現在の入力音量、Vreceive(t−Δt)は現在から時間Δtだけ過去の時点の入力音量、VleveliはVreceive(t−Δt)から見て上にある閾値、Vleveli−1はVreceive(t−Δt)から見て下にある閾値、tbaseは変化(立上り又は立下り)検出時の時刻、Vbaseは算出時の基準の音量である。
以下、サイズ・輝度算出部2065が行う処理である。この処理は、所定時間おきに繰り返されている。
まず、時間(t−Δt)から時間tまでの間に、入力音量Vreceive(t)が閾値Vleveliをまたいで上昇したことを検出すると(S1のYes)、どの閾値まで上昇したのかを検出し(S2,S3)、音量が上がりきった時点の時刻を保存する(S4)。
また、時間(t−Δt)から時間tまでの間に、入力音量Vreceive(t)が閾値Vleveliをまたいで上昇しなかった場合(S1のNo)、入力音量Vreceive(t)が閾値Vleveli−1をまたいで下降したことを検出すると(S5のYes)、どの閾値まで下降したのかを検出し(S6,S7)、音量が下がりきった時点の時刻tをtbaseとして保存する(S4)。
続いて、時間(t−Δt)から時間tまでの間に入力音量Vreceive(t)が閾値Vleveljをまたいで上昇していた場合(S11のYes)は、立上り状態(state1)であるとし(S12)、式(9)にて加工音量Vdisplayを算出する(S13)。
display=Vreceive …(9)
そして、statepreにstateを保存して(S14)、処理を終了する。
時間(t−Δt)から時間tまでの間に入力音量Vreceive(t)が閾値Vleveljをまたいで上昇していなかった場合(S11のNo)で、前回のstateであるstatepreが1か3であった場合(S15のYes)で、時間(t−Δt)から時間tまでの間に入力音量Vreceive(t)が閾値Vlevelj−1をまたいで下降していた場合(S16のYes)には、立下り状態(state2)であるとし(S17)、算出基準音量Vbaseに時間Δtだけ過去の時点の加工音量Vdisplayを代入し(S18)、式(10)にて加工音量Vdisplayを算出する(S19)。
display=Vlevelj−1+(Vbase−Vlevelj−1)×exp(−a×Tspeak×(t−tbase))
…(10)
これにより、加工音量Vdisplayは、入力音量Vreceiveよりも緩やかに減衰する。
そして、statepreにstateを保存して(S14)、処理を終了する。
S16で、時間(t−Δt)から時間tまでの間に入力音量Vreceive(t)が閾値Vlevelj−1をまたいで下降していなかった場合(S16のNo)には、安定状態(state3)であるとし(S20)、式(11)にて加工音量Vdisplayを算出する(S21)。
Figure 2007180657
そして、statepreにstateを保存して(S14)、処理を終了する。
S15で、前回のstateであるstatepreが2であった場合(S15のNo)で、時間Δtだけ過去の加工音量Vdisplayが入力音量Vreceiveと同等の値まで減衰していなかった場合(S22のYes)、立下り継続状態(state2)であるとし(S23)、加工音量Vdisplay(t−Δt)が閾値Vlevelj−1に十分近づいたか、即ち加工音量Vdisplay(t−Δt)とVlevelj−1との差が所定値ΔV未満になっていれば(S24のYes)、基準を下の閾値に下げて(S25)、式(10)にて加工音量Vdisplayを算出する(S26)。
そして、statepreにstateを保存して(S14)、処理を終了する。
S22で、時間Δtだけ過去の加工音量Vdisplayが入力音量Vreceiveと同等の値まで減衰していた場合(S22のNo)には、安定状態(state3)であるとし(S27)、式(11)にて加工音量Vdisplayを算出する(S28)。
そして、statepreにstateを保存して(S14)、処理を終了する。
なお、本実施形態では、音量の増減を全て輝度の増減に振り替えているが、実施にあたっては、音量の増減を輝度の増減だけでなくスクリーンの拡大縮小にも振り分けてもよい。
以上、説明したように、マルチスクリーン(マルチウィンドウ)表示が可能な通信端末装置を例にした本実施形態によれば、各通信相手を表示しているスクリーンの大きさ、スクリーンに対応付けられた音声の大きさに応じた輝度制御を行うことにより、適切な注目度を各スクリーンに対して与えることができると共に、大きいスクリーンに過度に高い輝度を適用して消費電流を大きく増加させることを回避できる。
また、スクリーンへの輝度制御を行った場合でも、表示デバイスに許容される消費電流を超えない一定値以下(許容できる最大の電流値つまり上限値)に抑えることができるので、バッテリー駆動である通信端末装置の通話可能時間等の装置の性能(電池の持ち)に悪影響を与えることを回避できる。
また、音声の大きさが最大の話者を特定するのではなく、音声の大きさの比による輝度制御を行うことで、複数の話者が略同程度の音声の大きさで発言している場合でも、誰と誰の議論であるかが視覚的に判り易い画面とすることができ、また、輝度を上げるスクリーンが頻繁に入れ替わって見難い画面となることを回避できる。
更に、受信音量の変化に対して、受信音量が大きく増大した場合つまり発言開始時には即時に輝度を増加させる一方、発言終了後に輝度を減衰させる際には発声期間を考慮に入れ、発声期間が長いほど速く、発声期間が短いほど遅く減衰させている。これにより、新たな発声に対して即時に輝度が上がる一方で、相槌や返事等の短い発言に対して、輝度のが穏やかに減衰してゆくため、短期的に輝度が増加/減衰を起こす目障りなスクリーンの輝度変動をなくすことが可能となる。
本発明の一実施形態における携帯端末装置の構成例を示すブロック図である。 本発明の一実施形態における携帯端末装置の構成例を示すブロック図である。 本発明の一実施形態における画面の正面図である。 本発明の一実施形態における音量の経時変化を表すグラフである。 本発明の一実施形態における音量の経時変化を表すグラフである。 本発明の一実施形態における発言継続時間に応じた輝度制御用音量を得る過程を示すフローチャートである。 本発明の一実施形態における発言継続時間に応じた輝度制御用音量を得る過程を示すフローチャートである。
符号の説明
10…エンコード装置、101…音声入力部、102…画像入力部、103…操作部、104…音声符号化処理部、105…画像符号化処理部、106…端末制御部、107…制御情報生成部、108…送信パケット生成部、109…ネットワークI/F
20…デコード装置20、201…ネットワークI/F、202…操作部、203…受信パケット解析部、204…音声復号処理部、205…画像復号処理部、206…画像制御部、207…音量修正部、208…音声出力部、209…画像補正部、210…画像出力部(表示手段)、211…自端末制御部
2061…天地補正部、2062…顔エリア検出部(抽出手段)、2063…スクリーン判定部、2064…切り出し処理部、2065…サイズ・輝度算出部(上限設定手段、輝度制御手段、表示面積制御手段)、2066…縮小・拡大処理部、2067…表示位置算出部、2068…マッピング処理部

Claims (11)

  1. 複数の通信相手の画像及び音声を受信し、表示手段に前記各画像を表示すると共に前記音声を発音する通信端末装置において、
    前記表示手段における前記各画像が占める領域の大きさに基づいて、前記各領域の輝度の上限値を設定する上限設定手段と、
    前記上限値を超えない範囲で前記各領域の輝度を制御する輝度制御手段と
    を備えることを特徴とする通信端末装置。
  2. 前記輝度制御手段は、前記音声の大きさに基づいて、当該音声と共に受信された前記画像が占める前記領域の輝度を制御することを特徴とする請求項1に記載の通信端末装置。
  3. 前記上限設定手段は、前記表示手段に許容される消費電流を超えない範囲で輝度の上限値を設定し、前記輝度制御手段は、前記領域の輝度の制御にあたって、前記領域の大きさを加味することを特徴とする請求項1又は2に記載の通信端末装置。
  4. 前記音声の大きさに基づいて、当該音声と共に受信された前記画像が占める前記領域の大きさを変更する表示面積制御手段を更に備えることを特徴とする請求項1〜3の何れかに記載の通信端末装置。
  5. 前記表示手段の各画素は、自発光素子によって構成されていることを特徴とする請求項1〜4に記載の通信端末装置。
  6. 複数の通信相手の画像及び音声を受信し、表示手段に前記各画像を表示すると共に前記音声を発音する通信端末装置における画像表示方法であって、
    前記表示手段における前記各画像が占める領域の大きさに基づいて、前記各領域の輝度の上限値を設定し、
    前記上限値を超えない範囲で前記各領域の輝度を制御する
    ことを特徴とする通信端末装置における画像表示方法。
  7. 前記音声の大きさに基づいて、当該音声と共に受信された前記画像が占める前記領域の輝度を制御することを特徴とする請求項6に記載の通信端末装置における画像表示方法。
  8. 前記表示手段に許容される消費電流を超えない範囲で輝度の上限値を設定し、前記領域の輝度の制御にあたって、前記領域の大きさを加味することを特徴とする請求項6又は7に記載の通信端末装置における画像表示方法。
  9. 前記音声の大きさに基づいて、当該音声と共に受信された前記画像が占める前記領域の大きさを変更することを特徴とする請求項6〜8の何れかに記載の通信端末装置における画像表示方法。
  10. 複数の通信相手の画像及び音声を受信して前記画像を前記音声と共に再生する通信端末装置において、
    前記音声の大きさに基づいて前記通信相手の発言の開始及び終了を検出し、
    前記画像を再生する際の輝度を当該画像と共に受信した前記音声の大きさに基づいて設定し、前記発言が終了した際には、前記輝度を前記発言の持続時間に応じて減衰させる
    ことを特徴とする通信端末装置。
  11. 前記発言が終了した際には、前記輝度を、前記発言の持続時間が長いほど速く、前記発言の持続時間が短いほど遅く、減衰させることを特徴とする請求項10に記載の通信端末装置。
JP2005374049A 2005-11-29 2005-12-27 通信端末装置及び通信端末装置における画像表示方法 Active JP4850509B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005374049A JP4850509B2 (ja) 2005-12-27 2005-12-27 通信端末装置及び通信端末装置における画像表示方法
US12/095,489 US8487956B2 (en) 2005-11-29 2006-11-29 Communication terminal, system and display method to adaptively update a displayed image
PCT/JP2006/323857 WO2007063922A1 (ja) 2005-11-29 2006-11-29 通信端末および通信システム、並びに通信端末の表示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005374049A JP4850509B2 (ja) 2005-12-27 2005-12-27 通信端末装置及び通信端末装置における画像表示方法

Publications (2)

Publication Number Publication Date
JP2007180657A true JP2007180657A (ja) 2007-07-12
JP4850509B2 JP4850509B2 (ja) 2012-01-11

Family

ID=38305424

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005374049A Active JP4850509B2 (ja) 2005-11-29 2005-12-27 通信端末装置及び通信端末装置における画像表示方法

Country Status (1)

Country Link
JP (1) JP4850509B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011061450A (ja) * 2009-09-09 2011-03-24 Nippon Telegr & Teleph Corp <Ntt> 会議通信システム、会議通信方法及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0983985A (ja) * 1995-09-19 1997-03-28 Matsushita Electric Ind Co Ltd 画像表示方法
JPH09139927A (ja) * 1995-11-15 1997-05-27 Matsushita Electric Ind Co Ltd 多地点画像伝送装置
JPH09247640A (ja) * 1996-03-07 1997-09-19 Matsushita Electric Ind Co Ltd 多地点電子会議方法および多地点電子会議装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0983985A (ja) * 1995-09-19 1997-03-28 Matsushita Electric Ind Co Ltd 画像表示方法
JPH09139927A (ja) * 1995-11-15 1997-05-27 Matsushita Electric Ind Co Ltd 多地点画像伝送装置
JPH09247640A (ja) * 1996-03-07 1997-09-19 Matsushita Electric Ind Co Ltd 多地点電子会議方法および多地点電子会議装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011061450A (ja) * 2009-09-09 2011-03-24 Nippon Telegr & Teleph Corp <Ntt> 会議通信システム、会議通信方法及びプログラム

Also Published As

Publication number Publication date
JP4850509B2 (ja) 2012-01-11

Similar Documents

Publication Publication Date Title
JP6381153B2 (ja) ユーザ端末ならびに端末の音量を調整する方法および装置
US8487956B2 (en) Communication terminal, system and display method to adaptively update a displayed image
EP2139235B1 (en) Video selector
US10586131B2 (en) Multimedia conferencing system for determining participant engagement
US10009475B2 (en) Perceptually continuous mixing in a teleconference
US9959881B2 (en) Voice processing device, audio and video output apparatus, communication system, and sound processing method
US8259954B2 (en) Enhancing comprehension of phone conversation while in a noisy environment
CN105874517B (zh) 提供更加安静的开放空间工作环境的服务器
CN113676689A (zh) 一种视频通话方法、装置及电视
US8976223B1 (en) Speaker switching in multiway conversation
JP2008048030A (ja) 情報処理装置
JP4850509B2 (ja) 通信端末装置及び通信端末装置における画像表示方法
US9094514B2 (en) Aural volume feedback in call center
JP4169712B2 (ja) 会話支援システム
US10659907B2 (en) System for distraction avoidance via soundscaping and headset coordination
JP2009027239A (ja) 通信会議装置
US11783837B2 (en) Transcription generation technique selection
CN111742538A (zh) 提醒方法及装置、电子设备
JP2005151002A (ja) 遠隔会議システム
JP2018139397A (ja) 音声表示装置および音声表示プログラム
JP2007096555A (ja) 音声会議システム、端末装置及びそれに用いる話者優先レベル制御方法並びにそのプログラム
JP6079535B2 (ja) 通信端末、通信端末の出力制御方法、通信端末の出力制御用プログラム
JP2023081469A (ja) プログラム、装置、方法及びシステム
JP2004242050A (ja) 無線端末及びその受話音量調節方法
JP4926464B2 (ja) 通信端末およびその表示方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080902

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110607

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110808

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111011

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111019

R150 Certificate of patent or registration of utility model

Ref document number: 4850509

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141028

Year of fee payment: 3