JP5007590B2 - Videophone system and agent device - Google Patents
Videophone system and agent device Download PDFInfo
- Publication number
- JP5007590B2 JP5007590B2 JP2007090400A JP2007090400A JP5007590B2 JP 5007590 B2 JP5007590 B2 JP 5007590B2 JP 2007090400 A JP2007090400 A JP 2007090400A JP 2007090400 A JP2007090400 A JP 2007090400A JP 5007590 B2 JP5007590 B2 JP 5007590B2
- Authority
- JP
- Japan
- Prior art keywords
- caller
- speaker
- agent device
- display device
- agent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
Description
本発明は、複数の通話者の間で音声および画像を用いて通信を行うテレビ電話システム、およびそれに用いるエージェント装置、並びにテレビ電話システムにおける話題の対象の指示方法に関する。 The present invention relates to a videophone system that performs communication using voice and images among a plurality of callers, an agent device used therefor, and a method for instructing a topic target in the videophone system.
従来より、複数の通話者の間で音声および画像を用いて通信を行うテレビ電話システムが用いられている。そのようなテレビ電話システムでは、ディスプレイ装置のモニタ画面に相手の顔や姿を映しながら電話で会話を行うことができる。 2. Description of the Related Art Conventionally, a videophone system that performs communication using voice and images between a plurality of callers has been used. In such a videophone system, it is possible to carry out a telephone conversation while reflecting the face and appearance of the other party on the monitor screen of the display device.
図19は従来のテレビ電話システム80を示す図である。
FIG. 19 is a diagram showing a
図19に示すテレビ電話システム80おいては、互いに離れた場所にいる2人の通話者A,Bが、テレビ電話装置82a,82bを用いて通信を行う。各テレビ電話装置82a,82bには、各通話者A,Bを撮影するビデオカメラ、音声を拾うマイク、および、相手側から送られてきた画像(映像)を表示するディスプレイ装置が備えられている。
In the
また、テレビ電話を用いて多人数で同時に会議を開けるようにしたテレビ電話システムでは、複数台のビデオカメラおよびマイクが設置され、ビデオカメラを遠隔操作することにより会場の全体の様子や発言者の顔などを離れた場所のディスプレイ装置に表示できるようになっている。 In addition, in a videophone system that allows a large number of people to hold a conference simultaneously using a videophone, multiple video cameras and microphones are installed. It can be displayed on a display device at a distant place such as a face.
また、ビデオカメラを遠隔操作するためにビデオカメラを移動型ロボットに搭載し、ロボットを遠隔操縦することによって、多数のビデオカメラを設置することなく、複数箇所の画像を取得して離れた場所で監視する技術が提案されている(特許文献1)。 In addition, a video camera is installed in a mobile robot to remotely control the video camera, and by remotely manipulating the robot, multiple images can be acquired at a remote location without installing a large number of video cameras. A technique for monitoring has been proposed (Patent Document 1).
また、W−CDMAなどの高伝送能力の次世代通信方式の携帯電話機を用いたテレビ電話において、携帯電話機によって相手側のカメラを制御することが提案されている(特許文献2)
また、カメラで撮影を行う場合に、レーザ光をスポット照射して対象物を指し示す指示装置も提案されている(特許文献3)。
In addition, an instruction device has also been proposed that irradiates a laser beam with a spot and points to an object when photographing with a camera (Patent Document 3).
しかし、従来のテレビ電話システムでは次のような問題がある。 However, the conventional videophone system has the following problems.
すなわち、テレビ電話を利用する通話者A,Bは、その時々の話題について会話を行うが、通常、その話題の対象となっている物(対象物)は、通話者A,Bのいずれか一方のみに存在するので、他方の通話者は、その対象物を相手側のビデオカメラで撮影して送信されてきた画像を見ながら会話を行うこととなる。 That is, the callers A and B who use the videophone call have conversations on the topic at that time, but the object (object) that is the subject of the topic is usually one of the callers A and B. Therefore, the other party talks while looking at the image transmitted by photographing the target object with the video camera of the other party.
したがって、例えば、対象物が通話者Aの側にあるとした場合に、その相手方である通話者Bが、テレビ電話装置82bに映し出された対象物またはその特定の部分を「これ」と言って指差したとしても、通話者Aには通話者Bが何を指しているのか理解できない。そのため、通話者Bは、「赤くて、丸くて…」などと多くの言葉で補いながら会話を進める必要があった。
Therefore, for example, when the object is on the side of the caller A, the other party, the caller B, says "this" the object displayed on the
そこで、通話者Aのテレビ電話装置82aにも、通話者Bのテレビ電話装置82bと同じ映像を映し出すようにし、通話者Bの「指差し」位置を通話者Aのテレビ電話装置82aに表示することによって、通話者Bが「これ」と言って指差した内容を通話者Aが理解できるようにすることが考えられる。
Therefore, the same video as the
しかし、その場合でも、通話者Aの意識は実空間とモニタ画面上の空間との間を行き来することがあり、その場合には、話題とは乖離した画像操作が必要となって会話の進行が円滑に進まない要因ともなる。 However, even in that case, the consciousness of the caller A sometimes goes back and forth between the real space and the space on the monitor screen. In this case, an image operation that deviates from the topic is required, and the conversation progresses. Is also a factor that does not proceed smoothly.
また、話題の対象物が通話者A,Bのそれぞれの近傍に存在する場合にも、それらを相互に参照する場合において、話題の対象物の所在場所を言葉で説明する必要があるために会話の進行が円滑に進まないことがある。 In addition, even when a topical object exists in the vicinity of each of the callers A and B, it is necessary to explain the location of the topical object in words when referring to each other. May not progress smoothly.
また、特許文献1および2のようにビデオカメラを遠隔操作した場合であっても、それだけでは話題の対象物を旨く指し示すことは困難である。
Further, even when the video camera is remotely operated as in
また、特許文献3のような指示装置をテレビ電話システムに用いたとした場合に、どのようにすれば話題の対象物を旨く指し示すことができるかについて未解決である。 Further, when an instruction device such as that disclosed in Patent Document 3 is used in a videophone system, it is not yet solved how to indicate a topical object.
このように、従来においては、テレビ電話システムを用いて会話を行うときに、今どれを話題の対象物としているのかを相手方に分かり易く示すことが容易ではなかった。 As described above, conventionally, when a conversation is performed using a videophone system, it is not easy to easily show to the other party which is the subject of interest.
本発明は、上述の問題に鑑みてなされたもので、テレビ電話システムを用いて会話を行うときに、今どれを話題の対象物としているのかを相手方により分かり易く示せるようにすることを目的とする。 The present invention has been made in view of the above-described problems, and it is an object of the present invention to make it easier for the other party to understand which is the subject of interest when a conversation is performed using a videophone system. To do.
本発明に係る実施形態のテレビ電話システムは、複数の通話者の間で音声および画像を用いて通信を行うテレビ電話システムであって、他の通話者から送信される画像を表示するするディスプレイ装置、および、他の通話者に送信するための画像を撮影するカメラおよび近傍にある対象物を指し示すための指示装置を搭載した移動可能なエージェント装置が、各通話者の側に配置されており、しかも、前記各エージェント装置は、前記カメラを支持するとともにその光軸の角度を変更し調整するためのアングル制御装置、および、当該エージェント装置を前記対象物の近傍に移動させるための移動装置を備え、さらに、前記ディスプレイ装置および前記エージェント装置には、他の通話者からの音声を出力するためのスピーカが搭載され、他の通話者の動作または操作によって、当該他の通話者の音声が前記ディスプレイ装置のスピーカまたは前記エージェント装置のスピーカから選択的に切り替えられて出力される。 A videophone system according to an embodiment of the present invention is a videophone system that performs communication using voice and images among a plurality of callers, and displays an image transmitted from another caller A movable agent device equipped with a camera that captures an image to be transmitted to other callers and an instruction device for pointing an object in the vicinity is disposed on each caller's side, In addition, each agent device includes an angle control device for supporting and changing the angle of the optical axis of the camera device, and a moving device for moving the agent device in the vicinity of the object. , further, the said display device and said agent device, a speaker for outputting voice from the other party are mounted, other The talker operation or operations, the voice of the other party are outputted selectively switched by the speaker or the speaker of the agent device of the display device.
通話者の動作または操作によって相手方のスピーカを切り替えることにより、音声が出力される位置や音質などが変化することから、相手方は、話題の対象物が変化したことを認識することができる。また、これとともに音声の内容、例えば「あれ」「これ」などの語句によって、話題の対象物がより一層分かり易くなる。 By switching the speaker of the other party according to the operation or operation of the caller, the position where the sound is output, the sound quality, and the like change, so that the other party can recognize that the topical object has changed. In addition, the content of the voice, for example, phrases such as “that” and “this” make it easier to understand the topical object.
また、エージェント装置は、光軸の角度を変更できるカメラを備えかつ対象物の近傍に移動可能であるので、通話者が相手方のエージェント装置を遠隔操作することにより、カメラによって撮影した相手方の対象物の画像をディスプレイ装置に表示させながら、指示装置によって相手方の対象物を容易に差し示すことができ、話題の対象物を相手方に容易に理解させることができる。 The agent device, movable der Runode near the a camera capable of changing the angle of the optical axis and the object, by the party to remotely control the other party agent apparatus, the other party of the subject taken by the camera While the object image is displayed on the display device, the object of the other party can be easily indicated by the pointing device, and the other party can easily understand the topic object.
切り替えのための動作または操作として、音声による指示、接触センサによる指示、操作ボタンなどによる指示などを用いることが可能である。 As an operation or operation for switching, an instruction by voice, an instruction by a contact sensor, an instruction by an operation button, or the like can be used.
また、前記ディスプレイ装置および前記エージェント装置に、通話者が接触したことを検出する接触センサを設けておき、他の通話者が当該他の通話者の側の前記ディスプレイ装置に接触したときには前記エージェント装置のスピーカから音声が出力され、他の通話者が当該他の通話者の側の前記エージェント装置に接触したときには前記ディスプレイ装置のスピーカから音声が出力されるように構成してもよい。 In addition, the display device and the agent device are provided with a contact sensor that detects that a caller has touched, and when another caller contacts the display device on the other caller side, the agent device. A voice may be output from the speaker of the display device, and a voice may be output from the speaker of the display device when another caller contacts the agent device on the other caller's side.
これによって、通話者は、ディスプレイ装置またはエージェント装置に接触することによって、自分の音声を出力する相手方のスピーカを切り替え、自分が話題としている対象物を相手方に分からせることが一層容易になる。 This makes it easier for the caller to switch the speaker of the other party that outputs his / her voice by touching the display device or the agent device, so that the other party knows the subject he / she is talking about.
本発明によると、テレビ電話システムを用いて会話を行うときに、今どれを話題の対象物としているのかを相手方により分かり易く示せるようになる。 According to the present invention, when a conversation is performed using a videophone system, it is possible to easily show which is the subject of interest now to the other party.
図1は本発明に係る一実施形態のテレビ電話システム1を示すブロック図、図2は携帯電話機11の構成の例を示すブロック図、図3はディスプレイ装置12の構成の例を示すブロック図、図4はエージェント装置13の構成の例を示すブロック図、図5はカメラ装置51の構成の例を示す図である。
1 is a block diagram showing a
図1に示すテレビ電話システム1は、2人の通話者A,Bの間で音声(Voice )および画像(Video )を用いて通信を行う場合の例を示す。
The
図1において、テレビ電話システム1では、各通話者A,Bの近傍に、携帯電話機11a,11b、ディスプレイ装置(モニタ装置)12a,12b、エージェント装置13a,13bが設けられている。これらの機器は、各通話者A,Bの側において、ルータBSa,bを経由して相互に通信を行うことができる。また、各通話者A,Bは、これらの機器によって、IP網およびルータBSa,bを経由して、他の通話者B,Aとテレビ電話を行うことができる。通話者がさらに増える場合には、その通話者の近傍にこれら携帯電話機11、ディスプレイ装置12、エージェント装置13、およびルータBSと同じものを設ければよい。
In FIG. 1, in the
なお、携帯電話機11a,11bは互いに同じ機能を有するものであり、本明細書においてはそれらのいずれかまたは両方を指して「携帯電話機11」と記載することがある。ディスプレイ装置12a,12b、エージェント装置13a,13bなどについても同様である。
Note that the
携帯電話機11は、通話者A,Bが携帯可能であり、種々の携帯電話事業者が提供する移動体通信システムを用いて相手方と電話やメールなどの通信を行うものである。また、携帯電話機11は、相手方との通信のみでなく、テレビ電話システム1における相手方の機器を遠隔操作することも可能である。
The
図2に示すように、携帯電話機11には、ボタン入力部およびジョイスティック入力部などからなる操作部31、スピーカやイヤホンジャックなどを含む音声出力部32、マイクなどを含む音声入力部33、ディスプレイ34、通信制御部35、記憶部36、および制御部30などが設けられている。このような携帯電話機11の構成それ自体については公知であるので、ここでは本実施形態に特徴的な構成および作用などについてのみ説明する。
As shown in FIG. 2, the
通信制御部35は、ディスプレイ装置12、エージェント装置13、またはルータBSなどを中継機として利用し、他の機器との無線による通信を制御する。
The
記憶部36には、アドレス情報記憶部36aが設けられている。アドレス情報記憶部36aには、送信先アドレス情報、受信アドレス情報、および制御アドレス情報などが格納される。また、送信先アドレス情報および受信アドレス情報として、画像、音声、遠隔制御、許可信号、および指定位置のそれぞれについての情報が格納される。制御アドレス情報として、エージェント接続、モニタ接続、および相手携帯装置接続のそれぞれについての情報が格納される。これらのうち、指定位置受信アドレス情報は、位置指定信号を受信するためのアドレス情報である。
記憶部36には、また、対象位置x比率座標、対象位置y比率座標が格納される。これらの情報は、エージェント装置13に備えられた指示装置62で指示を行う際の指定位置を示す座標情報である。
The
The
記憶部36は、これらアドレス情報および座標情報の他、制御部30で実行するプログラムやプログラム処理に必要な情報が格納されている。
In addition to the address information and coordinate information, the
制御部30は、記憶部36に格納されたプログラムなどを実行しまたは処理することにより、携帯電話機11の全体を制御する。
The
携帯電話機11を使用する通話者A,Bが操作部31を操作(アングル調整)することによって、相手方のエージェント装置13のアングル制御装置52を遠隔操作することができる。
When the callers A and B who use the
また、携帯電話機11を操作(引込操作、訪問操作、押戻操作、退去操作)することによって、当該通話者A,Bの声を、他の通話者B,Aの側の携帯電話機11a,11bのスピーカ、ディスプレイ装置12b,12aのスピーカ、またはエージェント装置13a,13bのスピーカのいずれかに選択的に切り替えて出力させることができる。その動作については後で説明する。
Further, by operating the cellular phone 11 (withdrawing operation, visiting operation, pushing back operation, leaving operation), the voices of the callers A and B can be transmitted to the
図3に示すように、ディスプレイ装置12には、LCDなどからなるビデオ表示部41、タッチパネル入力部41a、スピーカを含む音声出力部42、通信制御部43、記憶部44、接触センサSE2、操作入力部SN2、および制御部40などが設けられている。
As shown in FIG. 3, the
ビデオ表示部41には、他の通話者から送信される画像が表示される。ビデオ表示部41には、タッチパネル入力部41aが一体的に設けられており、通話者は、ビデオ表示部41に表示された画像を見ながらタッチパネル入力部41aから入力を行うことができる。これにより、ビデオ表示部41に表示された画像に対して、特定の部位を容易に指定することができる。指定された位置は、例えば指定位置情報として出力される。
The
音声出力部42からは、当該ディスプレイ装置12が音声出力用として選択されている場合に、他の通話者から送信される音声が出力される。
The
通信制御部43は、携帯電話機11、エージェント装置13、またはルータBSなどを中継機として利用し、他の機器との無線による通信を制御する。
The
記憶部44には、アドレス情報記憶部44aが設けられており、携帯電話機11のアドレス情報記憶部36aと同様なアドレス情報が格納されている。また、アドレス情報の他、制御部40で実行するプログラムやプログラム処理に必要な情報が格納されている。
The
接触センサSE2は、通話者がディスプレイ装置12に接触した場合にそれを検出する。つまり、通話者がディスプレイ装置12に接触した場合に、接触センサSE2から信号が出力され、それに応じて後で説明するような処理が行われる。
The contact sensor SE2 detects when a caller contacts the
操作入力部SN2は、種々のボタン、キー、マウスなどであり、通話者の操作によって指令などを入力する。 The operation input unit SN2 includes various buttons, keys, a mouse, and the like, and inputs commands and the like by a caller's operation.
制御部40は、記憶部44に格納されたプログラムなどを実行しまたは処理することにより、ディスプレイ装置12の全体を制御する。
The
図4に示すように、エージェント装置13には、カメラ装置51、アングル制御装置52、移動装置53、スピーカを含む音声出力部54、マイクを含む音声入力部55、音声認識部56、音声認識辞書部57、通信制御部58、記憶部59、および制御部50などが設けられている。
As shown in FIG. 4, the
カメラ装置51には、他の通話者に送信するための画像を撮影するカメラ61、および近傍にある対象物JTを指し示すための指示装置62が設けられている。
The
つまり、図5に示すように、カメラ装置51は、カメラ61および指示装置62が一体になって構成されている。カメラ61は、レンズ63、CCD64、およびフォーカス制御部65などからなる。対象物JTの像が、レンズ63を介してCCD64上に結像する。フォーカス制御部65は、対象物JTの距離に応じてレンズ63を光軸方向に移動させて焦点を合わせる。
That is, as shown in FIG. 5, the
指示装置62は、プロジェクタ67および平面板ガラス68などからなる。プロジェクタ67の発光面は、CCD64の受光面に対し、平面板ガラス68を対称面として鏡像の位置関係に配置されており、プロジェクタ67の発光面上の任意の位置を発光させることができる。プロジェクタ67から射出された光スポットは、平面板ガラス68で反射し、レンズ63を通過して対象物JTの表面の一点を照射する。これによって、CCD64による対象物JTの撮影と同期して、対象物JT上の位置を指し示すことができる。なお、平面板ガラス68は、プロジェクタ67から照射された光は反射するが、レンズ63から入射した光は透過してCCD64上に結像する。
The
例えば、図5に示すように、CCD64の受光面64Sに対象物JTの像FQ1が結像しているとすると、それと相似の関係にあるプロジェクタ67の発光面67Sにも、それに対応する像FQ2が仮想的に存在する。そこで、発光面67Sの像FQ2の1つの点PT1を指定して発光させると、その光スポットは、対象物JT上の1つの点PT2を照射する。
For example, as shown in FIG. 5, if an image FQ1 of the object JT is formed on the
したがって、例えば、CCD64で撮影した像FQ1を、タッチパネルの設けられた表示画面HGで表示し、その像FQ1上の特定の点PT1をタッチパネルで指定し、指定した点PT1に対応した位置からプロジェクタ67が光スポットを照射するように構成しておくことにより、対象物JT上の点PT2を光スポットによって指し示すことができる。対象物JTから離れた相手方の通話者の側に、このような表示画面HGを備えたエージェント装置13を配置しておけばよい。
Therefore, for example, the image FQ1 photographed by the
なお、プロジェクタ67に代えて、平面上を移動可能な点光源、例えばLED、レーザダイオードなどを設けてもよい。
Instead of the
図4に戻って、アングル制御装置52は、カメラ装置51を支持するとともに、その光軸の角度を垂直および水平方向に変更し調整する。移動装置53は、エージェント装置13の全体を移動させて位置を変更する。これらにより、任意の位置にある対象物JTに対して、エージェント装置13がその近傍に移動し、カメラ装置51を対象物JTの方向に向け、カメラ61によって対象物JTの撮影を行い、指示装置62によって対象物JT上に光スポットを照射して位置を差し示すことができる。
Returning to FIG. 4, the
音声出力部54からは、当該エージェント装置13が音声出力用として選択されている場合に、他の通話者から送信される音声が出力される。
The
なお、上に述べたように、音声出力部32,42,54は、いずれもスピーカを含むものであり、現実にはスピーカから音声が出力されるので、これらを、「スピーカ32」「スピーカ42」「スピーカ54」と記載することがある。なお、スピーカには、その原理、構造、形状がどのようなものであれ、音声を出力する全ての機器が含まれる。同様に、マイクには、音声を入力する全ての機器が含まれる。
Note that, as described above, each of the
音声入力部55は、マイクから通話者の音声などを入力する。音声認識部56は、音声入力部55から入力された音声のなかで、音声認識辞書部57に登録された「ことば」を検知して音声認識を行う。
The
通信制御部58は、携帯電話機11、ディスプレイ装置12、またはルータBSなどを中継機として利用し、他の機器との無線による通信を制御する。
The
記憶部59には、アドレス情報記憶部59aが設けられており、携帯電話機11のアドレス情報記憶部36aと同様なアドレス情報が格納されている。また、アドレス情報の他、制御部50で実行するプログラムやプログラム処理に必要な情報が格納されている。
The
接触センサSE3は、通話者がエージェント装置13に接触した場合にそれを検出する。つまり、通話者がエージェント装置13に接触した場合に、接触センサSE3から信号が出力され、それに応じて後で説明するような処理が行われる。
The contact sensor SE3 detects when the caller contacts the
操作入力部SN3は、種々のボタン、キー、タッチパネルなどであり、通話者の操作によって指令などを入力する。 The operation input unit SN3 is various buttons, keys, a touch panel, and the like, and inputs a command and the like by a caller's operation.
制御部50は、記憶部59に格納されたプログラムなどを実行しまたは処理することにより、エージェント装置13の全体を制御する。
The
このように構成されたエージェント装置13は、一種のロボットまたはラジコンカーであるということができ、他の通話者の側のディスプレイ装置12によって遠隔操作され、対象物JTその他の画像や通話者の音声などを取得して他の通話者に提示する。
The
例えば、ディスプレイ装置12の表示画面HG上に相手方の対象物JTの画像を表示させておき、当該通話者が画面HG上で対象物JT上の特定の位置を指で押して指示する。すると、その位置を示す信号がその対象物JTの存在する相手方のエージェント装置13に送信され、その位置が相手方のエージェント装置13によって差し示される。
For example, an image of the other party's target object JT is displayed on the display screen HG of the
また、表示画面HG上において、当該通話者が任意の位置を指で押して指示する。すると、相手方のエージェント装置13は、差し示された対象物JT上の位置がカメラ装置51の光軸上となるように、移動装置53によって移動し、アングル制御装置52によってカメラ装置51の角度方向を制御する。
On the display screen HG, the caller gives an instruction by pressing an arbitrary position with a finger. Then, the
また、エージェント装置13は、音声入力部55によって音を感知した場合に、カメラ装置51をその音の方向へ向ける。また、通話者の音声によってエージェント装置13を制御することもできる。例えば、通話者が「とまれ」と言った場合に、エージェント装置13がそれを音声認識して「制止」の命令であると認識し、他の通話者による遠隔操作を制止する。また、携帯電話機11の操作によって、エージェント装置13に対する他の通話者からの遠隔操作を許容するように制御することもできる。
Further, when the
さて、本実施形態のテレビ電話システム1では、通話者の発する声を、通信の相手方の複数のスピーカのうちのいずれかを指定して出力させることができる。つまり、テレビ電話システム1で2人の通話者A,Bが通信を行っている間において、各通話者A,Bは、自分の音声を相手側で出力するスピーカとして、相手側にあるディスプレイ装置12のスピーカ42またはエージェント装置13のスピーカ54のどちらかを指定することができる。換言すれば、通話者A,Bの動作または操作によって、相手方のスピーカ42,54を切り替えることができる。
Now, in the
切り替えのための動作または操作として、音声による指示、接触センサSEによる指示、操作ボタンなどによる指示などがある。音声による指示では、通話者A,Bが特定の語句を発したときに、エージェント装置13が音声認識によってそれをスピーカの切り替えの命令であると認識し、通信の相手方のスピーカを順次切り替えるか、または指定されたスピーカから出力されるように切り替える。
As an operation or operation for switching, there are an instruction by voice, an instruction by the contact sensor SE, an instruction by an operation button, and the like. In the voice instruction, when the callers A and B utter a specific word, the
そのような特定の語句として、例えば、「切り替え」「ディスプレイ」「エージェント」「それ」「これ」「そちら」「こちら」「あなたの」「わたしの」などを用いればよい。 As such specific phrases, for example, “switch”, “display”, “agent”, “it”, “this”, “this”, “here”, “your”, “my”, etc. may be used.
その場合に、それぞれの語句を特定のスピーカと予め対応付けておき、その語句を認識したときに対応付けられたスピーカから音声が出力されるように切り替えるようにしてもよい。 In that case, each phrase may be associated with a specific speaker in advance, and switching may be performed so that sound is output from the associated speaker when the phrase is recognized.
接触センサSE2による指示では、通話者がディスプレイ装置12またはエージェント装置13のいずれかに接触することにより、接触センサSE2,3がそれを検出して信号を出し、通信の相手方のスピーカをいずれかのスピーカに切り替える。つまり、例えば、通話者が当該通話者の側のディスプレイ装置12に接触したときには、相手方のエージェント装置13のスピーカ54から音声が出力され、エージェント装置13に接触したときには、相手方のディスプレイ装置12のスピーカ42から音声が出力されるよう、それぞれ切り替える。
In the instruction by the contact sensor SE2, when the caller contacts either the
また、接触センサSEは、通話者が接触したことを検出するだけでなく、ディスプレイ装置12またはエージェント装置13を通話者が床面から持ち上げたことをも検出する。例えば、通話者がエージェント装置13を持ち上げた場合には、それを接触センサSE3が検出し、相手方における音声の出力をディスプレイ装置12のスピーカ42に切り替える。
Further, the contact sensor SE not only detects that the caller has touched, but also detects that the caller has lifted the
なお、持ち上げたことの検出に当たって、例えば、接触センサSEによって接触が検出されたとき、またはその状態が所定時間持続したときに、持ち上げたと判断することでもよい。 In detecting the lift, for example, when the contact is detected by the contact sensor SE or when the state has been maintained for a predetermined time, it may be determined that the lift has been made.
操作ボタンなどによる指示では、通話者が操作入力部SN2,3を操作して切り替えの指令を入力することにより、相手方のスピーカが切り替えられる。 In the instruction by the operation button or the like, the other party's speaker is switched when the caller operates the operation input sections SN2 and SN3 and inputs a switching command.
このように、相手方のスピーカを切り替えることによって、音声が出力される位置や音質などが変化することから、相手方は、話題の対象物JTが変化したことを認識することができ、これとともに音声の内容、例えば「あれ」「これ」などの語句の意味とを総合することによって、今どれを話題の対象物としているのかがより一層分かり易くなる。 In this way, by switching the other party's speaker, the position where the sound is output, the sound quality, and the like change, so that the other party can recognize that the topical object JT has changed, and with this, By combining the contents, for example, the meanings of phrases such as “that” and “this”, it becomes easier to understand which is the subject of the topic now.
また、エージェント装置13は移動可能であり、かつ対象物JTおよび対象物JT上の位置を差し示すことができるから、通話者が相手方のエージェント装置13を遠隔操作することにより、話題の対象物JTを相手方に容易に理解させることができる。
Further, since the
例えば、通話者Bが、「これ」と言って対象物JTを指し示す場合には、通話者Bは、ディスプレイ装置12bを利用して相手方のエージェント装置13aを制御し、通話者Aに「これ」の対象物JTを指し示す。通話者Aは、通話者Bが話題の対象としたいものが何であるかを「これ」という語句とエージェント装置13aの動作により理解することができる。
For example, when the caller B says “this” and points to the target object JT, the caller B uses the
また、通話者Aが、「これ」と言って対象物JTを差し示す場合には、通話者Aは、ディスプレイ装置12aを利用して相手方のエージェント装置13bを制御し、通話者Aが指し示したものをエージェント装置13aの視界に入れる。通話者Bは、ディスプレイ装置12bを通して、話題の対象が何であるかを理解することができる。
When the caller A says “this” and points to the object JT, the caller A uses the
上に述べたように、テレビ電話システム1では、話題の対象を指示するために、通話者の近辺の複数の異なる位置にそれぞれスピーカを配置しておき、他の通話者の動作または操作によって、複数のスピーカのいずれかに切り替えて当該他の通話者の音声を出力する。
As described above, in the
このように、テレビ電話システム1によると、通話者A,Bのいずれもが、話題の対象物JTから視点をそらすことなく、会話を進めることが可能となる。対象物JTの名称が不明な場合であっても、対象物JTが何であるかを容易に理解させることができる。
Thus, according to the
テレビ電話システム1は、さらに次に述べる動作を行うことができる。
The
すなわち、相手方のスピーカを、ディスプレイ装置12とエージェント装置13とで切り替えるのみでなく、これに携帯電話機11のスピーカを含めた3者のうちから選択して切り替えることができる。このように、3つの異なった位置にあるスピーカを切り替えることにより、通話者の意識の変遷を相手方に知らせ、話題の対象物JTが何であるかを一層分かり易くすることができる。
That is, not only can the speaker of the other party be switched between the
また、話題の対象が具体的な物ではなく、抽象的なもののように仮想の共有空間である場合に、特定の機器のスピーカから音声が出力された場合にそのような仮想の共有空間が対象であることとして相手方に知らせることができる。 Also, if the topic is not a concrete object but a virtual shared space such as an abstract one, such a virtual shared space is targeted when sound is output from the speaker of a specific device. The other party can be informed that this is the case.
例えば、話題の対象が相手方である通話者Bの近傍にあるときには、相手方のエージェント装置13bから音声を出力し、話題の対象が本人である通話者Aの近傍にあるときは、相手方のディスプレイ装置12bから音声を出力し、話題の対象が仮想の共有空間であるときには、相手方の携帯電話機11bから音声を出力する。
For example, when the topic target is in the vicinity of the caller B who is the other party, a voice is output from the other party's
また、通話者の動作または操作によって、音声を出力する相手方のスピーカがエージェント装置13からディスプレイ装置12に切り替えられたときに、そのエージェント装置13の指示装置62の処理動作が中断するようにしてもよい。例えば、エージェント装置13は、指示装置62が切り替え前まで差し示していた状態を維持したり、プロジェクタ67を消灯して指示装置62による指示を行わないようにする。これによって、相手方は、話題の対象物JTが他に移ったことをより一層認識し易くなる。
Further, when the speaker of the other party that outputs the sound is switched from the
また、同じく、音声を出力する相手方のスピーカがエージェント装置13からディスプレイ装置12に切り替えられたときに、そのエージェント装置13の指示装置62がディスプレイ装置12を指示するようにしてもよい。
Similarly, the
また、通話者の動作または操作によって、音声を出力する相手方のスピーカがディスプレイ装置12からエージェント装置13に切り替えられたときに、当該ディスプレイ装置12によって、エージェント装置13の側に切り替えられた旨を示すメッセージを表示する。メッセージとして、例えば「エージェントの方に話題が移りました」「エージェントの方を見てください」などとすればよい。これによって、それまでディスプレイ装置12を見ていた通話者は、対象物JTが他に移ったことをより明確に知ることができる。
In addition, when the speaker of the other party that outputs the sound is switched from the
また、通話者が、携帯電話機11に向かって話すかまたはディスプレイ装置12に向かって話すかによって、その音声が相手方で出力される機器を切り替えてもよい。例えば、通話者が携帯電話機11に向かって話した場合に、相手方のディスプレイ装置12のスピーカ42からその音声が出力され、ディスプレイ装置12に向かって話した場合に、相手方のエージェント装置13のスピーカ54からその音声が出力されるようにする。また、通話者が携帯電話機11に向かって話している場合に、携帯電話機11の操作部31を操作することによって、それらのスピーカ42,54を切り替えてもよい。
Further, the device to which the voice is output by the other party may be switched depending on whether the caller speaks to the
また、通話者のいずれかの側においてスピーカが切り替えられたときに、切り替え元のスピーカ、または切り替え後のスピーカから、切り替えを示すためのビープ音を出力するようにしてもよい。 Further, when the speaker is switched on either side of the caller, a beep sound for indicating switching may be output from the switching source speaker or the switched speaker.
次に、テレビ電話システム1における通話に関する種々のシーケンスの例について説明する。
Next, examples of various sequences relating to a call in the
図6は通話開始シーケンスの例を示す図である。 FIG. 6 is a diagram showing an example of a call start sequence.
図6においては、通話者Aから通話者Bにテレビ電話をかける例が示されている。まず、通話者Aが携帯電話機11aの発呼操作を行う。携帯電話機11aは、ディスプレイ装置12aに接続要求を送り、接続応答を待つ。ディスプレイ装置12aからの接続応答を受けると、エージェント装置13aに接続要求を送り、接続応答を待つ。
FIG. 6 shows an example of making a videophone call from the caller A to the caller B. First, the caller A performs a call operation on the mobile phone 11a. The cellular phone 11a sends a connection request to the
携帯電話機11aは、エージェント装置13aからの接続応答を受けると、相手方の携帯電話機11bにSetup信号を送る。
When the mobile phone 11a receives a connection response from the
携帯電話機11bは、Setup信号を受けると、ディスプレイ装置12bに接続要求を送り、接続応答を待つ。ディスプレイ装置12bからの接続応答を受けると、エージェント装置13bに接続要求を送り、接続応答を待つ。
Upon receiving the Setup signal, the
携帯電話機11bは、エージェント装置13bからの接続応答を受けると、携帯電話機11aにAlerting信号を送る。また、携帯電話機11bは鳴動を開始し、通話者Bに着信を知らせる。
When receiving the connection response from the
携帯電話機11aは、携帯電話機11bからAlerting信号を受けると、RBT(リングバックトーン)により、通話者Bを呼び出し中であることを通話者Aに知らせる。
When receiving the Alerting signal from the
通話者Bが携帯電話機11bの応答操作を行うと、携帯電話機11bは携帯電話機11aにConnect信号を送る。携帯電話機11aはConnect信号を受けると、通話者A,Bの間でテレビ電話により通話可能な状態となる。
When the caller B performs a response operation on the
図7は話題の対象指示シーケンスの例を示す図である。 FIG. 7 is a diagram showing an example of a topic target instruction sequence.
図7には、通話者Aの近傍にある対象物JTを通話者Bが「これ」と言って指し示す場合が示されている。通話者A,Bの間で音声および画像を互いに通信している状態において、通話者Bが携帯電話機11bを操作してアングル調整操作を行うと、携帯電話機11bは、携帯電話機11aを経由してエージェント装置13aに首方向調整信号を送る。首方向調整信号には、指定位置情報、例えば、xy座標面における照射先のxy座標、またはx軸からの回転角度などの情報を含めることができる。エージェント装置13aは、首方向調整信号を受けると、そのアングル制御装置52を制御し、それに応じてカメラ装置51の向きを変える。
FIG. 7 shows a case where the caller B points to the object JT near the caller A by saying “this”. When the caller B operates the
これにより、通話者Bは、話題の対象物の中心となる画像がディスプレイ装置12bに映るように調整することができる。そして、通話者Bが携帯電話機11bに作動指示操作を行うと、携帯電話機11bは、携帯電話機11aを経由して、エージェント装置13aに作動指示を送る。エージェント装置13aは、作動指示を受けると、エージェント装置13aの指示装置62のプロジェクタ67を点灯する。
As a result, the caller B can make adjustments so that the image that is the center of the subject of interest is displayed on the
これにより、通話者Aは、通話者Bが話題の対象物としたいものを「これ」という語句とともに明確に知ることができる。 Thereby, the caller A can clearly know what the caller B wants to be the subject of the topic together with the phrase “this”.
図8は話題空間の切り替えシーケンスの例を示す図である。 FIG. 8 is a diagram illustrating an example of a topic space switching sequence.
図8には、通話者Aの意思により、仮想共有空間から通話者Aのいる実空間へ話題を転換しようとする場合の例が示されている。 FIG. 8 shows an example in which the topic is changed from the virtual shared space to the real space where the caller A is present by the intention of the caller A.
通話者Aが携帯電話機11aの引込操作を行うと、携帯電話機11aは、携帯電話機11aの音声入力部33から入力された音声信号の送信先を携帯電話機11bからディスプレイ装置12bに切り替える。これにより、通話者Aは、通話者Bの意識を、通話者Aの側の画像を表示しているディスプレイ装置12bに向けさせることができる。
When the caller A performs the pull-in operation of the mobile phone 11a, the mobile phone 11a switches the transmission destination of the audio signal input from the
同様に、通話者Bの側においても、携帯電話機11bの引込操作を行って同様な切り替えを行うことができる。
Similarly, on the side of the caller B, the same switching can be performed by performing the pull-in operation of the
図9は話題空間の切り替えシーケンスの他の例を示す図である。 FIG. 9 is a diagram showing another example of the topic space switching sequence.
図9には、通話者Bの意思により、仮想共有空間から通話者Aのいる実空間へ話題を転換しようとする場合の例が示されている。 FIG. 9 shows an example in which the topic is changed from the virtual shared space to the real space where the caller A is present by the intention of the caller B.
通話者Bが携帯電話機11bの訪問操作を行うと、携帯電話機11bは、携帯電話機11bの音声入力部33から入力された音声信号の送信先を携帯電話機11aからエージェント装置13aに切り替える。これにより、通話者Bは、通話者Aの意識を、エージェント装置13aに向けさせることができる。
When the caller B visits the
図10は話題空間の切り替えシーケンスの他の例を示す図である。 FIG. 10 is a diagram showing another example of the topic space switching sequence.
図10には、通話者Aの意思により、通話者Aのいる実空間から仮想共有空間へ話題を転換しようとする場合の例が示されている。 FIG. 10 shows an example in which the topic is changed from the real space where the caller A is present to the virtual shared space by the intention of the caller A.
通話者Aが携帯電話機11aの押戻操作を行うと、携帯電話機11aは、携帯電話機11aの音声入力部33から入力された音声信号の送信先をディスプレイ装置12bから携帯電話機11bに切り替える。これにより、通話者Aは、通話者Bの意識を、ディスプレイ装置12bから離して携帯電話機11bに向けさせることができる。
When the caller A pushes back the mobile phone 11a, the mobile phone 11a switches the transmission destination of the audio signal input from the
図11は話題空間の切り替えシーケンスの他の例を示す図である。 FIG. 11 is a diagram showing another example of the topic space switching sequence.
図11には、通話者Bの意思により、通話者Aのいる実空間から仮想共有空間へ話題を転換しようとする場合の例が示されている。 FIG. 11 shows an example in which the topic is changed from the real space where the caller A is present to the virtual shared space by the intention of the caller B.
通話者Bが携帯電話機11bの退去操作を行うと、携帯電話機11bは、携帯電話機11bの音声入力部33から入力された音声信号の送信先をエージェント装置13aから携帯電話機11aに切り替える。これにより、通話者Bは、通話者Aの意識を、エージェント装置13aから離して携帯電話機11aに向けさせることができる。
When the caller B performs the leaving operation of the
図12は近傍エージェントの制止シーケンスの例を示す図である。 FIG. 12 is a diagram illustrating an example of a stop sequence of neighboring agents.
図12には、通話者Bからの遠隔制御によるエージェント装置13aの動作に不具合がある場合に、通話者Aの意思によってエージェント装置13aの動作を制止する場合の例が示されている。
FIG. 12 shows an example in which the operation of the
通話者Aがエージェント装置13aに制止を命令するための語句を言うと、エージェント装置13aは、ディスプレイ装置12bへの画像信号を停止し、携帯電話機11bからの遠隔制御信号を破棄する状態となる。
When the caller A says a phrase for instructing the
図13は近傍エージェントの遠隔制御許可シーケンスの例を示す図である。 FIG. 13 is a diagram showing an example of the remote control permission sequence of the neighboring agent.
図13には、通話者Aが、通話者Bに対して遠隔制御を許可する場合の例が示されている。 FIG. 13 shows an example where the caller A permits the caller B to perform remote control.
通話者Aが携帯電話機11aの許可操作を行うと、携帯電話機11aは、許可信号をエージェント装置13aに送る。エージェント装置13aは、携帯電話機11aからの許可信号を受けると、ディスプレイ装置12bへの画像信号の送信を再開し、携帯電話機11bからの遠隔制御信号を処理可能とする状態となる。
When the caller A performs a permission operation on the mobile phone 11a, the mobile phone 11a sends a permission signal to the
図14は話題の対象指示シーケンスの他の例を示す図である。 FIG. 14 is a diagram showing another example of the topic target instruction sequence.
図14には、通話者Aの近傍にある対象物JTを通話者Bが「これ」と言って指し示す場合が示されている。 FIG. 14 shows a case where the caller B points to the object JT in the vicinity of the caller A by saying “this”.
通話者A,Bの間で音声および画像を互いに通信している状態において、通話者Bがディスプレイ装置12bのタッチパネル入力部41aによってタッチ操作を行うと、ディスプレイ装置12bは、タッチ操作によって得られた指定位置情報を携帯電話機11bへ送る。携帯電話機11bは、ディスプレイ装置12bからの指定位置情報を受けると、指定位置の座標を記憶する。通話者Bが携帯電話機11bを操作してアングル調整操作を行うと、携帯電話機11bは、携帯電話機11aを経由してエージェント装置13aに首方向調整信号を送る。エージェント装置13aは、首方向調整信号を受けると、そのアングル制御装置52を制御し、それに応じてカメラ装置51の向きを変える。
When the caller B performs a touch operation with the touch
さらに、通話者Bが携帯電話機11bに作動指示操作を行うと、携帯電話機11bは、携帯電話機11aを経由して、エージェント装置13aに作動指示を送る。エージェント装置13aは、作動指示を受けると、エージェント装置13aの指示装置62のプロジェクタ67を点灯する。
Further, when the caller B performs an operation instruction operation on the
図15は話題の対象指示シーケンスの他の例を示す図である。 FIG. 15 is a diagram showing another example of the topic target instruction sequence.
図15には、通話者Aの近傍にある対象物JTを通話者Bが「これ」と言って指し示す場合が示されている。 FIG. 15 shows a case where the caller B points to the object JT in the vicinity of the caller A by saying “this”.
通話者Bがディスプレイ装置12bのタッチパネル入力部41aによってタッチ操作を行うと、ディスプレイ装置12bは、タッチ操作によって得られた指定位置情報を携帯電話機11bへ送る。携帯電話機11bは、ディスプレイ装置12bからの指定位置情報を受けると、指定位置の座標を記憶する。通話者Bが携帯電話機11bを操作して作動指示操作を行うと、携帯電話機11bは、携帯電話機11aを経由してエージェント装置13aに作動指示を送る。エージェント装置13aは、作動指示を受けると、エージェント装置13aの指示装置62のプロジェクタ67を点灯する。
When the caller B performs a touch operation using the touch
図16は話題空間の切り替えシーケンスの他の例を示す図である。 FIG. 16 is a diagram showing another example of the topic space switching sequence.
図16には、通話者Aの意思により、エージェント装置13aを持ち上げることにより、仮想共有空間から通話者Aのいる実空間へ話題を転換しようとする場合の例が示されている。
FIG. 16 shows an example in which the topic is changed from the virtual shared space to the real space where the caller A is located by lifting the
通話者Aがエージェント装置13aを持ち上げると、エージェント装置13aの接触センサSE3がそれを検出し、携帯電話機11aへ持ち上げ感知信号を送る。携帯電話機11aが持ち上げ感知信号を受信すると、携帯電話機11aは、携帯電話機11aの音声入力部33から入力した音声信号の送信先を携帯電話機11bからディスプレイ装置12bへ切り替える。
When the caller A lifts the
次に、テレビ電話システム1におけるスピーカの切り替え動作について、フローチャートを参照して説明する。
Next, a speaker switching operation in the
図17はテレビ電話システム1のスピーカの切り替え動作の概略を示すフローチャートである。
FIG. 17 is a flowchart showing an outline of the speaker switching operation of the
図17において、通話者の間でテレビ電話による通信が行われている状態で(#11)、いずれかの通話者が切り替えのための操作を行うと(#12)、異なった位置にある複数のスピーカの中で切り替えられ(#13)、切り替えられたスピーカから相手方の音声が出力される。これによって、またこれと相手方の言う言葉とによって、相手方の話題の対象物JTが変更されたことが分かり易くなる。 In FIG. 17, in a state where videophone communication is performed between the callers (# 11), when any caller performs an operation for switching (# 12), a plurality of callers at different positions are displayed. The other party's voice is output from the switched speaker (# 13). This makes it easier to understand that the subject JT of the opponent's topic has been changed by this and the words the opponent says.
図18は通話者の接触によるスピーカの切り替え動作を示すフローチャートである。 FIG. 18 is a flowchart showing a speaker switching operation by contact of a caller.
図18において、テレビ電話による通信が行われている状態で(#21)、通話者がディスプレイ装置12に接触すると(#22)、相手方のエージェント装置13のスピーカから音声が出るように切り替えられ(#23)、相手方のディスプレイ装置12に、エージェント装置13の方に注目する旨のメッセージを表示する(#24)。通話者がエージェント装置13に接触すると(#25)、相手方のディスプレイ装置12のスピーカから音声が出るように切り替えられ(#26)、相手方のエージェント装置13は指示装置62による指示動作を中断する(#27)。
In FIG. 18, in a state in which videophone communication is performed (# 21), when a caller touches the display device 12 (# 22), switching is performed so that sound is output from the speaker of the partner agent device 13 ( # 23) A message to pay attention to the
なお、音声を出力するスピーカを切り替えるために、種々の構成を採用することができる。 It should be noted that various configurations can be employed to switch the speaker that outputs sound.
例えば、音声を携帯電話機11から送信する場合には、携帯電話機11からの音声の送信先アドレス情報を切り替え先の機器のアドレスに変更する。その場合に、ディスプレイ装置12の操作によって切り替え先が決定された場合には、切り替え先の機器のアドレスをディスプレイ装置12から携帯電話機11に送信する。また、エージェント装置13の操作によって切り替え先が決定された場合には、切り替え先の機器のアドレスをエージェント装置13から携帯電話機11に送信する。
For example, when transmitting voice from the
また、例えば、音声をディスプレイ装置12から送信する場合には、ディスプレイ装置12からの音声の送信先アドレス情報を切り替え先の機器のアドレスに変更する。音声をエージェント装置13から送信する場合には、エージェント装置13からの音声の送信先アドレス情報を切り替え先の機器のアドレスに変更する。また、それらの情報をルータBSその他の装置を経由して配信するようにしてもよい。また、ルータBSを無線ルータとしてもよい。
Further, for example, when audio is transmitted from the
なお、スピーカの切り替え先をどこにするかという点については、話題の対象物JTが存在する位置に近いスピーカから音声が出力されるように切り替えると、相手方の意識が音声の出る方に向くため、対象物JTが変更されたこと、また、変更された対象物JTがどれであるかということが、一層分かり易い。その場合に、対象物JTとスピーカとの位置関係に応じて、通話者が「あれ」「これ」などの言葉を送ると、より一層対象物JTが分かり易い。 As for where to switch the speaker, because the other party's consciousness is suitable for the direction of the voice when switching so that the voice is output from the speaker close to the position where the topical object JT exists, It is easier to understand that the object JT has been changed and which object JT has been changed. In this case, if the caller sends a word such as “that” or “this” in accordance with the positional relationship between the target object JT and the speaker, the target object JT can be understood more easily.
また、ディスプレイ装置12およびエージェント装置13の2つのスピーカのみでなく、携帯電話機11のスピーカを含めた3つのスピーカから選択して切り替えることによって、より一層対象物JTを特定し易い。
Further, by selecting and switching from three speakers including the speaker of the
また、ディスプレイ装置12やエージェント装置13には、それぞれ、スピーカが1つ設けられた例を説明したが、離れた位置に2つ以上のスピーカを設け、それらのスピーカを切り替えるようにしてもよい。これによって、音声の出る位置を対象物JTの位置に応じてきめ細かく切り替えることができ、より一層対象物JTを認識し易くなる。
Further, the
以上、本実施形態のテレビ電話システム1の動作について説明したが、上に説明した種々の処理動作またはスピーカの切り替え方法を適宜組み合わせることにより、種々の状況において話題の対象物JTを通信の相手に分からせることが可能である。
The operation of the
上に述べた実施形態において、携帯装置として携帯電話機11を例にとって説明したが、携帯電話機11以外の種々の携帯装置を用いることが可能である。ディスプレイ装置12にマイクを設けてもよい。
In the above-described embodiment, the
その他、携帯電話機11、ディスプレイ装置12、エージェント装置13、カメラ装置51、指示装置62、またはテレビ電話システム1の全体または各部の構成、構造、形状、寸法、個数、処理の内容またはタイミング、音声の内容などは、本発明の趣旨に沿って適宜変更することができる。
In addition, the configuration, structure, shape, dimensions, number, processing content or timing of the whole or each part of the
以下の付記に示される形態も本発明による実施形態に含まれる。
(付記1)
複数の通話者の間で音声および画像を用いて通信を行うテレビ電話システムであって、
他の通話者から送信される画像を表示するするディスプレイ装置、および、他の通話者に送信するための画像を撮影するカメラおよび近傍にある対象物を指し示すための指示装置を搭載した移動可能なエージェント装置が、各通話者の側に配置されており、
前記ディスプレイ装置および前記エージェント装置には、他の通話者からの音声を出力するためのスピーカが搭載され、他の通話者の動作または操作によって、当該他の通話者の音声が前記ディスプレイ装置のスピーカまたは前記エージェント装置のスピーカから選択的に切り替えられて出力されるように構成されている、
ことを特徴とするテレビ電話システム。
(付記2)
前記ディスプレイ装置および前記エージェント装置には、通話者が接触したことを検出する接触センサが設けられており、
他の通話者が当該他の通話者の側の前記ディスプレイ装置に接触したときには前記エージェント装置のスピーカから音声が出力され、他の通話者が当該他の通話者の側の前記エージェント装置に接触したときには前記ディスプレイ装置のスピーカから音声が出力される、
付記1記載のテレビ電話システム。
(付記3)
他の通話者が発する特定の語句を音声認識することによって、前記ディスプレイ装置のスピーカまたは前記エージェント装置のスピーカから選択的に切り替えられて音声が出力される、
付記1記載のテレビ電話システム。
(付記4)
いずれかの通話者の側に、当該通話者が携帯可能であり且つ操作部および他の通話者に送信する音声を入力するマイクが設けられた携帯装置が配置され、
当該通話者による前記操作部の操作によって、他の通話者の側の前記ディスプレイ装置のスピーカまたは前記エージェント装置のスピーカから選択的に切り替えられて音声が出力される、
付記1記載のテレビ電話システム。
(付記5)
他の通話者の動作または操作によって前記エージェント装置のスピーカから前記ディスプレイ装置のスピーカに切り替えられたときに、当該エージェント装置の指示装置の処理動作を中断する、
付記1ないし4のいずれかに記載のテレビ電話システム。
(付記6)
他の通話者の動作または操作によって前記ディスプレイ装置のスピーカから前記エージェント装置のスピーカに切り替えられたときに、当該ディスプレイ装置によって、前記エージェント装置の側に切り替えられた旨を示すメッセージを表示する、
付記1ないし5のいずれかに記載のテレビ電話システム。
(付記7)
複数の通話者の間で音声および画像を用いて通信を行うテレビ電話システムに用いるエージェント装置であって、
他の通話者に送信するための画像を撮影するカメラと、
他の通話者からの音声を出力するスピーカと、
近傍にある対象物を指し示すための指示装置と、
通話者が接触したことを検出する接触センサと、
当該エージェント装置を移動するための移動装置と、
を有してなることを特徴とするテレビ電話システムに用いるエージェント装置。
(付記8)
他の通話者からの音声の出力が前記スピーカから他のスピーカに切り替えられたときに、前記指示装置の処理動作を中断する、
付記7記載のテレビ電話システムに用いるエージェント装置。
(付記9)
複数の通話者の間で音声および画像を用いて通信を行うテレビ電話システムにおける話題の対象の指示方法であって、
通話者の近辺の複数の異なる位置にそれぞれスピーカを配置しておき、
他の通話者の動作または操作によって、前記スピーカのいずれかに切り替えて当該他の通話者の音声を出力する、
ことを特徴とするテレビ電話システムにおける話題の対象の指示方法。
The forms shown in the following supplementary notes are also included in the embodiments according to the present invention.
(Appendix 1)
A videophone system that communicates between a plurality of callers using sound and images,
A mobile device equipped with a display device that displays an image transmitted from another party, a camera that captures an image to be transmitted to another party, and a pointing device for pointing a nearby object An agent device is located on each party's side,
The display device and the agent device are each equipped with a speaker for outputting sound from another caller, and the other caller's sound is output from the speaker of the display device by the operation or operation of the other caller. Or configured to be selectively switched from the speaker of the agent device and output.
A videophone system characterized by that.
(Appendix 2)
The display device and the agent device are provided with a contact sensor for detecting contact of a caller,
When another caller touches the display device on the other caller's side, sound is output from the speaker of the agent device, and another caller touches the agent device on the other caller's side. Sometimes audio is output from the speaker of the display device,
The videophone system according to
(Appendix 3)
By recognizing a specific phrase from another caller, the speaker is selectively switched from the speaker of the display device or the speaker of the agent device, and the sound is output.
The videophone system according to
(Appendix 4)
On either party's side, a portable device provided with a microphone that can be carried by the caller and that inputs a voice to be transmitted to the operation unit and another caller is disposed,
By the operation of the operation unit by the caller, a voice is output by selectively switching from the speaker of the display device or the speaker of the agent device on the other caller side.
The videophone system according to
(Appendix 5)
When the speaker of the agent device is switched from the speaker of the agent device to the speaker of the display device by the operation or operation of another party, the processing operation of the instruction device of the agent device is interrupted.
The videophone system according to any one of
(Appendix 6)
When the speaker of the display device is switched from the speaker of the display device to the agent device by an operation or operation of another caller, a message indicating that the display device has been switched to the agent device side is displayed by the display device.
The videophone system according to any one of
(Appendix 7)
An agent device used in a videophone system that communicates between a plurality of callers using sound and images,
A camera that captures images for transmission to other parties,
A speaker that outputs audio from other parties;
An indicating device for pointing an object in the vicinity;
A contact sensor that detects contact of the caller;
A mobile device for moving the agent device;
An agent device for use in a videophone system, comprising:
(Appendix 8)
Interrupting the processing operation of the pointing device when the output of voice from another party is switched from the speaker to the other speaker;
An agent device used in the videophone system according to attachment 7.
(Appendix 9)
A method for instructing a subject of a topic in a videophone system that performs communication using voice and images between a plurality of callers,
Place speakers at several different locations near the caller,
According to the operation or operation of another party, the voice of the other party is output by switching to one of the speakers.
A method for indicating a topic of interest in a videophone system.
1 テレビ電話システム
11 携帯電話機(携帯装置)
12 ディスプレイ装置
13 エージェント装置
32 音声出力部(スピーカ)
33 音声入力部(マイク)
41 ビデオ表示部
41a タッチパネル入力部
42 音声出力部(スピーカ)
51 カメラ装置
53 移動装置
54 音声出力部(スピーカ)
55 音声入力部(マイク)
56 音声認識部
57 音声認識辞書部
61 カメラ
62 指示装置
67 プロジェクタ
SE2,3 接触センサ
JT 対象物
1
12
33 Voice input unit (microphone)
41
51
55 Voice input unit (microphone)
56
Claims (5)
他の通話者から送信される画像を表示するディスプレイ装置、および、他の通話者に送信するための画像を撮影するカメラおよび近傍にある対象物を指し示すための指示装置を搭載したエージェント装置が、各通話者の側に配置されており、
しかも、前記各エージェント装置は、前記カメラを支持するとともにその光軸の角度を変更し調整するためのアングル制御装置、および、当該エージェント装置を前記対象物の近傍に移動させるための移動装置を備え、
さらに、前記ディスプレイ装置および前記エージェント装置には、他の通話者からの音声を出力するためのスピーカが搭載され、他の通話者の動作または操作によって、当該他の通話者の音声が前記ディスプレイ装置のスピーカまたは前記エージェント装置のスピーカから選択的に切り替えられて出力されるように構成されている、
ことを特徴とするテレビ電話システム。 A videophone system that communicates between a plurality of callers using sound and images,
An agent device equipped with a display device that displays an image transmitted from another caller, a camera that captures an image for transmission to another caller, and a pointing device for pointing an object in the vicinity, Located on each party's side,
In addition, each agent device includes an angle control device for supporting and changing the angle of the optical axis of the camera device, and a moving device for moving the agent device in the vicinity of the object. ,
Furthermore, the display device and the agent device are each equipped with a speaker for outputting sound from another caller, and the other caller's voice is transmitted to the display device by the operation or operation of the other caller. Configured to be selectively switched and output from the speaker of the agent device or the speaker of the agent device,
A videophone system characterized by that.
他の通話者が当該他の通話者の側の前記ディスプレイ装置に接触したときには前記エージェント装置のスピーカから音声が出力され、他の通話者が当該他の通話者の側の前記エージェント装置に接触したときには前記ディスプレイ装置のスピーカから音声が出力される、
請求項1記載のテレビ電話システム。 The display device and the agent device are provided with a contact sensor for detecting contact of a caller,
When another caller touches the display device on the other caller's side, sound is output from the speaker of the agent device, and another caller touches the agent device on the other caller's side. Sometimes audio is output from the speaker of the display device,
The videophone system according to claim 1.
請求項1記載のテレビ電話システム。 By recognizing a specific phrase from another caller, the speaker is selectively switched from the speaker of the display device or the speaker of the agent device, and the sound is output.
The videophone system according to claim 1.
当該通話者による前記操作部の操作によって、他の通話者の側の前記ディスプレイ装置のスピーカまたは前記エージェント装置のスピーカから選択的に切り替えられて音声が出力される、
請求項1記載のテレビ電話システム。 On either party's side, a portable device provided with a microphone that can be carried by the caller and that inputs a voice to be transmitted to the operation unit and another caller is disposed,
By the operation of the operation unit by the caller, a voice is output by selectively switching from the speaker of the display device or the speaker of the agent device on the other caller side.
The videophone system according to claim 1.
請求項1ないし4のいずれかに記載のテレビ電話システム。 When the speaker of the agent device is switched from the speaker of the agent device to the speaker of the display device by the operation or operation of another party, the processing operation of the instruction device of the agent device is interrupted.
The videophone system according to any one of claims 1 to 4.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007090400A JP5007590B2 (en) | 2007-03-30 | 2007-03-30 | Videophone system and agent device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007090400A JP5007590B2 (en) | 2007-03-30 | 2007-03-30 | Videophone system and agent device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008252455A JP2008252455A (en) | 2008-10-16 |
JP5007590B2 true JP5007590B2 (en) | 2012-08-22 |
Family
ID=39976893
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007090400A Expired - Fee Related JP5007590B2 (en) | 2007-03-30 | 2007-03-30 | Videophone system and agent device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5007590B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112019003189T5 (en) * | 2018-06-25 | 2021-04-08 | Sony Corporation | INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD AND INFORMATION PROCESSING SYSTEM |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3553050B2 (en) * | 2002-05-28 | 2004-08-11 | 株式会社エイティング | Videophone monitoring system |
JP2007036543A (en) * | 2005-07-26 | 2007-02-08 | Fuji Xerox Co Ltd | Remote instruction system and remote instruction method |
-
2007
- 2007-03-30 JP JP2007090400A patent/JP5007590B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008252455A (en) | 2008-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10499136B2 (en) | Providing isolation from distractions | |
EP3062196B1 (en) | Method and apparatus for operating and controlling smart devices with hand gestures | |
US9253303B2 (en) | Signal processing apparatus and storage medium | |
US8254984B2 (en) | Speaker activation for mobile communication device | |
EP3429174A1 (en) | Automatic routing of call audio at incoming call | |
KR20160082206A (en) | Headset that is operated with mobile terminal using short range wireless communication | |
EP3322167B1 (en) | Method and device for adjusting frequencies of intercom apparatuses | |
KR20150062795A (en) | Mobile terminal and control method for the mobile terminal | |
JP7473029B2 (en) | Portable information terminal, portable information terminal control method, and program | |
JP5929698B2 (en) | Communication system and program | |
JP5007590B2 (en) | Videophone system and agent device | |
KR20120127987A (en) | Method and apparatus for switching call mode | |
JP2018137568A (en) | Reception telephone terminal | |
JP4997572B2 (en) | Control device for mobile phone device, mobile phone device, and control method for mobile phone device | |
KR102075750B1 (en) | Method for providing voice communication using character data and an electronic device thereof | |
KR101727494B1 (en) | Method for handling call waiting and mobile terminal using this method | |
JP2007174360A (en) | Hands-free device of radio connection system, and connection switching method thereof | |
JP2015126313A (en) | Radio device and control method of the same | |
KR20160072644A (en) | Mobile terminal and method for controlling the same | |
JP2010114864A (en) | Portable information apparatus | |
WO2017163513A1 (en) | Information processing terminal, wristwatch terminal, and control method and control program for said information processing terminal and said wristwatch terminal | |
JP2010028214A (en) | Wireless communication system | |
JP2010154005A (en) | Hands-free intercom device | |
JP2005217594A (en) | Mobile communication terminal and call termination processing method thereof | |
WO2014027372A1 (en) | Portable terminal, method for controlling portable terminal, and non-temporary computer-readable medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120131 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120330 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120501 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120514 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150608 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |