JP5007590B2 - Videophone system and agent device - Google Patents

Videophone system and agent device Download PDF

Info

Publication number
JP5007590B2
JP5007590B2 JP2007090400A JP2007090400A JP5007590B2 JP 5007590 B2 JP5007590 B2 JP 5007590B2 JP 2007090400 A JP2007090400 A JP 2007090400A JP 2007090400 A JP2007090400 A JP 2007090400A JP 5007590 B2 JP5007590 B2 JP 5007590B2
Authority
JP
Japan
Prior art keywords
caller
speaker
agent device
display device
agent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007090400A
Other languages
Japanese (ja)
Other versions
JP2008252455A (en
Inventor
鎭治 加古
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2007090400A priority Critical patent/JP5007590B2/en
Publication of JP2008252455A publication Critical patent/JP2008252455A/en
Application granted granted Critical
Publication of JP5007590B2 publication Critical patent/JP5007590B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、複数の通話者の間で音声および画像を用いて通信を行うテレビ電話システム、およびそれに用いるエージェント装置、並びにテレビ電話システムにおける話題の対象の指示方法に関する。   The present invention relates to a videophone system that performs communication using voice and images among a plurality of callers, an agent device used therefor, and a method for instructing a topic target in the videophone system.

従来より、複数の通話者の間で音声および画像を用いて通信を行うテレビ電話システムが用いられている。そのようなテレビ電話システムでは、ディスプレイ装置のモニタ画面に相手の顔や姿を映しながら電話で会話を行うことができる。   2. Description of the Related Art Conventionally, a videophone system that performs communication using voice and images between a plurality of callers has been used. In such a videophone system, it is possible to carry out a telephone conversation while reflecting the face and appearance of the other party on the monitor screen of the display device.

図19は従来のテレビ電話システム80を示す図である。   FIG. 19 is a diagram showing a conventional videophone system 80.

図19に示すテレビ電話システム80おいては、互いに離れた場所にいる2人の通話者A,Bが、テレビ電話装置82a,82bを用いて通信を行う。各テレビ電話装置82a,82bには、各通話者A,Bを撮影するビデオカメラ、音声を拾うマイク、および、相手側から送られてきた画像(映像)を表示するディスプレイ装置が備えられている。   In the videophone system 80 shown in FIG. 19, two callers A and B who are remote from each other communicate using videophone devices 82a and 82b. Each of the video phone devices 82a and 82b is provided with a video camera that captures each of the callers A and B, a microphone that picks up sound, and a display device that displays an image (video) sent from the other party. .

また、テレビ電話を用いて多人数で同時に会議を開けるようにしたテレビ電話システムでは、複数台のビデオカメラおよびマイクが設置され、ビデオカメラを遠隔操作することにより会場の全体の様子や発言者の顔などを離れた場所のディスプレイ装置に表示できるようになっている。   In addition, in a videophone system that allows a large number of people to hold a conference simultaneously using a videophone, multiple video cameras and microphones are installed. It can be displayed on a display device at a distant place such as a face.

また、ビデオカメラを遠隔操作するためにビデオカメラを移動型ロボットに搭載し、ロボットを遠隔操縦することによって、多数のビデオカメラを設置することなく、複数箇所の画像を取得して離れた場所で監視する技術が提案されている(特許文献1)。   In addition, a video camera is installed in a mobile robot to remotely control the video camera, and by remotely manipulating the robot, multiple images can be acquired at a remote location without installing a large number of video cameras. A technique for monitoring has been proposed (Patent Document 1).

また、W−CDMAなどの高伝送能力の次世代通信方式の携帯電話機を用いたテレビ電話において、携帯電話機によって相手側のカメラを制御することが提案されている(特許文献2)
また、カメラで撮影を行う場合に、レーザ光をスポット照射して対象物を指し示す指示装置も提案されている(特許文献3)。
特開2002−84531 特開2002−57808 特開2004−364067
In addition, in a videophone using a mobile phone of a next-generation communication system with high transmission capability such as W-CDMA, it has been proposed to control a camera on the other side by the mobile phone (Patent Document 2).
In addition, an instruction device has also been proposed that irradiates a laser beam with a spot and points to an object when photographing with a camera (Patent Document 3).
JP 2002-84531 A JP 2002-57808 A JP-A 2004-364067

しかし、従来のテレビ電話システムでは次のような問題がある。   However, the conventional videophone system has the following problems.

すなわち、テレビ電話を利用する通話者A,Bは、その時々の話題について会話を行うが、通常、その話題の対象となっている物(対象物)は、通話者A,Bのいずれか一方のみに存在するので、他方の通話者は、その対象物を相手側のビデオカメラで撮影して送信されてきた画像を見ながら会話を行うこととなる。   That is, the callers A and B who use the videophone call have conversations on the topic at that time, but the object (object) that is the subject of the topic is usually one of the callers A and B. Therefore, the other party talks while looking at the image transmitted by photographing the target object with the video camera of the other party.

したがって、例えば、対象物が通話者Aの側にあるとした場合に、その相手方である通話者Bが、テレビ電話装置82bに映し出された対象物またはその特定の部分を「これ」と言って指差したとしても、通話者Aには通話者Bが何を指しているのか理解できない。そのため、通話者Bは、「赤くて、丸くて…」などと多くの言葉で補いながら会話を進める必要があった。   Therefore, for example, when the object is on the side of the caller A, the other party, the caller B, says "this" the object displayed on the videophone device 82b or a specific part thereof. Even if he points, the caller A cannot understand what the caller B is pointing to. Therefore, the caller B had to proceed with the conversation while supplementing with many words such as “red, round ...”.

そこで、通話者Aのテレビ電話装置82aにも、通話者Bのテレビ電話装置82bと同じ映像を映し出すようにし、通話者Bの「指差し」位置を通話者Aのテレビ電話装置82aに表示することによって、通話者Bが「これ」と言って指差した内容を通話者Aが理解できるようにすることが考えられる。   Therefore, the same video as the video phone device 82b of the caller B is displayed on the video phone device 82a of the caller A, and the “pointing” position of the caller B is displayed on the video phone device 82a of the caller A. Thus, it is conceivable that the caller A can understand the content pointed by the caller B saying “this”.

しかし、その場合でも、通話者Aの意識は実空間とモニタ画面上の空間との間を行き来することがあり、その場合には、話題とは乖離した画像操作が必要となって会話の進行が円滑に進まない要因ともなる。   However, even in that case, the consciousness of the caller A sometimes goes back and forth between the real space and the space on the monitor screen. In this case, an image operation that deviates from the topic is required, and the conversation progresses. Is also a factor that does not proceed smoothly.

また、話題の対象物が通話者A,Bのそれぞれの近傍に存在する場合にも、それらを相互に参照する場合において、話題の対象物の所在場所を言葉で説明する必要があるために会話の進行が円滑に進まないことがある。   In addition, even when a topical object exists in the vicinity of each of the callers A and B, it is necessary to explain the location of the topical object in words when referring to each other. May not progress smoothly.

また、特許文献1および2のようにビデオカメラを遠隔操作した場合であっても、それだけでは話題の対象物を旨く指し示すことは困難である。   Further, even when the video camera is remotely operated as in Patent Documents 1 and 2, it is difficult to point out a topical object by itself.

また、特許文献3のような指示装置をテレビ電話システムに用いたとした場合に、どのようにすれば話題の対象物を旨く指し示すことができるかについて未解決である。   Further, when an instruction device such as that disclosed in Patent Document 3 is used in a videophone system, it is not yet solved how to indicate a topical object.

このように、従来においては、テレビ電話システムを用いて会話を行うときに、今どれを話題の対象物としているのかを相手方に分かり易く示すことが容易ではなかった。   As described above, conventionally, when a conversation is performed using a videophone system, it is not easy to easily show to the other party which is the subject of interest.

本発明は、上述の問題に鑑みてなされたもので、テレビ電話システムを用いて会話を行うときに、今どれを話題の対象物としているのかを相手方により分かり易く示せるようにすることを目的とする。   The present invention has been made in view of the above-described problems, and it is an object of the present invention to make it easier for the other party to understand which is the subject of interest when a conversation is performed using a videophone system. To do.

本発明に係る実施形態のテレビ電話システムは、複数の通話者の間で音声および画像を用いて通信を行うテレビ電話システムであって、他の通話者から送信される画像を表示するするディスプレイ装置、および、他の通話者に送信するための画像を撮影するカメラおよび近傍にある対象物を指し示すための指示装置を搭載した移動可能なエージェント装置が、各通話者の側に配置されており、しかも、前記各エージェント装置は、前記カメラを支持するとともにその光軸の角度を変更し調整するためのアングル制御装置、および、当該エージェント装置を前記対象物の近傍に移動させるための移動装置を備え、さらに、前記ディスプレイ装置および前記エージェント装置には、他の通話者からの音声を出力するためのスピーカが搭載され、他の通話者の動作または操作によって、当該他の通話者の音声が前記ディスプレイ装置のスピーカまたは前記エージェント装置のスピーカから選択的に切り替えられて出力される。 A videophone system according to an embodiment of the present invention is a videophone system that performs communication using voice and images among a plurality of callers, and displays an image transmitted from another caller A movable agent device equipped with a camera that captures an image to be transmitted to other callers and an instruction device for pointing an object in the vicinity is disposed on each caller's side, In addition, each agent device includes an angle control device for supporting and changing the angle of the optical axis of the camera device, and a moving device for moving the agent device in the vicinity of the object. , further, the said display device and said agent device, a speaker for outputting voice from the other party are mounted, other The talker operation or operations, the voice of the other party are outputted selectively switched by the speaker or the speaker of the agent device of the display device.

通話者の動作または操作によって相手方のスピーカを切り替えることにより、音声が出力される位置や音質などが変化することから、相手方は、話題の対象物が変化したことを認識することができる。また、これとともに音声の内容、例えば「あれ」「これ」などの語句によって、話題の対象物がより一層分かり易くなる。   By switching the speaker of the other party according to the operation or operation of the caller, the position where the sound is output, the sound quality, and the like change, so that the other party can recognize that the topical object has changed. In addition, the content of the voice, for example, phrases such as “that” and “this” make it easier to understand the topical object.

また、エージェント装置は、光軸の角度を変更できるカメラを備えかつ対象物の近傍に移動可能であるので、通話者が相手方のエージェント装置を遠隔操作することにより、カメラによって撮影した相手方の対象物の画像をディスプレイ装置に表示させながら、指示装置によって相手方の対象物を容易に差し示すことができ、話題の対象物を相手方に容易に理解させることができる。 The agent device, movable der Runode near the a camera capable of changing the angle of the optical axis and the object, by the party to remotely control the other party agent apparatus, the other party of the subject taken by the camera While the object image is displayed on the display device, the object of the other party can be easily indicated by the pointing device, and the other party can easily understand the topic object.

切り替えのための動作または操作として、音声による指示、接触センサによる指示、操作ボタンなどによる指示などを用いることが可能である。   As an operation or operation for switching, an instruction by voice, an instruction by a contact sensor, an instruction by an operation button, or the like can be used.

また、前記ディスプレイ装置および前記エージェント装置に、通話者が接触したことを検出する接触センサを設けておき、他の通話者が当該他の通話者の側の前記ディスプレイ装置に接触したときには前記エージェント装置のスピーカから音声が出力され、他の通話者が当該他の通話者の側の前記エージェント装置に接触したときには前記ディスプレイ装置のスピーカから音声が出力されるように構成してもよい。   In addition, the display device and the agent device are provided with a contact sensor that detects that a caller has touched, and when another caller contacts the display device on the other caller side, the agent device. A voice may be output from the speaker of the display device, and a voice may be output from the speaker of the display device when another caller contacts the agent device on the other caller's side.

これによって、通話者は、ディスプレイ装置またはエージェント装置に接触することによって、自分の音声を出力する相手方のスピーカを切り替え、自分が話題としている対象物を相手方に分からせることが一層容易になる。   This makes it easier for the caller to switch the speaker of the other party that outputs his / her voice by touching the display device or the agent device, so that the other party knows the subject he / she is talking about.

本発明によると、テレビ電話システムを用いて会話を行うときに、今どれを話題の対象物としているのかを相手方により分かり易く示せるようになる。   According to the present invention, when a conversation is performed using a videophone system, it is possible to easily show which is the subject of interest now to the other party.

図1は本発明に係る一実施形態のテレビ電話システム1を示すブロック図、図2は携帯電話機11の構成の例を示すブロック図、図3はディスプレイ装置12の構成の例を示すブロック図、図4はエージェント装置13の構成の例を示すブロック図、図5はカメラ装置51の構成の例を示す図である。   1 is a block diagram showing a videophone system 1 according to an embodiment of the present invention, FIG. 2 is a block diagram showing an example of the configuration of a mobile phone 11, and FIG. 3 is a block diagram showing an example of the configuration of a display device 12. FIG. 4 is a block diagram showing an example of the configuration of the agent device 13, and FIG. 5 is a diagram showing an example of the configuration of the camera device 51.

図1に示すテレビ電話システム1は、2人の通話者A,Bの間で音声(Voice )および画像(Video )を用いて通信を行う場合の例を示す。   The videophone system 1 shown in FIG. 1 shows an example in which communication is performed between two callers A and B using voice (Voice) and images (Video).

図1において、テレビ電話システム1では、各通話者A,Bの近傍に、携帯電話機11a,11b、ディスプレイ装置(モニタ装置)12a,12b、エージェント装置13a,13bが設けられている。これらの機器は、各通話者A,Bの側において、ルータBSa,bを経由して相互に通信を行うことができる。また、各通話者A,Bは、これらの機器によって、IP網およびルータBSa,bを経由して、他の通話者B,Aとテレビ電話を行うことができる。通話者がさらに増える場合には、その通話者の近傍にこれら携帯電話機11、ディスプレイ装置12、エージェント装置13、およびルータBSと同じものを設ければよい。   In FIG. 1, in the videophone system 1, mobile phones 11a and 11b, display devices (monitor devices) 12a and 12b, and agent devices 13a and 13b are provided in the vicinity of the callers A and B. These devices can communicate with each other via the routers BSa and b on the side of the callers A and B. In addition, each of the callers A and B can make a videophone call with other callers B and A via the IP network and the routers BSa and b by using these devices. When the number of callers further increases, the same mobile phone 11, display device 12, agent device 13, and router BS may be provided in the vicinity of the callers.

なお、携帯電話機11a,11bは互いに同じ機能を有するものであり、本明細書においてはそれらのいずれかまたは両方を指して「携帯電話機11」と記載することがある。ディスプレイ装置12a,12b、エージェント装置13a,13bなどについても同様である。   Note that the mobile phones 11a and 11b have the same functions as each other, and in this specification, either or both of them may be referred to as “mobile phone 11”. The same applies to the display devices 12a and 12b and the agent devices 13a and 13b.

携帯電話機11は、通話者A,Bが携帯可能であり、種々の携帯電話事業者が提供する移動体通信システムを用いて相手方と電話やメールなどの通信を行うものである。また、携帯電話機11は、相手方との通信のみでなく、テレビ電話システム1における相手方の機器を遠隔操作することも可能である。   The mobile phone 11 can be carried by the callers A and B, and communicates with the other party using a mobile communication system provided by various mobile phone carriers. In addition, the mobile phone 11 can not only communicate with the other party, but also remotely operate the other party's device in the videophone system 1.

図2に示すように、携帯電話機11には、ボタン入力部およびジョイスティック入力部などからなる操作部31、スピーカやイヤホンジャックなどを含む音声出力部32、マイクなどを含む音声入力部33、ディスプレイ34、通信制御部35、記憶部36、および制御部30などが設けられている。このような携帯電話機11の構成それ自体については公知であるので、ここでは本実施形態に特徴的な構成および作用などについてのみ説明する。   As shown in FIG. 2, the cellular phone 11 includes an operation unit 31 including a button input unit and a joystick input unit, an audio output unit 32 including a speaker and an earphone jack, an audio input unit 33 including a microphone, and a display 34. A communication control unit 35, a storage unit 36, a control unit 30, and the like are provided. Since the configuration of the mobile phone 11 as such is well known, only the configuration and operation characteristic of this embodiment will be described here.

通信制御部35は、ディスプレイ装置12、エージェント装置13、またはルータBSなどを中継機として利用し、他の機器との無線による通信を制御する。   The communication control unit 35 uses the display device 12, the agent device 13, the router BS, or the like as a relay device, and controls wireless communication with other devices.

記憶部36には、アドレス情報記憶部36aが設けられている。アドレス情報記憶部36aには、送信先アドレス情報、受信アドレス情報、および制御アドレス情報などが格納される。また、送信先アドレス情報および受信アドレス情報として、画像、音声、遠隔制御、許可信号、および指定位置のそれぞれについての情報が格納される。制御アドレス情報として、エージェント接続、モニタ接続、および相手携帯装置接続のそれぞれについての情報が格納される。これらのうち、指定位置受信アドレス情報は、位置指定信号を受信するためのアドレス情報である。

記憶部36には、また、対象位置x比率座標、対象位置y比率座標が格納される。これらの情報は、エージェント装置13に備えられた指示装置62で指示を行う際の指定位置を示す座標情報である。
The storage unit 36 is provided with an address information storage unit 36a. The address information storage unit 36a stores transmission destination address information, reception address information, control address information, and the like. In addition, information about each of the image, sound, remote control, permission signal, and designated position is stored as transmission destination address information and reception address information. Information about each of agent connection, monitor connection, and partner mobile device connection is stored as control address information. Among these, designated position reception address information is address information for receiving a position designation signal.

The storage unit 36 also stores target position x ratio coordinates and target position y ratio coordinates. These pieces of information are coordinate information indicating a designated position when an instruction is issued by the instruction device 62 provided in the agent device 13.

記憶部36は、これらアドレス情報および座標情報の他、制御部30で実行するプログラムやプログラム処理に必要な情報が格納されている。   In addition to the address information and coordinate information, the storage unit 36 stores programs executed by the control unit 30 and information necessary for program processing.

制御部30は、記憶部36に格納されたプログラムなどを実行しまたは処理することにより、携帯電話機11の全体を制御する。   The control unit 30 controls the entire mobile phone 11 by executing or processing a program stored in the storage unit 36.

携帯電話機11を使用する通話者A,Bが操作部31を操作(アングル調整)することによって、相手方のエージェント装置13のアングル制御装置52を遠隔操作することができる。   When the callers A and B who use the mobile phone 11 operate the operation unit 31 (angle adjustment), the angle control device 52 of the partner agent device 13 can be remotely operated.

また、携帯電話機11を操作(引込操作、訪問操作、押戻操作、退去操作)することによって、当該通話者A,Bの声を、他の通話者B,Aの側の携帯電話機11a,11bのスピーカ、ディスプレイ装置12b,12aのスピーカ、またはエージェント装置13a,13bのスピーカのいずれかに選択的に切り替えて出力させることができる。その動作については後で説明する。   Further, by operating the cellular phone 11 (withdrawing operation, visiting operation, pushing back operation, leaving operation), the voices of the callers A and B can be transmitted to the cellular phones 11a and 11b on the other callers B and A side. Can be selectively switched to any one of the above speakers, the speakers of the display devices 12b and 12a, or the speakers of the agent devices 13a and 13b. The operation will be described later.

図3に示すように、ディスプレイ装置12には、LCDなどからなるビデオ表示部41、タッチパネル入力部41a、スピーカを含む音声出力部42、通信制御部43、記憶部44、接触センサSE2、操作入力部SN2、および制御部40などが設けられている。   As shown in FIG. 3, the display device 12 includes a video display unit 41 such as an LCD, a touch panel input unit 41a, an audio output unit 42 including a speaker, a communication control unit 43, a storage unit 44, a contact sensor SE2, and an operation input. The unit SN2, the control unit 40, and the like are provided.

ビデオ表示部41には、他の通話者から送信される画像が表示される。ビデオ表示部41には、タッチパネル入力部41aが一体的に設けられており、通話者は、ビデオ表示部41に表示された画像を見ながらタッチパネル入力部41aから入力を行うことができる。これにより、ビデオ表示部41に表示された画像に対して、特定の部位を容易に指定することができる。指定された位置は、例えば指定位置情報として出力される。   The video display unit 41 displays images transmitted from other callers. The video display unit 41 is integrally provided with a touch panel input unit 41 a, and a caller can input from the touch panel input unit 41 a while viewing an image displayed on the video display unit 41. Thereby, it is possible to easily specify a specific part for the image displayed on the video display unit 41. The designated position is output as designated position information, for example.

音声出力部42からは、当該ディスプレイ装置12が音声出力用として選択されている場合に、他の通話者から送信される音声が出力される。   The audio output unit 42 outputs audio transmitted from other callers when the display device 12 is selected for audio output.

通信制御部43は、携帯電話機11、エージェント装置13、またはルータBSなどを中継機として利用し、他の機器との無線による通信を制御する。   The communication control unit 43 uses the mobile phone 11, the agent device 13, or the router BS as a relay device, and controls wireless communication with other devices.

記憶部44には、アドレス情報記憶部44aが設けられており、携帯電話機11のアドレス情報記憶部36aと同様なアドレス情報が格納されている。また、アドレス情報の他、制御部40で実行するプログラムやプログラム処理に必要な情報が格納されている。   The storage unit 44 is provided with an address information storage unit 44 a and stores address information similar to the address information storage unit 36 a of the mobile phone 11. In addition to address information, a program executed by the control unit 40 and information necessary for program processing are stored.

接触センサSE2は、通話者がディスプレイ装置12に接触した場合にそれを検出する。つまり、通話者がディスプレイ装置12に接触した場合に、接触センサSE2から信号が出力され、それに応じて後で説明するような処理が行われる。   The contact sensor SE2 detects when a caller contacts the display device 12. That is, when the caller touches the display device 12, a signal is output from the contact sensor SE2, and processing described later is performed accordingly.

操作入力部SN2は、種々のボタン、キー、マウスなどであり、通話者の操作によって指令などを入力する。   The operation input unit SN2 includes various buttons, keys, a mouse, and the like, and inputs commands and the like by a caller's operation.

制御部40は、記憶部44に格納されたプログラムなどを実行しまたは処理することにより、ディスプレイ装置12の全体を制御する。   The control unit 40 controls the entire display device 12 by executing or processing a program stored in the storage unit 44.

図4に示すように、エージェント装置13には、カメラ装置51、アングル制御装置52、移動装置53、スピーカを含む音声出力部54、マイクを含む音声入力部55、音声認識部56、音声認識辞書部57、通信制御部58、記憶部59、および制御部50などが設けられている。   As shown in FIG. 4, the agent device 13 includes a camera device 51, an angle control device 52, a moving device 53, a voice output unit 54 including a speaker, a voice input unit 55 including a microphone, a voice recognition unit 56, a voice recognition dictionary. A unit 57, a communication control unit 58, a storage unit 59, a control unit 50, and the like are provided.

カメラ装置51には、他の通話者に送信するための画像を撮影するカメラ61、および近傍にある対象物JTを指し示すための指示装置62が設けられている。   The camera device 51 is provided with a camera 61 that captures an image for transmission to another caller, and an instruction device 62 for pointing to a target object JT in the vicinity.

つまり、図5に示すように、カメラ装置51は、カメラ61および指示装置62が一体になって構成されている。カメラ61は、レンズ63、CCD64、およびフォーカス制御部65などからなる。対象物JTの像が、レンズ63を介してCCD64上に結像する。フォーカス制御部65は、対象物JTの距離に応じてレンズ63を光軸方向に移動させて焦点を合わせる。   That is, as shown in FIG. 5, the camera device 51 is configured by integrating a camera 61 and an instruction device 62. The camera 61 includes a lens 63, a CCD 64, a focus control unit 65, and the like. An image of the object JT is formed on the CCD 64 via the lens 63. The focus control unit 65 moves the lens 63 in the optical axis direction according to the distance of the target object JT to focus.

指示装置62は、プロジェクタ67および平面板ガラス68などからなる。プロジェクタ67の発光面は、CCD64の受光面に対し、平面板ガラス68を対称面として鏡像の位置関係に配置されており、プロジェクタ67の発光面上の任意の位置を発光させることができる。プロジェクタ67から射出された光スポットは、平面板ガラス68で反射し、レンズ63を通過して対象物JTの表面の一点を照射する。これによって、CCD64による対象物JTの撮影と同期して、対象物JT上の位置を指し示すことができる。なお、平面板ガラス68は、プロジェクタ67から照射された光は反射するが、レンズ63から入射した光は透過してCCD64上に結像する。   The pointing device 62 includes a projector 67 and a flat plate glass 68. The light emitting surface of the projector 67 is arranged in a mirror image positional relationship with respect to the light receiving surface of the CCD 64 with the flat plate glass 68 as a symmetrical surface, and can emit light at an arbitrary position on the light emitting surface of the projector 67. The light spot emitted from the projector 67 is reflected by the flat plate glass 68, passes through the lens 63, and irradiates one point on the surface of the object JT. Thereby, the position on the object JT can be pointed in synchronization with the photographing of the object JT by the CCD 64. The flat plate glass 68 reflects the light emitted from the projector 67 but transmits the light incident from the lens 63 and forms an image on the CCD 64.

例えば、図5に示すように、CCD64の受光面64Sに対象物JTの像FQ1が結像しているとすると、それと相似の関係にあるプロジェクタ67の発光面67Sにも、それに対応する像FQ2が仮想的に存在する。そこで、発光面67Sの像FQ2の1つの点PT1を指定して発光させると、その光スポットは、対象物JT上の1つの点PT2を照射する。   For example, as shown in FIG. 5, if an image FQ1 of the object JT is formed on the light receiving surface 64S of the CCD 64, the image FQ2 corresponding to the light emitting surface 67S of the projector 67 having a similar relationship therewith is also displayed. Exists virtually. Therefore, when one point PT1 of the image FQ2 on the light emitting surface 67S is designated and emitted, the light spot irradiates one point PT2 on the object JT.

したがって、例えば、CCD64で撮影した像FQ1を、タッチパネルの設けられた表示画面HGで表示し、その像FQ1上の特定の点PT1をタッチパネルで指定し、指定した点PT1に対応した位置からプロジェクタ67が光スポットを照射するように構成しておくことにより、対象物JT上の点PT2を光スポットによって指し示すことができる。対象物JTから離れた相手方の通話者の側に、このような表示画面HGを備えたエージェント装置13を配置しておけばよい。   Therefore, for example, the image FQ1 photographed by the CCD 64 is displayed on the display screen HG provided with the touch panel, a specific point PT1 on the image FQ1 is designated by the touch panel, and the projector 67 is selected from the position corresponding to the designated point PT1. Is configured to irradiate the light spot, the point PT2 on the object JT can be indicated by the light spot. The agent device 13 having such a display screen HG may be arranged on the side of the other party who is away from the object JT.

なお、プロジェクタ67に代えて、平面上を移動可能な点光源、例えばLED、レーザダイオードなどを設けてもよい。   Instead of the projector 67, a point light source that can move on a plane, such as an LED or a laser diode, may be provided.

図4に戻って、アングル制御装置52は、カメラ装置51を支持するとともに、その光軸の角度を垂直および水平方向に変更し調整する。移動装置53は、エージェント装置13の全体を移動させて位置を変更する。これらにより、任意の位置にある対象物JTに対して、エージェント装置13がその近傍に移動し、カメラ装置51を対象物JTの方向に向け、カメラ61によって対象物JTの撮影を行い、指示装置62によって対象物JT上に光スポットを照射して位置を差し示すことができる。   Returning to FIG. 4, the angle control device 52 supports the camera device 51 and changes and adjusts the angle of the optical axis in the vertical and horizontal directions. The moving device 53 changes the position by moving the entire agent device 13. As a result, the agent device 13 moves to the vicinity of the target object JT at an arbitrary position, directs the camera device 51 in the direction of the target object JT, images the target object JT with the camera 61, and indicates the pointing device. The position can be indicated by irradiating a light spot on the object JT by 62.

音声出力部54からは、当該エージェント装置13が音声出力用として選択されている場合に、他の通話者から送信される音声が出力される。   The voice output unit 54 outputs a voice transmitted from another caller when the agent device 13 is selected for voice output.

なお、上に述べたように、音声出力部32,42,54は、いずれもスピーカを含むものであり、現実にはスピーカから音声が出力されるので、これらを、「スピーカ32」「スピーカ42」「スピーカ54」と記載することがある。なお、スピーカには、その原理、構造、形状がどのようなものであれ、音声を出力する全ての機器が含まれる。同様に、マイクには、音声を入力する全ての機器が含まれる。   Note that, as described above, each of the audio output units 32, 42, and 54 includes a speaker, and since audio is actually output from the speaker, these are output as “speaker 32” and “speaker 42”. "Speaker 54". Note that the speaker includes all devices that output sound regardless of the principle, structure, or shape. Similarly, the microphone includes all devices that input audio.

音声入力部55は、マイクから通話者の音声などを入力する。音声認識部56は、音声入力部55から入力された音声のなかで、音声認識辞書部57に登録された「ことば」を検知して音声認識を行う。   The voice input unit 55 inputs a caller's voice and the like from a microphone. The voice recognition unit 56 detects the “word” registered in the voice recognition dictionary unit 57 from the voices input from the voice input unit 55 and performs voice recognition.

通信制御部58は、携帯電話機11、ディスプレイ装置12、またはルータBSなどを中継機として利用し、他の機器との無線による通信を制御する。   The communication control unit 58 uses the mobile phone 11, the display device 12, or the router BS as a relay device, and controls wireless communication with other devices.

記憶部59には、アドレス情報記憶部59aが設けられており、携帯電話機11のアドレス情報記憶部36aと同様なアドレス情報が格納されている。また、アドレス情報の他、制御部50で実行するプログラムやプログラム処理に必要な情報が格納されている。   The storage unit 59 is provided with an address information storage unit 59a, and stores address information similar to the address information storage unit 36a of the mobile phone 11. In addition to the address information, a program executed by the control unit 50 and information necessary for program processing are stored.

接触センサSE3は、通話者がエージェント装置13に接触した場合にそれを検出する。つまり、通話者がエージェント装置13に接触した場合に、接触センサSE3から信号が出力され、それに応じて後で説明するような処理が行われる。   The contact sensor SE3 detects when the caller contacts the agent device 13. That is, when the caller contacts the agent device 13, a signal is output from the contact sensor SE3, and processing described later is performed accordingly.

操作入力部SN3は、種々のボタン、キー、タッチパネルなどであり、通話者の操作によって指令などを入力する。   The operation input unit SN3 is various buttons, keys, a touch panel, and the like, and inputs a command and the like by a caller's operation.

制御部50は、記憶部59に格納されたプログラムなどを実行しまたは処理することにより、エージェント装置13の全体を制御する。   The control unit 50 controls the entire agent device 13 by executing or processing a program stored in the storage unit 59.

このように構成されたエージェント装置13は、一種のロボットまたはラジコンカーであるということができ、他の通話者の側のディスプレイ装置12によって遠隔操作され、対象物JTその他の画像や通話者の音声などを取得して他の通話者に提示する。   The agent device 13 configured in this way can be said to be a kind of robot or radio controlled car, and is remotely operated by the display device 12 on the other party's side, and the object JT or other images or the voice of the party's call. Etc. and present it to other parties.

例えば、ディスプレイ装置12の表示画面HG上に相手方の対象物JTの画像を表示させておき、当該通話者が画面HG上で対象物JT上の特定の位置を指で押して指示する。すると、その位置を示す信号がその対象物JTの存在する相手方のエージェント装置13に送信され、その位置が相手方のエージェント装置13によって差し示される。   For example, an image of the other party's target object JT is displayed on the display screen HG of the display device 12, and the caller gives an instruction by pressing a specific position on the target object JT with the finger on the screen HG. Then, a signal indicating the position is transmitted to the partner agent apparatus 13 where the target object JT exists, and the position is indicated by the partner agent apparatus 13.

また、表示画面HG上において、当該通話者が任意の位置を指で押して指示する。すると、相手方のエージェント装置13は、差し示された対象物JT上の位置がカメラ装置51の光軸上となるように、移動装置53によって移動し、アングル制御装置52によってカメラ装置51の角度方向を制御する。   On the display screen HG, the caller gives an instruction by pressing an arbitrary position with a finger. Then, the partner agent device 13 is moved by the moving device 53 so that the position on the indicated object JT is on the optical axis of the camera device 51, and the angle direction of the camera device 51 by the angle control device 52. To control.

また、エージェント装置13は、音声入力部55によって音を感知した場合に、カメラ装置51をその音の方向へ向ける。また、通話者の音声によってエージェント装置13を制御することもできる。例えば、通話者が「とまれ」と言った場合に、エージェント装置13がそれを音声認識して「制止」の命令であると認識し、他の通話者による遠隔操作を制止する。また、携帯電話機11の操作によって、エージェント装置13に対する他の通話者からの遠隔操作を許容するように制御することもできる。   Further, when the agent device 13 senses sound by the voice input unit 55, the agent device 13 turns the camera device 51 in the direction of the sound. The agent device 13 can also be controlled by the voice of the caller. For example, when the caller says “Tarely”, the agent device 13 recognizes the voice and recognizes it as a “stop” command, and stops remote operation by other callers. Further, it is possible to control the remote operation of the agent device 13 from another caller by operating the mobile phone 11.

さて、本実施形態のテレビ電話システム1では、通話者の発する声を、通信の相手方の複数のスピーカのうちのいずれかを指定して出力させることができる。つまり、テレビ電話システム1で2人の通話者A,Bが通信を行っている間において、各通話者A,Bは、自分の音声を相手側で出力するスピーカとして、相手側にあるディスプレイ装置12のスピーカ42またはエージェント装置13のスピーカ54のどちらかを指定することができる。換言すれば、通話者A,Bの動作または操作によって、相手方のスピーカ42,54を切り替えることができる。   Now, in the videophone system 1 of the present embodiment, the voice uttered by the caller can be output by designating any one of a plurality of speakers of the communication partner. That is, while the two callers A and B are communicating with each other in the videophone system 1, each caller A and B uses the display device on the other side as a speaker that outputs their voice on the other side. Either 12 speakers 42 or the speaker 54 of the agent device 13 can be designated. In other words, the other party's speakers 42 and 54 can be switched by the operation or operation of the callers A and B.

切り替えのための動作または操作として、音声による指示、接触センサSEによる指示、操作ボタンなどによる指示などがある。音声による指示では、通話者A,Bが特定の語句を発したときに、エージェント装置13が音声認識によってそれをスピーカの切り替えの命令であると認識し、通信の相手方のスピーカを順次切り替えるか、または指定されたスピーカから出力されるように切り替える。   As an operation or operation for switching, there are an instruction by voice, an instruction by the contact sensor SE, an instruction by an operation button, and the like. In the voice instruction, when the callers A and B utter a specific word, the agent device 13 recognizes it as a speaker switching command by voice recognition and sequentially switches the speaker of the communication partner. Or switch to output from the specified speaker.

そのような特定の語句として、例えば、「切り替え」「ディスプレイ」「エージェント」「それ」「これ」「そちら」「こちら」「あなたの」「わたしの」などを用いればよい。   As such specific phrases, for example, “switch”, “display”, “agent”, “it”, “this”, “this”, “here”, “your”, “my”, etc. may be used.

その場合に、それぞれの語句を特定のスピーカと予め対応付けておき、その語句を認識したときに対応付けられたスピーカから音声が出力されるように切り替えるようにしてもよい。   In that case, each phrase may be associated with a specific speaker in advance, and switching may be performed so that sound is output from the associated speaker when the phrase is recognized.

接触センサSE2による指示では、通話者がディスプレイ装置12またはエージェント装置13のいずれかに接触することにより、接触センサSE2,3がそれを検出して信号を出し、通信の相手方のスピーカをいずれかのスピーカに切り替える。つまり、例えば、通話者が当該通話者の側のディスプレイ装置12に接触したときには、相手方のエージェント装置13のスピーカ54から音声が出力され、エージェント装置13に接触したときには、相手方のディスプレイ装置12のスピーカ42から音声が出力されるよう、それぞれ切り替える。   In the instruction by the contact sensor SE2, when the caller contacts either the display device 12 or the agent device 13, the contact sensors SE2 and 3 detect it and output a signal, and the speaker of the other party of communication is Switch to speaker. That is, for example, when a caller touches the display device 12 on the side of the caller, sound is output from the speaker 54 of the partner agent device 13, and when the caller contacts the agent device 13, the speaker of the display device 12 of the other party Each is switched so that sound is output from 42.

また、接触センサSEは、通話者が接触したことを検出するだけでなく、ディスプレイ装置12またはエージェント装置13を通話者が床面から持ち上げたことをも検出する。例えば、通話者がエージェント装置13を持ち上げた場合には、それを接触センサSE3が検出し、相手方における音声の出力をディスプレイ装置12のスピーカ42に切り替える。   Further, the contact sensor SE not only detects that the caller has touched, but also detects that the caller has lifted the display device 12 or the agent device 13 from the floor surface. For example, when the caller lifts the agent device 13, the contact sensor SE <b> 3 detects this and switches the voice output at the other party to the speaker 42 of the display device 12.

なお、持ち上げたことの検出に当たって、例えば、接触センサSEによって接触が検出されたとき、またはその状態が所定時間持続したときに、持ち上げたと判断することでもよい。   In detecting the lift, for example, when the contact is detected by the contact sensor SE or when the state has been maintained for a predetermined time, it may be determined that the lift has been made.

操作ボタンなどによる指示では、通話者が操作入力部SN2,3を操作して切り替えの指令を入力することにより、相手方のスピーカが切り替えられる。   In the instruction by the operation button or the like, the other party's speaker is switched when the caller operates the operation input sections SN2 and SN3 and inputs a switching command.

このように、相手方のスピーカを切り替えることによって、音声が出力される位置や音質などが変化することから、相手方は、話題の対象物JTが変化したことを認識することができ、これとともに音声の内容、例えば「あれ」「これ」などの語句の意味とを総合することによって、今どれを話題の対象物としているのかがより一層分かり易くなる。   In this way, by switching the other party's speaker, the position where the sound is output, the sound quality, and the like change, so that the other party can recognize that the topical object JT has changed, and with this, By combining the contents, for example, the meanings of phrases such as “that” and “this”, it becomes easier to understand which is the subject of the topic now.

また、エージェント装置13は移動可能であり、かつ対象物JTおよび対象物JT上の位置を差し示すことができるから、通話者が相手方のエージェント装置13を遠隔操作することにより、話題の対象物JTを相手方に容易に理解させることができる。   Further, since the agent device 13 is movable and can indicate the target object JT and the position on the target object JT, when the caller remotely operates the partner agent device 13, the topic target object JT. Can be easily understood by the other party.

例えば、通話者Bが、「これ」と言って対象物JTを指し示す場合には、通話者Bは、ディスプレイ装置12bを利用して相手方のエージェント装置13aを制御し、通話者Aに「これ」の対象物JTを指し示す。通話者Aは、通話者Bが話題の対象としたいものが何であるかを「これ」という語句とエージェント装置13aの動作により理解することができる。   For example, when the caller B says “this” and points to the target object JT, the caller B uses the display device 12b to control the partner agent device 13a and asks the caller A “this”. Indicates the target object JT. The caller A can understand what the caller B wants to talk about by the phrase “this” and the operation of the agent device 13a.

また、通話者Aが、「これ」と言って対象物JTを差し示す場合には、通話者Aは、ディスプレイ装置12aを利用して相手方のエージェント装置13bを制御し、通話者Aが指し示したものをエージェント装置13aの視界に入れる。通話者Bは、ディスプレイ装置12bを通して、話題の対象が何であるかを理解することができる。   When the caller A says “this” and points to the object JT, the caller A uses the display device 12a to control the partner agent device 13b, and the caller A points to it. Things are put into the field of view of the agent device 13a. The caller B can understand what the subject of the topic is through the display device 12b.

上に述べたように、テレビ電話システム1では、話題の対象を指示するために、通話者の近辺の複数の異なる位置にそれぞれスピーカを配置しておき、他の通話者の動作または操作によって、複数のスピーカのいずれかに切り替えて当該他の通話者の音声を出力する。   As described above, in the videophone system 1, in order to indicate the subject of the topic, speakers are arranged at a plurality of different positions in the vicinity of the caller, and by the operation or operation of other callers, The voice of the other party is output by switching to one of the plurality of speakers.

このように、テレビ電話システム1によると、通話者A,Bのいずれもが、話題の対象物JTから視点をそらすことなく、会話を進めることが可能となる。対象物JTの名称が不明な場合であっても、対象物JTが何であるかを容易に理解させることができる。   Thus, according to the videophone system 1, it is possible for both of the callers A and B to advance the conversation without diverting the viewpoint from the topic target object JT. Even if the name of the target object JT is unknown, it is possible to easily understand what the target object JT is.

テレビ電話システム1は、さらに次に述べる動作を行うことができる。   The videophone system 1 can further perform the following operations.

すなわち、相手方のスピーカを、ディスプレイ装置12とエージェント装置13とで切り替えるのみでなく、これに携帯電話機11のスピーカを含めた3者のうちから選択して切り替えることができる。このように、3つの異なった位置にあるスピーカを切り替えることにより、通話者の意識の変遷を相手方に知らせ、話題の対象物JTが何であるかを一層分かり易くすることができる。   That is, not only can the speaker of the other party be switched between the display device 12 and the agent device 13, but it can also be selected and switched from among three parties including the speaker of the mobile phone 11. In this way, by switching the speakers at three different positions, it is possible to inform the other party of the change in the consciousness of the caller and to make it easier to understand what the topical object JT is.

また、話題の対象が具体的な物ではなく、抽象的なもののように仮想の共有空間である場合に、特定の機器のスピーカから音声が出力された場合にそのような仮想の共有空間が対象であることとして相手方に知らせることができる。   Also, if the topic is not a concrete object but a virtual shared space such as an abstract one, such a virtual shared space is targeted when sound is output from the speaker of a specific device. The other party can be informed that this is the case.

例えば、話題の対象が相手方である通話者Bの近傍にあるときには、相手方のエージェント装置13bから音声を出力し、話題の対象が本人である通話者Aの近傍にあるときは、相手方のディスプレイ装置12bから音声を出力し、話題の対象が仮想の共有空間であるときには、相手方の携帯電話機11bから音声を出力する。   For example, when the topic target is in the vicinity of the caller B who is the other party, a voice is output from the other party's agent device 13b, and when the topic target is in the vicinity of the caller A who is the other party, the display apparatus of the other party Audio is output from 12b, and audio is output from the other party's mobile phone 11b when the subject of interest is a virtual shared space.

また、通話者の動作または操作によって、音声を出力する相手方のスピーカがエージェント装置13からディスプレイ装置12に切り替えられたときに、そのエージェント装置13の指示装置62の処理動作が中断するようにしてもよい。例えば、エージェント装置13は、指示装置62が切り替え前まで差し示していた状態を維持したり、プロジェクタ67を消灯して指示装置62による指示を行わないようにする。これによって、相手方は、話題の対象物JTが他に移ったことをより一層認識し易くなる。   Further, when the speaker of the other party that outputs the sound is switched from the agent device 13 to the display device 12 by the caller's operation or operation, the processing operation of the instruction device 62 of the agent device 13 is interrupted. Good. For example, the agent device 13 maintains the state indicated by the instruction device 62 before switching, or turns off the projector 67 so that the instruction device 62 does not give an instruction. This makes it easier for the other party to recognize that the topical object JT has moved to another.

また、同じく、音声を出力する相手方のスピーカがエージェント装置13からディスプレイ装置12に切り替えられたときに、そのエージェント装置13の指示装置62がディスプレイ装置12を指示するようにしてもよい。   Similarly, the instruction device 62 of the agent device 13 may instruct the display device 12 when the speaker of the other party outputting the sound is switched from the agent device 13 to the display device 12.

また、通話者の動作または操作によって、音声を出力する相手方のスピーカがディスプレイ装置12からエージェント装置13に切り替えられたときに、当該ディスプレイ装置12によって、エージェント装置13の側に切り替えられた旨を示すメッセージを表示する。メッセージとして、例えば「エージェントの方に話題が移りました」「エージェントの方を見てください」などとすればよい。これによって、それまでディスプレイ装置12を見ていた通話者は、対象物JTが他に移ったことをより明確に知ることができる。   In addition, when the speaker of the other party that outputs the sound is switched from the display device 12 to the agent device 13 by the operation or operation of the caller, the display device 12 is switched to the agent device 13 side. Display a message. The message may be, for example, “The topic has moved to the agent” or “Look at the agent”. Thus, the caller who has been watching the display device 12 until then can know more clearly that the object JT has moved to another.

また、通話者が、携帯電話機11に向かって話すかまたはディスプレイ装置12に向かって話すかによって、その音声が相手方で出力される機器を切り替えてもよい。例えば、通話者が携帯電話機11に向かって話した場合に、相手方のディスプレイ装置12のスピーカ42からその音声が出力され、ディスプレイ装置12に向かって話した場合に、相手方のエージェント装置13のスピーカ54からその音声が出力されるようにする。また、通話者が携帯電話機11に向かって話している場合に、携帯電話機11の操作部31を操作することによって、それらのスピーカ42,54を切り替えてもよい。   Further, the device to which the voice is output by the other party may be switched depending on whether the caller speaks to the mobile phone 11 or the display device 12. For example, when a caller speaks to the mobile phone 11, the sound is output from the speaker 42 of the other party's display device 12, and when the speaker speaks to the display device 12, the speaker 54 of the other party's agent device 13. So that the sound is output. Further, when the caller is talking toward the mobile phone 11, the speakers 42 and 54 may be switched by operating the operation unit 31 of the mobile phone 11.

また、通話者のいずれかの側においてスピーカが切り替えられたときに、切り替え元のスピーカ、または切り替え後のスピーカから、切り替えを示すためのビープ音を出力するようにしてもよい。   Further, when the speaker is switched on either side of the caller, a beep sound for indicating switching may be output from the switching source speaker or the switched speaker.

次に、テレビ電話システム1における通話に関する種々のシーケンスの例について説明する。   Next, examples of various sequences relating to a call in the videophone system 1 will be described.

図6は通話開始シーケンスの例を示す図である。   FIG. 6 is a diagram showing an example of a call start sequence.

図6においては、通話者Aから通話者Bにテレビ電話をかける例が示されている。まず、通話者Aが携帯電話機11aの発呼操作を行う。携帯電話機11aは、ディスプレイ装置12aに接続要求を送り、接続応答を待つ。ディスプレイ装置12aからの接続応答を受けると、エージェント装置13aに接続要求を送り、接続応答を待つ。   FIG. 6 shows an example of making a videophone call from the caller A to the caller B. First, the caller A performs a call operation on the mobile phone 11a. The cellular phone 11a sends a connection request to the display device 12a and waits for a connection response. When a connection response is received from the display device 12a, a connection request is sent to the agent device 13a and a connection response is awaited.

携帯電話機11aは、エージェント装置13aからの接続応答を受けると、相手方の携帯電話機11bにSetup信号を送る。   When the mobile phone 11a receives a connection response from the agent device 13a, the mobile phone 11a sends a Setup signal to the other party's mobile phone 11b.

携帯電話機11bは、Setup信号を受けると、ディスプレイ装置12bに接続要求を送り、接続応答を待つ。ディスプレイ装置12bからの接続応答を受けると、エージェント装置13bに接続要求を送り、接続応答を待つ。   Upon receiving the Setup signal, the mobile phone 11b sends a connection request to the display device 12b and waits for a connection response. When a connection response is received from the display device 12b, a connection request is sent to the agent device 13b and a connection response is awaited.

携帯電話機11bは、エージェント装置13bからの接続応答を受けると、携帯電話機11aにAlerting信号を送る。また、携帯電話機11bは鳴動を開始し、通話者Bに着信を知らせる。   When receiving the connection response from the agent device 13b, the mobile phone 11b sends an Alerting signal to the mobile phone 11a. In addition, the mobile phone 11b starts ringing and notifies the caller B of the incoming call.

携帯電話機11aは、携帯電話機11bからAlerting信号を受けると、RBT(リングバックトーン)により、通話者Bを呼び出し中であることを通話者Aに知らせる。   When receiving the Alerting signal from the mobile phone 11b, the mobile phone 11a notifies the caller A that the caller B is being called by RBT (ringback tone).

通話者Bが携帯電話機11bの応答操作を行うと、携帯電話機11bは携帯電話機11aにConnect信号を送る。携帯電話機11aはConnect信号を受けると、通話者A,Bの間でテレビ電話により通話可能な状態となる。   When the caller B performs a response operation on the mobile phone 11b, the mobile phone 11b sends a Connect signal to the mobile phone 11a. When the cellular phone 11a receives the Connect signal, the cellular phone 11a is in a state in which a telephone call can be made between the callers A and B by a videophone.

図7は話題の対象指示シーケンスの例を示す図である。   FIG. 7 is a diagram showing an example of a topic target instruction sequence.

図7には、通話者Aの近傍にある対象物JTを通話者Bが「これ」と言って指し示す場合が示されている。通話者A,Bの間で音声および画像を互いに通信している状態において、通話者Bが携帯電話機11bを操作してアングル調整操作を行うと、携帯電話機11bは、携帯電話機11aを経由してエージェント装置13aに首方向調整信号を送る。首方向調整信号には、指定位置情報、例えば、xy座標面における照射先のxy座標、またはx軸からの回転角度などの情報を含めることができる。エージェント装置13aは、首方向調整信号を受けると、そのアングル制御装置52を制御し、それに応じてカメラ装置51の向きを変える。   FIG. 7 shows a case where the caller B points to the object JT near the caller A by saying “this”. When the caller B operates the mobile phone 11b and performs an angle adjustment operation in a state in which voice and image are communicated between the callers A and B, the mobile phone 11b passes through the mobile phone 11a. A neck direction adjustment signal is sent to the agent device 13a. The neck direction adjustment signal can include specified position information, for example, information such as the xy coordinates of the irradiation destination on the xy coordinate plane or the rotation angle from the x axis. Upon receiving the neck direction adjustment signal, the agent device 13a controls the angle control device 52 and changes the orientation of the camera device 51 accordingly.

これにより、通話者Bは、話題の対象物の中心となる画像がディスプレイ装置12bに映るように調整することができる。そして、通話者Bが携帯電話機11bに作動指示操作を行うと、携帯電話機11bは、携帯電話機11aを経由して、エージェント装置13aに作動指示を送る。エージェント装置13aは、作動指示を受けると、エージェント装置13aの指示装置62のプロジェクタ67を点灯する。   As a result, the caller B can make adjustments so that the image that is the center of the subject of interest is displayed on the display device 12b. When the caller B performs an operation instruction operation on the mobile phone 11b, the mobile phone 11b sends an operation instruction to the agent device 13a via the mobile phone 11a. When receiving the operation instruction, the agent device 13a turns on the projector 67 of the instruction device 62 of the agent device 13a.

これにより、通話者Aは、通話者Bが話題の対象物としたいものを「これ」という語句とともに明確に知ることができる。   Thereby, the caller A can clearly know what the caller B wants to be the subject of the topic together with the phrase “this”.

図8は話題空間の切り替えシーケンスの例を示す図である。   FIG. 8 is a diagram illustrating an example of a topic space switching sequence.

図8には、通話者Aの意思により、仮想共有空間から通話者Aのいる実空間へ話題を転換しようとする場合の例が示されている。   FIG. 8 shows an example in which the topic is changed from the virtual shared space to the real space where the caller A is present by the intention of the caller A.

通話者Aが携帯電話機11aの引込操作を行うと、携帯電話機11aは、携帯電話機11aの音声入力部33から入力された音声信号の送信先を携帯電話機11bからディスプレイ装置12bに切り替える。これにより、通話者Aは、通話者Bの意識を、通話者Aの側の画像を表示しているディスプレイ装置12bに向けさせることができる。   When the caller A performs the pull-in operation of the mobile phone 11a, the mobile phone 11a switches the transmission destination of the audio signal input from the audio input unit 33 of the mobile phone 11a from the mobile phone 11b to the display device 12b. Thereby, the caller A can make the caller B's consciousness turn to the display device 12b displaying the image of the caller A.

同様に、通話者Bの側においても、携帯電話機11bの引込操作を行って同様な切り替えを行うことができる。   Similarly, on the side of the caller B, the same switching can be performed by performing the pull-in operation of the mobile phone 11b.

図9は話題空間の切り替えシーケンスの他の例を示す図である。   FIG. 9 is a diagram showing another example of the topic space switching sequence.

図9には、通話者Bの意思により、仮想共有空間から通話者Aのいる実空間へ話題を転換しようとする場合の例が示されている。   FIG. 9 shows an example in which the topic is changed from the virtual shared space to the real space where the caller A is present by the intention of the caller B.

通話者Bが携帯電話機11bの訪問操作を行うと、携帯電話機11bは、携帯電話機11bの音声入力部33から入力された音声信号の送信先を携帯電話機11aからエージェント装置13aに切り替える。これにより、通話者Bは、通話者Aの意識を、エージェント装置13aに向けさせることができる。   When the caller B visits the mobile phone 11b, the mobile phone 11b switches the destination of the audio signal input from the audio input unit 33 of the mobile phone 11b from the mobile phone 11a to the agent device 13a. Accordingly, the caller B can make the caller A aware of the agent device 13a.

図10は話題空間の切り替えシーケンスの他の例を示す図である。   FIG. 10 is a diagram showing another example of the topic space switching sequence.

図10には、通話者Aの意思により、通話者Aのいる実空間から仮想共有空間へ話題を転換しようとする場合の例が示されている。   FIG. 10 shows an example in which the topic is changed from the real space where the caller A is present to the virtual shared space by the intention of the caller A.

通話者Aが携帯電話機11aの押戻操作を行うと、携帯電話機11aは、携帯電話機11aの音声入力部33から入力された音声信号の送信先をディスプレイ装置12bから携帯電話機11bに切り替える。これにより、通話者Aは、通話者Bの意識を、ディスプレイ装置12bから離して携帯電話機11bに向けさせることができる。   When the caller A pushes back the mobile phone 11a, the mobile phone 11a switches the transmission destination of the audio signal input from the audio input unit 33 of the mobile phone 11a from the display device 12b to the mobile phone 11b. Thereby, the caller A can make the caller B's consciousness turn away from the display device 12b and be directed to the mobile phone 11b.

図11は話題空間の切り替えシーケンスの他の例を示す図である。   FIG. 11 is a diagram showing another example of the topic space switching sequence.

図11には、通話者Bの意思により、通話者Aのいる実空間から仮想共有空間へ話題を転換しようとする場合の例が示されている。   FIG. 11 shows an example in which the topic is changed from the real space where the caller A is present to the virtual shared space by the intention of the caller B.

通話者Bが携帯電話機11bの退去操作を行うと、携帯電話機11bは、携帯電話機11bの音声入力部33から入力された音声信号の送信先をエージェント装置13aから携帯電話機11aに切り替える。これにより、通話者Bは、通話者Aの意識を、エージェント装置13aから離して携帯電話機11aに向けさせることができる。   When the caller B performs the leaving operation of the mobile phone 11b, the mobile phone 11b switches the transmission destination of the audio signal input from the audio input unit 33 of the mobile phone 11b from the agent device 13a to the mobile phone 11a. Thereby, the caller B can make the caller A's consciousness away from the agent device 13a and direct it toward the mobile phone 11a.

図12は近傍エージェントの制止シーケンスの例を示す図である。   FIG. 12 is a diagram illustrating an example of a stop sequence of neighboring agents.

図12には、通話者Bからの遠隔制御によるエージェント装置13aの動作に不具合がある場合に、通話者Aの意思によってエージェント装置13aの動作を制止する場合の例が示されている。   FIG. 12 shows an example in which the operation of the agent device 13a is stopped by the intention of the caller A when there is a malfunction in the operation of the agent device 13a by remote control from the caller B.

通話者Aがエージェント装置13aに制止を命令するための語句を言うと、エージェント装置13aは、ディスプレイ装置12bへの画像信号を停止し、携帯電話機11bからの遠隔制御信号を破棄する状態となる。   When the caller A says a phrase for instructing the agent device 13a to stop, the agent device 13a stops the image signal to the display device 12b and cancels the remote control signal from the mobile phone 11b.

図13は近傍エージェントの遠隔制御許可シーケンスの例を示す図である。   FIG. 13 is a diagram showing an example of the remote control permission sequence of the neighboring agent.

図13には、通話者Aが、通話者Bに対して遠隔制御を許可する場合の例が示されている。   FIG. 13 shows an example where the caller A permits the caller B to perform remote control.

通話者Aが携帯電話機11aの許可操作を行うと、携帯電話機11aは、許可信号をエージェント装置13aに送る。エージェント装置13aは、携帯電話機11aからの許可信号を受けると、ディスプレイ装置12bへの画像信号の送信を再開し、携帯電話機11bからの遠隔制御信号を処理可能とする状態となる。   When the caller A performs a permission operation on the mobile phone 11a, the mobile phone 11a sends a permission signal to the agent device 13a. When the agent device 13a receives the permission signal from the mobile phone 11a, the agent device 13a resumes the transmission of the image signal to the display device 12b and becomes ready to process the remote control signal from the mobile phone 11b.

図14は話題の対象指示シーケンスの他の例を示す図である。   FIG. 14 is a diagram showing another example of the topic target instruction sequence.

図14には、通話者Aの近傍にある対象物JTを通話者Bが「これ」と言って指し示す場合が示されている。   FIG. 14 shows a case where the caller B points to the object JT in the vicinity of the caller A by saying “this”.

通話者A,Bの間で音声および画像を互いに通信している状態において、通話者Bがディスプレイ装置12bのタッチパネル入力部41aによってタッチ操作を行うと、ディスプレイ装置12bは、タッチ操作によって得られた指定位置情報を携帯電話機11bへ送る。携帯電話機11bは、ディスプレイ装置12bからの指定位置情報を受けると、指定位置の座標を記憶する。通話者Bが携帯電話機11bを操作してアングル調整操作を行うと、携帯電話機11bは、携帯電話機11aを経由してエージェント装置13aに首方向調整信号を送る。エージェント装置13aは、首方向調整信号を受けると、そのアングル制御装置52を制御し、それに応じてカメラ装置51の向きを変える。   When the caller B performs a touch operation with the touch panel input unit 41a of the display device 12b in a state where voice and images are communicated with each other between the callers A and B, the display device 12b is obtained by the touch operation. The designated position information is sent to the mobile phone 11b. When receiving the designated position information from the display device 12b, the mobile phone 11b stores the coordinates of the designated position. When the caller B operates the mobile phone 11b to perform an angle adjustment operation, the mobile phone 11b sends a neck direction adjustment signal to the agent device 13a via the mobile phone 11a. Upon receiving the neck direction adjustment signal, the agent device 13a controls the angle control device 52 and changes the orientation of the camera device 51 accordingly.

さらに、通話者Bが携帯電話機11bに作動指示操作を行うと、携帯電話機11bは、携帯電話機11aを経由して、エージェント装置13aに作動指示を送る。エージェント装置13aは、作動指示を受けると、エージェント装置13aの指示装置62のプロジェクタ67を点灯する。   Further, when the caller B performs an operation instruction operation on the mobile phone 11b, the mobile phone 11b sends an operation instruction to the agent device 13a via the mobile phone 11a. When receiving the operation instruction, the agent device 13a turns on the projector 67 of the instruction device 62 of the agent device 13a.

図15は話題の対象指示シーケンスの他の例を示す図である。   FIG. 15 is a diagram showing another example of the topic target instruction sequence.

図15には、通話者Aの近傍にある対象物JTを通話者Bが「これ」と言って指し示す場合が示されている。   FIG. 15 shows a case where the caller B points to the object JT in the vicinity of the caller A by saying “this”.

通話者Bがディスプレイ装置12bのタッチパネル入力部41aによってタッチ操作を行うと、ディスプレイ装置12bは、タッチ操作によって得られた指定位置情報を携帯電話機11bへ送る。携帯電話機11bは、ディスプレイ装置12bからの指定位置情報を受けると、指定位置の座標を記憶する。通話者Bが携帯電話機11bを操作して作動指示操作を行うと、携帯電話機11bは、携帯電話機11aを経由してエージェント装置13aに作動指示を送る。エージェント装置13aは、作動指示を受けると、エージェント装置13aの指示装置62のプロジェクタ67を点灯する。   When the caller B performs a touch operation using the touch panel input unit 41a of the display device 12b, the display device 12b sends the specified position information obtained by the touch operation to the mobile phone 11b. When receiving the designated position information from the display device 12b, the mobile phone 11b stores the coordinates of the designated position. When the caller B operates the mobile phone 11b to perform an operation instruction operation, the mobile phone 11b sends an operation instruction to the agent device 13a via the mobile phone 11a. When receiving the operation instruction, the agent device 13a turns on the projector 67 of the instruction device 62 of the agent device 13a.

図16は話題空間の切り替えシーケンスの他の例を示す図である。   FIG. 16 is a diagram showing another example of the topic space switching sequence.

図16には、通話者Aの意思により、エージェント装置13aを持ち上げることにより、仮想共有空間から通話者Aのいる実空間へ話題を転換しようとする場合の例が示されている。   FIG. 16 shows an example in which the topic is changed from the virtual shared space to the real space where the caller A is located by lifting the agent device 13a with the intention of the caller A.

通話者Aがエージェント装置13aを持ち上げると、エージェント装置13aの接触センサSE3がそれを検出し、携帯電話機11aへ持ち上げ感知信号を送る。携帯電話機11aが持ち上げ感知信号を受信すると、携帯電話機11aは、携帯電話機11aの音声入力部33から入力した音声信号の送信先を携帯電話機11bからディスプレイ装置12bへ切り替える。   When the caller A lifts the agent device 13a, the contact sensor SE3 of the agent device 13a detects it and sends a lift detection signal to the mobile phone 11a. When the mobile phone 11a receives the lifting detection signal, the mobile phone 11a switches the transmission destination of the audio signal input from the audio input unit 33 of the mobile phone 11a from the mobile phone 11b to the display device 12b.

次に、テレビ電話システム1におけるスピーカの切り替え動作について、フローチャートを参照して説明する。   Next, a speaker switching operation in the videophone system 1 will be described with reference to a flowchart.

図17はテレビ電話システム1のスピーカの切り替え動作の概略を示すフローチャートである。   FIG. 17 is a flowchart showing an outline of the speaker switching operation of the videophone system 1.

図17において、通話者の間でテレビ電話による通信が行われている状態で(#11)、いずれかの通話者が切り替えのための操作を行うと(#12)、異なった位置にある複数のスピーカの中で切り替えられ(#13)、切り替えられたスピーカから相手方の音声が出力される。これによって、またこれと相手方の言う言葉とによって、相手方の話題の対象物JTが変更されたことが分かり易くなる。   In FIG. 17, in a state where videophone communication is performed between the callers (# 11), when any caller performs an operation for switching (# 12), a plurality of callers at different positions are displayed. The other party's voice is output from the switched speaker (# 13). This makes it easier to understand that the subject JT of the opponent's topic has been changed by this and the words the opponent says.

図18は通話者の接触によるスピーカの切り替え動作を示すフローチャートである。   FIG. 18 is a flowchart showing a speaker switching operation by contact of a caller.

図18において、テレビ電話による通信が行われている状態で(#21)、通話者がディスプレイ装置12に接触すると(#22)、相手方のエージェント装置13のスピーカから音声が出るように切り替えられ(#23)、相手方のディスプレイ装置12に、エージェント装置13の方に注目する旨のメッセージを表示する(#24)。通話者がエージェント装置13に接触すると(#25)、相手方のディスプレイ装置12のスピーカから音声が出るように切り替えられ(#26)、相手方のエージェント装置13は指示装置62による指示動作を中断する(#27)。   In FIG. 18, in a state in which videophone communication is performed (# 21), when a caller touches the display device 12 (# 22), switching is performed so that sound is output from the speaker of the partner agent device 13 ( # 23) A message to pay attention to the agent device 13 is displayed on the display device 12 of the other party (# 24). When the caller contacts the agent device 13 (# 25), switching is performed so that sound is output from the speaker of the other display device 12 (# 26), and the other agent device 13 interrupts the instruction operation by the instruction device 62 ( # 27).

なお、音声を出力するスピーカを切り替えるために、種々の構成を採用することができる。   It should be noted that various configurations can be employed to switch the speaker that outputs sound.

例えば、音声を携帯電話機11から送信する場合には、携帯電話機11からの音声の送信先アドレス情報を切り替え先の機器のアドレスに変更する。その場合に、ディスプレイ装置12の操作によって切り替え先が決定された場合には、切り替え先の機器のアドレスをディスプレイ装置12から携帯電話機11に送信する。また、エージェント装置13の操作によって切り替え先が決定された場合には、切り替え先の機器のアドレスをエージェント装置13から携帯電話機11に送信する。   For example, when transmitting voice from the mobile phone 11, the destination address information of the voice from the mobile phone 11 is changed to the address of the switching destination device. In this case, when the switching destination is determined by the operation of the display device 12, the address of the switching destination device is transmitted from the display device 12 to the mobile phone 11. When the switching destination is determined by operating the agent device 13, the address of the switching destination device is transmitted from the agent device 13 to the mobile phone 11.

また、例えば、音声をディスプレイ装置12から送信する場合には、ディスプレイ装置12からの音声の送信先アドレス情報を切り替え先の機器のアドレスに変更する。音声をエージェント装置13から送信する場合には、エージェント装置13からの音声の送信先アドレス情報を切り替え先の機器のアドレスに変更する。また、それらの情報をルータBSその他の装置を経由して配信するようにしてもよい。また、ルータBSを無線ルータとしてもよい。   Further, for example, when audio is transmitted from the display device 12, the audio transmission destination address information from the display device 12 is changed to the address of the switching destination device. When the voice is transmitted from the agent device 13, the voice destination address information from the agent device 13 is changed to the address of the switching destination device. Further, such information may be distributed via the router BS or other devices. The router BS may be a wireless router.

なお、スピーカの切り替え先をどこにするかという点については、話題の対象物JTが存在する位置に近いスピーカから音声が出力されるように切り替えると、相手方の意識が音声の出る方に向くため、対象物JTが変更されたこと、また、変更された対象物JTがどれであるかということが、一層分かり易い。その場合に、対象物JTとスピーカとの位置関係に応じて、通話者が「あれ」「これ」などの言葉を送ると、より一層対象物JTが分かり易い。   As for where to switch the speaker, because the other party's consciousness is suitable for the direction of the voice when switching so that the voice is output from the speaker close to the position where the topical object JT exists, It is easier to understand that the object JT has been changed and which object JT has been changed. In this case, if the caller sends a word such as “that” or “this” in accordance with the positional relationship between the target object JT and the speaker, the target object JT can be understood more easily.

また、ディスプレイ装置12およびエージェント装置13の2つのスピーカのみでなく、携帯電話機11のスピーカを含めた3つのスピーカから選択して切り替えることによって、より一層対象物JTを特定し易い。   Further, by selecting and switching from three speakers including the speaker of the mobile phone 11 as well as the two speakers of the display device 12 and the agent device 13, it is easier to specify the target JT.

また、ディスプレイ装置12やエージェント装置13には、それぞれ、スピーカが1つ設けられた例を説明したが、離れた位置に2つ以上のスピーカを設け、それらのスピーカを切り替えるようにしてもよい。これによって、音声の出る位置を対象物JTの位置に応じてきめ細かく切り替えることができ、より一層対象物JTを認識し易くなる。   Further, the display device 12 and the agent device 13 have been described with examples in which one speaker is provided. However, two or more speakers may be provided at different positions, and the speakers may be switched. As a result, the position where the sound comes out can be finely switched according to the position of the object JT, and the object JT can be recognized more easily.

以上、本実施形態のテレビ電話システム1の動作について説明したが、上に説明した種々の処理動作またはスピーカの切り替え方法を適宜組み合わせることにより、種々の状況において話題の対象物JTを通信の相手に分からせることが可能である。   The operation of the videophone system 1 according to the present embodiment has been described above. By appropriately combining the various processing operations described above or the speaker switching method, the subject JT that is a topic in various situations can be used as a communication partner. It is possible to understand.

上に述べた実施形態において、携帯装置として携帯電話機11を例にとって説明したが、携帯電話機11以外の種々の携帯装置を用いることが可能である。ディスプレイ装置12にマイクを設けてもよい。   In the above-described embodiment, the mobile phone 11 has been described as an example of the mobile device, but various mobile devices other than the mobile phone 11 can be used. The display device 12 may be provided with a microphone.

その他、携帯電話機11、ディスプレイ装置12、エージェント装置13、カメラ装置51、指示装置62、またはテレビ電話システム1の全体または各部の構成、構造、形状、寸法、個数、処理の内容またはタイミング、音声の内容などは、本発明の趣旨に沿って適宜変更することができる。   In addition, the configuration, structure, shape, dimensions, number, processing content or timing of the whole or each part of the mobile phone 11, the display device 12, the agent device 13, the camera device 51, the pointing device 62, or the videophone system 1, and the audio content The contents and the like can be appropriately changed in accordance with the spirit of the present invention.

以下の付記に示される形態も本発明による実施形態に含まれる。
(付記1)
複数の通話者の間で音声および画像を用いて通信を行うテレビ電話システムであって、
他の通話者から送信される画像を表示するするディスプレイ装置、および、他の通話者に送信するための画像を撮影するカメラおよび近傍にある対象物を指し示すための指示装置を搭載した移動可能なエージェント装置が、各通話者の側に配置されており、
前記ディスプレイ装置および前記エージェント装置には、他の通話者からの音声を出力するためのスピーカが搭載され、他の通話者の動作または操作によって、当該他の通話者の音声が前記ディスプレイ装置のスピーカまたは前記エージェント装置のスピーカから選択的に切り替えられて出力されるように構成されている、
ことを特徴とするテレビ電話システム。
(付記2)
前記ディスプレイ装置および前記エージェント装置には、通話者が接触したことを検出する接触センサが設けられており、
他の通話者が当該他の通話者の側の前記ディスプレイ装置に接触したときには前記エージェント装置のスピーカから音声が出力され、他の通話者が当該他の通話者の側の前記エージェント装置に接触したときには前記ディスプレイ装置のスピーカから音声が出力される、
付記1記載のテレビ電話システム。
(付記3)
他の通話者が発する特定の語句を音声認識することによって、前記ディスプレイ装置のスピーカまたは前記エージェント装置のスピーカから選択的に切り替えられて音声が出力される、
付記1記載のテレビ電話システム。
(付記4)
いずれかの通話者の側に、当該通話者が携帯可能であり且つ操作部および他の通話者に送信する音声を入力するマイクが設けられた携帯装置が配置され、
当該通話者による前記操作部の操作によって、他の通話者の側の前記ディスプレイ装置のスピーカまたは前記エージェント装置のスピーカから選択的に切り替えられて音声が出力される、
付記1記載のテレビ電話システム。
(付記5)
他の通話者の動作または操作によって前記エージェント装置のスピーカから前記ディスプレイ装置のスピーカに切り替えられたときに、当該エージェント装置の指示装置の処理動作を中断する、
付記1ないし4のいずれかに記載のテレビ電話システム。
(付記6)
他の通話者の動作または操作によって前記ディスプレイ装置のスピーカから前記エージェント装置のスピーカに切り替えられたときに、当該ディスプレイ装置によって、前記エージェント装置の側に切り替えられた旨を示すメッセージを表示する、
付記1ないし5のいずれかに記載のテレビ電話システム。
(付記7)
複数の通話者の間で音声および画像を用いて通信を行うテレビ電話システムに用いるエージェント装置であって、
他の通話者に送信するための画像を撮影するカメラと、
他の通話者からの音声を出力するスピーカと、
近傍にある対象物を指し示すための指示装置と、
通話者が接触したことを検出する接触センサと、
当該エージェント装置を移動するための移動装置と、
を有してなることを特徴とするテレビ電話システムに用いるエージェント装置。
(付記8)
他の通話者からの音声の出力が前記スピーカから他のスピーカに切り替えられたときに、前記指示装置の処理動作を中断する、
付記7記載のテレビ電話システムに用いるエージェント装置。
(付記9)
複数の通話者の間で音声および画像を用いて通信を行うテレビ電話システムにおける話題の対象の指示方法であって、
通話者の近辺の複数の異なる位置にそれぞれスピーカを配置しておき、
他の通話者の動作または操作によって、前記スピーカのいずれかに切り替えて当該他の通話者の音声を出力する、
ことを特徴とするテレビ電話システムにおける話題の対象の指示方法。
The forms shown in the following supplementary notes are also included in the embodiments according to the present invention.
(Appendix 1)
A videophone system that communicates between a plurality of callers using sound and images,
A mobile device equipped with a display device that displays an image transmitted from another party, a camera that captures an image to be transmitted to another party, and a pointing device for pointing a nearby object An agent device is located on each party's side,
The display device and the agent device are each equipped with a speaker for outputting sound from another caller, and the other caller's sound is output from the speaker of the display device by the operation or operation of the other caller. Or configured to be selectively switched from the speaker of the agent device and output.
A videophone system characterized by that.
(Appendix 2)
The display device and the agent device are provided with a contact sensor for detecting contact of a caller,
When another caller touches the display device on the other caller's side, sound is output from the speaker of the agent device, and another caller touches the agent device on the other caller's side. Sometimes audio is output from the speaker of the display device,
The videophone system according to attachment 1.
(Appendix 3)
By recognizing a specific phrase from another caller, the speaker is selectively switched from the speaker of the display device or the speaker of the agent device, and the sound is output.
The videophone system according to attachment 1.
(Appendix 4)
On either party's side, a portable device provided with a microphone that can be carried by the caller and that inputs a voice to be transmitted to the operation unit and another caller is disposed,
By the operation of the operation unit by the caller, a voice is output by selectively switching from the speaker of the display device or the speaker of the agent device on the other caller side.
The videophone system according to attachment 1.
(Appendix 5)
When the speaker of the agent device is switched from the speaker of the agent device to the speaker of the display device by the operation or operation of another party, the processing operation of the instruction device of the agent device is interrupted.
The videophone system according to any one of appendices 1 to 4.
(Appendix 6)
When the speaker of the display device is switched from the speaker of the display device to the agent device by an operation or operation of another caller, a message indicating that the display device has been switched to the agent device side is displayed by the display device.
The videophone system according to any one of appendices 1 to 5.
(Appendix 7)
An agent device used in a videophone system that communicates between a plurality of callers using sound and images,
A camera that captures images for transmission to other parties,
A speaker that outputs audio from other parties;
An indicating device for pointing an object in the vicinity;
A contact sensor that detects contact of the caller;
A mobile device for moving the agent device;
An agent device for use in a videophone system, comprising:
(Appendix 8)
Interrupting the processing operation of the pointing device when the output of voice from another party is switched from the speaker to the other speaker;
An agent device used in the videophone system according to attachment 7.
(Appendix 9)
A method for instructing a subject of a topic in a videophone system that performs communication using voice and images between a plurality of callers,
Place speakers at several different locations near the caller,
According to the operation or operation of another party, the voice of the other party is output by switching to one of the speakers.
A method for indicating a topic of interest in a videophone system.

本発明に係る一実施形態のテレビ電話システムを示すブロック図である。It is a block diagram which shows the videophone system of one Embodiment which concerns on this invention. 携帯電話機の構成の例を示すブロック図である。It is a block diagram which shows the example of a structure of a mobile telephone. ディスプレイ装置の構成の例を示すブロック図である。It is a block diagram which shows the example of a structure of a display apparatus. エージェント装置の構成の例を示すブロック図である。It is a block diagram which shows the example of a structure of an agent apparatus. カメラ装置の構成の例を示す図である。It is a figure which shows the example of a structure of a camera apparatus. 通話開始シーケンスの例を示す図である。It is a figure which shows the example of a call start sequence. 話題の対象指示シーケンスの例を示す図である。It is a figure which shows the example of a subject instruction | indication sequence of a topic. 話題空間の切り替えシーケンスの例を示す図である。It is a figure which shows the example of the switching sequence of a topic space. 話題空間の切り替えシーケンスの他の例を示す図である。It is a figure which shows the other example of the switching sequence of a topic space. 話題空間の切り替えシーケンスの他の例を示す図である。It is a figure which shows the other example of the switching sequence of a topic space. 話題空間の切り替えシーケンスの他の例を示す図である。It is a figure which shows the other example of the switching sequence of a topic space. 近傍エージェントの制止シーケンスの例を示す図である。It is a figure which shows the example of the stop sequence of a near agent. 近傍エージェントの遠隔制御許可シーケンスの例を示す図である。It is a figure which shows the example of the remote control permission sequence of a neighborhood agent. 話題の対象指示シーケンスの他の例を示す図である。It is a figure which shows the other example of a subject instruction | indication sequence of a topic. 話題の対象指示シーケンスの他の例を示す図である。It is a figure which shows the other example of a subject instruction | indication sequence of a topic. 話題空間の切り替えシーケンスの他の例を示す図である。It is a figure which shows the other example of the switching sequence of a topic space. スピーカの切り替え動作の概略を示すフローチャートである。It is a flowchart which shows the outline of the switching operation | movement of a speaker. 通話者の接触によるスピーカの切り替え動作を示すフローチャートである。It is a flowchart which shows the switching operation of the speaker by a caller's contact. 従来のテレビ電話システムを示す図である。It is a figure which shows the conventional videophone system.

符号の説明Explanation of symbols

1 テレビ電話システム
11 携帯電話機(携帯装置)
12 ディスプレイ装置
13 エージェント装置
32 音声出力部(スピーカ)
33 音声入力部(マイク)
41 ビデオ表示部
41a タッチパネル入力部
42 音声出力部(スピーカ)
51 カメラ装置
53 移動装置
54 音声出力部(スピーカ)
55 音声入力部(マイク)
56 音声認識部
57 音声認識辞書部
61 カメラ
62 指示装置
67 プロジェクタ
SE2,3 接触センサ
JT 対象物
1 Videophone system 11 Mobile phone (mobile device)
12 Display device 13 Agent device 32 Audio output unit (speaker)
33 Voice input unit (microphone)
41 Video display unit 41a Touch panel input unit 42 Audio output unit (speaker)
51 Camera Device 53 Moving Device 54 Audio Output Unit (Speaker)
55 Voice input unit (microphone)
56 voice recognition unit 57 voice recognition dictionary unit 61 camera 62 pointing device 67 projector SE2, 3 contact sensor JT object

Claims (5)

複数の通話者の間で音声および画像を用いて通信を行うテレビ電話システムであって、
他の通話者から送信される画像を表示するディスプレイ装置、および、他の通話者に送信するための画像を撮影するカメラおよび近傍にある対象物を指し示すための指示装置を搭載したエージェント装置が、各通話者の側に配置されており、
しかも、前記各エージェント装置は、前記カメラを支持するとともにその光軸の角度を変更し調整するためのアングル制御装置、および、当該エージェント装置を前記対象物の近傍に移動させるための移動装置を備え、
さらに、前記ディスプレイ装置および前記エージェント装置には、他の通話者からの音声を出力するためのスピーカが搭載され、他の通話者の動作または操作によって、当該他の通話者の音声が前記ディスプレイ装置のスピーカまたは前記エージェント装置のスピーカから選択的に切り替えられて出力されるように構成されている、
ことを特徴とするテレビ電話システム。
A videophone system that communicates between a plurality of callers using sound and images,
An agent device equipped with a display device that displays an image transmitted from another caller, a camera that captures an image for transmission to another caller, and a pointing device for pointing an object in the vicinity, Located on each party's side,
In addition, each agent device includes an angle control device for supporting and changing the angle of the optical axis of the camera device, and a moving device for moving the agent device in the vicinity of the object. ,
Furthermore, the display device and the agent device are each equipped with a speaker for outputting sound from another caller, and the other caller's voice is transmitted to the display device by the operation or operation of the other caller. Configured to be selectively switched and output from the speaker of the agent device or the speaker of the agent device,
A videophone system characterized by that.
前記ディスプレイ装置および前記エージェント装置には、通話者が接触したことを検出する接触センサが設けられており、
他の通話者が当該他の通話者の側の前記ディスプレイ装置に接触したときには前記エージェント装置のスピーカから音声が出力され、他の通話者が当該他の通話者の側の前記エージェント装置に接触したときには前記ディスプレイ装置のスピーカから音声が出力される、
請求項1記載のテレビ電話システム。
The display device and the agent device are provided with a contact sensor for detecting contact of a caller,
When another caller touches the display device on the other caller's side, sound is output from the speaker of the agent device, and another caller touches the agent device on the other caller's side. Sometimes audio is output from the speaker of the display device,
The videophone system according to claim 1.
他の通話者が発する特定の語句を音声認識することによって、前記ディスプレイ装置のスピーカまたは前記エージェント装置のスピーカから選択的に切り替えられて音声が出力される、
請求項1記載のテレビ電話システム。
By recognizing a specific phrase from another caller, the speaker is selectively switched from the speaker of the display device or the speaker of the agent device, and the sound is output.
The videophone system according to claim 1.
いずれかの通話者の側に、当該通話者が携帯可能であり且つ操作部および他の通話者に送信する音声を入力するマイクが設けられた携帯装置が配置され、
当該通話者による前記操作部の操作によって、他の通話者の側の前記ディスプレイ装置のスピーカまたは前記エージェント装置のスピーカから選択的に切り替えられて音声が出力される、
請求項1記載のテレビ電話システム。
On either party's side, a portable device provided with a microphone that can be carried by the caller and that inputs a voice to be transmitted to the operation unit and another caller is disposed,
By the operation of the operation unit by the caller, a voice is output by selectively switching from the speaker of the display device or the speaker of the agent device on the other caller side.
The videophone system according to claim 1.
他の通話者の動作または操作によって前記エージェント装置のスピーカから前記ディスプレイ装置のスピーカに切り替えられたときに、当該エージェント装置の指示装置の処理動作を中断する、
請求項1ないし4のいずれかに記載のテレビ電話システム。
When the speaker of the agent device is switched from the speaker of the agent device to the speaker of the display device by the operation or operation of another party, the processing operation of the instruction device of the agent device is interrupted.
The videophone system according to any one of claims 1 to 4.
JP2007090400A 2007-03-30 2007-03-30 Videophone system and agent device Expired - Fee Related JP5007590B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007090400A JP5007590B2 (en) 2007-03-30 2007-03-30 Videophone system and agent device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007090400A JP5007590B2 (en) 2007-03-30 2007-03-30 Videophone system and agent device

Publications (2)

Publication Number Publication Date
JP2008252455A JP2008252455A (en) 2008-10-16
JP5007590B2 true JP5007590B2 (en) 2012-08-22

Family

ID=39976893

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007090400A Expired - Fee Related JP5007590B2 (en) 2007-03-30 2007-03-30 Videophone system and agent device

Country Status (1)

Country Link
JP (1) JP5007590B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112019003189T5 (en) * 2018-06-25 2021-04-08 Sony Corporation INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD AND INFORMATION PROCESSING SYSTEM

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3553050B2 (en) * 2002-05-28 2004-08-11 株式会社エイティング Videophone monitoring system
JP2007036543A (en) * 2005-07-26 2007-02-08 Fuji Xerox Co Ltd Remote instruction system and remote instruction method

Also Published As

Publication number Publication date
JP2008252455A (en) 2008-10-16

Similar Documents

Publication Publication Date Title
US10499136B2 (en) Providing isolation from distractions
EP3062196B1 (en) Method and apparatus for operating and controlling smart devices with hand gestures
US9253303B2 (en) Signal processing apparatus and storage medium
US8254984B2 (en) Speaker activation for mobile communication device
EP3429174A1 (en) Automatic routing of call audio at incoming call
KR20160082206A (en) Headset that is operated with mobile terminal using short range wireless communication
EP3322167B1 (en) Method and device for adjusting frequencies of intercom apparatuses
KR20150062795A (en) Mobile terminal and control method for the mobile terminal
JP7473029B2 (en) Portable information terminal, portable information terminal control method, and program
JP5929698B2 (en) Communication system and program
JP5007590B2 (en) Videophone system and agent device
KR20120127987A (en) Method and apparatus for switching call mode
JP2018137568A (en) Reception telephone terminal
JP4997572B2 (en) Control device for mobile phone device, mobile phone device, and control method for mobile phone device
KR102075750B1 (en) Method for providing voice communication using character data and an electronic device thereof
KR101727494B1 (en) Method for handling call waiting and mobile terminal using this method
JP2007174360A (en) Hands-free device of radio connection system, and connection switching method thereof
JP2015126313A (en) Radio device and control method of the same
KR20160072644A (en) Mobile terminal and method for controlling the same
JP2010114864A (en) Portable information apparatus
WO2017163513A1 (en) Information processing terminal, wristwatch terminal, and control method and control program for said information processing terminal and said wristwatch terminal
JP2010028214A (en) Wireless communication system
JP2010154005A (en) Hands-free intercom device
JP2005217594A (en) Mobile communication terminal and call termination processing method thereof
WO2014027372A1 (en) Portable terminal, method for controlling portable terminal, and non-temporary computer-readable medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120131

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120330

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120501

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120514

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150608

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees