JP2006093883A - Television telephone call device - Google Patents

Television telephone call device Download PDF

Info

Publication number
JP2006093883A
JP2006093883A JP2004273985A JP2004273985A JP2006093883A JP 2006093883 A JP2006093883 A JP 2006093883A JP 2004273985 A JP2004273985 A JP 2004273985A JP 2004273985 A JP2004273985 A JP 2004273985A JP 2006093883 A JP2006093883 A JP 2006093883A
Authority
JP
Japan
Prior art keywords
video
signal
external
audio
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004273985A
Other languages
Japanese (ja)
Inventor
Koichi Onose
康一 小野瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2004273985A priority Critical patent/JP2006093883A/en
Publication of JP2006093883A publication Critical patent/JP2006093883A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a television telephone call device for switching to external video and voice as well as the captured image and voice of a caller for transmission, and for transmitting the voice of the caller as well as external voice. <P>SOLUTION: The television telephone call device 1 switches to an internal video signal derived from a camera 2 by a video selection switch 19 or an external video signal inputted to external video input terminals 14, 15 for displaying explanation materials, or the like by images and video effectively. A voice selection switch 20 switches to an internal voice signal from a microphone 3 when switching has been made to the internal video signal in linking with the video selection switch 19, and mixes both of external and internal voice signals when switching has been made to the external video signal for transmitting to one's call party. Since the internal voice signal of the caller can also be transmitted after being mixed with the external voice signal, conversation with one's call party regarding the external video signal can be made simultaneously with display. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、相手側の映像を相互に表示するための画像通信と、通話を行うための音声通信とを同時に行うテレビ通話装置に関する。   The present invention relates to a video communication device that simultaneously performs image communication for displaying images of the other party and audio communication for making a call.

従来から、相手側の映像を相互に表示しながら通話や会議を行うテレビ電話装置やテレビ会議用端末装置が利用されている。従来のテレビ電話装置は、本体附属カメラの映像とマイクロホンからの音声とを相手に送り、相手からの映像を表示し、相手からの音声を再生するものである(たとえば、特許文献1。)。特許文献1には、従来技術として、通話相手との会話は音声のみの電話機と同様に行い、自画像をテレビ電話装置に備えられるカメラで撮像して相手側に送信し、相手側から受信する画像をテレビ電話装置に備えられる表示画面に表示するものが紹介されている。画像の通信は音声用の電話回線を介して行うので、送受される画像は静止画となる。テレビ電話装置には、本体内蔵のカメラやマイクロホンではなく、外部入力で他のカメラやマイクロホンにも接続可能なものもある。特許文献1で開示されている発明に係るテレビ電話装置では、カメラとしてマイクロホンが一体化されているビデオカメラを用い、画面表示にテレビジョン受信機を用いることができるように、ビデオカメラからの映像信号および音声信号の入力部と、テレビジョン受信機への映像信号および音声信号の出力部とを備える構成を有している。   2. Description of the Related Art Conventionally, videophone devices and videoconferencing terminal devices that make calls and conferences while displaying images of the other party are used. A conventional videophone device transmits video from a camera attached to a main body and audio from a microphone to a partner, displays video from the partner, and reproduces voice from the partner (for example, Patent Document 1). In Patent Document 1, as a conventional technique, a conversation with a call partner is performed in the same manner as a voice-only telephone, and a self-portrait is captured by a camera provided in a videophone device, transmitted to the other party, and received from the other party. Is displayed on a display screen provided in a videophone device. Since image communication is performed via a voice telephone line, the image transmitted and received is a still image. Some videophone devices can be connected to other cameras and microphones by external input, instead of cameras and microphones built in the main body. In the videophone device according to the invention disclosed in Patent Document 1, a video camera integrated with a microphone is used as a camera, and an image from the video camera is used so that a television receiver can be used for screen display. A signal and audio signal input unit and a video signal and audio signal output unit to a television receiver are included.

なお、マイクロホンがカメラに一体化され、映像の撮像と音声の取得が可能で取得された映像および音声の記録と再生を行うカメラ一体形ビデオカメラを用いて、映像および音声の記録再生を行う際に、外部からの映像信号や音声信号を付加したり、外部へ映像信号や音声信号を出力させる映像信号記録再生装置も開示されている(たとえば、特許文献2参照。)。したがって、特許文献1の発明に係るテレビ電話装置には、特許文献2で開示されている映像信号記録再生装置を接続することができる。   When recording and reproducing video and audio using a camera-integrated video camera that integrates a microphone into the camera and can capture video and acquire audio, and records and reproduces the acquired video and audio In addition, a video signal recording / reproducing apparatus for adding an external video signal or audio signal or outputting a video signal or audio signal to the outside is also disclosed (for example, see Patent Document 2). Therefore, the video signal recording / reproducing apparatus disclosed in Patent Document 2 can be connected to the videophone device according to the invention of Patent Document 1.

相互に通話する少なくとも一方に複数の参加者がある場合は、テレビ会議と呼ばれる。テレビ会議では、実際に対面して会議を進める状態に近付けるため、映像をリアルタイムで送受信することが要望され、Public Switched Telephone Network からPSTNと呼ばれる一般の公衆用電話回線網では伝送可能な情報量が不足し、より伝送可能な情報量が大きいISDN(Integrated Services Digital Network )や専用の通信回線が用いられている。ただし、ISDNでも、完全なリアルタイムの映像の送受信は困難であり、映像は静止画を間欠的に送受信する程度となる。このため、複数の参加者のいずれかが発言していても、撮像した映像を表示するだけでは不明であり、発言者を特定するような表示の付加が提案されている(たとえば、特許文献3参照。)。特許文献3では、ビデオカメラで会議参加者の映像を撮像しながら、会議参加者の近傍に分散して配置する複数のマイクロホンへの音声入力を検出し、特定のマイクロホンに所定値以上の音声入力があれば、そのマイクロホンの近傍の会議参加者の映像に、発言者表示情報を付加するようにしている。相手側に送信する音声信号では、複数のマイクロホンに入力された音声信号は混合され、まとめて再生されるので、発言者を特定するような情報は失われてしまうからである。   When there are a plurality of participants in at least one of the parties talking to each other, it is called a video conference. In video conferencing, it is necessary to send and receive video in real time in order to approach the state where the conference is actually proceeding, and the amount of information that can be transmitted by the public telephone line network called PSTN from the Public Switched Telephone Network is large. ISDN (Integrated Services Digital Network) and a dedicated communication line are used, which are insufficient and have a large amount of information that can be transmitted. However, even with ISDN, it is difficult to transmit and receive complete real-time video, and video is only transmitted and received intermittently. For this reason, even if any of a plurality of participants speaks, it is unclear simply by displaying the captured video, and the addition of a display that identifies the speaker is proposed (for example, Patent Document 3). reference.). In Japanese Patent Laid-Open No. 2004-260688, while capturing video of a conference participant with a video camera, audio input to a plurality of microphones distributed in the vicinity of the conference participant is detected, and audio input of a predetermined value or more is input to a specific microphone If there is, the speaker display information is added to the video of the conference participant in the vicinity of the microphone. This is because in the audio signal transmitted to the other party, the audio signals input to the plurality of microphones are mixed and reproduced together, so that information for identifying the speaker is lost.

近年、インターネットなどのデジタル通信網を有効に利用するために、一般家庭などにも、ADSL(Asymmetric Digital Subscriber Line )やFTTH(Fiber To The
Home)などのISDNよりも高速で、ブロードバンド化された通信線が接続されるようになってきている。またCAble TeleVisionからCATVと呼ばれる有線テレビ(CAble
TeleVision)の配信線を、インターネットへの接続のためのブロードバンド通信線として利用することも行われている。これらのブロードバンド化された通信線を用いれば、テレビ電話やテレビ会議も、より有効に利用可能になると期待される。また、携帯電話機も高機能化され、動画データを含む高速のデータ通信が可能で、カメラと表示器とを備えているので、携帯電話機を用いるテレビ電話やテレビ化会議も可能になってきている。
In recent years, ADSL (Asymmetric Digital Subscriber Line) and FTTH (Fiber To The) have been used in ordinary homes to effectively use digital communication networks such as the Internet.
Home) and other broadband communication lines have been connected at higher speeds than ISDN. In addition, CAble TeleVision calls CATV, a cable television (CAble
TeleVision's distribution line is also used as a broadband communication line for connection to the Internet. If these broadband communication lines are used, it is expected that videophones and videoconferencing can be used more effectively. In addition, since mobile phones are also highly functional, high-speed data communication including moving image data is possible, and since a camera and a display are provided, videophones and teleconferences using mobile phones are becoming possible. .

特開平2−194786号公報Japanese Patent Laid-Open No. 2-194786 特開平1−188076号公報Japanese Patent Laid-Open No. 1-188076 特開昭61−146083号公報JP-A-61-146083

テレビ電話やテレビ会議では、音声信号ばかりではなく映像信号も伝送する必要がある。PSTNのアナログ回線は、音声信号を3kHz程度までの周波数帯域に制限して伝送するように形成されている。データを送受信するためには、モデムが必要となる。PSTNのアナログ回線を使用してデータを送受信するモデムでは、データ圧縮技術などを利用して、最大56kbps程度の伝送速度が得られている。しかしながら、テレビ電話やテレビ会議を円滑に行うために必要な映像信号の伝送には、伝送速度として不足している。ISDN回線が普及すると、ISDN回線では64kbpsの最大速度を両方向で得られる。また、2回線が同時に接続可能であるので、2回線同時に使用して128kbpsの伝送速度が得られる。これらのテレビ電話やテレビ会議は、International
Telecommunication Union からITUと略称される国際電気通信連合で決められているH.320の手順を使用して行われる。
In videophone and videoconference, it is necessary to transmit not only audio signals but also video signals. The PSTN analog line is formed to transmit an audio signal with a frequency band limited to about 3 kHz. In order to transmit and receive data, a modem is required. A modem that transmits and receives data using a PSTN analog line uses a data compression technique or the like to obtain a maximum transmission speed of about 56 kbps. However, the transmission speed is insufficient for the transmission of video signals necessary for smoothly conducting videophone calls and videoconferences. When the ISDN line becomes widespread, a maximum speed of 64 kbps can be obtained in both directions on the ISDN line. Also, since two lines can be connected simultaneously, a transmission rate of 128 kbps can be obtained by using the two lines simultaneously. These videophones and conferences are international
The H.264 has been decided by the International Telecommunications Union, abbreviated as ITU from the Telecommunication Union. This is done using 320 procedures.

近年では、前述のようにADSLや光ファイバのFTTHなどのブロードバンド化された通信線が利用可能となり、テレビ電話やテレビ会議にもより高速な通信回線の利用が可能になってきている。特に、ADSLは、PSTNの電話交換機と利用者の電話機とを繋ぐアナログ信号用の加入者線に、高周波でデジタル信号を重畳させる技術であるので、既存の加入者線を利用することができ、広く普及している。ただし、電話交換機から利用者の電話機への下りの通信速度は速くなるけれども、利用者の電話機から電話交換機への上りの通信速度は比較的遅い非対称性を有するので、双方向に多量の画像データを送受信することが臨まれるテレビ電話やテレビ会議には必ずしも適していない。光ファイバやCATVの配信線は、数Mbps以上の伝送速度で多量のデータを双方向に伝送可能であるので、テレビ電話やテレビ会議に適している。また、動画データの送受が可能な携帯電話機でも、テレビ電話やテレビ会議に利用することができる。これらのブロードバンド化された通信線を利用する場合は、料金も固定料金となることが多い。従来のPSTNやISDNでは、従量課金であり、伝送すべき情報量が多いテレビ通話装置では、料金が高騰してしまうけれども、固定料金制であれば、料金面での制約も少なくなる。   In recent years, broadband communication lines such as ADSL and optical fiber FTTH can be used as described above, and higher-speed communication lines can be used for videophones and video conferences. In particular, ADSL is a technology that superimposes a digital signal at a high frequency on an analog signal subscriber line connecting a PSTN telephone exchange and a user's telephone, so that an existing subscriber line can be used. Widely used. However, although the downlink communication speed from the telephone exchange to the user's telephone is faster, the uplink communication speed from the user's telephone to the telephone exchange has a relatively slow asymmetry, so a large amount of image data is bidirectional. It is not necessarily suitable for videophones and video conferences that are expected to send and receive messages. An optical fiber or CATV distribution line can transmit a large amount of data bidirectionally at a transmission rate of several Mbps or more, and is suitable for a video phone or a video conference. A mobile phone capable of transmitting and receiving moving image data can also be used for videophones and videoconferencing. When using these broadband communication lines, the charge is often fixed. With conventional PSTN and ISDN, pay-as-you-go is charged, and a video call device with a large amount of information to be transmitted increases the charge. However, the fixed charge system reduces the restrictions on the charge.

テレビ電話やテレビ会議を円滑に行うための映像信号の伝送速度を満たす環境が整ってくると、テレビ電話やテレビ会議を行うためのテレビ電話装置には、テレビ電話やテレビ会議をより有効に行うための機能が要望される。たとえば送受信する映像信号には、付属しているカメラなどで撮像する相手側の画像ばかりではなく、外部装置などから入力される映像信号も送受信可能であることが要望される。   When an environment that satisfies the video signal transmission speed for smooth videophone calls and videoconferences is established, videophones and videoconferencing for videophones and videoconferences are more effective for videophones and videoconferences. A function is required. For example, a video signal to be transmitted / received is required to be able to transmit / receive not only an image of a partner imaged by an attached camera or the like but also a video signal input from an external device or the like.

テレビ会議に用いる装置では、会議に必要な資料を送信する機能が備えられている。しかしながら、映像信号の入力先を付属のカメラから外部に切換えると、音声信号の入力先も付属のマイクロホンから外部装置に切換えられてしまう。外部装置として特許文献2に開示されているような映像信号記録再生装置を用いると、事前に用意して記録しておいた映像と音声とを同時に相手先に送信することができる。ただし、自己の音声を相手先に通信するためには、映像と音声との入力を付属のカメラおよびマイクロホン切換えなければならず、相手先に資料を表示しながら説明することができない。テレビ電話でも、通話者以外の映像を送信することが要望される。たとえば、離れた家族間で通話する場合、孫の運動会のビデオを見ながらテレビ電話をするような場合を想定すると、ビデオの映像とその撮像の際に収録した音声を送信するとともに、同時に会話も行うための音声も送信することが要望される。   An apparatus used for a video conference has a function of transmitting materials necessary for the conference. However, if the input destination of the video signal is switched from the attached camera to the outside, the input destination of the audio signal is also switched from the attached microphone to the external device. When a video signal recording / reproducing apparatus as disclosed in Patent Document 2 is used as an external apparatus, it is possible to simultaneously transmit video and audio prepared and recorded in advance to the other party. However, in order to communicate own voice to the other party, the input of video and voice must be switched between the attached camera and microphone, and cannot be explained while displaying the document at the other party. Even in a videophone call, it is desired to transmit a video other than the caller. For example, when calling between family members who are far away, assuming that you are making a videophone call while watching a video of a grandson's athletic meet, the video image and the audio recorded at the time of imaging will be transmitted, and at the same time conversation It is also desired to transmit audio for performing.

テレビ通話やテレビ会議を利用する有効性は、相手の反応を見ながら、必要に応じてその場で説明を追加したり変更したりすることが可能な点にあり、この点が円滑に行えないと、テレビ通話やテレビ会議の有効性が損われてしまうことになる。   The effectiveness of using video calls and video conferencing is that it is possible to add or change the explanation on the spot as needed while watching the reaction of the other party, and this can not be done smoothly. This will impair the effectiveness of video calls and video conferences.

本発明の目的は、通話者の撮像および音声ばかりではなく、外部からの映像および音声に切換えて送信することができ、外部からの音声とともに通話者の音声も送信することができるテレビ通話装置を提供することである。   It is an object of the present invention to provide a video communication device capable of switching and transmitting not only a caller's image and sound but also an external video and sound, and capable of transmitting a caller's voice together with the external sound. Is to provide.

本発明は、相手側の映像を相互に表示しながら通話を行うテレビ通話装置において、
通話者を撮像して内部映像信号を導出する映像撮像手段と、
通話者の音声を取得して内部音声信号を導出する音声取得手段と、
外部の機器からの映像信号を外部映像信号として入力する映像入力手段と、
外部の機器からの音声信号を外部音声信号として入力する音声入力手段と、
映像撮像手段から導出される内部映像信号、または映像入力手段に入力される外部映像信号のいずれかに切換えて、通話相手に送信する映像切換手段と、
映像切換手段に連動して、内部映像信号に切換えられるときは内部音声信号に切換え、外部映像信号に切換えられるときは、外部音声信号および内部音声信号の両方をミキシングして、通話相手に送信する音声切換手段とを含むことを特徴とするテレビ通話装置である。
The present invention, in a video call device for making a call while mutually displaying the other party's video,
Video imaging means for imaging a caller and deriving an internal video signal;
Voice acquisition means for acquiring the voice of the caller and deriving an internal voice signal;
Video input means for inputting a video signal from an external device as an external video signal;
An audio input means for inputting an audio signal from an external device as an external audio signal;
Video switching means for switching to either an internal video signal derived from the video imaging means or an external video signal input to the video input means, and transmitting to the other party,
In conjunction with the video switching means, when switching to the internal video signal, switch to the internal audio signal, and when switching to the external video signal, mix both the external audio signal and the internal audio signal and transmit to the other party And a voice switching device.

本発明に従えば、テレビ通話装置は、たとえばテレビ電話やテレビ会議で、相手側の映像を相互に表示しながら通話を行うために、映像撮像手段と、音声取得手段と、映像入力手段と、音声入力手段と、映像切換手段と、音声切換手段とを含む。映像撮像手段は、たとえばカメラなどによって実現され、通話者を撮像して内部映像信号を導出する。音声取得手段は、たとえばマイクロホンなどによって実現され、通話者の音声を取得して内部音声信号を導出する。映像入力手段および音声入力手段は、外部の機器からの映像信号および音声信号を、外部映像信号および外部音声信号としてそれぞれ入力する。映像切換手段は、映像撮像手段から導出される内部映像信号、または映像入力手段に入力される外部映像信号のいずれかに切換えて、通話相手に送信するので、映像撮像手段によって撮像される通話者の映像ばかりではなく、外部の機器からの外部映像信号も通話相手に送信することができ、説明資料などを画像や映像で有効に表示させることができる。音声切換手段は、映像切換手段に連動して、内部映像信号に切換えられるときは内部音声信号に切換え、外部映像信号に切換えられるときは、外部音声信号および内部音声信号の両方をミキシングして、通話相手に送信する。外部映像信号とともに入力される外部音声信号ばかりではなく、音声取得手段で取得される通話者の内部音声信号も外部音声信号とミキシングして送信するので、外部映像信号に関する通話相手との会話を外部映像信号の表示と同時に行うことができる。   In accordance with the present invention, the video calling device, for example, in videophone or videoconference, in order to make a call while mutually displaying the other party's video, video imaging means, audio acquisition means, video input means, Audio input means, video switching means, and audio switching means are included. The video imaging means is realized by a camera, for example, and images the caller to derive an internal video signal. The voice acquisition means is realized by a microphone, for example, and acquires the voice of the caller and derives an internal voice signal. The video input unit and the audio input unit respectively input a video signal and an audio signal from an external device as an external video signal and an external audio signal. Since the video switching means switches to either the internal video signal derived from the video imaging means or the external video signal input to the video input means and transmits to the other party, the caller imaged by the video imaging means In addition to this video, an external video signal from an external device can be transmitted to the other party, and explanatory materials can be effectively displayed as images and videos. The audio switching means is linked to the video switching means to switch to the internal audio signal when switched to the internal video signal, and to mix both the external audio signal and the internal audio signal when switched to the external video signal, Send to the other party. Since not only the external audio signal input with the external video signal but also the caller's internal audio signal acquired by the audio acquisition means is mixed with the external audio signal and transmitted, the conversation with the other party on the external video signal can be communicated externally. It can be performed simultaneously with the display of the video signal.

また本発明で、前記音声切換手段は、前記映像切換手段に連動して、内部映像信号に切換えられるときは通話の相手側からの相手音声信号を、外部映像信号に切換えられるときは、該相手音声信号および外部音声信号をミキシングした音声信号を、切換えて音響出力を導出することを特徴とする。   Further, in the present invention, the voice switching means is linked to the video switching means, and when switching to the internal video signal, the voice signal from the other party of the call is switched to the external video signal. A sound output is derived by switching a sound signal obtained by mixing a sound signal and an external sound signal.

また本発明に従えば、内部映像信号を相手側に送信するときには相手側からの相手音声信号の音響出力を導出するように切換えるので、従来からのテレビ通話と同様に、相互に相手側の映像を表示しながら相互に通話を行うことができる。外部映像信号を相手側に送信するときは、相手音声信号を外部音声信号にミキシングした音声信号の音響出力を導出するように切換えるので、相手側に送信している外部音声を自分でも聞きながら、相手側との通話を行うことができる。   According to the present invention, when the internal video signal is transmitted to the other party, switching is performed so as to derive the acoustic output of the other party's audio signal from the other party. You can talk to each other while displaying. When sending an external video signal to the other party, it is switched to derive the acoustic output of the audio signal mixed with the other party's audio signal, so you can listen to the external audio that you are sending to the other party, You can make a call with the other party.

また本発明では、前記映像切換手段に連動して、内部映像信号に切換えられるときは通話の相手側からの相手映像信号を表し、外部映像信号に切換えられるときは、該相手映像信号とともに、外部映像信号を表示する表示手段をさらに含むことを特徴とする。   Further, in the present invention, in conjunction with the video switching means, when switched to the internal video signal, it represents the partner video signal from the other party of the call, and when switched to the external video signal, together with the partner video signal, the external video signal It further includes display means for displaying a video signal.

本発明に従えば、内部映像信号を相手側に送信するときには相手側からの相手映像信号を表示するので、従来からのテレビ通話と同様に、相互に相手側の映像を表示しながら相互に通話を行うことができる。外部映像信号を相手側に送信するときは、相手映像信号とともに外部映像信号を表示するので、相手側に送信している外部映像を自分でも見ながら、相手側との通話を行うことができる。   According to the present invention, when the internal video signal is transmitted to the other party, the other party's video signal is displayed, so that the other party's video is displayed while the other party's video is displayed as in the conventional video call. It can be performed. When the external video signal is transmitted to the other party, the external video signal is displayed together with the other video signal, so that it is possible to make a call with the other party while watching the external video transmitted to the other party.

また本発明では、前記通話者が前記ミキシングでの混合状態を調整操作可能な操作手段をさらに含むことを特徴とする。   Further, the present invention is further characterized in that the caller further includes operation means capable of adjusting the mixed state in the mixing.

本発明に従えば、音声信号のミキシングでの混合状態を通話者が操作手段で調整操作可能なので、相手側と通話しながら、相手側の反応を見て、適切な混合状態に調整することができる。   According to the present invention, since the caller can adjust the mixed state in the mixing of the audio signal by the operation means, it is possible to adjust to the appropriate mixed state by looking at the reaction of the other party while talking with the other party. it can.

また本発明で、前記映像入力手段および前記音声入力手段は、
映像信号および音声信号を再生して導出する映像音声再生手段からの入力用と、
映像信号および音声信号を取得して導出する映像音声取得手段からの入力用とを、
含むことを特徴とする。
In the present invention, the video input means and the audio input means are:
For input from video / audio reproduction means for reproducing and deriving video and audio signals;
For input from a video / audio acquisition means for acquiring and deriving a video signal and an audio signal,
It is characterized by including.

本発明に従えば、ビデオ記録再生装置などに記録されている映像信号および音声信号を再生して相手側に送信したり、通話者がビデオカメラなどの映像音声取得手段で映像信号および音声信号を取得しながら相手側に送信したりするように、切換えることができる。   According to the present invention, a video signal and an audio signal recorded in a video recording / reproducing apparatus or the like are reproduced and transmitted to the other party, or a caller receives the video signal and the audio signal by an audio / video acquisition unit such as a video camera. It can be switched to send to the other party while acquiring.

また本発明で、前記内部音声信号とミキシングされる外部音声信号は、前記映像音声取得手段から入力される音声信号であることを特徴とする。   In the present invention, the external audio signal to be mixed with the internal audio signal is an audio signal input from the video / audio acquisition means.

本発明に従えば、映像入力手段に映像音声取得手段としてたとえばビデオカメラを接続し、テレビ通話装置の周辺から離れている場所を撮像してその映像信号を相手側に送信している場合でも、テレビ通話装置の周辺で話す音声も同時に取得して相手側に送信することができる。   According to the present invention, even when, for example, a video camera is connected to the video input unit as the video / audio acquisition unit, the video signal is transmitted to the other party by imaging a place away from the periphery of the video calling device, It is also possible to simultaneously acquire voices spoken in the vicinity of the videophone and transmit them to the other party.

本発明によれば、通話者などを撮像する内部映像信号を相手側に送信することができるばかりではなく、外部の機器から入力される外部映像信号に切換えて通話相手に送信することもできる。外部映像信号に切換えて送信する際には、通話者の音声などの内部音声信号を、外部の機器から入力される外部音声信号にミキシングして相手側に送信することができる。資料などを送信して画像や映像で有効に表示させることができるとともに、その外部映像信号とともに入力される外部音声信号ばかりではなく、通話者の音声を取得することができる内部音声信号も同時に通話相手に送信することができるので、資料などを通話しながら判りやすく説明することができる。   According to the present invention, not only can an internal video signal for imaging a caller or the like be transmitted to the other party, but it can also be switched to an external video signal input from an external device and transmitted to the other party. When switching to an external video signal for transmission, an internal audio signal such as a caller's voice can be mixed with an external audio signal input from an external device and transmitted to the other party. You can send materials and display them effectively with images and video, and not only external audio signals that are input along with the external video signals but also internal audio signals that can acquire the voice of the caller at the same time Since it can be transmitted to the other party, it is possible to explain easily while talking on materials.

また本発明によれば、従来からのテレビ通話と同様に、相互に相手側の映像を表示しながら相互に通話を行うことができ、外部映像信号を相手側に送信するときは、相手側に送信している外部音声を自分でも聞きながら、相手側との通話を行うことができる。   Further, according to the present invention, similar to a conventional video call, it is possible to make a call with each other while displaying the other party's video, and when transmitting an external video signal to the other side, You can talk to the other party while listening to the external audio you are sending.

また本発明によれば、従来からのテレビ通話と同様に、相互に相手側の映像を表示しながら相互に通話を行うことができ、外部映像信号を相手側に送信するときは、相手側に送信している外部映像を自分でも見ながら、相手側との通話を行うことができる。   Further, according to the present invention, similar to a conventional video call, it is possible to make a call with each other while displaying the other party's video, and when transmitting an external video signal to the other side, You can talk with the other party while watching the external video you are sending.

また本発明によれば、音声信号のミキシングでの混合状態を、通話者が相手側と通話しながら、適切に調整することができる。   Further, according to the present invention, the mixed state in the mixing of audio signals can be adjusted appropriately while the caller is talking to the other party.

また本発明よれば、事前に記録しておいた映像信号および音声信号を再生して相手側に送信したり、通話者が映像信号および音声信号を取得しながら相手側に送信したりするように、切換えることができる。   Further, according to the present invention, a video signal and an audio signal recorded in advance are reproduced and transmitted to the other party, or a caller transmits the video signal and the audio signal to the other party while acquiring the video signal and the audio signal. Can be switched.

また本発明によれば、たとえばビデオカメラを接続し、テレビ通話装置の周辺から離れている場所を撮像して音声も取得しながら相手側に送信している場合でも、テレビ通話装置の周辺で話す音声も同時に取得して相手側に送信することができるので、会話を続けたり、解説や説明を追加することができる。   Further, according to the present invention, for example, even when a video camera is connected and an image of a place away from the periphery of the video calling device is captured and the sound is acquired and transmitted to the other party, the video communication device can speak in the vicinity. Since voice can be acquired and sent to the other party at the same time, conversation can be continued and explanations and explanations can be added.

図1は、本発明の実施の一形態としてのテレビ通話装置1の概略的なシステム構成を示す。テレビ通話装置1は、カメラ2と、マイクロホン3aおよびリモコン受光部3bを備えたカメラ部3と、ディスプレイ4と、アダプタ本体5とを含む。ディスプレイ4は、液晶表示装置(LCD)やプラズマ表示装置(PDP)、または陰極線管(CRT)表示装置など、テレビジョン放送の受信機の画像表示や、コンピュータやゲーム機用の画像表示を行うディスプレイ装置の製品を使用する。アダプタ本体5は、カメラ部3やディスプレイ装置などの製品と組合わせて、テレビ通話装置1を形成するために必要な信号処理や通信制御を行う機能を備えている。アダプタ本体5には、通話者が操作する入力部が設けられているけれども、赤外線や無線電波を使用するリモコン6を用いて、離れた位置からでも操作を可能にしておく。   FIG. 1 shows a schematic system configuration of a video communication device 1 as an embodiment of the present invention. The video communication device 1 includes a camera 2, a camera unit 3 provided with a microphone 3a and a remote control light receiving unit 3b, a display 4, and an adapter body 5. The display 4 is a liquid crystal display (LCD), plasma display (PDP), or cathode ray tube (CRT) display, such as a television broadcast receiver image display or a computer or game console image display. Use equipment products. The adapter main body 5 has a function of performing signal processing and communication control necessary for forming the video communication device 1 in combination with products such as the camera unit 3 and the display device. Although the adapter body 5 is provided with an input unit operated by a caller, it can be operated from a remote location using a remote controller 6 that uses infrared rays or radio waves.

テレビ通話としての音声や映像は、インターネットを介してパケット化したデータとして通信する。アダプタ本体5は、LAN(Local Area Network)形成用の通信線を介してルータ7と接続される。ルータ7は、たとえばADSLモデム8を介してADSL回線9に接続され、ADSL回線9からインターネットに繋がる。また、FTTH回線11などの光ファイバの通信線に接続される場合は、ルータ7から加入者終端装置10を介してFTTH回線11に接続され、さらにFTTH回線11からインターネットに繋がる。ただし、ADSLは、インターネットでWebページを閲覧する場合のように、インターネットから端末への下り方向のデータ転送速度が上り方向へのデータ転送速度よりも大きくなるように設定されている。ADSLでは、高周波の周波数帯域を下り側に広く取って非対称となっているので、テレビ通話では遅い方の上り方向のデータ転送速度で通話速度が規制され、下り方向の高速性を有効に利用することはできない。なお、ADSLと同様に、PSTNのアナログの加入者線に高周波信号を重畳してブロードバンド化を図るxDSL技術には、上りのデータ転送速度を高めるものもあるので、そのような技術が普及すれば、テレビ通話には好適となる。テレビ通話では、映像を扱うためにデータ転送速度には双方向の高速性を要求するので、現状ではFTTHなどの光ファイバやCATVなどの利用がADSL回線9よりも好ましい。   Audio and video as a video call are communicated as packetized data via the Internet. The adapter body 5 is connected to the router 7 via a LAN (Local Area Network) forming communication line. The router 7 is connected to the ADSL line 9 via the ADSL modem 8, for example, and is connected to the Internet from the ADSL line 9. When connected to an optical fiber communication line such as the FTTH line 11, the router 7 is connected to the FTTH line 11 via the subscriber termination device 10, and the FTTH line 11 is connected to the Internet. However, ADSL is set such that the data transfer rate in the downlink direction from the Internet to the terminal is larger than the data transfer rate in the uplink direction, as in the case of browsing Web pages on the Internet. In ADSL, the frequency band of the high frequency is widened to the downstream side and becomes asymmetrical. Therefore, in the video call, the call speed is regulated by the slower data transfer rate in the upstream direction, and the high speed in the downstream direction is effectively used. It is not possible. As with ADSL, there are some xDSL technologies that increase the data transfer rate of the uplink by superimposing high-frequency signals on PSTN analog subscriber lines to increase the bandwidth. It is suitable for a video call. In a video call, the data transfer speed requires bi-directional high speed in order to handle video, so at present, the use of an optical fiber such as FTTH or CATV is preferable to the ADSL line 9.

インターネットを介してテレビ通話を行う手順は、前述のようなITUのH.320に代えて、SIP(Session Initiation Protocol)が使用されることが多くなってきている。SIPは転送機能や発信者番号通知機能など、同様のプロトコルに比べて公衆電話網に近い機能を備え、接続にかかる時間も短くなっている。SIPは構造が簡単であるけれども、パラメータが多くあり、パラメータを1にセットするのか0にセットするのかが明確でないなど、細部までの記載がない。パラメータが0または1のいずれでも可である部分では問題は生じないけれども、いずれかにセットする必要があるような部分では接続できなくなり、相互接続には多少難がある。しかし、インターネットの普及もあり、今後はこの方式に従う手順が広く利用され、細部まで統一されるものと期待されている。現在でも、インターネット電話と呼ばれ、VoIP(Voice over Internet Protocol)に従うIP電話は、SIPを使用している。テレビ通話でも、接続手順としてSIPを使用するようにすれば、IP電話とテレビ電話との相互通信も可能となる。   The procedure for making a video call over the Internet is the same as the ITU H.264 standard. Instead of 320, SIP (Session Initiation Protocol) is often used. SIP has a function close to a public telephone network, such as a transfer function and a caller ID notification function, and has a shorter connection time. Although SIP has a simple structure, there are many parameters, and there is no detailed description such as whether it is not clear whether the parameter is set to 1 or 0. There is no problem in the portion where the parameter can be either 0 or 1, but the connection cannot be made in the portion that needs to be set to any one, and there is some difficulty in interconnection. However, with the spread of the Internet, it is expected that procedures in accordance with this method will be widely used and unified in detail. Even now, IP telephones that are called Internet telephones and comply with VoIP (Voice over Internet Protocol) use SIP. Even in a video call, if SIP is used as the connection procedure, mutual communication between the IP phone and the video phone is possible.

図2は、図1のテレビ通話装置1の概略的な電気的構成を示す。テレビ通話装置1は、送信部1aおよび受信部1bを含む。送信部1aには、内部映像入力端子13、外部映像入力端子14,15、内部音声入力端子16、外部音声入力端子17,18、映像切換スイッチ19、音声切換スイッチ20、ミキシング回路(以下、「MIX」と略称する)21、エコーキャンセラ22、利得調整増幅器23,24、画像符号化回路25、音声符号化回路26およびMIX27が含まれる。   FIG. 2 shows a schematic electrical configuration of the video communication device 1 of FIG. The video call device 1 includes a transmitter 1a and a receiver 1b. The transmitter 1 a includes an internal video input terminal 13, external video input terminals 14 and 15, internal audio input terminal 16, external audio input terminals 17 and 18, video changeover switch 19, audio changeover switch 20, a mixing circuit (hereinafter referred to as “ 21), an echo canceller 22, gain adjustment amplifiers 23 and 24, an image encoding circuit 25, an audio encoding circuit 26, and a MIX 27.

送信部1a、カメラ2が撮像する内部映像信号およびマイクロホン3aが取得する内部音声信号は、内部映像入力端子13および内部音声入力端子16にそれぞれ入力される。ビデオカメラなどのマイクロホンと一体化されている機器からの外部映像信号および外部音声信号は、外部映像入力端子14および外部音声入力端子17にそれぞれ入力可能である。VTRやDVDなどの再生装置などから出力される外部映像信号および外部音声信号は、外部映像入力端子15および外部音声入力端子18にそれぞれ入力可能である。内部映像入力端子13、外部映像入力端子14,15のいずれか1つが映像切換スイッチ19で切換えて画像符号化回路25に入力され、通話の相手側に送信されるような画像データを表すパケット信号として符号化される。内部音声入力端子16、外部音声入力端子17,18のいずれか1つが音声切換スイッチ20で切換えて音声符号化回路26に入力され、通話の相手側に送信されるような音声データを表すパケット信号として符号化される。   The internal video signal captured by the transmitter 1a and the camera 2 and the internal audio signal acquired by the microphone 3a are input to the internal video input terminal 13 and the internal audio input terminal 16, respectively. An external video signal and an external audio signal from a device integrated with a microphone such as a video camera can be input to the external video input terminal 14 and the external audio input terminal 17, respectively. External video signals and external audio signals output from playback devices such as VTRs and DVDs can be input to the external video input terminal 15 and the external audio input terminal 18, respectively. A packet signal representing image data such that any one of the internal video input terminal 13 and the external video input terminals 14 and 15 is switched by the video switch 19 and input to the image encoding circuit 25 and transmitted to the other party of the call. Is encoded as A packet signal that represents voice data such that any one of the internal voice input terminal 16 and the external voice input terminals 17 and 18 is switched by the voice changeover switch 20 and input to the voice encoding circuit 26 and transmitted to the other party of the call. Is encoded as

MIX21は、外部音声入力端子17または外部音声入力端子18が音声切換スイッチ20で選択された場合、内部音声入力端子13の音声信号を外部音声入力端子17または外部音声入力端子18から入力される外部音声信号と利得調整増幅器23を介して混合し、通話の相手側に送信する音声とする。なお、利得調整増幅器23は簡略化して記載しているけれども、音声切換スイッチ20と連動して、音声切換スイッチ20が外部音声入力端子17または外部音声入力端子18を入力するように切換えられているときのみ、MIX21で内部音声入力端子16に入力されている内部音声信号を混合するように、音声切換スイッチ20が内部音声入力端子16に切換えられているときには、ほとんど利得がない状態となり、入力される音声信号はMIX21には混合されないようにしている。   When the external audio input terminal 17 or the external audio input terminal 18 is selected by the audio selector switch 20, the MIX 21 receives the audio signal of the internal audio input terminal 13 from the external audio input terminal 17 or the external audio input terminal 18. The voice signal and the gain adjustment amplifier 23 are mixed to obtain a voice to be transmitted to the other party of the call. Although the gain adjusting amplifier 23 is described in a simplified manner, the voice changeover switch 20 is switched to input the external voice input terminal 17 or the external voice input terminal 18 in conjunction with the voice changeover switch 20. Only when the audio selector switch 20 is switched to the internal audio input terminal 16 so that the internal audio signal input to the internal audio input terminal 16 is mixed by the MIX 21, there is almost no gain and is input. Audio signals are not mixed with the MIX 21.

なお、利得調整増幅器23は、音声切換スイッチ20が外部音声入力端子17または外部音声入力端子18に切換えられているときに、利得の調整を可能としておく。   The gain adjustment amplifier 23 enables the gain to be adjusted when the audio selector switch 20 is switched to the external audio input terminal 17 or the external audio input terminal 18.

画像符号化回路25および音声符号化回路26からの出力はMIX27で合成され、インターネットへ送信される。   Outputs from the image encoding circuit 25 and the audio encoding circuit 26 are synthesized by the MIX 27 and transmitted to the Internet.

受信部1bには、スピーカ30、MIX31、分離回路32、音声復号化回路33、画像復号化回路34およびVMIX35が含まれる。スピーカ30は受信する音声信号を音響化して、音波30sとして出力する。MIX31は、スピーカ30で再生する通話相手側からの相手音声信号に、外部音声入力端子17または外部音声入力端子18に入力される外部音声信号を利得調整増幅器24を介して混合し、同時に再生可能にする。なお、利得調整増幅器24は簡略化して記載しているけれども、音声切換スイッチ20と連動して、音声切換スイッチ20が外部音声入力端子17または外部音声入力端子18を入力するように切換えられているときのみ、MIX31に外部音声入力端子17または外部音声入力端子18に入力されている外部音声信号を混合するように、音声切換スイッチ20が内部音声入力端子16切換えられているときには、ほとんど利得がない状態で、入力される音声信号はMIX31には混合されないようにしている。   The receiving unit 1b includes a speaker 30, a MIX 31, a separation circuit 32, an audio decoding circuit 33, an image decoding circuit 34, and a VMIX 35. The speaker 30 sonicates the received audio signal and outputs it as a sound wave 30s. The MIX 31 can mix the external audio signal input to the external audio input terminal 17 or the external audio input terminal 18 via the gain adjustment amplifier 24 with the other party audio signal from the other party to be played back by the speaker 30 and reproduce it simultaneously. To. Although the gain adjusting amplifier 24 is described in a simplified manner, the voice changeover switch 20 is switched to input the external voice input terminal 17 or the external voice input terminal 18 in conjunction with the voice changeover switch 20. Only when the audio switch 20 is switched to the internal audio input terminal 16 so that the external audio signal input to the external audio input terminal 17 or the external audio input terminal 18 is mixed with the MIX 31, there is almost no gain. In this state, the input audio signal is not mixed with the MIX 31.

インターネットなどを介して受信されるテレビ通話用の信号は、分離回路32で音声用のパケット信号と画像用のパケット信号とに分離される。分離回路32での分離は、パケット信号の種別を示すデータなどに従って行われる。音声用のパケット信号は、音声復号化回路33でアナログの音声信号に復号化され、MIX31に入力されて、スピーカ30で音響化され、通話者の耳に達する。画像用のパケット信号は、ディスプレイ4で使用する信号の形態に応じて、画像復号化回路34でアナログまたはデジタルの画像信号に復号化され、VMIX35で送信部1aからの映像信号と混合され、ディスプレイ4で画像として表示される。   A video call signal received via the Internet or the like is separated by the separation circuit 32 into a voice packet signal and an image packet signal. Separation by the separation circuit 32 is performed according to data indicating the type of packet signal. The packet signal for voice is decoded into an analog voice signal by the voice decoding circuit 33, input to the MIX 31, sounded by the speaker 30, and reaches the ear of the caller. The image packet signal is decoded into an analog or digital image signal by the image decoding circuit 34 according to the form of the signal used in the display 4, mixed with the video signal from the transmission unit 1 a by the VMIX 35, and displayed. 4 is displayed as an image.

VMIX35は、受信部1bで受信する相手側からの受信映像と、送信部1aで相手側に送信する送信映像とを、ピクチャ・イン・ピクチャ処理などの種々の形態で併せて表示する。ピクチャ・イン・ピクチャ処理では、たとえば大きな画面を受信映像または送信映像のいずれか一方の表示に使用し、その大きな画面中に小さな画面での表示領域を設けて、他方の送信映像または受信映像を表示する。小さな画面の表示領域は、大きな画面中を移動させることもできる。   The VMIX 35 displays the received video from the other side received by the receiving unit 1b and the transmitted video transmitted to the other side by the transmitting unit 1a in various forms such as picture-in-picture processing. In picture-in-picture processing, for example, a large screen is used to display either received video or transmitted video, a display area for a small screen is provided in the large screen, and the other transmitted video or received video is displayed. indicate. The display area of the small screen can be moved in the large screen.

なお、MIX21と音声符号化回路26との間にはエコーキャンセラ22が設けられている。エコーキャンセラ22は、スピーカ30から音響化して出力する相手音声信号の音波30sがマイクロホン3aや、外部音声入力端子17に入力されるビデオカメラなどに付属しているマイクロホンなどに入力されると、音声信号として相手側に送信されて、相手側のスピーカで音響化され、再び相手側のマイクロホンに入力されて相手音声信号として受信されることを繰返してループが形成され、発振状態となるハウリングを防止するために設けられる。このループの形成を防ぐには、ループ形成に寄与する周波数成分を除くなどで、ハウリングが生じるのを防ぐことができるエコーキャンセラ22を設けるようにすればよい。   An echo canceller 22 is provided between the MIX 21 and the speech encoding circuit 26. The echo canceller 22 generates sound when the sound wave 30s of the other party's audio signal output from the speaker 30 is input to the microphone 3a, the microphone attached to the video camera input to the external audio input terminal 17, or the like. Signals are sent to the other party, sounded by the other party's speaker, input to the other party's microphone and received as the other party's voice signal repeatedly, forming a loop, preventing howling that would cause an oscillation state To be provided. In order to prevent this loop formation, an echo canceller 22 can be provided that can prevent howling by removing frequency components that contribute to loop formation.

映像切換スイッチ19および利得調整増幅器23,24の利得は、アダプタ本体5の操作部、またはリモコン6に対する通話者などの操作で切換えまたは調整が可能である。音声切換スイッチ20は、映像切換スイッチ19の切換えに連動して、映像切換スイッチ19が内部映像入力端子13または外部映像入力端子14,15のいずれかに切換えられると、音声切換スイッチ20も、内部音声入力端子16または外部音声入力端子17,18のいずれかにそれぞれ切換えられる。   The gains of the video switch 19 and the gain adjustment amplifiers 23 and 24 can be switched or adjusted by the operation of the operation unit of the adapter body 5 or a caller to the remote controller 6. When the video switch 19 is switched to either the internal video input terminal 13 or the external video input terminals 14 and 15 in conjunction with the switching of the video switch 19, the audio switch 20 It is switched to either the audio input terminal 16 or the external audio input terminals 17 and 18, respectively.

したがって、テレビ通話装置1は、たとえばテレビ電話やテレビ会議で、相手側の映像を相互にディスプレイ4に表示しながら通話を行うために、映像撮像手段であるカメラ2と、音声取得手段であるマイクロホン3aと、映像入力手段である外部映像入力端子14,15と、音声入力手段である外部音声入力端子17,18と、映像切換手段である映像切換スイッチ19と、音声切換手段である音声切換スイッチ20とを含む。映像撮像手段は、たとえばCCD撮像素子などのカメラ2によって実現され、通話者を撮像して内部映像信号を導出する。音声取得手段は、コンデンサマイク等のマイクロホン3aなどによって実現され、通話者の音声を取得して内部音声信号を導出する。映像入力手段および音声入力手段は、外部の機器である撮像装置や再生装置からの映像信号および音声信号を、外部映像信号および外部音声信号としてそれぞれ入力する。映像切換手段は、映像撮像手段から導出される内部映像信号、または映像入力手段に入力される外部映像信号のいずれかに切換えて、通話相手に送信するので、映像撮像手段によって撮像される通話者の映像ばかりではなく、外部の機器からの外部映像信号も通話相手に送信することができ、説明資料などを画像や映像で有効に表示させることができる。音声切換手段は、映像切換手段に連動して、内部映像信号に切換えられるときは内部音声信号に切換え、外部映像信号に切換えられるときは、外部音声信号および内部音声信号の両方をミキシングして、通話相手に送信する。外部映像信号とともに入力される外部音声信号ばかりではなく、音声取得手段で取得される通話者の内部音声信号も外部音声信号とミキシングして送信するので、外部映像信号に関する通話相手との会話を外部映像信号の表示と同時に行うことができる。   Accordingly, the video calling device 1 is, for example, a video phone or a video conference. In order to make a call while displaying images of the other party on the display 4, the video calling device 1 and a microphone that is a voice acquisition unit are used. 3a, external video input terminals 14 and 15 as video input means, external audio input terminals 17 and 18 as audio input means, video switch 19 as video switching means, and audio switch as audio switching means 20 and so on. The video image pickup means is realized by the camera 2 such as a CCD image pickup device, for example, and picks up the caller to derive an internal video signal. The voice acquisition means is realized by the microphone 3a such as a condenser microphone, and acquires the voice of the caller to derive the internal voice signal. The video input unit and the audio input unit respectively input a video signal and an audio signal from an imaging device or a playback device, which are external devices, as an external video signal and an external audio signal. Since the video switching means switches to either the internal video signal derived from the video imaging means or the external video signal input to the video input means and transmits to the other party, the caller imaged by the video imaging means In addition to this video, an external video signal from an external device can be transmitted to the other party, and explanatory materials can be effectively displayed as images and videos. The audio switching means is linked to the video switching means to switch to the internal audio signal when switched to the internal video signal, and to mix both the external audio signal and the internal audio signal when switched to the external video signal, Send to the other party. Since not only the external audio signal input with the external video signal but also the caller's internal audio signal acquired by the audio acquisition means is mixed with the external audio signal and transmitted, the conversation with the other party on the external video signal can be communicated externally. It can be performed simultaneously with the display of the video signal.

また映像切換スイッチ19が内部映像信号を相手側に送信するように切換えられているときには、相手側からの相手音声信号の音響出力をスピーカ30から導出するように音声切換スイッチ20が音声信号を切換えるので、従来からのテレビ通話と同様に、相互に相手側の映像をディスプレイ4に表示しながら相互に通話を行うことができる。映像切換スイッチ19が外部映像信号を相手側に送信するように切換えられているときは、音声切換スイッチ20が相手音声信号を外部音声信号とMIX31でミキシングした音声信号の音響出力をスピーカ30から導出するように切換えるので、相手側に送信している外部音声を自分でも聞きながら、相手側との通話を行うことができる。   When the video switch 19 is switched to transmit the internal video signal to the other party, the voice switch 20 switches the audio signal so that the sound output of the partner voice signal from the other party is derived from the speaker 30. Therefore, similarly to the conventional video call, it is possible to make a call with each other while displaying the other party's video on the display 4. When the video switch 19 is switched to transmit the external video signal to the other party, the sound output of the voice signal obtained by mixing the partner voice signal with the external voice signal by the MIX 31 is derived from the speaker 30. Therefore, the user can talk with the other party while listening to the external voice transmitted to the other party.

また映像切換スイッチ19が外部映像信号を相手側に送信するように切換えられているときには、VMIX35で相手側からの相手映像信号とともに、外部映像信号もディスプレイ4表示するので、相手側に送信している外部映像を自分でも見ながら、相手側との通話を行うことができる。   When the video changeover switch 19 is switched to transmit the external video signal to the other party, the VMIX 35 displays the external video signal together with the partner video signal from the other party on the display 4 so that it can be transmitted to the other party. You can make a call with the other party while watching the external video.

また、利得調整増幅器23,24によって、音声信号のミキシングでの混合状態を、通話者がアダプタ本体5の操作部やリモコン6などの操作手段で調整操作可能なので、相手側と通話しながら、相手側の反応を見て、適切な混合状態に調整することができる。   In addition, the gain adjustment amplifiers 23 and 24 allow the caller to adjust the mixed state of the audio signal mixing by operating means such as the operation unit of the adapter body 5 or the remote controller 6, so that the other party can talk while talking to the other party. By looking at the reaction on the side, it can be adjusted to an appropriate mixing state.

また、ビデオ記録再生装置などに記録されている映像信号および音声信号を再生して、外部映像入力端子15および外部音声入力端子18から入力して相手側に送信したり、通話者がビデオカメラなどの映像音声取得手段で映像信号および音声を取得しながら外部映像入力端子14および外部音声入力端子17から入力して相手側に送信したりするように、切換えることができる。さらに、外部映像入力端子15および外部音声入力端子18にビデオカメラなどの映像音声取得手段を接続すれば、外部音声信号にマイクロホン3aで取得する内部音声信号をミキシングすることができる。外部映像入力端子15および外部音声入力端子18にたとえばビデオカメラを接続し、テレビ通話装置1の周辺から離れている場所を撮像してその映像信号を相手側に送信している場合でも、テレビ通話装置1の周辺で話す音声も同時にマイクロホン3aで取得して相手側に送信することができる。   In addition, video signals and audio signals recorded in a video recording / reproducing apparatus or the like are reproduced and input from the external video input terminal 15 and the external audio input terminal 18 and transmitted to the other party, or the caller receives a video camera or the like. The video / audio acquisition means can be switched so as to input from the external video input terminal 14 and the external audio input terminal 17 and transmit to the other party while acquiring the video signal and audio. Furthermore, if video / audio acquisition means such as a video camera is connected to the external video input terminal 15 and the external audio input terminal 18, the internal audio signal acquired by the microphone 3a can be mixed with the external audio signal. Even when a video camera, for example, is connected to the external video input terminal 15 and the external audio input terminal 18 to image a place away from the periphery of the video call device 1 and transmit the video signal to the other party, the video call Voices spoken around the device 1 can be simultaneously acquired by the microphone 3a and transmitted to the other party.

図3は、本発明の実施のさらに他の形態としてのテレビ通話装置51の概略的な電気的構成を示す。図2のテレビ通話装置1と対応する部分には同一の参照符を付して、重複する説明を省略する。テレビ通話装置51では、外部映像入力端子52および外部音声入力端子53はそれぞれ1系統だけ備え、映像切換スイッチ54およびそれに連動する音声切換スイッチ55は、内部映像信号と外部映像信号、内部音声信号と外部音声信号との2系統をそれぞれ切換える。すなわち、映像切換スイッチ54は、カメラ2が接続される内部映像入力端子13と外部映像入力端子52との間を切換える。音声切換スイッチ55は、マイクロホン3からの内部音声入力端子16であるa側と、外部音声入力端子53であるb側とを、映像切換スイッチ54に連動して切換える。   FIG. 3 shows a schematic electrical configuration of a video communication device 51 as still another embodiment of the present invention. Portions corresponding to those of the video communication device 1 in FIG. 2 are denoted by the same reference numerals, and redundant description is omitted. In the video communication device 51, the external video input terminal 52 and the external audio input terminal 53 are each provided with only one system, and the video changeover switch 54 and the audio changeover switch 55 linked thereto are provided with an internal video signal, an external video signal, and an internal audio signal. The two systems for the external audio signal are switched. That is, the video switch 54 switches between the internal video input terminal 13 to which the camera 2 is connected and the external video input terminal 52. The audio changeover switch 55 switches between the a side that is the internal audio input terminal 16 from the microphone 3 and the b side that is the external audio input terminal 53 in conjunction with the video changeover switch 54.

経路切換スイッチ56は、外部音声信号がマイクロホンで音響信号を取得して音声信号に変換するような場合には、スピーカ30で音響再生する相手音声信号が取得されて相手側に送信され、相手側のスピーカで再生されてマイクロホンに取得されるループが形成されるおそれがあるので、音声信号の経路にエコーキャンセラ22が入るように、c側に切換える。外部音声入力端子53に入力される外部音声信号がVTRやDVDなどの再生出力の場合には、相手音声信号がスピーカ30から音響化されても取得するマイクロホンを用いることはないので、音声信号の経路にエコーキャンセラ22が入らないようにd側に切換える。そして音声信号は、MIX57により混合される。また、 利得調整増幅器58は、VTRやDVDなどの外部入力音声信号の増幅をするものである。このようにすれば、同一の外部音声入力端子53に、ハウリング防止対策を施す必要があるマイクロホンなどを接続しても、エコーキャンセラ22でハウリング防止を図ることができる。また、ハウリング防止対策を施す必要がない再生音などを送信する場合は、エコーキャンセラ22を通さないようにして、音質への影響を避けることができる。   When an external audio signal acquires a sound signal with a microphone and converts the sound signal into a sound signal, the path switch 56 acquires the other party's voice signal to be reproduced by the speaker 30 and transmits it to the other party. Since a loop that is reproduced by the speaker and acquired by the microphone may be formed, switching to the c side is performed so that the echo canceller 22 enters the path of the audio signal. When the external audio signal input to the external audio input terminal 53 is a reproduction output such as a VTR or a DVD, the microphone to be acquired is not used even if the other party audio signal is made acoustic from the speaker 30. Switch to the d side so that the echo canceller 22 does not enter the path. The audio signal is mixed by MIX57. The gain adjustment amplifier 58 amplifies an external input audio signal such as a VTR or DVD. In this way, the echo canceller 22 can prevent howling even if the same external audio input terminal 53 is connected to a microphone or the like that needs to be subjected to howling prevention. Further, when transmitting reproduced sound or the like that does not require howling prevention measures, it is possible to avoid the influence on the sound quality by not passing through the echo canceller 22.

なお、各実施の形態のテレビ通話装置1,51では、アダプタ本体5にビデオカメラやディスプレイ4を接続しているけれども、テレビ電話装置やテレビ会議装置として一体化するような構成とすることもできる。また、アダプタ装置5は、インターネットに接続する汎用のコンピュータ装置に、プログラムを読込ませて実現することもできる。さらに、携帯電話機の形態で一体化し、無線のデータ通信回線や携帯電話網を介してテレビ通話を行わせることもできる。   In the video communication devices 1 and 51 of each embodiment, the video camera and the display 4 are connected to the adapter main body 5, but may be configured to be integrated as a video phone device or a video conference device. . The adapter device 5 can also be realized by having a general-purpose computer device connected to the Internet read the program. Further, it can be integrated in the form of a mobile phone, and a video call can be performed via a wireless data communication line or a mobile phone network.

また、映像と音声とが混在している信号、たとえば外部の機器として携帯電話機を用い、パーソナルコンピュータと接続するためのUSB(Universal Serial Bus)などのインタフェースで映像信号と音声信号とを同時に入力し、内部で分離するようにすることもできる。さらに、接続している携帯電話機に他の携帯電話機から映像と音声とを携帯電話通信網を介して入力することもできる。さらに、携帯電話機と同様な構成の無線端末やPDAを用い、Blutoothなどの無線データ通信で映像と音声とを入力することもできる。また、パーソナルコンピュータなどでプレゼンテーション用のアプリケーションプログラムなどを動作させ、出力される画像データを外部映像信号として入力することもできる。さらに、パーソナルコンピュータやゲーム機器でインターネット利用の対戦型ゲームを行う際に、テレビ通話の外部映像や音声として送受信すれば、相手を見ながら対戦することができる。   Also, a signal containing both video and audio, for example, using a mobile phone as an external device, and simultaneously inputting the video signal and the audio signal through an interface such as a USB (Universal Serial Bus) for connecting to a personal computer. It can also be separated inside. Furthermore, video and audio can be input to the connected mobile phone from another mobile phone via the mobile phone communication network. Furthermore, using a wireless terminal or PDA having a configuration similar to that of a mobile phone, video and audio can be input through wireless data communication such as Bluetooth. In addition, a presentation application program or the like can be operated on a personal computer or the like, and output image data can be input as an external video signal. Furthermore, when a battle game using the Internet is performed on a personal computer or a game machine, it is possible to battle while watching the opponent if it is transmitted and received as an external video or audio of a video call.

本発明の実施の一形態であるテレビ通話装置1の概略的なシステム構成を示すブロック図である。It is a block diagram which shows the schematic system configuration | structure of the video call apparatus 1 which is one Embodiment of this invention. 図1のテレビ通話装置1の概略的な電気的構成を示すブロック図である。FIG. 2 is a block diagram showing a schematic electrical configuration of the video communication device 1 of FIG. 1. 本発明の実施の他の形態であるテレビ通話装置51の概略的な電気的構成を示すブロック図である。It is a block diagram which shows schematic electrical structure of the video call apparatus 51 which is other embodiment of this invention.

符号の説明Explanation of symbols

1,51 テレビ通話装置
1a,51a 送信部
1b,51b 受信部
2 カメラ
3 カメラ部
3a マイクロホン
3b リモコン受光部
4 ディスプレイ
5 アダプタ本体
6 リモコン
13 内部映像入力端子
14,15,52 外部映像入力端子
17,18,53 外部音声入力端子
19,54 映像切換スイッチ
20,55 音声切換スイッチ
21,27,31,57 MIX
22 エコーキャンセラ
23,24,58 利得調整増幅器
30 スピーカ
35 VMIX
56 経路切換スイッチ
DESCRIPTION OF SYMBOLS 1,51 Video call apparatus 1a, 51a Transmission part 1b, 51b Reception part 2 Camera 3 Camera part 3a Microphone 3b Remote control light-receiving part 4 Display 5 Adapter main body 6 Remote control 13 Internal video input terminal 14, 15, 52 External video input terminal 17, 18, 53 External audio input terminal 19, 54 Video selector switch 20, 55 Audio selector switch 21, 27, 31, 57 MIX
22 Echo canceller 23, 24, 58 Gain adjustment amplifier 30 Speaker 35 VMIX
56 Route selector switch

Claims (6)

相手側の映像を相互に表示しながら通話を行うテレビ通話装置において、
通話者を撮像して内部映像信号を導出する映像撮像手段と、
通話者の音声を取得して内部音声信号を導出する音声取得手段と、
外部の機器からの映像信号を外部映像信号として入力する映像入力手段と、
外部の機器からの音声信号を外部音声信号として入力する音声入力手段と、
映像撮像手段から導出される内部映像信号、または映像入力手段に入力される外部映像信号のいずれかに切換えて、通話相手に送信する映像切換手段と、
映像切換手段に連動して、内部映像信号に切換えられるときは内部音声信号に切換え、外部映像信号に切換えられるときは、外部音声信号および内部音声信号の両方をミキシングして、通話相手に送信する音声切換手段とを含むことを特徴とするテレビ通話装置。
In a video calling device that makes a call while displaying the other party's video each other,
Video imaging means for imaging a caller and deriving an internal video signal;
Voice acquisition means for acquiring the voice of the caller and deriving an internal voice signal;
Video input means for inputting a video signal from an external device as an external video signal;
An audio input means for inputting an audio signal from an external device as an external audio signal;
Video switching means for switching to either an internal video signal derived from the video imaging means or an external video signal input to the video input means, and transmitting to the other party,
In conjunction with the video switching means, when switching to the internal video signal, switch to the internal audio signal, and when switching to the external video signal, mix both the external audio signal and the internal audio signal and transmit to the other party And a voice switching device.
前記音声切換手段は、前記映像切換手段に連動して、内部映像信号に切換えられるときは通話の相手側からの相手音声信号を、外部映像信号に切換えられるときは、該相手音声信号および外部音声信号をミキシングした音声信号を、切換えて音響出力を導出することを特徴とする請求項1記載のテレビ通話装置。   The voice switching means is linked to the video switching means, and when switching to the internal video signal, the voice signal from the other party of the call is switched to the external video signal. The video call device according to claim 1, wherein an audio output is derived by switching an audio signal obtained by mixing the signals. 前記映像切換手段に連動して、内部映像信号に切換えられるときは通話の相手側からの相手映像信号を表し、外部映像信号に切換えられるときは、該相手映像信号とともに、外部映像信号を表示する表示手段をさらに含むことを特徴とする請求項1または2記載のテレビ通話装置。   In conjunction with the video switching means, when switched to the internal video signal, it represents the partner video signal from the other party of the call, and when switched to the external video signal, the external video signal is displayed together with the partner video signal. 3. The video call device according to claim 1, further comprising display means. 前記通話者が前記ミキシングでの混合状態を調整操作可能な操作手段をさらに含むことを特徴とする請求項1〜3のいずれか1つに記載のテレビ通話装置。   The video call device according to any one of claims 1 to 3, further comprising operation means that allows the caller to adjust the mixing state in the mixing. 前記映像入力手段および前記音声入力手段は、
映像信号および音声信号を再生して導出する映像音声再生手段からの入力用と、
映像信号および音声信号を取得して導出する映像音声取得手段からの入力用とを、
含むことを特徴とする請求項1〜4のいずれか1つに記載のテレビ通話装置。
The video input means and the audio input means are:
For input from video / audio reproduction means for reproducing and deriving video and audio signals;
For input from a video / audio acquisition means for acquiring and deriving a video signal and an audio signal,
The video call device according to any one of claims 1 to 4, further comprising:
前記内部音声信号とミキシングされる外部音声信号は、前記映像音声取得手段から入力される音声信号であることを特徴とする請求項5記載のテレビ通話装置。   6. The video call device according to claim 5, wherein the external audio signal mixed with the internal audio signal is an audio signal input from the video / audio acquisition means.
JP2004273985A 2004-09-21 2004-09-21 Television telephone call device Pending JP2006093883A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004273985A JP2006093883A (en) 2004-09-21 2004-09-21 Television telephone call device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004273985A JP2006093883A (en) 2004-09-21 2004-09-21 Television telephone call device

Publications (1)

Publication Number Publication Date
JP2006093883A true JP2006093883A (en) 2006-04-06

Family

ID=36234464

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004273985A Pending JP2006093883A (en) 2004-09-21 2004-09-21 Television telephone call device

Country Status (1)

Country Link
JP (1) JP2006093883A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010213179A (en) * 2009-03-12 2010-09-24 Seiko Epson Corp Apparatus, system, method, and program for supplying image voice

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010213179A (en) * 2009-03-12 2010-09-24 Seiko Epson Corp Apparatus, system, method, and program for supplying image voice

Similar Documents

Publication Publication Date Title
EP2482612B1 (en) Method, application server and system for privacy protection in video call
US8994881B2 (en) Method and apparatus for simultaneously viewing multimedia content and accepting an incoming video call communication
EP2154885B1 (en) A caption display method and a video communication control device
US6201562B1 (en) Internet protocol video phone adapter for high bandwidth data access
WO2007082433A1 (en) Apparatus, network device and method for transmitting video-audio signal
US7180535B2 (en) Method, hub system and terminal equipment for videoconferencing
TWI451746B (en) Video conference system and video conference method thereof
TW201320744A (en) Video conference system, video conference apparatus and method thereof
CN115344230A (en) Method and system for switching wireless audio connection during call
KR101585871B1 (en) Apparatus and method for providing white board service in mobile communication system
JP2002058005A (en) Video conference and video telephone system, device for transmission and reception, image communication system, device and method for communication, recording medium and program
US8373740B2 (en) Method and apparatus for video conferencing in mobile terminal
JP5436743B2 (en) Communication terminal device and communication control device
KR20120126595A (en) USB camera apparatus
JP4572697B2 (en) Method, terminal and program for reproducing video content data during call connection based on IP telephone function
JP2006093883A (en) Television telephone call device
JP4391362B2 (en) Image communication device
KR200265603Y1 (en) The CTI conference system using technology of separate transmission of multi-media
KR100850350B1 (en) Home Server having Multilateral Image Communication Using TV
WO2004077829A1 (en) Video conference system for mobile communication
KR100729628B1 (en) Unification home gateway apparatus
KR20100001536A (en) Video telecommunication system using ip set-top box
JP2001036881A (en) Voice transmission system and voice reproduction device
EP1892961A1 (en) Method of audio-visual communication using a television and television using the same
TWI468013B (en) Video conference system and method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060912

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090415

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090623

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090824

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091013