WO2012111059A1 - Content reproduction device with videophone function and method of processing audio for videophone - Google Patents

Content reproduction device with videophone function and method of processing audio for videophone Download PDF

Info

Publication number
WO2012111059A1
WO2012111059A1 PCT/JP2011/007033 JP2011007033W WO2012111059A1 WO 2012111059 A1 WO2012111059 A1 WO 2012111059A1 JP 2011007033 W JP2011007033 W JP 2011007033W WO 2012111059 A1 WO2012111059 A1 WO 2012111059A1
Authority
WO
WIPO (PCT)
Prior art keywords
content
video
identification information
audio
audio signal
Prior art date
Application number
PCT/JP2011/007033
Other languages
French (fr)
Japanese (ja)
Inventor
奥埜 貢士
隆 坪根
達人 堀部
隆造 渡邊
友章 田中
知幸 南野
Original Assignee
パナソニック株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パナソニック株式会社 filed Critical パナソニック株式会社
Publication of WO2012111059A1 publication Critical patent/WO2012111059A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/4223Cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/15Transducers incorporated in visual displaying devices, e.g. televisions, computer displays, laptops

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

When the same program is being watched by a partner device and a self-device a videophone control unit (160) of a television (100) controls an echo cancelling unit (140) such that a call audio received from the partner device and a television audio received by the self-device and outputted from a speaker (134) are eliminated from the audio inputted from a microphone (144) (a call audio received from the partner device, the television audio received by the self-device and outputted from the speaker (134) and a call audio surrounding the self-device). When the same program is not being watched, the videophone control unit (160) of the television (100) controls the echo cancelling unit (140) such that the call audio received from the partner device is eliminated from the audio inputted from the microphone (144).

Description

テレビ電話機能付きコンテンツ再生装置及びテレビ電話音声処理方法Content reproduction apparatus with videophone function and videophone audio processing method
 本発明は、映像および音声から構成されるコンテンツを出力する装置(代表的にはテレビジョン受像機(以下、単にテレビまたはTVと記載))に、テレビ電話による通話を可能とする機能を設けて、コンテンツ視聴とともに、他の装置との間でテレビ電話による通話を行なうことができるようにした、画像音声通信技術に関する。 According to the present invention, a device for outputting contents composed of video and audio (typically, a television receiver (hereinafter simply referred to as a television or a TV)) is provided with a function capable of making telephone calls by videophone. The present invention relates to a video and audio communication technology that enables videophone calls to be made with other devices as well as content viewing.
 従来から実現されているテレビ電話に加えて、最近では、常時接続ブロードバンド技術の進展に伴い、IP(Internet Protocol)テレビ電話が普及しつつある。このようなIPテレビ電話機では、内蔵のカメラによって撮影された映像情報、および、内蔵のマイクによって取得された音声情報を、IPネットワークを介して通信相手先に送信することが可能である。さらに、IPテレビ電話機に内蔵されたカメラおよびマイクを別体のモジュールとして、そのモジュールをパソコンに接続してIPテレビ電話を実現する場合もある。さらに、モニタの代わりにテレビの表示部を用いることもある。テレビを用いたIPテレビ電話においては、カメラおよびマイクから構成されるモジュールを、インターネット接続されたテレビに接続したり内蔵したりすることが考えられる。 Recently, IP (Internet Protocol) videophones are becoming popular with the development of always-on broadband technology in addition to videophones which have been conventionally realized. In such an IP video telephone, it is possible to transmit video information captured by a built-in camera and audio information acquired by a built-in microphone to a communication partner via an IP network. Furthermore, there are also cases where an IP videophone is realized by connecting the module to a personal computer by using a camera and a microphone built in the IP videophone as separate modules. Furthermore, a display unit of a television may be used instead of the monitor. In an IP videophone using a television, it is conceivable to connect or incorporate a module comprising a camera and a microphone to a television connected to the Internet.
 特開2007-281923号公報(特許文献1)は、カメラおよびマイクから構成されるモジュールをテレビに内蔵した装置を開示する。この装置は、テレビ電話機能を備えたテレビであって、チャンネル切換などに応じてその情報を遠隔地のテレビに送信して、遠隔地のテレビはこれを受信して遠隔地のテレビに同じ番組を表示する。両者が同じ番組を見ることにより体験共有感を演出する。このようにすると、たとえば、互いに遠隔地に住んでいる家庭どうしがテレビ鑑賞を通じて日常的に情報を交換し、お互いの様子を見守るとともに体験の共有による擬似的な団らんを演出することができる。 Japanese Patent Laid-Open No. 2007-281923 (Patent Document 1) discloses an apparatus in which a module including a camera and a microphone is incorporated in a television. This device is a television equipped with a video telephone function, and transmits the information to the remote television in response to channel switching etc., which is received by the remote television and the same program on the remote television Display When both parties watch the same program, they create a sense of experience sharing. In this way, for example, families living in remote areas can exchange information on a daily basis through television watching, and can monitor each other's appearance and can create a simulated gang by sharing experiences.
日本国公開特許公報「特開2007-281923号公報」Japanese Patent Application Publication "2007-281923"
 しかしながら、特許文献1に開示された技術を用いて、テレビ視聴とテレビ電話とを同時に実行すると、同じ番組を視聴しているときに、以下の問題が発生する。相手先のテレビにおいて、相手先のユーザの声のみならずテレビ音声もマイクに入力されてしまい、自機へ送信される。自機のスピーカから、相手先のテレビから受信した(相手先のテレビのチューナーが受信して出力した)テレビ音声が出力されてしまい、自機で受信したテレビ音声とハウリングを起こしてしまう。 However, when the television viewing and the videophone are simultaneously executed using the technology disclosed in Patent Document 1, the following problems occur when the same program is viewed. In the other party's television, not only the voice of the other party's user but also the television sound is input to the microphone and transmitted to the own device. TV sound received from the other party's TV (received and output from the partner's TV tuner and output) is output from the speaker of the own machine, and howling occurs with the television sound received by the own machine.
 これに対応するために、相手先のテレビでは、チューナーが受信したテレビ音声をスピーカから出力しないようにすることも考えられる。しかしながら、これでは、異なる番組を視聴していた場合、相手先のテレビ音声が背景音として送信されないので、テレビ視聴とテレビ電話とを両立できない。 In order to cope with this, it may be considered that the television of the other party is made not to output the television sound received by the tuner from the speaker. However, in this case, when watching a different program, the television sound of the other party is not transmitted as a background sound, so that it is not possible to balance television viewing with videophone.
 本発明は、上述した問題点を解決するためになされたものであって、その目的は、テレビ視聴(広くはコンテンツ視聴)とテレビ電話とを両立することのできる、画像音声通信技術を提供することである。 The present invention has been made to solve the above-mentioned problems, and an object thereof is to provide an image and voice communication technology capable of achieving both television viewing (generally content viewing) and videophone. It is.
 本発明のある局面に係るテレビ電話機能付きコンテンツ再生装置は、映像および音声から構成されるコンテンツを出力するテレビ機能とテレビ電話機能とを備えたテレビ電話機能付きコンテンツ再生装置であって、TV電話の相手機と映像信号及び音声信号を通信するTV電話通信部と、映像信号を入力する映像入力部と、音声信号を入力する音声入力部と、コンテンツを取得する取得部と、取得部が取得したコンテンツの映像信号とTV電話通信部が取得した映像信号とを出力する映像出力部と、取得部が取得したコンテンツの音声信号とTV電話通信部が取得した音声信号とを出力する音声出力部と、音声入力部に入力された音声信号から、指定された音声信号を消去するエコーキャンセル部と、TV電話通信部に、エコーキャンセル部から出力された音声信号と映像入力部から入力された映像信号とを相手機に送信させるTV電話制御部と、を備える。このTV電話制御部は、TV電話通信部を介して相手機において視聴中のコンテンツの情報である第1コンテンツ特定情報を取得し、取得した第1コンテンツ特定情報と自機において視聴中のコンテンツの情報である第2コンテンツ特定情報とを比較し、第1コンテンツ特定情報と第2コンテンツ特定情報が一致すると判断した場合は、エコーキャンセル部に対して、音声入力部に入力された音声信号から、TV電話通信部が取得した音声信号及び取得部が取得したコンテンツの音声信号を消去させる。 A content reproducing apparatus with a videophone function according to an aspect of the present invention is a content reproducing apparatus with a videophone function including a television function for outputting content composed of video and audio and a videophone function, Video telephone and communication units that communicate video and audio signals with each other, a video input unit that inputs video signals, an audio input unit that inputs audio signals, an acquisition unit that acquires content, and an acquisition unit A video output unit that outputs a video signal of the selected content and a video signal acquired by the TV telephone communication unit; and an audio output unit that outputs an audio signal of the content acquired by the acquisition unit and an audio signal acquired by the TV telephone communication unit And an echo cancellation unit that cancels a designated audio signal from the audio signal input to the audio input unit; And a TV telephone control unit to transmit output and the video signal inputted from the audio signal and the video input section to the other aircraft from. The video telephone control unit acquires first content identification information which is information of content being viewed at the other party via the video telephone communication unit, and the acquired first content identification information and the acquired content of the content being viewed at the own device. If it is determined that the first content identification information and the second content identification information match by comparing the second content identification information, which is information, to the echo cancellation unit, from the audio signal input to the audio input unit, The audio signal acquired by the TV telephone communication unit and the audio signal of the content acquired by the acquisition unit are erased.
 本発明の別の局面に係るテレビ電話音声処理方法は、映像および音声から構成されるコンテンツを出力するテレビ機能とテレビ電話機能とを備えたテレビ電話機能付きコンテンツ再生装置のテレビ電話音声処理方法であって、視聴中のコンテンツの情報である第2コンテンツ特定情報を特定するステップと、TV電話の相手機と映像信号及び音声信号を送受信するステップと、自機の映像信号を入力するステップと、自機の音声信号を入力するステップと、送受信するステップを介して、相手機において視聴中のコンテンツの情報である第1コンテンツ特定情報を取得するステップと、第1コンテンツ特定情報と第2コンテンツ特定情報とを比較するステップと、第1コンテンツ特定情報と第2コンテンツ特定情報が一致する場合、入力した自機の音声信号から、送受信するステップを介して取得した音声信号及び視聴中のコンテンツの音声信号を消去した音声信号を生成するステップと、送受信するステップに、自機の映像信号及び生成した音声信号を送信させるステップと、を有する。 A videophone audio processing method according to another aspect of the present invention is a videophone audio processing method of a content reproducing apparatus with a videophone function having a television function for outputting contents composed of video and audio and a videophone function. A step of specifying second content specification information which is information of a content being viewed, a step of transmitting / receiving a video signal and an audio signal to / from a partner device of a video telephone, a step of inputting a video signal of the own device The first content identification information and the second content identification are obtained by acquiring the first content identification information which is the information of the content being viewed on the other party through the steps of inputting the audio signal of the own device and transmitting and receiving Entering the step of comparing the information and the first content identification information and the second content identification information if they match In the steps of generating an audio signal obtained by erasing the audio signal acquired through the transmitting and receiving step and the audio signal of the content being viewed from the audio signal of the own device, and transmitting and receiving the video signal of the own device and the generated audio Sending a signal.
 上述したテレビ電話機能付きコンテンツ再生装置によると、相手機と自機で同じコンテンツを視聴していると判定されると、音声入力部から入力された音声のうち、相手機から受信した相手側音声および自機で取得したコンテンツ音声が消去されて、相手機に送信される。このため、相手機から、相手機が出力したコンテンツ音声が消去されて送信されてくるので、自機でコンテンツ音声がハウリングすることを回避できる。さらに、相手機と自機で同じコンテンツを視聴していると判定されないと、音声入力部から入力された音声のうち、相手機から受信した相手側音声が消去されて、相手機に送信される。このため、相手機から、相手機が取得したコンテンツ音声が消去されないで送信されてくるので、相手機が自機とは異なるコンテンツを視聴していることがわかるとともに、そのコンテンツを視聴しているときの相手の声を聞くことができる。 According to the content reproducing apparatus with videophone function described above, when it is determined that the same content is being viewed by the other party's device and the own device, the other party's voice received from the other party's voice among the voices input from the voice input unit And the content audio acquired by the own device is erased and transmitted to the other device. For this reason, since the content audio output from the other device is erased and transmitted from the other device, it is possible to prevent the content audio from being howling in the own device. Furthermore, if it is not determined that the same device is viewing the same content as the other device, the other party's voice received from the other device is deleted from the audio input from the voice input unit and transmitted to the other device . Therefore, since the other party's device transmits the content audio acquired by the other party's device without being deleted, it can be known that the other party's device is viewing the content different from that of the own device, and viewing the content I can hear the voice of the other party.
図1は、本発明の実施の形態に係るTV電話システムの全体構成図である。FIG. 1 is an overall configuration diagram of a videophone system according to an embodiment of the present invention. 図2は、図1のTVのハードウェア構成図である。FIG. 2 is a hardware block diagram of the TV of FIG. 図3は、図2のTV電話制御部で実行されるプログラムの制御構造を示すフローチャートである。FIG. 3 is a flow chart showing a control structure of a program executed by the video telephone control unit of FIG. 図4は、本発明の実施の形態に係るTV電話システムの動作を説明するための図(その1)である。FIG. 4 is a diagram (part 1) for explaining the operation of the videophone system according to the embodiment of the present invention. 図5は、本発明の実施の形態に係るTV電話システムの動作を説明するための図(その2)である。FIG. 5 is a diagram (part 2) for explaining the operation of the videophone system according to the embodiment of the present invention. 図6は、本発明の実施の形態に係るTV電話システムの動作を説明するための図(その3)である。FIG. 6 is a diagram (part 3) for explaining the operation of the videophone system according to the embodiment of the present invention. 図7は、本発明の実施の形態に係るTV電話システムの動作を説明するための図(その4)である。FIG. 7 is a diagram (4) for explaining the operation of the videophone system according to the embodiment of the present invention.
 以下、図面を参照しつつ本発明の実施の形態に係るTV電話システムについて説明する。以下の説明においては、同一の構成には同一の符号を付してある。それらの名称及び機能は同じである。従って、それらについての詳細な説明は繰り返さない。 Hereinafter, a video telephone system according to an embodiment of the present invention will be described with reference to the drawings. In the following description, the same components are denoted by the same reference numerals. Their names and functions are the same. Therefore, the detailed description about them is not repeated.
 (構成)
 図1を参照して、本実施の形態に係るTV電話システムは、地上放送局からのデジタル放送波または放送衛星からのデジタル放送波を受信して映像と音声とを出力するテレビ機能に加えてTV電話機能を備えた2台のテレビ(テレビ電話機能付きコンテンツ再生装置)100を、ネットワークで接続したシステムである。なお、放送された電波に限定されず、TV機能に代えて/加えて、ネットワークを介して受信したコンテンツデータに基づいて映像と音声とを出力する機能を有しても構わない。このテレビ100が、テレビ電話機能付きコンテンツ再生装置の一例である。
(Constitution)
Referring to FIG. 1, the videophone system according to the present embodiment is added to a television function that receives digital broadcast waves from ground broadcasting stations or digital broadcast waves from broadcast satellites and outputs video and audio. This is a system in which two television sets (content reproduction devices with video telephone function) 100 having a video telephone function are connected by a network. The present invention is not limited to the broadcasted radio waves, and may have a function of outputting video and audio based on content data received via a network instead of / in addition to the TV function. The television 100 is an example of a content reproducing device with a videophone function.
 これらのテレビ100は、相手先のテレビ100において視聴中の番組情報(第1コンテンツ特定情報)を取得し、同一番組を視聴中であると(第1コンテンツ特定情報と自機において視聴中の番組情報(第2コンテンツ特定情報)とが一致していると)判断した場合は、マイク144から入力された音声(相手機から受信した通話音声、自機で受信してスピーカ134から出力したテレビ音声および自機の周囲の通話音声)から、相手機から受信した通話音声および自機で受信してスピーカ134から出力したテレビ音声を消去して、自機の周囲の通話音声のみを相手機へ送信するという特徴を備える。図1に示すシステム構成図においては、機能が全く同じテレビ100どうしをネットワーク接続しているが、上述した特徴を実現するための機能を備えたテレビであればよく、全く同じ機能を備えるテレビである必要はない。 The television 100 acquires program information (first content identification information) being viewed on the other party's television 100, and when the same program is being viewed (the first content identification information and the program being viewed on the own device) When it is determined that the information (the second content identification information) matches, the voice input from the microphone 144 (the call voice received from the other party, the television voice received by the own device and output from the speaker 134 And from the call voice around the own machine, the call voice received from the other machine and the TV sound received by the own machine and output from the speaker 134 are erased, and only the call voice around the own machine is sent to the other machine Have the feature of In the system configuration diagram shown in FIG. 1, although the television 100 having the identical function is connected to the network, it may be a television provided with the function for realizing the features described above, and a television having the identical function. It does not have to be.
 図1に示すように、これらのテレビ100は、映像を出力する液晶ディスプレイまたはプラズマディスプレイ等からなるモニタ124と、音声を出力するスピーカ134と、テレビ電話用の音声が入力されるマイク144および映像が入力されるカメラ154とを備える。 As shown in FIG. 1, these televisions 100 have a monitor 124 such as a liquid crystal display or plasma display for outputting video, a speaker 134 for outputting audio, a microphone 144 for receiving videophone audio, and video And the camera 154 to which the
 図2に、テレビ100のハードウェア構成図を示す。チューナー(取得部)102は、アンテナ(図示せず)で受信したデジタル放送波を受けて、復調などの処理を行った信号をDEMUX回路104へ送る。DEMUX回路104は、チューナー102から受けた信号をMPEGデータと番組付属情報とに分離して、MPEGデータをデコード部106へ送る。デコード部106は、DEMUX回路104から受けたMPEGデータを復調し、得られた映像信号を映像合成部120へ、音声信号を音声合成部130へ送る。 The hardware block diagram of the television 100 is shown in FIG. The tuner (acquisition unit) 102 receives a digital broadcast wave received by an antenna (not shown), and sends a signal subjected to processing such as demodulation to the DEMUX circuit 104. The DEMUX circuit 104 separates the signal received from the tuner 102 into MPEG data and program ancillary information, and sends the MPEG data to the decoding unit 106. The decoding unit 106 demodulates the MPEG data received from the DEMUX circuit 104, and sends the obtained video signal to the video combining unit 120 and the audio signal to the audio combining unit 130.
 メインメモリ108は、番組付属情報などを格納する。番組表制御部110は、メインメモリ108の番組付属情報などから、現在視聴中の番組情報をTV電話制御部160へ送る。 The main memory 108 stores program ancillary information and the like. The program guide control unit 110 sends program information currently being viewed to the video telephone control unit 160 from the program ancillary information of the main memory 108 and the like.
 映像合成部120は、デコード部106から送られた映像信号とTV電話制御部160で生成した映像信号とを合成した信号を、映像出力回路122へ送る。映像出力回路122は、映像合成部120から送られた映像信号をモニタ124へ出力する。映像合成部120と映像出力回路122とモニタ124とで映像出力部121を構成する。 The video combining unit 120 sends to the video output circuit 122 a signal obtained by combining the video signal sent from the decoding unit 106 and the video signal generated by the video telephone control unit 160. The video output circuit 122 outputs the video signal sent from the video synthesis unit 120 to the monitor 124. The video combining unit 120, the video output circuit 122, and the monitor 124 constitute a video output unit 121.
 音声合成部130は、デコード部106から送られた音声信号とTV電話制御部160で生成した音声信号とを合成した信号を、音声出力回路132へ送る。音声出力回路132は、音声合成部130から送られた音声信号をスピーカ134へ出力する。音声合成部130と音声出力回路132とスピーカ134とで音声出力部131を構成する。 The voice synthesis unit 130 sends, to the voice output circuit 132, a signal obtained by combining the voice signal sent from the decoding unit 106 and the voice signal generated by the video telephone control unit 160. The voice output circuit 132 outputs the voice signal sent from the voice synthesis unit 130 to the speaker 134. The voice synthesis unit 130, the voice output circuit 132, and the speaker 134 constitute a voice output unit 131.
 音声入力回路142は、マイク144から入力された音声信号をエコーキャンセル部140へ送る。映像入力回路152は、カメラ154から入力された映像信号をTV電話制御部160へ送る。音声入力回路142とマイク144とで音声入力部141を構成し、映像入力回路152とカメラ154とで映像入力部151を構成する。 The voice input circuit 142 sends the voice signal input from the microphone 144 to the echo cancellation unit 140. The video input circuit 152 sends the video signal input from the camera 154 to the video telephone control unit 160. The audio input circuit 142 and the microphone 144 constitute an audio input unit 141, and the video input circuit 152 and the camera 154 constitute a video input unit 151.
 ネットワーク制御部(テレビ電話通信部)170は、TV電話制御部160と通信して、相手側のテレビ100(相手機)にTV電話の映像信号および音声信号を送信したり、相手機からTV電話の映像信号および音声信号を受信したりする。 The network control unit (video telephone communication unit) 170 communicates with the video telephone control unit 160 to transmit video and audio signals of a video telephone to the other party's television 100 (the other machine), or the other machine Receive video and audio signals.
 リモコン受光部180は、ユーザ操作などによる外部要求を受信して、リモコン制御部182へ通知する。リモコン制御部182は、ユーザの操作に応じて、TV電話についての要求を、TV電話制御部160へ送る。 The remote control light receiving unit 180 receives an external request by a user operation or the like and notifies the remote control control unit 182. The remote control control unit 182 sends a request for a videophone call to the videophone control unit 160 according to the user's operation.
 TV電話制御部160は、ユーザ操作等により、TV電話が開始されたときに、相手機のTV電話制御部160に、視聴中の番組情報(第1コンテンツ特定情報)を問い合わせる。さらに、TV電話制御部160は、自機側のテレビ100(自機)で現在視聴中の番組情報(第2コンテンツ特定情報)と、相手機で現在視聴中の番組情報とが一致するか否かを判定する。 When a videophone call is started by a user operation or the like, the videophone control unit 160 inquires of the videophone control unit 160 of the other device about program information (first content identification information) being viewed. Furthermore, the video telephone control unit 160 determines whether the program information (second content identification information) currently being viewed on the television 100 of the own device (the own device) matches the program information currently being viewed on the partner device. Determine if
 TV電話制御部160は、視聴中の番組が一致すると判定すると、エコーキャンセル部140へ、マイク144から入力された音声(相手機から受信した通話音声、自機で受信してスピーカ134から出力したテレビ音声および自機の周囲の通話音声)から、相手機から受信した通話音声および自機で受信してスピーカ134から出力したテレビ音声を消去するように指示する。 When the video telephone control unit 160 determines that the program being viewed matches, the voice input from the microphone 144 (call voice received from the other party, received by the own device, and output from the speaker 134 to the echo cancellation unit 140 It is instructed to delete the call sound received from the other party's device and the television sound received by the own device and output from the speaker 134 from the television sound and the call voice around the own device.
 TV電話制御部160は、視聴中の番組が一致しないと判定すると、エコーキャンセル部140へ、マイク144から入力された音声(相手機から受信した通話音声、自機で受信してスピーカ134から出力したテレビ音声および自機の周囲の通話音声)から、相手機から受信した通話音声のみを消去するように指示する。 When the video telephone control unit 160 determines that the program being viewed does not match, the voice input from the microphone 144 (call voice received from the other party, received by the own device, and output from the speaker 134 to the echo cancellation unit 140 Instructs to delete only the call voice received from the other party from the TV voice and the call voice around the own machine.
 エコーキャンセル部140は、上述したように、TV電話制御部160からの指示に基づいて、音声入力回路142からの音声から、相手機から受信した通話音声および自機で受信してスピーカ134から出力したテレビ音声を消去したり、相手機から受信した通話音声のみを消去したりする。このとき、エコーキャンセル部140は、TV電話制御部160から送られた相手機から受信した通話音声信号およびデコード部106から送られたTV音声信号を基準信号として、指示された音声を消去する。 As described above, the echo cancellation unit 140 receives the call voice received from the other party and the own device from the voice from the voice input circuit 142 based on the instruction from the video telephone control unit 160 and outputs it from the speaker 134 Delete the recorded TV sound or delete only the call sound received from the other party. At this time, the echo cancellation unit 140 cancels the instructed voice by using the call voice signal received from the partner apparatus sent from the video telephone control unit 160 and the TV voice signal sent from the decoding unit 106 as a reference signal.
 (ソフトウェア構成)
 図3を参照して、TV電話制御部160で実行されるTV電話音声処理の制御構造について説明する。ステップ(以下、ステップをSと記載)1000にて、TV電話制御部160は、リモコン等を用いたユーザの指示に基づいて、TV電話を開始する要求を検出したか否かを判定する。TV電話を開始する要求を検出したと判定されると(S1000にてYES)、処理はS1010へ移される。もしそうでないと(S1000にてNO)、この処理はS1000へ移される。
(Software configuration)
The control structure of the video telephone audio processing performed by the video telephone control unit 160 will be described with reference to FIG. In step (hereinafter, step will be referred to as S) 1000, video telephone control section 160 determines whether or not a request to start a video telephone call has been detected based on a user's instruction using a remote control or the like. If it is determined that a request to start a videophone call has been detected (YES at S1000), the process proceeds to S1010. If not (NO at S1000), the process goes to S1000.
 S1010にて、TV電話制御部160は、通話処理を開始する。このとき、TV電話制御部160は、通信プロトコルに基づいてTV電話が実現できるように処理する。S1020にて、TV電話制御部160は、相手機へ視聴中の番組情報を問い合わせる。ここで、TV電話制御部160は、所定のプロトコル(たとえばhttp)を用いて、相手機へ番組情報を問い合わせる。なお、視聴中の番組情報の問い合わせを受けたテレビ100のTV電話制御部160は、相手機へ番組情報を送信する。ここで、番組情報は、コンテンツ特定情報の一例である。 At S1010, video telephone control section 160 starts call processing. At this time, the video telephone control unit 160 performs processing so that a video telephone can be realized based on the communication protocol. At S1020, video telephone control section 160 inquires of the other party of program information being viewed. Here, the video telephone control unit 160 inquires program information to the partner apparatus using a predetermined protocol (for example, http). In addition, the TV telephone control unit 160 of the television 100 which received the inquiry of the program information being viewed transmits the program information to the other party. Here, program information is an example of content identification information.
 S1030にて、TV電話制御部160は、番組情報を相手機から受信したか否かを判定する。番組情報を相手機から受信すると(S1030にてYES)、処理はS1040へ移される。もしそうでないと(S1030にてNO)、この処理はS1030へ移される。 At S1030, video telephone control section 160 determines whether or not program information has been received from the other party. If program information is received from the other party (YES at S1030), the process proceeds to S1040. If not (NO at S1030), the process goes to S1030.
 S1040にて、TV電話制御部160は、予め定められた時間、双方(相手機、自機)ともチャンネル変更されていないか否かを判定する。このように判定するのは、ザッピング(リモコンでチャンネルを頻繁に切り替えながら視聴する行為)による誤動作を防止するためである。すなわち、相手機と自機との少なくとも一方がチャンネルを切り替えている最中であると、双方の視聴中の番組情報が一致しているか否かを正しく判定することができないからである。予め定められた時間、双方ともチャンネル変更されていないと判定されると(S1040にてYES)、処理はS1050へ移される。もしそうでないと(S1040にてNO)、この処理はS1020へ移される。 At S1040, video telephone control section 160 determines whether or not both of the channels (the opposite device and the own device) have not been changed for a predetermined time. The determination is made in order to prevent a malfunction due to zapping (an act of viewing while switching a channel frequently with a remote control). That is, if at least one of the partner machine and the own machine is switching the channel, it can not be correctly determined whether the program information being viewed by both the parties match. If it is determined that neither of the channels has been changed for a predetermined time (YES in S1040), the process proceeds to S1050. If not (NO at S1040), the process goes to S1020.
 S1050にて、TV電話制御部160は、自機と相手機とで同じ番組を視聴しているか否かを判定する。このとき、TV電話制御部160は、番組表制御部110から送られた番組情報(自機)と、受信した番組情報(相手機)とに基づいて判定する。自機と相手機とで同じ番組を視聴していると判定されると(S1050にてYES)、処理はS1060へ移される。もしそうでないと(S1050にてNO)、処理はS1070へ移される。 At S1050, video telephone control section 160 determines whether or not the same program is being viewed on the own device and the other device. At this time, the video telephone control unit 160 makes a determination based on the program information (own device) sent from the program guide control unit 110 and the received program information (other device). If it is determined that the same program is being viewed on the own apparatus and the other apparatus (YES in S1050), the process proceeds to S1060. If not (NO at S1050), the process proceeds to S1070.
 S1060にて、TV電話制御部160は、自機のマイク144から入力された信号から、相手機から受信した音声信号および自機のスピーカ134からの出力TV音声信号を消去するように、エコーキャンセル部140に指示する。なお、自機のマイク144から入力された信号には、相手機から受信した音声信号および自機のスピーカ134からの出力TV音声信号に加えて、自機の周囲の人の音声信号が含まれる。ここで、相手機も同じ処理を実行するので、相手機から受信した音声信号には、背景のTV音声信号は含まれておらず、相手機の周囲の人の音声信号のみが含まれている。その後、処理はS1080へ移される。 In S1060, the video telephone control unit 160 cancels the echo so that the audio signal received from the other party device and the output TV audio signal from the speaker 134 of the own device are eliminated from the signal input from the microphone 144 of the own device. It instructs the part 140. Note that the signal input from the microphone 144 of the own device includes the audio signals of people around the own device, in addition to the audio signal received from the other device and the output TV audio signal from the speaker 134 of the own device. . Here, since the other device executes the same processing, the audio signal received from the other device does not include the background TV audio signal, but only the sound signals of people around the other device. . Thereafter, the process proceeds to S1080.
 S1070にて、TV電話制御部160は、自機のマイク144から入力された信号から、相手機から受信した音声信号を消去するように、エコーキャンセル部140に指示する。ここで、同じ処理を相手機も実行するので、相手機から受信した音声信号には、背景のTV音声信号に加えて、相手機の周囲の人の音声信号が含まれている。その後、処理はS1080へ移される。 At S1070, video telephone control section 160 instructs echo cancellation section 140 to cancel the audio signal received from the other party from the signal inputted from microphone 144 of the own apparatus. Here, since the same process is executed by the other device, the voice signal received from the other device includes the voice signal of the person around the other device in addition to the background TV voice signal. Thereafter, the process proceeds to S1080.
 S1080にて、TV電話制御部160は、通話処理を実行する。このとき、エコーキャンセル部140で消去されなかった音声信号が相手機へネットワークを介して送信される。 At S1080, video telephone control section 160 executes call processing. At this time, the voice signal not canceled by the echo cancellation unit 140 is transmitted to the other party via the network.
 S1090にて、TV電話制御部160は、リモコン等を用いたユーザの指示に基づいて、TV電話を終了する要求を検出したか否かを判定する。TV電話を終了する要求を検出したと判定されると(S1090にてYES)、処理はS1100へ移される。もしそうでないと(S1090にてNO)、この処理はS1110へ移される。 At S1090, video telephone control section 160 determines whether or not a request to end the video telephone has been detected, based on a user's instruction using a remote control or the like. If it is determined that the request to end the videophone call is detected (YES at S1090), the process proceeds to S1100. If not (NO at S1090), the process goes to S1110.
 S1100にて、TV電話制御部160は、通話処理を終了する。その後、この処理は終了する。 At S1100, video telephone control section 160 ends the call processing. Thereafter, this process ends.
 S1110にて、TV電話制御部160は、チャンネル変更されたか否かを判定する。チャンネル変更されたと判定されると(S1110にてYES)、処理はS1020へ移される。もしそうでないと(S1110にてNO)、この処理はS1080へ移される。 At S1110, videophone control section 160 determines whether or not the channel has been changed. If it is determined that the channel has been changed (YES in S1110), the process proceeds to S1020. If not (NO at S1110), this process is moved to S1080.
 (動作)
 以上のような構造及びフローチャートに基づく本実施の形態に係るテレビ100の動作について説明する。
(Operation)
The operation of television 100 according to the present embodiment based on the above-described structure and flowchart will be described.
 ・視聴している番組が同じである場合
 以下において、自機と相手機とで同じ番組を視聴している場合の動作を図4および図5を用いて説明する。
When the program being watched is the same The operation in the case where the same program is watched by the own machine and the partner machine will be described below with reference to FIGS. 4 and 5.
 TV電話が開始されて(S1000にてYES、S1010)、相手機へ視聴中の番組情報が問合せされて(S1020)、番組情報を受信する(S1030)。予め定められた時間において、図4に示すように同じ番組を視聴している場合には(S1040にてYES、S1050にてYES)、自機のマイク144から入力された信号から、相手機から受信した音声信号および自機のスピーカ134からの出力TV音声信号が、エコーキャンセル部140により消去される(S1060)。 When the videophone call is started (YES in S1000, S1010), the program information being viewed to the other party is inquired (S1020), and the program information is received (S1030). When viewing the same program at a predetermined time as shown in FIG. 4 (YES in S1040, YES in S1050), from the signal input from the microphone 144 of the own machine, from the other party machine The echo cancellation unit 140 cancels the received audio signal and the output TV audio signal from the speaker 134 of its own device (S1060).
 自機も相手機も同じ制御を実行するので、図5に示すように、スピーカ134からは、相手機から受信した通話音声(背景TV音なしで相手の声のみ)および自機で受信してデコードした放送音声が出力される。マイク144では、スピーカ134から出力された音声に加えて、自機の周囲の音声(ここでは自分の音声とする)が入力される。 Since both the own machine and the other machine execute the same control, as shown in FIG. 5, the call voice received from the other machine (only the other party's voice without background TV sound) and the own machine are received from the speaker 134 Broadcast audio decoded is output. In the microphone 144, in addition to the voice output from the speaker 134, the voice around the player (here, the voice of the player) is input.
 マイク144から入力された音声のうち、相手機から受信した通話音声(背景TV音なしで相手の声のみ)および自機で受信してデコードした放送音声が消去されて、通話処理が行われて、映像信号および音声信号(自分の声のみ)が相手機に送信される(S1080)。このような処理が、TV電話の終了要求を検出するまで継続される。このため、相手機から、相手機が受信して出力したTV音声信号が消去されて送信されてくるので、自機でTV音声がハウリングすることを回避できる。 Among the voices input from the microphone 144, the call voice received from the other party (only the other party's voice without background TV sound) and the broadcast voice received and decoded by the own party are erased, and the call processing is performed. , The video signal and the audio signal (only one's voice) are transmitted to the other party (S 1080). Such processing is continued until a video telephone termination request is detected. As a result, the TV sound signal received and output by the partner device is erased and transmitted from the partner device, so that it is possible to prevent the howling of the TV sound by the own device.
 ・視聴している番組が同じでない場合
 以下において、自機と相手機とで異なる番組を視聴している場合の動作を図6および図7を用いて説明する。上述した動作と同じ説明は繰り返さない。
When the programs being watched are not the same, the operation in the case where different programs are watched by the own machine and the partner machine will be described below with reference to FIGS. 6 and 7. The same description as the operation described above will not be repeated.
 予め定められた時間において、図6に示すように異なる番組を視聴している場合には(S1040にてYES、S1050にてNO)、自機のマイク144から入力された信号から、相手機から受信した音声信号が、エコーキャンセル部140により消去される(S1070)。 When viewing a different program as shown in FIG. 6 at a predetermined time (YES in S1040, NO in S1050), from the signal inputted from the microphone 144 of the own machine, from the other party machine The received voice signal is deleted by the echo cancellation unit 140 (S 1070).
 自機も相手機も同じ制御を実行するので、図7に示すように、スピーカ134からは、相手機から受信した通話音声(背景TV音+相手の声)および自機で受信してデコードした放送音声が出力される。マイク144では、スピーカ134から出力された音声に加えて、自機の周囲の音声(ここでは自分の音声とする)が入力される。 Since both the own machine and the other machine execute the same control, as shown in FIG. 7, the call voice (background TV sound + the other party's voice) received from the other machine and the own machine received and decoded from the speaker 134 Broadcast audio is output. In the microphone 144, in addition to the voice output from the speaker 134, the voice around the player (here, the voice of the player) is input.
 マイク144から入力された音声のうち、相手機から受信した通話音声(背景TV音+相手の声)が消去されて、通話処理が行われて、映像信号および音声信号(自機のTV音声および自分の声のみ)が相手機に送信される(S1080)。このような処理が、TV電話の終了要求を検出するまで継続される。このため、相手機から、相手機が受信して出力したTV音声信号が消去されないで送信されてくるので、相手機が自機とは異なる番組を視聴していることがわかるとともに、その番組を視聴しているときの相手の声を聞くことができる。 Of the voices input from the microphone 144, the call voice (background TV sound + voice of the other party) received from the other party is deleted and call processing is performed, and the video signal and the audio signal (TV voice of the own party One's own voice) is sent to the other party (S1080). Such processing is continued until a video telephone termination request is detected. For this reason, since the TV audio signal received and output by the other device is transmitted without being deleted from the other device, it is known that the other device is viewing a program different from the own device, and the program is You can hear the other party's voice while watching.
 なお、いずれの動作においても、同じ番組を視聴しているか否かに関わらず、相手機から受信した通話音声(背景TV音なしで相手の声のみ、または、背景TV音および相手の声)は消去されるので、自機で音声がハウリングすることを回避できる。 In any operation, regardless of whether the same program is viewed or not, the call voice (only the voice of the other party without the background TV sound, or the background TV sound and the other party's voice) received from the other device is Since it is erased, it is possible to prevent the sound from being heard by the player.
 (変形例)
 なお、本発明の実施の形態については、以下のように変形することができる。
(1)受信する放送波は、デジタル放送波でなく、アナログ放送波でも構わない。
(2)ネットワーク回線を介した動画再生中であっても、番組情報の代わりに、たとえばURL(Uniform Resource Locators)のようなコンテンツを一意に識別できる識別子(コンテンツ特定データ)を利用することで、上述と同様の制御を行うことができる。すなわち、現在再生されているコンテンツの一致/不一致により、エコーキャンセル部におけるTV電話における音声信号の消去を決定する。
(3)現在視聴中の番組を示す番組情報は、相手機からの問合せ(TV電話開始時およびチャンネル変更時に送信される問合せ)に応答して相手機へ送信するようにしているが、一定時間毎に相手機へ送信するようにしても構わない。
(4)現在視聴中の番組を示す番組が変更されると(問合せるのではなく)、番組情報を相手機へ送信するようにしても構わない。
(Modification)
The embodiment of the present invention can be modified as follows.
(1) The broadcast waves to be received may be not analog broadcast waves but analog broadcast waves.
(2) Even during video reproduction via a network line, instead of program information, an identifier (content identification data) that can uniquely identify content such as URL (Uniform Resource Locators), for example, is used. The same control as described above can be performed. That is, the cancellation of the audio signal in the videophone in the echo cancellation unit is determined based on the match / mismatch of the currently reproduced content.
(3) The program information indicating the program currently being viewed is sent to the other party in response to the inquiry from the other party (the inquiry sent when the video telephone starts and the channel is changed) It may be transmitted to the other party each time.
(4) When the program indicating the program currently being viewed is changed (instead of making an inquiry), the program information may be transmitted to the other party.
 本発明は、たとえば、テレビ視聴(広くはコンテンツ視聴)とテレビ電話とを両立することのできる、画像音声通信に広く適用することができる。 The present invention can be widely applied to, for example, image and voice communication that can achieve both television viewing (generally content viewing) and videophone.
 100  テレビ
 124  モニタ
 134  スピーカ
 140  エコーキャンセル部
 144  マイク
 154  カメラ
 160  TV電話制御部 
100 TV 124 monitor 134 speaker 140 echo cancellation unit 144 microphone 154 camera 160 video telephone control unit

Claims (8)

  1.  映像および音声から構成されるコンテンツを出力するテレビ機能とテレビ電話機能とを備えたテレビ電話機能付きコンテンツ再生装置であって、
     TV電話の相手機と映像信号及び音声信号を通信するTV電話通信部と、
     映像信号を入力する映像入力部と、
     音声信号を入力する音声入力部と、
     前記コンテンツを取得する取得部と、
     前記取得部が取得した前記コンテンツの映像信号と前記TV電話通信部が取得した映像信号とを出力する映像出力部と、
     前記取得部が取得した前記コンテンツの音声信号と前記TV電話通信部が取得した音声信号とを出力する音声出力部と、
     前記音声入力部に入力された前記音声信号から、指定された音声信号を消去するエコーキャンセル部と、
     前記TV電話通信部に、前記エコーキャンセル部から出力された音声信号と前記映像入力部から入力された映像信号とを前記相手機に送信させるTV電話制御部と、を備え、
     前記TV電話制御部は、前記TV電話通信部を介して前記相手機において視聴中のコンテンツの情報である第1コンテンツ特定情報を取得し、取得した前記第1コンテンツ特定情報と自機において視聴中のコンテンツの情報である第2コンテンツ特定情報とを比較し、前記第1コンテンツ特定情報と前記第2コンテンツ特定情報が一致すると判断した場合は、前記エコーキャンセル部に対して、前記音声入力部に入力された前記音声信号から、前記TV電話通信部が取得した音声信号及び前記取得部が取得した前記コンテンツの音声信号を消去させる、ことを特徴とするテレビ電話機能付きコンテンツ再生装置。
    A content reproducing apparatus with a videophone function comprising a television function for outputting contents composed of video and audio and a videophone function,
    A video telephone communication unit that communicates video and audio signals with a partner device of the video telephone;
    A video input unit for inputting a video signal;
    An audio input unit for inputting an audio signal;
    An acquisition unit for acquiring the content;
    A video output unit that outputs the video signal of the content acquired by the acquisition unit and the video signal acquired by the video telephone communication unit;
    An audio output unit that outputs an audio signal of the content acquired by the acquisition unit and an audio signal acquired by the TV telephone communication unit;
    An echo cancellation unit that cancels a designated audio signal from the audio signal input to the audio input unit;
    The video telephone communication unit includes a video telephone control unit for transmitting the audio signal output from the echo cancellation unit and the video signal input from the video input unit to the destination device;
    The video telephone control unit acquires first content identification information, which is information of content being viewed on the partner apparatus via the video telephone communication unit, and is viewing on the own device and the acquired first content identification information. When it is determined that the first content identification information and the second content identification information match with each other, the echo cancellation unit is compared with the voice input unit. An apparatus for reproducing content with a videophone function, wherein the audio signal acquired by the video telephone communication unit and the audio signal of the content acquired by the acquisition unit are erased from the input audio signal.
  2.  前記TV電話制御部は、前記第1コンテンツ特定情報と前記第2コンテンツ特定情報が一致しないと判断した場合は、前記エコーキャンセル部に対して、前記音声入力部に入力された前記音声信号から、前記TV電話通信部が取得した音声信号のみを消去させる、ことを特徴とする請求項1に記載のテレビ電話機能付きコンテンツ再生装置。 When the video telephone control unit determines that the first content identification information and the second content identification information do not match, the echo cancellation unit receives the audio signal input to the audio input unit. 2. The videophone function-equipped content reproduction apparatus according to claim 1, wherein only the audio signal acquired by the videophone communication unit is erased.
  3.  前記TV電話制御部は、予め定められた時間、前記第1コンテンツ特定情報と前記第2コンテンツ特定情報とを比較する、ことを特徴とする請求項1または2に記載のテレビ電話機能付きコンテンツ再生装置。 3. The videophone function-containing content reproduction according to claim 1, wherein the video telephone control unit compares the first content identification information with the second content identification information for a predetermined time. apparatus.
  4.  前記TV電話制御部は、TV電話の開始時、前記第2コンテンツ特定情報が変更された時または一定時間毎に、前記TV電話通信部を介して前記第1コンテンツ特定情報を取得する、ことを特徴とする請求項1または2に記載のテレビ電話機能付きコンテンツ再生装置。 The video telephone control unit acquires the first content identification information via the video telephone communication unit when the second content identification information is changed or every predetermined time when the video telephone is started. The content reproducing apparatus with a videophone function according to claim 1 or 2 characterized by the above.
  5.  映像および音声から構成されるコンテンツを出力するテレビ機能とテレビ電話機能とを備えたテレビ電話機能付きコンテンツ再生装置のテレビ電話音声処理方法であって、
     視聴中のコンテンツの情報である第2コンテンツ特定情報を特定するステップと、
     TV電話の相手機と映像信号及び音声信号を送受信するステップと、
     自機の映像信号を入力するステップと、
     自機の音声信号を入力するステップと、
     前記送受信するステップを介して、前記相手機において視聴中のコンテンツの情報である第1コンテンツ特定情報を取得するステップと、
     前記第1コンテンツ特定情報と前記第2コンテンツ特定情報とを比較するステップと、
     前記第1コンテンツ特定情報と前記第2コンテンツ特定情報が一致する場合、入力した前記自機の音声信号から、前記送受信するステップを介して取得した前記音声信号及び前記視聴中のコンテンツの音声信号を消去した音声信号を生成するステップと、
     前記送受信するステップに、前記自機の映像信号及び前記生成した音声信号を送信させるステップと、
    を有することを特徴とするテレビ電話音声処理方法。
    A videophone audio processing method of a content reproducing apparatus with a videophone function comprising a television function for outputting contents composed of video and audio and a videophone function,
    Identifying second content identification information which is information of content being viewed;
    Transmitting / receiving a video signal and an audio signal to / from a partner device of the video telephone;
    Inputting an image signal of the own machine,
    Inputting an audio signal of the own machine;
    Acquiring first content identification information, which is information of content being viewed on the partner apparatus, through the transmitting and receiving steps;
    Comparing the first content identification information with the second content identification information;
    When the first content identification information and the second content identification information match, the audio signal of the own device input from the input audio signal of the own device and the audio signal of the content being viewed are obtained through the step of transmitting and receiving Generating an erased audio signal;
    Transmitting the video signal of the own device and the generated audio signal to the transmitting and receiving steps;
    A video telephone audio processing method comprising:
  6.  前記第1コンテンツ特定情報と前記第2コンテンツ特定情報が一致しない場合、入力した前記自機の音声信号から、前記送受信するステップを介して取得した前記音声信号のみを消去した音声信号を生成するステップを更に有することを特徴とする請求項5に記載のテレビ電話音声処理方法。 A step of generating an audio signal in which only the audio signal acquired through the step of transmitting and receiving is erased from the input audio signal of the own device when the first content identification information and the second content identification information do not match The video telephone audio processing method according to claim 5, further comprising:
  7.  前記比較するステップは、予め定められた時間、前記第1コンテンツ特定情報と前記第2コンテンツ特定情報とを比較する、ことを特徴とする請求項5または6に記載のテレビ電話音声処理方法。 The video telephone audio processing method according to claim 5 or 6, wherein the comparing step compares the first content specifying information with the second content specifying information for a predetermined time.
  8.  前記第1コンテンツ特定情報を取得するステップは、TV電話の開始時、前記第2コンテンツ特定情報が変更された時または一定時間毎に、前記送受信するステップを介して前記第1コンテンツ特定情報を取得する、ことを特徴とする請求項5または6に記載のテレビ電話音声処理方法。  In the step of acquiring the first content identification information, the first content identification information is acquired through the step of transmitting and receiving at the start of a videophone call, when the second content identification information is changed, or at predetermined time intervals. The video telephone audio processing method according to claim 5 or 6, characterized in that:
PCT/JP2011/007033 2011-02-17 2011-12-16 Content reproduction device with videophone function and method of processing audio for videophone WO2012111059A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011-032557 2011-02-17
JP2011032557A JP2012175192A (en) 2011-02-17 2011-02-17 Content playback apparatus with video telephone function and video telephone voice processing method

Publications (1)

Publication Number Publication Date
WO2012111059A1 true WO2012111059A1 (en) 2012-08-23

Family

ID=46672025

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2011/007033 WO2012111059A1 (en) 2011-02-17 2011-12-16 Content reproduction device with videophone function and method of processing audio for videophone

Country Status (2)

Country Link
JP (1) JP2012175192A (en)
WO (1) WO2012111059A1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103096176A (en) * 2012-12-25 2013-05-08 广州中大电讯科技有限公司 Video telephone system based on digital television middleware
JP6134925B2 (en) * 2013-02-27 2017-05-31 学校法人同志社 Home support system
JP6096916B2 (en) * 2013-09-30 2017-03-15 株式会社東芝 Electronic device, method and program
JP6311784B2 (en) * 2016-12-20 2018-04-18 ソニー株式会社 Television receiver, audio processing method, audio processing program, audio device, audio output method, and audio output program

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010258941A (en) * 2009-04-28 2010-11-11 Sony Corp Echo removing apparatus, echo removing method, and communication apparatus

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010258941A (en) * 2009-04-28 2010-11-11 Sony Corp Echo removing apparatus, echo removing method, and communication apparatus

Also Published As

Publication number Publication date
JP2012175192A (en) 2012-09-10

Similar Documents

Publication Publication Date Title
JP3905509B2 (en) Apparatus and method for processing audio signal during voice call in mobile terminal for receiving digital multimedia broadcast
US20030005462A1 (en) Noise reduction for teleconferencing within an interactive television system
US20140015916A1 (en) Method of audio-visual communication using a television and television using the same
US20100272251A1 (en) Echo removing apparatus, echo removing method, and communication apparatus
US8352993B2 (en) Method for providing viewing information for displaying a list of channels viewed by call recipients
JP2002185943A (en) Broadcasting viewing method, broadcasting transmission server, portable terminal and multi-spot speaking and broadcasting control viewing equipment
KR20130076947A (en) Imaging apparatus and control method for the same
US8875192B2 (en) Method and apparatus for multiple audio outputs
JP2008182463A (en) Television receiving device
WO2012111059A1 (en) Content reproduction device with videophone function and method of processing audio for videophone
JP2011234261A (en) Television system, television receiver, and portable terminal
GB2410160A (en) Base station for transmitting audio visual signal to a mobile device in a home network
KR100919629B1 (en) method of using apparatus for video telephony
KR100630223B1 (en) Method for watching television in mobile telecommunication terminal
JP2007259087A (en) Device, method, and system for repeating information
KR100928253B1 (en) VOD data transmission method of mobile communication terminal and mobile communication terminal implementing such method
CN105704556A (en) Method for solely enjoying program audio of set top box
JP4988022B2 (en) Video display device and audio output control method
KR100518364B1 (en) Multimedia integration system for a domestic
JP2009100378A (en) Mobile terminal with video telephone function, image transmission method, and program
KR20100001536A (en) Video telecommunication system using ip set-top box
KR100823209B1 (en) Portable terminal having alternate image transmitting function and method for transmitting alternate image for portable terminal
JP2006186454A (en) Broadcast receiver, portable broadcast receiver
JP2022118416A (en) Television receiver, television reception system, and television reception method
US20080253374A1 (en) Apparatus and method for communicating with receiving end via internet

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11858847

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11858847

Country of ref document: EP

Kind code of ref document: A1