JP2012142910A - 通信装置および通信方法 - Google Patents

通信装置および通信方法 Download PDF

Info

Publication number
JP2012142910A
JP2012142910A JP2011111807A JP2011111807A JP2012142910A JP 2012142910 A JP2012142910 A JP 2012142910A JP 2011111807 A JP2011111807 A JP 2011111807A JP 2011111807 A JP2011111807 A JP 2011111807A JP 2012142910 A JP2012142910 A JP 2012142910A
Authority
JP
Japan
Prior art keywords
unit
output
voice
audio
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011111807A
Other languages
English (en)
Other versions
JP2012142910A5 (ja
JP5877351B2 (ja
Inventor
Naoya Takao
直弥 高尾
Kazuo Fujimoto
和生 藤本
Shigeaki Watanabe
茂晃 渡邉
Masashi Kozuki
昌史 上月
Masaki Ito
正樹 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2011111807A priority Critical patent/JP5877351B2/ja
Publication of JP2012142910A publication Critical patent/JP2012142910A/ja
Publication of JP2012142910A5 publication Critical patent/JP2012142910A5/ja
Application granted granted Critical
Publication of JP5877351B2 publication Critical patent/JP5877351B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/142Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/02Power saving arrangements
    • H04W52/0209Power saving arrangements in terminal devices
    • H04W52/0225Power saving arrangements in terminal devices using monitoring of external events, e.g. the presence of a signal
    • H04W52/0229Power saving arrangements in terminal devices using monitoring of external events, e.g. the presence of a signal where the received signal is a wanted signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/02Power saving arrangements
    • H04W52/0209Power saving arrangements in terminal devices
    • H04W52/0261Power saving arrangements in terminal devices managing power supply demand, e.g. depending on battery level
    • H04W52/0274Power saving arrangements in terminal devices managing power supply demand, e.g. depending on battery level by switching on or off the equipment or parts thereof
    • H04W52/028Power saving arrangements in terminal devices managing power supply demand, e.g. depending on battery level by switching on or off the equipment or parts thereof switching on or off only a part of the equipment circuit blocks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Abstract

【課題】使用者が覚える違和感を軽減することが可能な通信装置および通信方法を提供する。
【解決手段】他の通信装置から送信される音声データが受信部132により受信され、受信された音声データがテレビ300のスピーカ302に出力される。出力された音声データに基づいて音声が発生され、その音声がカメラ/マイク装置200のマイク202に入力される。入力された音声に対応する音声データがエコーキャンセル処理部125に入力される。エコーキャンセル処理部125により受信された音声データに対する入力された音声データの歪量が検出される。歪検出部126により検出された音声データの歪量が許容量を超えたか否かが判定される。音声データの歪量が許容量を超えた場合に、テレビ300における音声の出力条件の変更要求を使用者に提示するための報知データMが報知信号生成部127により生成される。
【選択図】図10

Description

本発明は、映像データとともに音声データの送受信が可能な通信装置および通信方法に関する。
特許文献1に記載の通信システムおよびデータ通信方法においては、ネットワークを介して第1の端末と第2の端末との間で通信が行われる。この通信システムにおいて、第1および第2の端末の各々は、受信回路および送信回路を含む。また、第1および第2の端末の各々は、入力装置としてウェブカメラおよびマイクロホンを備えるとともに、出力装置としてディスプレイスクリーンおよびラウドスピーカを備える。
例えば、第1の端末において、ウェブカメラに第1の端末のユーザの映像が入力され、マイクロホンに第1の端末のユーザの音声が入力される。また、第2の端末において、ウェブカメラに第2の端末のユーザの映像が入力され、マイクロホンに第2の端末のユーザの音声が入力される。
第1の端末の送信回路においては、ウェブカメラおよびマイクロホンに入力された映像および音声に基づくデータがネットワークを介して第2の端末に送信される。この場合、第2の端末の受信回路においては、ネットワークを介して第1の端末から送信されたデータが受信され、受信されたデータに基づく映像および音声がディスプレイスクリーンおよびラウドスピーカから出力される。
同様に、第2の端末の送信回路においては、ウェブカメラおよびマイクロホンに入力された映像および音声に基づくデータがネットワークを介して第1の端末に送信される。この場合、第1の端末の受信回路においては、ネットワークを介して第2の端末から送信されたデータが受信され、受信されたデータに基づく映像および音声がディスプレイスクリーンおよびラウドスピーカから出力される。
これにより、第1の端末のユーザは、第2の端末のユーザの映像を視認しつつ第2の端末のユーザと会話することができる。同様に、第2の端末のユーザは、第1の端末のユーザの映像を視認しつつ第1の端末のユーザと会話することができる。
特表2010−521856号公報 特表2010−283483号公報
上記の通信システムにおいて、例えば第2の端末から第1の端末に送られるデータに基づく音声が、第1の端末のラウドスピーカにより出力される。このとき、第1の端末のラウドスピーカから出力された音声の一部が、室内で反響することにより第1の端末のマイクロホンに入力される場合がある。第1の端末の送信回路においては、マイクロホンから入力された音声に基づくデータがネットワークを介して第2の端末に送信される。そのため、第2の端末では、第2の端末のユーザが言葉を発するごとにそのユーザの音声がラウドスピーカから出力される。この場合、第2の端末のユーザは第1の端末のユーザとの会話に違和感を覚える。
上記のように、第2の端末において、マイクロホンに入力された音声がラウドスピーカから出力されることを抑制するための構成としてエコーキャンセラが知られている(例えば、特許文献2参照)。
エコーキャンセラによれば、第1の端末のラウドスピーカから出力される音声に基づいて第1の端末のマイクロホンに入力される音響エコーが推定される。推定結果に基づいて、第1の端末のラウドスピーカに入力される音声信号から推定された音響エコーに基づく音声信号が減算される。これにより、第2の端末のラウドスピーカから音響エコーが発生することが抑制される。
しかしながら、エコーキャンセラの構成を採用した場合でも、第1の端末および第2の端末に用いられるラウドスピーカから出力される音声に歪が生じる場合がある。
また、上記の通信システムの各端末においては、通信されたデータに画像処理および音響処理が行われる。そのため、各端末では、データが入力されるタイミングと入力されたデータに基づく映像および音声が出力されるタイミングとの間に遅延が発生する。
このように、第1の端末において出力される音声に歪または遅延が生じていると、第2の端末から出力される音声に第1の端末に入力された音声の影響が残る。この場合、第2の端末のユーザは会話に違和感を覚える。同様に、第2の端末において出力される音声に歪または遅延が生じていると、第1の端末から出力される音声に第2の端末に入力された音声の影響が残る。この場合、第1の端末のユーザは会話に違和感を覚える。
本発明の目的は、使用者が覚える違和感を軽減することが可能な通信装置および通信方法を提供することである。
(1)第1の発明に係る通信装置は、他装置との間で映像データおよび音声データの送受信が可能でかつ音声入力装置および音声出力装置に接続可能な通信装置であって、他装置から送信される音声データを受信可能に構成された受信部と、受信部により受信された音声データを音声出力装置に出力する音声データ出力部と、音声入力装置からの音声データが入力される音声データ入力部と、音声データ入力部により入力された音声データを他装置に送信可能に構成された送信部と、音声データ出力部から出力された音声データに基づいて音声出力装置により音声が出力されるとともに出力された音声に基づく音声データが音声入力装置から音声データ入力部に入力されるときに、受信部により受信された音声データと音声データ入力部により入力された音声データとの差分を検出する差分検出部と、差分検出部により検出された差分が予め定められた許容量を超えたか否かを判定する判定部と、判定部により差分が許容量を超えたと判定された場合に、音声データ出力部により出力される音声データに基づく音声の出力条件の変更要求を使用者に提示するための提示信号を生成する提示信号生成部とを備えるものである。
その通信装置においては、他装置から送信される音声データが受信部により受信され、受信部により受信された音声データが音声データ出力部により音声出力装置に出力される。音声データ入力部には、音声入力装置から音声データが入力される。音声データ入力部により入力された音声データは、送信部により他装置に送信される。それにより、通信装置の使用者と他装置の他の使用者との間で会話を行うことができる。
通信装置に接続される音声出力装置により出力される音声が通信装置に接続される音声入力装置に入力された場合、他装置に入力された音声が通信装置を経由して他装置から出力される。この場合、通信装置において、音声データ入力部に入力された音声データから受信部により受信された音声データに相当する成分を除去することにより、他装置に入力された音声が通信装置を経由して他装置から出力されることを防止することが可能となる。
しかしながら、音声出力装置により出力される音声に歪または遅延が生じている場合には、他装置により出力される音声に他装置に入力された音声の影響が残ることになる。それにより、他装置の使用者が違和感を覚えることになる。
そこで、音声データ出力部から出力された音声データに基づいて音声出力装置により音声が出力されるとともに出力された音声に基づく音声データが音声入力装置から音声データ入力部に入力されるときに、受信部により受信された音声データにより表される波形と音声データ入力部により入力された音声データにより表される波形との幾何学的または時間的な差分が差分検出部により検出される。
ここで、波形の幾何学的な差分とは、一の波形と他の波形との相違の程度を意味する。一の波形の振幅に任意の係数を乗じることにより得られる波形が他の波形と等しい場合には、一の波形と他の波形との差分は0となる。波形の時間的な差分とは、一の波形と他の波形との時間軸上でのずれの程度を意味する。
検出された差分が予め定められた許容量を超えたか否かが判定部により判定される。差分が許容量を超えたと判定された場合には、音声データ出力部により出力される音声データに基づく音声の出力条件の変更要求を使用者に提示するための提示信号が提示信号生成部により生成される。
提示信号に基づいて音声の出力条件の変更要求が提示されると、通信装置の使用者に、音声出力装置による音声の出力条件の変更が促される。その結果、通信装置の使用者が音声出力装置による音声の出力条件を変更することにより、他装置の使用者が覚える違和感を軽減することが可能となる。
(2)差分検出部は、音声データ入力部に入力された音声データから受信部により受信された音声データに相当する成分を除去する処理を行う除去処理部と、音声データ出力部から出力された音声データに基づいて音声出力装置により音声が出力されるとともに出力された音声に基づく音声データが音声入力装置から音声データ入力部に入力されるときに、除去処理部により処理された音声データのレベルを差分として検出するレベル検出部を含み、提示信号は、音声出力装置の音量の調整の要求を音声の出力条件の変更要求として含んでもよい。
この場合、音声データ入力部に入力された音声データから受信部により受信された音声データに相当する成分を除去する処理が除去処理部により行われる。音声出力装置から出力される音声に歪が生じている場合には、除去処理部により処理された音声データに音声の歪に起因するノイズが残ることになる。そこで、音声データ出力部から出力された音声データに基づいて音声出力装置により音声が出力されるとともに出力された音声に基づく音声データが音声入力装置から音声データ入力部に入力されるときに、除去処理部により処理された音声データのレベルが差分としてレベル検出部により検出される。除去処理部により処理された音声データのレベルが許容量を超えた場合には、音声出力装置により出力される音声が一定量以上の歪を有すると判定することができる。この場合、音声出力装置の音量の調整の要求を使用者に提示するための提示信号が提示信号生成部により生成される。
提示信号に基づいて音声出力装置の音量の調整の要求が提示されることにより、通信装置の使用者に音声出力装置の音量の調整が促される。通信装置の使用者が音声出力装置の音量を調整することにより、音声出力装置により出力される音声の歪を軽減することができる。それにより、除去処理部により処理された音声データにおいて、音声の歪に起因するノイズが抑制される。その結果、他装置の使用者が覚える違和感を軽減することが可能となる。
(3)提示信号は、音声出力装置の音量の低減の要求を音声の出力条件の変更要求として含んでもよい。
この場合、除去処理部により処理された音声データのレベルが許容量を超えた場合に、音声出力装置の音量の低減の要求を使用者に提示するための提示信号が提示信号生成部により生成される。提示信号に基づいて音声出力装置の音量の低減の要求が提示されることにより、通信装置の使用者に音声出力装置の音量の低減が促される。通信装置の使用者が音声出力装置の音量を低減することにより、音声出力装置から出力される音声の歪が抑制される。それにより、除去処理部により処理された音声データにおいて、音声の歪に起因するノイズが十分に抑制される。その結果、他装置の使用者が覚える違和感を軽減することが可能となる。
(4)通信装置は、映像出力装置に接続可能であり、映像出力装置に映像データを出力する映像データ出力部をさらに備え、提示信号生成部は、音声出力装置の音量の調整の要求を表示するための映像データを提示信号として生成し、映像データ出力部は、提示信号生成部により生成された提示信号を映像出力装置に出力してもよい。
この場合、音声出力装置の音量の調整の要求を表示するための映像データが提示信号生成部により生成される。生成された映像データが映像データ出力部から映像出力装置に出力される。これにより、音声出力装置の音量の調整の要求が映像出力装置により表示される。その結果、会話を妨げることなく通信装置の使用者に音声出力装置の音量の調整を映像により促すことが可能となる。
(5)音声出力装置は、入力された音声データの遅延量を変更可能に構成され、差分検出部は、音声データ出力部から出力された音声データに基づいて音声出力装置により音声が出力されるとともに出力された音声に基づく音声データが音声入力装置から音声データ入力部に入力されるときに、受信部により受信された音声データに対する音声データ入力部に入力された音声データの遅延量を差分として検出する遅延検出部を含み、提示信号は、音声出力装置における音声データの遅延量の変更を伴う操作の要求を音声の出力条件の変更要求として含んでもよい。
音声出力装置において生じる音声データの遅延が大きい場合には、他装置に入力された音声が通信装置に接続される音声出力装置から出力されるまでの時間、および通信装置に接続される音声入力装置に入力された音声が他装置から出力されるまでの時間が長くなる。それにより、会話時に、通信装置の使用者および他装置の使用者が違和感を覚える。
そこで、音声データ出力部から出力された音声データに基づいて音声出力装置により音声が出力されるとともに出力された音声に基づく音声データが音声入力装置から音声データ入力部に入力されるときに、受信部により受信された音声データに対する音声データ入力部に入力された音声データの遅延量が遅延検出部により差分として検出される。検出された遅延量が許容量を超えた場合に、音声出力装置における音声データの遅延量の変更を伴う操作の要求を使用者に提示するための提示信号が提示信号生成部により生成される。
提示信号に基づいて音声データの遅延量の変更を伴う操作の要求が提示されることにより、通信装置の使用者に音声データの遅延量の変更を伴う操作が促される。通信装置の使用者が音声データの遅延量の変更を伴う操作を行うことにより、音声出力装置における音声データの遅延量を小さくすることが可能となる。これにより、他装置に入力された音声が通信装置に接続される音声出力装置から出力されるまでの時間、および通信装置に接続される音声入力装置に入力された音声が他装置から出力されるまでの時間を短くすることができる。その結果、会話時に通信装置の使用者および他装置の使用者が覚える違和感を軽減することが可能となる。
(6)通信装置は、映像出力装置に接続可能であり、映像出力装置は、映像データに基づいて複数の表示モードのうち選択された表示モードで映像を表示可能に構成されるとともに、複数の表示モードにそれぞれ対応して映像データの遅延量が異なるように設定され、音声出力装置は、音声データが映像出力装置における映像データに同期するように音声データの遅延量が調整されるように構成され、受信部は、他装置から送信された映像データを受信可能に構成され、通信装置は、受信部により受信された映像データを出力する映像データ出力部をさらに備え、提示信号は、音声出力装置における音声データの遅延量の変更を伴う操作の要求として映像出力装置の表示モードの変更の操作の要求を含んでもよい。
この場合、映像出力装置により表示される映像の表示モードにより映像データの遅延量が異なる。また、音声出力装置において、音声データが映像出力装置における映像データに同期するように音声データの遅延量が調整される。そのため、表示モードが変更されると、音声データの遅延量が変更される。映像出力装置が映像データの遅延量が大きい表示モードに設定されている場合には、音声データの遅延量も大きくなる。その場合、他装置に入力された音声が通信装置に接続される音声出力装置から出力されるまでの時間、および通信装置に接続される音声入力装置に入力された音声が他装置から出力されるまでの時間が長くなる。それにより、会話時に、通信装置の使用者および他装置の使用者が違和感を覚える。
そこで、遅延検出部により検出された遅延量が許容量を超えた場合に、映像出力装置の表示モードの変更の操作の要求を使用者に提示するための提示信号が提示信号生成部により生成される。提示信号に基づいて映像出力装置の表示モードの変更の操作の要求が提示されることにより、通信装置の使用者に映像出力装置の表示モードの変更の操作が促される。通信装置の使用者が映像出力装置の表示モードの変更の操作を行うことにより、映像データの遅延量が変更されるとともに、音声出力装置における音声データの遅延量が変更される。したがって、通信装置の使用者が映像出力装置の表示モードの変更の操作を行うことにより、音声データの遅延量を小さくすることが可能となる。その結果、会話時に通信装置の使用者および他装置の使用者が覚える違和感を軽減することが可能となる。
(7)提示信号生成部は、映像出力装置の表示モードの変更の操作の要求を表示するための映像データを提示信号として生成し、映像データ出力部は、提示信号生成部により生成された提示信号を映像出力装置に出力してもよい。
この場合、映像出力装置の表示モードの変更の操作の要求を表示するための映像データが提示信号生成部により生成される。生成された映像データが映像データ出力部により映像出力装置に出力される。これにより、映像出力装置の表示モードの変更の操作の要求が映像表示装置により表示される。その結果、会話を妨げることなく通信装置の使用者に映像出力装置の表示モードの変更の操作を映像により促すことが可能となる。
(8)通信装置は、受信部により受信された音声データを遅延させる遅延部と、音声データ入力部に入力された音声データから遅延部により遅延された音声データに相当する成分を除去する処理を行う除去処理部とをさらに備え、送信部は、除去処理部により処理された音声データを他装置に送信するように構成されてもよい。
この場合、遅延部により受信部により受信された音声データが遅延される。音声データ入力部に入力された音声データから遅延部により遅延された音声データに相当する成分を除去する処理が除去処理部により行われる。除去処理部により処理された音声データが、送信部により他装置に送信される。これにより、通信装置に接続される音声出力装置から出力される音声が通信装置に接続される音声入力装置に入力される場合でも、他装置に入力された音声が通信装置を経由して他装置から出力されることを抑制することが可能となる。
また、提示信号に基づいて音声出力装置における音声データの遅延量が小さくされるので、大きな遅延量を有する遅延部を用いることなく、音声データ入力部に入力された音声データから受信部により受信された音声データの成分を除去することが可能となる。そのため、遅延部のコストが増加しない。その結果、通信装置の低コスト化が実現される。
(9)第2の発明に係る通信装置は、他装置との間で映像データおよび音声データの送受信が可能でかつ音声入力装置および音声出力装置に接続可能な通信装置であって、他装置から送信される音声データを受信可能に構成された受信部と、受信部により受信された音声データを音声出力装置に出力する音声データ出力部と、音声入力装置からの音声データが入力される音声データ入力部と、音声データ入力部により入力された音声データを他装置に送信可能に構成された送信部と、音声データ出力部から出力された音声データに基づいて音声出力装置により音声が出力されるとともに出力された音声に基づく音声データが音声入力装置から音声データ入力部に入力されるときに、受信部により受信された音声データにより表される波形と音声データ入力部により入力された音声データにより表される波形との幾何学的または時間的な差分を検出する差分検出部と、差分検出部により検出された差分が予め定められた許容量を超えたか否かを判定する判定部と、判定部により差分が許容量を超えたと判定された場合に、音声データ出力部により出力される音声データに基づく音声の出力条件を変更するための制御信号を生成する制御信号生成部とを備えるものである。
その通信装置においては、他装置から送信される音声データが受信部により受信され、受信部により受信された音声データが音声データ出力部により音声出力装置に出力される。音声データ入力部には、音声入力装置から音声データが入力される。音声データ入力部により入力された音声データは、送信部により他装置に送信される。それにより、通信装置の使用者と他装置の他の使用者との間で会話を行うことができる。
通信装置に接続される音声出力装置により出力される音声が通信装置に接続される音声入力装置に入力された場合、他装置に入力された音声が通信装置を経由して他装置から出力される。この場合、通信装置において、音声データ入力部に入力された音声データから受信部により受信された音声データに相当する成分を除去することにより、他装置に入力された音声が通信装置を経由して他装置から出力されることを防止することが可能となる。
しかしながら、音声出力装置により出力される音声に歪または遅延が生じている場合には、他装置により出力される音声に他装置に入力された音声の影響が残ることになる。それにより、他装置の使用者が違和感を覚えることになる。
そこで、音声データ出力部から出力された音声データに基づいて音声出力装置により音声が出力されるとともに出力された音声に基づく音声データが音声入力装置から音声データ入力部に入力されるときに、受信部により受信された音声データにより表される波形と音声データ入力部により入力された音声データにより表される波形との幾何学的または時間的な差分が差分検出部により検出される。また、検出された差分が予め定められた許容量を超えたか否かが判定部により判定される。差分が許容量を超えたと判定された場合には、音声データ出力部により出力される音声データに基づく音声の出力条件を変更するための制御信号が提示信号生成部により生成される。
制御信号に基づいて音声の出力条件が変更されることにより、会話を妨げることなく他装置の使用者が覚える違和感を軽減することが可能となる。
(10)第3の発明に係る通信方法は、他装置との間で映像データおよび音声データの送受信が可能でかつ音声入力装置および音声出力装置に接続可能な通信装置を用いた通信方法であって、他装置から送信される音声データを通信装置の受信部により受信するステップと、受信された音声データを通信装置の音声データ出力部から音声出力装置に出力するステップと、音声入力装置からの音声データを通信装置の音声データ入力部に入力するステップと、音声データ入力部に入力された音声データを通信装置の送信部から他装置に送信するステップと、音声データ出力部から出力された音声データに基づいて音声出力装置により音声が出力されるとともに出力された音声に基づく音声データが音声入力装置から音声データ入力部に入力されるときに、受信部により受信された音声データにより表される波形と音声データ入力部により入力された音声データにより表される波形との幾何学的または時間的な差分を検出するステップと、検出された差分が予め定められた許容量を超えたか否かを判定するステップと、差分が許容量を超えたと判定された場合に、音声データ出力部により出力される音声データに基づく音声の出力条件の変更要求を使用者に提示するための提示信号を出力するステップとを備えるものである。
その通信方法においては、他装置から送信される音声データが通信装置の受信部により受信され、受信部により受信された音声データが通信装置の音声データ出力部により音声出力装置に出力される。音声データ入力部には、音声入力装置から音声データが入力される。音声データ入力部により入力された音声データは、通信装置の送信部により他装置に送信される。それにより、通信装置の使用者と他装置の他の使用者との間で会話を行うことができる。
通信装置に接続される音声出力装置により出力される音声が通信装置に接続される音声入力装置に入力された場合、他装置に入力された音声が通信装置を経由して他装置から出力される。この場合、通信装置において、音声データ入力部に入力された音声データから受信部により受信された音声データに相当する成分を除去することにより、他装置に入力された音声が通信装置を経由して他装置から出力されることを防止することが可能となる。
しかしながら、音声出力装置により出力される音声に歪または遅延が生じている場合には、他装置により出力される音声に他装置に入力された音声の影響が残ることになる。それにより、他装置の使用者が違和感を覚えることになる。
そこで、音声データ出力部から出力された音声データに基づいて音声出力装置により音声が出力されるとともに出力された音声に基づく音声データが音声入力装置から音声データ入力部に入力されるときに、受信部により受信された音声データにより表される波形と音声データ入力部により入力された音声データにより表される波形との幾何学的または時間的な差分が検出される。また、検出された差分が予め定められた許容量を超えたか否かが判定される。差分が許容量を超えたと判定された場合には、音声データ出力部により出力される音声データに基づく音声の出力条件の変更要求を使用者に提示するための提示信号が生成される。
提示信号に基づいて音声の出力条件の変更要求が提示されると、通信装置の使用者に、音声出力装置による音声の出力条件の変更が促される。その結果、通信装置の使用者が音声出力装置による音声の出力条件を変更することにより、他装置の使用者が覚える違和感を軽減することが可能となる。
本発明によれば、通信装置の使用者が覚える違和感を軽減することできる。
第1の実施の形態に係る通信システムの概略を説明するための図。 図1の端末の構成を示すブロック図。 サインイン画面を示す図。 ユーザ登録画面を示す図。 コンタクト画面を示す図。 コンタクトリスト画面を示す図。 会話画面を示す図。 着信画面を示す図。 着信画面の他の例を示す図。 図2の制御LSIの詳細な構成を示すブロック図。 エコーキャンセル処理部によるエコーキャンセル処理を説明するための図。 報知映像を含む会話画面の一例を示す図。 第1の実施の形態に係る会話プログラムに基づく制御LSIの一動作例を示すフローチャート。 第2の実施の形態に係るテレビの構成を示すブロック図。 複数の表示モードにそれぞれ対応する音声遅延量の一覧。 第2の実施の形態に係る制御LSIの詳細な構成を示すブロック図。 報知映像を含む会話画面の他の例を示す図。 エコーキャンセル処理の概念図。 第2の実施の形態に係る会話プログラムに基づく制御LSIの一動作例を示すフローチャート。
[1]第1の実施の形態
本発明の一実施の形態に係る通信装置および通信方法について図面を参照しつつ説明する。
(1)通信システムの概略
第1の実施の形態に係る通信装置を含む通信システムについて説明する。図1は第1の実施の形態に係る通信システムの概略を説明するための図であり、図2は図1の端末1000の構成を示すブロック図である。
図1に示すように、この通信システムにおいては、端末1000、基地局800、パーソナルコンピュータ600、テレビジョン受像機(以下、テレビと略記する。)700および会話用サーバ2000がネットワーク500に接続される。また、携帯電話900が基地局800を介してネットワーク500に接続される。このように、ネットワーク500には、複数の通信端末として、端末1000、パーソナルコンピュータ600、テレビ700および携帯電話900が接続される。本実施の形態において、ネットワーク500はインターネットである。
図1の例において、互いに接続された複数の通信端末(端末1000、パーソナルコンピュータ600、テレビ700および携帯電話900)には、それぞれ後述する制御LSI(大規模集積回路)101(図2)が内蔵される。制御LSI101(図2)には、内蔵のメモリに後述する会話プログラムが記憶される。
また、各通信端末は、映像入力部、音声入力部、映像出力部および音声出力部を有する。映像入力部は例えばカメラを含む。音声入力部は例えばマイクを含む。映像出力部は例えばモニタを含む。音声出力部は例えばスピーカを含む。
本実施の形態において、複数の通信端末のユーザは、予めそれぞれ固有のユーザ情報を会話用サーバ2000に登録する必要がある。ユーザ情報は、ユーザ識別子(以下、ユーザIDと呼ぶ。)およびそのユーザIDに対応付けられたパスワードを含む。会話用サーバ2000は、複数のユーザの複数のユーザ情報を記憶することにより、複数のユーザを管理する。
新たなユーザ情報が登録される場合には、任意の通信端末から会話用サーバ2000に、ユーザ情報の登録要求とともに新たなユーザ情報が送信される。
会話用サーバ2000は、予め記憶されている複数のユーザ情報を参照しつつ、受信したユーザ情報のユーザIDが既に登録されている複数のユーザ情報のユーザIDのいずれかに一致するか否かを判定する。
会話用サーバ2000は、受信したユーザ情報のユーザIDが既に登録されている複数のユーザ情報のユーザIDのいずれにも一致しない場合、与えられたユーザ情報を記憶する。一方、会話用サーバ2000は、受信したユーザ情報のユーザIDが既に登録されている複数のユーザ情報のユーザIDのいずれかに一致する場合、受信したユーザ情報を記憶しない。これにより、同一のユーザIDを含む複数のユーザ情報が会話用サーバ2000に登録されることが防止される。
会話用サーバ2000に、例えば一の通信端末からユーザ情報とともにサインインの要求が送信される。この場合、会話用サーバ2000は、受信したユーザ情報が記憶されている複数のユーザ情報のいずれかに一致するか否かを判定する。すなわち、会話用サーバ2000は、一の通信端末から受信したユーザ情報が既に登録されているか否かを判定する。
受信したユーザ情報が既に登録されている場合、会話用サーバ2000は、複数のユーザが同一のユーザ情報でサインインすることを防止するために、受信したユーザ情報と同一のユーザ情報によるサインインが現在行われているか否かを判定する。
会話用サーバ2000は、受信したユーザ情報と同一のユーザ情報によるサインインが行われていない場合に、ユーザのサインインを許可する。一方、会話用サーバ2000は、一の通信端末から受信したユーザ情報が登録されていない場合、および受信したユーザ情報と同一のユーザ情報によるサインインが現在行われている場合に、ユーザのサインインを許可しない。
ユーザが会話用サーバ2000にサインインすることにより、ユーザが使用する通信端末から会話用サーバ2000に、通信端末のアドレス(例えば、インターネットプロトコルアドレス)が送信される。また、通信端末から会話用サーバ2000に、所定の周期でサインインの継続要求が送信される。
これにより、会話用サーバ2000においては、現在サインインしているユーザ、およびサインインしているユーザが使用する通信端末のアドレスが管理される。
ユーザは、一の通信端末を用いて会話用サーバ2000にサインインすることにより、会話用サーバ2000に他のユーザとの会話要求をそのユーザのユーザIDとともに送信することができる。この場合、会話用サーバ2000は、受信したユーザIDに基づいて他のユーザがサインインしているか否かを判定する。
他のユーザがサインインしている場合、会話用サーバ2000は、他のユーザが使用する通信端末のアドレスを一の通信端末に送信する。これにより、一の通信端末が、受信したアドレスにより他の通信端末にアクセスする。このようにして、一の通信端末と他の通信端末との間で、映像データおよび音声データを含む種々のデータの通信が可能となる。
一方、他のユーザがサインインしていない場合、会話用サーバ2000は、他のユーザがサインインしていないことを示す情報を一の通信端末に送信する。この場合、一の通信端末においては、他のユーザと会話することができないことを示す情報がモニタまたはスピーカによりユーザに提示される。
上記に加えて、ユーザは、一の通信端末を用いて会話用サーバ2000にサインインすることにより、他の通信端末からのアクセスを受け付けることができる。
複数の通信端末間では、カメラにより撮影された各ユーザの映像に基づく映像データ、およびマイクに入力された各ユーザの音声に基づく音声データの通信が行われる。これにより、各通信端末のユーザは、他の通信端末のユーザと会話することができる。
次に、端末1000の構成について説明する。図1および図2に示すように、端末1000は、通信装置100、カメラ/マイク装置200、テレビ300および2つのリモートコントローラ400,490を備える。
図2に示すように、通信装置100は、制御LSI101、ネットワークインターフェース103、無線受信部104、ユニバーサルシリアルバス(以下、USBと呼ぶ。)インターフェース105、電源供給部106、高解像度マルチメディアインターフェース(以下、HDMIと呼ぶ。)107、光ディスクドライブ108、メモリスロット109、蛍光表示管(以下、FLディスプレイと呼ぶ。)191、発光ダイオードユニット(以下、LEDユニットと呼ぶ。)192、ブザー193およびフラッシュメモリ112を備える。メモリスロット109には、メモリカード110が挿入される。本実施の形態では、通信装置100のネットワークインターフェース103は、ネットワークケーブル(例えば、ローカルエリアネットワークケーブル)を介してネットワーク500に接続される。
制御LSI101は、CPU(中央演算処理装置)およびメモリを含み、半導体を用いた集積回路で実現される。上述のように、制御LSI101のメモリには、通信装置100のシステムプログラムとともに後述する会話プログラムが記憶される。CPUがメモリに記憶された各プログラムを実行することにより、制御LSI101が種々の処理を実行する。また、制御LSI101は、通信装置100の各構成要素の動作を制御するとともに、他の通信端末(図1のパーソナルコンピュータ600、テレビ700および携帯電話900等)との通信を制御する。制御LSI101の詳細な構成は後述する。
ネットワークインターフェース103は、ネットワークケーブルを介してネットワーク500に接続される。ネットワークインターフェース103により、ネットワーク500から通信装置100の制御LSI101に、映像データおよび音声データを含む種々のデータが与えられる。また、通信装置100の制御LSI101からネットワーク500に映像データおよび音声データを含む種々のデータが与えられる。
後述するように、リモートコントローラ400は、無線通信(例えば赤外線通信)により後述する操作信号を通信装置100に送信する。無線受信部104は、リモートコントローラ400から無線で送信される操作信号を受信する。無線受信部104により受信された操作信号は、制御LSI101に与えられる。
USBインターフェース105は、USBケーブルを介してカメラ/マイク装置200に接続される。電源供給部106は、例えばコンセントを含み、家庭用電源に接続される。電源供給部106は、家庭用電源から得られた電力を通信装置100の各構成要素に供給する。HDMI107は、HDMIケーブルを介してテレビ300に接続される。光ディスクドライブ108は、光ディスクに対してデータの読み書きを行う。
メモリスロット109は、メモリカード110が挿入および取り出し可能に構成される。制御LSI101は、メモリスロット109にメモリカード110が挿入された状態で、メモリカード110に記憶されたデータを読み出すことができる。また、制御LSI101は、メモリカード110にデータを書き込むことができる。
フラッシュメモリ112は、制御LSI101に接続される。フラッシュメモリ112に代えて、他の不揮発性メモリを用いてもよい。フラッシュメモリ112には、例えば端末1000を使用するユーザのユーザ情報および他のユーザのユーザIDのリスト(以下、コンタクトリストと呼ぶ。)が記憶される。また、フラッシュメモリ112には、ユーザが他の通信端末からのアクセスを受け付けることができない場合に、他の通信端末からのアクセスに応答して他の通信端末に与えられるべきデータ(例えば、留守であることを伝えるための映像データおよび音声データ)が記憶される。
通信装置100は、例えば箱型のケーシングを有する。制御LSI101、ネットワークインターフェース103、無線受信部104、USBインターフェース105、電源供給部106、HDMI107、光ディスクドライブ108およびメモリスロット109はケーシング内に収容される。FLディスプレイ191、FLディスプレイ191、LEDユニット192およびブザー193は、ケーシングに取り付けられる。
FLディスプレイ191は、例えば7セグメント蛍光表示管または14セグメント蛍光表示管等からなる。制御LSI101からFLディスプレイ191に現在の時刻および光ディスクの再生時間等を示す情報が与えられる。FLディスプレイ191は、与えられた情報を表示する。
LEDユニット192は単色の光を発生する。制御LSI101からLEDユニット192に発光または非発光を示す情報が与えられる。LEDユニット192は、制御LSI101から与えられる情報に基づいて点灯、消灯または点滅する。
制御LSI101からブザー193に警報の発生を指令するための情報が与えられる。この場合、ブザー193は、制御LSI101から与えられる情報に基づいて警報音を発生する。
リモートコントローラ400は、操作部401、処理回路402および無線送信部403を備える。操作部401は、図1の電源ボタン411、会話起動ボタン412、会話応答ボタン413、十字キー414、決定ボタン415および図示しない複数の数字ボタンを含む。十字キー414は、上ボタン、下ボタン、左ボタンおよび右ボタンを含む。ユーザにより、操作部401のいずれかのボタンが操作される。処理回路402により操作されたボタンに応じた操作信号が生成される。生成された操作信号は、無線送信部403から通信装置100の無線受信部104に送信される。上記のように、通信装置100とリモートコントローラ400との間の無線通信は、例えば赤外線通信により実現される。
カメラ/マイク装置200は、カメラ201、マイク202および2つのアナログデジタル(以下、A/Dと呼ぶ。)コンバータ203,204およびUSBインターフェース205を備える。カメラ/マイク装置200のUSBインターフェース205は、USBケーブルを介して通信装置100のUSBインターフェース105に接続される。
カメラ201は、撮像素子を備える。撮像素子により被写体の映像が取得される。カメラ201においては、取得された映像に基づいてアナログ形式の映像信号が生成される。生成された映像信号が、A/Dコンバータ203によりデジタル形式の映像データに変換される。デジタル形式の映像データが、USBインターフェース205、USBケーブルおよびUSBインターフェース105を介して、通信装置100の制御LSI101に与えられる。
マイク202には外部から音声(音波)が入力される。マイク202においては、入力された音声に基づいてアナログ形式の音声信号が生成される。生成された音声信号が、A/Dコンバータ204によりデジタル形式の音声データに変換される。デジタル形式の音声データが、USBインターフェース205、USBケーブルおよびUSBインターフェース105を介して、通信装置100の制御LSI101に与えられる。
本実施の形態では、カメラ/マイク装置200は、例えばユーザの映像およびユーザの音声を取得するために用いられる。
上記のように、カメラ/マイク装置200は、カメラ201およびマイク202を含む。通信装置100にカメラ/マイク装置200が接続される代わりに、通信装置100にカメラ201およびマイク202がそれぞれ個別に接続されてもよい。
カメラ/マイク装置200がHDMIを有してもよい。この場合、カメラ/マイク装置200のHDMIがHDMIケーブルを介して通信装置100に接続される。カメラ/マイク装置200が無線送信部を有してもよい。この場合には、カメラ/マイク装置200の無線送信部から通信装置100の無線受信部104に映像データおよび音声データが与えられる。
テレビ300は、モニタ301、スピーカ302、デジタルアナログ(以下、D/Aと呼ぶ。)コンバータ303,304、HDMI305、無線受信部306および音量調整部310を備える。本実施の形態では、テレビ300のHDMI305が、HDMIケーブルを介して通信装置100のHDMI107に接続される。
通信装置100の制御LSI101からテレビ300に、HDMI107、HDMIケーブルおよびHDMI305を介してデジタル形式の映像データおよび音声データが与えられる。テレビ300に与えられた映像データは、D/Aコンバータ303によりアナログ形式の映像信号に変換される。アナログ形式の映像信号がモニタ301に与えられる。これにより、モニタ301に映像が表示される。
一方、テレビ300に与えられた音声データは、D/Aコンバータ304によりアナログ形式の音声信号に変換される。アナログ形式の音声信号が音量調整部310に与えられる。
音量調整部310には、後述するリモートコントローラ490から、例えば音声信号のレベルを調整するための操作信号が入力される。これにより、音量調整部310においては、リモートコントローラ490から与えられる操作信号に基づいて音声信号のレベルが調整される。調整された音声信号がスピーカ302に与えられ、音声信号に基づく音声が出力される。
上記のように、通信装置100とテレビ300とがHDMI107、HDMIケーブルおよびHDMI305を介して接続される。この場合、通信装置100は、テレビ300の動作を制御するための制御信号をテレビ300に与えることができる。
通信装置100にテレビ300が接続される代わりに、通信装置100にモニタ301およびスピーカ302がそれぞれ個別に接続されてもよい。
リモートコントローラ490は、操作部491、処理回路492および無線送信部493を備える。操作部491は、図1の電源ボタン481および音量調整ボタン484a,484bを含む。ユーザにより、操作部491のいずれかのボタンが操作される。処理回路492により操作されたボタンに応じた操作信号が生成される。
電源ボタン481が操作されることにより、テレビ300の電源をオンするための操作信号が生成される。音量調整ボタン484aが操作されることにより、音声信号のレベルを高くするための操作信号が生成される。音量調整ボタン484bが操作されることにより、音声信号のレベルを低くするための操作信号が生成される。
生成された操作信号は、無線送信部493からテレビ300の無線受信部306に無線で送信される。テレビ300とリモートコントローラ490との間の無線通信は、例えば赤外線通信により実現される。
上記の端末1000においては、例えばカメラ/マイク装置200から通信装置100に映像データおよび音声データが与えられる。通信装置100においては、与えられた映像データが符号化される。また、与えられた音声データが符号化される。後述する端末1000の会話動作時において、通信装置100は、符号化された映像データおよび音声データをネットワーク500に接続された他の通信端末(パーソナルコンピュータ600、テレビ700および携帯電話900)に送信する。
また、端末1000においては、ユーザが図1の会話用サーバ2000にサインインすることにより、ネットワーク500に接続された他の通信端末から送信される映像データおよび音声データが通信装置100により受信される。通信装置100においては、受信された映像データおよび音声データが復号化される。後述する端末1000の会話動作時において、通信装置100は、復号化された映像データおよび音声データをテレビ300に与える。テレビ300では、デジタル形式の映像データがアナログ形式の映像信号に変換され、変換された映像信号に基づく映像がモニタ301に表示される。また、デジタル形式の音声データがアナログ形式の音声信号に変換され、変換された音声信号に基づく音声がスピーカ302から出力される。
これにより、上記のように、端末1000と他の通信端末間で映像データおよび音声データの通信が行われる。ネットワーク500に接続される複数の通信端末の各々は、端末1000と同様に、カメラ、マイク、モニタおよびスピーカを有する。したがって、端末1000を使用するユーザは、他の通信端末を使用するユーザと会話することができる。
端末1000の通信装置100においては、例えば光ディスクドライブ108により光ディスクから読み出された映像データおよび音声データがテレビ300に与えられる。テレビ300では、デジタル形式の映像データがアナログ形式の映像信号に変換され、変換された映像信号に基づく映像がモニタ301に表示される。また、デジタル形式の音声データがアナログ形式の音声信号に変換され、変換された音声信号に基づく音声がスピーカ302から出力される。
さらに、端末1000の通信装置100においては、例えばネットワーク500から受信された映像データおよび音声データがメモリカード110に書き込まれる。
(2)ユーザによる端末1000の操作概要
以下の説明において、テレビ300のモニタ301には、通信装置100からD/Aコンバータ303を通して映像信号が与えられる。テレビ300のモニタ301は、与えられる映像信号に基づく映像を表示する。また、テレビ300のスピーカ302には、通信装置100からD/Aコンバータ304を通して音声信号が与えられる。テレビ300のスピーカ302は、与えられる音声信号に基づく音声を出力する。
ユーザによる端末1000の操作の概要を、テレビ300のモニタ301に表示される映像とともに説明する。
一のユーザが端末1000を用いて会話用サーバ2000にサインインする場合、一のユーザは例えば図1の会話起動ボタン412を操作する。これにより、リモートコントローラ400から通信装置100に会話プログラムを実行することを示す操作信号が与えられる。会話プログラムが実行されることにより、テレビ300のモニタ301にサインイン画面が表示される。
図3は、サインイン画面を示す図である。図3に示すように、サインイン画面SC1には、ユーザIDの入力枠f1、パスワードの入力枠f2、サインインボタンb1および登録画面ボタンb2が表示される。ユーザは、図1のリモートコントローラ400の十字キー414を操作することにより入力枠f1,f2、サインインボタンb1および登録画面ボタンb2をそれぞれ選択することができる。ユーザは、図1のリモートコントローラ400の図示しない複数の数字ボタン等を用いて入力枠f1,f2に文字を入力することができる。
ユーザは、入力枠f1,f2にそれぞれユーザIDおよびパスワードを入力した後、サインインボタンb1を選択し、図1のリモートコントローラ400の決定ボタン415を操作する。これにより、会話用サーバ2000へのサインインが実行される。
一方、ユーザは、会話用サーバ2000にユーザ情報を登録する場合、登録画面ボタンb2を選択し、図1のリモートコントローラ400の決定ボタン415を操作する。この場合、テレビ300のモニタ301にユーザ登録画面が表示される。
図4は、ユーザ登録画面を示す図である。図4に示すように、ユーザ登録画面SC2には、ユーザの名前の入力枠f3、ユーザIDの入力枠f1、パスワードの入力枠f2および登録ボタンb3が表示される。ユーザは、図1のリモートコントローラ400の十字キー414を操作することにより入力枠f1,f2,f3および登録ボタンb3をそれぞれ選択することができる。ユーザは、入力枠f1,f2,f3にそれぞれユーザID、パスワードおよび名前を入力した後、登録ボタンb3を選択し、図1のリモートコントローラ400の決定ボタン415を操作する。これにより、会話用サーバ2000にユーザ情報が登録される。
会話用サーバ2000へのサインインが実行されることにより、テレビ300のモニタ301にコンタクト画面が表示される。
図5は、コンタクト画面を示す図である。上述のように、図2の通信装置100のフラッシュメモリ112には、コンタクトリストが記憶されている。図5に示すように、コンタクト画面SC3には、フラッシュメモリ112に記憶されたコンタクトリストを表示するためのコンタクトリストボタンb4が表示される。この状態で、ユーザは、コンタクトリストボタンb4を選択し、図1のリモートコントローラ400の決定ボタン415を操作する。この場合、テレビ300のモニタ301にコンタクトリスト画面が表示される。
図6は、コンタクトリスト画面を示す図である。図6に示すように、コンタクトリスト画面SC4には、例えば通信装置100に記憶された複数のユーザIDにそれぞれ対応付けられた複数のユーザIDボタンb5が表示される。ユーザは、複数のユーザIDボタンb5のうちのいずれかを選択し、図1のリモートコントローラ400の決定ボタン415を操作する。
これにより、選択されたユーザIDが会話要求として会話用サーバ2000に送信される。選択されたユーザIDによるサインインが既に行われている場合に、端末1000の通信装置100は、そのユーザIDによるサインインに用いられた他の通信端末のアドレスを会話用サーバ2000から取得する。
その後、取得したアドレスを用いて端末1000の通信装置100から他の通信端末に会話を要求することを示す要求信号が送信される。通信装置100が他の通信端末からの応答信号を受けることにより、テレビ300のモニタ301に会話画面が表示される。
図7は、会話画面を示す図である。図7に示すように、会話画面SC5には、会話相手表示ウィンドウW1および自己表示ウィンドウW2が表示される。会話相手表示ウィンドウW1には、他の通信端末のカメラにより撮影された他のユーザの映像が表示される。自己表示ウィンドウW2には、カメラ/マイク装置200のカメラ201により撮影されたユーザの映像が表示される。また、カメラ/マイク装置200のマイク202に端末1000のユーザの音声が入力される。テレビ300のスピーカ302から他の通信端末のマイクに入力された他のユーザの音声が出力される。
上記のように、端末1000においてテレビ300のモニタ301に会話画面SC5が表示される場合には、他のユーザの通信端末のモニタにも会話画面SC5が表示される。他のユーザの通信端末のモニタには、端末1000のユーザの映像および他の通信端末のユーザの映像が表示される。また、他の通信端末のマイクに他のユーザの音声が入力される。他の通信端末のスピーカから端末1000のユーザの音声が出力される。
モニタ301に図5のコンタクト画面SC3が表示された状態で、他のユーザの通信端末から会話を要求することを示す要求信号が送信される場合がある。この場合、テレビ300のモニタ301に着信画面が表示される。
図8は、着信画面を示す図である。この場合、図8に示すように、着信画面SC6には、風景映像SSおよび複数の操作ボタンとともにビデオ応答ボタンb6が表示される。図9は、着信画面SC6の他の例を示す図である。図9の例では、着信画面SC6に風景映像が表示されていない。
ユーザは、図8または図9の着信画面SC6のビデオ応答ボタンb6を選択し、図1のリモートコントローラ400の決定ボタン415を操作する。または、ユーザは、図1のリモートコントローラ400の会話応答ボタン413を操作する。この場合、端末1000の通信装置100から他のユーザの通信端末に応答信号が送信されるとともに、テレビ300のモニタ301に図7の会話画面SC5が表示される。この状態で、ユーザは、要求信号を送信した他のユーザと会話することができる。
(3)会話動作
図2の制御LSI101のメモリに記憶された会話プログラムに基づく端末1000の動作(以下、会話動作と呼ぶ。)について、制御LSI101の詳細な構成とともに説明する。
図10は、図2の制御LSI101の詳細な構成を示すブロック図である。図10では、制御LSI101、図2のカメラ/マイク装置200、テレビ300およびネットワーク500の接続関係が示される。各接続部のインターフェースの図示は省略する。
図10に示すように、制御LSI101は、制御ブロック101Aおよび通信ブロック101Bからなる。制御ブロック101Aは、バッファ部121a,121b、復号化部122、合成部123、符号化部124、エコーキャンセル処理部125、差分レベル検出部126、報知信号生成部137および制御部129を含む。また、通信ブロック101Bは、通信管理部131、受信部132、パケット化部133および送信部134を含む。
制御LSI101の通信ブロック101Bにおいて、通信管理部131は、端末1000と他の通信端末との間で通信が行われている際に、他の通信端末において復号可能なデータの符号化方式を検出し、検出された符号化方式で送信用データを符号化することを指令する指令信号を制御ブロック101Aの制御部129に与える。例えば、通信管理部131は、他の通信端末においてH.264形式で符号化された映像データを復号することが可能である場合、H.264形式で映像データを符号化することを指令する指令信号を制御部129に与える。また、通信管理部131は、他の通信端末においてSILK形式で符号化された音声データを復号することが可能である場合、SILK形式で音声データを符号化することを指令する指令信号を制御部129に与える。
他の通信端末は、ネットワーク500を介して端末1000にデータ(映像データおよび音声データ)を送信する。端末1000の受信部132は、他の通信端末から送信されるデータ(映像データおよび音声データ)を受信する。受信されたデータはパケット化されている。
受信部132は、受信したデータを制御ブロック101Aのバッファ部121aに与える。バッファ部121aに、データが一時的に記憶される。また、受信部132は、データ(映像データおよび音声データ)が受信されていることを示す受信信号を制御部129に与える。
この場合、制御部129は、バッファ部121aに記憶されたデータ(映像データおよび音声データ)を復号化することを指令する指令信号を復号化部122に与える。これにより、バッファ部121aに記憶されたデータ(映像データおよび音声データ)が復号化部122により復号化される。
以下の説明では、復号化部122により復号化された映像データを受信映像データDaと呼び、復号化部122により復号化された音声データを受信音声データDbと呼ぶ。
受信映像データDaは合成部123に与えられる。合成部123には、カメラ/マイク装置200から後述する送信映像データDcが与えられる。合成部123は、受信映像データDaおよび送信映像データDcを合成することにより合成映像データEを生成する。
合成部123は、生成された合成映像データEをテレビ300のD/Aコンバータ303に与える。D/Aコンバータ303では、デジタル形式の合成映像データEがアナログ形式の合成映像信号に変換される。これにより、テレビ300のモニタ301に合成映像信号に基づく映像(例えば、図7の会話画面SC5または後述する図12の会話画面SC5)が表示される。
受信音声データDbはテレビ300のD/Aコンバータ304に与えられるとともに制御ブロック101A内のバッファ部121bに与えられる。D/Aコンバータ304では、デジタル形式の受信音声データDbがアナログ形式の音声信号に変換される。アナログ形式の音声信号は、音量調整部310を通してスピーカ302に入力される。スピーカ302から音声信号に基づく音声が出力される。
カメラ/マイク装置200のカメラ201により映像が撮影される。撮影された映像に基づく映像信号がA/Dコンバータ203に与えられる。A/Dコンバータ203では、アナログ形式の映像信号がデジタル形式の映像データに変換される。
カメラ/マイク装置200のマイク202に音声が入力される。入力された音声に基づく音声信号が、A/Dコンバータ204に与えられる。A/Dコンバータ204では、アナログ形式の音声信号がデジタル形式の音声データに変換される。
以下の説明では、A/Dコンバータ203により変換された映像データを送信映像データDcと呼び、A/Dコンバータ204により変換された音声データを送信音声データDdと呼ぶ。
テレビ300のスピーカ302から出力される音声の一部が、カメラ/マイク装置200のマイク202に入力される場合がある。そこで、本実施の形態では、エコーキャンセル処理部125が用いられる。
受信音声データDbが通信装置100からテレビ300に与えられると、その受信音声データDbに基づく音声がスピーカ302から出力され、マイク202に入力される。カメラ/マイク装置200においては、入力された音声に基づく送信音声データDdが生成され、通信装置100に与えられる。この場合、共通の音声に基づく受信音声データDbがテレビ300に与えられるタイミングと、共通の音声に基づく送信音声データDdが通信装置100に与えられるタイミングとの間には遅延(以下、この遅延量を入出力遅延量と呼ぶ。)が生じる。バッファ部121bは、復号化部122から与えられた受信音声データDbを入出力遅延量に相当する時間遅延させてエコーキャンセル処理部125に出力する。
エコーキャンセル処理部125には、カメラ/マイク装置200から送信音声データDdが与えられるとともに、バッファ部121bから受信音声データDbが与えられる。
エコーキャンセル処理部125は制御部129により制御される。エコーキャンセル処理部125は制御部129から開始信号を受けることにより、以下のエコーキャンセル処理を開始する。
ここで、開始信号は、端末1000のユーザが音声を発していないと想定されるタイミングで、制御部129からエコーキャンセル処理部125に与えられる。例えば、他のユーザの要求信号に応答する直後に、端末1000のユーザが音声を発している可能性は低い。そのため、開始信号は、ユーザにより会話応答ボタン413が操作された場合、または図8のビデオ応答ボタンb6が選択された場合に、制御部129からエコーキャンセル処理部125に与えられる。
また、他のユーザの音声がテレビ300から出力されている間に、端末1000のユーザが音声を発している可能性は低い。そのため、開始信号は、受信音声データDbのレベルが所定のしきい値(以下、音声しきい値と呼ぶ。)を超えた場合に制御部129からエコーキャンセル処理部125に与えられる。
エコーキャンセル処理部125は、制御部129から開始信号を受けると、カメラ/マイク装置200から与えられた送信音声データDdのレベルを検出するとともにバッファ部121bから与えられた受信音声データDbのレベルを検出する。
エコーキャンセル処理部125は、例えば一定期間内に検出された送信音声データDdのレベルの平均値(または最大値)を算出するとともに、一定期間内に検出された受信音声データDbのレベルの平均値(または最大値)を算出する。その後、エコーキャンセル処理部125は、受信音声データDbのレベルの平均値(または最大値)が送信音声データDdのレベルの平均値(または最大値)と同じになるように、受信音声データDbのレベルを増幅する。
続いて、エコーキャンセル処理部125は、与えられた送信音声データDdから増幅された受信音声データDbを減算するエコーキャンセル処理を行う。エコーキャンセル処理後の送信音声データDdは、符号化部124に与えられるとともに、差分レベル検出部126に与えられる。
図11は、エコーキャンセル処理部125によるエコーキャンセル処理を説明するための図である。図11(a)〜図11(d)において、縦軸は音声データのレベルを表し、横軸は時間を表す。図11(a)に送信音声データDdのレベルの経時的な変化が示される。図11(b)に受信音声データDbのレベルの経時的な変化が示される。図11(c)にエコーキャンセル処理部125により増幅された受信音声データDbのレベルの経時的な変化が示される。図11(d)にエコーキャンセル処理後の送信音声データDdのレベルの経時的な変化が示される。
送信音声データDdと受信音声データDbとは共通の音声に基づいて生成される。そのため、図11(a)および図11(c)に示すように、送信音声データDdのレベルの経時的変化と増幅された受信音声データDbのレベルの経時的変化とは、近似している。したがって、端末1000のユーザが音声を発しない場合には、図11(d)に実線で示すように、エコーキャンセル処理後の送信音声データDdのレベルは本来的にほぼ0になる。
通信装置100に接続されるテレビ300は必ずしも同じ仕様を有するとは限らない。そのため、スピーカ302の音声出力の特性により、スピーカ302から出力される音声の音量が大きい場合にスピーカ302から出力される音声に歪が生じる場合がある。この場合、送信音声データDdのレベルの経時的変化と増幅された受信音声データDbのレベルの経時的変化との間に大きな差が生じる。それにより、送信音声データDdから受信音声データDbの成分を十分に除去することができなくなる。その結果、図11(d)に点線で示すように、エコーキャンセル処理後の送信音声データDdのレベルが大きくなる。
エコーキャンセル処理後の送信音声データDdのレベルは、エコーキャンセル処理前の送信音声データDdにより表される波形と受信音声データDbにより表される波形との幾何学的な差分に相当する。
そこで、本実施の形態では、差分レベル検出部126が、エコーキャンセル処理後の送信音声データDdのレベルの絶対値が所定のしきい値(以下、レベル差分しきい値と呼ぶ。)TH1を超えたか否かを判定する。レベル差分しきい値TH1は、エコーキャンセル処理後の送信音声データDdのレベルの許容範囲の上限値(許容値)に設定される。差分レベル検出部126は、エコーキャンセル処理後の送信音声データDdのレベルの絶対値がレベル差分しきい値TH1を超えた場合に、音声の歪を検出したことを示す検出信号を制御部129に与える。
この場合、制御部129は、検出信号に応答して、報知データMの生成を指令する指令信号を報知信号生成部127に与える。報知信号生成部127は、制御部129からの指令信号に応答して報知データMを生成し、生成された報知データMを合成部123に与える。報知データMは、スピーカ302から出力される音声の出力条件の変更要求をユーザに提示するためのデータを含む。本実施の形態では、報知データMは、スピーカ302から出力される音声の音量を低減する操作を要求する報知映像を表示するための映像データを含む。
これにより、合成部123には、受信映像データDaおよび送信映像データDcとともに報知信号生成部127から報知データMが与えられる。この場合、合成部123は、受信映像データDa、送信映像データDcおよび報知データMを合成することにより合成映像データEを生成する。
生成された合成映像データEがテレビ300のD/Aコンバータ303によりアナログ形式の合成映像信号に変換されることにより、テレビ300のモニタ301に報知映像を含む会話画面SC5が表示される。
図12は、報知映像を含む会話画面SC5の一例を示す図である。図12に示すように、会話画面SC5には、会話相手表示ウィンドウW1および自己表示ウィンドウW2に加えて、報知ウィンドウW3が表示される。報知ウィンドウW3に報知映像が表示される。
図12の例では、報知ウィンドウW3に「こちら側の声が会話相手に伝わり難い可能性があります。TVの音量を少し下げて下さい。」というメッセージを含む報知映像が表示される。ユーザによりリモートコントローラ490の音量調整ボタン484bが操作されることにより、スピーカ302から出力される音声の音量が小さくなると、音声の歪が低減される。その結果、エコーキャンセル処理後の送信音声データDdのレベルを0に近づけることができる。
ユーザが報知映像のメッセージに従ってリモートコントローラ490を操作することによりエコーキャンセル処理後の送信音声データDdのレベルの絶対値がレベル差分しきい値TH1以下になると、差分レベル検出部126は検出信号を制御部129に与えない。この場合、制御部129から報知信号生成部127に指令信号が与えられないので、報知データMが生成されない。そのため、報知映像を含む図12の報知ウィンドウW3が会話画面SC5に表示されなくなる。
その結果、ユーザは、報知ウィンドウW3が消滅することを視認することにより、スピーカ302から出力される音声の音量の調整を行う必要がなくなったことを容易に認識することができる。
図10のエコーキャンセル処理部125は、制御部129から開始信号を受けない場合、エコーキャンセル処理を行わない。この場合、エコーキャンセル処理部125はカメラ/マイク装置200から与えられる送信音声データDdを符号化部124に与える。
会話動作時において、制御部129に通信管理部131から符号化に関する指令信号が与えられた場合、制御部129は、与えられた指令信号に従う符号化方式を指定する指定信号を符号化部124に与える。これにより、符号化部124は、指定信号により指定された符号化形式で送信映像データDcおよび送信音声データDdを符号化する。符号化された送信映像データDcおよび送信音声データDdがパケット化部133に与えられる。パケット化部133は、送信映像データDcおよび送信音声データDdのパケット化を行う。パケット化された送信映像データDcおよび送信音声データDdは送信部134からネットワーク500を通して他のユーザの通信端末に送信される。
上記の制御部129の機能は、例えばCPU(中央演算処理装置)およびメモリ等のハードウェアとコンピュータプログラム等のソフトウェアとにより実現される。
また、バッファ部121a,121b、復号化部122、合成部123、符号化部124、エコーキャンセル処理部125、差分レベル検出部126、報知信号生成部137、通信管理部131、受信部132、パケット化部133および送信部134は、電子回路等のハードウェアで実現されてもよく、これらの構成要素の一部が、CPUおよびメモリ等のハードウェアとコンピュータプログラム等のソフトウェアとにより実現されてもよい。
(4)会話プログラム
第1の実施の形態に係る会話プログラムに基づく処理の一例を説明する。図13は、第1の実施の形態に係る会話プログラムに基づく制御LSI101の一動作例を示すフローチャートである。以下に示す動作は、例えばユーザが端末1000により会話用サーバ2000にサインインすることにより所定の周期で実行される。
初めに、図10の制御LSI101の制御部129は、ユーザが図1のリモートコントローラ400を操作することにより他の通信端末からの要求信号に応答したか否かを判定する(ステップS11)。具体的には、制御部129は、図1のリモートコントローラ400の会話応答ボタン413が操作された場合に、リモートコントローラ400から与えられる操作信号に基づいてユーザが他の通信端末からの要求信号に応答したと判定する。または、制御部129は、図1のリモートコントローラ400の十字キー414が操作されることにより図8のビデオ応答ボタンb6が選択された後に図1のリモートコントローラ400の決定ボタン415が操作された場合に、リモートコントローラ400から与えられる操作信号に基づいてユーザが他の通信端末からの要求信号に応答したと判定する。
ユーザが他の通信端末からの要求信号に応答した場合、エコーキャンセル処理部125は、上記のエコーキャンセル処理を行う(ステップS12)。
次に、差分レベル検出部126は、エコーキャンセル処理後の送信音声データDdのレベルがレベル差分しきい値を超えたか否かを判定する(ステップS13)。
エコーキャンセル処理後の送信音声データDdのレベルがレベル差分しきい値を超えた場合に、図10の報知信号生成部127は、報知データMを生成する(ステップS14)。
続いて、合成部123は、生成された報知データMをカメラ/マイク装置200から与えられる送信音声データDdとともに受信映像データDaに合成する(ステップS15)。その後、合成部123は、合成により得られた合成映像データEをテレビ300に出力する(ステップS16)。これにより、会話プログラムが終了する。
上記のステップS11において、ユーザが他の通信端末からの要求信号に応答していない場合、制御部129は、受信音声データDbのレベルが音声しきい値を超えたか否かを判定する(ステップS21)。すなわち、制御部129は、他のユーザが音声を発したか否かを判定する。受信音声データDbのレベルが音声しきい値を超えた場合に、エコーキャンセル処理部125は上記のステップS12のエコーキャンセル処理を実行する。一方、受信音声データDbのレベルが音声しきい値を超えない場合に、上記のステップS11の処理に戻る。
上記のステップS13において、エコーキャンセル処理後の送信音声データDdのレベルがレベル差分しきい値を超えない場合、合成部123は、カメラ/マイク装置200から与えられる送信音声データDdを受信映像データDaに合成する(ステップS31)。その後、上記のステップS16の処理に進み、合成部123は、合成により得られた合成映像データEをテレビ300に出力する。
上記の会話プログラムに係る一連の処理が所定の周期で繰り返し実行されることにより、エコーキャンセル処理後の送信音声データDdのレベルがレベル差分しきい値を超えた場合に、上記のステップS13〜S15の処理により報知映像がモニタ301に表示される。
一方、モニタ301に報知映像が表示されている状態でエコーキャンセル処理後の送信音声データDdのレベルがレベル差分しきい値以下になった場合には、上記のステップS13,S31の処理により報知データMが生成されなくなる。それにより、モニタ301に表示されている報知画像が消滅する。
したがって、ユーザは、報知画像の表示状態を確認することにより、スピーカ302から出力される音声の音量の調整の要否を容易に認識することができる。
(5)効果
本実施の形態では、差分レベル検出部126により、エコーキャンセル処理後の送信音声データDdのレベルの絶対値がレベル差分しきい値TH1を超えたか否かが判定される。エコーキャンセル処理後の送信音声データDdのレベルの絶対値がレベル差分しきい値TH1を超えた場合に、報知映像をモニタ301に表示させるための報知データMが生成される。生成された報知データMは、合成部123により、受信映像データDaおよび送信映像データDcに合成され、モニタ301に与えられる。
これにより、テレビ300のモニタ301に報知映像が表示される。この場合、ユーザは、報知映像に含まれるメッセージに従ってスピーカ302から出力される音声の音量を小さくすることができる。それにより、スピーカ302から出力される音声の歪を低減することができる。そのため、エコーキャンセル処理後の送信音声データDdのレベルの絶対値をレベル差分しきい値TH1以下にすることができる。
したがって、他の通信端末に送信される送信音声データDdから他の通信端末において入力された音声の影響を十分に除去することができる。その結果、他の通信端末のユーザが覚える違和感を十分に抑制することが可能になる。
[2]第2の実施の形態
第2の実施の形態に係る通信システムについて、第1の実施の形態に係る通信システムと異なる点を説明する。第2の実施の形態に係る通信システムにおいては、図1の端末1000のテレビ300にアンテナが接続される。テレビ300は、アンテナにより放送局装置から送信される放送信号を受信可能に構成される。
(1)テレビの構成
図14は、第2の実施の形態に係るテレビ300の構成を示すブロック図である。図14に示すように、本実施の形態に係るテレビ300は、モニタ301、スピーカ302、D/Aコンバータ303,304、HDMI305、無線受信部306、映像音声処理回路307、チューナ308および音量調整部310を備える。チューナ308にアンテナ309が接続される。テレビ300のHDMI305は、HDMIケーブルを介して通信装置100のHDMI107に接続される。通信装置100の詳細な構成については後述する。
図14のテレビ300に用いられるリモートコントローラ490は、操作部491が表示モードボタン485を含む点を除き、図1および図2のリモートコントローラ490と同じ構成を有する。表示モードボタン485が操作されることにより、後述するテレビ300の表示モードを変更するための操作信号が生成される。
図14のテレビ300において、アンテナ309により放送局装置から送信される放送信号が受信される。チューナ308は、選局を行うとともに、選局されたチャンネルの放送信号を映像データおよび音声データに復調する。復調された映像データおよび音声データが映像音声処理回路307に与えられる。
映像音声処理回路307は例えばLSIで実現される。映像音声処理回路307は復号化部を含む。映像音声処理回路307の復号化部は、チューナ308から与えられる映像データおよび音声データを復号する。
テレビ300には、モニタ301に表示可能な複数の表示モードが設定されている。複数の表示モードとしては、例えばスタンダードモード、シネマモード、ダイナミックモードおよび会話モードがある。
ユーザは、リモートコントローラ490の表示モードボタン485を操作することにより、複数の表示モードのいずれかを選択することができる。映像音声処理回路307は、ユーザにより選択された表示モードに基づいて映像データに映像の画質および明るさ等を調整するための映像調整処理を行う。
複数の表示モードにそれぞれ対応する複数の映像調整処理はそれぞれ異なる。そのため、複数の映像調整処理に必要な時間もそれぞれ異なる。そこで、映像音声処理回路307は、映像調整処理後の映像データをD/Aコンバータ303に出力するタイミングと、音声データをD/Aコンバータ304に出力するタイミングとを同期させる。この場合、映像音声処理回路307は、音声データと映像データとを同期させるために、音声データを遅延させる。D/Aコンバータ303により、映像データがアナログ形式の映像信号に変換され、モニタ301に映像が表示される。D/Aコンバータ304により、音声データがアナログ形式の音声信号に変換され、スピーカ302から音声が出力される。このように、映像データの出力タイミングと音声データの出力タイミングとが一致しているので、モニタ301に表示される映像のタイミングとスピーカ302から出力される音声のタイミングとが一致する。
(2)スピーカから出力される音声の遅延
上記の会話動作時においても、テレビ300はユーザにより選択された表示モードに基づいて映像調整処理を行う。そのため、選択された表示モードに対応する映像調整処理の時間が長いと、通信装置100からテレビ300に受信音声データDbが与えられるタイミングと、その受信音声データDbに基づいてテレビ300のスピーカ302から音声が出力されるタイミングとの間に大きな差が生じる。この場合、ユーザが発声した後、他の通信端末のユーザの音声がスピーカ302から出力されるまでの時間が長くなる。そのため、ユーザは所望の表示モードでモニタ301に表示される映像を視認することができるが、会話に違和感を覚える。
以下の説明では、通信装置100からテレビ300に受信音声データDbが与えられるタイミングと、その受信音声データDbに基づいてテレビ300のスピーカ302から音声が出力されるタイミングとの差を音声遅延量と呼ぶ。
図15は、複数の表示モードにそれぞれ対応する音声遅延量の一覧である。図15の例では、スタンダードモードに対応する音声遅延量は200msecであり、シネマモードに対応する音声遅延量は400msecであり、ダイナミックモードに対応する音声遅延量は300msecであり、会話モードに対応する音声遅延量は100msecである。
このように、図15の例では、スタンダードモードに対応する音声遅延量は会話モードに対応する音声遅延量の2倍である。ダイナミックモードに対応する音声遅延量は会話モードに対応する音声遅延量の3倍である。シネマモードに対応する音声遅延量は会話モードに対応する音声遅延量の4倍である。
そのため、例えばテレビ300においてシネマモードが選択されておりかつ図10を用いて説明した入出力遅延量が大きい場合には、テレビ300の表示モードを音声遅延量が短い表示モード(例えば会話モード)に変更することが好ましい。テレビ300の表示モードが会話モードに変更されることにより、テレビ300における音声遅延量が低減される。それにより、会話時におけるユーザの違和感が抑制される。本実施の形態では、通信装置100の制御LSI101が以下の構成を有する。
(3)制御LSIの詳細な構成
図16は、第2の実施の形態に係る制御LSI101の詳細な構成を示すブロック図である。図16に示すように、本実施の形態に係る制御LSI101は、遅延量検出部121cをさらに含む点を除いて、図10の制御LSI101と同じ構成を有する。
この制御LSI101において、復号化部122により復号化された受信音声データDbが、遅延量検出部121cおよびバッファ部121bに与えられるとともに、テレビ300の映像音声処理回路307に与えられる。また、カメラ/マイク装置200のA/Dコンバータ204から送信音声データDdが遅延量検出部121cおよびエコーキャンセル処理部125に与えられる。
遅延量検出部121cは制御部129により制御される。遅延量検出部121cは制御部129から開始信号を受けることにより、以下の遅延量検出処理を行う。制御部129から遅延量検出部121cに開始信号が与えられるタイミングは、上述のエコーキャンセル処理部125に開始信号が与えられるタイミングと同じである。
遅延量検出部121cは、制御部129から開始信号を受けると、送信音声データDdのレベルの経時的変化を検出するとともに受信音声データDbのレベルの経時的変化をそれぞれ検出する。
さらに、遅延量検出部121cは、検出された受信音声データDbの波形および送信音声データDdの波形のパターンマッチングを行う。これにより、遅延量検出部121cは、上記の入出力遅延量を検出する遅延量検出処理を行う。入出力遅延量は、送信音声データDdの波形と受信音声データDbの波形との時間的な差分に相当する。
続いて、遅延量検出部121cは、検出された入出力遅延量が所定のしきい値(以下、遅延量しきい値と呼ぶ。)を超えたか否かを判定する。遅延量しきい値は、入出力遅延量の許容範囲の上限値(許容値)に設定される。
遅延量検出部121cは、入出力遅延量が遅延量しきい値を超えた場合に、入出力遅延量が大きいことを示す検出信号を制御部129に与える。
この場合、制御部129は、検出信号に応答して、報知データMの生成を指令する指令信号を報知信号生成部127に与える。報知信号生成部127は、制御部129からの指令信号に応答して報知データMを生成し、生成された報知データMを合成部123に与える。報知データMは、スピーカ302から出力される音声の出力条件の変更要求をユーザに提示するためのデータを含む。本実施の形態では、報知データMは映像データを含む。この映像データは、モニタ301にテレビ300の表示モードの変更を要求する報知映像を表示させるためのデータである。
これにより、合成部123には、受信映像データDaおよび送信映像データDcとともに報知信号生成部127から報知データMが与えられる。この場合、合成部123は、受信映像データDa、送信映像データDcおよび報知データMを合成することにより合成映像データEを生成する。
生成された合成映像データEがテレビ300の映像音声処理回路307を通してD/Aコンバータ303に与えられる。合成映像データEがD/Aコンバータ303によりアナログ形式の合成映像信号に変換されることにより、テレビ300のモニタ301に報知映像を含む会話画面SC5が表示される。
図17は、報知映像を含む会話画面SC5の他の例を示す図である。本例では、テレビ300の表示モードとしてシネマモードが選択されているものとする。図17に示すように、会話画面SC5には、会話相手表示ウィンドウW1および自己表示ウィンドウW2に加えて、報知ウィンドウW3が表示される。報知ウィンドウW3に報知映像が表示される。
図17の例では、報知ウィンドウW3に「表示モードを会話モードに変更して下さい。」というメッセージを含む報知映像が表示される。ユーザによりリモートコントローラ490の表示モードボタン485が操作されることにより、テレビ300の表示モードがシネマモードから会話モードに変更される。これにより、テレビ300における音声遅延量が低減され、入出力遅延量が低減される。
(4)音声の遅延に対応するために必要なバッファの容量
図18は、エコーキャンセル処理の概念図である。図18に示すように、テレビ300における音声遅延量が大きくなると、エコーキャンセル処理を行うために用いられるバッファ部121bによる受信音声データDbの遅延時間を長くする必要がある。そのため、バッファ部121bの記憶容量を大きくしなければならない。
バッファ部121bの記憶容量は、テレビ300における複数の表示モードにそれぞれ対応する遅延時間に基づいて決定することが好ましい。しかしながら、通信装置100に接続されるテレビ300は必ずしも同じ仕様を有するとは限らない。そのため、通信装置100に種々の仕様を有するテレビ300を接続可能にするためには、バッファ部121bが大きな記憶容量を有することが必要となる。
上記のように、図16の制御LSI101によれば、遅延量検出部121cにより入出力遅延量を低減するための報知映像がユーザに提示される。これにより、ユーザが入出力遅延量を低減するように表示モードを会話モードに変更するので、バッファ部121bの記憶容量を大きくする必要がなくなる。その結果、制御LSI101の高コスト化が抑制される。
(5)会話プログラム
第2の実施の形態に係る会話プログラムに基づく処理の一例を説明する。図19は、第2の実施の形態に係る会話プログラムに基づく制御LSI101の一動作例を示すフローチャートである。以下に示す動作は、例えばユーザが端末1000により会話用サーバ2000にサインインすることにより所定の周期で繰り返し実行される。
初めに、図16の制御LSI101の制御部129は、ユーザが図1のリモートコントローラ400を操作することにより他の通信端末からの要求信号に応答したか否かを判定する(ステップS41)。
ユーザが他の通信端末からの要求信号に応答した場合、遅延量検出部121cは、上記の遅延量検出処理を行う(ステップS42)。
次に、遅延量検出部121cは、検出された入出力遅延量が遅延量しきい値を超えたか否かを判定する(ステップS43)。
入出力遅延量が遅延量しきい値を超えた場合に、図16の報知信号生成部127が報知データMを生成する(ステップS44)。
続いて、合成部123は、生成された報知データMを、図16のカメラ/マイク装置200から与えられる送信音声データDdとともに受信映像データDaに合成する(ステップS45)。その後、合成部123は、合成により得られた合成映像データEをテレビ300に出力する(ステップS46)。これにより、会話プログラムが終了する。
上記のステップS41において、ユーザが他の通信端末からの要求信号に応答していない場合、制御部129は、受信音声データDbのレベルが音声しきい値を超えたか否かを判定する(ステップS51)。受信音声データDbのレベルが音声しきい値を超えた場合に、遅延量検出部121cは上記のステップS42の遅延量検出処理を実行する。一方、受信音声データDbのレベルが音声しきい値を超えない場合に、上記のステップS41の処理に戻る。
上記のステップS43において、検出された入出力遅延量が遅延量しきい値を超えない場合、合成部123は、カメラ/マイク装置200から与えられる送信音声データDdを受信映像データDaに合成する(ステップS61)。その後、上記のステップS46の処理に進み、合成部123は、合成により得られた合成映像データEをテレビ300に出力する。
上記の会話プログラムに係る一連の処理が所定の周期で繰り返し実行されることにより、入出力遅延量が遅延量しきい値を超えた場合に、上記のステップS43〜S45の処理により報知映像がモニタ301に表示される。
一方、モニタ301に報知映像が表示されている状態で入出力遅延量が遅延量しきい値以下になった場合には、上記のステップS43,S61の処理により報知データMが生成されなくなる。それにより、モニタ301に表示されている報知画像が消滅する。
したがって、ユーザは、報知画像の表示状態を確認することにより、テレビ300の表示モードを会話モードに変更すべきか否かを容易に認識することができる。
(6)効果
本実施の形態では、遅延量検出部121cにより入出力遅延量が検出され、検出された入出力遅延量が遅延量しきい値を超えたか否かが判定される。入出力遅延量が遅延量しきい値を超えた場合に、報知映像をモニタ301に表示させるための報知データMが生成される。生成された報知データMは、合成部123により受信映像データDaおよび送信映像データDcに合成され、モニタ301に与えられる。
これにより、テレビ300のモニタ301に報知映像が表示される。この場合、ユーザは、報知映像に含まれるメッセージに従ってテレビ300の表示モードを会話モードに変更することができる。テレビ300の表示モードが会話モードに変更されることにより、テレビ300における音声遅延量を最小にすることができる。したがって、入出力遅延量を十分に低減することができる。
その結果、複数の通信端末を用いた会話時に、各通信端末のユーザが覚える違和感を十分に抑制することが可能になる。
[3]変形例
(1)第1および第2の実施の形態において、差分レベル検出部126から検出信号が与えられた場合、制御部129は、図10および図16に一点鎖線で示すように、テレビ300の音量調整部310に音声信号のレベル低くするための制御信号を与えてもよい。この場合、音量調整部310は、制御部129から与えられる制御信号に基づいて音声信号のレベルを低くする。これにより、スピーカ302から出力される音声の音量が小さくなり、音声の歪が低減される。その結果、ユーザによるリモートコントローラ490の操作を伴うことなく、会話時にユーザが覚える違和感が十分に抑制される。
このように、制御部129から音量調整部310に制御信号が与えられる場合には、図10の報知信号生成部127は設けられなくてもよい。または、図10の報知信号生成部127は以下の報知データMを生成してもよい。
本例において、報知データMは、音声の歪を低減するためにスピーカ302から出力される音声の音量が小さくなったことを示す報知映像の映像データを含んでもよい。
この場合、差分レベル検出部126から制御部129に検出信号が与えられることによりスピーカ302から出力される音声の音量が小さくなると、音声の歪を低減するために音量が小さくなったことを示す報知映像がモニタ301に表示される。これにより、ユーザは上記の報知映像を視認することにより、音声の歪を低減するために音量が小さくなったことを容易に認識することができる。
報知データMは、音声の歪を低減するために音量が小さくなったことを報知するガイド音声の音声データを含んでもよい。
この場合、差分レベル検出部126から制御部129に検出信号が与えられることによりスピーカ302から出力される音声の音量が小さくなると、音声の歪を低減するために音量が小さくなったことを報知するガイド音声がスピーカ302から出力される。これにより、ユーザは上記のガイド音声を聴くことにより、音声の歪を低減するために音量が小さくなったことを容易に認識することができる。
(2)第2の実施の形態において、遅延量検出部121cから検出信号が与えられた場合、制御部129は、図16に一点鎖線で示すように、テレビ300の映像音声処理回路307にテレビ300の表示モードを会話モードに変更するための制御信号を与えてもよい。この場合、映像音声処理回路307は、制御部129から与えられる制御信号に基づいて会話モードに対応する映像調整処理を行う。これにより、テレビ300における音声遅延量を最も小さくすることができる。したがって、入出力遅延量を十分に低減することができる。その結果、ユーザによるリモートコントローラ490の操作を伴うことなく、会話時にユーザが覚える違和感が十分に抑制される。
このように、制御部129から音量調整部310に制御信号が与えられる場合には、図16の報知信号生成部127は設けられなくてもよい。または、図16の報知信号生成部127は以下の報知データMを生成してもよい。
本例において、報知データMは音声遅延量を小さくするためにテレビ300の表示モードが会話モードに変更されたことを示す報知映像の映像データを含んでもよい。
この場合、差分レベル検出部126から制御部129に検出信号が与えられることによりテレビ300の表示モードが会話モードに変更されると、音声遅延量を小さくするためにテレビ300の表示モードが会話モードに変更されたことを示す報知映像がモニタ301に表示される。これにより、ユーザは上記の報知映像を視認することにより、音声遅延量を小さくするためにテレビ300の表示モードが会話モードに変更されたことを容易に認識することができる。
報知データMは、音声遅延量を小さくするためにテレビ300の表示モードが会話モードに変更されたことを報知するガイド音声の音声データを含んでもよい。
この場合、差分レベル検出部126から制御部129に検出信号が与えられることによりテレビ300の表示モードが会話モードに変更されると、音声遅延量を小さくするためにテレビ300の表示モードが会話モードに変更されたことを報知するガイド音声がスピーカ302から出力される。これにより、ユーザは上記のガイド音声を聴くことにより、音声遅延量を小さくするためにテレビ300の表示モードが会話モードに変更されたことを容易に認識することができる。
(3)第2の実施の形態において、遅延量検出部121cから検出信号が与えられた場合、制御部129は、図16に一点鎖線で示すように、映像音声処理回路307に音声データの遅延を最も小さくするかまたは0にするための制御信号を与えてもよい。
この場合、映像音声処理回路307は、制御部129から与えられる制御信号に基づいて音声データの遅延を最も小さくしまたは0にする。これにより、入出力遅延量が十分に小さくなる。その結果、ユーザによるリモートコントローラ490の操作を伴うことなく、会話時にユーザが覚える違和感が十分に抑制される。
このように、制御部129から音量調整部310に指令信号が与えられる場合には、図16の報知信号生成部127は設けられなくてもよい。または、図16の報知信号生成部127は以下の報知データMを生成してもよい。
本例において、報知データMは音声遅延量を小さくするためにテレビ300における音声データの遅延量が小さくなったことを示す報知映像の映像データを含んでもよい。また、報知データMは音声遅延量を小さくするためにテレビ300における音声データの遅延量が小さくなったことを報知するガイド音声の音声データを含んでもよい。
これにより、ユーザは、上記の報知映像を視認するとともにガイド音声を聴くことにより、音声遅延量を小さくするためにテレビ300における音声データの遅延量が小さくなるように調整されたことを容易に認識することができる。
(4)第2の実施の形態において、会話モードが選択されている場合、図14の映像音声処理回路307は映像調整処理後の映像データをD/Aコンバータ303に出力するタイミングと、音声データをD/Aコンバータ304に出力するタイミングとを同期させなくてもよい。
この場合、通信装置100から映像音声処理回路307に合成映像データEおよび受信音声データDbが入力されると、映像調整処理の影響を受けることなく受信音声データDbがD/Aコンバータ304に出力される。それにより、テレビ300における音声遅延量を十分に小さくすることができる。その結果、入出力遅延量が十分に小さくなる。
(5)第2の実施の形態において、図16の遅延量検出部121cは検出された入出力遅延量を制御部129に与えてもよい。この場合、遅延量検出部121cにより入出力遅延量が遅延量しきい値を超えたか否かが判定される代わりに、制御部129が、遅延量検出部121cから与えられる入出力遅延量が遅延量しきい値を超えたか否かを判定してもよい。
(6)第2の実施の形態において、テレビ300のスピーカ302から出力される音声が、カメラ/マイク装置200のマイク202に入力されることがない場合には、図16の制御LSI101にエコーキャンセル処理部125および差分レベル検出部126が設けられなくてもよい。
(7)第1および第2の実施の形態においては、報知データMは、例えば端末1000のユーザにテレビ300の特定の操作を促す報知映像に基づく映像データである。これに限らず、報知データMは、例えば端末1000のユーザにテレビ300の特定の操作を促す音声に基づく音声データであってもよい。
この場合、例えばテレビ300に報知データMが入力されることにより、スピーカ302から「音量を下げてください。」または「表示モードを会話モードにして下さい。」等のガイド音声が出力される。
[4]請求項の各構成要素と実施の形態の各要素との対応
以下、請求項の各構成要素と実施の形態の各要素との対応の例について説明するが、本発明は下記の例に限定されない。
上記実施の形態では、通信装置100が通信装置の例であり、パーソナルコンピュータ600、テレビ700および携帯電話900が他装置の例であり、マイク202およびA/Dコンバータ204を含む構成が音声入力装置の例であり、スピーカ302、音量調整部310、D/Aコンバータ304および映像音声処理回路307を含む構成が音声出力装置の例である。
また、ネットワークインターフェース103、受信部132およびバッファ部121aが受信部の例であり、HDMI107および復号化部122が音声データ出力部の例であり、USBインターフェース105、エコーキャンセル処理部125および遅延量検出部121cが音声データ入力部の例であり、ネットワークインターフェース103、パケット化部133および送信部134が送信部の例である。
さらに、エコーキャンセル処理部125および遅延量検出部121cが差分検出部の例であり、差分レベル検出部126、遅延量検出部121cおよび制御部129が判定部の例であり、合成部123、報知信号生成部127および制御部129が提示信号生成部の例である。
また、レベル差分しきい値TH1および遅延量しきい値が許容量の例であり、報知データMが提示信号の例であり、エコーキャンセル処理部125が除去処理部の例であり、差分レベル検出部126がレベル検出部および判定部の例であり、スタンダードモード、シネマモード、ダイナミックモードおよび会話モードが複数の表示モードの例である。
また、モニタ301、D/Aコンバータ303および映像音声処理回路307を含む構成が映像出力装置の例であり、HDMI107および復号化部122が映像データ出力部の例であり、遅延量検出部121cが遅延検出部の例であり、制御部129が制御信号生成部の例である。
請求項の各構成要素として、請求項に記載されている構成または機能を有する他の種々の要素を用いることもできる。
本発明は、映像データおよび音声データの通信を行う通信機器に有効に利用することができる。
100 通信装置
103 ネットワークインターフェース
105 USBインターフェース
107 HDMI
121a バッファ部
121c 遅延量検出部
122 復号化部
123 合成部
125 エコーキャンセル処理部
126 差分レベル検出部
127 報知信号生成部
129 制御部
132 受信部
133 パケット化部
134 送信部
202 マイク
204 A/Dコンバータ
301 モニタ
302 スピーカ
303,304 D/Aコンバータ
307 映像音声処理回路
310 音量調整部
600 パーソナルコンピュータ
700 テレビ
900 携帯電話
1000 端末
TH1 レベル差分しきい値
M 報知データ

Claims (10)

  1. 他装置との間で映像データおよび音声データの送受信が可能でかつ音声入力装置および音声出力装置に接続可能な通信装置であって、
    前記他装置から送信される音声データを受信可能に構成された受信部と、
    前記受信部により受信された音声データを前記音声出力装置に出力する音声データ出力部と、
    前記音声入力装置からの音声データが入力される音声データ入力部と、
    前記音声データ入力部により入力された音声データを前記他装置に送信可能に構成された送信部と、
    前記音声データ出力部から出力された音声データに基づいて前記音声出力装置により音声が出力されるとともに前記出力された音声に基づく音声データが前記音声入力装置から前記音声データ入力部に入力されるときに、前記受信部により受信された音声データにより表される波形と前記音声データ入力部により入力された音声データにより表される波形との幾何学的または時間的な差分を検出する差分検出部と、
    前記差分検出部により検出された差分が予め定められた許容量を超えたか否かを判定する判定部と、
    前記判定部により差分が前記許容量を超えたと判定された場合に、前記音声データ出力部により出力される音声データに基づく音声の出力条件の変更要求を使用者に提示するための提示信号を生成する提示信号生成部とを備える、通信装置。
  2. 前記差分検出部は、
    前記音声データ入力部に入力された音声データから前記受信部により受信された音声データに相当する成分を除去する処理を行う除去処理部と、
    前記音声データ出力部から出力された音声データに基づいて前記音声出力装置により音声が出力されるとともに前記出力された音声に基づく音声データが前記音声入力装置から前記音声データ入力部に入力されるときに、前記除去処理部により処理された音声データのレベルを前記差分として検出するレベル検出部を含み、
    前記提示信号は、前記音声出力装置の音量の調整の要求を前記音声の出力条件の変更要求として含む、請求項1記載の通信装置。
  3. 前記提示信号は、前記音声出力装置の音量の低減の要求を前記音声の出力条件の変更要求として含む、請求項2記載の通信装置。
  4. 前記通信装置は、映像出力装置に接続可能であり、
    前記映像出力装置に映像データを出力する映像データ出力部をさらに備え、
    前記提示信号生成部は、前記音声出力装置の音量の調整の要求を表示するための映像データを前記提示信号として生成し、
    前記映像データ出力部は、前記提示信号生成部により生成された提示信号を前記映像出力装置に出力する、請求項2記載の通信装置。
  5. 前記音声出力装置は、入力された音声データの遅延量を変更可能に構成され、
    前記差分検出部は、
    前記音声データ出力部から出力された音声データに基づいて前記音声出力装置により音声が出力されるとともに前記出力された音声に基づく音声データが前記音声入力装置から前記音声データ入力部に入力されるときに、前記受信部により受信された音声データに対する前記音声データ入力部に入力された音声データの遅延量を前記差分として検出する遅延検出部を含み、
    前記提示信号は、前記音声出力装置における音声データの遅延量の変更を伴う操作の要求を前記音声の出力条件の変更要求として含む、請求項1記載の通信装置。
  6. 前記通信装置は、映像出力装置に接続可能であり、前記映像出力装置は、映像データに基づいて複数の表示モードのうち選択された表示モードで映像を表示可能に構成されるとともに、複数の表示モードにそれぞれ対応して映像データの遅延量が異なるように設定され、
    前記音声出力装置は、音声データが前記映像出力装置における映像データに同期するように音声データの遅延量が調整されるように構成され、
    前記受信部は、前記他装置から送信された映像データを受信可能に構成され、
    前記通信装置は、
    前記受信部により受信された映像データを出力する映像データ出力部をさらに備え、
    前記提示信号は、前記音声出力装置における音声データの遅延量の変更を伴う操作の要求として前記映像出力装置の表示モードの変更の操作の要求を含む、請求項5記載の通信装置。
  7. 前記提示信号生成部は、前記映像出力装置の表示モードの変更の操作の要求を表示するための映像データを前記提示信号として生成し、
    前記映像データ出力部は、前記提示信号生成部により生成された提示信号を前記映像出力装置に出力する、請求項6記載の通信装置。
  8. 前記受信部により受信された音声データを遅延させる遅延部と、
    前記音声データ入力部に入力された音声データから前記遅延部により遅延された音声データに相当する成分を除去する処理を行う除去処理部とをさらに備え、
    前記送信部は、前記除去処理部により処理された音声データを前記他装置に送信するように構成される、請求項5記載の通信装置。
  9. 他装置との間で映像データおよび音声データの送受信が可能でかつ音声入力装置および音声出力装置に接続可能な通信装置であって、
    前記他装置から送信される音声データを受信可能に構成された受信部と、
    前記受信部により受信された音声データを前記音声出力装置に出力する音声データ出力部と、
    前記音声入力装置からの音声データが入力される音声データ入力部と、
    前記音声データ入力部により入力された音声データを前記他装置に送信可能に構成された送信部と、
    前記音声データ出力部から出力された音声データに基づいて前記音声出力装置により音声が出力されるとともに前記出力された音声に基づく音声データが前記音声入力装置から前記音声データ入力部に入力されるときに、前記受信部により受信された音声データにより表される波形と前記音声データ入力部により入力された音声データにより表される波形との幾何学的または時間的な差分を検出する差分検出部と、
    前記差分検出部により検出された差分が予め定められた許容量を超えたか否かを判定する判定部と、
    前記判定部により差分が前記許容量を超えたと判定された場合に、前記音声データ出力部により出力される音声データに基づく音声の出力条件を変更するための制御信号を生成する制御信号生成部とを備える、通信装置。
  10. 他装置との間で映像データおよび音声データの送受信が可能でかつ音声入力装置および音声出力装置に接続可能な通信装置を用いた通信方法であって、
    前記他装置から送信される音声データを前記通信装置の受信部により受信するステップと、
    前記受信された音声データを前記通信装置の音声データ出力部から前記音声出力装置に出力するステップと、
    前記音声入力装置からの音声データを前記通信装置の音声データ入力部に入力するステップと、
    前記音声データ入力部に入力された音声データを前記通信装置の送信部から前記他装置に送信するステップと、
    前記音声データ出力部から出力された音声データに基づいて前記音声出力装置により音声が出力されるとともに前記出力された音声に基づく音声データが前記音声入力装置から前記音声データ入力部に入力されるときに、前記受信部により受信された音声データにより表される波形と前記音声データ入力部により入力された音声データにより表される波形との幾何学的または時間的な差分を検出するステップと、
    前記検出された差分が予め定められた許容量を超えたか否かを判定するステップと、
    前記差分が前記許容量を超えたと判定された場合に、前記音声データ出力部により出力される音声データに基づく音声の出力条件の変更要求を使用者に提示するための提示信号を出力するステップとを備える、通信方法。
JP2011111807A 2010-12-15 2011-05-18 通信装置および通信方法 Expired - Fee Related JP5877351B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011111807A JP5877351B2 (ja) 2010-12-15 2011-05-18 通信装置および通信方法

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP2010278788 2010-12-15
JP2010278788 2010-12-15
US201061427564P 2010-12-28 2010-12-28
US61/427,564 2010-12-28
US201161434876P 2011-01-21 2011-01-21
US61/434,876 2011-01-21
JP2011111807A JP5877351B2 (ja) 2010-12-15 2011-05-18 通信装置および通信方法

Publications (3)

Publication Number Publication Date
JP2012142910A true JP2012142910A (ja) 2012-07-26
JP2012142910A5 JP2012142910A5 (ja) 2014-06-26
JP5877351B2 JP5877351B2 (ja) 2016-03-08

Family

ID=46233842

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2011111807A Expired - Fee Related JP5877351B2 (ja) 2010-12-15 2011-05-18 通信装置および通信方法
JP2011225026A Pending JP2012142915A (ja) 2010-12-15 2011-10-12 通信装置およびその動作方法
JP2012548634A Pending JPWO2012081203A1 (ja) 2010-12-15 2011-12-08 通信装置およびその動作方法
JP2011274950A Pending JP2012142927A (ja) 2010-12-15 2011-12-15 通信装置、その動作方法およびその動作プログラム

Family Applications After (3)

Application Number Title Priority Date Filing Date
JP2011225026A Pending JP2012142915A (ja) 2010-12-15 2011-10-12 通信装置およびその動作方法
JP2012548634A Pending JPWO2012081203A1 (ja) 2010-12-15 2011-12-08 通信装置およびその動作方法
JP2011274950A Pending JP2012142927A (ja) 2010-12-15 2011-12-15 通信装置、その動作方法およびその動作プログラム

Country Status (3)

Country Link
US (4) US20120155657A1 (ja)
JP (4) JP5877351B2 (ja)
WO (1) WO2012081203A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017123648A (ja) * 2016-12-20 2017-07-13 ソニー株式会社 オーディオ機器

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201328079A (zh) * 2011-12-23 2013-07-01 Hon Hai Prec Ind Co Ltd 電視機轉接器
USD682304S1 (en) 2012-01-06 2013-05-14 Path, Inc. Display screen with graphical user interface
EP2724507B1 (en) * 2012-05-18 2015-07-08 Unify GmbH & Co. KG System and method for reducing bandwidth usage during a communication session
JP2014017642A (ja) * 2012-07-09 2014-01-30 Panasonic Corp 映像通信装置およびそれを用いた映像通信システム
JP5422085B1 (ja) * 2013-05-31 2014-02-19 楽天株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
US11271887B2 (en) 2014-04-07 2022-03-08 Nec Corporation Updating and transmitting action-related data based on user-contributed content to social networking service
JP6446893B2 (ja) * 2014-07-31 2019-01-09 富士通株式会社 エコー抑圧装置、エコー抑圧方法及びエコー抑圧用コンピュータプログラム
CN104639967A (zh) * 2015-01-31 2015-05-20 乐视致新电子科技(天津)有限公司 语音启动终端的方法及装置
DE102015211673A1 (de) * 2015-06-24 2016-12-29 Robert Bosch Gmbh Verfahren zum Betreiben eines Mobilgeräts und eines Datenmanagementsystems, Mobilgerät, Datenmanagementsystem
JP6365708B2 (ja) * 2016-04-05 2018-08-01 キヤノンマーケティングジャパン株式会社 ウェブ会議システム、ウェブ会議サーバ、ウェブ会議サーバとウェブ会議システムの制御方法、およびプログラム。
JP7074056B2 (ja) * 2016-05-13 2022-05-24 ソニーグループ株式会社 画像処理装置、画像処理システム、および画像処理方法、並びにプログラム
US10547660B2 (en) * 2016-09-12 2020-01-28 Bose Corporation Advertising media processing capabilities
JP6956354B2 (ja) * 2018-08-30 2021-11-02 パナソニックIpマネジメント株式会社 映像信号出力装置、制御方法、及び、プログラム
US20220368790A1 (en) * 2021-05-13 2022-11-17 Facebook Technologies, Llc Quick switching to receive a call on a tv

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007214976A (ja) * 2006-02-10 2007-08-23 Sharp Corp エコーキャンセル装置、テレビ電話端末、及びエコーキャンセル方法
JP2010268028A (ja) * 2009-05-12 2010-11-25 Hitachi Ltd 音響出力システム及び音響出力方法

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06125551A (ja) 1992-10-09 1994-05-06 G C Technol Kk コードレステレビ電話装置
US5717857A (en) * 1993-03-19 1998-02-10 Ncr Corporation System for switching data connection to use first channel and second channel without substantial interruption of transfer of audio signals and image data between computers
US5623538A (en) * 1995-08-30 1997-04-22 Lucent Technologies Inc. Shared distribution of internal message storage facilities by a plurality of communication terminals
US5995595A (en) * 1997-10-14 1999-11-30 Ameritech Corporation Method of sharing and transferring information between ISDN telephones
DK199801716A (da) * 1998-12-23 2000-06-24 Gn Netcom As Hovedsæt
KR100644579B1 (ko) * 1999-10-26 2006-11-13 삼성전자주식회사 인터넷에서 실시간 음성 및 영상 통신방법 및 그 통신장치
FR2802367B1 (fr) * 1999-12-14 2006-08-18 France Telecom Procede temps reel de traitement et de gestion pour l'annulation d'echo entre haut-parleur et microphone d'un terminal informatique
US6721415B1 (en) * 2000-02-17 2004-04-13 Bellsouth Intellectual Property Corporation Telephone voice messaging system and method using off-hook immediate trigger
US20030174549A1 (en) * 2000-03-31 2003-09-18 Yoshitaka Yaguchi Recording format, recording device and reproducing device
NO20002565L (no) * 2000-05-19 2001-11-20 Ericsson Telefon Ab L M Meldingsoverföring i H.323 nett ved anropsoppsett
JP3778784B2 (ja) * 2000-06-28 2006-05-24 シャープ株式会社 留守番電話機能を有するテレビ電話装置
JP2002077841A (ja) 2000-08-31 2002-03-15 Minolta Co Ltd カメラ付き携帯電話
KR100371684B1 (ko) * 2000-12-21 2003-02-11 엘지전자 주식회사 이동통신 시스템의 부번호를 이용한 영상 호 응답서비스방법
US7283808B2 (en) * 2001-01-18 2007-10-16 Research In Motion Limited System, method and mobile device for remote control of a voice mail system
EP1301059B1 (en) * 2001-05-01 2012-05-30 NTT DoCoMo, Inc. Reception notification control
US6751298B2 (en) * 2001-06-29 2004-06-15 International Business Machines Corporation Localized voice mail system
US20030041331A1 (en) * 2001-08-21 2003-02-27 Allen Paul G. System and method for mitigating interruptions during television viewing
US7155018B1 (en) * 2002-04-16 2006-12-26 Microsoft Corporation System and method facilitating acoustic echo cancellation convergence detection
US7324857B2 (en) * 2002-04-19 2008-01-29 Gateway Inc. Method to synchronize playback of multicast audio streams on a local network
US6879828B2 (en) * 2002-09-09 2005-04-12 Nokia Corporation Unbroken primary connection switching between communications services
JP4135071B2 (ja) * 2002-09-10 2008-08-20 ソニー株式会社 通信システムおよび通信方法
AU2003289788A1 (en) * 2002-12-20 2004-07-14 Nimcat Networks Inc. Voice mail system for packet switched networks
US20040248594A1 (en) * 2003-06-09 2004-12-09 Wren Paul I. Combined multimedia cordless phone and messaging system
DE60312332T2 (de) * 2003-09-30 2008-01-10 Siemens Ag Anrufsprungsystem, verfahren und vorrichtung
US7050553B2 (en) * 2003-11-20 2006-05-23 Lucent Technologies Inc. Communication device that provides enhanced services
JP4427733B2 (ja) * 2004-07-16 2010-03-10 ソニー株式会社 映像音声処理システム、アンプ装置および音声遅延処置方法
US20060029050A1 (en) * 2004-08-05 2006-02-09 Harris John C IP video telephone having integrated devices
JP2006060396A (ja) 2004-08-18 2006-03-02 Fujitsu Ltd 携帯端末装置
US7734034B1 (en) * 2005-06-21 2010-06-08 Avaya Inc. Remote party speaker phone detection
US20070195158A1 (en) * 2006-02-23 2007-08-23 Kies Jonathan K Apparatus and methods for managing video calls on a wireless device
JP4627281B2 (ja) * 2006-06-08 2011-02-09 富士通株式会社 通信支援システム、通信支援方法および通信支援プログラム
GB0704834D0 (en) 2007-03-13 2007-04-18 Skype Ltd Method of transmitting data in a communication system
GB0819389D0 (en) 2008-03-12 2008-11-26 Skype Ltd Method of transmitting data in a communication system
KR100933166B1 (ko) * 2007-08-20 2009-12-21 삼성전자주식회사 근거리 네트워크에서 데이터를 공유하기 위한 방법 및 이를 위한 단말기
JP2009089150A (ja) * 2007-10-01 2009-04-23 Sony Corp 情報処理装置および方法、並びにプログラム
US8315653B2 (en) * 2008-01-03 2012-11-20 Vtech Telecommunications Ltd. Routing messages between cellular handsets and a multi-handset cordless telephone system
US8583105B2 (en) * 2008-01-31 2013-11-12 Centurylink Intellectual Property Llc System and method for a personal phone extension
US8503669B2 (en) * 2008-04-07 2013-08-06 Sony Computer Entertainment Inc. Integrated latency detection and echo cancellation
GB2463103A (en) * 2008-09-05 2010-03-10 Skype Ltd Video telephone call using a television receiver
JP5235618B2 (ja) * 2008-11-12 2013-07-10 株式会社日立製作所 受信装置及び受信方法
US20110242268A1 (en) * 2010-03-31 2011-10-06 Jin Kim Television Appliance

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007214976A (ja) * 2006-02-10 2007-08-23 Sharp Corp エコーキャンセル装置、テレビ電話端末、及びエコーキャンセル方法
JP2010268028A (ja) * 2009-05-12 2010-11-25 Hitachi Ltd 音響出力システム及び音響出力方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017123648A (ja) * 2016-12-20 2017-07-13 ソニー株式会社 オーディオ機器

Also Published As

Publication number Publication date
WO2012081203A1 (ja) 2012-06-21
JP2012142915A (ja) 2012-07-26
US20120155827A1 (en) 2012-06-21
US20120162346A1 (en) 2012-06-28
JPWO2012081203A1 (ja) 2014-05-22
US20120155657A1 (en) 2012-06-21
JP2012142927A (ja) 2012-07-26
US8902277B2 (en) 2014-12-02
JP5877351B2 (ja) 2016-03-08
US20120154512A1 (en) 2012-06-21

Similar Documents

Publication Publication Date Title
JP5877351B2 (ja) 通信装置および通信方法
JP6179834B1 (ja) テレビ会議装置
CN101754087A (zh) 音频装置及其信号校准方法
CN108293104B (zh) 信息处理系统、无线终端和信息处理方法
JP7467513B2 (ja) 端末、音声連携再生システム及びコンテンツ表示装置
JP2004304601A (ja) Tv電話装置、tv電話装置のデータ送受信方法
US20160112574A1 (en) Audio conferencing system for office furniture
US20140362166A1 (en) Incoming call display method, electronic device, and incoming call display system
US20070171307A1 (en) Media playback system with real-time camera image display and method thereof
JP6781318B2 (ja) 情報処理システム及び無線端末
JP2006339869A (ja) 映像信号と音響信号の統合装置
JP2008028884A (ja) テレビ電話通信をなすコールセンタシステム
JP2015015728A (ja) 制御装置、および制御方法
JP7149386B2 (ja) 情報処理システム及び無線端末
JP5417502B2 (ja) 機器情報通信方法、映像表示装置および映像表示システム
US11533523B2 (en) Interconnected system for high-quality wireless transmission of audio and video between electronic consumer devices
US20160065638A1 (en) Controller and voice transmission system using the same
JP2011049959A (ja) インターホンシステム
WO2023014464A1 (en) Pairing a target device with a source device and pairing the target device with a partner device
JP5069263B2 (ja) テレビインターホン装置
JP2021036678A (ja) 情報処理システム及び無線端末
JP2006324940A (ja) 自動アニメーション付き留守番電話機能を備えた画像表示機能付き通信装置および自動アニメーション付き留守番電話機能を用いた通信方法
WO2013114472A1 (ja) 通信装置、その動作方法およびその動作プログラム
JP2006180027A (ja) 通話装置
JP2012235331A (ja) 電話システム、テレビジョン受像機、及びリモートコントローラ

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140514

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140514

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20141009

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150210

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20150212

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150915

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150917

R151 Written notification of patent or utility model registration

Ref document number: 5877351

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees