(実施形態1)
(1)概要
本実施形態に係る通話システム100は、図2に示すように、第1通話装置10と、第2通話装置20と、を備えている。第1通話装置(以下、単に「通話装置」と呼ぶこともある)10は、エコーサプレッサ12(図1参照)を備えている。すなわち、本実施形態に係る通話装置10は、例えば、ハンズフリー(拡声)通話を実現しつつ、マイクロフォン3とスピーカ2との音響結合により生じる音響エコーを抑圧する機能を持つ。
ここで、本実施形態に係る通話装置10は、音響エコーの抑圧性能の向上を図る目的で、図1に示すように、エコーサプレッサ12に加えて、減衰処理部13を備えている。減衰処理部13は、送話信号Si2を通すための送話線52に挿入され、判定条件を満足する場合に、送話信号Si2に対して減衰処理を行う。判定条件は、受話線51を通る受話信号Si1の振幅レベルが閾値以上であること、を含んでいる。本開示でいう「送話信号」は、通話装置10から相手側の通話装置(第2通話装置20)に送信される音声信号であって、通話装置10のユーザ(近端側話者)が発した音声に相当する音声信号(近端信号)を意味する。本開示でいう「受話信号」は、通話装置10が相手側の通話装置(第2通話装置20)から受信する音声信号であって、第2通話装置20のユーザ(遠端側話者)が発した音声に相当する音声信号(遠端信号)を意味する。また、本開示でいう「減衰処理」は、送話信号Si2の少なくとも一部の成分について振幅レベルを減衰する処理を意味する。また、本開示でいう「振幅レベル」は、振幅の大きさを意味しており、音声の音量が大きくなる程、この音声に相当する音声信号の振幅レベルが大きくなる。
したがって、通話装置10は、例えば、受話信号Si1の振幅レベルが比較的大きく、音響エコーに非線形歪みが生じるような状況において、減衰処理部13を作動させて、送話信号Si2に対する減衰処理を行わせることができる。減衰処理部13が送話信号Si2に対して減衰処理を行うことで、仮に、エコーサプレッサ12にて、エコーサプレッサ12の入力信号(送話信号Si2)の抑圧が行われなかったとしても、減衰処理部13にて音響エコーを減衰(抑圧)することができる。その結果、通話装置10によれば、音響エコーの抑圧性能の向上を図ることができる、という利点がある。
(2)構成
(2.1)通話システム
本実施形態に係る通話システム100は、図2に示すように、第1通話装置10と、第2通話装置20と、を備えている。第1通話装置10は、図1の通話装置10に相当するので、「第1通話装置」を単に「通話装置」と呼ぶこともある。
第1通話装置10及び第2通話装置20は、通話機能に関する基本的な構成が共通している。本開示でいう「通話機能」は、第1通話装置10と第2通話装置20とが音声信号を互いに送受信することにより、第1通話装置10のユーザと第2通話装置20のユーザとの通話を実現するための機能を意味する。図2の例では、通話システム100は、第1通話装置10及び第2通話装置20を1台ずつ備えているが、この例に限らず、第1通話装置10及び第2通話装置20の少なくとも一方を複数台備えていてもよい。
本実施形態では、通話システム100が、集合住宅用のインターホンシステムである場合を例として説明する。インターホンシステムは、インターホン子機とインターホン親機との間での通話を実現するシステムである。ここでは一例として、第1通話装置10は、集合住宅の各住戸に設置されたドアホン子機、又は集合住宅の共用ロビーに設置されたロビーインターホン等のインターホン子機であると仮定する。一方、第2通話装置20は、集合住宅の各住戸の室内(キッチン、リビング等の壁)に設置されたインターホン親機であると仮定する。また、通話システム100は、第1通話装置10及び第2通話装置20に加えて、インターホンシステムを構成する管理人室親機、制御装置及び分岐器等を含んでもよい。
第1通話装置10は、2線式の伝送線6を介して第2通話装置20と電気的に接続されている。第1通話装置10及び第2通話装置20の各々は、通話機能を実現するための基本的な構成として、通話処理部1と、スピーカ2と、マイクロフォン3と、通信回路4と、を備えている。また、第1通話装置10は、来訪者等を撮影するカメラを更に備え、第2通話装置20は、第1通話装置10のカメラで撮影された映像を表示するディスプレイを備えている。第1通話装置10と第2通話装置20とは、互いに音声信号、映像信号及び制御信号を多重伝送方式で送受信することにより、通話機能及び映像の表示機能等を実現する。また、第1通話装置10及び第2通話装置20の各々は、筐体及び操作部(呼出ボタン又は通話ボタン等)等を更に備えている。
このような構成の通話システム100によれば、第1通話装置10(インターホン子機)は、呼出ボタンが押されると、第2通話装置20(インターホン親機)に呼出信号を送信する。第2通話装置20は、第1通話装置10からの呼出信号を受信すると、第2通話装置20のスピーカ2から呼出音を出力し、この状態で通話ボタンが押されると、第1通話装置10との通話機能が有効になる。つまり、第1通話装置10のユーザと第2通話装置20のユーザとが、第1通話装置10及び第2通話装置20を介して互いに通話可能な状態となる。この状態において、第1通話装置10のユーザが発声すると、第1通信装置10は、第1通話装置10のユーザの音声に応じた音声信号としての送話信号Si2(図1参照)を第2通話装置20に送信する。第2通話装置20は、第1通話装置10から受信した送話信号Si2に応じた音声を、第2通話装置20のスピーカ2から出力する。一方、第2通話装置20のユーザが発声すると、第1通信装置10は、第2通話装置20のユーザの音声に応じた音声信号としての受話信号Si1(図1参照)を第2通話装置20から受信する。第1通話装置10は、第2通話装置20から受信した受話信号Si1に応じた音声を、第1通話装置10のスピーカ2から出力する。通話機能が有効な状態で通話ボタンが押されると、第1通話装置10と第2通話装置20との通話機能が終了する。
(2.2)通話装置
次に、通話装置10の構成について説明する。第2通話装置20における通話機能に関する基本的な構成は第1通話装置10と共通するので、ここでは、第1通話装置10である通話装置10の構成について説明し、第2通話装置20の構成についての説明は省略する。
通話装置10は、図2に示すように、通話処理部1、スピーカ2、マイクロフォン3及び通信回路4を備えている。
通話処理部1は、通話機能を実現するための種々の信号処理を実行する。通話処理部1は、スピーカ2、マイクロフォン3及び通信回路4と電気的に接続されている。通話処理部1は、例えば、2線4線変換回路(ハイブリッド回路)及び音声スイッチ(ボイススイッチ)等を含んでいる。本実施形態では、通話処理部1は、DSP(Digital Signal Processor)を主構成としており、デジタル信号からなる音声信号(受話信号Si1及び送話信号Si2)についての信号処理を実行する。
スピーカ2は、電気信号(音声信号)を音声に変換して出力する。ここでは、スピーカ2は、通話処理部1からスピーカアンプ及びD/A変換器等を通して入力される受話信号Si1を、音声に変換して出力する。スピーカ2は、通話装置10の筐体に固定されている。
マイクロフォン3は、音声を電気信号(音声信号)に変換して出力する。ここでは、マイクロフォン3から出力される電気信号は、A/D変換器及びマイクアンプ等を通して、送話信号Si2として通話処理部1に入力される。マイクロフォン3は、通話装置10の筐体に固定されている。
通信回路4は、相手側の通話装置(第2通話装置20)の通信回路4との通信機能を有している。本実施形態では一例として、通信回路4は、2線式の伝送線6を介して、デジタル伝送方式により、音声信号(受話信号Si1及び送話信号Si2)等を送受信する。ただし、通信回路4の通信方式は、この例に限らず、例えば、アナログ伝送方式であってもよいし、電波を媒体とする無線通信、又は有線通信と無線通信との組み合わせ等であってもよい。
ところで、本実施形態に係る通話処理部1は、図1に示すように、エコーキャンセラ11と、エコーサプレッサ12と、減衰処理部13と、を有している。通話処理部1は、受話線51と、送話線52と、を更に有している。
受話線51は、2線4線変換回路とスピーカ2とを電気的に接続し、相手側の通話装置(第2通話装置20)から通信回路4が受信しスピーカ2に出力される受話信号Si1を通すための経路である。送話線52は、マイクロフォン3と2線4線変換回路とを電気的に接続し、マイクロフォン3から出力され相手側の通話装置(第2通話装置20)へ通信回路4から送信される送話信号Si2を通すための経路である。図1は、通話処理部1の要部の機能を示す概念図であって、図1では、2線4線変換回路、音声スイッチ及び通信回路4等の図示を省略している。
エコーキャンセラ11、エコーサプレッサ12及び減衰処理部13は、いずれも送話線52に挿入される。エコーキャンセラ11、エコーサプレッサ12及び減衰処理部13は、マイクロフォン3側から、エコーキャンセラ11、エコーサプレッサ12、減衰処理部13の順に接続される。つまり、エコーキャンセラ11の後段にエコーサプレッサ12が位置し、エコーサプレッサ12の後段に減衰処理部13が位置する。
エコーキャンセラ11は、マイクロフォン3とスピーカ2との音響結合により生じる音響エコーの成分を、送話線52を通る送話信号Si2から減衰(抑圧)する機能を持つ。エコーキャンセラ11は、例えば、スピーカ2とマイクロフォン3との音響結合により形成される帰還経路(音響エコー経路)の伝達特性を適応フィルタにて同定し、受話信号Si1から推定される音響エコーを、送話信号Si2から減算する。エコーキャンセラ11にて音響エコーが減衰(抑圧)された送話信号Si2は、エコーサプレッサ12の入力信号として、エコーキャンセラ11の後段のエコーサプレッサ12に入力される。
エコーサプレッサ12は、送話線52を通る送話信号Si2を、指定された抑圧量で抑圧する。エコーサプレッサ12は、受話線51を通る受話信号Si1に対するエコーサプレッサ12の入力信号の振幅レベルの割合に応じて、送話信号Si2の抑圧量を変化させる。すなわち、エコーサプレッサ12での送話信号Si2の抑圧量は、可変(切替可能)であって、受話信号Si1に対するエコーサプレッサ12の入力信号の振幅レベルの割合に応じて、変化する(切り替わる)。エコーサプレッサ12の入力信号は、本実施形態では、エコーキャンセラ11の出力、つまりエコーキャンセラ11にて音響エコーが減衰(抑圧)された送話信号Si2である。ただし、エコーキャンセラ11では音響エコーを完全に抑圧することはできず、エコーキャンセラ11の出力(エコーサプレッサ12の入力信号)に、抑圧しきれなかった音響エコーの成分が残ることがある。以下、エコーキャンセラ11の出力に含まれる音響エコーの成分を「残留エコー」ともいう。
本実施形態では、エコーサプレッサ12は、検知部121及び抑圧部122を有している。
検知部121は、受話線51を通る受話信号Si1に対するエコーサプレッサ12の入力信号の振幅レベルの割合に基づいて、ダブルトークの検知を行う。検知部121は、受話信号Si1に対するエコーサプレッサ12の入力信号の振幅レベルの割合が規定値以下である場合に、シングルトーク(非ダブルトーク)と判断する。また、検知部121は、受話信号Si1に対するエコーサプレッサ12の入力信号の振幅レベルの割合が規定値より大きい場合に、ダブルトークと判断する。すなわち、通話装置10のユーザ(近端側話者)と相手側の通話装置(第2通話装置20)のユーザ(遠端側話者)とのうち、遠端側話者のみが発声しているシングルトーク時においては、検知部121は、シングルトーク(片方向通話)と判断する。一方、通話装置10のユーザ(近端側話者)と相手側の通話装置(第2通話装置20)のユーザ(遠端側話者)とのうち、双方のユーザが発声しているダブルトーク時においては、検知部121は、ダブルトーク(双方向通話)と判断する。本実施形態では、検知部121はダブルトークフラグを有しており、検知部121がダブルトークと判断している間、ダブルトークフラグの値が「ダブルトーク」を示すように構成されている。
抑圧部122は、検知部121の検知結果に応じて抑圧量を調節する。抑圧部122は、検知部121がシングルトークと判断した場合、つまり受話信号Si1に対するエコーサプレッサ12の入力信号の振幅レベルの割合が規定値以下である場合、シングルトークモードで動作し、抑圧量を基準値以上とする。また、検知部121がダブルトークと判断した場合、つまり受話信号Si1に対するエコーサプレッサ12の入力信号の振幅レベルの割合が規定値より大きい場合、ダブルトークモードで動作し、抑圧量を基準値未満とする。
具体的には、シングルトークモードにおいては、抑圧部122は、背景ノイズレベルまで音響エコーが抑圧されるように、十分に大きな抑圧量(基準値以上の抑圧量)で、送話信号Si2の抑圧処理を実行する。この場合、仮にエコーキャンセラ11の出力(エコーサプレッサ12の入力信号)に音響エコー(残留エコー)が残っていたとしても、エコーサプレッサ12にて音響エコー(残留エコー)が抑圧される。一方、ダブルトークモードにおいては、抑圧部122は、受話信号Si1の周波数成分のみが抑圧されるように、十分に小さな抑圧量(基準値未満の抑圧量)で、送話信号Si2の抑圧処理を実行する。この場合、ダブルトーク(双方向通話)を実現しながらも、仮にエコーキャンセラ11の出力(エコーサプレッサ12の入力信号)に音響エコー(残留エコー)が残っていたとしても、エコーサプレッサ12にて音響エコー(残留エコー)が抑圧される。
要するに、背景ノイズレベルまで音響エコーが抑圧されるような、エコーサプレッサ12での音響エコーの抑圧効果の高い(効きが強い)状態が、抑圧処理の抑圧量が大きい(基準値以上の)状態に該当する。反対に、受話信号Si1の周波数成分のみが抑圧されるような、エコーサプレッサ12での音響エコーの抑圧効果の低い(効きが弱い)状態が、抑圧処理の抑圧量が小さい(基準値未満の)状態に該当する。
減衰処理部13は、判定条件を満足する場合に、送話信号Si2に対して減衰処理を行う。すなわち、判定条件を満足する場合、減衰処理部13にて、送話信号Si2の少なくとも一部の成分について振幅レベルを減衰する減衰処理が実行される。本実施形態では、減衰処理部13は、送話線52に損失(ロス)要素を挿入することにより、送話線52を通過する送話信号Si2を損失要素にて減衰する。そのため、減衰処理部13での減衰処理による送話信号Si2の減衰量は、損失要素の損失量に応じて決定される。
ここで、減衰処理部13で用いられる判定条件は、受話信号Si1の振幅レベルが閾値以上であること(以下、「第1条件」ともいう)、を含んでいる。つまり、受話信号Si1の振幅レベルが閾値以上である場合に、減衰処理部13は、判定条件のうち第1条件を満足すると判定する。そのため、受話信号Si1の振幅レベルが閾値未満であれば、減衰処理部13は、判定条件のうち第1条件は満足しないと判定する。ここで、判定条件は、送話信号Si2の振幅レベルに関する条件は含まない。つまり、判定条件は送話信号Si2の振幅レベルの影響を受けず、送話信号Si2の振幅レベルによって減衰処理部13での判定条件の判定結果が変わることはない。
また、本実施形態では、判定条件は、エコーサプレッサ12において受話信号Si1に対するエコーサプレッサ12の入力信号の振幅レベルの割合が規定値より大きいと判断されること(以下、「第2条件」ともいう)、を更に含む。つまり、判定条件は、エコーサプレッサ12がダブルトークと判断していることを、2つ目の条件(第2条件)として含んでいる。本実施形態では、エコーサプレッサ12の検知部121がダブルトークと判断している間はダブルトークフラグの値が「ダブルトーク」を示すので、減衰処理部13は、エコーサプレッサ12からダブルトークフラグを取得し、第2条件を満たすか否かを判定する。
また、判定条件は、受話信号Si1の高調波成分が送話信号Si2に含まれていること(以下、「第3条件」ともいう)、を更に含む。つまり、判定条件は、受話信号Si1の高調波成分が送話信号Si2に含まれていることを、3つ目の条件(第3条件)として含んでいる。具体的は、減衰処理部13は、受話信号Si1に対して、例えば、高速フーリエ変換(FFT:Fast Fourier Transform)等のフーリエ変換を施すことにより、例えば、2次高調波から、4次高調波、又は5次高調波程度まで、受話信号Si1の高調波成分を求める。このようにして求まった高調波成分に相当する周波数成分が送話信号Si2において判定値以上含まれていれば、減衰処理部13は、受話信号Si1の高調波成分が送話信号Si2に含まれている、つまり第3条件を満たすと判定する。詳しくは「(3.1)通話装置の基本動作」の欄で説明するが、音響エコーに非線形歪みが生じると、音響エコー(非線形エコー)には、受話信号Si1の高調波成分が含まれることになるので、第3条件を満足する。
本実施形態では、減衰処理部13は、判定部131及び減衰部132を有している。
判定部131は、判定条件を満足するか否かを判定する。ここでは、上述したように判定条件は、第1条件、第2条件及び第3条件の3つの条件を含んでいる。判定部131は、第1条件、第2条件及び第3条件の全てを満足する場合に、判定条件を満足する、と判定する。判定条件(閾値等を含む)は、例えば、減衰処理部13に含まれるメモリに記憶されている。
減衰部132は、判定部131の判定結果に応じて減衰処理を実行する。つまり、減衰部132は、判定部131にて判定条件を満足すると判定された場合に、送話線52に損失要素を挿入することにより、送話線52を通過する送話信号Si2を損失要素にて減衰する減衰処理を行う。減衰処理での減衰量(損失要素の損失量)は、判定部131の判定結果に応じて決定される。
このように構成される減衰処理部13は、一例として、図3に示すフローチャートに従って動作する。
すなわち、減衰処理部13は、まず判定部131にて、受話信号Si1の振幅レベルを閾値と比較する(S1)。詳しくは「(3.2)減衰量の調節」の欄で説明するが、振幅レベルの比較対象となる閾値は、第1閾値と、第1閾値よりも大きい第2閾値と、を含んでいる(第1閾値<第2閾値)。減衰処理部13は、受話信号Si1の振幅レベルが第1閾値以上であれば(S2:Yes)、判定部131にて第1条件を満たすと判定する。
第1条件を満たすと判定すると、減衰処理部13は、判定部131にて、エコーサプレッサ12からダブルトークフラグを取得し(S3)、第2条件の判定を行う。このとき、取得したダブルトークフラグの値が「ダブルトーク」を示す場合、つまりエコーサプレッサ12の抑圧部122がダブルトークモードにある場合(S4:Yes)、減衰処理部13は、判定部131にて第2条件を満たすと判定する。
第2条件を満たすと判定すると、減衰処理部13は、判定部131にて、受話信号Si1の高調波成分を送話信号Si2から取得し(S5)、第3条件の判定を行う。このとき、取得した高調波成分が判定値以上であれば(S6:Yes)、減衰処理部13は、判定部131にて第3条件を満たすと判定する。
判定部131は、第1条件、第2条件及び第3条件を全て満足すると判定されると、判定条件を満たすと判定し、減衰部132での減衰処理における減衰量を決定する(S7)。詳しくは「(3.2)減衰量の調節」の欄で説明するが、減衰量は、受話信号Si1の振幅レベルに応じて決定される。減衰処理部13は、減衰量に対応する損失要素を送話線52に挿入することにより、送話線52を通過する送話信号Si2を損失要素にて減衰する減衰処理を行う(S8)。
また、第1条件、第2条件及び第3条件のうちの1つでも満足しない場合(S2:No,S4:No,S6:No)、減衰処理部13は、減衰処理(S8)を行うことなく一連の処理を終了する。
(3)動作
(3.1)通話装置の基本動作
以下、本実施形態に係る通話装置10の基本動作について、図4A〜図4Cを参照して説明する。図4A〜図4Cでは、通話処理部1の要部の機能を概念的に示している。
図4Aは、通話装置10のユーザ(近端側話者)と相手側の通話装置のユーザ(遠端側話者)とのうち、遠端側話者のみが発声しているシングルトーク時の通話装置10の動作を示している。図4Aの状態では、遠端側話者が発した音声(受話音声)に相当する受話信号Si1が、受話線51を通してスピーカ2から出力される。このとき、マイクロフォン3とスピーカ2との音響結合により音響エコーが生じると、この音響エコーに相当する送話信号Si2がマイクロフォン3から出力される。
図4Aでは、エコーキャンセラ11で抑圧しきれなかった音響エコーの成分が、エコーサプレッサ12の入力信号に残留エコーとして含まれる場合を想定している(図4A中に「エコー小」と表記)。この場合、エコーサプレッサ12は、シングルトークと判断し、シングルトークモードにおいて、背景ノイズレベルまで音響エコー(残響エコー)が抑圧されるように、基準値以上の抑圧量で、送話信号Si2の抑圧処理を実行する(図4A中に「シングルトークモード」と表記)。その結果、エコーサプレッサ12の出力においては、音響エコーの成分は略影響がない程度に抑圧される(図4A中に「エコー無し」と表記)。
また、図4Bは、通話装置10のユーザ(近端側話者)と相手側の通話装置のユーザ(遠端側話者)とのうち、双方のユーザが発声しているダブルトーク時の通話装置10の動作を示している。図4Bの状態では、遠端側話者が発した音声(受話音声)に相当する受話信号Si1が、受話線51を通してスピーカ2から出力される。さらに、近端側話者が発した音声(送話音声)がマイクロフォン3に入力されると、マイクロフォン3から送話音声に相当する送話信号Si2が出力される。このとき、マイクロフォン3とスピーカ2との音響結合により音響エコーが生じると、この音響エコーに相当する成分が送話信号Si2に重畳される。
図4Bでは、エコーキャンセラ11で抑圧しきれなかった音響エコーの成分が、エコーサプレッサ12の入力信号に残留エコーとして含まれる場合を想定している(図4B中に「エコー小」と表記)。この場合、エコーサプレッサ12は、ダブルトークと判断し、ダブルトークモードにおいて、受話信号Si1の周波数成分のみが抑圧されるように、基準値未満の抑圧量で、送話信号Si2の抑圧処理を実行する(図4B中に「ダブルトークモード」と表記)。つまり、エコーサプレッサ12での残留エコーの抑圧量は小さいものの、残留エコーは送話音声に相当する送話信号Si2に重畳されているので、エコーサプレッサ12の出力に占める残留エコーの割合でみれば残留エコーは十分抑圧される。その結果、エコーサプレッサ12の出力においては、音響エコーの成分は略影響がない程度に抑圧される(図4B中に「エコー影響無し」と表記)。
一方、図4Cは、通話装置10のユーザ(近端側話者)と相手側の通話装置のユーザ(遠端側話者)とのうち、遠端側話者のみが発声しているシングルトーク時において、受話信号Si1の振幅レベルが比較的大きい場合の、通話装置10の動作を示している。図4Cの状態では、遠端側話者が発した音声(受話音声)に相当する受話信号Si1が、受話線51を通してスピーカ2から出力される。このとき、マイクロフォン3とスピーカ2との音響結合により音響エコーが生じると、この音響エコーに相当する送話信号Si2がマイクロフォン3から出力される。ここで、図4Cの例では、例えば、スピーカ2から出力される受話音声による通話装置10の筐体の振動、又はスピーカ2の非線形特性等により、音響エコーに非線形歪みが生じて、非線形エコーが発生することを想定している。つまり、受話音声の音量が大きく、受話信号Si1の振幅レベルが大きい場合には、このような非線形エコーが発生することがある。
図4Cでは、エコーキャンセラ11で抑圧しきれなかった音響エコーの成分が、エコーサプレッサ12の入力信号に残留エコーとして含まれている。特に、非線形歪みの影響により、エコーキャンセラ11での音響エコーの抑圧性能が低下するため、エコーサプレッサ12の入力信号に含まれる音響エコーの成分が、図4Aの場合に比べて大きくなる(図4C中に「エコー大」と表記)。そのため、シングルトークであるにもかかわらず、エコーサプレッサ12は、誤ってダブルトークと判断し、ダブルトークモードで動作することがある(図4C中に「ダブルトークモード」と表記)。この場合において、エコーサプレッサ12での残留エコーの抑圧量は小さいため、エコーサプレッサ12の出力に占める残留エコーの割合でみても残留エコーの抑圧は不十分となる。音響エコーに非線形歪みが生じていると、音響エコー(非線形エコー)には、受話信号Si1の周波数成分(基本数)よりも、高調波成分が多く含まれることになる。したがって、特に本実施形態のようにダブルトークモードにおいて受話信号Si1の周波数成分のみを抑圧するエコーサプレッサ12では、音響エコー(非線形エコー)は殆ど抑圧されない。その結果、エコーサプレッサ12で抑圧しきれなかった音響エコーの成分が、エコーサプレッサ12の出力(減衰処理部13の入力信号)に残留エコーとして含まれる(図4C中に「エコー有り」と表記)。
この場合、減衰処理部13は、判定条件(第1条件、第2条件及び第3条件)を満足すると判定し、送話線52に損失要素を挿入することにより、送話線52を通過する送話信号Si2を損失要素にて減衰する減衰処理を行う。すなわち、図4Cの例では、受話信号Si1の振幅レベルが閾値以上であり、エコーサプレッサ12がダブルトークと判断しており、かつ受話信号Si1の高調波成分が送話信号Si2に含まれているので、判定条件を満足することになる。その結果、減衰処理部13の出力においては、音響エコーの成分は略影響がない程度に抑圧される(図4C中に「エコー無し」と表記)。
(3.2)減衰量の調節
次に、減衰処理部13が減衰処理における減衰量を調節する際の通話装置10の動作について、図5A及び図5Bを参照して説明する。図5A及び図5Bは、いずれも横軸が受話信号Si1の振幅レベルを表し、縦軸が減衰量を表すグラフである。
上述したように、本実施形態では、振幅レベルの比較対象となる閾値は、第1閾値と、第1閾値よりも大きい第2閾値と、を含んでいる(第1閾値<第2閾値)。減衰処理部13は、受話信号Si1の振幅レベルが第1閾値未満であれば、第1条件を満たさないと判定し、減衰処理は行わない。
一方、受話信号Si1の振幅レベルが第1閾値以上であれば、第1条件を満たすと判定し、減衰処理を実行する。この場合において、受話信号Si1の振幅レベルに応じて減衰処理における減衰量を調節する。すなわち、図5A及び図5Bに示すように、減衰処理部13は、受話信号Si1の振幅レベルが第1閾値と一致するときには、減衰処理における減衰量を第1減衰量とする。また、受話信号Si1の振幅レベルが第2閾値(>第1閾値)と一致するときには、減衰処理部13は、減衰処理における減衰量を第2減衰量とする。第2減衰量は、第1減衰量よりも大きい減衰量である。つまり、減衰処理における減衰量が第2減衰量である場合には、減衰処理における減衰量が第1減衰量である場合に比べて、減衰処理にて送話信号Si2が大きく減衰する。
ここにおいて、減衰処理部13は、受話信号Si1の振幅レベルが第1閾値と第2閾値との間の補間領域にある場合、受話信号Si1の振幅レベルの関数で減衰処理における減衰量が表されるように構成されている。本実施形態では、補間領域における受話信号Si1の振幅レベルと減衰量との関係として、図5A及び図5Bの2通りの関係を想定している。
第1の例では、図5Aに示すように、受話信号Si1の振幅レベルが第1閾値と第2閾値との間の補間領域にある場合、減衰処理における減衰量は、受話信号Si1の振幅レベルの線形関数で表される。すなわち、図5Aの例では、補間領域において、受話信号Si1の振幅レベルと減衰量とは比例関係にある。そのため、受話信号Si1の振幅レベルが第1閾値から第2閾値にかけて徐々に大きくなると、受話信号Si1の振幅レベルの第1閾値からの増加分に比例して、減衰量が第1減衰量から第2減衰量にかけて徐々に大きくなる。したがって、第1の例では、補間領域における減衰量の演算処理が比較的簡単になる。
第2の例では、図5Bに示すように、受話信号Si1の振幅レベルが第1閾値と第2閾値との間の補間領域にある場合、減衰処理における減衰量は、受話信号Si1の振幅レベルの対数(常用対数)関数で表される。図5Bでは、縦軸の減衰量をデシベル(dB)表記しており、受話信号Si1の振幅レベルが第1閾値未満の場合、減衰量が0〔dB〕である、つまり減衰しないことを表している。すなわち、図5Bの例では、受話信号Si1の振幅レベルが第1閾値から第2閾値にかけて徐々に大きくなると、受話信号Si1の振幅レベルの第1閾値からの増加分に応じて、減衰量が第1減衰量から第2減衰量にかけて指数関数的に大きくなる。したがって、第2の例では、補間領域における減衰量の増減が、人の聴覚特性に近くなる。
(4)変形例
実施形態1は、本開示の様々な実施形態の一つに過ぎない。実施形態1は、本開示の目的を達成できれば、設計等に応じて種々の変更が可能である。また、通話装置10と同様の機能は、通話装置制御方法、コンピュータプログラム、又はプログラムを記録した非一時的記録媒体等で具現化されてもよい。一態様に係る(コンピュータ)プログラムは、コンピュータシステムを、通話装置10として機能させるためのプログラムである。例えば、スマートフォン又はタブレット端末等を通話装置10として用いる場合、携帯端末が専用のアプリケーションソフト(プログラム)を起動することにより、プログラムは、携帯端末が備えるコンピュータシステムを通話装置10として機能させる。
以下、実施形態1の変形例を列挙する。以下に説明する変形例は、適宜組み合わせて適用可能である。
本開示における通話装置10は、例えば、通話処理部1等に、コンピュータシステムを含んでいる。コンピュータシステムは、ハードウェアとしてのプロセッサ及びメモリを主構成とする。コンピュータシステムのメモリに記録されたプログラムをプロセッサが実行することによって、本開示における通話装置10としての機能が実現される。プログラムは、コンピュータシステムのメモリに予め記録されてもよく、電気通信回線を通じて提供されてもよく、コンピュータシステムで読み取り可能なメモリカード、光学ディスク、ハードディスクドライブ等の非一時的記録媒体に記録されて提供されてもよい。コンピュータシステムのプロセッサは、半導体集積回路(IC)又は大規模集積回路(LSI)を含む1乃至複数の電子回路で構成される。複数の電子回路は、1つのチップに集約されていてもよいし、複数のチップに分散して設けられていてもよい。複数のチップは、1つの装置に集約されていてもよいし、複数の装置に分散して設けられていてもよい。
また、通話装置10に設けた複数の機能が、1つの筐体内に集約されていることは通話装置10に必須の構成ではなく、通話装置10の構成要素は、複数の筐体に分散して設けられていてもよい。さらに、通話装置10の少なくとも一部の機能は、例えば、クラウド(クラウドコンピューティング)等によって実現されてもよい。
また、スピーカ2及びマイクロフォン3は通話装置10に必須の構成ではなく、スピーカ2とマイクロフォン3との少なくとも一方は適宜省略されてもよい。この場合、例えば、通話装置10とは別体のヘッドセット又はハンドセット(受話器)等を通話装置10に電気的に接続することで、通話装置10を用いた通話が実現可能となる。
また、通話システム100において、第2通話装置20は携帯端末器との間で音声信号等を相互に転送する連携機能を更に備えていてもよい。携帯端末は、例えば、スマートフォン、タブレット端末及び携帯電話機等を含む。この場合、第1通話装置10の呼出ボタンが押されると、第2通話装置20は、例えば、ルータを介して携帯端末に呼出信号を転送し、第1通話装置10と携帯端末との間で通話機能が実現される。つまり、携帯端末が、第1通話装置10との通話機能を有する第2通話装置を構成する。同様に、携帯端末が、第2通話装置20との通話機能を有する第1通話装置を構成してもよい。特に、スマートフォン又はタブレット端末等の携帯端末が通話装置(第1通話装置又は第2通話装置)を構成する場合、携帯端末は、専用のアプリケーションソフトをインストールし、このアプリケーションソフトを起動することにより、通話装置として機能する。
また、通話システム100は、集合住宅用のインターホンシステムに限らず、互いに通話可能な第1通話装置10及び第2通話装置20を備えるシステムであればよく、例えば、戸建住宅用のインターホンシステムであってもよい。この場合、第1通話装置10及び第2通話装置20の各々は、屋外に設置されたインターホン子機、及び屋内に設置されたインターホン親機を構成する。また、通話システム100は、インターホンシステムに限らず、例えば、ナースコールシステム及び見守りシステム等であってもよい。さらに、通話装置(第1通話装置10又は第2通話装置20)は、例えば、電話機(スマートフォン及び携帯電話機等を含む)等であってもよい。
また、通話装置10において、エコーキャンセラ11は必須の構成ではなく、エコーキャンセラ11は適宜省略されてもよい。この場合でも、減衰処理部13は、例えば、音響エコーに非線形歪みが生じた際に、エコーサプレッサ12で抑圧しきれなかった音響エコーの成分を減衰処理により減衰(抑圧)できる。
また、エコーキャンセラ11、エコーサプレッサ12及び減衰処理部13は、マイクロフォン3側から、エコーキャンセラ11、エコーサプレッサ12、減衰処理部13の順に接続される構成に限らない。例えば、マイクロフォン3側から、エコーキャンセラ11、減衰処理部13、エコーサプレッサ12の順に接続されてもよい。また、通話処理部1は、デジタル回路に限らずアナログ回路で実現されてもよい。
また、減衰処理部13の判定条件は、第1条件、第2条件及び第3条件の3つの条件を含むことは必須でなく、第2条件及び第3条件の各々は適宜省略可能である。例えば、判定条件は、第1条件のみであってもよく、この場合、受話信号Si1の振幅レベルが閾値以上であれば必ず、減衰処理部13は判定条件を満足すると判定する。また、判定条件は、第1条件及び第2条件の組み合わせ、又は第1条件及び第3条件の組み合わせであってもよい。さらに、振幅レベルの比較対象となる閾値は、第1閾値及び第2閾値の2つに限らず、3つ以上の閾値を含んでいてもよい。
また、減衰処理部13の判定条件(閾値を含む)は、例えば、通話装置10の筐体の設置状態、通話装置10の型番(モデル)、又は通話装置10の回路特性等に応じて、決定されてもよい。スマートフォン又はタブレット端末等が通話装置10として用いられる場合、携帯端末のキャリブレーションを行って、減衰処理部13の判定条件(閾値を含む)が決定されてもよい。
また、振幅レベル及び閾値等の2値間の比較において、「以上」としているところは、2値が等しい場合、及び2値の一方が他方を上回る場合との両方を含む。ただし、これに限らず、ここでいう「以上」は、2値の一方が他方を上回る場合のみを含む「より大きい」と同義であってもよい。つまり、2値が等しい場合を含むか否かは、閾値等の設定次第で任意に変更できるので、「以上」か「より大きい」かに技術上の差異はない。同様に、「未満」においても「以下」と同義であってもよい。
(実施形態2)
本実施形態に係る通話装置10は、減衰処理部13での減衰処理が、実施形態1に係る通話装置10と相違する。以下、実施形態1と同様の構成については、共通の符号を付して適宜説明を省略する。
本実施形態では、減衰処理部13は、減衰処理として、送話信号Si2に含まれている受話信号Si1の高調波成分を減衰する処理を行うように構成されている。すなわち、本実施形態では、減衰処理部13は、減衰処理により、送話信号Si2の全ての周波数成分を一律に減衰するのではなく、送話信号Si2に含まれている受話信号Si1の高調波成分のみを減衰する。具体的には、減衰処理部13は、特定の周波数成分を減衰させるフィルタを送話線52に挿入することにより、送話線52を通過する送話信号Si2について特定の周波数成分を減衰させる。この場合に、減衰処理部13は、受話信号Si1に対して、例えば、高速フーリエ変換等のフーリエ変換を施すことにより受話信号Si1の高調波成分を求め、求まった高調波成分に相当する周波数成分を減衰させるように、フィルタのパラメータを決定する。
音響エコーに非線形歪みが生じると、音響エコー(非線形エコー)には、受話信号Si1の高調波成分が多く含まれることになる。本実施形態に係る通話装置10によれば、この高調波成分を減衰することにより、非線形エコーについて効率的に抑圧を図ることができる。
実施形態2で説明した構成は、実施形態1で説明した種々の構成(変形例を含む)と適宜組み合わせて採用可能である。
(実施形態3)
本実施形態に係る通話装置10は、減衰処理部13の判定条件が、実施形態1に係る通話装置10と相違する。以下、実施形態1と同様の構成については、共通の符号を付して適宜説明を省略する。
本実施形態では、判定条件は、エコーサプレッサ12の入力信号と受話信号Si1との間に所定の相関があること(以下、「第4条件」ともいう)、を更に含んでいる。つまり、判定条件は、第1条件、第2条件及び第3条件に加えて、第4条件の4つの条件を含んでいる。減衰処理部13は、第1条件、第2条件、第3条件及び第4条件の全てを満足する場合に、判定条件を満足する、と判定する。
所定の相関は、例えば、エコーサプレッサ12の入力信号と受話信号Si1との振幅レベルの比率、エコーサプレッサ12の入力信号と受話信号Si1との高調波成分の比率等によって表される。つまり、例えば、エコーサプレッサ12の入力信号と受話信号Si1との振幅レベルの比率が所定の範囲内にあれば、減衰処理部13は、エコーサプレッサ12の入力信号と受話信号Si1との間に所定の相関がある、と判定する。
実施形態3で説明した構成は、実施形態1で説明した種々の構成(変形例を含む)及び実施形態2で説明した種々の構成と適宜組み合わせて採用可能である。
(まとめ)
以上説明したように、第1の態様に係る通話装置(10)は、エコーサプレッサ(12)と、減衰処理部(13)と、を備える。エコーサプレッサ(12)は、送話線(52)に挿入され、送話線(52)を通る送話信号(Si2)を、指定された抑圧量で抑圧する。減衰処理部(13)は、送話線(52)に挿入され、判定条件を満足する場合に、送話信号(Si2)に対して減衰処理を行う。エコーサプレッサ(12)は、受話線(51)を通る受話信号(Si1)に対するエコーサプレッサ(12)の入力信号の振幅レベルの割合が規定値以下である場合に、抑圧量を基準値以上とする。エコーサプレッサ(12)は、受話信号(Si1)に対するエコーサプレッサ(12)の入力信号の振幅レベルの割合が規定値より大きい場合に、抑圧量を基準値未満とする。判定条件は、受話信号(Si1)の振幅レベルが閾値以上であることを含む。
この構成によれば、通話装置(10)は、例えば、受話信号(Si1)の振幅レベルが比較的大きく、音響エコーに非線形歪みが生じるような状況において、減衰処理部(13)を作動させて、送話信号(Si2)に対する減衰処理を行わせることができる。減衰処理部(13)が送話信号(Si2)に対して減衰処理を行うことで、仮に、エコーサプレッサ(12)にて、エコーサプレッサ(12)の入力信号の抑圧が行われなかったとしても、減衰処理部(13)にて音響エコーを減衰することができる。その結果、通話装置(10)によれば、音響エコーの抑圧性能の向上を図ることができる、という利点がある。
第2の態様に係る通話装置(10)は、第1の態様において、送話線(52)に挿入されるエコーキャンセラ(11)を更に備える。エコーサプレッサ(12)の入力信号は、エコーキャンセラ(11)の出力信号からなる。
この構成によれば、エコーサプレッサ(12)の前段に設けられたエコーキャンセラ(11)にて音響エコーの抑圧が可能になり、音響エコーの抑圧性能の更なる向上を図ることができる。
第3の態様に係る通話装置(10)は、第1又は2の態様において、判定条件は、送話信号(Si2)の振幅レベルに関する条件を含まない。
この構成によれば、例えば、ダブルトーク時において、通話装置(10)のユーザ(近端側話者)の音声に相当する送話信号(Si2)の振幅レベルのみにより、減衰処理部(13)が作動することはない。したがって、通話装置(10)では、減衰処理部(13)による減衰処理が作動しない状態でのダブルトークを実現可能である。
第4の態様に係る通話装置(10)は、第1〜3のいずれかの態様において、閾値は、第1閾値及び第1閾値よりも大きい第2閾値を含んでいる。減衰処理部(13)は、受話信号(Si1)の振幅レベルが第1閾値と一致するときには、減衰処理における減衰量を第1減衰量とするように構成されている。減衰処理部(13)は、受話信号(Si1)の振幅レベルが第2閾値と一致するときには、減衰処理における減衰量を第1減衰量よりも大きい第2減衰量とするように構成されている。
この構成によれば、受話信号(Si1)の振幅レベルに応じて減衰処理における減衰量が変化するので、非線形歪みの大きさに応じた、適切な減衰処理が可能となる。
第5の態様に係る通話装置(10)は、第4の態様において、受話信号(Si1)の振幅レベルが第1閾値と第2閾値との間の補間領域にある場合、減衰処理における減衰量は、受話信号(Si1)の振幅レベルの線形関数で表される。
この構成によれば、補間領域における減衰量の演算処理が比較的簡単になる。
第6の態様に係る通話装置(10)は、第4の態様において、受話信号(Si1)の振幅レベルが第1閾値と第2閾値との間の補間領域にある場合、減衰処理における減衰量は、受話信号(Si1)の振幅レベルの対数関数で表される。
この構成によれば、補間領域における減衰量の増減が、人の聴覚特性に近くなる。
第7の態様に係る通話装置(10)は、第1〜6のいずれかの態様において、判定条件は、エコーサプレッサ(12)において受話信号(Si1)に対するエコーサプレッサ(12)の入力信号の振幅レベルの割合が規定値より大きいと判断されることを更に含む。
この構成によれば、不要な減衰処理を低減しながらも、エコーサプレッサ(12)がダブルトークと判断した結果、エコーサプレッサ(12)での音響エコーの抑圧が十分に行われない場合には、減衰処理部(13)にて音響エコーを減衰することができる。
第8の態様に係る通話装置(10)は、第1〜7のいずれかの態様において、判定条件は、受話信号(Si1)の高調波成分が送話信号(Si2)に含まれていることを更に含む。
この構成によれば、不要な減衰処理を低減しながらも、音響エコーに非線形歪みが生じて、受話信号(Si1)の高調波成分が送話信号(Si2)に含まれる場合には、減衰処理部(13)にて音響エコーを減衰することができる。
第9の態様に係る通話装置(10)は、第1〜8のいずれかの態様において、減衰処理部(13)は、減衰処理として、送話信号(Si2)に含まれている受話信号(Si1)の高調波成分を減衰する処理を行うように構成されている。
この構成によれば、送話信号(Si2)に含まれている受話信号(Si1)の高調波成分以外の周波数成分に対する、不要な減衰処理を低減することができる。
第10の態様に係る通話装置(10)は、第1〜9のいずれかの態様において、判定条件は、エコーサプレッサ(12)の入力信号と受話信号(Si1)との間に所定の相関があることを更に含む。
この構成によれば、不要な減衰処理を低減しながらも、判定条件は、エコーサプレッサ(12)の入力信号と受話信号(Si1)との間に所定の相関がある場合には、減衰処理部(13)にて音響エコーを減衰することができる。
第11の態様に係るプログラムは、コンピュータシステムを、第1〜10のいずれかの態様に係る通話装置(10)として機能させるためのプログラムである。
このプログラムによれば、通話装置(10)は、例えば、受話信号(Si1)の振幅レベルが比較的大きく、音響エコーに非線形歪みが生じるような状況において、減衰処理部(13)を作動させて、送話信号(Si2)に対する減衰処理を行わせることができる。減衰処理部(13)が送話信号(Si2)に対して減衰処理を行うことで、仮に、エコーサプレッサ(12)にて、エコーサプレッサ(12)の入力信号の抑圧が行われなかったとしても、減衰処理部(13)にて音響エコーを減衰することができる。その結果、上記プログラムによれば、音響エコーの抑圧性能の向上を図ることができる、という利点がある。
第12の態様に係る通話システムは、第1〜10のいずれかの態様に係る通話装置(10)からなる第1通話装置(10)と、第1通話装置(10)との間で、送話信号(Si2)及び受話信号(Si1)の授受を行う第2通話装置(20)と、を備える。
この構成によれば、第1通話装置(10)は、例えば、受話信号(Si1)の振幅レベルが比較的大きく、音響エコーに非線形歪みが生じるような状況において、減衰処理部(13)を作動させて、送話信号(Si2)に対する減衰処理を行わせることができる。減衰処理部(13)が送話信号(Si2)に対して減衰処理を行うことで、仮に、エコーサプレッサ(12)にて、エコーサプレッサ(12)の入力信号の抑圧が行われなかったとしても、減衰処理部(13)にて音響エコーを減衰することができる。その結果、通話システム(100)によれば、音響エコーの抑圧性能の向上を図ることができる、という利点がある。
上記態様に限らず、実施形態1、実施形態2及び実施形態3に係る通話装置(10)の種々の構成(変形例を含む)は、(コンピュータ)プログラム、又はプログラムを記録した非一時的記録媒体等で具現化可能である。
第2〜10の態様に係る構成については、通話装置(10)に必須の構成ではなく、適宜省略可能である。