JP2016019263A - 音声通信装置およびプログラム - Google Patents

音声通信装置およびプログラム Download PDF

Info

Publication number
JP2016019263A
JP2016019263A JP2014143053A JP2014143053A JP2016019263A JP 2016019263 A JP2016019263 A JP 2016019263A JP 2014143053 A JP2014143053 A JP 2014143053A JP 2014143053 A JP2014143053 A JP 2014143053A JP 2016019263 A JP2016019263 A JP 2016019263A
Authority
JP
Japan
Prior art keywords
sound
signal
level
unit
acoustic signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014143053A
Other languages
English (en)
Other versions
JP6409378B2 (ja
Inventor
祐弘 向嶋
Yoshihiro Mukoujima
祐弘 向嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2014143053A priority Critical patent/JP6409378B2/ja
Publication of JP2016019263A publication Critical patent/JP2016019263A/ja
Application granted granted Critical
Publication of JP6409378B2 publication Critical patent/JP6409378B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】送話者の音声と送話者の環境音とを受話者に提供する。【解決手段】受信部34は、通話相手の音声通信装置から送信された受話信号SRを受信する。放音部50は、受信部34が受信した受話信号SRに応じた音響を放音する。収音部20は、目的音と環境音とを含む音響を収音して収音信号MA1、MA2、MBを生成する。第1信号処理部11は、収音信号のうち目的音成分を強調した第1音響信号S1を生成する。第2信号処理部12は、収音信号のうち環境音成分を強調した第2音響信号S2を生成する。制御部40は、受話信号SRのレベルに応じて第2音響信号S2のレベルを制御する。送信部32は、第1音響信号S1と第2音響信号S2とを送信する。【選択図】図2

Description

本発明は、利用者間で音声を授受する音声通信技術に関する。
利用者が発声した会話音等の音声を示す音響信号を複数の利用者間で通信網を介して送受信する音声通信装置において、収音機器が収音した音響信号から雑音成分を抑圧する技術が従来から提供されている。例えば特許文献1には、音響信号から推定される雑音成分のスペクトル(推定雑音スペクトル)を音響信号から除去する技術が開示されている。特許文献1の技術では、音響信号における音声成分の有無に応じた推定雑音スペクトルと音声成分の有無とは無関係に推定された推定雑音スペクトルとから最終的な推定雑音スペクトルを生成して音響信号から除去する。
特開2010−102204号公報
特許文献1のような高度な雑音抑圧技術を利用すれば、音響信号に包含される雑音成分を非常に高精度に抑圧して通話相手の音声通信装置に送信することが可能である。しかし、発話者の周囲に存在する音響(以下「環境音」という)を含む雑音成分が過度に高精度に除去されると、発話者の周囲の環境音を通話相手に伝達できないという問題がある。以上の事情を考慮して、利用者の周囲の環境音を通話相手に適切に伝達することを目的とする。
以上の課題を解決するために、本発明に係る音声通信装置は、通話相手の通信装置から送信された受話信号を受信する受信部と、前記受信部が受信した前記受話信号に応じた音響を放音する放音部と、目的音と環境音とを含む音響を収音して収音信号を生成する収音部と、前記収音部が生成した前記収音信号のうち前記目的音成分を強調した第1音響信号を生成する第1信号処理部と、前記収音部が生成した前記収音信号のうち前記環境音成分を強調した第2音響信号を生成する第2信号処理部と、前記受信部が受信した前記受話信号のレベルに応じて前記第2音響信号のレベルを制御する制御部と、前記第1音響信号と前記第2音響信号とを送信する送信部とを具備する。以上の構成では、収音部が生成した収音信号のうち目的音成分を強調した第1音響信号と環境音成分を強調した第2音響信号とが通話相手の通信装置に送信される。したがって、利用者の周囲の環境音を通話相手に適切に伝達することが可能である。なお、目的音とは、収音の目的となる音響であり、具体的には音声通信装置の利用者の発声音である。他方、環境音とは、目的音以外の音響であり、音声通信装置の利用者の周囲に存在する音響(人混みでの雑踏音や空調設備の動作音等)と、放音部から放射されて収音部に収音される帰還音とを含む。帰還音は、例えば、通話相手の通信装置から送信されて放音部から放射された通話相手の発声音である。
ところで、受話信号に包含される通話相手の音声は、放音部から収音部に到達する帰還音として環境音に包含されるから、例えば受話信号のレベルに関わらず第2音響信号のレベルが維持される構成では、利用者の音声通信装置と通話相手の音声通信装置との間で通話相手の利用者の音声が循環し、結果的にハウリングを発生させる原因となり得る。以上の事情を考慮して、本発明の好適な態様における前記制御部は、前記受話信号のレベルが高いほど前記第2音響信号のレベルが低下するように前記第2音響信号のレベルを制御する。以上の態様では、受話信号のレベルが高いほど第2音響信号のレベルが低下するように第2音響信号のレベルが制御されるから、受話信号のレベルに関わらず第2音響信号のレベルが維持される構成と比較してハウリングを有効に防止できるという利点がある。
本発明の好適な態様において、前記制御部は、前記受話信号のレベルが閾値を上回る場合に、前記第2音響信号のレベルが低下するように前記第2音響信号のレベルを制御する。以上の態様では、受話信号のレベルが閾値を上回る場合に第2音響信号のレベルが低下するように第2音響信号のレベルが制御されるから、受話信号のレベルに関わらず第2音響信号のレベルを受話信号のレベルに連動させる構成と比較して、適切に環境音が伝達されるという利点がある。
本発明の好適な態様において、前記制御部は、前記受話信号を音声区間と前記音声区間以外の挿入区間とに区分し、前記挿入区間において、前記受話信号のレベルに対する前記第2音響信号のレベルの変動が前記音声区間と比較して低減されるように前記第2音響信号のレベルを制御する。以上の態様では、受話信号を音声区間と挿入区間とに区分し、挿入区間では受話信号のレベルに対する第2音響信号のレベルの変動が音声区間と比較して低減されるように第2音響信号のレベルが制御される。したがって、挿入区間内での環境音の変動に起因して通話相手の利用者が違和感を知覚する可能性が低減されるという利点がある。なお、音声区間とは、受話信号のうち通話相手の発声音が優勢に存在する区間であり、挿入区間とは、音声区間以外の区間(例えば相前後する音声区間の間で発声者の発話が途切れた区間)である。
本発明の好適な態様において、前記制御部は、前記挿入区間の時間長が閾値を下回る場合に、当該挿入区間において、前記受話信号のレベルに対する前記第2音響信号のレベルの変動が前記音声区間と比較して低減されるように前記第2音響信号のレベルを制御する一方、前記挿入区間の時間長が前記閾値を上回る場合に、当該挿入区間において、前記受話信号のレベルに対する前記第2音響信号のレベルの変動が前記音声区間と同等となるように前記第2音響信号のレベルを制御する。以上の態様では、挿入区間の時間長が閾値を上回る場合(通話相手の一連の発話が終了したと推定される状況)には、受話信号のレベルに応じた第2音響信号のレベルが音声区間と同等に制御され、閾値を下回る場合には、受話信号のレベルに応じた第2音響信号のレベルの制御が音声区間と比較して抑制されるように第2音響信号のレベルが制御される。したがって、挿入区間の時間長が閾値を下回る場合には、環境音の変動に起因して利用者が違和感を知覚する可能性が低減することが可能になる。他方、挿入区間の時間長が閾値を上回る場合には、利用者側の環境音を通話相手に適切に伝達することが可能になる。以上の態様によれば、通話相手の発話の状況に応じた適切なレベルの環境音を通話相手に伝達することが可能になるという利点がある。
本発明に係る音声通信装置は、音声通信に関連する処理に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラムとの協働によっても実現される。本発明に係るプログラムは、通話相手の通信装置から送信された受話信号を受信する受信部、前記受信部が受信した前記受話信号に応じた音響を放音する放音部、目的音と環境音とを含む音響を収音して収音信号を生成する収音部、前記収音部が生成した前記収音信号のうち前記目的音成分を強調した第1音響信号を生成する第1信号処理部、前記収音部が生成した前記収音信号のうち前記環境音成分を強調した第2音響信号を生成する第2信号処理部、前記受信部が受信した前記受話信号のレベルに応じて前記第2音響信号のレベルを制御する制御部、および、前記第1音響信号と前記第2音響信号とを送信する送信部としてコンピュータを機能させる。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体や磁気記録媒体等の公知の任意の形式の記録媒体を包含し得る。なお、例えば、本発明のプログラムは、通信網を介した配信の形態で提供されてコンピュータにインストールされ得る。また、以上の各態様に係る音声通信装置の動作方法(音声通信方法)としても本発明は特定される。
第1実施形態に係る通信システムの構成を示す図である。 音声通信装置のブロック図である。 音声通信装置の具体的な形態の説明図である。 第1信号処理部のブロック図である。 調音処理部のブロック図である。 制御部のブロック図である。 受話信号のレベルと調整値との関係の説明図である。 受話信号のレベルに応じた調整値の変化の説明図である。 第2実施形態に係る制御部のブロック図である。 音声区間および挿入区間でのレベルと調整値との関係の説明図である。 第3実施形態における受話信号のレベルと調整値との関係の説明図である。 第4実施形態に係る音声通信装置のブロック図である。 変形例に係る音声通信装置のブロック図である。
<第1実施形態>
図1は、本発明の第1実施形態に係る音声通信装置を利用した通信システムの構成を示す図である。図1に例示されるように、通信システム100は、通信網200と複数の音声通信装置D(D1,D2)とを含んで構成される。複数の音声通信装置Dの各々は、例えば、利用者に携行される通信端末であり、他の音声通信装置Dとの間で通信網200を介した音声通話を実行する。通信網(例えば移動通信網)200は、基地局と交換局とを含む多数の中継装置で構成される。図1では、相互に通信する2個の音声通信装置D(D1,D2)のみが便宜的に図示されている。以下の説明では、利用者U1が使用する音声通信装置D1と利用者U2が使用する音声通信装置D2とを利用して利用者U1と利用者U2とが通話する場合を想定する。また、音声通信装置D1に便宜的に着目して構成および動作を例示するが、音声通信装置D2の構成および動作も同様である。
図2は、音声通信装置D1のブロック図である。音声通信装置D1は、利用者U1が発声した音声等の周囲の音響を表す音響信号(以下「送話信号」という)STを通信網200に送信するとともに、通話相手である利用者U2の音声を含む音響を表す音響信号(以下「受話信号」という)SRを通信網200から受信して受話信号SRに応じた音響を放射する装置であり、音響処理部10と収音部20と通信部30と制御部40と放音部50とを具備する。図2に例示された各要素(例えば音響処理部10や制御部40)は、例えば各種の記録媒体に記憶されたプログラムを演算処理装置(CPU)が実行することで実現される。なお、音響処理部10の各機能を複数の集積回路に分散した構成や、専用の電子回路(DSP)が各機能を実現する構成も採用され得る。音響信号をデジタル信号に変換するA/D変換器や、音響信号をアナログ信号に変換するD/A変換器の図示は便宜的に省略されている。
収音部20は、周囲の音響を収音して収音信号M(MA1,MA2,MB)を生成する音響機器であり、相互に離間して配置される複数の収音機器22(22A1,22A2,22B)を含んで構成される。放音部50は、利用者U2の音声通信装置D2から通信網200を介して受信した受話信号SRに応じた音響を放射する音響機器(例えばスピーカやイヤホン)である。
収音部20には、目的音と環境音との混合音が到来する。目的音は、収音の目的となる音響であり、具体的には利用者U1の発声音である。環境音は、目的音以外の音響であり、利用者U1の周囲に存在する音響(例えば人混みでの雑踏音や空調設備の動作音等)と、放音部50から放射されて収音機器22に収音される帰還音とを含む。帰還音は、例えば、音声通信装置D2から送信された利用者U2の発声音である。
図3は、第1実施形態の音声通信装置Dの外観図である。図3では、眼鏡型のウェアラブル端末が音声通信装置D1として例示されている。音声通信装置D1は、利用者U1の両眼の前方に位置する本体部60と、本体部60の両側に設置される支持部62および支持部64とを具備する電子機器である。利用者U1の左耳に装着される支持部62の基端側(本体部60側)に収音機器22A1が設置され、利用者U1の右耳に装着される支持部64の基端側に収音機器22A2が設置される。すなわち、収音機器22A1と収音機器22A2とは相互に間隔d1をあけて離間する。支持部64の先端側(収音機器22A2とは反対側であって利用者U1からみて後方)には収音機器22Bが設置される。
収音機器22A(22A1,22A2)は、目的音の収音用に配置された無指向性のマイクロホンである。収音機器22Aは、周囲の音響(目的音と環境音との混合音)の波形を表す収音信号MA(MA1,MA2)を生成する。他方、収音機器22Bは、環境音の収音用に配置された無指向性のマイクロホンであり、目的音と比較して環境音を優勢に含有する音響の波形を表す収音信号MBを生成する。以上に説明した通り、支持部62および支持部64に収音部20と放音部50とが配置される構成では、利用者U1は拡声通話(ハンズフリー通話)が可能である。
図2の音響処理部10は、収音部20が生成した収音信号M(MA1,MA2,MB)に応じて送話信号STを生成する。通信部30は、送信部32と受信部34とを含み、通信網200を介して音声通信装置D2との間で通信する通信機器(アンテナおよび変復調回路)である。送信部32は、音声通信装置D2を送信先として送話信号STを通信網200に送信する。他方、受信部34は、音声通信装置D2が送信した送話信号STを受話信号SRとして通信網200から受信する。前述の通り、受信部34が受信した受話信号SRに応じた音響が放音部50から放射される。
図2に例示される通り、第1実施形態の音響処理部10は、第1信号処理部11と第2信号処理部12と加算部13とを含んで構成される。第1信号処理部11は、収音部20(収音機器22A1,収音機器22A2)が生成した収音信号MAのうち目的音成分を強調(環境音成分を抑圧)した第1音響信号S1を生成する。
図4は、第1信号処理部11のブロック図である。図4に例示される通り、第1信号処理部11は、残響抑圧部111と指向制御部112と残響抑圧部113と雑音抑圧部114と帯域強調部115と強度調整部116とを含んで構成される。残響抑圧部111は、受信部34から放音部50に供給される受話信号SRと各収音機器22(22A1,22A2)が生成した収音信号MA(MA1,MA2)とを利用した適応フィルタ処理により、収音信号MA(MA1,MA2)に重畳された推定エコー成分Eを推定し、収音信号MA(MA1,MA2)から推定エコー成分Eを抑圧することで音響信号X1(X1a,X1b)を生成する。推定エコー成分Eは、放音部50から収音部20に到来する帰還音を推定した音響成分である。
指向制御部112は、収音機器22A(22A1,22A2)の指向方向を制御する。具体的には、指向制御部112は、例えば公知のビーム形成処理(例えば遅延加算型ビーム形成)により、収音のビーム(収音感度が高い領域)を利用者U1の口元に向けるように制御して、音響信号X1(X1a,X1b)のうち目的音成分を強調した音響信号X2を生成する。残響抑圧部113は、音響信号X2から推定エコー成分Eを抑圧することで音響信号X3を生成する。残響抑圧部111および残響抑圧部113の双方で推定エコー成分Eを抑圧するのは、残響抑圧部111による1回の抑圧だけでは推定エコー成分Eを充分に抑圧できないからである。雑音抑圧部114は、音響信号X3から雑音成分(目的音成分以外の音響成分)を抑圧することで音響信号X4を生成する。雑音成分の抑圧には、スペクトル減算等の公知の雑音抑圧処理が任意に採用され得る。帯域強調部115は、音響信号X4のうち目的音成分(発声音)を包含する周波数帯域の音響成分が他帯域と比較して強調されるように音響信号X4の周波数特性を制御(イコライジング)して音響信号X5を生成する。強度調整部116は、音響信号X5のレベルのダイナミックレンジを周波数帯域毎に調整すること(Dynamic Range Control)で第1音響信号S1を生成する。
図2の第2信号処理部12は、収音部20(収音機器22B)が生成した収音信号MBのうち環境音成分を強調(目的音成分を抑圧)した第2音響信号S2を生成する。第2信号処理部12は、図2に例示される通り、調音処理部120と調整部130とを含んで構成される。
図5は、調音処理部120のブロック図である。第1実施形態の調音処理部120は、収音信号MBのうち環境音成分を強調した環境音信号SEを生成する要素であり、図5に例示される通り、雑音抑圧部121と帯域強調部122と強度調整部123とを含んで構成される。
雑音抑圧部121は、収音機器22Bが生成した収音信号MBのうち放音部50を構成する機器に固有の雑音成分(例えばヒスノイズ)を抑圧することで音響信号Y1を生成する。帯域強調部122は、音響信号Y1のうち環境音成分を包含する周波数帯域の音響成分が他帯域と比較して強調されるように音響信号Y1の周波数特性を制御(イコライジング)することで音響信号Y2を生成する。強度調整部123は、音響信号Y2のレベルのダイナミックレンジを周波数帯域毎に調整することで環境音信号SEを生成する。
図2の調整部130は、調音処理部120が生成した環境音信号SEを調整値Gに応じて調整することで第2音響信号S2を生成する。具体的には、環境音信号SEに調整値Gを乗算する乗算器が調整部130として好適に採用され得る。以上の説明から理解される通り、第2音響信号S2のレベルは調整値(ゲイン)Gに応じて調整される。
図2の加算部13は、第1信号処理部11が生成した第1音響信号S1と第2信号処理部12が生成した第2音響信号S2とを加算することで送話信号STを生成する。加算部13による加算後の送話信号STが送信部32から通信網200を介して利用者U2の音声通信装置D2に送信される。
制御部40は、調整部130による調整に適用される調整値Gを可変に制御する。第1実施形態の制御部40は、受信部34が受信して放音部50に供給される受話信号SRのレベルに応じて調整値Gを制御する。以上の説明から理解される通り、制御部40は、受話信号SRのレベルに応じて第2音響信号S2のレベルを制御する要素として機能する。
図6は、制御部40のブロック図である。図6に例示される通り、制御部40は、レベル算出部42と調整値設定部44とを含んで構成される。レベル算出部42は、受話信号SRのレベルLEを算出する。受話信号SRのレベルLEの算出には公知の技術が任意に採用され得るが、例えば、受話信号SRのパワーを時間軸の方向に平滑化することでレベルLEを算出することが可能である。
調整値設定部44は、レベル算出部42が算出した受話信号SRのレベルLEに応じた調整値Gを設定する。第1実施形態の調整値設定部44は、受話信号SRのレベルLEと調整値Gとの関係を規定する調整値テーブル(図示略)を調整値Gの設定に利用する。具体的には、調整値設定部44は、受話信号SRのレベルLEに対応する調整値Gを調整値テーブルから取得する。図7に例示される通り、第1実施形態では、受話信号SRのレベルLEが大きいほど調整値Gが小さくなるように制御部40において調整値Gが設定される。したがって、受話信号SRのレベルLEが大きい(通話相手である利用者U2の発声音量が大きい)ほど、第2音響信号S2のレベルは低下する。なお、以上の説明では調整値テーブルを利用する構成を例示したが、受話信号SRのレベルLEを適用した所定の演算で調整値Gを算定する構成も採用され得る。
図8には、受話信号SRのレベルLEに応じた調整値Gの変動の具体例が例示されている。受話信号SRのレベルLEが充分に小さい状態(t1〜t2)では、調整値Gは最大値(例えば1)に維持される。そして、利用者U2による発声の開始とともに受話信号SRのレベルLEが増加すると、調整値GはレベルLEに連動して経時的に減少する(t2〜t3)。また、利用者U2による一連の発声が終了に近付いて受話信号SRのレベルLEが減少すると、調整値GはレベルLEに連動して経時的に増加する(t3〜t4)。
以上の例示から理解される通り、環境音成分を包含する第2音響信号S2のレベルは、通話相手である利用者U2の音声の有無(受話信号SRのレベルLE)に応じて刻々と変動する。具体的には、利用者U2の音声が小さい状態(例えば利用者U2が沈黙して利用者U1の発声音を聴取する状態)では、利用者U1の周囲に存在する環境音成分を優勢に含有する第2音響信号S2を利用者U1の発声音(目的音成分)の第1音響信号S1に付加した送話信号STが通話相手の利用者U2の音声通信装置D2に送信される。他方、放音部50から収音部20に到達する帰還音に利用者U2の音声が優勢に含有される状態(利用者U2が発声する状態)では、利用者U2の音声通信装置D2に送信される送話信号STのうち帰還音を含有する第2音響信号S2のレベルが低下し、環境音成分が少なく、利用者U1の発声音成分が多い送話信号STが送信される。
以上に説明した通り、第1実施形態では、収音機器22A(22A1,22A2)が収音した収音信号MAのうち目的音成分を強調した第1音響信号S1と、環境音成分を強調した第2音響信号S2との双方が音声通信装置D2に送信される。したがって、目的音成分が強調された第1音響信号S1のみが音声通信装置D2に送信される構成と比較すると、音声通信装置D2の利用者U2が、利用者U1の発声音のほか、利用者U1の周囲の環境音を聴取できるという利点がある。しかも、第1実施形態では、第2音響信号S2のレベルが第1音響信号S1とは独立に調整されるから、利用者U1の周囲の環境音を適切なレベルで利用者U2に伝達することが可能である。
ところで、適度なレベルの環境音を利用者U1の音声に付加した送話信号STを生成する構成(環境音を利用者U2に伝達する構成)としては、例えば、第1実施形態の第2信号処理部12を省略したうえで、収音信号MAの環境音成分を第1信号処理部11にて完全には除去せずに送話信号STに適度なレベルで残存させる、という構成(以下「対比例1」という)も想定され得る。しかし、目的音成分と環境音成分とが単一の系統で纏めて処理される対比例1の構成では、環境音成分を抑圧する処理にて目的音成分に不可避的に波形歪が発生して音質が低下する(例えば目的音成分の聴覚的な明瞭性が低下する)という問題が発生し得る。対比例1とは対照的に、第1実施形態では、第1信号処理部11による目的音成分の強調と第2信号処理部12による環境音成分の強調とが相互に別個に実行されたうえで、処理後の第1音響信号S1と第2音響信号S2とを含む送話信号STが送信される。以上の構成では、第1信号処理部11では目的音成分の強調に最適化された音響処理により音質(特に明瞭性)を維持しながら目的音成分を充分に強調する一方、第2信号処理部12では環境音成分の強調に最適化された音響処理により音質を維持しながら環境音成分を充分に強調することが可能である。したがって、目的音成分および環境音成分の各々が高音質に維持された送話信号STを利用者U2に送信できるという利点がある。特に、目的音成分および環境音成分の各々の明瞭性が維持されるから、環境音が周囲に存在するなかで利用者U1が目的音を発生するという状況を利用者U2が明瞭に知覚し得る臨場感のある送話信号STを生成することが可能である。
なお、環境音成分が優勢な第2音響信号S2を目的音成分が優勢な第1音響信号S1に付加するという観点のみからすると、第2音響信号S2のレベルを制御する要素(制御部40および調整部130)を省略し、調音処理部120が生成した環境音信号SEを第2音響信号S2として第1音響信号S1に加算する構成(以下「対比例2」という)も想定され得る。しかし、受話信号SRに包含される利用者U2の音声は、放音部50から収音部20に到達する帰還音として環境音に包含されるから、受話信号SRのレベルLEに関わらず第2音響信号S2のレベルが維持される対比例2の構成では、音声通信装置D1と音声通信装置D2との間で利用者U2の音声が循環し、結果的にハウリングを発生させる原因となり得る。対比例2とは対照的に、第1実施形態では、受話信号SRのレベルLEに応じて第2音響信号S2のレベル(第1音響信号S1に付加される環境音成分のレベル)が制御される。具体的には、受話信号SRのレベルLEが高いほど第2音響信号S2のレベルが低下する。すなわち、前述の通り、利用者U2が発声する期間内では第2音響信号S2が低いレベルに抑制される。したがって、第1実施形態によれば、利用者U2が発声する音声に起因したハウリングを対比例2と比較して有効に防止できるという利点がある。
なお、以上の説明から理解される通り、利用者U2が聴取する音響では利用者U1の周囲の環境音の音量が刻々と増減するから、当該音響を聴取する利用者U2が聴覚的な違和感を知覚する可能性も想定される。しかし、自身が発声している最中には自身に対する到来音を余り意識しない(自分の発話中は他人の発声を余り集中して聴取しない)という一般的な傾向を考慮すると、利用者U2が聴取する音響において利用者U1の環境音の音量が変動することに起因して利用者U2が違和感を知覚する可能性は特段の問題にならない。
<第2実施形態>
本発明の第2実施形態を以下に説明する。第1実施形態では、受話信号SRのレベルLEに応じて第2音響信号S2のレベルを制御した。以上の構成において、利用者U2による相前後する発話の間で利用者U2の音声が途切れる区間にて環境音が変動すると、利用者U2が違和感を知覚する可能性がある。以上の事情を考慮して、第2実施形態では、受話信号SRのうち利用者U2の音声が優勢に存在する区間(以下「音声区間」という)と音声区間以外の区間(以下「挿入区間」という)とで調整値Gの設定を相違させる。なお、以下に例示する各形態において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
図9は、第2実施形態の制御部40のブロック図であり、図10は、第2実施形態における調整値Gの設定の説明図である。図9に例示される通り、第2実施形態の調整値設定部44は、区間検出部46を包含する。区間検出部46は、図10に例示される通り、受話信号SRを時間軸上で音声区間TV(TV1,TV2)と挿入区間TD(TD1,TD2)とに区分する。挿入区間TDは、例えば、利用者U2による相前後する発話の間で利用者U2の音声が途切れる区間である。区間検出部46は、例えば、受話信号SRを時間軸上で区分したフレーム毎に音声の有無を判定することで受話信号SRを音声区間TVと挿入区間TDとに区分する。音声区間TVと挿入区間TDとの判別には、公知の音声検出技術が任意に採用される。
図10は、音声区間TVおよび挿入区間TDの調整値Gの説明図である。図10では、時間軸上に例示される音声区間TVのうち、音声区間TV(TV1,TV2)と挿入区間TD(TD1,TD2)とを便宜的に図示している。第2実施形態の調整値設定部44は、音声区間TVと挿入区間TDとで調整値Gを個別に設定する。各区間(音声区間TV,挿入区間TD)での調整値Gの設定について以下に詳述する。
音声区間TV内において、調整値設定部44は、第1実施形態と同様に、受話信号SRのレベルLEに応じて調整値Gを設定する。具体的には、調整値設定部44は、受話信号SRのレベルが高いほど第2音響信号S2のレベルが低下するように調整値Gを設定する。
他方、挿入区間TDでは、音声通信装置D2の利用者の発話の状況に応じて調整値Gが設定される。具体的には、以下に例示される通り、調整値設定部44は、挿入区間TDの時間長と閾値T0との比較結果に応じて調整値Gを設定する。
(a).挿入区間TDの時間長が閾値T0を下回る場合(TD<T0)
挿入区間TDの時間長が閾値T0を下回る場合(相前後する音声区間TVの間隔が短い場合)には、音声通信装置D2の利用者U2が発話の途中であると推定される。相前後する発話の間に環境音成分(第2音響信号S2)のレベルが音声区間TVと同様に変動すると、利用者U2が違和感を知覚する可能性がある。以上の傾向を考慮して、調整値設定部44は、受話信号SRのレベルLEに応じた第2音響信号S2のレベルの変動が、音声区間TVと比較して抑制されるように調整値Gを設定する。具体的には、図10の挿入区間TD1に例示される通り、受話信号SRのレベルLEに対する調整値Gの変動(レベルLEに対する調整値Gの変化率)が、音声区間TVにおけるレベルLEに対する調整値Gの変動と比較して緩やかになるように調整値Gが設定される。なお、時間長が閾値T0を下回る挿入区間TDにおいて調整値Gを一定値に維持する構成(レベルLEに対する調整値Gの変化率をゼロに設定する構成)も採用され得る。
(b).挿入区間TDの時間長が閾値T0を上回る場合(TD>T0)
挿入区間TDの時間長が閾値T0を上回る場合(直前の音声区間TVの終点から利用者U2が発声することなく充分な時間長が経過した場合)には、利用者U2の一連の発話が終了した状況(例えば発話主体が利用者U1に変更されて利用者U2は音声通信装置D1の利用者U1の音声を聴取している状況)にあると推定されるから、利用者U1の周囲の環境音が適切なレベルで利用者U2に伝達されることが好ましい。以上の傾向を考慮して、調整値設定部44は、受話信号SRのレベルLEに応じた第2音響信号S2のレベルの変動が音声区間TV1と同等になるように調整値Gを設定する。具体的には、図10の挿入区間TD2に例示される通り、直前の音声区間TV2の終点からの経過時間が閾値T0を上回る時点から、音声区間TVと同様の調整値Gの制御が開始される。音声区間TV2の終点からの経過時間が閾値T0を上回った時点で、受話信号SRのレベルLEに応じて調整値Gを最大値まで増大させる構成も考えられる。しかし、調整値Gが急激に増大する構成では、利用者U2が違和感を知覚する可能性がある。そこで、図10に例示される通り、利用者U1の周囲の環境音が適切なレベルで利用者U2に伝達するように調整値Gを徐々に増大させる。
調整部130は、音声区間TVおよび挿入区間TDの各区間について設定された調整値Gを環境音信号SEに乗算することで第2音響信号S2のレベルを制御する。以降の処理については、第1実施形態と同様であるので詳細な説明を省略する。
第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態では、受話信号SRのうち挿入区間TD(時間長が閾値T0を下回る挿入区間TD)において、第2音響信号S2のレベルの変動が音声区間TVと比較して抑制されるように第2音響信号S2のレベルが制御される。したがって、挿入区間TD内での環境音の変動に起因して利用者U2が違和感を知覚する可能性が低減されるという利点がある。
他方、時間長が閾値T0を上回る挿入区間TD(利用者U2の一連の発話が終了したと推定される状況)では、受話信号SRのレベルLEに応じた第2音響信号S2のレベルの制御が音声区間TVと同様の制御に復帰する。したがって、利用者U2の発話の終了後には、利用者U1側の環境音を利用者U2に適切に伝達できるという利点がある。以上の説明から理解される通り、第2実施形態では、利用者U2の発話の状況に応じた適切なレベルの環境音を利用者U2に伝達することが可能である。
<第3実施形態>
第1実施形態では、受話信号SRのレベルLEに対して調整値Gを直線的に変化させたが、レベルLEに対する調整値Gの変化の態様は以上の例示に限定されない。例えば、受話信号SRに起因したハウリングが発生しない程度に受話信号SRのレベルLEが低い範囲では、第2音響信号S2のレベルの低減によるハウリングの抑制よりも、音声通信装置D2の利用者U2に対する環境音の伝達を優先させるべきである。以上の事情を考慮して、第3実施形態では、受話信号SRのレベルLEが所定の閾値L0を上回る場合に、当該レベルLEの増加に応じて調整値Gが低減されるように調整値Gが設定される。
図11は、第3実施形態における受話信号SRのレベルLEと調整値Gとの関係(調整値テーブル)の説明図である。図11に例示されるように、受話信号SRのレベルLEが閾値L0を下回る場合(LE<L0)には、調整値Gは、レベルLEに依存しない所定値(例えば最大値1)に維持される。他方、受話信号SRのレベルLEが閾値L0を上回る場合(LE>L0)には、受話信号SRのレベルLEが増加するほど調整値Gが低減するように調整値Gが設定される。具体的には、レベルLEの値域のうち閾値L0を上回る領域が複数の範囲に区分され、レベルLEに対する調整値Gの変化率が範囲毎に個別に設定される。図11では、レベルLEが大きい範囲ほどレベルLEに対する調整値Gの変化率(勾配)が増加する場合が例示されている。
第3実施形態においても第1実施形態と同様の効果が実現される。また、第3実施形態では、受話信号SRのレベルLEが閾値L0を上回る場合にのみ、調整値Gが低減されるように(ひいては第2音響信号S2のレベルが低下するように)、すなわち、受話信号SRのレベルLEに応じて調整値Gの変化の度合いが異なるように調整値Gが設定される。したがって、第2音響信号S2のレベルを受話信号SRのレベルLEに連動させる度合いを受話信号SRのレベルLEに関わらず一定とした構成と比較して、適切に環境音が伝達されるという利点がある。
<第4実施形態>
図12は、第4実施形態の音声通信装置D1のブロック図である。第1実施形態では、目的音の収音用の収音機器22Aとは別個に、環境音の収音用の収音機器22Bを設置した。第4実施形態では、図12に例示される通り、目的音の収音と環境音の収音とに共通の収音機器22A2が兼用される。収音機器22A2が生成した収音信号MA2は、第1信号処理部11および第2信号処理部12の双方に供給され、第2信号処理部12は、収音信号MA2の環境音成分を強調することで第2音響信号S2を生成する。以上の構成では、目的音の収音用の収音機器と環境音の収音用の収音機器とを別個に設ける必要がないから、音声通信装置D1の装置構成が簡略化されるという利点がある。なお、収音機器22A1を指向性のマイクロホンによって構成し、指向方向を音声通信装置D1の利用者の口元としてもよい。また、目的音の収音と環境音の収音とに兼用される収音機器22A2を無指向性のマイクロホンによって構成しても良い。
<変形例>
前述の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様を適宜に併合することも可能である。
(1)前述の各形態で例示した第1信号処理部11および第2信号処理部12の構成要素は任意であり、図4や図5に例示された要素は適宜に省略され得る。例えば、第1信号処理部11から指向制御部112を省略した構成も好適に採用され得る。前述の各形態のように指向制御部112を包含する構成では、指向方向を制御するビーム形成処理のために複数の収音機器22(22A1,22A2)が必要であるが、指向制御部112を省略した構成(ビーム形成処理を実行しない構成)では、例えば図13に例示される通り、収音部20を1個の収音機器22A1により構成することも可能である。収音機器22A1から収音された収音信号MA1は、第1信号処理部11および第2信号処理部12に供給される。以上の説明から理解される通り、前述の各形態の収音部20は、目的音と環境音とを含む音響を収音して収音信号Mを生成する要素として包括的に表現され、収音部20を構成する収音機器22の個数や指向性の有無は不問である。
(2)前述の各形態では、目的音成分に対応する第1音響信号S1と環境音成分に対応する第2音響信号S2との加算結果に応じた送話信号STを通話相手の音声通信装置D2に送信する構成を例示したが、第1音響信号S1と第2音響信号S2とを相互に個別に送信して音声通信装置D2で加算することも可能である。すなわち、音声通信装置D1の加算部13は省略され得る。以上の説明から理解される通り、前述の各形態の送信部32は、第1音響信号S1と第2音響信号S2とを送信する要素として包括的に表現され、第1音響信号S1と第2音響信号S2との加算信号(送話信号ST)を送信する構成と、第1音響信号S1および第2音響信号S2の各々を送信する構成との双方を包含する。
(3)通信網200としては、広帯域のIP(Internet Protocol)網、公共無線LAN(WiFi)が好適に採用され得る。発声音(目的音成分)に対応する周波数成分は比較的に低帯域であり、環境音に対応する周波数成分は比較的に高帯域であるから、高速データ通信規格に準拠した広帯域の通信システムが好適である。
(4)前述の各形態では、眼鏡型のウェアラブル端末を音声通信装置Dとして例示したが、音声通話が可能な電子機器であって利用者による携行が可能であれば、音声通信装置Dの形態は任意である。例えば、携帯電話機やスマートフォン等の公知の通信端末が音声通信装置Dとして任意に利用され得る。
(5)前述の各形態では、利用者の周囲の環境音を目的音とともに通話相手に伝達する構成を例示したが、現実的には、通話相手に自分の居場所を知らせたくない場合も想定される。そこで、環境音を前述の各形態と同様に目的音に付加する動作モードと、環境音を付加しない動作モード(第2信号処理部12の動作を無効化する動作モード)とを利用者が任意に選択できる構成も採用され得る。
(6)前述の各形態では、受話信号SRのレベルLEに対して調整値Gを直線的に変化させたが、レベルLEに対する調整値Gの変化の態様は以上の例示に限定されない。例えば、受話信号SRのレベルLEに対して調整値Gを非線形に変化させる構成や、受話信号SRのレベルLEに対して調整値Gを曲線的に規定される構成も採用され得る。
D……音声通信装置、10……音響処理部、11……第1信号処理部、12……第2信号処理部、20……収音部、22A1,22A2,22B……収音機器,30……通信部、32……送信部、34……受信部、120……調音処理部、130……調整部、40……制御部、42……レベル算出部、44……調整値設定部、200……通信網。

Claims (5)

  1. 通話相手の通信装置から送信された受話信号を受信する受信部と、
    前記受信部が受信した前記受話信号に応じた音響を放音する放音部と、
    目的音と環境音とを含む音響を収音して収音信号を生成する収音部と、
    前記収音部が生成した前記収音信号のうち前記目的音成分を強調した第1音響信号を生成する第1信号処理部と、
    前記収音部が生成した前記収音信号のうち前記環境音成分を強調した第2音響信号を生成する第2信号処理部と、
    前記受信部が受信した前記受話信号のレベルに応じて前記第2音響信号のレベルを制御する制御部と
    前記第1音響信号と前記第2音響信号とを送信する送信部と
    を具備する音声通信装置。
  2. 前記制御部は、前記受話信号のレベルが高いほど前記第2音響信号のレベルが低下するように前記第2音響信号のレベルを制御する
    請求項1の音声通信装置。
  3. 前記制御部は、前記受話信号を音声区間と前記音声区間以外の挿入区間とに区分し、前記挿入区間において、前記受話信号のレベルに対する前記第2音響信号のレベルの変動が前記音声区間と比較して低減されるように前記第2音響信号のレベルを制御する
    請求項1または請求項2の音声通信装置。
  4. 前記制御部は、前記挿入区間の時間長が閾値を下回る場合に、当該挿入区間において、前記受話信号のレベルに対する前記第2音響信号のレベルの変動が前記音声区間と比較して低減されるように前記第2音響信号のレベルを制御する一方、前記挿入区間の時間長が前記閾値を上回る場合に、当該挿入区間において、前記受話信号のレベルに対する前記第2音響信号のレベルの変動が前記音声区間と同等となるように前記第2音響信号のレベルを制御する
    請求項3の音声通信装置。
  5. 通話相手の通信装置から送信された受話信号を受信する受信部、
    前記受信部が受信した前記受話信号に応じた音響を放音する放音部、
    目的音と環境音とを含む音響を収音して収音信号を生成する収音部、
    前記収音部が生成した前記収音信号のうち前記目的音成分を強調した第1音響信号を生成する第1信号処理部、
    前記収音部が生成した前記収音信号のうち前記環境音成分を強調した第2音響信号を生成する第2信号処理部、
    前記受信部が受信した前記受話信号のレベルに応じて前記第2音響信号のレベルを制御する制御部、および、
    前記第1音響信号と前記第2音響信号とを送信する送信部
    としてコンピュータを機能させるプログラム。
JP2014143053A 2014-07-11 2014-07-11 音声通信装置およびプログラム Active JP6409378B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014143053A JP6409378B2 (ja) 2014-07-11 2014-07-11 音声通信装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014143053A JP6409378B2 (ja) 2014-07-11 2014-07-11 音声通信装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2016019263A true JP2016019263A (ja) 2016-02-01
JP6409378B2 JP6409378B2 (ja) 2018-10-24

Family

ID=55234157

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014143053A Active JP6409378B2 (ja) 2014-07-11 2014-07-11 音声通信装置およびプログラム

Country Status (1)

Country Link
JP (1) JP6409378B2 (ja)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0260269A (ja) * 1988-08-25 1990-02-28 Fujitsu Ltd ハンドフリー通話回路
JPH05136726A (ja) * 1991-11-11 1993-06-01 Toshiba Corp 無線電話装置
JPH10224459A (ja) * 1997-02-10 1998-08-21 Atsuden Kk ハンズフリー装置
JP2002368891A (ja) * 2001-06-11 2002-12-20 Matsushita Electric Works Ltd 拡声通話システム
JP2005217544A (ja) * 2004-01-27 2005-08-11 Matsushita Electric Works Ltd インターホン親機
JP2006287431A (ja) * 2005-03-31 2006-10-19 Saxa Inc 電話装置
JP2010239243A (ja) * 2009-03-30 2010-10-21 Oki Electric Ind Co Ltd 音声通信装置、方法及びプログラム
JP2012105115A (ja) * 2010-11-11 2012-05-31 Oki Electric Ind Co Ltd エコーキャンセラ及びエコーキャンセルプログラム、並びに電話装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0260269A (ja) * 1988-08-25 1990-02-28 Fujitsu Ltd ハンドフリー通話回路
JPH05136726A (ja) * 1991-11-11 1993-06-01 Toshiba Corp 無線電話装置
JPH10224459A (ja) * 1997-02-10 1998-08-21 Atsuden Kk ハンズフリー装置
JP2002368891A (ja) * 2001-06-11 2002-12-20 Matsushita Electric Works Ltd 拡声通話システム
JP2005217544A (ja) * 2004-01-27 2005-08-11 Matsushita Electric Works Ltd インターホン親機
JP2006287431A (ja) * 2005-03-31 2006-10-19 Saxa Inc 電話装置
JP2010239243A (ja) * 2009-03-30 2010-10-21 Oki Electric Ind Co Ltd 音声通信装置、方法及びプログラム
JP2012105115A (ja) * 2010-11-11 2012-05-31 Oki Electric Ind Co Ltd エコーキャンセラ及びエコーキャンセルプログラム、並びに電話装置

Also Published As

Publication number Publication date
JP6409378B2 (ja) 2018-10-24

Similar Documents

Publication Publication Date Title
EP2899996B1 (en) Signal enhancement using wireless streaming
US8204263B2 (en) Method of estimating weighting function of audio signals in a hearing aid
US9432778B2 (en) Hearing aid with improved localization of a monaural signal source
US20130337796A1 (en) Audio Communication Networks
JP2009542038A (ja) 骨伝導音伝播のための方法及びシステム
CN108769884B (zh) 双耳电平和/或增益估计器及包括双耳电平和/或增益估计器的听力系统
US9191755B2 (en) Spatial enhancement mode for hearing aids
EP3777114B1 (en) Dynamically adjustable sidetone generation
CN108694956B (zh) 具有自适应子频带波束成形的听力设备及相关方法
CN113825076A (zh) 用于包括听力装置的听力系统的与方向相关抑制噪声的方法
EP2928213B1 (en) A hearing aid with improved localization of a monaural signal source
US11153695B2 (en) Hearing devices and related methods
JP2020102835A (ja) バイノーラル補聴器の空間聴覚を改善するための方法
JP6409378B2 (ja) 音声通信装置およびプログラム
US10643597B2 (en) Method and device for generating and providing an audio signal for enhancing a hearing impression at live events
KR102139599B1 (ko) 음향 전달 장치
US11438712B2 (en) Method of operating a hearing aid system and a hearing aid system
JP2011199697A (ja) ヘッドフォン
US11617037B2 (en) Hearing device with omnidirectional sensitivity
JP2021536207A (ja) 聴覚装置の環境音声信号を強化するための方法、システム、および聴覚装置
EP4207194A1 (en) Audio device with audio quality detection and related methods
EP3886463A1 (en) Method at a hearing device
CN115278493A (zh) 具有全向灵敏度的听力设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170524

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180522

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180828

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180910

R151 Written notification of patent or utility model registration

Ref document number: 6409378

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151