JP2003249996A - 音声信号入出力装置 - Google Patents

音声信号入出力装置

Info

Publication number
JP2003249996A
JP2003249996A JP2002048183A JP2002048183A JP2003249996A JP 2003249996 A JP2003249996 A JP 2003249996A JP 2002048183 A JP2002048183 A JP 2002048183A JP 2002048183 A JP2002048183 A JP 2002048183A JP 2003249996 A JP2003249996 A JP 2003249996A
Authority
JP
Japan
Prior art keywords
signal
audio
voice signal
voice
mixed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002048183A
Other languages
English (en)
Inventor
Tetsuya Takahashi
哲也 高橋
Hiroshi Hashimoto
裕志 橋本
Toshiaki Shimoda
敏章 下田
Takayuki Hiekata
孝之 稗方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe Steel Ltd
Original Assignee
Kobe Steel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe Steel Ltd filed Critical Kobe Steel Ltd
Priority to JP2002048183A priority Critical patent/JP2003249996A/ja
Publication of JP2003249996A publication Critical patent/JP2003249996A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Abstract

(57)【要約】 【課題】 オーディオ音声信号の出力機能とハンズフリ
ー通話機能とを実現し,オーディオ音声信号と通話信号
とが混在する状況化で適切なエコーキャンセルを行う。 【解決手段】 受話音声信号を第1のサンプリングレー
ト変換部11によりオーディオ音声信号のそれと一致さ
せ,さらにチャンネルゲイン乗算部12によりオーディ
オ音声信号の各チャンネル(L,R等)に対応したチャ
ンネルごとに音量調節した後に,オーディオ音声信号と
混合した混合音声信号をスピーカ出力する。さらに,エ
コーキャンセラ20により,低サンプリングレートに変
換した混合音声信号に基づいて,マイクM入力された送
話音声信号からエコー除去を行う。エコー除去のパラメ
ータを学習するタイミングは,コントローラ30によ
り,送話及び通話音声信号,オーディオ音声信号のレベ
ルに基づいて制御する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,オーディオ音声信
号の出力機能とハンズフリー通話機能とを実現する音声
信号入出力装置に関するものである。
【0002】
【従来の技術】近年,自動車運転時においても,安全に
携帯電話等による通話を行えるようにするため,いわゆ
るハンズフリー通話を可能とする車載装置が普及しつつ
ある。また,小型化や低コスト化等のため,カーオーデ
ィオやカーナビゲーション等の車載装置の一体化,部品
の共有化が図られている。このような中で,ハンズフリ
ー通話を実現する装置もカーオーディオ等と一体化する
ことにより,スピーカやマイク,情報処理部等を共有化
することが望ましい。また,インターネットにより安価
な電話サービスを提供するVoIP(Voiceover IP)の
普及にともない,VoIPを用いたハンズフリー通話を
実現する装置をゲーム機やテレビ受像機等の情報家電に
組み込むことも行われつつある。この場合にも,スピー
カやマイク,情報処理部等を共有化することが小型化,
低コスト化のために望ましい。一般に,ハンズフリー通
話機能を有する通話装置では,スピーカ(音声出力手
段)から出力された音声がマイク(音声入力手段)に回
り込み,利用者が直接発した音声に混入することにより
エコーやハウリングが発生することが知られている。こ
のようなエコーやハウリングを防止するため,混入した
音声信号(以下,混入音声信号という)をマイクで入力
した音声信号から除去するエコーキャンセル機能を設け
ることが必要となる。このエコーキャンセル機能を有す
るものとして,例えば,特開平10−190533号公
報,特開平11−284550号公報,特開平11−2
98382号公報(以下,公報1〜3という)等には,
前記混入音声信号を学習同定し,相手先からの受話信号
に基づいてエコーを除去する適応フィルタを設けた通話
装置が示されている。
【0003】
【発明が解決しようとする課題】しかしながら,オーデ
ィオや情報家電等にハンズフリー通話機能を設ける場
合,スピーカから出力される音声には,相手先からの受
話音声信号だけでなく,音楽CD再生やテレビ放送等に
係る音声信号(以下,オーディオ音声信号という)も加
わることになるが,前記公報1〜3に示されるような受
話音声信号に基づくエコーキャンセルでは,適切なエコ
ーキャンセルが行えないという問題点があった。また,
特開2001−195085号公報(以下,公報4とい
う)には,カーオーディオによる音声が流れる車内で,
音声認識装置に入力する音声信号から前記オーディオ音
声信号に基づきエコーキャンセルを行う音声認識用オー
ディオキャンセル装置が示されているが,ハンズフリー
通話機能を設けた場合に,相手先からの受話音声信号に
起因するエコーをどのようにキャンセルするかについて
は何ら示されていない。また,一般に,通話信号(前記
送話音声信号及び受話音声信号,即ち,人の声について
の音声信号)と前記オーディオ音声信号とは周波数帯域
やサンプリングレート等の信号形態が異なるが,この違
いをどのように処理してエコーキャンセルを行うかにつ
いても,前記公報1〜3及び公報4には何ら示されてい
ない。従って,本発明は上記事情に鑑みてなされたもの
であり,その目的とするところは,オーディオ音声信号
の出力機能とハンズフリー通話機能とを実現し,オーデ
ィオ音声信号と通話信号とが混在する状況化で適切なエ
コーキャンセルを行う音声信号入出力装置を提供するこ
とにある。
【0004】
【課題を解決するための手段】上記目的を達成するため
に本発明は,ハンズフリー通話における相手先へ送信す
る送話音声信号を所定の音声入力手段から入力して所定
の通話装置へ出力するとともに,該通話装置から入力し
た相手先からの受話音声信号を所定の音声出力手段に出
力する音声信号入出力装置において,所定のオーディオ
音声信号を入力するオーディオ音声信号入力手段と,前
記受話音声信号に前記オーディオ音声信号を混合した混
合音声信号を前記音声出力手段に出力する音声信号混合
手段と,前記混合音声信号に基づいて,前記通話装置へ
出力する前記送話音声信号から前記混合音声信号に対応
する混入音声信号を除去する混入音声信号除去手段と,
を具備してなることを特徴とする音声信号入出力装置で
ある。これにより,オーディオ機器や家電製品等とスピ
ーカ(前記音声出力手段)やマイク(前記音声入力手
段)等の部品を共有化しながら,オーディオ音声信号の
出力機能とハンズフリー通話機能とを実現するに際し,
受話音声信号とオーディオ音声信号とを混合した混合音
声信号に基づいてエコー除去を行うため,オーディオ音
声信号と通話信号とが混在する状況化でもオーディオ音
声信号の影響を考慮した適切なエコーキャンセルを行う
ことが可能となる。
【0005】また,前記オーディオ音声信号が1以上の
チャンネルから構成されるものであり,前記音声信号混
合手段により混合される前記受話音声信号に対して,前
記オーディオ音声信号のチャンネルそれぞれに対応した
所定の信号処理を施すチャンネル信号処理手段を具備す
るものであれば,利用者と前記チャンネルそれぞれに対
応した複数のスピーカとの位置関係に応じて音声信号の
適切なバランス調整(音量等)を行うことが可能とな
る。
【0006】また,前記音声信号混合手段により混合さ
れる前記受話音声信号と前記オーディオ音声信号とにつ
いて,そのサンプリングレート及び周波数帯域の一方又
は両方を一致させるよう信号変換する第1の信号変換手
段を具備すれば,通話信号(前記受話音声信号及び前記
送話音声信号)とオーディオ音声信号とのサンプリング
レートや周波数帯域に違いがある場合にも適用可能であ
る。
【0007】また,前記混入音声信号が除去された前記
送話音声信号と前記混合音声信号とに基づいて,前記混
入音声信号除去手段における前記混入音声信号の特定に
関するパラメータを学習する学習手段を具備すれば,状
況変化に応じた混入音声信号の除去が可能となる。
【0008】また,前記学習手段及び前記混入音声除去
手段の一方又は両方に用いられる前記混合音声信号及び
前記送話音声信号について,そのサンプリングレート及
び周波数帯域の一方又は両方を一致させるよう信号変換
する第2の信号変換手段を具備するものも考えられ,さ
らに,前記第2の信号変換手段における信号変換後のサ
ンプリングレートが,前記音声信号入力手段から入力さ
れる前記送話音声信号,前記通話装置から入力される前
記受話音声信号,及び前記オーディオ音声信号の各サン
プリングレートの値の最小値に基づいて設定すれば,混
入音声除去やその学習の演算負荷を大幅に低減でき,比
較的性能の低い,安価なDSPやCPU等で混入音声の
除去やその学習を実現できる。
【0009】また,前記送話音声信号,前記受話音声信
号,及び前記オーディオ音声信号のいずれか1つ又は複
数の信号レベルを検出する信号レベル検出手段と,該信
号レベル検出手段による信号レベルに基づいて,前記送
話音声信号,前記前記受話音声信号,及び前記オーディ
オ音声信号のいずれか1つ又は複数の信号レベルを調節
する信号レベル調節手段と,を具備すれば,例えば,通
話中は前記オーディオ音声信号のレベルを下げる等の調
節により,混入音声除去の学習が不十分な場合等におい
ても,送話音声信号へのエコーの混入やハウリングの発
生を防止することができる。
【0010】
【発明の実施の形態】以下添付図面を参照しながら,本
発明の実施の形態及び実施例について説明し,本発明の
理解に供する。尚,以下の実施の形態及び実施例は,本
発明を具体化した一例であって,本発明の技術的範囲を
限定する性格のものではない。ここに,図1は本発明の
実施の形態に係る音声信号入出力装置Xの構成を表すブ
ロック図,図2は本発明の実施例に係る音声信号入出力
装置Y1の構成を表すブロック図,図3は本発明の実施
例に係る音声信号入出力装置Y2の構成を表すブロック
図である。
【0011】まず,図1を用いて本発明の実施の形態に
係る音声信号入出力装置Xについて説明する。本音声信
号入出力装置Xは,例えば,マイクMとスピーカSが設
けられたカーオーディオやテレビ受像機等のオーディオ
機器に組み込まれ,携帯電話機や通常の電話機等の通話
装置と接続されることにより,いわゆるハンズフリー通
話機能を実現するものである。即ち,オーディオ機器が
備えるマイクM(前記音声信号入力手段の一例)により
送話音声信号を入力し,これを電話機等の通話装置に出
力することによって相手先へ送信するとともに,相手先
から受信した受話音声信号を電話機等から入力し,これ
をオーディオ機器のスピーカS(前記音声信号出力手段
の一例)に出力して音声出力するものである。このと
き,スピーカSには,前記受話音声信号にオーディオ機
器より出力されるオーディオ音声信号(ラジオ放送の受
信音声やCD音楽の再生音等の音声信号)を混合した
(加えた)混合音声信号が出力される。これにより,オ
ーディオ機器のスピーカSが,通話用のスピーカとして
も兼用(共有化)されることになる。図1に示すよう
に,本音声信号入出力装置Xは,前記受話音声信号と前
記オーディオ音声信号とを混合し,混合された前記混合
音声信号を不図示のD/A変換器及びアンプを介してス
ピーカSに出力する音声信号混合手段10と,前記混合
音声信号に基づいて,マイクMから入力して前記通話装
置へ出力する前記送話音声信号から前記混合音声信号に
対応する混入音声信号を除去するエコーキャンセラ20
と,前記オーディオ音声信号と前記通話装置へ出力され
る前記送話音声信号とを入力し,これらに基づいて前記
エコーキャンセラ20が具備する所定の学習手段23
(後述)が学習を行うべきタイミングを制御するコント
ローラ30とを具備している。このように,前記エコー
キャンセラ20が,前記受話音声信号と前記オーディオ
音声信号とが混合された前記混合音声信号に基づいてエ
コー除去を行うため,前記オーディオ音声信号と前記受
話音声信号とが混在する状況化で適切なエコーキャンセ
ルを行うことが可能となる。
【0012】次に,前記音声信号混合手段10について
説明する。一般に,音楽CD等の前記オーディオ音声信
号は,サンプリングレートが44.1kHzであり,理
論的には22.05kHzという高い周波数帯域まで含
むことが可能な広帯域な音声信号である。一方,電話機
等の通話装置で用いられる通話信号(前記受話音声信号
及び送話音声信号)は,一般に,サンプリングレートが
8kHzであり,4kHz程度の周波数帯域しか含ませ
ることができない。このようにサンプリングレートや周
波数帯域の異なる2つの音声信号を混合するために,前
記音声信号混合手段10は,前記受話音声信号及び前記
オーディオ音声信号について,混合前にそれらのサンプ
リングレートを一致させるよう変換するための第1のサ
ンプリングレート変換部11を具備している。図1に示
す前記第1のサンプリングレート変換部11は,前記受
話音声信号のサンプリングレートを前記オーディオ音声
信号のそれ(44.1kHz)に一致させるよう変換す
るものである。変換後のサンプリングレートが,前記2
つの音声信号のうちの高い方の値となるように構成され
ているのは,スピーカSへ出力される音声信号に音質の
低下が生じないようにするためである。前記第1のサン
プリングレート変換部11としては,例えば,変換前の
ディジタル信号をアップサンプリングした信号を低域通
過フィルタに通した後,目標のサンプリングレートにな
るようにダウンサンプリングするものが知られている。
具体的には,8kHzから44.1kHzへの変換を行
う場合,まず,8kHzの前記受話音声信号を441倍
のサンプリングレートとし,441サンプルごとに元の
8kHzの音声信号と同じ値を残し,その他の値が0
(ゼロ)にした信号を作るいわゆるアップサンプリング
処理を施す。この信号を44.1kHzにダウンサンプ
リングする前に,8kHzでは本来存在しない4kHz
を越える周波数成分を取り除くための低域通過フィルタ
の処理を施す。このフィルタ処理により得られた信号を
80サンプルおきに間引いた信号を作ることにより4
4.1kHzの音声信号が得られる。もちろん,サンプ
リングレートの変換手段としては,データの補間を用い
るものなど各種存在するので,前記第1のサンプリング
レート変換部11は,他の手段によるものであってもか
まわない。
【0013】また,前記オーディオ音声信号は,いわゆ
るモノラル方式のように1チャンネルで構成される場合
は少なく,一般に,いわゆるステレオ方式の2チャンネ
ル,或いはサラウンド方式の5.1チャンネル等のよう
に複数のスピーカSそれぞれに対応した複数チャンネル
で構成される場合が多い。一方,前記通話装置で用いら
れる前記通話信号は,モノラル方式であることが一般的
である。例えば,カーオーディオ等のように,主な聴取
者である運転者が座る運転席と複数のスピーカSとの位
置関係が固定されている場合には,運転席において最も
音量バランス(左右バランス等)が良くなるように各ス
ピーカSの音量レベル,即ち,前記オーディオ音声信号
の各チャンネルの信号レベルを個別に補正(信号処理の
一例)することが有効である。これを実現するため,前
記音声信号混合手段10は,前記受話音声信号を前記オ
ーディオ音声信号の各チャンネルに対応するチャンネル
ごとに信号レベルのゲイン補正を行うチャンネルゲイン
乗算部12(前記チャンネル信号処理手段の一例)を具
備している。これにより,例えば,ステレオ方式の場合
には左右の2チャンネル,サラウンド方式の場合には
5.1チャンネル(5+1チャンネル)それぞれに対応
する信号のゲインが補正(それぞれ個別に乗算補正)さ
れる。さらに,ゲインの乗算補正だけでなく,車内の音
響特性を考慮して各チャンネルごとに所定の特性のフィ
ルタ処理(信号処理の一例)を施すようにしてもよい。
【0014】以上のように,前記第1のサンプリングレ
ート変換部11によりサンプリングレートが前記オーデ
ィオ音声信号のそれと一致するように変換され,チャン
ネルごとに所定の処理が施された前記受話音声信号に対
し,所定の音響補償フィルタ13により所定の音響処理
がなされた前記オーディオ音声信号を加算器15により
混合し(加え),混合後の混合音声信号を不図示のA/
D変換器及びアンプを介してスピーカSに出力する。も
ちろん,前記チャンネルゲイン乗算部12と同様に,前
記オーディオ音声信号や前記混合音声信号についてもチ
ャンネルごとに信号処理(ゲイン乗算やフィルタ処理
等)を行う手段を設けることも考えられる。また,前記
混合音声信号は,前記音声信号混合手段10の具備する
第2サンプリングレート変換部14により,そのサンプ
リングレートが変換されて前記エコーキャンセラ20に
出力される。前記第2のサンプリングレート変換部14
による変換後のサンプリングレートの値は,前記通話装
置へ出力される前記送話音声信号のサンプリングレート
(8kHz)の値となるように設定されている。
【0015】次に,前記エコーキャンセラ20について
説明する。前記エコーキャンセラ20は,帯域制限部2
1,適応フィルタ22,学習手段23,及び減算器24
を具備している。前記帯域制限部21は,マイクMによ
り入力された前記送話音声信号の周波数帯域を所定のフ
ィルタにより,前記通話装置へ出力される前記送話音声
信号の周波数帯域(4kHz)に制限(変換)するもの
である。前記帯域制限部21及び前記第2のサンプリン
グレート変換部14により,前記第2の信号変換手段の
一例が構成されている。前記適応フィルタ22は,前記
音声信号混合手段10から入力した低サンプリングレー
ト(8kHz)に変換後の前記混合音声信号に基づい
て,スピーカSからマイクMに回り込む音声に相当する
擬似エコー(前記混合音声信号に対応する前記混入音声
信号の一例)を出力するものである。前記減算器24
は,前記擬似エコーを,前記帯域制限部21により帯域
制限された前記送話音声信号(前記通話装置へ出力され
る前記送話音声信号)から減算器24によって除去する
ことにより,スピーカSからマイクMに回り込むエコー
を除去するものである。前記適応フィルタ22及び前記
減算器24により,前記混入音声信号除去手段の一例が
構成されている。前記学習手段23は,前記音声信号混
合手段10から入力した低サンプリングレート(8kH
z)の前記オーディオ音声信号と,前記擬似エコーが除
去された前記送話音声信号とに基づいて,前記適応フィ
ルタ22のフィルタ係数(前記擬似エコーを求める(特
定する)ためのパラメータの一例)を自動学習するもの
である。該学習手段23の学習方法としては,LMSア
ルゴリズムや学習同定アルゴリズム等の手法が知られて
いる。例えば,学習同定アルゴリズムでは,最大Nサン
プル時間までの長さのエコーを除去する場合,前記擬似
エコーをp(i)とすると,p(i)は過去Nサンプル
分のL(左)側スピーカの音声出力SL(i),及びR
(右)側スピーカの音声出力SR(i)の線形和として
次の(1)式で推定する。
【数1】 ここで,KLi,KRiは適応フィルタのフィルタ係数
である。この(1)式の時刻iにおける前記フィルタ係
数KLi,KRiからなる1行ベクトルをH(i),同
スピーカの音声出力SL(i),SR(i)からなる1
列ベクトルをS(i)とし,前記擬似エコーp(i)の
誤差をe(i)(時刻iにおけるマイクMからの実際の
音声入力と前記擬似エコーp(i)との差分)とする
と,学習同定アルゴリズムでは,次の(2)式に示すよ
うに,誤差e(i)に応じて前記フィルタ係数を修正
(学習)を行う。
【数2】 (2)式において,αは学習の収束スピードを調節する
パラメータであり,各種の設定方法が知られている。前
記適応フィルタ22及び前記学習手段23については,
前記公報1〜3等にも示されている。本音声信号入出力
装置Xでは,図1に示すように,マイクMから入力した
前記送話音声信号から前記擬似エコーを除去した後の信
号を前記誤差e(i)として用いている。
【0016】前述したように,本音声信号入出力装置X
では,前記適応フィルタ22及び前記学習手段23に入
力される音声信号のサンプリングレートは,前記帯域制
限部21及び前記第2のサンプリングレート変換部14
によって小さい値,即ち,マイクMから入力される前記
送話音声信号,スピーカSへ出力される前記混合音声信
号,及び前記通話装置へ出力される前記送話音声信号の
各サンプリングレートのうち最小の値となるように変換
される。これにより,DSPやCPU等で実現される前
記適応フィルタ22や前記学習手段23にかかる処理の
負荷を大幅に低減することができ,比較的性能の低い,
安価なDSPやCPU等で前記適応フィルタ22や前記
学習手段23を実現することが可能となる。一般に,取
り扱う信号のサンプリングレートが大きくなるにつれて
必要な演算量が加速度的に増大するので,サンプリング
レートを小さくした信号に基づき前記適応フィルタ22
や前記学習手段23の処理を行うことによる負荷低減効
果は大きい。一方,このようにサンプリングレートを低
くすると,前記送話音声信号の音声品質を低下させるこ
とになるが,そもそも通話用としては前記オーディオ音
声信号ほどの音声品質を必要としないため,このように
しても何ら問題はない。
【0017】次に,前記コントローラ30について説明
する。前述したように,前記学習手段23は,前記擬似
エコーを除去した後の前記送話音声信号を前記誤差e
(i)として用いているため,話者が発した音声と,ス
ピーカSから回りこんだエコーとが混在してマイクMに
入力されるダブルトークの状況化で学習を行うと,話者
の発した音声が外乱となるため適切な学習が行えない。
そこで,話者が声を発していないタイミングで学習を行
う必要がある。前記コントローラ30は,この学習のタ
イミングを,前記擬似エコーを除去した後の前記送話音
声信号の信号レベルに基づいて制御する。該信号レベル
は所定の信号レベル検出手段41により検出される。例
えば,前記送話音声信号の信号レベルが所定レベル以下
である場合に前記ダブルトークの状態でないと判断し,
該受話状態である場合にのみ前記学習手段23による前
記適用フィルタ22のパラメータの学習を行うよう制御
する等が考えられる。これにより,話者の音声が混入し
ない適切なタイミングでエコーの学習が可能となる。も
ちろん,前記受話音声信号や,前記オーディオ音声信号
の信号レベルを検出し,これらに基づいて学習タイミン
グを制御するようにしてもよい。例えば,前記受話音声
信号のレベルが,前記送話音声信号のレベルより大きい
場合に前記受話状態であると判断することや,前記受話
状態であって,かつ前記オーディオ音声信号のレベルが
大きい場合にのみ学習する等が考えられる。
【0018】
【実施例】次に,図2を用いて,前記音声信号入出力装
置Xの応用例である音声信号入出力装置Y1について説
明する。前述したように,前記音声信号入出力装置Xで
は,前記エコーキャンセラ20によりスピーカSからマ
イクMに回り込むエコーを除去するが,前記学習手段2
3による学習が不十分な場合等にはエコー除去が不十分
となる場合もある。このため,前記エコーキャンセラ2
0によるエコー除去に加えて,前記通話装置を介しての
通話状態に応じて,各音声信号の信号レベル(音量レベ
ル)を調節することが望ましい。これに対応するため,
本音声信号入出力装置Y1は,前記音声信号入出力装置
Xにおける前記コントローラ30に新たな制御機能を付
加したものであり,その他の構成及び機能については,
前記音声信号入出力信号装置Xと同じである。即ち,本
音声信号入出力装置Y1は,前記音声信号入出力装置X
の構成に加え,前記通話装置へ出力される前記送話音声
信号,前記音声信号混合手段10に入力される前記受話
音声信号及び前記オーディオ音声信号の音量レベル(信
号レベル)それぞれを検出する音量レベル検出手段4
1,42,43及び,同音量レベルそれぞれを調節する
音量ゲイン調節手段51,52,53を具備している。
ここで,前記送話音声信号についての前記音量レベル検
出手段41は,前記エコーキャンセラ20により前記擬
似エコーが除去された後の信号レベルを検出することが
望ましい。前記コントローラ30は,前記音量レベル検
出手段41,42,43それぞれによって検出された音
量レベルに基づいて前記音量ゲイン調節手段51,5
2,53それぞれを例えば以下のように制御する。ま
ず,前記送話音声信号のレベルが前記受話音声信号のレ
ベルよりも大きい場合は,送話状態であると判断し,前
記受話音声信号に係る前記音量ゲイン調節手段52のゲ
インを下げる。逆に,前記受話音声信号のレベルが前記
送話音声信号のレベルよりも大きい場合は受話状態であ
ると判断し,前記送話音声信号に係る前記音量ゲイン調
節手段51のゲインを下げる。さらには,前記送話音声
信号又は前記受話音声信号のいずれかのレベルが所定レ
ベル以上である場合には,通話状態(前記送話状態又は
受話状態)であると判断し,前記オーディオ音声信号に
係る前記音量ゲイン調節手段53のゲインを下げる。以
上のような制御を行うことにより,前記学習手段23に
よる学習が不十分な場合でも,前記送話音声信号にエコ
ーが混入することを防止できるとともに,前記送話音声
信号と前記受話音声信号とが同時に発生することによる
ハウリングの発生防止にもつながる。
【0019】次に,図3を用いて,前記音声入出力装置
Xの別の応用例である音声入出力装置Y2について説明
する。本発明は,音声認識機能を有するカーナビゲーシ
ョン装置やカーオーディオ,携帯電話やVoIPによる
通話装置等への適用が考えられるが,これらの装置それ
ぞれの有する機能の一部を前記音声入出力装置Xに付加
して一体に統合したものが,本音声入出力装置Y2であ
る。図3に示すように本音声入出力装置Y2は,前記音
声信号入出力装置Xの構成に加え,ノイズサプレッサ6
1,音声認識手段62,送話音声符号化手段63,受話
音声復号化手段64,通信プロトコル処理手段65,音
声合成手段66,オーディオ信号復号化手段67,及び
加算器68を具備している。前記ノイズサプレッサ61
は,前記エコーキャンセラ20から出力される前記送話
音声信号から車の走行音等,所定の周波数帯域のノイズ
を除去するものである。前記音声認識手段62は,一般
に,カーナビゲーション装置等に搭載されるものであ
り,前記ノイズサプレッサ61の出力する音声信号に基
づき,音声認識を行い,カーナビゲーション装置に対す
る制御コマンド等の音声認識結果を出力するものであ
る。これにより,前記エコーキャンセラ20を前記送話
音声信号からのエコー除去だけでなく,前記音声認識手
段62に対する音声信号からのエコー除去にも兼用(共
用)される。前記送話音声符号化手段63及び前記受話
音声復号化手段64は,携帯電話やVoIPによる通話
装置との間で入出力する前記送話音声信号及び前記受話
音声信号について,所定の符号化(エンコード)及び復
号化(デコード)をおこなうものである。一般に,携帯
電話やVoIP等で送受信される通話信号は,VSEL
P,PSI−CELP,AMR,G.729,G.72
3.1等の規格で圧縮(符号化)されている。前記送話
音声符号化手段63及び前記受話音声復号化手段64
は,これら各規格に応じた符号化及び復号化を行う。こ
の送話音声符号化手段63により符号化する音声信号に
車の走行音等のノイズが混入していると,符号化(圧
縮)によって著しく音声品質の劣化が生じるので,前記
ノイズサプレッサ61によるノイズ除去が,音声品質を
確保する上で有効である。前記通信プロトコル処理手段
65は,例えば,VoIPにおけるRTPやG.32
3,SIP等,音声信号の符号化や復号化と同時に行う
ことが効率的である通信のプロトコル処理を行うもので
ある。前記音声合成手段66は,カーナビゲーション装
置等で行われる利用者への音声ガイダンス等の合成音声
を出力するものである。該合成音声は,前記加算器68
によって前記音声信号混合手段10に入力される前記受
話音声信号に加算(混合)される。これにより,音声ガ
イダンス等の合成音声も前記エコーキャンセラ20が用
いる前記混合音声信号に含まれることになるので,前記
送話音声信号に音声ガイダンス等のエコーが含まれるこ
とを防止できる。前記オーディオ信号復号化手段67
は,MP3,WMA,TwinVQ,MPEG2−AA
C等の圧縮規格によって符号化されたデジタルオーディ
オ信号(前記オーディオ音声信号の一例)を復号化する
ものである。
【0020】図3に示した各構成要素を1チップのDS
P等に一体化して統合することは,単に複数の機器を組
み合わせた1チップ化により小型・軽量化が図れるだけ
でなく,通話品質悪化を防止する効果をも奏する。即
ち,各機器を別の装置に搭載して接続し,それぞれの間
で音声信号を入出力する構成とした場合,機器間で通信
を行うことにより生じる音声信号の入出力のタイミング
の違いを緩衝させたり,信号の処理待ち等のためにバッ
ファが必要となるが,このようなバッファに入出力信号
が一時滞留すると信号処理の遅延が生じる。例えば,送
話側では,前記エコーキャンセラ20,前記ノイズサプ
レッサ61,前記送話音声符号化手段63,及び前記通
信プロトコル処理手段65それぞれの間の信号入出力に
おいて遅延が生じ,受話側では,前記通信プロトコル処
理手段65,前記受話音声復号化手段64,及び前記音
声信号混合手段10それぞれの間の信号入出力において
遅延が生じる。この遅延により,例えば一方の話者の問
いかけに対して他方の話者の応答が遅れて聞こえてくる
等,円滑な通話が阻害される。一方,図3に示す構成要
素を1チップ化して統合することにより,同一メモリ上
のデータ(音声信号)に対して各種処理を行えるように
なり,音声信号の入出力に遅延が発生せず,通話品質の
悪化を防止できる。さらに,処理の遅延がなくなること
により,利用者の音声を認識してガイダンス(合成音
声)を出力したりオーディオ機器を動作させたりする等
の応答の速度が向上するという効果も奏する。また,前
記音声信号入出力装置Y1と同様に音量調節機能を付加
することにより,例えば前記音声認識手段62の動作中
はスピーカSへの出力信号を減衰させる等,全体として
最適な制御が可能となる。
【0021】
【発明の効果】以上説明したように,本発明によれば,
オーディオ機器や家電製品等とスピーカやマイク等の部
品を共有化しながら,オーディオ音声信号の出力機能と
ハンズフリー通話機能とを実現するに際し,受話音声信
号とオーディオ音声信号とを混合した混合音声信号に基
づいてエコー除去を行うため,オーディオ音声信号と通
話信号とが混在する状況化でもオーディオ音声信号の影
響を考慮した適切なエコーキャンセルを行うことが可能
となる。また,オーディオ音声信号の有する1以上のチ
ャンネルに対応させて受話音声信号の処理を行うことに
より,利用者と複数のスピーカとの位置関係に応じて音
声信号の適切なバランス調整を行うことが可能となる。
また,サンプリングレートや周波数帯域についての信号
変換手段を具備することにより,通話信号とオーディオ
音声信号とのサンプリングレートや周波数帯域に違いが
ある場合にも適用可能である。また,混入音声(エコ
ー)の除去やその学習に用いる信号のサンプリングレー
トを,通話信号及びオーディオ音声信号のサンプリング
レートの最小値に基づいて設定することにより,混入音
声除去やその学習の演算負荷を大幅に低減でき,比較的
性能の低い,安価なDSPやCPU等で混入音声の除去
やその学習を実現できる。また,送話音声信号,受話音
声信号,オーディオ音声信号について,これらの信号レ
ベルの検出結果に基づいてその信号レベルを調節するこ
とにより,エコー除去の学習が不十分な場合等において
も,送話音声信号へのエコーの混入やハウリングの発生
を防止することができる。また,本発明を,音声信号の
符号化や復号化,音声認識,通信プロトコル処理,音声
合成等の各手段と統合した形で実施すれば,信号の遅延
が防止できるため,信号遅延に起因する通話品質の悪化
を防止できるとともに,応答速度の向上が図れる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る音声信号入出力装置
Xの構成を表すブロック図。
【図2】本発明の実施例に係る音声信号入出力装置Y1
の構成を表すブロック図。
【図3】本発明の実施例に係る音声信号入出力装置Y2
の構成を表すブロック図。
【符号の説明】
10…音声信号混合手段 11…第1のサンプリングレート変換部 12…チャンネルゲイン乗算部 13…音響補償フィルタ 14…第2のサンプリングレート変換部 15…加算器 20…エコーキャンセラ 21…帯域制限部 22…適応フィルタ 23…学習手段 24…減算器 30…コントローラ 41,42,43…音量レベル検出手段 51,52,53…音量ゲイン調節手段 61…ノイズサプレッサ 62…音声認識手段 63…送話音声符号化手段 64…受話音声復号化手段 65…通信プロトコル処理手段 66…音声合成手段 67…オーディオ信号復号化手段 68…加算器 M…マイク S…スピーカ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 3/00 N (72)発明者 下田 敏章 兵庫県神戸市西区高塚台1丁目5番5号 株式会社神戸製鋼所神戸総合技術研究所内 (72)発明者 稗方 孝之 兵庫県神戸市西区高塚台1丁目5番5号 株式会社神戸製鋼所神戸総合技術研究所内 Fターム(参考) 5D020 CC05 CC06 5D045 AB26 DA20 5K027 DD07 DD10 HH03 5K046 BB01 CC28 HH02 HH19 HH78 HH79

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 ハンズフリー通話における相手先へ送信
    する送話音声信号を所定の音声入力手段から入力して所
    定の通話装置へ出力するとともに,該通話装置から入力
    した相手先からの受話音声信号を所定の音声出力手段に
    出力する音声信号入出力装置において,所定のオーディ
    オ音声信号を入力するオーディオ音声信号入力手段と,
    前記受話音声信号に前記オーディオ音声信号を混合した
    混合音声信号を前記音声出力手段に出力する音声信号混
    合手段と,前記混合音声信号に基づいて,前記通話装置
    へ出力する前記送話音声信号から前記混合音声信号に対
    応する混入音声信号を除去する混入音声信号除去手段
    と,を具備してなることを特徴とする音声信号入出力装
    置。
  2. 【請求項2】 前記オーディオ音声信号が1以上のチャ
    ンネルから構成されるものであり,前記音声信号混合手
    段により混合される前記受話音声信号に対して,前記オ
    ーディオ音声信号のチャンネルそれぞれに対応した所定
    の信号処理を施すチャンネル信号処理手段を具備してな
    る請求項1に記載の音声信号入出力装置。
  3. 【請求項3】 前記音声信号混合手段により混合される
    前記受話音声信号と前記オーディオ音声信号とについ
    て,そのサンプリングレート及び周波数帯域の一方又は
    両方を一致させるよう信号変換する第1の信号変換手段
    を具備してなる請求項1又は2のいずれかに記載の音声
    信号入出力装置。
  4. 【請求項4】 前記混入音声信号が除去された前記送話
    音声信号と前記混合音声信号とに基づいて,前記混入音
    声信号除去手段における前記混入音声信号の特定に関す
    るパラメータを学習する学習手段を具備してなる請求項
    1〜3のいずれかに記載の音声信号入出力装置。
  5. 【請求項5】 前記学習手段及び前記混入音声除去手段
    の一方又は両方に用いられる前記混合音声信号及び前記
    送話音声信号について,そのサンプリングレート及び周
    波数帯域の一方又は両方を一致させるよう信号変換する
    第2の信号変換手段を具備してなる請求項4に記載の音
    声信号入出力装置。
  6. 【請求項6】 前記第2の信号変換手段における信号変
    換後のサンプリングレートが,前記音声信号入力手段か
    ら入力される前記送話音声信号,前記通話装置から入力
    される前記受話音声信号,及び前記オーディオ音声信号
    の各サンプリングレートの値の最小値に基づいて設定さ
    れてなる請求項5に記載の音声信号入出力装置。
  7. 【請求項7】 前記送話音声信号,前記受話音声信号,
    及び前記オーディオ音声信号のいずれか1つ又は複数の
    信号レベルを検出する信号レベル検出手段と,該信号レ
    ベル検出手段による信号レベルに基づいて,前記送話音
    声信号,前記前記受話音声信号,及び前記オーディオ音
    声信号のいずれか1つ又は複数の信号レベルを調節する
    信号レベル調節手段と,を具備してなる請求項1〜6の
    いずれかに記載の音声信号入出力装置。
JP2002048183A 2002-02-25 2002-02-25 音声信号入出力装置 Pending JP2003249996A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002048183A JP2003249996A (ja) 2002-02-25 2002-02-25 音声信号入出力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002048183A JP2003249996A (ja) 2002-02-25 2002-02-25 音声信号入出力装置

Publications (1)

Publication Number Publication Date
JP2003249996A true JP2003249996A (ja) 2003-09-05

Family

ID=28661046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002048183A Pending JP2003249996A (ja) 2002-02-25 2002-02-25 音声信号入出力装置

Country Status (1)

Country Link
JP (1) JP2003249996A (ja)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005130475A (ja) * 2003-10-24 2005-05-19 Microsoft Corp 任意の再生サンプリングレートを用いたエコーキャンセルのためのシステムおよび方法
WO2005091677A1 (ja) * 2004-03-22 2005-09-29 Toa Corporation マルチチャンネルシステム同定装置
WO2006025256A1 (ja) * 2004-09-01 2006-03-09 School Juridical Person Of Fukuoka Kogyo Daigaku 発振・エコー防止回路及びマイクスピーカ
JP2006195411A (ja) * 2004-12-14 2006-07-27 Alpine Electronics Inc 音声処理装置
JP2007053511A (ja) * 2005-08-17 2007-03-01 Sony Corp 音声処理装置及びマイク装置
JP2007528646A (ja) * 2004-03-05 2007-10-11 トムソン ライセンシング 会議または電話用の音響エコー・キャンセラのバックグラウンド訓練
JP2008244775A (ja) * 2007-03-27 2008-10-09 Rohm Co Ltd オーディオ回路およびそれを備える電子機器
JP2009522904A (ja) * 2006-01-06 2009-06-11 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音響エコーキャンセラ
JP2009169445A (ja) * 2009-05-07 2009-07-30 Denso Corp 音声認識装置及びカーナビゲーション装置
JP2010081004A (ja) * 2008-09-24 2010-04-08 Nec Electronics Corp エコーキャンセル装置、通信装置、及びエコーキャンセル方法
JP2011045125A (ja) * 2004-12-14 2011-03-03 Alpine Electronics Inc 音声処理装置
JP2011055405A (ja) * 2009-09-04 2011-03-17 Alps Electric Co Ltd ハンズフリー通信システム及び近距離無線通信装置
JP2012253653A (ja) * 2011-06-06 2012-12-20 Sony Corp 信号処理装置、信号処理方法
WO2014020760A1 (ja) * 2012-08-03 2014-02-06 三菱電機株式会社 通話装置
JP2015002460A (ja) * 2013-06-17 2015-01-05 沖電気工業株式会社 エコー抑圧装置及びプログラム
JP5960128B2 (ja) * 2011-05-20 2016-08-02 株式会社ソシオネクスト 通話機
CN106464299A (zh) * 2014-03-06 2017-02-22 博士有限公司 管理车辆音频平台中的电话和娱乐音频
JP2017123648A (ja) * 2016-12-20 2017-07-13 ソニー株式会社 オーディオ機器
KR20170125021A (ko) * 2015-02-27 2017-11-13 하만인터내셔날인더스트리스인코포레이티드 다수 사용자 간에 스테레오 사운드를 공유하기 위한 기술
JPWO2021005806A1 (ja) * 2019-07-08 2021-01-14
JP2022536801A (ja) * 2019-06-17 2022-08-18 ボーズ・コーポレーション モジュール式エコーキャンセルユニット

Cited By (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4514125B2 (ja) * 2003-10-24 2010-07-28 マイクロソフト コーポレーション 任意の再生サンプリングレートを用いたエコーキャンセルのためのシステムおよび方法
JP2005130475A (ja) * 2003-10-24 2005-05-19 Microsoft Corp 任意の再生サンプリングレートを用いたエコーキャンセルのためのシステムおよび方法
KR101099340B1 (ko) 2003-10-24 2011-12-26 마이크로소프트 코포레이션 임의의 플레이백 샘플링 비율들을 갖는 에코우 제거를위한 시스템 및 방법
US8401176B2 (en) 2004-03-05 2013-03-19 Thomson Licensing Acoustic echo canceller with multimedia training signal
JP2007528646A (ja) * 2004-03-05 2007-10-11 トムソン ライセンシング 会議または電話用の音響エコー・キャンセラのバックグラウンド訓練
US7769162B2 (en) 2004-03-05 2010-08-03 Thomson Licensing Acoustic echo canceller with multimedia training signal
WO2005091677A1 (ja) * 2004-03-22 2005-09-29 Toa Corporation マルチチャンネルシステム同定装置
WO2006025256A1 (ja) * 2004-09-01 2006-03-09 School Juridical Person Of Fukuoka Kogyo Daigaku 発振・エコー防止回路及びマイクスピーカ
US8254560B2 (en) 2004-09-01 2012-08-28 School Juridical Person Of Fukuoka Kogyo Daigaku Oscillation-echo preventing circuit and microphone/speaker unit
KR101119787B1 (ko) 2004-09-01 2012-03-23 스쿨 쥬리디컬 펄슨 오브 후꾸오까 쿄교 다이가꾸 발진?에코 방지 회로 및 마이크 스피커
JP2011045125A (ja) * 2004-12-14 2011-03-03 Alpine Electronics Inc 音声処理装置
JP4722607B2 (ja) * 2004-12-14 2011-07-13 アルパイン株式会社 音声処理装置
JP2006195411A (ja) * 2004-12-14 2006-07-27 Alpine Electronics Inc 音声処理装置
JP2007053511A (ja) * 2005-08-17 2007-03-01 Sony Corp 音声処理装置及びマイク装置
JP4696776B2 (ja) * 2005-08-17 2011-06-08 ソニー株式会社 音声処理装置及びマイク装置
JP2009522904A (ja) * 2006-01-06 2009-06-11 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音響エコーキャンセラ
JP2008244775A (ja) * 2007-03-27 2008-10-09 Rohm Co Ltd オーディオ回路およびそれを備える電子機器
JP2010081004A (ja) * 2008-09-24 2010-04-08 Nec Electronics Corp エコーキャンセル装置、通信装置、及びエコーキャンセル方法
US8325910B2 (en) 2008-09-24 2012-12-04 Renesas Electronics Corporation Echo cancelling device, communication device, and echo cancelling method having the error signal generating circuit
US8867735B2 (en) 2008-09-24 2014-10-21 Renesas Electronics Corporation Echo cancelling device, communication device, and echo cancelling method having the error signal generating circuit
JP2009169445A (ja) * 2009-05-07 2009-07-30 Denso Corp 音声認識装置及びカーナビゲーション装置
JP2011055405A (ja) * 2009-09-04 2011-03-17 Alps Electric Co Ltd ハンズフリー通信システム及び近距離無線通信装置
JP5960128B2 (ja) * 2011-05-20 2016-08-02 株式会社ソシオネクスト 通話機
JP2012253653A (ja) * 2011-06-06 2012-12-20 Sony Corp 信号処理装置、信号処理方法
US9584908B2 (en) 2011-06-06 2017-02-28 Sony Corporation Signal processing device and signal processing method
WO2014020760A1 (ja) * 2012-08-03 2014-02-06 三菱電機株式会社 通話装置
JP5666063B2 (ja) * 2012-08-03 2015-02-12 三菱電機株式会社 通話装置
JP2015002460A (ja) * 2013-06-17 2015-01-05 沖電気工業株式会社 エコー抑圧装置及びプログラム
JP2018164310A (ja) * 2014-03-06 2018-10-18 ボーズ・コーポレーションBose Corporation 車両の音声プラットホームにおける電話および娯楽オーディオの管理
CN106464299A (zh) * 2014-03-06 2017-02-22 博士有限公司 管理车辆音频平台中的电话和娱乐音频
JP2017507612A (ja) * 2014-03-06 2017-03-16 ボーズ・コーポレーションBose Corporation 車両の音声プラットホームにおける電話および娯楽オーディオの管理
EP3114826B1 (en) * 2014-03-06 2020-01-22 Bose Corporation Managing telephony and entertainment audio in a vehicle audio platform
US9883286B2 (en) 2014-03-06 2018-01-30 Bose Corporation Managing telephony and entertainment audio in a vehicle audio platform
CN106464299B (zh) * 2014-03-06 2019-08-16 博士有限公司 管理车辆音频平台中的电话和娱乐音频
KR20170125021A (ko) * 2015-02-27 2017-11-13 하만인터내셔날인더스트리스인코포레이티드 다수 사용자 간에 스테레오 사운드를 공유하기 위한 기술
JP2018512754A (ja) * 2015-02-27 2018-05-17 ハーマン インターナショナル インダストリーズ インコーポレイテッド 多数のユーザ間でステレオ音声を共有するための技術
US11418874B2 (en) 2015-02-27 2022-08-16 Harman International Industries, Inc. Techniques for sharing stereo sound between multiple users
KR102524590B1 (ko) * 2015-02-27 2023-04-21 하만인터내셔날인더스트리스인코포레이티드 다수 사용자 간에 스테레오 사운드를 공유하기 위한 기술
JP2017123648A (ja) * 2016-12-20 2017-07-13 ソニー株式会社 オーディオ機器
JP2022536801A (ja) * 2019-06-17 2022-08-18 ボーズ・コーポレーション モジュール式エコーキャンセルユニット
JP7259092B2 (ja) 2019-06-17 2023-04-17 ボーズ・コーポレーション モジュール式エコーキャンセルユニット
JPWO2021005806A1 (ja) * 2019-07-08 2021-01-14
WO2021005806A1 (ja) * 2019-07-08 2021-01-14 パナソニックIpマネジメント株式会社 スピーカシステム、音処理装置、音処理方法及びプログラム
CN113228706A (zh) * 2019-07-08 2021-08-06 松下知识产权经营株式会社 扬声器系统、声音处理装置、声音处理方法以及程序
EP3998781A4 (en) * 2019-07-08 2022-08-24 Panasonic Intellectual Property Management Co., Ltd. SPEAKER SYSTEM, SOUND PROCESSING DEVICE, SOUND PROCESSING METHOD AND PROGRAM
JP7281788B2 (ja) 2019-07-08 2023-05-26 パナソニックIpマネジメント株式会社 スピーカシステム、音処理装置、音処理方法及びプログラム
US11682375B2 (en) 2019-07-08 2023-06-20 Panasonic Intellectual Property Management Co., Ltd. Speaker system, sound processing device, sound processing method, and recording medium

Similar Documents

Publication Publication Date Title
JP2003249996A (ja) 音声信号入出力装置
JP4913155B2 (ja) 音響エコーキャンセラ
JP3199155B2 (ja) 反響消去装置
EP1858295A1 (en) Equalization in acoustic signal processing
US20200372926A1 (en) Acoustical in-cabin noise cancellation system for far-end telecommunications
US20060008091A1 (en) Apparatus and method for cross-talk cancellation in a mobile device
JP2006270601A (ja) ハンズフリー通話装置
US8774398B2 (en) Transceiver
US20090067615A1 (en) Echo cancellation using gain control
US5911124A (en) Method and apparatus for applying echo mitigation in a communication device
US8879721B2 (en) Audio communication system
US20060111154A1 (en) Apparatus and method for a full-duplex speakerphone using a digital automobile radio and a cellular phone
JP3619461B2 (ja) 多チャネル雑音抑圧装置、その方法、そのプログラム及びその記録媒体
JPH09204195A (ja) 相関信号の送信システム
US20220303677A1 (en) Beamforming techniques for acoustic interference cancellation
JPH08288894A (ja) エコー抑圧装置
JP2003099100A (ja) 音声認識装置およびその方法
US7751856B2 (en) Coordination of apparatus and mobile terminal media processing circuitry
JPH0766757A (ja) エコーキャンセル方法
JPH0715787A (ja) 音声信号処理装置
JP2008311848A (ja) 音声信号処理装置、音声信号処理方法
JPH10145487A (ja) 高品質拡声情報通信システム
JP2006108777A (ja) 電話端末及びこの電話端末を使用した電話システム、及び電話端末の制御方法
JP2005269546A (ja) エコーキャンセル装置、エコーキャンセル方法、およびエコーキャンセルプログラム
JPH08340267A (ja) 背景雑音低減機能付き送受信機