JP2001236090A - 音声入力装置 - Google Patents

音声入力装置

Info

Publication number
JP2001236090A
JP2001236090A JP2000043952A JP2000043952A JP2001236090A JP 2001236090 A JP2001236090 A JP 2001236090A JP 2000043952 A JP2000043952 A JP 2000043952A JP 2000043952 A JP2000043952 A JP 2000043952A JP 2001236090 A JP2001236090 A JP 2001236090A
Authority
JP
Japan
Prior art keywords
audio sound
audio
unit
volume
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000043952A
Other languages
English (en)
Inventor
Koichi Nakada
孝一 中田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP2000043952A priority Critical patent/JP2001236090A/ja
Publication of JP2001236090A publication Critical patent/JP2001236090A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

(57)【要約】 【課題】 入力音声以外のオーディオ音を必要以上に断
続することなく入力音声を抽出することができる音声入
力システムを提供すること。 【解決手段】 トークスイッチ70が押下されると、ミ
ュート処理部30は、増幅器120内の音量調整部12
2から出力されるオーディオ音信号の信号レベルを調
べ、この信号レベルが所定のしきい値よりも大きい場合
には、音量調整部122のボリューム値を制御し、音量
調整部122から出力されるオーディオ音信号の信号レ
ベルがしきい値以下となるようにする。この結果、スピ
ーカ130から出力されるオーディオ音の音量が所定量
だけ低下する。オーディオ音除去部40は、マイクロホ
ン140から出力される検出信号から、オーディオ音信
号に対応する成分を除去し、除去後の信号を音声認識装
置150に出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、マイクロホンによ
って集音した音声信号に重畳されるオーディオ音信号を
除去する音声入力装置に関する。
【0002】
【従来の技術】最近の車載用機器、例えばナビゲーショ
ン装置やオーディオ機器に各種の操作指示を与える方法
としては、利用者が操作パネルやリモートコントロール
(リモコン)ユニット等に備わった各種のキーを押下す
る方法の他に、利用者によって発せられた操作音声の内
容を音声認識することによって行う方法がある。音声認
識装置を用いて操作指示を行う場合には、操作キーの配
置等を覚える必要がなく、しかも走行中に車両が振動し
た状態でキーの操作を行わないですむため、操作の簡略
化が可能であり、特に最近ではプロセッサの高速化等に
伴って車載用機器についても用いられることが多い。
【0003】このような音声認識装置による認識率を低
下させる要因の代表的なものに、車室内のオーディオ装
置から出力されるオーディオ音がある。利用者の音声に
オーディオ音が重畳されると、音声認識装置ではそれら
を区別して利用者の音声に対してのみ音声認識処理を行
うことができないため、正確な音声認識処理を行うこと
が困難となる。このため、従来は、トークスイッチが押
下されたときにオーディオ音の出力を中断したりあるい
は音量を下げたりして、音声認識の対象となる音声信号
に重畳されるオーディオ音を除去あるいは低減する工夫
を行っている。
【0004】
【発明が解決しようとする課題】ところで、上述したよ
うにトークスイッチを押下したときにオーディオ音の出
力を中断する場合には、頻繁に音声認識処理を行ったと
きにオーディオ音が断続することになるため、利用者に
よるオーディオ音の聴取を妨げるという問題がある。特
に、音声入力によって車載用機器の操作を行っている利
用者以外の搭乗者は、この操作とは無関係にオーディオ
音を聴取している場合もあるため、聴取しているオーデ
ィオ音が頻繁に断続されると不快であり、認識対象とな
る入力音声以外のオーディオ音を断続することなく入力
音声を抽出することができる手法が望まれている。
【0005】また、トークスイッチを押下したときにオ
ーディオ音の音量を下げる場合に、この音量を下げる量
を多く設定した場合には、上述したオーディオ音の出力
を中断した場合と同様なオーディオ音の断続状態が生
じ、一方、この音量を下げる量を少なく設定した場合に
は、入力音声に重畳されるオーディオ音を十分に抑圧す
ることができないことになり、十分な効果が得られな
い。
【0006】本発明は、このような点に鑑みて創作され
たものであり、その目的は、入力音声以外のオーディオ
音を必要以上に断続することなく入力音声を抽出するこ
とができる音声入力システムを提供することにある。
【0007】
【課題を解決するための手段】上述した課題を解決する
ために、本発明の音声入力装置は、オーディオ音除去手
段により、マイクロホンから出力される信号からこの信
号に含まれるオーディオ音信号に対応する成分を除去し
ており、この際に、減衰手段からスピーカに向けて出力
される減衰後のオーディオ音信号の信号レベルが所定の
しきい値以下となるように利得設定手段によって減衰手
段の利得を設定している。このため、減衰手段から出力
されるオーディオ音信号の信号レベルが所定のしきい値
以下である場合には、オーディオ音信号はそれ以上減衰
されることがなく、オーディオ音除去手段によるオーデ
ィオ音成分の除去処理だけが行われるので、スピーカか
ら出力されるオーディオ音の音量を不必要に低下させる
ことなく入力音声を抽出することができる。また、減衰
手段から出力されるオーディオ音信号の信号レベルが所
定のしきい値を超えている場合には、信号レベルが所定
値以下となるように減衰手段の利得が設定されるので、
スピーカから出力されるオーディオ音の音量低下を必要
最小限に抑えることができる。したがって、本発明の音
声入力装置によれば、入力音声以外のオーディオ音を必
要以上に断続することなく入力音声を抽出することがで
きる。
【0008】また、上述した利得設定手段は、マイクロ
ホンから出力される信号に含まれる音声信号とオーディ
オ音信号のパワーの比が所定値以上となるように減衰手
段の利得を設定することが望ましい。音声信号とオーデ
ィオ音信号のパワーの比が所定値以上となるように制御
されるため、良好なSN比を有する音声信号を得ること
ができる。
【0009】また、音量が異なる複数の入力音声に対応
して用意された複数のしきい値の中からいずれか一つを
選択する選択手段をさらに備え、上述した利得設定手段
は、選択手段によって選択されたしきい値を用いて、減
衰手段の利得を設定することが望ましい。このように、
複数のしきい値を使い分けて減衰手段の利得を設定する
ことにより、複数の利用者の音量(声の大きさ)がそれ
ぞれ異なる場合にも、確実に入力音声を抽出することが
できるとともに、オーディオ音の音量低下を必要最小限
に抑えることができる。
【0010】
【発明の実施の形態】以下、本発明を適用した一実施形
態の車載用の音声入力装置について、図面を参照しなが
ら説明する。
【0011】図1は、本実施形態の音声入力装置の構成
を示す図である。同図に示す音声入力装置100は、ミ
ュート処理部30、オーディオ音除去部40、トークス
イッチ70、操作部80を含んで構成されており、利用
者がマイクロホン140に向かって車載用のナビゲーシ
ョン装置(図示せず)等に対する操作音声を発声したと
きに、スピーカ130から出力されるオーディオ音の音
量を必要量だけ調整するとともに、マイクロホン140
から出力される検出信号に含まれるオーディオ音成分を
除去して入力音声を抽出して音声認識装置150に入力
する。
【0012】ミュート処理部30は、オーディオ装置1
10から出力されるオーディオ音信号の増幅度(減衰
量)を可変する制御を行う。具体的には、オーディオ装
置110から出力されるオーディオ音信号は増幅器12
0に入力されて、音量調整部122によって信号レベル
の調整が行われ、その後段の電力増幅部124で所定の
ゲインで電力増幅が行われた後に、スピーカ130から
オーディオ音が出力される。ミュート処理部30は、こ
の増幅器120内の音量調整部122から出力される増
幅後のオーディオ音信号の信号レベルが所定のしきい値
以下となるように、音量調整部122による信号の減衰
量(以下、この減衰量を「ミュート量」と称する)を設
定する。これにより、マイクロホン140から出力され
る検出信号に含まれるオーディオ音成分の信号レベルが
所定値以下に維持される。
【0013】オーディオ音除去部40は、マイクロホン
140から出力される検出信号に含まれるオーディオ音
成分を除去する。したがって、利用者によって音声認識
用の所定の単語等が発声され、この音声がマイクロホン
140によって集音されると、オーディオ音除去部40
は、マイクロホン140から出力される検出信号に含ま
れるオーディオ音成分を除去し、除去後の信号を音声認
識装置150に出力する。
【0014】トークスイッチ70は、利用者が操作音声
を発声する際に押下するスイッチであり、操作状況がミ
ュート処理部30およびオーディオ音除去部40に送ら
れる。操作部80は、ミュート処理部30がミュート量
を算出する際に基準として用いる所定のしきい値を設定
するための操作を行うものであり、利用者による操作内
容に応じた信号をミュート処理部30に出力する。
【0015】次に、音声入力装置100の詳細な構成に
ついて説明する。図2は、音声入力装置100の詳細構
成を示す図である。同図に示すミュート処理部30は、
アナログ−デジタル変換器(ADC)32、しきい値設
定部34、ミュート量設定部36を含んで構成されてい
る。
【0016】アナログ−デジタル変換器32は、増幅器
120内の音量調整部122から出力されるオーディオ
音信号をデジタルデータに変換する。しきい値設定部3
4は、ミュート量設定部36がミュート量を設定する際
に基準とするしきい値を設定する。
【0017】上述したしきい値について具体的に説明す
る。一般に、音声認識処理を良好に行うためには、音声
認識装置に入力される音声信号において、音声成分のパ
ワーPs とオーディオ音成分のパワーPn とのSN比が
15dB程度必要であると言われている。ここで、例え
ば、本実施形態の音声入力装置100に備えられたオー
ディオ音除去部40の除去性能が−20dBであるとす
ると、マイクロホン140によって集音された検出信号
における音声成分のパワーPs とオーディオ音成分のパ
ワーPn とのSN比が−5dB以上であれば、マイクロ
ホン140から出力される検出信号に対してオーディオ
音除去部40により所定のオーディオ音除去処理を行う
ことにより、音声認識装置150に入力される音声信号
のSN比として15dB以上の値を確保することができ
る。すなわち、マイクロホン140から出力される検出
信号において、10log(Ps /Pn )=−5dBと
いう関係を満たす場合に、良好な音声認識処理が行える
こととなる。
【0018】したがって、まず、不特定多数の利用者を
対象として操作音声を発声した場合の音声成分のパワー
を測定する。なお、複数の利用者を対象として操作音声
を発声した場合の音声成分のパワーを測定する代わり
に、平均的な音量で発声すると考えられる1人あるいは
少数の利用者を対象として操作音声を発声した場合の音
声成分のパワーを測定するようにしてもよい。以後、こ
の平均的な音声成分のパワーをPsaとする。次に、求め
られた平均的な音声成分のパワーPsaの値を用いて、上
述した10log(Psa/Pn )=−5dBの関係を満
たすオーディオ音成分のパワーPn の値(以後、この値
を「Pnthr」とおく)を計算する。次に、オーディオ装
置110からオーディオ音信号を出力し、増幅器120
内の音量調整部122によって音量を変化させて、スピ
ーカ130から出力されるオーディオ音をマイクロホン
140によって集音する。そして、マイクロホン140
から出力される検出信号に基づいて、オーディオ音成分
のパワーPn の値が上述したPnthrとなるように音量調
整部122の減衰量設定値(以後、この減衰量設定値を
慣用的な表現を用いて「ボリューム値」と称する)を調
整し、この状態で音量調整部122から出力されるオー
ディオ音信号の信号レベルを求める。このようにして求
められたオーディオ音信号の信号レベルが、本実施形態
のしきい値設定部34において設定されるしきい値x
thr となる。
【0019】すなわち、音量調整部122から出力され
るオーディオ音信号の信号レベルがしきい値xthr 以下
となるように音量調整部122のボリューム値を調整す
ることにより、マイクロホン140から出力される検出
信号に含まれるオーディオ音成分のパワーPn を上述し
たPnthr以下に抑制することができ、これにより上述し
た10log(Ps /Pn )=−5dBの関係を満た
し、良好な音声認識処理を行うことができる。
【0020】なお、本実施形態では、上述した方法によ
って求められる不特定多数の利用者を対象とした平均的
な音声成分のパワーPsaに対応したしきい値xthr の他
に、声の音量の大きい利用者を想定して求められたしき
い値xthr′ 、および声の音量の小さい利用者を想定し
て求められたしきい値xthr″ のそれぞれがあらかじめ
用意されてしきい値設定部34に格納されており、声の
音量の大小に応じて、いずれか一つのしきい値を利用者
が選択できるようになっている。本実施形態のしきい値
設定部34は、操作部80を介して利用者により選択さ
れたしきい値をミュート量設定部36に出力する。
【0021】ミュート量設定部36は、しきい値設定部
34によって設定されたしきい値に基づいて、音量調整
部122から出力されるオーディオ音信号の信号レベル
がしきい値以下となるように、必要なミュート量を設定
して音量調整部122に出力する。ミュート量設定部3
6の動作の詳細については後述する。
【0022】また、上述した図2に示すオーディオ音除
去部40は、アンプ42、2つのアナログ−デジタル変
換器44、48、遅延素子46、適応フィルタ50、L
MS(Least Mean Square )アルゴリズム処理部52、
演算部54を含んで構成されている。
【0023】アンプ42は、マイクロホン140から出
力される検出信号を所定のゲインで増幅する。アナログ
−デジタル変換器44は、アンプ42から出力される検
出信号をデジタルデータに変換する。遅延素子46は、
アナログ−デジタル変換器44によってデジタルデータ
に変換された検出信号を所定時間だけ遅延させる。この
遅延素子46は、例えば、伝達特性Z-mを有するFIR
(Finite Impulse Response )型のデジタルフィルタで
あり、遅延時間tに対応するフィルタ係数を1に設定
し、それ以外のフィルタ係数を0に設定することにより
実現される。
【0024】アナログ−デジタル変換器48は、オーデ
ィオ装置110から出力されるオーディオ音信号をデジ
タルデータに変換する。適応フィルタ50は、フィルタ
係数W1を有するFIR型のデジタルフィルタであり、
アナログ−デジタル変換器48から出力されるオーディ
オ音信号に対して所定の適応等化処理を行う。このフィ
ルタ係数W1は、LMSアルゴリズム処理部52によっ
て更新される。
【0025】LMSアルゴリズム処理部52は、アナロ
グ−デジタル変換器48から出力されるオーディオ音信
号(参照信号)と演算部54から出力される差分信号
(後述する)が入力されており、周知のLMSアルゴリ
ズムを用いることにより、演算部54から出力される差
分信号のパワーが最小となるように、上述した適応フィ
ルタ50のフィルタ係数W1を更新する。
【0026】演算部54は、遅延素子46から出力され
る検出信号と適応フィルタ50から出力されるオーディ
オ音信号との差分を計算して、差分信号を出力する。上
述したように、LMSアルゴリズム処理部52によって
この差分信号のパワーが最小となるように適応フィルタ
50のフィルタ係数W1が更新される。このため、フィ
ルタ係数W1は、スピーカ130からオーディオ音が出
力され、マイクロホン140からアンプ42、アナログ
−デジタル変換器44、遅延素子46を経由して演算部
54に至るまでの音響系に対応する伝達特性を模擬した
ものとなる。したがって、適応フィルタ50から出力さ
れるオーディオ音信号と遅延素子46から出力される検
出信号に含まれるオーディオ音成分は、位相および振幅
がほぼ同じとなり、演算部54によって2つの信号の差
分を求めることにより、オーディオ音を除去して、操作
音声のみを抽出することができる。
【0027】上述した音量調整部122が減衰手段に、
オーディオ音除去部40がオーディオ音除去手段に、ミ
ュート処理部30が利得設定手段に、操作部80が選択
手段にそれぞれ対応している。
【0028】本実施形態の音声入力装置100はこのよ
うな構成を有しており、次に、オーディオ音除去部40
によるオーディオ音の除去動作と並行してミュート処理
部30で行われる所定のミュート処理動作について説明
する。なお、以下の説明では、しきい値設定部34にお
いて、しきい値xthr が選択されているものとする。
【0029】図3は、ミュート処理部30の動作手順を
示す図であり、主にミュート量設定部36の動作内容が
説明されている。ミュート量設定部36は、利用者によ
りトークスイッチ70が押下されたか否かを判定してお
り(ステップ100)、トークスイッチ70が押下され
た場合には肯定判断を行って、アナログ−デジタル変換
器32から出力されるデジタルデータに基づいて、オー
ディオ音信号の信号レベルを取得する(ステップ10
1)。
【0030】次に、ミュート量設定部36は、オーディ
オ音信号の信号レベルが、しきい値設定部34によって
設定されたしきい値xthr よりも大きいか否かを判定す
る(ステップ102)。信号レベルxがしきい値xthr
よりも小さい場合には、ステップ102において否定判
断がなされ、ミュート量設定部36は、音量を低下させ
る処理(ミュート処理)を行わずにステップ100に戻
り、トークスイッチが押下されたか否かの判定以降の動
作を繰り返す。このように、本実施形態では、トークス
イッチ70が押下された場合でも、信号レベルがしきい
値xthr よりも小さい場合、すなわちスピーカ130か
ら出力されるオーディオ音の音量がそれほど大きくなく
音声認識処理に支障をきたさない場合にはミュート処理
を行わないので、不必要にオーディオ音の音量が下げら
れてしまうことがなく、利用者を不快にさせることがな
い。
【0031】また、信号レベルがしきい値xthr よりも
大きい場合には、ステップ102において肯定判断がな
され、ミュート量設定部36は、音量調整部122に対
して、ボリューム値を現在の値より1レベルだけ下げる
ように指示する(ステップ103)。その後、ミュート
量設定部36は、上述したステップ101に戻り、音量
調整部122から出力されるオーディオ音信号の信号レ
ベルがしきい値xthr以下となる(ステップ102にお
いて否定判断がなされる)まで、ステップ101〜10
3の処理を繰り返す。
【0032】図4は、ミュート処理部30によって音量
調整部122のボリューム値を低下させる動作について
説明する図であり、音量調整部122のボリューム値と
音量調整部122から出力されるオーディオ音信号の信
号レベルとの関係の一例が示されている。音量調整部1
22に対して入力されるオーディオ音信号の信号レベル
が一定であるとすると、図4において特性aで示されて
いるように、オーディオ音信号の信号レベルはボリュー
ム値に比例して大きくなる。
【0033】ここで、例えば、現在のボリューム値がV
1 に設定されており、対応する信号レベルが所定のしき
い値xthr より大きい値x1 である場合には、図4にお
いてハッチングが付されている「ミュートあり領域」に
含まれており、ミュート処理部30は、音量調整部12
2から出力されるオーディオ音信号の信号レベルがしき
い値xthr 以下となるように、音量調整部122のボリ
ューム値をV0 まで下げる処理を行う。言い換えれば、
ミュート処理部30は、ボリューム値V1 とボリューム
値V0 の差(V1 −V0 )をミュート量として設定する
ということになる。
【0034】また、図4において特性bで示されている
ように、特性aの場合に比べてボリューム値の変化量に
対する信号レベルの変化量が大きい場合、すなわち、特
性aの場合に比較して信号レベルの大きいオーディオ音
信号が音量調整部122に入力されている場合を考える
と、ミュート処理部30は、音量調整部122から出力
されるオーディオ音信号の信号レベルがしきい値xthr
以下となるように、音量調整部122のボリューム値を
0′ まで下げる処理を行う。
【0035】このように、本実施形態では、音量調整部
122に対して入力されるオーディオ音信号の信号レベ
ルが変動することにより、上述した特性aおよび特性b
の例のようにボリューム値と信号レベルとの関係が変化
した場合にも、音量調整部122から出力されるオーデ
ィオ音信号の信号レベルを所定のしきい値xthr 以下と
するのに必要な最低限のミュート量がミュート処理部3
0によって設定されるので、オーディオ音の音量低下を
必要最小限に抑えることができる。
【0036】このように、本実施形態の音声入力装置1
00は、オーディオ音除去部40により、マイクロホン
140の検出信号に含まれるオーディオ音成分を除去す
る際に、増幅器120内の音量調整部122から出力さ
れるオーディオ音信号の信号レベルが所定のしきい値よ
りも小さい場合にはミュート処理を行わないので、不必
要にオーディオ音の音量が下げられることがなく、聴取
者を不快にさせることがない。また、信号レベルが所定
のしきい値よりも大きい場合には、この信号レベルがし
きい値以下となるようにミュート量を設定しているの
で、オーディオ音の音量低下を必要最小限に抑えること
ができる。したがって、入力音声以外のオーディオ音を
必要以上に断続することなく入力音声を抽出することが
できる。
【0037】なお、本発明は上記実施形態に限定される
ものではなく、本発明の要旨の範囲内において種々の変
形実施が可能である。図5は、変形例の音声入力装置1
00aの構成を示す図である。同図に示す音声入力装置
100aは、基本的に上述した音声入力装置100と同
様の構成を有しており、ミュート処理部30aの構成が
異なっている。以下の説明では、主に相違点について説
明を行う。
【0038】音声入力装置100aに含まれるミュート
処理部30aは、上述した音声入力装置100に含まれ
るミュート処理部30と比較して、アナログ−デジタル
変換器32が省略され、ゲイン設定部37、テーブル格
納部38、乗算部39が追加されている点が異なってい
る。なお、変形例のミュート処理部30aは、アナログ
−デジタル変換器32が省略されており、増幅器120
内の音量調整部122から出力されるオーディオ音信号
を取得することができないため、オーディオ音除去部4
0に含まれるアナログ−デジタル変換器48から出力さ
れるオーディオ音信号(オーディオ装置110から出力
される原信号に対応)に対して、後述するテーブル格納
部38に格納されたデータテーブルに基づいて設定され
るゲイン値を乗算することにより、音量調整部122か
ら出力される減衰後のオーディオ音信号とほぼ等しい信
号レベルを計算によって求めている。
【0039】ゲイン設定部37は、音量調整部122に
設定されているボリューム値を取得し、このボリューム
値とテーブル格納部38に格納されたデータテーブルと
に基づいて、オーディオ音除去部40に含まれるアナロ
グ−デジタル変換器48から出力されるオーディオ音信
号に対して乗算するゲイン値を設定する。
【0040】テーブル格納部38は、ゲイン設定部37
がゲイン値を設定するために必要なデータテーブルを格
納している。図6は、テーブル格納部38に格納される
データテーブルの一例を示す図である。同図に示す「ボ
リューム値」は、音量調整部122のボリューム値を示
しており、その値がV0 、V1 、V2 、……、Vn と設
定されている。また、「ゲイン値」は、設定されたボリ
ューム値にしたがって音量調整部122が実際にオーデ
ィオ音信号を増幅する、あるいは減衰させる際のゲイン
値を表しており、上述したボリューム値V0 、V1 、V
2 、……、Vnに対応してG0 、G1 、G2 、……、Gn
と設定されている。
【0041】具体的には、音量調整部122は、例え
ば、ボリューム値が「V0 」と設定された場合には、オ
ーディオ音信号に対してゲインG0 が設定されて、オー
ディオ音信号を減衰させる。テーブル格納部38は、こ
の音量調整部122における「ボリューム値」と「ゲイ
ン値」の関係を示したデータテーブルを格納している。
したがって、ゲイン設定部37は、音量調整部122か
ら取得したボリューム値に対応するゲイン値をテーブル
格納部38に格納されたデータテーブルから抽出し、こ
のゲイン値を乗算部39に出力する。
【0042】乗算部39は、アナログ−デジタル変換器
48から出力されるオーディオ音信号とゲイン設定部3
7から出力されるゲイン値とを乗算し、乗算結果をミュ
ート量設定部36に出力する。この結果、乗算部39か
らは、音量調整部122から出力されるオーディオ音信
号の信号レベルとほぼ等しい信号レベルを有するオーデ
ィオ音信号が出力されることとなる。したがって、ミュ
ート量設定部36は、乗算部39から出力されるオーデ
ィオ音信号の信号レベルとしきい値設定部34にから出
力されるしきい値とに基づいて、必要なミュート量を設
定する。
【0043】音声入力装置100aはこのような構成を
有しており、次に、オーディオ音除去部40によるオー
ディオ音の除去動作と並行してミュート処理部30aで
行われる所定のミュート処理動作について説明する。
【0044】図7は、ミュート処理部30aの動作手順
を示す図であり、主にミュート量設定部36の動作内容
が説明されている。ミュート量設定部36は、利用者に
よりトークスイッチ70が押下されたか否かを判定して
おり(ステップ200)、トークスイッチ70が押下さ
れた場合には肯定判断を行って、乗算器39から出力さ
れるデジタルデータに基づいて、オーディオ音信号の信
号レベルを取得する(ステップ201)。
【0045】次に、ミュート量設定部36は、オーディ
オ音信号の信号レベルが、しきい値設定部34によって
設定されたしきい値xthr よりも大きいか否かを判定す
る(ステップ202)。信号レベルがしきい値xthr
りも小さい場合には、ステップ102において否定判断
がなされ、ミュート量設定部36は、音量を低下させる
処理(ミュート処理)を行わずにステップ100に戻
り、トークスイッチが押下されたか否かの判定以降の動
作を繰り返す。
【0046】また、信号レベルがしきい値xthr よりも
大きい場合には、ステップ202において肯定判断がな
され、ミュート量設定部36は、音量調整部122に対
して、ボリューム値を現在の値より1レベルだけ低下す
るように指示する(ステップ203)。音量調整部12
2のボリューム値が1レベル下げられると、ゲイン設定
部37は、このボリューム値に対応するゲイン値をテー
ブル格納部38から抽出して乗算部39に出力する(ス
テップ204)。乗算部39からは、ゲイン設定部37
から出力されたゲイン値が乗算されたオーディオ音信号
が出力される(ステップ205)。
【0047】その後、ミュート量設定部36は、上述し
たステップ201に戻り、乗算部39から出力されるオ
ーディオ音信号の信号レベルがしきい値xthr 以下とな
る(ステップ202において否定判断がなされる)ま
で、ステップ201〜205の処理を繰り返す。この結
果、信号レベルをしきい値xthr 以下とするために必要
最低限のミュート量が設定されることとなり、上述した
実施形態と同様に、オーディオ音の音量低下を必要最小
限に抑えることができる。
【0048】このように、変形例の音声入力装置100
aでは、上述した音声入力装置100と比較して、アナ
ログ−デジタル変換器を1つ省略することができ、構成
の簡略化による低コスト化を図ることができる。
【0049】また、上述した各実施形態では、しきい値
設定部34によって設定されるしきい値xthr について
は、音声認識処理において望ましいSN比(音声成分の
パワーPs とオーディオ音成分のパワーPn とのSN
比)の値を15dB、オーディオ音除去部40の除去性
能を−20dBとそれぞれ想定し、10log(Ps
n )=−5dBという関係を満たす場合のオーディオ
音信号の信号レベルをもってしきい値xthr を決定して
いたが、音声認識処理に必要なSN比の値やオーディオ
音除去部40の除去性能が上述した値と異なる場合であ
っても同様な手順によりしきい値xthr を求めることが
できる。
【0050】また、上述した各実施形態では、不特定多
数の利用者を対象とした平均的な音声成分のパワーに対
応した所定のしきい値xthr の他に、声の大きい利用者
を想定したしきい値xthr′ 、および声の小さい利用者
を想定したしきい値xthr″の3種類のしきい値が用意
されてしきい値設定部34に格納されていたが、これに
限定されるものではなく、例えば、平均的な値であるx
thr のみを用いるようにして構成や処理手順の簡略化を
図ってもよく、反対に、3種類以上のしきい値を用意し
て、利用者の声の大きさの個人差により細かく対応でき
るようにしてもよい。
【0051】また、しきい値設定部34において、あら
かじめ用意された3種類のしきい値の中からいずれかを
選択する際に、上述した実施形態では、操作部80を介
して手動により利用者に選択させるようにしていたが、
マイクロホン140から出力される検出信号に基づいて
利用者の声の大きさを判定し、判定結果に基づいて自動
的にしきい値を設定するようにしてもよい。
【0052】また、上述した実施形態では、利用者は、
トークスイッチ70を押下した後に操作音声を発声する
ようにしたが、操作音声の先頭部分を検出する回路を設
けて、この検出信号をミュート量設定部36やLMSア
ルゴリズム処理部52に送るようにしてもよい。
【0053】また、上述した実施形態では、車載用の音
声入力装置について説明したが、音声入力装置の用途は
車載用に限定されず、建物内あるいは屋外で用いるよう
にしてもよい。
【0054】
【発明の効果】上述したように、本発明によれば、入力
されるオーディオ音信号の信号レベルが所定値以下であ
る場合には、入力音声以外のオーディオ音の音量を低下
することなくオーディオ音成分の除去処理が行われ、入
力されるオーディオ音信号の信号レベルが所定値を超え
る場合にも、オーディオ音の音量低下を必要最小限に抑
えながらオーディオ音成分の除去処理が行われるので、
入力音声以外のオーディオ音を必要以上に断続すること
なく入力音声を抽出することができる。
【図面の簡単な説明】
【図1】一実施形態の音声入力装置の構成を示す図であ
る。
【図2】音声入力装置の詳細構成を示す図である。
【図3】ミュート処理部の動作手順を示す図である。
【図4】ミュート処理部によって音量調整部のボリュー
ム値を低下させる動作について説明する図である。
【図5】変形例の音声入力装置の構成を示す図である。
【図6】テーブル格納部に格納されるデータテーブルの
一例を示す図である。
【図7】変形例のミュート処理部の動作手順を示す図で
ある。
【符号の説明】
30、30a ミュート処理部 32、44、48 アナログ−デジタル変換器(AD
C) 34 しきい値設定部 36 ミュート量設定部 37 ゲイン設定部 38 テーブル格納部 39 乗算部 40 オーディオ音除去部 42 アンプ 46 遅延素子 50 適応フィルタ 52 LMSアルゴリズム処理部 54 演算部 70 トークスイッチ 80 操作部 100、100a 音声入力装置 110 オーディオ装置 120 増幅器 122 音量調整部 124 電力増幅部 130 スピーカ 140 マイクロホン 150 音声認識装置

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力されるオーディオ音信号を所定の利
    得で減衰させてスピーカから出力する減衰手段と、 マイクロホンから出力される信号から、この信号に含ま
    れる前記オーディオ音信号に対応する成分を除去するオ
    ーディオ音除去手段と、 前記減衰手段から出力される減衰後の前記オーディオ音
    信号の信号レベルが所定のしきい値以下となるように、
    前記減衰手段の利得を設定する利得設定手段と、 を備えることを特徴とする音声入力装置。
  2. 【請求項2】 請求項1において、 前記利得設定手段は、前記マイクロホンから出力される
    信号に含まれる音声信号と前記オーディオ音信号のパワ
    ーの比が所定値以上となるように前記減衰手段の利得を
    設定することを特徴とする音声入力装置。
  3. 【請求項3】 請求項2において、 音量が異なる複数の入力音声に対応して用意された複数
    の前記しきい値の中からいずれか一つを選択する選択手
    段をさらに備えており、 前記利得設定手段は、前記選択手段によって選択された
    前記しきい値を用いて、前記減衰手段の利得を設定する
    ことを特徴とする音声入力装置。
JP2000043952A 2000-02-22 2000-02-22 音声入力装置 Pending JP2001236090A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000043952A JP2001236090A (ja) 2000-02-22 2000-02-22 音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000043952A JP2001236090A (ja) 2000-02-22 2000-02-22 音声入力装置

Publications (1)

Publication Number Publication Date
JP2001236090A true JP2001236090A (ja) 2001-08-31

Family

ID=18566790

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000043952A Pending JP2001236090A (ja) 2000-02-22 2000-02-22 音声入力装置

Country Status (1)

Country Link
JP (1) JP2001236090A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006195411A (ja) * 2004-12-14 2006-07-27 Alpine Electronics Inc 音声処理装置
JP2006317556A (ja) * 2005-05-10 2006-11-24 Toyota Motor Corp 音声対話装置
JP2009169445A (ja) * 2009-05-07 2009-07-30 Denso Corp 音声認識装置及びカーナビゲーション装置
JP2011045125A (ja) * 2004-12-14 2011-03-03 Alpine Electronics Inc 音声処理装置
JP2012022127A (ja) * 2010-07-14 2012-02-02 Alpine Electronics Inc 音声認識装置
JP2012181374A (ja) * 2011-03-01 2012-09-20 Toshiba Corp テレビジョン装置及び遠隔操作装置
JP2013543712A (ja) * 2010-10-07 2013-12-05 コンサートソニックス・リミテッド・ライアビリティ・カンパニー 音を増強させるための方法及びシステム
CN106856537A (zh) * 2015-12-08 2017-06-16 中移(杭州)信息技术有限公司 一种音量调整方法及装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006195411A (ja) * 2004-12-14 2006-07-27 Alpine Electronics Inc 音声処理装置
JP2011045125A (ja) * 2004-12-14 2011-03-03 Alpine Electronics Inc 音声処理装置
JP4722607B2 (ja) * 2004-12-14 2011-07-13 アルパイン株式会社 音声処理装置
JP2006317556A (ja) * 2005-05-10 2006-11-24 Toyota Motor Corp 音声対話装置
JP2009169445A (ja) * 2009-05-07 2009-07-30 Denso Corp 音声認識装置及びカーナビゲーション装置
JP2012022127A (ja) * 2010-07-14 2012-02-02 Alpine Electronics Inc 音声認識装置
JP2013543712A (ja) * 2010-10-07 2013-12-05 コンサートソニックス・リミテッド・ライアビリティ・カンパニー 音を増強させるための方法及びシステム
JP2012181374A (ja) * 2011-03-01 2012-09-20 Toshiba Corp テレビジョン装置及び遠隔操作装置
US9154848B2 (en) 2011-03-01 2015-10-06 Kabushiki Kaisha Toshiba Television apparatus and a remote operation apparatus
CN106856537A (zh) * 2015-12-08 2017-06-16 中移(杭州)信息技术有限公司 一种音量调整方法及装置
CN106856537B (zh) * 2015-12-08 2019-12-20 中移(杭州)信息技术有限公司 一种音量调整方法及装置

Similar Documents

Publication Publication Date Title
US6529605B1 (en) Method and apparatus for dynamic sound optimization
US9531338B2 (en) Signal processing apparatus, signal processing method, program, signal processing system, and communication terminal
EP1068773B2 (en) Apparatus and methods for combining audio compression and feedback cancellation in a hearing aid
TWI433553B (zh) 行動音訊裝置之自動音量及動態範圍調整及其方法
US7974428B2 (en) Hearing aid with acoustic feedback suppression
US7756280B2 (en) Audio processing system and method for automatically adjusting volume
AU601861B2 (en) Electronic telephone terminal having noise suppression function
JPH06310962A (ja) 自動音量調整装置
JP2011015018A (ja) 自動音量制御装置
JP2016051038A (ja) ノイズゲート装置
US6628788B2 (en) Apparatus and method for noise-dependent adaptation of an acoustic useful signal
US20160381468A1 (en) Method for compressing the dynamics in an audio signal
US20040125962A1 (en) Method and apparatus for dynamic sound optimization
JP2001236090A (ja) 音声入力装置
JPH0968997A (ja) 音声処理方法及び装置
JP5188558B2 (ja) 音声処理装置
EP1275200B1 (en) Method and apparatus for dynamic sound optimization
KR20110007394A (ko) 실시간 하울링 신호 제거 시스템 및 그 방법
JP4999267B2 (ja) 音声入力装置
JP2009015209A (ja) 音声明瞭度改善システム及び音声明瞭度改善方法
JPH03237899A (ja) ハウリング抑制装置
JP2001094370A (ja) 音声入出力方式
JPH08317496A (ja) ディジタル音声信号処理装置
JP4722607B2 (ja) 音声処理装置
JPH0956000A (ja) 補聴器

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060721

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060829