JP2001094370A - 音声入出力方式 - Google Patents
音声入出力方式Info
- Publication number
- JP2001094370A JP2001094370A JP27220999A JP27220999A JP2001094370A JP 2001094370 A JP2001094370 A JP 2001094370A JP 27220999 A JP27220999 A JP 27220999A JP 27220999 A JP27220999 A JP 27220999A JP 2001094370 A JP2001094370 A JP 2001094370A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- sound
- audio
- output
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Control Of Amplification And Gain Control (AREA)
Abstract
発声のしにくさを改善することができる音声入出力方式
を提供すること。 【解決手段】 オーディオ音と周辺ノイズと利用者の発
声音声とが同時に音響空間内に存在する場合に、マイク
ロホン110の出力信号から、演算部20によって利用
者の発声のエコー成分を除去し、演算部22によってオ
ーディオ信号に対応する成分を除去し、周辺ノイズ除去
部30によって周辺ノイズを除去することにより、利用
者の発声音声のみが抽出される。ラウドネス補償演算部
40によって、周辺ノイズ等の音圧レベルを考慮したゲ
インを算出し、発声音声の各周波数帯域の信号レベルを
音声補正用フィルタ42で補正した後にスピーカ120
から出力することにより、利用者は自分が発声した音声
の内容を明瞭に聴くことができる。
Description
音した音声に所定の処理を加えて音声認識装置等に出力
する音声入出力方式に関する。
置やオーディオ機器等の車載用機器においては、各種の
操作指示を入力する方法として、利用者が操作パネルや
リモートコントロールユニットに備えられた各種キーを
押下する方法が従来から汎用されているが、最近では、
利用者によって発せられた操作音声の内容を音声認識す
ることによって操作指示入力を行う方法が用いられてい
る。音声認識装置を用いて操作指示を行う場合には、操
作キーの配置等を覚える必要がなく、しかも走行中に車
両が振動した状態でキーの操作を行わないですむため、
操作の簡略化が可能であり、最近では車載用機器に対す
る操作方法として用いられることが多くなっている。
の内容を認識させる場合に、認識率を低下させる要因と
して代表的なものには、ロードノイズやエンジンノイズ
等の走行に伴って生じる車室内の周辺ノイズと、車室内
にオーディオ装置から出力されるオーディオ音とがあ
る。これらの周辺ノイズやオーディオ音が、利用者が発
声する操作音声に重畳した場合、音声認識装置ではこれ
らの入力音声から利用者の操作音声のみを区別して音声
認識を行うことが困難となり、認識率が低下する。この
ため、従来は、適応マイクロホンアレイ技術を用いてロ
ードノイズを低減させたり、トークスイッチが押下され
たときにオーディオ音の出力を中断したり、あるいは音
量を下げるなどして、音声認識の対象である利用者の操
作音声に重畳される各種のノイズやオーディオ音を低減
する工夫が行われている。
辺ノイズやオーディオ音が大きい場合には、利用者が発
声した操作音声は、マスキング効果によってかき消され
てしまって利用者自身が自分の発声した操作音声を確認
できない場合がある。このため、利用者は自分がどのよ
うに発声しているのかを認識できず、不安定な発音とな
って発声しにくくなるという問題がある。この場合に
は、当然ながら、音質や音量が不安定な音声が音声認識
装置に入力されることになるため、認識率の低下を招く
という問題もある。
オーディオ音の出力を中断したり音量を下げることで、
この問題点をある程度改善することができるが、ロード
ノイズ等が大きい場合もあるため、トークスイッチでは
完全な対策とは言えない。また、トークスイッチを用い
てオーディオ音の出力を中断したり音量を下げる場合に
は、操作音声の出力が頻繁になると、オーディオ音の出
力が断続的になり、利用者によるオーディオ音の聴取を
妨げるという新たな問題が生じる。特に、操作音声を発
声することにより車載用機器の操作を行っている利用者
以外の搭乗者においては、こうした操作とは無関係にオ
ーディオ音を聴取している場合もあるため、聴取してい
るオーディオ音が頻繁に断続すると不快であり、認識対
象となる入力音声以外の出力音を断続することなく操作
音声のみを抽出することができる音声入出力方式が望ま
れている。
たものであり、その目的は、周囲のノイズ等が大きい場
合の利用者による発声のしにくさを改善することができ
る音声入出力方式を提供することにある。
音声を抽出することにより、この音声に対して音声認識
を行う際の認識率を向上させることができる音声入出力
方式を提供することにある。
ために、本発明の音声入出力方式では、周辺ノイズ、オ
ーディオ音、利用者による発声音声のそれぞれが存在す
る音響空間内の所定位置にスピーカと集音手段とが設置
されており、集音手段の出力信号の中からノイズ除去手
段によって周辺ノイズに対応する成分を除去するととも
に、オーディオ音除去手段によってオーディオ音に対応
する成分を除去している。そして、集音手段の出力信号
からこれらの各成分が除去された後の発声音声に対応す
る成分に対して音声補正手段によってゲイン補正を行
い、このゲイン補正後の発声音声をスピーカから音響空
間内に放出する。集音手段によって集音された信号の中
から利用者の発声音声に対応した成分のみを抽出し、こ
れにゲイン補正を行った後にスピーカから出力してお
り、利用者は、自分の発声内容をオーディオ音等の大き
さにかかわらず常に確認することができるため、発声の
しにくさを改善することができる。
ズおよびオーディオ音の音圧レベルと、発声音声の音圧
レベルとに基づいて、周辺ノイズおよびオーディオ音の
音圧レベルによらずに、スピーカから出力される発声音
声が明瞭に聞き取れるように、発声音声の各周波数帯域
毎の補正ゲインをゲイン算出手段によって算出し、この
補正ゲインに基づく補正をゲイン補正手段によって行う
ことが望ましい。どの程度ゲインを補正した場合に明瞭
に音声が聞き取れるかは、全周波数領域で一律に決まる
ものではなく、周辺ノイズやオーディオ音あるいは発声
音声の各周波数成分毎に異なるため、各周波数成分毎に
補正ゲインを算出してゲイン補正を行うことにより、ス
ピーカからより明瞭な音声を出力することができる。
れらの各成分が除去された後の発声音声信号を用いて、
音声認識手段による音声認識処理を行うことが望まし
い。集音手段によって集音された音声にオーディオ音や
周辺ノイズが含まれている場合であっても、利用者の発
声音声のみを音声認識手段に入力することができるた
め、音声認識処理を行う際の認識率を高めることができ
る。また、利用者の発声のしにくさが改善されており、
利用者は、安定した発声を行うことができるため、音声
の調子等が発声の都度異なるといったことがなく、この
ような発声音声を用いて音声認識処理を行うことによっ
てさらに認識率を高めることができる。
態の音声入出力装置について、図面を参照しながら説明
する。
した第1の実施形態の音声入出力装置の構成を示す図で
ある。同図に示す音声入出力装置100は、マイクロホ
ン110によって集音された各種の音声の中から利用者
の発声音声のみを抽出して音声認識装置200に向けて
出力するとともに、この発声音声に対してゲイン補正を
行った後にスピーカ120から出力する。この音声入出
力装置100は、適応フィルタ10、フィルタ12、演
算部20、22、周辺ノイズ除去部30、ラウドネス補
償演算部40、音声補正用フィルタ42、音声合成部5
0、アンプ52を含んで構成されている。
伝達特性を模擬するためのものであり、フィルタ係数
(タップ係数)W1を有するFIR型のデジタルフィル
タであって、オーディオ装置300から入力されるオー
ディオ音信号に対して所定の適応等化処理を行う。この
フィルタ係数W1は、LMS(Least Mean Square)ア
ルゴリズムによって、演算部22から出力される差分信
号(後述する)のパワーが最小となるように更新され
る。フィルタ12は、適応フィルタ10と同様に車室内
の音響空間の伝達特性を模擬するためのものであり、フ
ィルタ係数W2を有している。フィルタ係数W2は、所
定のタイミングで適応フィルタ10のフィルタ係数W1
がコピーされる。
信号とフィルタ12の出力信号とが入力され、これら2
つの信号の差分を演算する。また、演算部22は、演算
部20から出力される差分信号と適応フィルタ10の出
力信号とが入力されており、これら2つの信号の差分を
演算する。
2から出力された差分信号に含まれる周辺ノイズに対応
する成分を除去する。この周辺ノイズ除去部30から
は、マイクロホン110から出力される信号に含まれる
利用者の発声音声に対応する成分のみが抽出されて出力
される。利用者の音声を抽出する詳細動作については後
述する。
音信号および周辺ノイズ信号と利用者の発声音声信号と
が入力されており、これらの信号に基づいて、利用者の
発声音声をスピーカ120から出力する際に必要な補正
ゲインを算出する。音声補正用フィルタ42は、ラウド
ネス補償演算部40によって算出された補正ゲインに基
づいて、周辺ノイズ除去部30から出力される音声信号
に対するゲイン補正を行う。ラウドネス補償演算部40
および音声補正用フィルタ42の詳細構成については後
述する。
2によって所定のゲイン補正がなされた後の音声信号
と、オーディオ装置300から入力されたオーディオ音
信号とを合成する。音声合成部50から出力される合成
信号は、アンプ52で増幅された後、スピーカ120か
ら車室内に出力される。
に、周辺ノイズ除去部30がノイズ除去手段に、適応フ
ィルタ10、演算部22がオーディオ音除去手段に、ラ
ウドネス補償演算部40、音声補正用フィルタ42が音
声補正手段に、アンプ52が音声出力手段に、ラウドネ
ス補償演算部40がゲイン算出手段に、音声補正用フィ
ルタ42がゲイン補正手段に、音声認識装置200が音
声認識手段にそれぞれ対応する。
ような構成を有しており、次にその動作を説明する。
ディオ音信号は、適応フィルタ10に入力されるととも
に、音声合成部50、アンプ52を介してスピーカ12
0から車室内に出力される。このスピーカ120から出
力されたオーディオ音は、利用者の発声音声を聴取可能
な所定位置に設定されたマイクロホン110によって集
音されるため、マイクロホン110から出力されて演算
部20を介して演算部22の一方の入力端に入力される
信号にはオーディオ音に対応する成分が含まれている。
また、このオーディオ音は、車室内に出力された後にマ
イクロホン110で集音されたものであるため、車室内
の音響空間の伝達特性が反映されたものである。
が反映されたオーディオ音に対応する成分が含まれるマ
イクロホン110の出力信号と、オーディオ装置300
から直接入力されたオーディオ音信号を適応フィルタ1
0に通した後の信号との差分を演算部22で演算し、こ
の差分信号のパワーが最小となるように適応フィルタ1
0のフィルタ係数W1を更新することにより、このフィ
ルタ係数W1は車室内の音響空間の伝達特性を模擬した
ものとなる。すなわち、演算部22の一方の入力端に入
力される信号には、オーディオ装置300から出力され
て実際の車室内の音響空間に出力されたオーディオ音に
対応する成分が含まれており、他方の入力端に入力され
る信号には、この音響空間の特性を模擬した適応フィル
タ10を通した後のオーディオ音に対応する成分が含ま
れることになり、演算部22によってこれらの差分を演
算することにより、オーディオ音に対応する成分が除去
される。また、演算部22の後段には周辺ノイズ除去部
30が配置されており、演算部22の出力信号に含まれ
る周辺ノイズが除去される。
2によってオーディオ音に対応する成分が除去され、さ
らに周辺ノイズ除去部30によって周辺ノイズに対応す
る成分が除去される。したがって、利用者の発声音声
と、スピーカ120から出力されるオーディオ音と、走
行雑音やエンジン雑音等の周辺ノイズとが同時にマイク
ロホン110によって集音された場合であっても、これ
らが重畳されたマイクロホン110の出力信号の中から
オーディオ音と周辺ノイズに対応する成分が除去され、
周辺ノイズ除去部30からは、利用者の発声音声に対応
する成分のみを出力することができる。このため、音声
認識装置200では、利用者の発声音声のみに対して音
声認識処理を行うことができ、認識率を高めることがで
きる。
は、利用者の周囲がオーディオ音や周辺ノイズの存在に
よって騒がしい場合であって、自分が発声した音声を直
接聴取できないために、発声が不安定になることを防止
するために、利用者の音声を拡声してスピーカ120か
ら出力する機能を有しており、次にその詳細について説
明する。
ス補償演算部40は、次に説明する原理に基づいて、ス
ピーカ120から出力する利用者の発声音声に対して各
周波数成分の信号レベルを調整するために必要な最適な
ゲインを算出する。
人間が聞いたときに感じる音の大きさ(ラウドネス)と
の対応関係(ラウドネス曲線)を示す図である。同図に
おいて、横軸は音圧レベル(単位:dB−SPL)、縦
軸は人間が感じる音の大きさを示すラウドネス(単位:
sone)であり、曲線は静寂下でのラウドネス曲
線、曲線は騒音下でのラウドネス曲線である。ただ
し、曲線は騒音レベルに応じて変化するものである。
れば、人間は同じ大きさの音であると感じる。したがっ
て、例えば、人間が0.1soneの大きさに感じる音
は、静寂下では約12dB−SPLの音圧レベルである
が、曲線に示す騒音下では約37dB−SPLの音圧
レベルの音である。すなわち静寂下で約12dB−SP
Lで出力していた音を曲線の騒音下で同じ大きさに感
じるには約37dB−SPLの音を出力する必要があ
り、約25dBのゲインを加える必要があるということ
である。また、人間が1soneの大きさに感じる音
は、静寂下では約42dB−SPLの音圧レベルの音で
あるが、曲線の騒音下では約49dB−SPLの音圧
レベルであるため、騒音下では約7dBのゲインを加え
てやる必要がある。したがって、同じ騒音下でも、出力
される音の音圧レベルに応じて加えるゲインを変更する
必要があるということである。
さの音に感じるために、静寂下の音圧レベルに対してど
れだけゲインを加える必要があるかを示す図である。同
図において、横軸は静寂下で出力される音の音圧レベル
であり、縦軸は騒音下において静寂下と同じ大きさの音
に感じるために加える必要があるゲイン値である。例え
ば、静寂下で音圧レベル20dBで出力される音は、騒
音下では、約19dBのゲインを加えられることによっ
て、人間は静寂下と同じ大きさの音であると感じるよう
になる。
様々な騒音レベルにおける図3に示すような音声信号の
音圧レベル(周辺ノイズ除去部30から出力される利用
者の発声による音声の音圧レベル)と加えるゲインとの
関係(以下、ゲインテーブルと呼ぶ)を内部のメモリに
格納しており、入力されるオーディオ音信号と周辺雑音
信号に基づいて、最適なゲインテーブルを選択し、この
選択したゲインテーブルと周辺ノイズ除去部14から出
力される音声信号とに基づいて、最適なゲインを算出す
る。ラウドネス補償演算部40は、この算出されたゲイ
ンを音声補正用フィルタ42に出力して音声信号に対し
て最適なゲインを与える。
は、様々な周波数成分を有しており、その周波数成分ご
とに音圧レベルが異なっている。したがって、利用者が
発声した音声をスピーカ120から出力しようとした場
合に、この音声の聴き取りやすさが出力音声の音圧レベ
ルだけでなく、オーディオ音や周辺雑音の各周波数成分
の音圧レベルによっても異なるという不均衡が生じる。
また、オーディオ音や周辺雑音の各周波数成分はそれら
の高周波成分の発声音声に対してマスキング効果を及ぼ
すため、このことも考慮する必要がある。
適なゲインを与えることが望ましい。すなわち、音声信
号とオーディオ音信号および周辺雑音信号のそれぞれを
所定の周波数帯域に分割して、各周波数帯域ごとにオー
ディオ音信号・周辺雑音信号の周波数成分に基づいて最
適なゲインテーブルを選択し、この選択したゲインテー
ブルと音声信号の周波数成分とに基づいて最適なゲイン
を算出することが望ましい。
構成を示す図である。同図に示すようにラウドネス補償
演算部40は、周波数帯域レベル平均部410、ラウド
ネス算出部412、周波数帯域ゲインテーブル選択部4
14、周波数帯域レベル平均部418、ゲインテーブル
416を含んで構成されている。
ィルタ10から入力されるオーディオ音信号と演算部2
2から入力される周辺ノイズ信号(以下、雑音等と呼
ぶ)に対して、所定の時間ブロックごとに周知のFFT
(Fast Fourier Transform)演算を行い、所定の周波数
帯域ごとに音圧レベルの平均を計算する。雑音等は、例
えば人間の聴覚がほぼ1/3オクターブごとに音の大き
さの違いを認識することができるという特性を考慮して
1/3オクターブごとに周波数分割される。
者が発声すると、演算部22から出力される差分信号に
はこの利用者の発声に対応する成分も含まれるため、利
用者が発声を開始する直前に演算部22から出力される
周辺ノイズ信号のみをラウドネス補償演算部40におい
て取り込むようにする。例えば、トークスイッチを設け
ておいて、利用者に発声する直前にこのトークスイッチ
を押下させるようにすればよい。
ckerのラウドネス算出手法(ISO 532B)やStev
ensのラウドネス算出手法(ISO 532A)を用いて、周
波数帯域レベル平均部410から周波数帯域ごとに出力
される雑音等の音圧レベルを調整する。具体的には、以
下のように調整を行う。すなわち、ある周波数成分の雑
音等があるとき、この雑音等は、同一の周波数成分の発
声音声の聴き取りにくさに影響するのみならず、マスキ
ング効果により高周波側に隣接する周波数成分の発声音
声の聴き取りにくさにも影響を与える。ラウドネス算出
部412は、これを考慮して、雑音等の各周波数成分の
音圧レベルを低周波側に隣接する雑音等の周波数成分の
音圧レベルの大きさに応じて調整を行う。すなわち、隣
接する低周波成分の音圧レベルが大きい場合には、高周
波側に隣接する周波数成分の音圧レベルを高めに補正す
る。このような調整を行うことで、各周波数帯域毎のゲ
インテーブルを選択する際には、対応する各周波数帯域
の雑音等の音圧レベルに着目するのみで足り、低周波側
に隣接する周波数帯域の雑音等を考慮するという煩雑な
処理を行う必要がなくなる。
は、ラウドネス算出部412から出力される調整後の周
波数帯域ごとの雑音等の音圧レベルに基づいて、周波数
帯域ごとに最適なゲインテーブル416を選択する。
イズ除去部30から入力される発声音声信号に対して、
短時間のブロックごとに周知のFFT演算を行い、所定
の周波数帯域ごとに音圧レベルの平均を計算する。発声
音声信号は、雑音等と同様の周波数帯域に分割される。
周波数帯域レベル平均部418から出力される周波数帯
域ごとに分割された発声音声信号は、周波数帯域ゲイン
テーブル選択部414によって選択されたゲインテーブ
ル416に入力され、各周波数帯域ごとに適切なゲイン
値が算出される。
の周波数帯域に分割することによって、各周波数帯域ご
とにゲインテーブルを選択して発声音声信号に最適なゲ
インを加えることが可能となる。
周波数帯域レベル平均部410および418を用いて発
声音声信号や雑音等の周波数帯域ごとの音圧レベルの平
均を求めたが、これらの周波数帯域レベル平均部の代わ
りにフィルタバンクとブロック平均部を用いて周波数帯
域毎の音圧レベルの平均を求めるようにしてもよい。
補正用フィルタ42の詳細について説明する。音声補正
用フィルタ42は、上述したラウドネス補償演算部40
で算出されたゲイン特性を修正(ゲインの加算)できる
ものであればよいため、様々な構成が考えられるが、そ
の一例として以下の3通りの構成について説明する。
用いた音声補正用フィルタ42の構成を示す図である。
同図に示す音声補正用フィルタ42は、フィルタバンク
420、可変ゲイン部422、加算器424を含んで構
成されている。
域幅を持つバンドパスフィルタ群であり、これらのバン
ドパスフィルタ群によって発声音声信号を周波数帯域ご
とに分割する。可変ゲイン部422は、ラウドネス補償
演算部40によって算出された各周波数帯域ごとのゲイ
ンを、フィルタバンク420から出力される周波数帯域
ごとに分割された発声音声信号の音圧レベルに与えて、
ゲイン調整を行う。加算器424は、各周波数帯域ごと
にゲイン調整された発声音声信号を足し合わせて出力し
て、所望のゲイン補正を実現する。この構成によれば、
アナログ回路で安価に音声補正用フィルタ42を構成す
ることができる。
いた音声補正用フィルタ42の構成を示す図である。同
図に示す音声補正用フィルタ42は、スプライン関数補
間部430、IFFT演算部432、FIRフィルタ4
34を含んで構成されている。
ス補償演算部40によって算出された各周波数帯域のゲ
インをそれぞれの周波数帯域の中心周波数のゲインとし
て、それぞれのゲイン値の間を周知のスプライン関数を
用いて補間することによって周波数領域における滑らか
なゲイン特性を得る。IFFT演算部432は、スプラ
イン関数補間部430から出力されるゲイン特性を周知
のIFFT(InverseFast Fourier Transform)演算を
用いて周波数領域から時間領域に変換し、FIRフィル
タ434のタップ係数の値を設定する。FIRフィルタ
434は、発声音声信号に対して時間軸上のフィルタリ
ング処理を行い、所望のゲイン補正を実現する。この構
成によれば、直線位相フィルタを実現することができ、
発声音声信号に対する補正は、周波数帯域ごとではな
く、周波数成分ごとに行うことが可能となる。
補正用フィルタ42の構成を示す図である。同図に示す
音声補正用フィルタ42は、スプライン関数補間部44
0、FFT演算部442、周波数帯域フィルタリング部
444、IFFT演算部446を含んで構成されてい
る。
ス補償演算部40によって算出された各周波数帯域のゲ
インをそれぞれの周波数帯域の中心周波数のゲインとし
て、それぞれのゲイン値の間を周知のスプライン関数を
用いて補間することによって周波数領域における滑らか
なゲイン特性を得る。FFT演算部442は、発声音声
信号に対してFFT演算を行い、時間領域から周波数領
域に変換する。周波数帯域フィルタリング部444は、
FFT演算部442から出力される周波数領域における
発声音声信号に対して、スプライン関数補間部440か
ら出力される滑らかなゲイン特性によってフィルタリン
グを行い、IFFT演算部446は、周波数帯域フィル
タリング部444から出力される周波数領域における発
声音声に対してIFFT演算を行って周波数領域から時
間領域に変換して、所望のゲイン補正を実現する。IF
FT演算の過程においては、線形フィルタリングを実現
するために周知の重畳加算法(overlap-add method)や
重畳保留法(overlap-savemethod )を用いるとよい。
この構成によって、フィルタのタップ数が多いときでも
演算量を比較的少なくすることができる。
42においては、いずれの場合もゲインが急激に変化す
ると出力波形が不連続になってしまうため、 G(n)=αG(n−1)+βGm を用いて、ゲイン特性を徐々に更新することが好まし
い。ここで、G(n)は時間nにおけるゲイン特性、G
(n−1)は時間n−1におけるゲイン特性、Gmはラ
ウドネス補償演算部40やスプライン関数補間部43
0、440によって算出されたゲイン特性である。α、
βは係数でα+β=1になる関係がある。
100では、ラウドネス補償算出部40および音声補正
用フィルタ42を用いることにより、周辺ノイズ除去部
30から出力される発声音声信号をスピーカ120から
出力した際に、同じ車室内の音響空間に出力されたオー
ディオ音や周辺ノイズの音圧レベルに関係なく、発声音
声が常に良好に聴取可能なように各周波数帯域のゲイン
調整が行われる。したがって、利用者は、自分の発声内
容を確認しながら発声を継続することができるため、発
声のしにくさを改善することができる。このため、常に
安定した状態で各種の操作音声等を発声することがで
き、音声認識装置200に入力される音声信号の状態も
安定するようになるため、さらに音声認識処理の認識率
を高めることができる。
した第2の実施形態の音声入出力装置の構成を示す図で
ある。なお、本実施形態の音声入出力装置100Aの構
成において、図1に示した第1の実施形態の音声入出力
装置100の構成と同じ動作を行うものについては同じ
符号を付し、詳細な説明は省略する。
00Aは、図1に示した第1の実施形態の音声入出力装
置100の機能に加えて、ナビゲーション装置(図示せ
ず)等から出力された案内音声の明瞭度を増す補正を行
う機能を有する。この音声入出力装置100Aは、適応
フィルタ10、フィルタ12、演算部20、22、周辺
ノイズ除去部30、ラウドネス補償演算部40、音声補
正用フィルタ42、44、音声合成部50、アンプ5
2、トークスイッチ60、スイッチ70、72、74、
76を含んで構成されている。
能を切り替えるために、利用者自身によって操作され
る。例えば、利用者が何らかの操作音声を発声しようと
してトークスイッチ60を操作すると、この操作に応じ
た切替信号が4つのスイッチ70〜76に送られる。
それぞれに入力される信号を、トークスイッチ60から
入力される切替信号の有無に応じて選択的に出力する。
具体的には、スイッチ70の一方の入力端子には周辺ノ
イズ除去部30の出力信号が入力され、他方の入力端子
にはナビゲーション装置(図示せず)等から出力される
案内音声信号が入力されている。トークスイッチ60が
操作されて切替信号が出力されると、一方の入力端子側
の接続状態が有効になり、以後周辺ノイズ除去部30か
ら出力される信号がスイッチ70を介してフィルタ12
および音声補正用フィルタ42に入力される。また、ト
ークスイッチ60が操作されない状態においては、他方
の入力端子側の接続状態が有効になり、ナビゲーション
装置等から入力される案内音声信号がスイッチ70を介
してフィルタ12および音声補正用フィルタ42に入力
される。なお、図1に示した音声入出力装置100に比
べてフィルタ12の配置が異なっているが、基本的な動
作に違いはなく、このフィルタ12によって、スピーカ
120から出力されてマイクロホン110に回り込んで
集音される発声音声のエコー成分が除去される。
周辺ノイズ除去部30の出力信号が入力され、他方の入
力端子には音声補正用フィルタ44の出力信号が入力さ
れている。トークスイッチ60が操作されて切替信号が
出力されると、一方の入力端子側の接続状態が有効にな
り、以後周辺ノイズ除去部30から出力された信号がス
イッチ72を介してラウドネス補償演算部40に入力さ
れる。また、トークスイッチ60が操作されない状態に
おいては、他方の入力端子の接続状態が有効になり、音
声補正用フィルタ44の出力信号がスイッチ72を介し
てラウドネス補償演算部40に入力される。なお、音声
補正用フィルタ44は、ラウドネス補償演算部40によ
ってゲインが設定された音声補正用フィルタ42の特性
をコピーしたものである。
ッチ60から出力される切替信号の有無に応じて、オン
状態とオフ状態が切り替えられる。スイッチ74は、ト
ークスイッチ60が操作されて切替信号が出力されると
オン状態になり、適応フィルタ10から出力される信号
を演算部22およびラウドネス補償演算部40に向けて
出力する。また、スイッチ76は、トークスイッチ60
が操作されず、切替信号が出力されないときにオン状態
になり、演算部22から出力される信号をラウドネス補
償演算部40に向けて出力する。
が出力された場合の各スイッチ70〜76の接続状態
は、上述した第1の実施形態の音声入出力装置100と
基本的に同じであり、マイクロホン110の出力信号に
含まれるオーディオ音に対応する成分と、周辺ノイズに
対応する成分とが除去されて、利用者の発声音声に対応
する成分のみが音声認識装置200に向けて出力され
る。また、この利用者の発声音声は、音声補正用フィル
タ42を通すことにより所定のゲイン補正が行われた後
にアンプ52によって増幅され、スピーカ120から出
力されるため、利用者は、自分の発声内容を確認しなが
ら発声を継続することができ、発声のしにくさを改善す
ることができる。
と、スイッチ76がオフ状態になって、演算部22から
出力される信号(周辺ノイズ信号)がラウドネス補償演
算部40に入力されないことになるが、ラウドネス補償
演算部40では、スイッチ76がオフ状態になる直前に
入力された周辺ノイズ信号を用いてその後のゲイン算出
を行っている。特に、周辺ノイズについては、短時間で
のパワーの変動が少ないと考えられるため、このように
しても実用上支障はない。
状態においては、ナビゲーション装置等から入力された
案内音声信号がスイッチ70、フィルタ12、音声補正
用フィルタ44、スイッチ72を介してラウドネス補償
演算部40に入力されるとともに、演算部22から出力
される周辺ノイズ信号およびオーディオ音信号がスイッ
チ76を介してラウドネス補償演算部40にそれぞれ入
力される。ラウドネス補償演算部40は、入力されるそ
れぞれの信号に基づいて音声補正用フィルタ42のゲイ
ンを設定する。したがって、ナビゲーション装置等から
入力された案内音声は、スピーカ120から出力した際
に、同じ車室内の音響空間に出力されたオーディオ音や
周辺ノイズの音圧レベルに関係なく、常に良好に聴取可
能なように各周波数帯域のゲイン調整が行われる。この
ため、利用者は、オーディオ音や周辺ノイズが大きい場
合であっても、スピーカ120から出力される案内音声
の内容を明瞭に聴取することができる。
ものではなく、本発明の要旨の範囲内において種々の変
形実施が可能である。例えば、上述した実施形態では、
車載用の音声入出力装置について説明したが、音声入出
力装置の用途は車載用に限定されず、建物内あるいは屋
外で用いるようにしてもよい。
手段によって集音された信号の中から利用者の発声音声
に対応した成分のみを抽出し、これにゲイン補正を行っ
た後にスピーカから出力しており、利用者は、自分の発
声内容をオーディオ音等の大きさにかかわらず常に確認
することができるため、発声のしにくさを改善すること
ができる。
オーディオ音や周辺ノイズが含まれている場合であって
も、利用者の発声音声のみを抽出することができるため
音声認識処理を行う際の認識率を高めることができる。
特に、利用者の発声のしにくさが改善されており、利用
者は、安定した発声を行うことができるため、音声の調
子等が発声の都度異なるといったことがなく、このよう
な発声音声を用いて音声認識処理を行うことによってさ
らに認識率を高めることができる。
図である。
る音の大きさとの対応関係を示す図である。
るために、静寂下の音圧レベルに対してどれだけゲイン
を加える必要があるかを示す図である。
る。
用フィルタの構成を示す図である。
用フィルタの構成を示す図である。
タの構成を示す図である。
図である。
Claims (3)
- 【請求項1】 周辺ノイズ、オーディオ音、利用者によ
る発声音声のそれぞれが存在する音響空間内の所定位置
に設置されたスピーカおよび集音手段と、 前記集音手段の出力信号の中から前記周辺ノイズに対応
する成分を除去するノイズ除去手段と、 前記集音手段の出力信号の中から前記オーディオ音に対
応する成分を除去するオーディオ音除去手段と、 前記集音手段の出力信号の中から、前記ノイズ除去手段
によって前記周辺ノイズに対応する成分が除去され、前
記オーディオ音除去手段によって前記オーディオ音に対
応する成分が除去された後の前記発声音声に対応する成
分に対して所定のゲイン補正を行う音声補正手段と、 前記音声補正手段によってゲイン補正が行われた後の前
記発声音声を前記スピーカから前記音響空間内に放出す
る音声出力手段と、 を備えることを特徴とする音声入出力方式。 - 【請求項2】 請求項1において、 前記音声補正手段は、 前記周辺ノイズおよび前記オーディオ音の音圧レベル
と、前記発声音声の音圧レベルとに基づいて、前記周辺
ノイズおよび前記オーディオ音の音圧レベルによらず
に、前記スピーカから出力される前記発声音声が明瞭に
聞き取れるように、前記発声音声の複数に分割された周
波数帯域毎の補正ゲインを算出するゲイン算出手段と、 前記発声音声に対して前記ゲイン算出手段によって算出
された前記補正ゲインに基づくゲイン補正を行うゲイン
補正手段と、 を備えることを特徴とする音声入出力方式。 - 【請求項3】 請求項1または2において、 前記集音手段の出力信号の中から、前記ノイズ除去手段
によって前記周辺ノイズに対応する成分が除去され、前
記オーディオ音除去手段によって前記オーディオ音に対
応する成分が除去された後の前記発声音声に対応する成
分のみが入力される音声認識手段を備えることを特徴と
する音声入出力方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27220999A JP3822397B2 (ja) | 1999-09-27 | 1999-09-27 | 音声入出力方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27220999A JP3822397B2 (ja) | 1999-09-27 | 1999-09-27 | 音声入出力方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001094370A true JP2001094370A (ja) | 2001-04-06 |
JP3822397B2 JP3822397B2 (ja) | 2006-09-20 |
Family
ID=17510638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP27220999A Expired - Fee Related JP3822397B2 (ja) | 1999-09-27 | 1999-09-27 | 音声入出力方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3822397B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003264627A (ja) * | 2002-03-11 | 2003-09-19 | Alpine Electronics Inc | 通話音声処理装置 |
JP2004085963A (ja) * | 2002-08-28 | 2004-03-18 | Alpine Electronics Inc | ナビゲーション音声補正装置 |
JP2007019595A (ja) * | 2005-07-05 | 2007-01-25 | Alpine Electronics Inc | 車載オーディオ処理装置 |
JP2007288565A (ja) * | 2006-04-18 | 2007-11-01 | Alpine Electronics Inc | 車載機 |
JP2008219240A (ja) * | 2007-03-01 | 2008-09-18 | Yamaha Corp | 放収音システム |
KR20160147556A (ko) * | 2015-06-15 | 2016-12-23 | 엘지전자 주식회사 | 영상표시장치의 동작 방법 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58205397A (ja) * | 1982-05-26 | 1983-11-30 | Nippon Hoso Kyokai <Nhk> | 場内拡声装置におけるハウリング防止方法 |
JPS60239199A (ja) * | 1984-05-14 | 1985-11-28 | Nec Corp | 拡声装置 |
JPH02244099A (ja) * | 1989-03-16 | 1990-09-28 | Aisin Seiki Co Ltd | 音声信号処理装置 |
JPH04235600A (ja) * | 1991-01-11 | 1992-08-24 | Clarion Co Ltd | 適応型フィルタを用いた雑音除去装置 |
JPH05259779A (ja) * | 1992-03-12 | 1993-10-08 | Mitsubishi Electric Corp | 自動音量調整装置 |
JPH11166835A (ja) * | 1997-12-03 | 1999-06-22 | Alpine Electron Inc | ナビゲーション音声補正装置 |
JP2000231399A (ja) * | 1999-02-10 | 2000-08-22 | Oki Electric Ind Co Ltd | 騒音低減装置 |
-
1999
- 1999-09-27 JP JP27220999A patent/JP3822397B2/ja not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58205397A (ja) * | 1982-05-26 | 1983-11-30 | Nippon Hoso Kyokai <Nhk> | 場内拡声装置におけるハウリング防止方法 |
JPS60239199A (ja) * | 1984-05-14 | 1985-11-28 | Nec Corp | 拡声装置 |
JPH02244099A (ja) * | 1989-03-16 | 1990-09-28 | Aisin Seiki Co Ltd | 音声信号処理装置 |
JPH04235600A (ja) * | 1991-01-11 | 1992-08-24 | Clarion Co Ltd | 適応型フィルタを用いた雑音除去装置 |
JPH05259779A (ja) * | 1992-03-12 | 1993-10-08 | Mitsubishi Electric Corp | 自動音量調整装置 |
JPH11166835A (ja) * | 1997-12-03 | 1999-06-22 | Alpine Electron Inc | ナビゲーション音声補正装置 |
JP2000231399A (ja) * | 1999-02-10 | 2000-08-22 | Oki Electric Ind Co Ltd | 騒音低減装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003264627A (ja) * | 2002-03-11 | 2003-09-19 | Alpine Electronics Inc | 通話音声処理装置 |
JP2004085963A (ja) * | 2002-08-28 | 2004-03-18 | Alpine Electronics Inc | ナビゲーション音声補正装置 |
JP2007019595A (ja) * | 2005-07-05 | 2007-01-25 | Alpine Electronics Inc | 車載オーディオ処理装置 |
JP4549243B2 (ja) * | 2005-07-05 | 2010-09-22 | アルパイン株式会社 | 車載オーディオ処理装置 |
JP2007288565A (ja) * | 2006-04-18 | 2007-11-01 | Alpine Electronics Inc | 車載機 |
JP2008219240A (ja) * | 2007-03-01 | 2008-09-18 | Yamaha Corp | 放収音システム |
KR20160147556A (ko) * | 2015-06-15 | 2016-12-23 | 엘지전자 주식회사 | 영상표시장치의 동작 방법 |
KR102454761B1 (ko) * | 2015-06-15 | 2022-10-13 | 엘지전자 주식회사 | 영상표시장치의 동작 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP3822397B2 (ja) | 2006-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4583781B2 (ja) | 音声補正装置 | |
CN108275159B (zh) | 语音界面和声乐娱乐系统 | |
CN106664473B (zh) | 信息处理装置、信息处理方法和程序 | |
JP3777904B2 (ja) | ユーザーの聴力に従ってデジタル入力信号を調整するデジタル電話 | |
JP3505085B2 (ja) | オーディオ装置 | |
US20120278070A1 (en) | Combined microphone and earphone audio headset having means for denoising a near speech signal, in particular for a " hands-free" telephony system | |
JP2002051392A (ja) | 車内会話補助装置 | |
EP1858295A1 (en) | Equalization in acoustic signal processing | |
US10997983B2 (en) | Speech enhancement device, speech enhancement method, and non-transitory computer-readable medium | |
JPH11166835A (ja) | ナビゲーション音声補正装置 | |
JP2004333704A (ja) | 音声認識装置および方法 | |
CN111391771B (zh) | 噪音处理的方法、装置及系统 | |
JP3822397B2 (ja) | 音声入出力方式 | |
JP2000148200A (ja) | 音声入力装置 | |
JP2002247699A (ja) | ステレオ音響信号処理方法及び装置並びにプログラム及び記録媒体 | |
JP5188558B2 (ja) | 音声処理装置 | |
RU2589298C1 (ru) | Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке | |
JPH0787587A (ja) | 車載用音響信号処理装置 | |
JP3958009B2 (ja) | 音声認識装置 | |
JPH05175772A (ja) | 音響再生装置 | |
JP5359744B2 (ja) | 音処理装置及びプログラム | |
JP2009015209A (ja) | 音声明瞭度改善システム及び音声明瞭度改善方法 | |
JP2001024459A (ja) | オーディオ装置 | |
JP4230301B2 (ja) | 音声補正装置 | |
JP4515731B2 (ja) | 音声補正装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20041126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041207 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060620 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060622 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100630 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110630 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120630 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120630 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130630 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130630 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140630 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |