JP2000112500A - 音声入力レベル調整装置 - Google Patents

音声入力レベル調整装置

Info

Publication number
JP2000112500A
JP2000112500A JP10299120A JP29912098A JP2000112500A JP 2000112500 A JP2000112500 A JP 2000112500A JP 10299120 A JP10299120 A JP 10299120A JP 29912098 A JP29912098 A JP 29912098A JP 2000112500 A JP2000112500 A JP 2000112500A
Authority
JP
Japan
Prior art keywords
signal
level
audio
sound
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10299120A
Other languages
English (en)
Inventor
Shingo Kiuchi
真吾 木内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP10299120A priority Critical patent/JP2000112500A/ja
Publication of JP2000112500A publication Critical patent/JP2000112500A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 入力された音声信号の信号レベルを調整する
ことにより、繰り返し入力することなく適正な信号レベ
ルの音声信号を得ることができる音声入力レベル調整装
置を提供する。 【解決手段】 マイクロホン20から出力された音声信
号がレベル変換部30に入力されて、それぞれの信号レ
ベルが異なる3種類の音声信号が生成され、音声蓄積部
40とレベル検出部70のそれぞれに入力される。音声
蓄積部40は、入力された複数の音声信号をデジタルの
音声データに変換した後に格納し、この中から信号レベ
ルが適正範囲に含まれるものがレベル検出部70、適正
信号判定部80およびセレクタ60によって選択され、
出力される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識装置に入
力される音声のレベル調整を行う音声入力レベル調整装
置に関する。
【0002】
【従来の技術】最近の車載用機器、例えばナビゲーショ
ン装置やオーディオに各種の操作指示を与える方法とし
ては、利用者が操作パネルやリモートコントロール(リ
モコン)ユニットに備わった各種のキーを押下する方法
の他に、利用者によって発せられた操作音声の内容を音
声認識装置によって解析する方法がある。音声認識装置
を用いて操作指示を行う場合には、操作キーの配置等を
覚える必要がなく、しかも走行中に車両が振動した状態
でキーの操作を行わないですむため、操作の簡略化が可
能であり、特に最近ではプロセッサの高速化等に伴って
車載用機器についても用いられることが多い。
【0003】
【発明が解決しようとする課題】ところで、上述した音
声認識装置によって正確な音声認識を行おうとすると、
適正な信号レベルを有する音声信号が入力される必要が
ある。しかし、利用者によって発声され、マイクロホン
で集音される音声信号は、信号レベルが過小な場合や過
大な場合があるため、音声認識装置に入力される音声信
号の信号レベルが一定ではなく、適切な信号レベルの音
声信号を入力することは難しいという問題がある。
【0004】例えば、複数個の発光ダイオード(LE
D)を組み合わせて、利用者が自分の発声による音声信
号の信号レベルを目視可能なレベルメータを備えておい
て、利用者自身が音声信号の音声レベルを監視しながら
音声認識用の操作音声を発声する場合が考えられるが、
これでは既に発声した音声信号の信号レベルが適正か否
かがわかるだけであるため、この音声信号の信号レベル
が過小な場合や過大な場合には、同じ操作音声を再度発
声する必要があり、利用者の負担が大きく、使い勝手も
悪い。したがって、同じ操作音声を何度も繰り返して入
力する必要がなく、利用者が発声した音声信号の信号レ
ベルを自動的に調整する装置があれば便利である。
【0005】本発明は、このような点に鑑みて創作され
たものであり、その目的は、入力された音声信号の信号
レベルを調整することにより、繰り返し入力することな
く適正な信号レベルの音声信号を得ることができる音声
入力レベル調整装置を提供することにある。
【0006】
【課題を解決するための手段】上述した課題を解決する
ために、本発明の音声入力レベル調整装置では、入力さ
れた音声信号に対する信号レベルの変換を信号レベル変
換手段によって行うことにより、互いに信号レベルが異
なる複数の音声信号を作成し、適正音声選択手段によっ
てこの中から最適なものを選択しており、繰り返し入力
することなく適正な信号レベルの音声信号を得ることが
できる。
【0007】また、上述したレベル変換手段は、入力さ
れた音声信号に対して増幅を行う増幅手段と減衰を行う
減衰手段とを備えており、適正音声選択手段は、入力さ
れた音声信号そのもの、およびこの音声信号を増幅ある
いは減衰した音声信号の中から最も音声認識に適したも
のを選択することが好ましい。利用者が発声した音声が
小さすぎる場合にはこれを増幅したものを用い、反対に
利用者が発声した音声が大きすぎる場合にはこれを減衰
させたものを用いることができるため、常に音声認識に
適した信号レベルの音声信号を得ることができる。
【0008】また、上述した適正音声選択手段は、レベ
ル変換手段から出力された複数の音声信号のそれぞれを
蓄積する音声蓄積手段と、レベル変換手段から出力され
た複数の音声信号のそれぞれの信号レベルを検出するレ
ベル検出手段と、レベル検出手段によって検出された複
数の信号レベルの中から音声認識に適したものを判定す
る適正信号判定手段と、音声蓄積手段に蓄積されている
複数の音声信号の中から適正信号判定手段によって適正
な信号レベルであると判定されたものを選択して出力す
る出力音声選択手段とを備えることが好ましい。互いに
信号レベルが異なる複数の音声信号を生成して音声蓄積
手段に蓄積しておくことにより、これらの音声信号の中
から音声認識に適した信号レベルを有するものを判定し
た後に読み出して出力することができるため、利用者が
再度の音声入力を行うことなく、適正な信号レベルを有
する音声信号を得ることができる。
【0009】
【発明の実施の形態】以下、本発明を適用した一実施形
態の音声入力レベル調整装置について、図面を参照しな
がら具体的に説明する。
【0010】図1は、本実施形態の音声入力レベル調整
装置の構成を示す図である。図1に示す音声入力レベル
調整装置10は、マイクロホン20によって集音された
音声に対応する音声信号が入力されたときに、この音声
信号の信号レベルを音声認識装置90において行われる
音声認識処理に適した値に調整するためのものであり、
レベル変換部30、音声蓄積部40、セレクタ60、レ
ベル検出部70および適正信号判定部80を含んで構成
されている。
【0011】レベル変換部30は、マイクロホン20か
ら出力される音声信号に対して複数の利得で信号レベル
の増幅および減衰を行うものであり、入力された音声信
号を増幅するために利得が1より大きな増幅器32と、
入力された音声信号を減衰させるために利得が1より小
さな増幅器34とを含んで構成されている。このレベル
変換部30からは、2つの増幅器32、34から出力さ
れる音声信号以外に、マイクロホン20から入力された
音声信号も出力されている。
【0012】音声蓄積部40は、レベル変換部30から
出力される信号レベルの異なる3種類の音声信号を蓄積
するためのものであり、3つのアナログ−デジタル(A
/D)変換器42、44、46と、3つのメモリ52、
54、56とを含んで構成されている。A/D変換器4
2は、レベル変換部30内の増幅器32から出力される
増幅後の音声信号(アナログ信号)を所定ビット長の音
声データ(デジタルデータ)に変換する。同様に、A/
D変換器46は、レベル変換部30内の増幅器34から
出力される減衰後の音声信号を所定ビット長の音声デー
タに変換する。また、A/D変換器44は、マイクロホ
ン20からレベル変換部30に入力されて増幅や減衰さ
れずに出力される音声信号を所定ビット長の音声データ
に変換する。3つのメモリ52、54、56は、それぞ
れに対応したA/D変換器42、44、46から出力さ
れる音声データを格納する。
【0013】セレクタ60は、上述した3つのメモリ5
2、54、56のいずれかに格納されている音声データ
を読み出して出力する。どの音声データを選択的に読み
出すかは、適正信号判定部80から出力される選択指示
信号に基づいて決定される。
【0014】レベル検出部70は、3つのレベルメータ
72、74、76を含んで構成されている。レベルメー
タ72は、レベル変換部30内の増幅器32から出力さ
れる増幅後の音声信号の信号レベルを検出し、この信号
レベルが適正範囲にある場合には適正検出信号を出力す
る。ここで、適正範囲に含まれる音声信号とは、音声認
識装置90において所定の音声認識処理を行った際に音
声の特徴部分が抽出できる程度の音声信号をいい、信号
レベルが小さすぎる場合や信号レベルが大きすぎて信号
が飽和して歪むような場合は該当しない。
【0015】同様に、レベルメータ76は、レベル変換
部30内の増幅器34から出力される減衰後の音声信号
の信号レベルを検出し、この信号レベルが適正範囲にあ
る場合には適正検出信号を出力する。また、レベルメー
タ74は、マイクロホン20からレベル変換部30に入
力されて増幅や減衰されずに出力される音声信号の信号
レベルを検出し、この信号レベルが適正範囲にある場合
には適正検出信号を出力する。
【0016】適正信号判定部80は、レベル検出部70
に含まれる3つのレベルメータ72、74、76の各出
力信号に基づいて、レベル変換部30から出力される3
種類の音声信号の中から信号レベルが適正範囲に含まれ
るものを判定し、この判定結果に対応した選択指示信号
をセレクタ60に送る。上述したように、3つのレベル
メータ72、74、76からはそれぞれに入力される音
声信号が適正範囲に含まれる場合にその旨を示す適正検
出信号が出力されるため、適正信号判定部80は、適正
検出信号が出力されたレベルメータ72〜76に対応す
る音声信号を、適正範囲にあるものとして判定する。
【0017】音声認識装置90は、入力される音声デー
タを分析して所定の音声認識処理を行う。例えば、利用
者が車載用のナビゲーション装置やオーディオ装置に対
する操作音声をマイクロホン20に向かって発声し、信
号レベルが調整された後の音声信号に基づいて得られた
音声データが音声認識装置90に入力される。音声認識
装置90は、この音声データに対して音声認識処理を行
うことにより、利用者が発声した操作音声の内容解析を
行い、解析結果をナビゲーション装置等に送る。
【0018】上述したレベル変換部30がレベル変換手
段に、増幅器32が増幅手段に、増幅器34が減衰手段
に、音声蓄積部40、セレクタ60、レベル検出部7
0、適正信号判定部80が適正音声選択手段に、音声蓄
積部40が音声蓄積手段に、セレクタ60が出力音声選
択手段に、レベル検出部70がレベル検出手段に、適正
信号判定部80が適正信号判定手段にそれぞれ対応す
る。
【0019】本実施形態の音声入力レベル調整装置10
はこのような構成を有しており、次にその動作を説明す
る。ナビゲーション装置等の利用者によって何らかの操
作音声が発せられると、この音声がマイクロホン20に
よって集音され、マイクロホン20からはこの集音され
た操作音声に対応する音声信号が出力される。この音声
信号は、利用者が任意の音量で発声した操作音声に対応
したものであるため、その信号レベルが適正範囲から外
れて、過小であったり、過大であったりする場合があ
る。
【0020】マイクロホン20から出力される音声信号
が入力されると、レベル変換部30は、この入力された
音声信号の他に信号レベルを増幅した音声信号と信号レ
ベルを減衰させた音声信号を生成し、入力された音声信
号を中心とした振幅レベルが異なる3種類の音声信号を
出力する。この3種類の音声信号は、音声蓄積部40に
入力されるとともにレベル検出部70に入力される。
【0021】レベル検出部70は、信号レベルが音声認
識装置90において音声認識処理を行う場合の適正範囲
に含まれるか否かの検出を、3種類の音声信号のそれぞ
れについて行う。適正信号判定部80は、レベル検出部
70による検出結果に基づいて、音声認識処理を行う場
合の適正範囲に含まれる信号レベルを有する音声信号の
判定を行い、その音声信号に対応した音声データの選択
を指示する選択指示信号をセレクタ60に送る。
【0022】一方、音声蓄積部40は、レベル変換部3
0から出力された3種類の音声信号のそれぞれをデジタ
ルの音声データに変換した後にメモリ52、54、56
に格納する。セレクタ60は、これら3つのメモリ5
2、54、56に格納された3種類の音声データの中か
ら、適正信号判定部80から出力された選択指示信号に
よって指定されたものだけを選択的に読み出して出力す
る。したがって、適正な信号レベルを有する音声信号に
対応した音声データが選択され、後段の音声認識装置9
0に入力される。
【0023】このように、本実施形態の音声入力レベル
調整装置10は、マイクロホン20から出力される音声
信号に対して信号レベルを可変した3種類の音声信号を
生成し、この中から音声認識処理に適した信号レベルを
有するものを選択して出力しており、入力された音声信
号の信号レベルが小さすぎたり大きすぎた場合であって
も適宜信号レベルが調整された後の音声データを得るこ
とができる。したがって、音声認識処理に適した信号レ
ベルを有する音声信号が得られるまで繰り返し音声の入
力を行う必要がなく、適正な信号レベルを有する音声信
号を容易に得ることができる。特に、音声認識処理に着
目した場合には、常に適正な信号レベルを有する音声信
号(音声データ)が入力されるため、音声認識処理の効
率を上げることができる。このため、ナビゲーション装
置やオーディオ装置の操作音声をマイクロホン20によ
って集音する場合を考えると、利用者によって発声され
た操作音声の音量が小さい場合や反対に大きい場合であ
っても、1回の発声によって適正な信号レベルに調整し
た後の音声データを得ることができ、音声認識処理を実
行したときの認識率を向上させることができる。
【0024】なお、本発明は上記実施形態に限定される
ものではなく、本発明の要旨の範囲内で種々の変形実施
が可能である。例えば、上述した実施形態では、マイク
ロホン20から入力された音声信号の信号レベルを可変
するために、レベル変換部30内において2つの増幅器
32、34を並列接続するようにしたが、増幅器の接続
形態は適宜変更することができる。例えば、図2に示す
ように、利得が1より小さな増幅器36と利得が1より
大きな増幅器38とを直列に接続してレベル変換部30
Aを構成することにより、信号レベルが異なる3種類の
音声信号を得るようにしてもよい。また、信号レベルを
減衰させる場合に、利得が1より小さな増幅器34、3
8を用いる代わりに、抵抗等で構成された分圧回路を減
衰手段として用いるようにしてもよい。また、レベル変
換部30、30Aにおいて、3つ以上の増幅器を用いた
り、信号の増幅動作および減衰動作のいずれか一方のみ
を行う増幅器のみを組み合わせるようにしてもよい。
【0025】また、上述した実施形態では、レベル変換
部30から出力された3種類のアナログの音声信号を用
いて、レベル検出部70による信号レベルの検出を行っ
たが、音声蓄積部40においてデジタルデータに変換さ
れた後の音声データを用いて信号レベルを検出してもよ
い。
【0026】図3は、音声蓄積部40内の各メモリ5
2、54、56に格納された音声データに基づいて各音
声信号の信号レベルを検出する音声入力レベル調整装置
10Aの構成を示す図である。図3に示す音声入力レベ
ル調整装置10Aは、図1に示した音声入力レベル調整
装置10に対して、レベル変換部30に接続されていた
レベル検出部70を、音声蓄積部40に接続されたレベ
ル検出部70Aに置き換えた構成を有している。
【0027】レベル検出部70Aは、3つの信号レベル
計算部73、75、77を含んで構成されている。信号
レベル計算部73は、音声蓄積部40内のメモリ52に
格納されている音声データを読み出して、この音声デー
タに対応する音声信号の信号レベルを計算し、計算によ
って得られた信号レベルが適正範囲にある場合には適正
検出信号を出力する。同様に、信号レベル計算部75、
77は、音声蓄積部40内のメモリ54、56のそれぞ
れに格納されている音声データを読み出して、それぞれ
の音声データに対応する音声信号の信号レベルを計算
し、計算によって得られた信号レベルが適正範囲にある
場合には適正検出信号を出力する。レベル検出部70A
の後段に接続された適正信号判定部80は、レベル検出
部70Aに含まれる3つの信号レベル計算部73、7
5、77の各出力信号に基づいて、レベル変換部30か
ら出力される3種類の音声信号の中から信号レベルが適
正範囲に含まれるものを判定し、この判定結果に対応し
た選択指示信号をセレクタ60に送る。
【0028】このように、デジタルデータに変換された
後の音声データを用いて各音声信号の信号レベルを検出
することもでき、信号レベルが適正範囲に含まれる音声
信号に対応した音声データがセレクタ60によって選択
され、音声認識装置90に入力される。
【0029】
【発明の効果】上述したように、本発明によれば、入力
された音声信号に対して信号レベルの変換を行うことに
より互いに信号レベルが異なる複数の音声信号を作成
し、この中から最適なものを選択して出力することによ
り、繰り返し入力することなく適正な信号レベルの音声
信号を得ることができる。特に、上述した信号レベルの
変換を信号レベルの増幅と減衰によって行うことによ
り、入力された音声信号の信号レベルが過小な場合と過
大な場合の両方について、適正な信号レベルを有する音
声信号を得ることができる。
【図面の簡単な説明】
【図1】本実施形態の音声入力レベル調整装置の構成を
示す図である。
【図2】図1に示した音声入力レベル調整装置の変形例
を示す図である。
【図3】メモリに格納された音声データに基づいて各音
声信号の信号レベルを検出する音声入力レベル調整装置
の構成を示す図である。
【符号の説明】
10 音声入力レベル調整装置 20 マイクロホン 30 レベル変換部 32、34 増幅器 40 音声蓄積部 42、44、46 A/D変換部 52、54、56 メモリ 60 セレクタ 70 レベル検出部 72、74、76 レベルメータ 80 適正信号判定部 90 音声認識装置

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 音声認識の対象となる音声信号が入力さ
    れ、信号レベルの変換を行うことにより、信号レベルが
    異なる複数の音声信号を出力するレベル変換手段と、 前記レベル変換手段から出力される複数の音声信号の中
    から前記音声認識に適した信号レベルを有するものを選
    択する適正音声選択手段と、 を備えることを特徴とする音声入力レベル調整装置。
  2. 【請求項2】 請求項1において、 前記レベル変換手段は、入力された前記音声信号に対し
    て増幅を行う増幅手段と減衰を行う減衰手段とを備えて
    おり、 前記適正音声選択手段は、入力された前記音声信号の信
    号レベルが前記音声認識に適した信号レベルを有する場
    合にはこの音声信号を選択し、入力された前記音声信号
    の信号レベルが過小である場合には前記増幅手段によっ
    て増幅された音声信号を選択し、入力された前記音声信
    号の信号レベルが過大である場合には前記減衰手段によ
    って減衰された音声信号を選択することを特徴とする音
    声入力レベル調整装置。
  3. 【請求項3】 請求項1または2において、 前記適正音声選択手段は、 前記レベル変換手段から出力された複数の音声信号のそ
    れぞれを蓄積する音声蓄積手段と、 前記レベル変換手段から出力された複数の音声信号のそ
    れぞれの信号レベルを検出するレベル検出手段と、 前記レベル検出手段によって検出された複数の信号レベ
    ルの中から前記音声認識に適したものを判定する適正信
    号判定手段と、 前記音声蓄積手段に蓄積されている複数の音声信号の中
    から、前記適正信号判定手段によって適正な信号レベル
    であると判定されたものを選択して出力する出力音声選
    択手段と、 を備えることを特徴とする音声入力レベル調整装置。
JP10299120A 1998-10-06 1998-10-06 音声入力レベル調整装置 Pending JP2000112500A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10299120A JP2000112500A (ja) 1998-10-06 1998-10-06 音声入力レベル調整装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10299120A JP2000112500A (ja) 1998-10-06 1998-10-06 音声入力レベル調整装置

Publications (1)

Publication Number Publication Date
JP2000112500A true JP2000112500A (ja) 2000-04-21

Family

ID=17868387

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10299120A Pending JP2000112500A (ja) 1998-10-06 1998-10-06 音声入力レベル調整装置

Country Status (1)

Country Link
JP (1) JP2000112500A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004361604A (ja) * 2003-06-04 2004-12-24 Alpine Electronics Inc 音声入力装置および音声認識処理システム
JP2020517204A (ja) * 2017-04-06 2020-06-11 キム, クム チョルKIM, Geum Cheol 広い領域で音を損失なく収集する装置及び使用方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004361604A (ja) * 2003-06-04 2004-12-24 Alpine Electronics Inc 音声入力装置および音声認識処理システム
JP4531350B2 (ja) * 2003-06-04 2010-08-25 アルパイン株式会社 音声入力装置および音声認識処理システム
JP2020517204A (ja) * 2017-04-06 2020-06-11 キム, クム チョルKIM, Geum Cheol 広い領域で音を損失なく収集する装置及び使用方法

Similar Documents

Publication Publication Date Title
US7756280B2 (en) Audio processing system and method for automatically adjusting volume
JPH0758565A (ja) 自動音量制御装置
US9564114B2 (en) Electronic musical instrument, method of controlling sound generation, and computer readable recording medium
US8155327B2 (en) Tone detector and method used in a robot for detecting a tone
JP2000112500A (ja) 音声入力レベル調整装置
JP2008275987A (ja) 音声認識装置および会議システム
JPH06236196A (ja) 音声認識方法および装置
US20070116296A1 (en) Audio processing system and method for hearing protection in an ambient environment
JPS6257040B2 (ja)
US9355648B2 (en) Voice input/output device, method and programme for preventing howling
WO1991000582A1 (fr) Systeme d'evaluation comparative pour l'amelioration de la prononciation
CN110160633B (zh) 一种多声音区域的音频隔离度检测方法及装置
KR100906676B1 (ko) 지능형 로봇의 음성인식장치 및 방법
JP4531350B2 (ja) 音声入力装置および音声認識処理システム
JP6631341B2 (ja) 信号処理装置
JP4255897B2 (ja) 話者認識装置
JPH11126093A (ja) 音声入力調整方法および音声入力システム
US20070076895A1 (en) Audio processing system and method for hearing protection
US20070078648A1 (en) Audio processing system and method for hearing protecting
JPH0675596A (ja) スピーチおよび音響学的現象分析装置
JP2022105372A (ja) 音声応答装置、音声応答方法および音声応答プログラム
KR930006627A (ko) 자동 음량제어방법 및 장치
JP2001215996A (ja) 音声認識装置
JP2019110478A (ja) 通信装置、および音量調整方法
JPS61108212A (ja) 自動音量調整機能付車載周波数特性検出装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050607

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051018