JPS61180296A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS61180296A JPS61180296A JP60021063A JP2106385A JPS61180296A JP S61180296 A JPS61180296 A JP S61180296A JP 60021063 A JP60021063 A JP 60021063A JP 2106385 A JP2106385 A JP 2106385A JP S61180296 A JPS61180296 A JP S61180296A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speech recognition
- power
- amplifier
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[発明の技術分野]
本発明は、たとえばマイクロフォンから入力された音声
を認識する音声認識装置に関する。
を認識する音声認識装置に関する。
[発明の技術的背景とその問題点コ
従来、この種の音声認識装置として第2図に示すように
構成されたものがある。すなわち、マイクロフォン1か
ら出力される音声信号を増幅器2で増幅した後、A/D
変換部3でディジタル信号に変換し、このディジタル音
声信号を音声認識部4へ供給することにより、たとえば
複合類似度法などにより音声認識を行なうものである。
構成されたものがある。すなわち、マイクロフォン1か
ら出力される音声信号を増幅器2で増幅した後、A/D
変換部3でディジタル信号に変換し、このディジタル音
声信号を音声認識部4へ供給することにより、たとえば
複合類似度法などにより音声認識を行なうものである。
このような装置では、増幅器2の利得はマニュアルで調
整しなくてはならないが、この方法では使用にあたり細
かい調整が必要となり、しかも音声のダイナミックレン
ジを充分にカバーできずに誤認識を生じるなどの問題が
あった。
整しなくてはならないが、この方法では使用にあたり細
かい調整が必要となり、しかも音声のダイナミックレン
ジを充分にカバーできずに誤認識を生じるなどの問題が
あった。
[発明の目的]
本発明は上記事情に鑑みてなされたもので、その目的と
するところは、音声認識率の向上が図れ、しかも音声信
号増幅用増幅器の細かい利得調整が不要となる音声認識
装置を提供することにある。
するところは、音声認識率の向上が図れ、しかも音声信
号増幅用増幅器の細かい利得調整が不要となる音声認識
装置を提供することにある。
[発明の概要]
本発明は上記目的を達成するために、入力される音声の
ダイナミックレンジに応じて増幅器の利得を制御するよ
うに構成したものである。
ダイナミックレンジに応じて増幅器の利得を制御するよ
うに構成したものである。
[発明の実施例]
以下、本発明の一実施例について図面を参照して説明す
る。
る。
第1図において、11は音声を入力するためのマイクロ
フォンであり、このマイクロフォン11から出力される
音声信号は増幅器12で増幅された後、A/D変換部1
3でディジタル信号に変換される。このディジタル化さ
れた音声信号は、パワー計算部14および音声認識部1
5にそれぞれ供給される。パワー計算部14では、上記
ディジタル音声信号から短時間パワーを計算し、その計
算結果を音声認識部15および増幅器制御部16にそれ
ぞれ供給する。また、音声認識部15では、上記ディジ
タル音声信号とパワー計算部14で計算された短時間パ
ワーにより音声区間を検出するとともに、その区間の音
声を複合類似麿法などにより認識し、それらの結果を増
幅器制御部16に供給する。増幅器制御部16では、パ
ワー計算部14で計算された短時間パワーと音声認識部
15で得られた音声区間および認識結果により音声区間
内の最大パワーを求め、さらに認識結果を加味して増幅
器12の利得を制御する。すなわち、最大パワーが小さ
いときには増幅器12の利得を上げるように、逆に最大
パワーが大き過ぎるときには増幅器12の利得を下げる
ように利得制御信号を出力する。その際、認識結果を考
慮して、たとえば比較的強く発声されるような単語と逆
に比較的弱く発声される単語とに分類し、利得の調整幅
(利得の上げ幅、下げ幅)を細かく処理する。たとえば
「0〜9」の数字では、一般に「ゴ」は強いし、「二」
は弱くなる傾向にある。したがって、たとえば認識結果
が「ゴ」で最大パワーが大きいときは増幅器12の利得
を僅かに下げ、最大パワーが小さいときは利得を大きく
上げる。また、たとえば認識結果が「二」で最大パワー
が大きいときは増幅器12の利得を大きく下げ、最大パ
ワーが小さいときは利得を僅かに上げる。
フォンであり、このマイクロフォン11から出力される
音声信号は増幅器12で増幅された後、A/D変換部1
3でディジタル信号に変換される。このディジタル化さ
れた音声信号は、パワー計算部14および音声認識部1
5にそれぞれ供給される。パワー計算部14では、上記
ディジタル音声信号から短時間パワーを計算し、その計
算結果を音声認識部15および増幅器制御部16にそれ
ぞれ供給する。また、音声認識部15では、上記ディジ
タル音声信号とパワー計算部14で計算された短時間パ
ワーにより音声区間を検出するとともに、その区間の音
声を複合類似麿法などにより認識し、それらの結果を増
幅器制御部16に供給する。増幅器制御部16では、パ
ワー計算部14で計算された短時間パワーと音声認識部
15で得られた音声区間および認識結果により音声区間
内の最大パワーを求め、さらに認識結果を加味して増幅
器12の利得を制御する。すなわち、最大パワーが小さ
いときには増幅器12の利得を上げるように、逆に最大
パワーが大き過ぎるときには増幅器12の利得を下げる
ように利得制御信号を出力する。その際、認識結果を考
慮して、たとえば比較的強く発声されるような単語と逆
に比較的弱く発声される単語とに分類し、利得の調整幅
(利得の上げ幅、下げ幅)を細かく処理する。たとえば
「0〜9」の数字では、一般に「ゴ」は強いし、「二」
は弱くなる傾向にある。したがって、たとえば認識結果
が「ゴ」で最大パワーが大きいときは増幅器12の利得
を僅かに下げ、最大パワーが小さいときは利得を大きく
上げる。また、たとえば認識結果が「二」で最大パワー
が大きいときは増幅器12の利得を大きく下げ、最大パ
ワーが小さいときは利得を僅かに上げる。
このように、入力される音声のダイナミックレンジに応
じて増幅器12の利得を制御することにより、音声のダ
イナミックレンジを充分にカバーでき、したがって音声
のlE[率を著しく向上できる。しかも、従来のような
マニュアル操作による細かい増幅器の利得調整が不要と
なる。
じて増幅器12の利得を制御することにより、音声のダ
イナミックレンジを充分にカバーでき、したがって音声
のlE[率を著しく向上できる。しかも、従来のような
マニュアル操作による細かい増幅器の利得調整が不要と
なる。
[発明の効果]
以上詳述したように本発明によれば、音声認識率の向上
が図れ、しかも音声信号増幅用増幅器の細かい利得調整
が不要となる音声認識装置を提供できる。
が図れ、しかも音声信号増幅用増幅器の細かい利得調整
が不要となる音声認識装置を提供できる。
第1図は本発明の一実施例を示すブロック図、第2図は
従来の音声認識装置を示すブロック図である。 11・・・・・・マイクロフォン、12・・・・・・増
幅器、13・・・・・・A/D変換部、14・・・・・
・パワー計算部、15・・・・・・音声認識部、16・
・・・・・増幅器制御部。
従来の音声認識装置を示すブロック図である。 11・・・・・・マイクロフォン、12・・・・・・増
幅器、13・・・・・・A/D変換部、14・・・・・
・パワー計算部、15・・・・・・音声認識部、16・
・・・・・増幅器制御部。
Claims (4)
- (1)入力される音声信号を増幅する増幅器と、この増
幅器から出力される音声信号をディジタル信号に変換す
るA/D変換手段と、このA/D変換手段から出力され
るディジタル音声信号からパワーを計算するパワー計算
手段と、このパワー計算手段で計算されたパワーと前記
A/D変換手段から出力されるディジタル音声信号によ
り音声区間を検出するとともに、その区間の音声を認識
する音声認識手段と、この音声認識手段で検出された音
声区間およびその認識結果と前記パワー計算手段で計算
されたパワーにより前記増幅器の利得を制御する制御手
段とを具備したことを特徴とする音声認識装置。 - (2)前記入力される音声信号はマイクロフォンから出
力される音声信号である特許請求の範囲第1項記載の音
声認識装置。 - (3)前記音声認識手段は複合類似度法により音声認識
を行なうことを特徴とする特許請求の範囲第1項記載の
音声認識装置。 - (4)前記制御手段は、音声認識手段で検出された音声
区間およびその認識結果とパワー計算手段で計算された
パワーにより音声区間内の最大パワーを求め、さらに認
識結果を加味して増幅器の利得を制御することを特徴と
する特許請求の範囲第1項記載の音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60021063A JPS61180296A (ja) | 1985-02-06 | 1985-02-06 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60021063A JPS61180296A (ja) | 1985-02-06 | 1985-02-06 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61180296A true JPS61180296A (ja) | 1986-08-12 |
Family
ID=12044431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60021063A Pending JPS61180296A (ja) | 1985-02-06 | 1985-02-06 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61180296A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63220198A (ja) * | 1987-03-09 | 1988-09-13 | 日本電気アイシーマイコンシステム株式会社 | 音声分析装置 |
JPWO2010131470A1 (ja) * | 2009-05-14 | 2012-11-01 | シャープ株式会社 | ゲイン制御装置及びゲイン制御方法、音声出力装置 |
-
1985
- 1985-02-06 JP JP60021063A patent/JPS61180296A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63220198A (ja) * | 1987-03-09 | 1988-09-13 | 日本電気アイシーマイコンシステム株式会社 | 音声分析装置 |
JPWO2010131470A1 (ja) * | 2009-05-14 | 2012-11-01 | シャープ株式会社 | ゲイン制御装置及びゲイン制御方法、音声出力装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS6239746B2 (ja) | ||
JPS6329754B2 (ja) | ||
GB1309700A (en) | Speech redognition apparatus | |
JPS61180296A (ja) | 音声認識装置 | |
CA2257461C (en) | Hearing aid with improved percentile estimator | |
JPS6257040B2 (ja) | ||
JP3350106B2 (ja) | 音声認識装置 | |
JPS5872994A (ja) | 信号入力装置 | |
JPH02176796A (ja) | 音声認識装置 | |
JP2000039900A (ja) | 自己診断機能付き音声対話装置 | |
JPS6195398A (ja) | 音声認識装置 | |
JPH0352638B2 (ja) | ||
JPH08250944A (ja) | 自動音量制御方法およびこの方法を実施する装置 | |
JPH048480Y2 (ja) | ||
KR20000047295A (ko) | 음성신호 가공방법 및 가공장치 | |
JPS6367199B2 (ja) | ||
JP2975808B2 (ja) | 音声認識装置 | |
JPS6326880Y2 (ja) | ||
JPS6334477B2 (ja) | ||
JPS63163494A (ja) | インテンシテイ検出装置 | |
JPH0627991A (ja) | 音声認識装置 | |
JPH04340598A (ja) | 音声認識装置 | |
JPH039400A (ja) | 音声認識装置 | |
JPS61175697A (ja) | 文書処理装置における話者音量表示装置 | |
JPS59185394A (ja) | 音声認識装置 |