JPS59195290A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS59195290A JPS59195290A JP58068832A JP6883283A JPS59195290A JP S59195290 A JPS59195290 A JP S59195290A JP 58068832 A JP58068832 A JP 58068832A JP 6883283 A JP6883283 A JP 6883283A JP S59195290 A JPS59195290 A JP S59195290A
- Authority
- JP
- Japan
- Prior art keywords
- correction
- speech recognition
- recognition device
- dictionary
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
炎森次I
本発明は、音声認識装置、より詳細には、音声認識装置
における特徴抽出に関する。
における特徴抽出に関する。
側米韮遺
−・般に、音声認識装置においては、音ル信号からその
特徴因子を抽出する際に、音声の生成過程の特徴である
母音の高域周波数成分の減衰を補正し、子音や抽出のむ
ずかしい促 C/Q1つまり/ツ/)や破裂音(/b/
、/p/ 、/l/)の特徴を強調するため抽出の前
処理として周波数補正回路(プリエンファシス回路とも
呼ぶ)を使用する。この回路の特性は約IKHz伺近か
ら約6d B / o c tで高域周波数成分を強調
する特性が−・般的であるが必らずしも聴感特性とは一
致してない。どちらかと2゛えば抽出の容易さはハート
側からの意味合いの強い処理法である。
特徴因子を抽出する際に、音声の生成過程の特徴である
母音の高域周波数成分の減衰を補正し、子音や抽出のむ
ずかしい促 C/Q1つまり/ツ/)や破裂音(/b/
、/p/ 、/l/)の特徴を強調するため抽出の前
処理として周波数補正回路(プリエンファシス回路とも
呼ぶ)を使用する。この回路の特性は約IKHz伺近か
ら約6d B / o c tで高域周波数成分を強調
する特性が−・般的であるが必らずしも聴感特性とは一
致してない。どちらかと2゛えば抽出の容易さはハート
側からの意味合いの強い処理法である。
−力、人間は音の大きさを全可聴周波数帯域に亘′)て
均一に感じているわけではなく、周波数によって感じか
たが異なり、低域周波数と高域周波数では感度が低く2
000〜4000Hz+1近で最も耳の感度が高くなる
所謂等感曲線といわれる特性で受聴している。従って、
認識システムにおいて、特徴抽出部にこの人間の聴感特
性を反映した等感曲線特性を持つ抽出部を使用した方が
より精度よく特徴抽出を行うことができる。
均一に感じているわけではなく、周波数によって感じか
たが異なり、低域周波数と高域周波数では感度が低く2
000〜4000Hz+1近で最も耳の感度が高くなる
所謂等感曲線といわれる特性で受聴している。従って、
認識システムにおいて、特徴抽出部にこの人間の聴感特
性を反映した等感曲線特性を持つ抽出部を使用した方が
より精度よく特徴抽出を行うことができる。
目 的
本発明は、上述の観点よりなされたもので、特に、従来
の周波数補正回路に代って人間の聴感曲線にマツチした
補正回路を用いて、音声の特徴抽出をより人間の聴感特
性を反映して行うことを目的としてなされてものである
。
の周波数補正回路に代って人間の聴感曲線にマツチした
補正回路を用いて、音声の特徴抽出をより人間の聴感特
性を反映して行うことを目的としてなされてものである
。
先−−1
ここでもう少し人間の耳の周波数特性について説明する
。第1図は、フレツチャーマンソンの曲線に代って19
55年にロヒンソンとダツドソンによって発表され国際
的に認められ広く利用されている耳の周波数特性図であ
る。この1木の曲線上の音は全て等しい大きさに聴こえ
ることを表わしており1ooOHzでの音圧レベルをそ
のままフォーンで大きさを表わすことになっている。こ
の曲線から判るように、低曹では中域音に対して大きな
音でないと聴こえず、2000〜4000H2で最も良
く聴こえ、高音でまた曲線はlニー B して聴こえに
くくなる。
。第1図は、フレツチャーマンソンの曲線に代って19
55年にロヒンソンとダツドソンによって発表され国際
的に認められ広く利用されている耳の周波数特性図であ
る。この1木の曲線上の音は全て等しい大きさに聴こえ
ることを表わしており1ooOHzでの音圧レベルをそ
のままフォーンで大きさを表わすことになっている。こ
の曲線から判るように、低曹では中域音に対して大きな
音でないと聴こえず、2000〜4000H2で最も良
く聴こえ、高音でまた曲線はlニー B して聴こえに
くくなる。
第2図は、第1図の耳の周波数特性をもとに決定された
聴感補正特性(所謂A #、1ffilとB特性と呼ば
れる曲線)を示している。この曲線は概略40フオーン
の周波数特性に対するミラー4¥性で会話タイプの音声
レベルを反映している。つまり人間は音声を大凡第2図
の周波数特性を持って受聴している。
聴感補正特性(所謂A #、1ffilとB特性と呼ば
れる曲線)を示している。この曲線は概略40フオーン
の周波数特性に対するミラー4¥性で会話タイプの音声
レベルを反映している。つまり人間は音声を大凡第2図
の周波数特性を持って受聴している。
以ド、に記聴感補正特性を用いて音声の特徴抽出を行う
本発明の実施例について説明する。
本発明の実施例について説明する。
第3図は、本発明の一実施例を説明するための図で、図
中、1は音声信号の入力端子で、1(声イ菖ぢをマイク
ロホン等で収音し適当なレベルに増幅した信号を入力す
る。2は従来のプリエンファシス回路に代る回路で、第
2図に示した聴感補iJE 4¥徴を実現する補正回路
である。3は音声信号からスペクトル包1ti等の特徴
パラメータを抽出する特徴抽出部、4はスイッチ、5は
標憎パラメータを格納する辞書用メモリ一部、6は入力
の特徴パラメータと辞占5に格納された標準パラメータ
との一致度を測定する照合部、7は照合結果に基づいて
入力音声か何であるかを判定する判定部、8は判定結果
の出力端r−で、スイッチ4を辞書5側にして或いは照
合部6側にして人カバターンを辞書に格納し或いは人カ
バターンを認識する。なお。
中、1は音声信号の入力端子で、1(声イ菖ぢをマイク
ロホン等で収音し適当なレベルに増幅した信号を入力す
る。2は従来のプリエンファシス回路に代る回路で、第
2図に示した聴感補iJE 4¥徴を実現する補正回路
である。3は音声信号からスペクトル包1ti等の特徴
パラメータを抽出する特徴抽出部、4はスイッチ、5は
標憎パラメータを格納する辞書用メモリ一部、6は入力
の特徴パラメータと辞占5に格納された標準パラメータ
との一致度を測定する照合部、7は照合結果に基づいて
入力音声か何であるかを判定する判定部、8は判定結果
の出力端r−で、スイッチ4を辞書5側にして或いは照
合部6側にして人カバターンを辞書に格納し或いは人カ
バターンを認識する。なお。
第3図において、3乃至8は単語認識を想定して構成し
たものであるが、これらを音素、単音節のレベル、更に
は、特定、不特定話者に対する認識を行うよう構成する
ことも0工能で、そのようにしても、補正回路2の有効
性が変るものでないことは容易に理解できよう。
たものであるが、これらを音素、単音節のレベル、更に
は、特定、不特定話者に対する認識を行うよう構成する
ことも0工能で、そのようにしても、補正回路2の有効
性が変るものでないことは容易に理解できよう。
第4図は、本発明の他の実施例を示す図で、図中、第3
図と同様の作用をする部分には第3図と場合と同一の参
照番号が伺しである。またスイッチ4以降は第3図と回
しであるので、省略しである。この第4図に示した実施
例は、第3図に示した実施例においては補正回路2が前
処理回路として挿入されていたのに対して、特徴抽出部
が/ヘンドパスフィルタ群で構成されている場合の例で
ある。この第4図に示した実施例おいて、入力音−丁信
号は入力端子1から夫々通過帯域の異なるバンドパスフ
ィルタ9.9・・・に供給され、次段の爪み伺は回路1
0.10・・・で第2図に示した補正特性を持つよう夫
々のフィルタ出力に重み伺けをする。この出力は次段の
マルチプレクサ−及びアナログデジタルコンバータ11
で量子化されて特徴パラメータとされ、以ド、第3図の
場合と同様にして処理される。なお、ここではハードで
構成する例を示したが/へ7トパスフイルタ群をデジタ
ルフィルタで構成する際に各フィルタの重み付は関11
1!(ゲイン関数)としても良いことは容易に理解でき
よう。
図と同様の作用をする部分には第3図と場合と同一の参
照番号が伺しである。またスイッチ4以降は第3図と回
しであるので、省略しである。この第4図に示した実施
例は、第3図に示した実施例においては補正回路2が前
処理回路として挿入されていたのに対して、特徴抽出部
が/ヘンドパスフィルタ群で構成されている場合の例で
ある。この第4図に示した実施例おいて、入力音−丁信
号は入力端子1から夫々通過帯域の異なるバンドパスフ
ィルタ9.9・・・に供給され、次段の爪み伺は回路1
0.10・・・で第2図に示した補正特性を持つよう夫
々のフィルタ出力に重み伺けをする。この出力は次段の
マルチプレクサ−及びアナログデジタルコンバータ11
で量子化されて特徴パラメータとされ、以ド、第3図の
場合と同様にして処理される。なお、ここではハードで
構成する例を示したが/へ7トパスフイルタ群をデジタ
ルフィルタで構成する際に各フィルタの重み付は関11
1!(ゲイン関数)としても良いことは容易に理解でき
よう。
倭−−−ヌ
以にの説明から明らかなように、本発明によると、従来
の音声の生成モデルから高音の減衰分を補正するといっ
たプリエンファシス補正に変って人間の聴感特性に一致
しだ補正特性をもつ補正をするようにしたので、音声の
認識システムをより人間の聴感の判別能力に近い形で実
現することができ、特徴パラメータの抽出精度を向上さ
せることかできる。
の音声の生成モデルから高音の減衰分を補正するといっ
たプリエンファシス補正に変って人間の聴感特性に一致
しだ補正特性をもつ補正をするようにしたので、音声の
認識システムをより人間の聴感の判別能力に近い形で実
現することができ、特徴パラメータの抽出精度を向上さ
せることかできる。
第1図は、耳の周波数特性図、第2図は、聴感補正特性
図、第3図及び第4図は、それぞれ本発明の実施例を示
す構成図である。 ■・・・入力端子、2・・・補正回路、3・・・特徴抽
出部、4・・・スイッチ、5・・・辞書部、6・・・照
合部、7・・・判定部、8・・・出力端子、9・・・バ
ンドパスフィルタ、10・・・重み利は回路、11・・
・マルチプレクサ及びA/D変換器。
図、第3図及び第4図は、それぞれ本発明の実施例を示
す構成図である。 ■・・・入力端子、2・・・補正回路、3・・・特徴抽
出部、4・・・スイッチ、5・・・辞書部、6・・・照
合部、7・・・判定部、8・・・出力端子、9・・・バ
ンドパスフィルタ、10・・・重み利は回路、11・・
・マルチプレクサ及びA/D変換器。
Claims (3)
- (1)音ル信号からその特徴パラメータを抽出して辞書
を構成し、入力音声の入力パラメータと該辞書に格納さ
れた特徴パラメータとを照合して入力音声を認識する音
声認識装置において、人間の聴感補正特性に合致した補
正特性を有する補正手段を用いて音声の特徴パラメータ
を抽出することを特徴とする音声認識装置。 - (2)上記補止手段を特徴抽出の前処理部で構成したこ
とを特徴とする特許請求の範囲第(1)項に記載の音声
認識装置。 - (3)上記補正手段を各バンドバスフィルタの重み付は
関数として特徴抽出部を構成したことを44F徴とする
特許請求の範囲第(1)項に記載の音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58068832A JPS59195290A (ja) | 1983-04-19 | 1983-04-19 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58068832A JPS59195290A (ja) | 1983-04-19 | 1983-04-19 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS59195290A true JPS59195290A (ja) | 1984-11-06 |
Family
ID=13385061
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58068832A Pending JPS59195290A (ja) | 1983-04-19 | 1983-04-19 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59195290A (ja) |
-
1983
- 1983-04-19 JP JP58068832A patent/JPS59195290A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5737719A (en) | Method and apparatus for enhancement of telephonic speech signals | |
US7243060B2 (en) | Single channel sound separation | |
JP2904272B2 (ja) | ディジタル補聴器、及びその補聴処理方法 | |
US4996712A (en) | Hearing aids | |
US10825353B2 (en) | Device for enhancement of language processing in autism spectrum disorders through modifying the auditory stream including an acoustic stimulus to reduce an acoustic detail characteristic while preserving a lexicality of the acoustics stimulus | |
EP1791393A1 (en) | Sound processing apparatus | |
EP2808868A1 (en) | Method of processing a voice segment and hearing aid | |
US10204637B2 (en) | Noise reduction methodology for wearable devices employing multitude of sensors | |
JP3731179B2 (ja) | 補聴器 | |
CN113921026A (zh) | 语音增强方法和装置 | |
EP3748635A1 (en) | Acoustic device and acoustic processing method | |
US7123732B2 (en) | Process to adapt the signal amplification in a hearing device as well as a hearing device | |
JPS59195290A (ja) | 音声認識装置 | |
CN114664322A (zh) | 基于蓝牙耳机芯片的单麦克风助听降噪方法及蓝牙耳机 | |
JPS6257040B2 (ja) | ||
CN112118511A (zh) | 耳机降噪方法、装置、耳机及计算机可读存储介质 | |
US20230290356A1 (en) | Hearing aid for cognitive help using speaker recognition | |
JP2002062886A (ja) | 感度調整機能を有する音声受信装置 | |
JPS59195291A (ja) | 音声認識装置 | |
JP4079478B2 (ja) | 音声信号の処理回路および処理方法 | |
JPH0352638B2 (ja) | ||
WO2020217605A1 (ja) | 音声処理装置 | |
JP2975808B2 (ja) | 音声認識装置 | |
JP3257379B2 (ja) | 話速変換機能付補聴器 | |
JPH048480Y2 (ja) |