JPS59123899A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS59123899A JPS59123899A JP23098082A JP23098082A JPS59123899A JP S59123899 A JPS59123899 A JP S59123899A JP 23098082 A JP23098082 A JP 23098082A JP 23098082 A JP23098082 A JP 23098082A JP S59123899 A JPS59123899 A JP S59123899A
- Authority
- JP
- Japan
- Prior art keywords
- formant
- circuit
- filter
- vowels
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〈技術分野〉
本発明は簡易型の音声認識装置に関するものである。
〈従来技術〉
日本語の音声の特徴はすべての音節に母音が付加されて
いるので、限定された文章や単語では、子音を無視して
母音の系列としだときでもかなりの部分が解読できる。
いるので、限定された文章や単語では、子音を無視して
母音の系列としだときでもかなりの部分が解読できる。
母音はエネルギーも大きく、持続時間も長いだめ騒音に
対しても影響が少ない。
対しても影響が少ない。
そのため日本語音声中から母音を正確1て認識すること
は極めて重要である。ところか、母音の認識で重要なホ
ルマントは性別1年令により異なり又連続音声中の母音
は前後の音韻や発声速度によっても異なシ、5母音の範
囲がかなり広がっている。
は極めて重要である。ところか、母音の認識で重要なホ
ルマントは性別1年令により異なり又連続音声中の母音
は前後の音韻や発声速度によっても異なシ、5母音の範
囲がかなり広がっている。
これを考慮に入れると次の2つの方法を考える必要があ
る。
る。
(i) フィルターを多数使用して周波数分解能を上
げる。その上でホルマント周波数の正規化を行なう。こ
の方法は後の処理が複雑になる欠点があるが、ばらつき
の範囲がかなり広くても適用が可能である。
げる。その上でホルマント周波数の正規化を行なう。こ
の方法は後の処理が複雑になる欠点があるが、ばらつき
の範囲がかなり広くても適用が可能である。
(ii)フィルターの周波数範囲を広げて、ばらつきを
吸収する様に考える。
吸収する様に考える。
上記(]1)の方法において統計的な実験の結果、5母
音の識別には5個のフィルターで充分であることかわか
った。1例として下記に示す。
音の識別には5個のフィルターで充分であることかわか
った。1例として下記に示す。
フィルタ一番号 中心周波数(H2) 周波数範囲(
H2)NOl 300 200〜
40ONO2550400〜70O NO3900700〜1,100 NO41,4001,100〜1,60ONO52,0
001,,600〜2,4.00フィルターNOI、N
O2は第1ホルーマント領域、フィルターNO3は第1
又は第2ホルマントの共存領域であり母音により異なる
。フィルターN。
H2)NOl 300 200〜
40ONO2550400〜70O NO3900700〜1,100 NO41,4001,100〜1,60ONO52,0
001,,600〜2,4.00フィルターNOI、N
O2は第1ホルーマント領域、フィルターNO3は第1
又は第2ホルマントの共存領域であり母音により異なる
。フィルターN。
4−、N05H第2ホルマント領域である。
これら5個のフィルターの出力に適当な重み付を行なっ
た後、各フィルター相互勿比較することにより母音を識
別する。これはかなり幅広い範囲にわだり5母音を識別
することができる方式である。しかしながら連続音声中
ではこのような5母音だけでは不充分であり、他の情報
か必要である。
た後、各フィルター相互勿比較することにより母音を識
別する。これはかなり幅広い範囲にわだり5母音を識別
することができる方式である。しかしながら連続音声中
ではこのような5母音だけでは不充分であり、他の情報
か必要である。
〈発明の目的〉
本発明けこのような点に鑑み、上記(11)の方式にお
けるフィルターを用いて効果的に実現できる471テ成
簡単な簡易型の音声認識装置を提供する。
けるフィルターを用いて効果的に実現できる471テ成
簡単な簡易型の音声認識装置を提供する。
〈実施例〉
以下図面に従って本発明の一実施例を説明する。
第1図(は本案音声認識装置の一実施例を示すフロック
図である。
図である。
マイクロホン]により音声信号が入力され、アンプ2に
入る。アンプ2は自動音量調整回路を付加されており、
必要に応じて使用できろ。又このアンプ20周波数特性
は約IKHzから高域強調(+6 dBloct )と
なっている。アンプ2の出力はフィルタ一群3に入力さ
れる。これは上記5個のフィルターでイ16゛成されて
いる。各フィルターNOI〜NO5の出力は包絡線検出
回路4に入、lzられる。この他、包絡線検出回路4に
はプリアンプ2から直4灸入力されるものがあり金側6
個で構成されている。この回路は低域濾波回路を有して
おり20〜5 ’OHzの遮断周波数に設定されている
。包絡線検出回路4の出力は母音・無声子音・無音識別
回路5及びフィルター逆択回路6に入力される。母音・
無声子音・無音識別回路5は包絡線検出回路4の各出力
を相互比較することにより5母音及び無声子音、無音(
結果的に有声子音も含む)を識別する回路であり、識別
状態は3ビツトのデイジタルイ言号として出力される。
入る。アンプ2は自動音量調整回路を付加されており、
必要に応じて使用できろ。又このアンプ20周波数特性
は約IKHzから高域強調(+6 dBloct )と
なっている。アンプ2の出力はフィルタ一群3に入力さ
れる。これは上記5個のフィルターでイ16゛成されて
いる。各フィルターNOI〜NO5の出力は包絡線検出
回路4に入、lzられる。この他、包絡線検出回路4に
はプリアンプ2から直4灸入力されるものがあり金側6
個で構成されている。この回路は低域濾波回路を有して
おり20〜5 ’OHzの遮断周波数に設定されている
。包絡線検出回路4の出力は母音・無声子音・無音識別
回路5及びフィルター逆択回路6に入力される。母音・
無声子音・無音識別回路5は包絡線検出回路4の各出力
を相互比較することにより5母音及び無声子音、無音(
結果的に有声子音も含む)を識別する回路であり、識別
状態は3ビツトのデイジタルイ言号として出力される。
一方フイルター選択回路6は上記の様に5個のフィルタ
ー出力に対応した包絡線検出回路4の各々の出力を二つ
のグループ即ちフィルターNOL。
ー出力に対応した包絡線検出回路4の各々の出力を二つ
のグループ即ちフィルターNOL。
NO2,NO3とフィルター(NO3)、NO4゜N0
5(後者グループのフィルターNO3は、前者グループ
の選択により含めるか又は含めないかが決定される)に
分割して、二つのグループ内での出力最大のフィルター
を選択し、スイッチ回路7を制御することによI)2つ
の入力としてホルマント周波数遷杉部分検出回路8に入
力される。
5(後者グループのフィルターNO3は、前者グループ
の選択により含めるか又は含めないかが決定される)に
分割して、二つのグループ内での出力最大のフィルター
を選択し、スイッチ回路7を制御することによI)2つ
の入力としてホルマント周波数遷杉部分検出回路8に入
力される。
即ちフィルターNOI、NO2,NO3を第1ホルマン
ト頭域、フィルターNO3,No4゜N05i第2ホル
マント領域として2つのグループ分けを行ない、第1ホ
ルマント領域のフィルター3個の中で最大出力を示すフ
ィルターを選択する。もし最大出力がフィルターNO3
でなければNO3を含む第2ホルマント領域のフィルタ
ー3個の中で最大出力を出すフィルターを選択する。
ト頭域、フィルターNO3,No4゜N05i第2ホル
マント領域として2つのグループ分けを行ない、第1ホ
ルマント領域のフィルター3個の中で最大出力を示すフ
ィルターを選択する。もし最大出力がフィルターNO3
でなければNO3を含む第2ホルマント領域のフィルタ
ー3個の中で最大出力を出すフィルターを選択する。
もし第1ホルマント領域のフィルターでNo3か最大値
を示す場合は、第2ホルマント領域id 1’J O4
、NO5から出力の大きい方を選択すふ。以上の方法に
より有効に第1及び第2ホルマントが存在するフィルタ
ーを自動的に選択できる。
を示す場合は、第2ホルマント領域id 1’J O4
、NO5から出力の大きい方を選択すふ。以上の方法に
より有効に第1及び第2ホルマントが存在するフィルタ
ーを自動的に選択できる。
このフィルターの出力は零交差計数回路に入力され、そ
の出力の時間的変化が観測される。この出力が第1及び
第2ホルマント周波数を推定していることも実験的にも
知られている。従ってこの零交差数の時間的変化はホル
マントのトランジェント部分を表現しているため定常母
音からの時間変化の特徴をとり、定常母音に入る前のホ
ルマントのトランジェントを「入シわたシ」、定常母音
ノ後ノホルマントトランジエントの「出わタリ」であシ
、音節や子音・母音・子音連鎖として特徴が表われる。
の出力の時間的変化が観測される。この出力が第1及び
第2ホルマント周波数を推定していることも実験的にも
知られている。従ってこの零交差数の時間的変化はホル
マントのトランジェント部分を表現しているため定常母
音からの時間変化の特徴をとり、定常母音に入る前のホ
ルマントのトランジェントを「入シわたシ」、定常母音
ノ後ノホルマントトランジエントの「出わタリ」であシ
、音節や子音・母音・子音連鎖として特徴が表われる。
第2図はホルマント周波数遷移部分検出回路8を示すも
の(第1ホルマント部、第2ホルマント部も同じ)であ
シ、選択されたフィルター出力はまず零交差計数回路8
aに入力される。これは一定時間(約10m5)の時間
内で音声波形が零を何度横切るかを計数する回路である
。その次段にそれらの計数結果を一時記憶する回路8b
があり(約200m5)、これに接続された判定回路8
Cによって、その範囲内での計数の変化度合により定常
句音と遷移部分の判定を行々い、さらに変化の度合、方
向、変化時間等の特徴を抽出することにより子音部と匂
音部の「わたり」の特徴を抽出する。
の(第1ホルマント部、第2ホルマント部も同じ)であ
シ、選択されたフィルター出力はまず零交差計数回路8
aに入力される。これは一定時間(約10m5)の時間
内で音声波形が零を何度横切るかを計数する回路である
。その次段にそれらの計数結果を一時記憶する回路8b
があり(約200m5)、これに接続された判定回路8
Cによって、その範囲内での計数の変化度合により定常
句音と遷移部分の判定を行々い、さらに変化の度合、方
向、変化時間等の特徴を抽出することにより子音部と匂
音部の「わたり」の特徴を抽出する。
このホルマント周波数遷移部分検出回路8の出力と母音
・無声子音・無音識別回路5の出力は識別単位判定回路
9に入力される。これにより母音。
・無声子音・無音識別回路5の出力は識別単位判定回路
9に入力される。これにより母音。
無声子音、無音と有声ヅ子音叉はホルマント遷移部分等
から識別単位を選び決定する。識別単位標準パターン記
憶回路10はこれら識別単位の特徴パターンを予じめ記
憶し、ホルマント周波数遷移部分検出回路8の出力及び
母音・無声子音・無音識別回路5の出力と照合され識別
単位を選択する。
から識別単位を選び決定する。識別単位標準パターン記
憶回路10はこれら識別単位の特徴パターンを予じめ記
憶し、ホルマント周波数遷移部分検出回路8の出力及び
母音・無声子音・無音識別回路5の出力と照合され識別
単位を選択する。
識別単位判定回路9の出力は識別系列照合回路11に入
力される。照合される標準パターンは多数のサンプルか
ら統計的に決定されたものをメモリー回路12に記憶し
ている。そして判別回路13によって、認識すべき音声
の識別系列の相互比較により最も類似した識別系列を選
択し、連続音声中の5母音を判定認識する。1 なお、以上の装置は汎用の8ビツトマイクロコンピユー
タ等により構成することも可能である。
力される。照合される標準パターンは多数のサンプルか
ら統計的に決定されたものをメモリー回路12に記憶し
ている。そして判別回路13によって、認識すべき音声
の識別系列の相互比較により最も類似した識別系列を選
択し、連続音声中の5母音を判定認識する。1 なお、以上の装置は汎用の8ビツトマイクロコンピユー
タ等により構成することも可能である。
〈発明の効果〉
以上のように本発明は、5個のフィルター回路を用いて
有効に連続音声中の5母音を認識できるものであり、装
置としても簡単である。また、フィルター出力の相互比
較によシ予じめ第1及び第2ホルマントが存在するフィ
ルターを選択し、それに零交差計数回路を接続すること
により、耐雑音性のあるホルマント推定が可能であり、
又時間分解能の優れた方式が複合され有用である。
有効に連続音声中の5母音を認識できるものであり、装
置としても簡単である。また、フィルター出力の相互比
較によシ予じめ第1及び第2ホルマントが存在するフィ
ルターを選択し、それに零交差計数回路を接続すること
により、耐雑音性のあるホルマント推定が可能であり、
又時間分解能の優れた方式が複合され有用である。
第1図は本発明の一実施例を示すプロ・ツク図、第2図
は第1図の要部を詳細に示すブロック図である。 3・・フィルタ一群、4・・包絡線検出回路、5・・・
母音・無声子音・無音識別回路、6・・・フィルター選
択回路、7 ・スイッチ回路、8 ・ホルマント周波数
遷移部分検出回路、9・・識別単位判定回路、lO・・
・識別単位標準パターン記憶回路、11 識別系列照合
回路、12・メモリー回路、13 判定回路。 代理人 弁理士 福 士 愛 彦(他2名)785− −786− 手続補正書 昭和584■4 月ψ日 41イ1−庁長官殿 (41°許庁 殿)1、中fi
の表示 特;(イ1昭57−230980 2、発明の名称 音声認識装置 3、補正をする者 中外との関係 特γ(出Jj+j人4、代 理 人 イ1 所 曇545大阪山阿倍野シ長池町22番22
5シ自 発 6、補正の対象 2!1′”f rj’F 、清水の範囲1;3’r、’
]ポルマント領域及び第2ポルマント領域を含む5飼
のフィルターl]11路をi1’iiえ、該5個のフィ
ルクー回路の出力の什11.比1Kにより、5ノー1音
1.1jjli声子−高、前高等を識別する丁段、及0
’;)’;1ホルマントと第2ポルマントか存在するO
i+記フィルター回路を選択してでれそれ零交差口数に
よりホルマン1−11′・1波I11.6移)11;分
を検出する手段と、 i’jil 記5 tj−7S、;1!!E 7jj−
r音、無iff !:’jノ識別出力とrii+記ホル
マンlノgA波数、代襲部分のj・7j出出力により識
別ア1j位をl’=lj定する・「1ヒ之と、該1″、
11定した識別中イダlのil’sj系列力・ら理続高
声の:rlJ定認識する手段 とを設けてなることを4.l、徴とするv′1声認識装
置1ノ1′。
は第1図の要部を詳細に示すブロック図である。 3・・フィルタ一群、4・・包絡線検出回路、5・・・
母音・無声子音・無音識別回路、6・・・フィルター選
択回路、7 ・スイッチ回路、8 ・ホルマント周波数
遷移部分検出回路、9・・識別単位判定回路、lO・・
・識別単位標準パターン記憶回路、11 識別系列照合
回路、12・メモリー回路、13 判定回路。 代理人 弁理士 福 士 愛 彦(他2名)785− −786− 手続補正書 昭和584■4 月ψ日 41イ1−庁長官殿 (41°許庁 殿)1、中fi
の表示 特;(イ1昭57−230980 2、発明の名称 音声認識装置 3、補正をする者 中外との関係 特γ(出Jj+j人4、代 理 人 イ1 所 曇545大阪山阿倍野シ長池町22番22
5シ自 発 6、補正の対象 2!1′”f rj’F 、清水の範囲1;3’r、’
]ポルマント領域及び第2ポルマント領域を含む5飼
のフィルターl]11路をi1’iiえ、該5個のフィ
ルクー回路の出力の什11.比1Kにより、5ノー1音
1.1jjli声子−高、前高等を識別する丁段、及0
’;)’;1ホルマントと第2ポルマントか存在するO
i+記フィルター回路を選択してでれそれ零交差口数に
よりホルマン1−11′・1波I11.6移)11;分
を検出する手段と、 i’jil 記5 tj−7S、;1!!E 7jj−
r音、無iff !:’jノ識別出力とrii+記ホル
マンlノgA波数、代襲部分のj・7j出出力により識
別ア1j位をl’=lj定する・「1ヒ之と、該1″、
11定した識別中イダlのil’sj系列力・ら理続高
声の:rlJ定認識する手段 とを設けてなることを4.l、徴とするv′1声認識装
置1ノ1′。
Claims (1)
- 【特許請求の範囲】 1、第1ホルマント領域及び第2ホルマン)領域を含む
5個のフィルター回路を備え、 該5個のフィルター回路の出力の相互比較により、5母
音、無声子音、無音等を識別する手段、及び第1ホルマ
ントと第2ホルマントが存在する前記フィルター回路を
選択してそれぞれ零交差計数によりホルマント周波数遷
移部分を検出する手段と、 前記5母音、無声子音、無音等の識別出力と前記ホルマ
ント周波数遷移部分の検出出力により識別単位を判定す
る手段と、 該判定した識別単位の時系列から連続音声の5母音の判
定認識する手段 とを設けてなることを特徴とする音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23098082A JPS59123899A (ja) | 1982-12-29 | 1982-12-29 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23098082A JPS59123899A (ja) | 1982-12-29 | 1982-12-29 | 音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS59123899A true JPS59123899A (ja) | 1984-07-17 |
JPS6334479B2 JPS6334479B2 (ja) | 1988-07-11 |
Family
ID=16916333
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP23098082A Granted JPS59123899A (ja) | 1982-12-29 | 1982-12-29 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59123899A (ja) |
-
1982
- 1982-12-29 JP JP23098082A patent/JPS59123899A/ja active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS6334479B2 (ja) | 1988-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0222398B2 (ja) | ||
Sethu et al. | Speaker normalisation for speech-based emotion detection | |
JPS5944639B2 (ja) | 音声による異同認識方式における標準パタ−ン更新方法 | |
JPS58130393A (ja) | 音声認識装置 | |
JPS5862699A (ja) | 音声認識装置 | |
Nwe et al. | Singing voice detection in popular music | |
CN116665649A (zh) | 基于韵律特征的合成语音检测方法 | |
Jayanna et al. | Fuzzy vector quantization for speaker recognition under limited data conditions | |
JPS60181798A (ja) | 音声認識装置 | |
JPS59123899A (ja) | 音声認識装置 | |
JPS5972500A (ja) | 音声認識方式 | |
Aye | Speech recognition using Zero-crossing features | |
Niederjohn et al. | Computer recognition of the continuant phonemes in connected English speech | |
Deshmukh et al. | Automatic recognition of class variants of Marathi consonants | |
JPS63213899A (ja) | 話者照合方式 | |
JPS59170894A (ja) | 音声区間の切り出し方式 | |
JP2844592B2 (ja) | 離散単語音声認識装置 | |
JP2891259B2 (ja) | 音声区間検出装置 | |
JP2658426B2 (ja) | 音声認識方法 | |
JPS59176794A (ja) | 単語音声認識装置 | |
JPS61292699A (ja) | 音声通過フイルタ | |
Undhad et al. | Exploiting speech source information for vowel landmark detection for low resource language | |
Zalewski | Text dependent speaker recognition in noise. | |
JPS61116400A (ja) | 音声情報処理装置 | |
JPS59105700A (ja) | 音声認識方式 |