JPS63798B2 - - Google Patents
Info
- Publication number
- JPS63798B2 JPS63798B2 JP53109596A JP10959678A JPS63798B2 JP S63798 B2 JPS63798 B2 JP S63798B2 JP 53109596 A JP53109596 A JP 53109596A JP 10959678 A JP10959678 A JP 10959678A JP S63798 B2 JPS63798 B2 JP S63798B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- speech
- dictionary
- partial
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000007781 pre-processing Methods 0.000 description 7
- 238000000034 method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Description
【発明の詳細な説明】
本発明は音声認識装置に係り、特に音韻レベル
で音声を認識する音声認識装置に関する。
で音声を認識する音声認識装置に関する。
従来より知られている音声認識は、主としてパ
ターンマツチング法がとられており、第1図はそ
の構成を示す図である。本図において入力音声は
前処理回路1に供給され、この前処理回路1で雑
音除去、エンフアシスなどの処理を行つた後、チ
ヤンネルフイルタ2で音声のスペクトル包絡を抽
出し、辞書3とのマツチング度を類似度計算回路
4で計算し、たとえば類似度が最大の辞書パター
を入力音声と判定する。類似度の計算としては、
入力音声パターンと辞書パターンとのユークリツ
ド距離、内積などが用いられる。
ターンマツチング法がとられており、第1図はそ
の構成を示す図である。本図において入力音声は
前処理回路1に供給され、この前処理回路1で雑
音除去、エンフアシスなどの処理を行つた後、チ
ヤンネルフイルタ2で音声のスペクトル包絡を抽
出し、辞書3とのマツチング度を類似度計算回路
4で計算し、たとえば類似度が最大の辞書パター
を入力音声と判定する。類似度の計算としては、
入力音声パターンと辞書パターンとのユークリツ
ド距離、内積などが用いられる。
また別の判定方式として、類似度が一定値以下
のときはリジエクトとし、判定を行わないという
方法も知られている。
のときはリジエクトとし、判定を行わないという
方法も知られている。
このように従来の方式はパターンマツチング法
によつて入力音声を判定するものであるが、上記
2つの判定方式のうち前者は判定誤りが多く、ま
た後者はリジエクトの割合が大きくなるという問
題があり、特に音韻認識については十分な識別率
が得られないという問題がある。すなわち従来の
音声認識はパターンマツチング、すなわち識別の
基準となる辞書パターンの中から入力音声が何で
あるかを判定する方式であるが、第1図で示した
従来の方式では類似したパターンをもつ異なる音
韻を明確に分離することができない。
によつて入力音声を判定するものであるが、上記
2つの判定方式のうち前者は判定誤りが多く、ま
た後者はリジエクトの割合が大きくなるという問
題があり、特に音韻認識については十分な識別率
が得られないという問題がある。すなわち従来の
音声認識はパターンマツチング、すなわち識別の
基準となる辞書パターンの中から入力音声が何で
あるかを判定する方式であるが、第1図で示した
従来の方式では類似したパターンをもつ異なる音
韻を明確に分離することができない。
このため入力音声言語の種類(カナ、漢字等)
を指定するための言語情報を利用して前後関係で
判定したり、あるいは音韻ではなく単語の形で認
識を行う方式をとるなどの考えもとられている
が、個々の音韻を音声のレベルで正しく認識する
技術が未だ実現されていない。
を指定するための言語情報を利用して前後関係で
判定したり、あるいは音韻ではなく単語の形で認
識を行う方式をとるなどの考えもとられている
が、個々の音韻を音声のレベルで正しく認識する
技術が未だ実現されていない。
本発明は上記従来技術の問題点を解決するため
になされたもので、音声のレベルで音韻を正しく
認識することのできる音声認識装置を提供するこ
とを目的とする。
になされたもので、音声のレベルで音韻を正しく
認識することのできる音声認識装置を提供するこ
とを目的とする。
本発明による音声認識装置は、パターン全体の
マツチングのほかに類似パターンについて一部分
のマツチングを調べる手段を設けて特徴の違いが
明確な部分についての部分マツチングをとるよう
にしたものである。
マツチングのほかに類似パターンについて一部分
のマツチングを調べる手段を設けて特徴の違いが
明確な部分についての部分マツチングをとるよう
にしたものである。
以下図面を参照して本発明を説明する。
第2図は本発明の音声認識装置の一実施例を示
すブロツク構成図である。本図において11は前
処理回路で、第1図で示したものと同様に入力音
声はこの前処理回路11で雑音除去、エンフアシ
ス等の前処理を受ける。前処理回路11の出力は
次にチヤンネルフイルタ12に送られてスペクト
ル包絡が抽出される。そしてチヤンネルフイルタ
12で得られたスペクトル包絡と辞書13中の音
声パターンとマツチングが類似度計算回路14に
より計算される。そしてもし類似度が十分大きい
ときは類似度最大のものが識別結果として合成回
路15を介して出力端子に送出される。
すブロツク構成図である。本図において11は前
処理回路で、第1図で示したものと同様に入力音
声はこの前処理回路11で雑音除去、エンフアシ
ス等の前処理を受ける。前処理回路11の出力は
次にチヤンネルフイルタ12に送られてスペクト
ル包絡が抽出される。そしてチヤンネルフイルタ
12で得られたスペクトル包絡と辞書13中の音
声パターンとマツチングが類似度計算回路14に
より計算される。そしてもし類似度が十分大きい
ときは類似度最大のものが識別結果として合成回
路15を介して出力端子に送出される。
一方類似度が一定値以下の場合はリジエクトと
して、いくつかの候補が部分マツチング回路16
に送られ、部分マツチング辞書17により部分マ
ツチングが調べられる。そして部分マツチングが
最大のものが識別結果として合成回路15を介し
て出力端子に送出される。この場合、さらにリジ
エクトの判定を行う場合もあることは云うまでも
ない。
して、いくつかの候補が部分マツチング回路16
に送られ、部分マツチング辞書17により部分マ
ツチングが調べられる。そして部分マツチングが
最大のものが識別結果として合成回路15を介し
て出力端子に送出される。この場合、さらにリジ
エクトの判定を行う場合もあることは云うまでも
ない。
ここで部分マツチング回路は全体のパターンの
マツチングをとる類似度計算回路と同様に構成す
ればよい。また部分マツチング辞書には識別の困
難な音声パターンの特徴を示す部分パターンとそ
の部分を示す情報を収容する、例えば全体の標準
パターンとのマツチングを入力音声の8msec毎
にサンプリングしこれを例えば時間軸方向に16点
のパターンとしてマツチングする場合であれば、
部分パターンとしては入力音声の特徴を示す部分
を2msec毎にサンプリングしこれを時間軸方向
に同様に16点のパターンとしてマツチングを行な
えばよい。
マツチングをとる類似度計算回路と同様に構成す
ればよい。また部分マツチング辞書には識別の困
難な音声パターンの特徴を示す部分パターンとそ
の部分を示す情報を収容する、例えば全体の標準
パターンとのマツチングを入力音声の8msec毎
にサンプリングしこれを例えば時間軸方向に16点
のパターンとしてマツチングする場合であれば、
部分パターンとしては入力音声の特徴を示す部分
を2msec毎にサンプリングしこれを時間軸方向
に同様に16点のパターンとしてマツチングを行な
えばよい。
以上説明したように本発明は、全体としてのパ
ターンマツチングでは十分な差がないものにつ
き、特徴的に異なる部分だけについて再度部分的
にマツチングをとることにより識別するようにし
たものである。
ターンマツチングでは十分な差がないものにつ
き、特徴的に異なる部分だけについて再度部分的
にマツチングをとることにより識別するようにし
たものである。
従つて本発明によれば全体としてみればわずか
の差しかないものでもその特徴部分の比較を行う
ことによつて十分分離が可能となり、識別率の向
上を図ることができる。しかし音韻レベルでの良
好な識別を言語情報の補助なく達成することがで
きるので、装置の小型化が可能となり、また操作
の単純化の点でも効果が大きい。
の差しかないものでもその特徴部分の比較を行う
ことによつて十分分離が可能となり、識別率の向
上を図ることができる。しかし音韻レベルでの良
好な識別を言語情報の補助なく達成することがで
きるので、装置の小型化が可能となり、また操作
の単純化の点でも効果が大きい。
第1図は従来例を示す図、第2図は本発明の一
実施例を示すブロツク構成図である。 11……前処理回路、12……フイルタ、13
……辞書、14……類似度計算回路、15……合
成回路、16……部分マツチング回路。
実施例を示すブロツク構成図である。 11……前処理回路、12……フイルタ、13
……辞書、14……類似度計算回路、15……合
成回路、16……部分マツチング回路。
Claims (1)
- 1 識別の基準となる音声パターンを辞書として
記憶する手段と、この手段に記憶された辞書パタ
ーンと入力音声パターンとの全体の類似度を計算
する手段とを有し、前記類似度の大きさによつて
前記入力音声を識別する音声認識装置において、
音声パターンの部分的な特徴を辞書として記憶す
る手段と、この手段に記憶された部分辞書パター
ンと前記入力音声の部分的なパターンとの類似度
を計算する部分マツチング回路とを備え、前記類
似度計算手段で十分な類似度が得られない前記入
力音声を前記部分マツチング回路によつて識別す
るようにしたことを特徴とする音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10959678A JPS5536825A (en) | 1978-09-08 | 1978-09-08 | Voice discriminating device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10959678A JPS5536825A (en) | 1978-09-08 | 1978-09-08 | Voice discriminating device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5536825A JPS5536825A (en) | 1980-03-14 |
JPS63798B2 true JPS63798B2 (ja) | 1988-01-08 |
Family
ID=14514267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10959678A Granted JPS5536825A (en) | 1978-09-08 | 1978-09-08 | Voice discriminating device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5536825A (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5713494A (en) * | 1980-06-26 | 1982-01-23 | Fujitsu Ltd | Voice recognition processing system |
JPS5825699A (ja) * | 1981-08-07 | 1983-02-15 | 三菱電機株式会社 | 音声認識装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS599080A (ja) * | 1982-07-07 | 1984-01-18 | Alps Electric Co Ltd | プリンタ |
-
1978
- 1978-09-08 JP JP10959678A patent/JPS5536825A/ja active Granted
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS599080A (ja) * | 1982-07-07 | 1984-01-18 | Alps Electric Co Ltd | プリンタ |
Also Published As
Publication number | Publication date |
---|---|
JPS5536825A (en) | 1980-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS58130393A (ja) | 音声認識装置 | |
JPS62217295A (ja) | 音声認識方式 | |
CA2085842A1 (en) | Neural network-based speech token recognition system and method | |
US6574596B2 (en) | Voice recognition rejection scheme | |
JPS62232691A (ja) | 音声認識装置 | |
JPS63798B2 (ja) | ||
JPS61180297A (ja) | 話者照合装置 | |
JPS5936759B2 (ja) | 音声認識方法 | |
JPH0211919B2 (ja) | ||
JP3357752B2 (ja) | パターンマッチング装置 | |
JPS62275300A (ja) | 連続音声認識方法 | |
JPH0419700A (ja) | 音声パターンマッチング方法 | |
JPS599080B2 (ja) | 音声認識方法 | |
JPS58159591A (ja) | 単音節音声認識方式 | |
JPS5977500A (ja) | 単語音声認識方式 | |
JPS62147492A (ja) | 音声認識装置における標準パラメ−タの修正方法 | |
JPS6170594A (ja) | 不特定話者音声認識方法 | |
JPH0415960B2 (ja) | ||
JPH0254560B2 (ja) | ||
JPH0711760B2 (ja) | 音声認識装置における標準パラメ−タの修正方法 | |
JPH04260100A (ja) | 音声認識装置 | |
JPS5936299A (ja) | 音声認識装置 | |
JPS59124390A (ja) | 候補削減音声認識方式 | |
JPS6375800A (ja) | 音声認識装置 | |
JPS6240497A (ja) | 音声パタ−ン分類方式 |