JPS6328315B2 - - Google Patents
Info
- Publication number
- JPS6328315B2 JPS6328315B2 JP55086916A JP8691680A JPS6328315B2 JP S6328315 B2 JPS6328315 B2 JP S6328315B2 JP 55086916 A JP55086916 A JP 55086916A JP 8691680 A JP8691680 A JP 8691680A JP S6328315 B2 JPS6328315 B2 JP S6328315B2
- Authority
- JP
- Japan
- Prior art keywords
- category
- similarity
- input speech
- dictionary
- categories
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000000605 extraction Methods 0.000 claims description 17
- 239000000284 extract Substances 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 6
- 238000000034 method Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 1
Description
【発明の詳細な説明】
本発明は、音声認識処理装置、特に辞書中に格
納される各カテゴリの特徴時系列パターンに対応
して、当該カテゴリ毎の当該カテゴリとして判定
可能な類似度の限界を示す変形限界値を上記辞書
中に格納しておき、上記変形限界値が複数個以上
判定可を示しているかいずれも判定不可を示して
いる場合に、最も可能性の高い少なくとも2つの
カテゴリについて、いわば相互の差異を拡大した
形で判定を行なうようにした音声認識処理装置に
関するものである。
納される各カテゴリの特徴時系列パターンに対応
して、当該カテゴリ毎の当該カテゴリとして判定
可能な類似度の限界を示す変形限界値を上記辞書
中に格納しておき、上記変形限界値が複数個以上
判定可を示しているかいずれも判定不可を示して
いる場合に、最も可能性の高い少なくとも2つの
カテゴリについて、いわば相互の差異を拡大した
形で判定を行なうようにした音声認識処理装置に
関するものである。
従来から音声認識処理装置においては、未知入
力音声を分析した結果にもとづいて入力音声特徴
時系列パターンを抽出し、当該入力音声特徴時系
列パターンと辞書中に格納しておいた標準特徴時
系列パターンとを照合し、最も類似度の高いカテ
ゴリを答として決定するようにしている。しか
し、カテゴリ数が大となりまたは不特定話者によ
る音声を認識しようとすると、上記標準特徴時系
列パターンによつて最も類似度の高いものを決定
するのみでは十分でない。
力音声を分析した結果にもとづいて入力音声特徴
時系列パターンを抽出し、当該入力音声特徴時系
列パターンと辞書中に格納しておいた標準特徴時
系列パターンとを照合し、最も類似度の高いカテ
ゴリを答として決定するようにしている。しか
し、カテゴリ数が大となりまたは不特定話者によ
る音声を認識しようとすると、上記標準特徴時系
列パターンによつて最も類似度の高いものを決定
するのみでは十分でない。
本発明は、上記の点を解決することを目的とし
ており、各標準特徴時系列毎に(カテゴリ毎に)
自己に対する類似度が或る値以下になれば未知入
力音声を自己カテゴリに属するものと確定するこ
とに疑問があるという限界を示す変形限界値を用
意しておき、全カテゴリに対する照合結果につい
て上記変形限界値以内にあるカテゴリが単一であ
る場合にはそのまま未知入力音声が当該カテゴリ
に属するものと決定し、変形限界値以内にあるカ
テゴリが複数個存在するかあるいは全カテゴリに
ついて上記変形限界値以外にあるかの場合に、最
も可能性の高い少なくとも2つのカテゴリ相互間
で最終的な判定を行なわせるようにすることを目
的としている。そしてそのため、本発明の音声認
識処理装置は、未知入力音声を分析した結果にも
とづいて入力音声の特徴を抽出する第1の入力音
声特徴抽出部をそなえ、該特徴抽出部によつて抽
出された入力音声特徴時系列パターンと予め用意
された辞書の内容とにもとづいて類似度を決定し
音声認識を行なう音声認識処理装置において、 上記辞書の内容としてカテゴリ名と当該カテゴ
リの特徴時系列パターンと当該カテゴリ毎の当該
カテゴリとして判定可能な類似度の限界を示す変
形限界値とを格納しておく辞書と、 上記未知入力音声を分析した結果にもとづい
て、互に近似する関係が予め判つている少なくと
も2つの音声相互間における差異特徴を拡大して
抽出する第2の入力音声特徴抽出部と、 上記入力音声特徴時系列パターンと上記辞書の
内容とを照合した結果の類似度と当該辞書の内容
を示すカテゴリ名と上記変形限界値とを対にして
対応づける対応づけ部と、 上記類似度と上記変形限界値とを比較した結果
をカテゴリ名毎に保持する変形限界内メモリと、
全カテゴリの照合終了時に、複数個のカテゴリに
対応して上記変形限界値以内であることを示して
いるかあるいはすべてのカテゴリにおいて上記変
形限界値以外であることを示している場合に、最
も可能性の高い少なくとも2つのカテゴリに関し
て上記第2の入力音声特徴抽出部によつて抽出さ
れた差異特徴にもとづいて判定する判定部とをそ
なえた ことを特徴としている。以下図面を参照しつつ説
明する。
ており、各標準特徴時系列毎に(カテゴリ毎に)
自己に対する類似度が或る値以下になれば未知入
力音声を自己カテゴリに属するものと確定するこ
とに疑問があるという限界を示す変形限界値を用
意しておき、全カテゴリに対する照合結果につい
て上記変形限界値以内にあるカテゴリが単一であ
る場合にはそのまま未知入力音声が当該カテゴリ
に属するものと決定し、変形限界値以内にあるカ
テゴリが複数個存在するかあるいは全カテゴリに
ついて上記変形限界値以外にあるかの場合に、最
も可能性の高い少なくとも2つのカテゴリ相互間
で最終的な判定を行なわせるようにすることを目
的としている。そしてそのため、本発明の音声認
識処理装置は、未知入力音声を分析した結果にも
とづいて入力音声の特徴を抽出する第1の入力音
声特徴抽出部をそなえ、該特徴抽出部によつて抽
出された入力音声特徴時系列パターンと予め用意
された辞書の内容とにもとづいて類似度を決定し
音声認識を行なう音声認識処理装置において、 上記辞書の内容としてカテゴリ名と当該カテゴ
リの特徴時系列パターンと当該カテゴリ毎の当該
カテゴリとして判定可能な類似度の限界を示す変
形限界値とを格納しておく辞書と、 上記未知入力音声を分析した結果にもとづい
て、互に近似する関係が予め判つている少なくと
も2つの音声相互間における差異特徴を拡大して
抽出する第2の入力音声特徴抽出部と、 上記入力音声特徴時系列パターンと上記辞書の
内容とを照合した結果の類似度と当該辞書の内容
を示すカテゴリ名と上記変形限界値とを対にして
対応づける対応づけ部と、 上記類似度と上記変形限界値とを比較した結果
をカテゴリ名毎に保持する変形限界内メモリと、
全カテゴリの照合終了時に、複数個のカテゴリに
対応して上記変形限界値以内であることを示して
いるかあるいはすべてのカテゴリにおいて上記変
形限界値以外であることを示している場合に、最
も可能性の高い少なくとも2つのカテゴリに関し
て上記第2の入力音声特徴抽出部によつて抽出さ
れた差異特徴にもとづいて判定する判定部とをそ
なえた ことを特徴としている。以下図面を参照しつつ説
明する。
第1図は本発明の一実施例構成を示し、第2図
は第1図図示の判定回路部における処理をフロー
チヤートの形で表わした一実施例を示す。
は第1図図示の判定回路部における処理をフロー
チヤートの形で表わした一実施例を示す。
第1図において、1は分析回路、2は第1の入
力音声特徴抽出部、3は第2の入力音声特徴抽出
部、4は入力音声特徴時系列パターン・メモリ、
5は辞書メモリ、6は辞書管理回路部、7は照合
回路部であつて例えばDPマツチングによつて距
離(類似度)計算を行なうもの、8は#0対応づ
け回路部であつて上記類似度とカテゴリ名とを対
応づけるもの、9は最大類似度メモリであつて例
えば全カテゴリについて夫々類似度を格納するも
の(勿論最大の類似度をもつカテゴリ名と次位の
類似度をもつカテゴリ名とを抽出して保持するも
のであつてもよい)、10は#1対応づけ回路部
であつて類似度とカテゴリ名と当該カテゴリに対
応する変形限界値とを対応づけて限界内にあるカ
テゴリについて類似度が限界内にある指示を例え
ば論理「1」として指摘するもの、11は変形限
界内メモリであつて例えば全カテゴリに対応して
上記限界内にある指示を1ビツトで保持するも
の、12は判定回路部であつて第2図に示す如き
処理を行なつて1つの答を得るものを表わしてい
る。また13は制御回路部であつて、各部に対す
る制御を行なうものを表わしている。
力音声特徴抽出部、3は第2の入力音声特徴抽出
部、4は入力音声特徴時系列パターン・メモリ、
5は辞書メモリ、6は辞書管理回路部、7は照合
回路部であつて例えばDPマツチングによつて距
離(類似度)計算を行なうもの、8は#0対応づ
け回路部であつて上記類似度とカテゴリ名とを対
応づけるもの、9は最大類似度メモリであつて例
えば全カテゴリについて夫々類似度を格納するも
の(勿論最大の類似度をもつカテゴリ名と次位の
類似度をもつカテゴリ名とを抽出して保持するも
のであつてもよい)、10は#1対応づけ回路部
であつて類似度とカテゴリ名と当該カテゴリに対
応する変形限界値とを対応づけて限界内にあるカ
テゴリについて類似度が限界内にある指示を例え
ば論理「1」として指摘するもの、11は変形限
界内メモリであつて例えば全カテゴリに対応して
上記限界内にある指示を1ビツトで保持するも
の、12は判定回路部であつて第2図に示す如き
処理を行なつて1つの答を得るものを表わしてい
る。また13は制御回路部であつて、各部に対す
る制御を行なうものを表わしている。
辞書5には、各カテゴリに対応して、カテゴリ
名と当該カテゴリに対応する標準特徴時系列パタ
ーンと当該カテゴリに対応して与えられる上記変
形限界値とを対にして保持している。
名と当該カテゴリに対応する標準特徴時系列パタ
ーンと当該カテゴリに対応して与えられる上記変
形限界値とを対にして保持している。
第1の入力音声特徴抽出部2は、分析回路1か
らの出力にもとづいて特徴時系列パターンを抽出
する。また第2の入力音声特徴抽出部3は、例え
ば次の如き特徴を抽出すると考えてよい。即ち、
例えば入力音声/ichi/と/hachi/とが比較的
区別しにくいことが判つている場合、/i/と/
ha/とに対応する範囲の特徴を重点的に抽出す
るようにされるものと考えてよい。
らの出力にもとづいて特徴時系列パターンを抽出
する。また第2の入力音声特徴抽出部3は、例え
ば次の如き特徴を抽出すると考えてよい。即ち、
例えば入力音声/ichi/と/hachi/とが比較的
区別しにくいことが判つている場合、/i/と/
ha/とに対応する範囲の特徴を重点的に抽出す
るようにされるものと考えてよい。
未知入力音声は分析回路1によつて分析され、
その結果は特徴抽出部2と3とに夫々導びかれ
る。第1の入力音声特徴抽出部2によつて抽出さ
れた特徴時系列パターンはパターン・メモリ4に
セツトされる。そしてパターンと辞書5から順次
読出される標準時系列パターンとが照合回路部7
によつて照合され、類似度が計算される。該類似
度は#0対応づけ回路部8を介して、例えば各カ
テゴリ毎に類似度を表わす値がメモリ9に保持さ
れる。一方#1対応づけ回路部10において、上
記類似度と上述の変形限界値とが比較され、当該
カテゴリに対する類似度が変形限界値以内であれ
ば、メモリ11内にカテゴリ名対応に論理「1」
がセツトされ、変形限界値以上であれば論理
「0」がセツトされる。
その結果は特徴抽出部2と3とに夫々導びかれ
る。第1の入力音声特徴抽出部2によつて抽出さ
れた特徴時系列パターンはパターン・メモリ4に
セツトされる。そしてパターンと辞書5から順次
読出される標準時系列パターンとが照合回路部7
によつて照合され、類似度が計算される。該類似
度は#0対応づけ回路部8を介して、例えば各カ
テゴリ毎に類似度を表わす値がメモリ9に保持さ
れる。一方#1対応づけ回路部10において、上
記類似度と上述の変形限界値とが比較され、当該
カテゴリに対する類似度が変形限界値以内であれ
ば、メモリ11内にカテゴリ名対応に論理「1」
がセツトされ、変形限界値以上であれば論理
「0」がセツトされる。
判定回路部12は、第2図にフローチヤートの
形で示す如く判定処理を行なう。即ち、 (1) メモリ11内の論理「1」の数を数え、論理
「1」の数即ちCinが値1であれば、即ち変形
限界値以内のものが唯1つのみであれば当該論
理「1」をもつカテゴリを答として出力する。
形で示す如く判定処理を行なう。即ち、 (1) メモリ11内の論理「1」の数を数え、論理
「1」の数即ちCinが値1であれば、即ち変形
限界値以内のものが唯1つのみであれば当該論
理「1」をもつカテゴリを答として出力する。
(2) 上記論理「1」の数即ちCinが値「1」でな
くかつCinが値「0」でない場合、論理「1」
をもつカテゴリのうちで類似度が最大のものと
次大のものとをメモリ9から読出す。
くかつCinが値「0」でない場合、論理「1」
をもつカテゴリのうちで類似度が最大のものと
次大のものとをメモリ9から読出す。
(3) 上記論理「1」の数即ちCinが値「1」でな
くかつCinが値「0」である場合、即ちすべて
のカテゴリについて変形限界値以外にある場合
メモリ9に格納されている全体のカテゴリのう
ち類似度が最大のものと次大のものとをメモリ
9から読出す。
くかつCinが値「0」である場合、即ちすべて
のカテゴリについて変形限界値以外にある場合
メモリ9に格納されている全体のカテゴリのう
ち類似度が最大のものと次大のものとをメモリ
9から読出す。
(4) 上記項(2)と(3)とのいずれかによつて2つの候
補カテゴリが選ばれた場合、次のようにする。
即ち例えば単語の先頭などに着目して上述の如
く/i/と/ha/とを識別できるような特徴
などを図示特徴抽出部3によつて用意されてい
る−これを判定法(A)と呼ぶ。用意されていない
場合これを判定法(B)と呼ぶ。
補カテゴリが選ばれた場合、次のようにする。
即ち例えば単語の先頭などに着目して上述の如
く/i/と/ha/とを識別できるような特徴
などを図示特徴抽出部3によつて用意されてい
る−これを判定法(A)と呼ぶ。用意されていない
場合これを判定法(B)と呼ぶ。
(5) 判定法(A)を使用できる場合、図示特徴抽出部
3からの出力にもとづいて、上記2つの候補カ
テゴリの1つを決定する。
3からの出力にもとづいて、上記2つの候補カ
テゴリの1つを決定する。
(6) 判定法(A)を使用できない場合、例えば図示メ
モリ9の内容を利用して最大の類似度をもつカ
テゴリを選んで答とする。
モリ9の内容を利用して最大の類似度をもつカ
テゴリを選んで答とする。
以上説明した如く、本発明によれば、予め誤認
識し易い単語が判つている場合などにおいて、第
2の入力音声特徴抽出部3からの出力を利用する
ことができ、認識率を一段と向上できる。
識し易い単語が判つている場合などにおいて、第
2の入力音声特徴抽出部3からの出力を利用する
ことができ、認識率を一段と向上できる。
第1図は本発明の一実施例構成を示し、第2図
は第1図図示の判定回路部における処理をフロー
チヤートの形で表わした一実施例を示す。 図中1は分析回路、2は第1の入力音声特徴抽
出部、3は第2の入力音声特徴抽出部、4は入力
音声特徴時系列パターン・メモリ、5は辞書メモ
リ、7は照合回路部、8,10は夫々対応づけ回
路部、9,11は夫々メモリ、12は判定回路部
を表わす。
は第1図図示の判定回路部における処理をフロー
チヤートの形で表わした一実施例を示す。 図中1は分析回路、2は第1の入力音声特徴抽
出部、3は第2の入力音声特徴抽出部、4は入力
音声特徴時系列パターン・メモリ、5は辞書メモ
リ、7は照合回路部、8,10は夫々対応づけ回
路部、9,11は夫々メモリ、12は判定回路部
を表わす。
Claims (1)
- 【特許請求の範囲】 1 未知入力音声を分析した結果にもとづいて入
力音声の特徴を抽出する第1の入力音声特徴抽出
部をそなえ、該特徴抽出部によつて抽出された入
力音声特徴時系列パターンと予め用意された辞書
の内容とにもとづいて類似度を決定し音声認識を
行なう音声認識処理装置において、 上記辞書の内容としてカテゴリ名と当該カテゴ
リの特徴時系列パターンと当該カテゴリ毎の当該
カテゴリとして判定可能な類似度の限界を示す変
形限界値とを格納しておく辞書と、 上記未知入力音声を分析した結果にもとづい
て、互に近似する関係が予め判つている少なくと
も2つの音声相互間における差異特徴を拡大して
抽出する第2の入力音声特徴抽出部と、 上記入力音声特徴時系列パターンと上記辞書の
内容とを照合した結果の類似度と当該辞書の内容
を示すカテゴリ名と上記変形限界値とを対にして
対応づける対応づけ部と、 上記類似度と上記変形限界値とを比較した結果
をカテゴリ名毎に保持する変形限界内メモリと、
全カテゴリの照合終了時に、複数個のカテゴリに
対応して上記変形限界値以内であることを示して
いるかあるいはすべてのカテゴリにおいて上記変
形限界値以外であることを示している場合に、最
も可能性の高い少なくとも2つのカテゴリに関し
て上記第2の入力音声特徴抽出部によつて抽出さ
れた差異特徴にもとづいて判定する判定部とをそ
なえた ことを特徴とする音声認識処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8691680A JPS5713494A (en) | 1980-06-26 | 1980-06-26 | Voice recognition processing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8691680A JPS5713494A (en) | 1980-06-26 | 1980-06-26 | Voice recognition processing system |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5713494A JPS5713494A (en) | 1982-01-23 |
JPS6328315B2 true JPS6328315B2 (ja) | 1988-06-08 |
Family
ID=13900168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8691680A Granted JPS5713494A (en) | 1980-06-26 | 1980-06-26 | Voice recognition processing system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5713494A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4400828A (en) * | 1981-03-27 | 1983-08-23 | Bell Telephone Laboratories, Incorporated | Word recognizer |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS51138104A (en) * | 1975-05-23 | 1976-11-29 | Hiroya Fujisaki | Voice recognition system |
JPS5536825A (en) * | 1978-09-08 | 1980-03-14 | Tokyo Shibaura Electric Co | Voice discriminating device |
-
1980
- 1980-06-26 JP JP8691680A patent/JPS5713494A/ja active Granted
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS51138104A (en) * | 1975-05-23 | 1976-11-29 | Hiroya Fujisaki | Voice recognition system |
JPS5536825A (en) * | 1978-09-08 | 1980-03-14 | Tokyo Shibaura Electric Co | Voice discriminating device |
Also Published As
Publication number | Publication date |
---|---|
JPS5713494A (en) | 1982-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0099476B1 (en) | Identity verification system | |
US4651289A (en) | Pattern recognition apparatus and method for making same | |
US4903306A (en) | Voice recognition using an eigenvector | |
EP0424071A2 (en) | Speaker recognition | |
US5159637A (en) | Speech word recognizing apparatus using information indicative of the relative significance of speech features | |
JPS6123560B2 (ja) | ||
JPS6328315B2 (ja) | ||
JPS6129518B2 (ja) | ||
JPH0555039B2 (ja) | ||
JP2856429B2 (ja) | 音声認識方式 | |
JPS6131880B2 (ja) | ||
JPS5977500A (ja) | 単語音声認識方式 | |
JPS6193499A (ja) | 音声パタ−ン照合方式 | |
JPS62133499A (ja) | 音声認識装置 | |
JPH0652537B2 (ja) | パタ−ン認識方法 | |
JPS63798B2 (ja) | ||
JPS6336678B2 (ja) | ||
JPS59189398A (ja) | 連続音声認識方式 | |
Feustel et al. | Voice-based security: identity verification over telephone lines | |
JPS63136097A (ja) | 音声認識方式 | |
JPS59124388A (ja) | 単語音声認識処理方式 | |
JPS6152698A (ja) | 音声認識装置 | |
KR20000040573A (ko) | 화자독립 고립단어 음성인식기의 오인식 방지장치 및 방법 | |
JPS63155195A (ja) | 音声認識装置 | |
JPS59124391A (ja) | 音声認識処理方式 |