JPH0473800A - 音声標準パターン登録方法 - Google Patents

音声標準パターン登録方法

Info

Publication number
JPH0473800A
JPH0473800A JP2186571A JP18657190A JPH0473800A JP H0473800 A JPH0473800 A JP H0473800A JP 2186571 A JP2186571 A JP 2186571A JP 18657190 A JP18657190 A JP 18657190A JP H0473800 A JPH0473800 A JP H0473800A
Authority
JP
Japan
Prior art keywords
pattern
registered
beginning
exist
silent section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2186571A
Other languages
English (en)
Other versions
JP3032551B2 (ja
Inventor
Junichiro Fujimoto
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2186571A priority Critical patent/JP3032551B2/ja
Publication of JPH0473800A publication Critical patent/JPH0473800A/ja
Application granted granted Critical
Publication of JP3032551B2 publication Critical patent/JP3032551B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 臘− 本発明は、音声認識における標準パターンの登録方式に
関するものである。
従来挟生 音声認識装置には特定話者方式と不特定話者方式があり
、それぞれ音声の登録が必要なものと、不要なものに別
れる。方言も含めて誰の声でも認識できる不特定話者音
声認識は実現が非常に難しい事、認識の精度が特定話者
方式の方が良い事等から現在では簡単な特定話者単語音
声認識が実用になっているに過ぎない。
特定話者方式では、あらかじめ使用する音声を登録する
訳であるが、多少の労力は増えても1つの言葉に対して
複数回登録する方が認識精度が向上する事が知られてい
る。複数回発声した音声を平均して登録する方法とそれ
らを別々に登録しておく方法があるがここでは前者の方
法を用いる場合について述べる。
一方、実際に音声認識装置を使う上で、認識しにくい原
因の多くは、入力されたパターンが正確に作成できない
事にある。つまり、入力用のマイクの使い方の違いによ
って発声している音声の一部が欠落して必要な情報が欠
損するために、誤認識となる訳である。特にこの現象は
音声の冒頭や末尾に破裂性の子音が付いているような場
合、たとえば、/ s t o1/、 / p i n
久/等で起りやすい。
第7図は、前述の複数回発声した音声をパターンの始端
と終端とを対応づけて線形伸縮する事でパターン長を一
致させ、平均をとる場合の例を説明するための図で、2
つのパターンの平均を取る際、1つのパターン(a)は
正常であっても、他方のパターン(b)の一部が欠落し
ていると、第2図(c)に示すように平均する事でむし
ろパターンの質を低下させる事になる。
第8図は、上述のごとき問題点に対する対策の一例を説
明するための図で(もし、必要ならば、特願昭62−2
38336号参照)、ここでは例として末尾に誤検出し
やすい子音がつく場合を述べるが、冒頭でも同様に配慮
する事で実行可能である。まず、一方のパターン(a)
にのみ誤検出しやすい子音がついて、他方のパターン(
b)では欠落しているような場合、標準パターン登録時
はこれらが同じ音声を発生した時に得られるものである
事がわかっていることから、冒頭又は末尾の誤検出しや
すい子音/P/をそのまま他方ヘコ1:’−((b) 
)図の点線)しておいてから両者を対応づけ、重ね合わ
せを行なう(Q)。この結果得られるパターンは異なる
音声の平均を取る事なく、正しい対応づけ、つまりパタ
ーンを乱す事が無い。照合時は次の様にする。
(1)未知のパターンの冒頭(又は末尾)に誤検出しや
すい子音がついていて、標準パターンに付いている場合
:対応づく部分同士を対応させて通常通りの照合をする
(2)未知のパターンの冒頭(又は末尾)に誤検出しや
すい子音がついていて、標準パターンに付いていない場
合:標準パターンの誤検出しやすい子音を取除いた部分
と未知パターンの照合をする。
(3)未知のパターンの冒頭(又は末尾)に誤検出しや
すい子音がついていなくて、標準パターンに付いている
場合:標準パターンの誤検出しやすい子音を取除いた部
分と未知パターンの照合をする。
本出願人は、上述のごときパターン照合方法の開発によ
って、誤検出しやすい子音が付いていても、あるいは、
パターンの冒頭や末尾に小さなノイズがついていても正
しい照合ができるようにした。しかしながら、パターン
の全長を一定にしてから、始端や終端に誤検出しやすい
子音があるがどうかを調べても、それを取除くとパター
ンの長さが変ってしまうことから、効果は小さい。
さらに、本出願人は、パターン長を一定にして照合する
音声パターンマツチング方法において、入力された未知
の音声の冒頭、または、末尾に音声のエネルギーが低い
部分が見出された時、全体のパターンを定められた長さ
に変換すると共に、エネルギーが低い部分から先端まで
の部分、あるいは、エネルギーが低い部分から末尾まで
の部分を取除いた残りのパターンを、定められた長さに
変換して両方を保持しておき、両方を標準パターンと照
合し、類似性の高い方の結果をパターン間の類似性と定
義するようにしたパターンマツチング方法について提案
したが、その際標準パターンを何回かの発声の平均によ
って作る方法には提案されておらず、第7図に示すよう
な場合、パターンが異常になる問題は解決されていなか
った。
月−眞 本発明は、上述のごとき従来技術の問題点を改良するた
めに為れされたものであり、パターン長を一定にして照
合するような照合方式であって、子音の欠落を考慮して
マツチング出来るような照合方式において、質のよい、
平均化標準パターンを作るためのパターン登録方式を堤
供することを目的としてなされたものである。
幇−−戊 本発明は、上記目的を達成するために、(1)入力され
た音声を特vi、量に変換して、特徴パターンとなし、
これを決められた時間長に正規化する際に、もとのパタ
ーンの冒頭や、末尾に無音区間が存在するか否かを調へ
、存在しない時には正規化されたパターンをそのまま登
録し、存在する時には、存在しない時と同様の登録後、
その無音区間の部分から冒頭に近い部分、或いは、その
部分から末尾に近い部分を取除いた残りのパターンを決
められた長さにするようなパターン登録法において、パ
ターンが修正されずに正規化されたものか、無音区間の
部分から冒頭に近い部分を取除いたものか、或いは、そ
の部分から末尾に近い部分を取除いたものであるかを分
類して登録するようにしたこと、或いは、(2)登録す
べき言葉を複数回発声し、最初の発声は上記(1)の方
法で登録し、2回目以降の発声では、特徴パターンに変
換した後、その冒頭または末尾近くに無音区間が存在す
るか否かを調べ、存在しない時には、決められた長さに
正規化した後、あらかじめ登録されている同し分類のパ
ターンと平均を取った上で登録するようにしたこと、或
いは、(3)!録すべき言葉を複数回発声し、最初の発
声は上記(1)の方法で登録し、2回目以降の発声では
、特徴パターンに変換した後、その冒頭または末尾近く
に無音区間が存在するか否かを調べ、存在する時には、
存在しない時と同様の正規化パターンを作成後、その無
音区間の部分から冒頭に近い部分、或いは、その部分か
ら末尾に近い部分を取除いた残りの部分を決められた長
さに正規化したパターンを作っておき、あらかじめ登録
されている同じ分類のパターンと平均を取った上で登録
するようにしたこと、或いは、(4)登録すべき言葉を
複数回発声し、最初の発声は上記(1)の方法で登録し
、2回目以降の発声では、特徴パターンに変換した後、
その冒頭または末尾近くに無音区間が存在するか否かを
調へ、存在しない時には決められた長さに正規化した後
、あらかじめ登録されているパターンが1つの言葉に対
して複数登録されているかどうかを調べ、複数登録され
ている場合、あらかじめ登録されているパターンと、今
正規化したパターンとの間で類似性を求め、最大の類似
性が得られたパターンと平均を取った上で複数個のパタ
ーンとして登録するようにしたこと、或いは、(5)登
録すべき言葉を複数回発声し、最初の発声は上記(1)
の方法で登録し、2回目以降の発声では、特徴パターン
に変換した後、その冒頭または末尾近くに無音区間が存
在するか否かを調べ、存在しない時には、決められた長
さに正規化した後、あらかじめ登録されているパターン
が1つの言葉に対して複数登録されているかどうかを調
べ、複数登録されている場合、あらかじめ登録されてい
るパターンと、今正規化したパターンとの間で類似性を
求め、得られたうちで最大の類似性が決められた値より
も小なる時、このパターンは平均を取らずに登録するよ
うにしたこと、或いは、(6)!録すべき言葉を複数回
発声し、最初の発声は上記(1)の方法で登録し、2回
目以降の発声では、特徴パターンに変換した後、その冒
頭または末尾近くに無音区間が存在するか否かを調べ、
存在する時には、まず、存在しない時と同様の操作で正
規化パターンを作成後、その無音区間の部分から冒頭に
近い部分、或いは、その部分から末尾に近い部分を取除
いた残りの部分を決められた長さに正規化したパターン
を作っておき、あらかじめ登録されているパターンが1
つの言葉に対して複数登録されているかどうかを調べ、
登録されているパターンが1つの場合、あらかじめ登録
されているパターンと、全正規化した2つのパターンと
の間で類似性を求め、最大の類似性が得られたパターン
と平均を取った上で登録し、平均を取らなかった方のパ
ターンはそのまま登録するようにしたこと、或いは、(
7)前記(4)において、一つのカテゴリーに一定の数
だけのパターンを登録する事とした時、あらたに平均を
取ったパターンの保存の優先順位は末尾を切取った残す
の長さに正規化したもの、冒頭を切取った残りの長さを
正規化したものの順とすること、或いは、(8)前記(
4)において、あらたに平均を取ったパターンの分類の
優先順位は末尾を切取った残りの長さを正規化したもの
、冒頭を切取った残りの長さを正規化したもの、修正を
しなかったものとし、平均を取らないパターンはそのパ
ターンに施した操作によって分類するようにしたこと、
或いは、(9)前記(6)において、平均を取らないパ
ターンはそのパターンに施した操作によって分類するよ
うにしたことを特徴としたものである。
以下、本発明の実施例に基づいて説明する。
第1図は、本発明の一実施例を説明するための構成図で
、図中、1は音声信号入力部、2は音声区間検出部、3
は特徴変換部、4は音声パワー検出部、5は比較部、6
は閾値部、7はレジスタ、8.8′は伸縮部、9は判断
部、10は部分切捨部、11.12はレジスタ、13は
平均部で、本発明は、入力された音声を特徴量に変換し
て、特徴パターンとなし、これを決められた時間長に正
規化する際に、もとのパターンの冒頭や、末尾に無音区
間が存在するか否かを調べ、存在しない時には正規化さ
れたパターンをそのまま登録し、存在する時には、存在
しない時と同様の登録後、その無音区間の部分から冒頭
に近い部分、或いは、その部分から末尾に近い部分を取
除いた残りのパターンを決められた長さにするようなパ
ターン登録法において、パターンの全体が修正されずに
正規化して一定長にされたものか、無音区間の部分から
冒頭に近い部分を取除いたものか、或いは、その部分か
ら末尾に近い部分を取除いたものであるかを分類して登
録するようにしたものであり、更には、登録すべき言葉
を複数回発声し、最初の発声は上記方法で登録し、2回
目以降の発声では、特徴パターンに変換した後、その冒
頭または末尾近くに無音区間が存在するか否かを調べ、
存在しない時には決められた長さに正規化した後、あら
かじめ登録されているパターンと平均を取った上で登録
するようにし、存在する時には、存在しない時と同様の
正規化パターンを作成した後、その無音区間の部分から
冒頭に近い部分、或いは、その部分から末尾に近い部分
を取り除いた残りの部分を決められた長さに正規化した
パターンを作っておき、あらかじめ登録されている同じ
分類のパターンと平均を取った上で登録するようにした
ものである。以下、本発明の実施例について図面に基い
て説明すると、第1図において、音声は入力部1から入
力されるが、この入力部1はマイクロフォンとマイクア
ンプで構成されている。入力された信号の中から音声に
係るものが音声区間検出部2で検出される。音声区間検
出の方法はいくつか提案されていてその中のどれを用い
ても実行可能であるが、音声のパワーが閾値を越えたが
どうかで始端を児つけ、再び閾値より下がるまでを音声
区間とする方法を用いるとよい。
次に、特徴変換部3で特徴量に変換され、特徴パターン
を形成する。特徴量としては、音声のスペクトラムを使
う事が多いがこわに限定するものではなく、線形予測分
析をしても良いし、ケプトスドラム分析でもその他どの
様なものでも良い。
パワー検出部4では入力さ九た音声の大きさを求めてあ
らかじめ設定されている閾値6と比較する。
この閾値よりもパワーが小さい時には音声の休止区間、
即ち無音区間が発生したものとする。この時の閾値は音
声が入力されない時のパワーの定数をかけて決定すれば
良い。一方、レジスタ7には検出された音声が格納され
、伸縮部8で全体を一定の長さに伸縮したものをレジス
タ11へ入れる。この時、他の種類のパターンとレジス
タを分けて格納しても良いし、パターンにパターン全体
をそのまま伸縮したことを表わすマークをつけてレジス
タに入れても良い。ここではマークとしてを付けて登録
する事にする。また、比較部5で比較されて検出されて
検出された無音区間が判断部9で音声区間の冒頭や末尾
近くに存在すると判断された場合には、レジスタ7の内
容から無音区間から冒頭まで、あるいは無音区間から末
尾までを部分切捨部1oで切捨てて残りを再び伸縮部8
′にて一定値に伸縮してレジスタ11に先のパターンと
一緒に登録しておく、ここで無音区nfJから冒頭まで
切捨てて作ったパターンにはA′のマークを、無音区間
から末尾までを切捨てて作ったパターンにはl S l
のマークを付けておく事にする。冒頭や、末尾の近くと
は端点から100m5〜200m5程度の時間を口う。
続いて平均部13でレジスタ11と12の内容を平均し
、その結果をレジスタ12の中に保存しておく。1回口
の発声の時は、先にレジスタ12の中には何も入ってい
ないので、レジスタ11の内容がレジスタ12にコピー
されることになる。2回目以降の発声では、レジスタ1
2と11が平均されてレジスタ12に上書きされる。た
だし、1つの単語の登録が終った時には、レジスタ12
の内容はクリアされるべきである。平均をとる際には、
あらかじめ登録されているパターンが全体パターン、つ
まり、マーク″の付いたもの1つだけであるか、部分的
に切捨てて2つのパターンがあるのかを調べて、レジス
タ11と12の中の同じマークの付いたもの同士を平均
するようにする。これによって複数回発声したパターン
の平均がとれ、標準パターンとしての質を向上させる事
ができる。
しかしながら、入力された時にすでにパターンの冒頭が
検出できなかった場合、冒頭が欠落したパターンに″の
マークを付けてしまう事となり、この結果、平均を取る
べきパターンがちがって、欠落したパターンとしないパ
ターンの平均を取ってしまうような事となる。したがっ
て、パターンの質が劣化することになる。
第2図は、上述のごとき問題点を解決した実施例を説明
するための図で、この実施例では、登録すべき言葉を複
数回発声し、最初の発声は上記方法で登録し、2回目以
降の発声では、特徴パターンに変換した後、その冒頭ま
たは末尾近くに無音区間が存在するか否かを調べ、存在
しない時にはこれを決められた長さに正規化すると共に
、さきに登録されているパターンが1つの言葉に対して
複数登録されているかどうかを調べる。今回の発声から
作ったパターンか、先に登録されているパターンのどち
らかが複数ある場合、それらの間で類似性を求め、最大
の類似性が得られたパターンと平均を取った上で複数個
のパターンとして登録するようにしている。
以下、本実施例について第2図に基いて説明するが、第
2図中、第1図に示した実施例と同様の作用をする部分
には、第1図の場合と同一の参照番号を付し、その説明
は省略する。この実施例においては、第1図に示した実
施例と同様、マークを付けてレジスタ11へ登録してか
ら、レジスタ11とレジスタ12の内容の類似度を類似
度判断部14でとる。この様子を第3図に示す。仮に、
レジスタ12にはパターンが1つ、レジスタ11には2
つ入っているものとする。たとえば、rstop」とい
う単語の1回口の発声時に/ p /の検出ミスがあり
、rstOJが入っているとし、2回目の発声は正確に
rstopJと入力されたとする。この時、2回目の発
声は/p/の前に無音区間ができる事から、まず、rs
topJ全体のパターンが″のマークを付けて保存され
、このパターンから末尾の/p/の部分を取除いた残り
、rstopJのパターンを作り、 1s1 のマーク
を付けて保存する。
この後に、レジスタ12のパターンとレジスタ11の中
にある2つのパターン間の類似度を計算する。通常、類
似度は類似度2の方が大きいから、第4図に示すように
、レジスタ12の内容は、s′のついたマークを優先さ
せて、レジスタ11のIS1マークがついたパターンと
平均を取る事になる。レジスタ11の″のマークのパタ
ーンはそのままでレジスタ12に格納される。
この例からも分かるように類似度を取る事で、マークに
頼っていて起こす誤りをなくす事ができる。
類似度だけに頼ると悪影響が発生する事も有り得るので
、その防止策として、第5図に示すように、登録すべき
言葉を複数回発声し、最初の発声は上記方法で登録し、
2回目以降の発声では、特徴パターンに変換した後、そ
の冒頭または末尾近くに無音区間が存在するか否かを調
べ、存在しない時には決められた長さに正規化した後、
あらかじめ登録されているパターンが1つの言葉に対し
て複数登録されているかどうかを調べ、複数登録されて
いる場合、あらかじめ登録されているパターンと、今正
規化したパターンとの間で類似性を求め、得られたうち
で最大の類似性が決められた値よりも小なる時、このパ
ターンは平均を取らずに登録するようにした。
すなわち、第5図において、得られた類似度を比較部5
′で閾値15と比較し、得られた類似度のうちで最大の
類似度が閾値15によって決められた値よりも小なる時
は、平均をとらすにレジスタ12へ’11Bするように
した。この時、判断部9′は、第6図に示すように、 IAI 、  IsI を判断してレジスタ12に登録
する。しかし、″、l A r、l S lの全ての種
類のパターンを保存しておくと、レジスタの容量が大き
くなる事から、1つの言葉に対して持てるパターン数を
、例えば2つのように制限する事が考えられるので、そ
の場合には、一つのカテゴリーに一定の数だけのパター
ンを登録する事とした時、あらたに平均を取ったパター
ンの保存の優先順位は、末尾を切取った残りの長さを正
規化したもの、冒頭を切取った残りの長さを正規化した
ものの順とするようにした。
一般に発声の最初はエネルギーを集中するのに対して、
音声の末尾はエネルギーが小さい事が多いことから、冒
頭が欠落する単語に比べて末尾が欠落する単語が多い。
したがって、平均を取る際に、第6図に示すように、 
  1.IAI、1slの3種類のパターンが存在する
場合には、まず。
′を登録し、I S l をt A 7に優先して登録
する。この場合IAJのパターンはレジスタ12から末
梢される。
倭−一来 以上の説明から明らかなように、本発明によると、パタ
ーン長を一定にして照合するような照合方式で子音の欠
落を考慮してマツチング出来るようなものにおいて、質
のよい、平均化標準パターンを作ることが可能になった
【図面の簡単な説明】
第1図は、本発明の一実施例を説明するための図、第2
図及び第3図は、本発明の他の実施例を説明するための
図、第4図、第5図及び第6図は、それぞれ本発明の他
の実施例を説明するための図、第7図は、誤検出しやす
い子音が欠落する事で生じる不具合を説明するための図
、第8図は、誤検出しやすい子音が欠落する事で生じる
不具合の対策法を説明するための図である。 1・・・音声信号入力部、2・・・音声区間検出部、3
・・特徴変換部、4・・・音声パワー検出部、5・・・
比較部、6・・・閾値部、7・・・レジスタ、8,8′
・・伸縮部、9・・・判断部、10・・・部分切捨部、
11.12レジスタ、13・・・平均部、14・・・類
似度判断部、15・・・閾値部。 特許出願人  株式会社 リ コ 第 図 レジスタIT 第 図 第 図 第 図 レジスタ12へ 第 ア 図 第 図

Claims (1)

  1. 【特許請求の範囲】 1、入力された音声を特徴量に変換して、特徴パターン
    となし、これを決められた時間長に正規化する際に、も
    とのパターンの冒頭や、末尾に無音区間が存在するか否
    かを調べ、存在しない時には、正規化されたパターンを
    そのまま登録し、存在する時には、存在しない時と同様
    の登録後、その無音区間の部分から冒頭に近い部分、或
    いは、その部分から末尾に近い部分を取除いた残りのパ
    ターンを決められた長さにするようなパターン登録法に
    おいて、パターンが修正されずに正規化されたものか、
    無音区間の部分から冒頭に近い部分を取除いたものか、
    或いは、その部分から末尾に近い部分を取除いたもので
    あるかを分類して登録するようにしたことを特徴とする
    音声標準パターン登録方式。 2、入力された音声を特徴量に変換して、特徴パターン
    となし、これを決められた時間長に正規化する際に、も
    とのパターンの冒頭や、末尾に無音区間が存在するか否
    かを調べ、存在しない時には、正規化されたパターンを
    そのまま登録し、存在する時には、存在しない時と同様
    の登録後、その無音区間の部分から冒頭に近い部分、或
    いは、その部分から末尾に近い部分を取除いた残りのパ
    ターンを決められた長さにするようなパターン登録法に
    おいて、登録すべき言葉を複数回発声し、最初の発声は
    上記方法で登録し、2回目以降の発声では、特徴パター
    ンに変換した後、その冒頭または末尾近くに無音区間が
    存在するか否かを調べ、存在しない時には、決められた
    長さに正規化した後、あらかじめ登録されている同じ分
    類のパターンと平均を取った上で登録するようにしたこ
    とを特徴とした音声標準パターン登録方式。 3、入力された音声を特徴量に変換して、特徴パターン
    となし、これを決められた時間長に正規化する際に、も
    とのパターンの冒頭や、末尾に無音区間が存在するか否
    かを調べ、存在しない時には、正規化されたパターンを
    そのまま登録し、存在する時には、存在しない時と同様
    の登録後、その無音区間の部分から冒頭に近い部分、或
    いは、その部分から末尾に近い部分を取除いた残りのパ
    ターンを決められた長さにするようなパターン登録法に
    おいて、登録すべき言葉を複数回発声し、最初の発声は
    上記方法で登録し、2回目以降の発声では、特徴パター
    ンに変換した後、その冒頭または末尾近くに無音区間が
    存在するか否かを調べ、存在する時には、存在しない時
    と同様の正規化パターンを作成後、その無音区間の部分
    から冒頭に近い部分、或いは、その部分から末尾に近い
    部分を取除いた残りの部分を決められた長さに正規化し
    たパターンを作っておき、あらかじめ登録されている同
    じ分類のパターンと平均を取った上で登録するようにし
    たことを特徴とする音声標準パターン登録方式。 4、入力された音声を特徴量に変換して、特徴パターン
    となし、これを決められた時間長に正規化する際に、も
    とのパターンの冒頭や、末尾に無音区間が存在するか否
    かを調べ、存在しない時には、正規化されたパターンを
    そのまま登録し、存在する時には、存在しない時と同様
    の登録後、その無音区間の部分から冒頭に近い部分、或
    いは、その部分から末尾に近い部分を取除いた残りのパ
    ターンを決められた長さにするようなパターン登録法に
    おいて、登録すべき言葉を複数回発声し、最初の発声は
    上記方法で登録し、2回目以降の発声では、特徴パター
    ンに変換した後、その冒頭または末尾近くに無音区間が
    存在するか否かを調べ、存在しない時には、決められた
    長さに正規化した後、あらかじめ登録されているパター
    ンが1つの言葉に対して複数登録されているかどうかを
    調べ、複数登録されている場合、あらかじめ登録されて
    いるパターンと、今正規化したパターンとの間で類似性
    を求め、最大の類似性が得られたパターンと平均を取っ
    た上で複数個のパターンとして登録するようにしたこと
    を特徴とする音声標準パターン登録方式。 5、入力された音声を特徴量に変換して、特徴パターン
    となし、これを決められた時間長に正規化する際に、も
    とのパターンの冒頭や、末尾に無音区間が存在するか否
    かを調べ、存在しない時には、正規化されたパターンを
    そのまま登録し、存在する時には、存在しない時と同様
    の登録後、その無音区間の部分から冒頭に近い部分、或
    いは、その部分から末尾に近い部分を取除いた残りのパ
    ターンを決められた長さにするようなパターン登録法に
    おいて、登録すべき言葉を複数回発声し、最初の発声は
    上記方法で登録し、2回目以降の発声では、特徴パター
    ンに変換した後、その冒頭または末尾近くに無音区間が
    存在するか否かを調べ、存在しない時には、決められた
    長さに正規化した後、あらかじめ登録されているパター
    ンが1つの言葉に対して複数登録されているかどうかを
    調べ、複数登録されている場合、あらかじめ登録されて
    いるパターンと、今正規化したパターンとの間で類似性
    を求め、得られたうちで最大の類似性が決められた値よ
    りも小なる時、このパターンは平均を取らずに登録する
    ようにしたことを特徴とする音声標準パターン登録方式
    。 6、入力された音声を特徴量に変換して、特徴パターン
    となし、これを決められた時間長に正規化する際に、も
    とのパターンの冒頭や、末尾に無音区間が存在するか否
    かを調べ、存在しない時には、正規化されたパターンを
    そのまま登録し、存在する時には、存在しない時と同様
    の登録後、その無音区間の部分から冒頭に近い部分、或
    いは、その部分から末尾に近い部分を取除いた残りのパ
    ターンを決められた長さにするようなパターン登録法に
    おいて、登録すべき言葉を複数回発声し、最初の発声は
    上記方法で登録し、2回目以降の発声では、特徴パター
    ンに変換した後、その冒頭または末尾近くに無音区間が
    存在するか否かを調べ、存在する時には、まず、存在し
    ない時と同様の操作で正規化パターンを作成後、その無
    音区間の部分から冒頭に近い部分、或いは、その部分か
    ら末尾に近い部分を取除いた残りの部分を決められた長
    さに正規化したパターンを作っておき、あらかじめ登録
    されているパターンが1つの言葉に対して複数登録され
    ているかどうかを調べ、登録されているパターンが1つ
    の場合、あらかじめ登録されているパターンと、今正規
    化した2つのパターンとの間で類似性を求め、最大の類
    似性が得られたパターンと平均を取った上で登録し、平
    均を取らなかった方のパターンはそのまま登録するよう
    にした音声標準パターン登録方式。
JP2186571A 1990-07-13 1990-07-13 音声標準パターン登録方法 Expired - Fee Related JP3032551B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2186571A JP3032551B2 (ja) 1990-07-13 1990-07-13 音声標準パターン登録方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2186571A JP3032551B2 (ja) 1990-07-13 1990-07-13 音声標準パターン登録方法

Publications (2)

Publication Number Publication Date
JPH0473800A true JPH0473800A (ja) 1992-03-09
JP3032551B2 JP3032551B2 (ja) 2000-04-17

Family

ID=16190864

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2186571A Expired - Fee Related JP3032551B2 (ja) 1990-07-13 1990-07-13 音声標準パターン登録方法

Country Status (1)

Country Link
JP (1) JP3032551B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10323915B2 (en) 2014-09-08 2019-06-18 Ringo Thieme Variable firework battery

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10323915B2 (en) 2014-09-08 2019-06-18 Ringo Thieme Variable firework battery

Also Published As

Publication number Publication date
JP3032551B2 (ja) 2000-04-17

Similar Documents

Publication Publication Date Title
US4933973A (en) Apparatus and methods for the selective addition of noise to templates employed in automatic speech recognition systems
US4918732A (en) Frame comparison method for word recognition in high noise environments
JPS62217295A (ja) 音声認識方式
JP3069531B2 (ja) 音声認識方法
JP2002366192A (ja) 音声認識方法及び音声認識装置
JPH0473800A (ja) 音声標準パターン登録方法
US5765124A (en) Time-varying feature space preprocessing procedure for telephone based speech recognition
JPS60114900A (ja) 有音・無音判定法
JP3588929B2 (ja) 音声認識装置
JP3020999B2 (ja) パターン登録方法
JPH0376471B2 (ja)
JP3360978B2 (ja) 音声認識装置
JP2882791B2 (ja) パターン比較方式
JP2737109B2 (ja) 音声区間検出方式
JPH0997095A (ja) 音声認識装置
JPH034918B2 (ja)
JP2534243B2 (ja) 標準パタ―ン作成方法
JP3125928B2 (ja) 音声認識装置
JPS59224900A (ja) 音声認識方法
JPH05210396A (ja) 音声認識装置
JPS59170894A (ja) 音声区間の切り出し方式
JPS59149400A (ja) 音声入力装置
JP2712586B2 (ja) 単語音声認識装置用パターンマッチング方式
EP1422691A1 (en) Method for adapting a speech recognition system
JPS6312000A (ja) 音声認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080210

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090210

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100210

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees