JPS6287995A - 音声パタ−ン登録方式 - Google Patents

音声パタ−ン登録方式

Info

Publication number
JPS6287995A
JPS6287995A JP60228510A JP22851085A JPS6287995A JP S6287995 A JPS6287995 A JP S6287995A JP 60228510 A JP60228510 A JP 60228510A JP 22851085 A JP22851085 A JP 22851085A JP S6287995 A JPS6287995 A JP S6287995A
Authority
JP
Japan
Prior art keywords
patterns
voice
speech
registered
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60228510A
Other languages
English (en)
Inventor
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP60228510A priority Critical patent/JPS6287995A/ja
Publication of JPS6287995A publication Critical patent/JPS6287995A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は、音声認識装置における標準パターンの登録方
式に関する。
従来技術 音声認識装置の認識率を左右する問題に辞書となる標準
パターンの登録があり、高認識を達成するためには正確
なパターンにより標準パターンを作成しなければならな
い。而して、単音節のような登録されている各音声間の
パターンが極めて類似している場合には、これらの各音
節について複数個の標準パターンを登録するような手法
(マルチテンプレート方式)が利用されている。又、複
数個のパターンを別々に登録せずにそれらの平均を9.
録することも行われる。しかし、どちらの方法にせよ、
登録すべきパターンが完全であることが条件であり、例
えば、平均すべきパターン中に一つでも異常なものが含
まれていると平均パターン全体の質が悪くなってしまう
旦−一血 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声認識装置において、平均パターンを作る際に
異常なパターンを検出し、最終的に完全なパターンで標
準パターンを登録することを目的としてなされたもので
ある。
構   成 本発明は、上記目的を達成するために、未知の入力音声
を特徴量に変換し、あらかじめ登録しておいた標準パタ
ーンと比較照合して未知音声を認識する音声認識装置に
おいて、登録すべき一つの音声に関して複数回発声して
生じる複数個の音声パターンの組合せによって新たに1
個以上の音声パターンを作成して登録すること、或いは
、登録すべき一つの音声に関して複数回発声して生じる
複数個の音声パターンの組合せにより新たな複数個の音
声パターンを作成し、該複数個のパターン間で類似性を
求め、特に類似を示すパターンの一方を消去して登録す
ること、或いは、登録すべき一つの音声に関して複数回
発声して生じる複数個の音声パターンの組合せにより新
たな複数個の音声パターンを作成し、該複数個のパター
ン間で類似性を求め、大半のパターン間類似度に比べ、
偏差が大きく類似度が小さいパターンを消去して登録す
ることを特徴としたものである。以下、本発明の実施例
にJ%づいて説明する。
第1図は、本発明の一実施例を説明するための′WX1
.気的ブロック線図で1図中、1はマイク、2は特徴量
変換部、3は音声区間検出部、4はレジスタ、5は組み
合わせ部、6は平均部、7はeA準パターンで5本発明
の基本的な考えは、完全、不完全な全てのパターンを使
って標準パターンを登録してから、不要なものを消去す
るもので、第1図に示した実施例は、未知の入力音声を
特徴量に変換し、あらかじめ登録しておいた標準パター
ンと比較照合して未知音声を認識する音声認識装置にお
いて、登録すべき一つの音声に関して複数回発声して生
じる複数個の音声パターンの組合せによって新たに1個
以−ヒの音声パターンを作成して登録するようにしたも
のである。
第1図に示した実施例において、マイク1から登録すべ
き音声を複数回発声し、それらを特徴量変換部2におい
て特徴量に変換し、音声区間検出部3において、音声区
間を検出してレジスタ4に格納する。ここで、例えば、
発声回数を3回としておくと、レジスタ4の1〜3に各
々のパターンが格納される。次に、これらの3つのパタ
ーンの全ての組み合わせを組み合わせ部5で得、それら
のパターンの平均を平均部6でとり、標準パターン7と
して登録する。ここでいう全ての組合わせの平均とは次
のようなことを意味する。つまり、レジスタ4の1に格
納されているのがパターンA。
2に格納されているのがパターンB、3に格納されてい
るのがパターンCであるとすると、これらの全ての組み
合わせは、A、B、C,A+B。
A+C,B+G、及び、A十B+Cの7通りであり、こ
のようにして、全ての組合せを作り、各々の組合わせに
応じて平均をとる。このようにすることによって同じタ
イプのパターン同士の平均、あらゆる変動を加味した平
均など考えられる全てのタイプのパターンが登録される
ことになりマルチテンプレート方式として有効になる。
しかし。
上記の方式では必ずしも全ての標準パターンが必要であ
る訳ではなく、不要なパターンが存在し、標準パターン
のメモリの浪費となる。
第2図は、第1図に示した上述のごとき欠点を解決した
実施例を説明するための電気的ブロック線図で、図中、
11はマイク、12は特徴量変換部、13は音声区間検
出部、14はレジスタ、15は照合部、20は結果表示
部で、マイク11乃至照合部15は音声認識部を構成す
るものであるが、本発明において音声認識部1oは図示
例のものに限定されるものでなく、図示以外の任意の方
法を用いてもよい。
而して、この実施例は、各パターンの認識寄与の度合を
計算して認識に寄与しないパターンを消去するようにし
たもので、図示のように、音声を特徴量変換してあらか
じめ第1図の方式で登録されている標7<Qパターンを
照合し、最大の類似度を得たものが認識結果として表示
される。この結果が正解であったものはどの標準パター
ンによって最大の類似度を得たかを知り、そのパターン
が第1位となった回数を示し、第1位のカウンタの数を
1だけ増す。登録すべき音声がn種類あり、各音声が第
1位と同様3回ずつ発声するなら、1つの音声について
7つの組合わせができるから7Xnのパターンがある。
各々のパターンの1位となる回数をカウントする。何回
かの使用後、第2図に示すように、音声1の認識結果に
パターンAは10回寄与し、パターンBは0回、・・・
・、パターンA+B+Cが31回であるなら、寄与回数
OのパターンBを消去する。これは0回に限らず他のパ
ターンに比べて小さい値なら良い。これにより。
標準パターンのメモリを減らすことが出来る。
このようなマルチテンプレート方式でよく見られる傾向
として一つの音声に多くのタイプの標準パターンを登録
するため、その中には、他のパターンとまぎられしいも
のが存在し、かえって誤認識をひき起こしてしまう、そ
こで、そのようなパターンをとり除くことにより認識率
を向上させることができる。
第3図は、上述のごとき観点に立ってなされたもので、
図中、30はキーボードで、その他は第2図に示した実
施例と同じである。而して1本実施例においては、認識
の結果を見て使用者が誤りの指示を出すと、認識結果を
出したパターンの誤りカウンタを一つ増やし、こうして
この回数が多くなったパターンを消去する。
以上により、他の音声と類似してしまった標準パターン
を自動的に消去でき、認、¥!l!率を向上させること
ができる。更に、一つの音声に対して複数個の標準パタ
ーンを持つマルチテンプレート方式では色々なタイプの
変動パターンが必要なのであって、類似したパターンが
いくつもあるとメモリの無駄となる。
第4図は、本発明の他の実施例を説明するための要部構
成図で、図中、15は照合部、16は類似度比較部、1
7は類似度が一定値以上か否かを判定する判定部、18
は消去部、40は標準パターンで、この実施例は、第1
図の方式で作った標準パターン内の同一音声のパターン
同士の類似度が大きいパターンの一方を消去するもので
ある。
これは第5図に示すように音声1の全てのパターン同士
で類似度を求め、同じパターン同士の類似度を例えば1
00として正規化し、図中のAとBのように特に類似し
ているものは同じパターンを二つ登録していることに近
いので、この一方を消去してメモリの無駄をなくす。こ
れまでの議論は全てパターンの音声区間切り出しが正し
く行われたとの仮定のもとに進めてきた。しかし、切り
出しは常に正しく働くとは限らないため、音声パターン
の一部が欠落したり、雑音が添加されたものができてし
まう。そこで、第4図と同様の手順で類似度が一定以下
のものを探し、他のパターン間の類似度バラツキに比べ
、極端に偏っているかどうかをチェックし、偏っている
場合には、区間切り出し、或いは、雑音混入とみなして
そのパターンを消去する。
第6図は、その場合の一例を示す図で、得られた類似度
中に一定値以下のものがないかをチェックし、あった場
合には引きつづき比較した類似度値の統計的処理を統計
処理部19で行なうようにしたものである。統計処理と
は、例えば、第7図のように各パターンでの類似度のバ
ラツキを調べ、極端にはずれているCのパターンを消去
するもので、これによって異常パターンを検出し、完全
なパターンを登録することができる。
効   果 以上の説明から明らかなように、本発明によると、異常
な音声パターンを検出し、該異常なパターンを消去する
ようにしたので、完全な音声パターンを登録することが
できる。
【図面の簡単な説明】
第1図乃至第4図及び第6図は、それぞれ本発明の詳細
な説明するための電気的ブロック線図、第5図は、パタ
ーン同志の類似度を示す図、第7図は、各パターンでの
類似度のバラツキを示す図である。 1・・・マイク、2・・・特徴量変換部、3・・・音声
区間検出部、4・・・レジスタ、5・・・組み合わせ部
、6・・・平均部、7・・・標準パターン、10・・・
音声認識部、11・・・マイク、12・・・特徴量変換
部、13・・・音声区間検出部、14・・・レジスタ、
15・・・照合部。 20・・・結果表示部、30・・・キーボード、40・
・・標準パターン。 特許出願人  株式会社 リコー 第 1 図 演 317I 第 4  図            第  5 図第
 6 図 第  7 図 と

Claims (5)

    【特許請求の範囲】
  1. (1)、未知の入力音声を特徴量に変換し、あらかじめ
    登録しておいた標準パターンと比較照合して未知音声を
    認識する音声認識装置において、登録すべき一つの音声
    に関して複数回発声して生じる複数個の音声パターンの
    組合せによつて新たに1個以上の音声パターンを作成し
    て登録することを特徴とする音声パターン登録方式。
  2. (2)、登録すべき一つの音声に関して複数回発声して
    生じる複数個の音声パターンの組合せにより新たな1個
    以上の音声パターンを作成して登録しておき、認識に寄
    与しないパターンを消去することを特徴とする特許請求
    の範囲第(1)項に記載の音声パターン登録方式。
  3. (3)、登録すべき一つの音声に関して複数回発声して
    生じる複数個の音声パターンの組合せにより新たな1個
    以上の音声パターンを作成して登録しておき、誤認識に
    起因するパターンを消去することを特徴とする特許請求
    の範囲第(1)項に記載の音声パターン登録方式。
  4. (4)、未知の入力音声を特徴量に変換し、あらかじめ
    登録しておいた標準パターンと比較照合して未知音声を
    認識する音声認識装置において、登録すべき一つの音声
    に関して複数回発声して生じる複数個の音声パターンの
    組合せにより新たな複数個の音声パターンを作成し、該
    複数個のパターン間で類似性を求め、特に類似を示すパ
    ターンの一方を消去して登録することを特徴とする音声
    パターン登録方式。
  5. (5)、未知の入力音声を特徴量に変換し、あらかじめ
    登録しておいた標準パターンと比較照合して未知音声を
    認識する音声認識装置において、登録すべき一つの音声
    に関して複数回発声して生じる複数個の音声パターンの
    組合せにより新たな複数個の音声パターンを作成し、該
    複数個のパターン間で類似性を求め、大半のパターン間
    類似度に比べ、偏差が大きく類似度が小さいパターンを
    消去して登録することを特徴とする音声パターン登録方
    式。
JP60228510A 1985-10-14 1985-10-14 音声パタ−ン登録方式 Pending JPS6287995A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60228510A JPS6287995A (ja) 1985-10-14 1985-10-14 音声パタ−ン登録方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60228510A JPS6287995A (ja) 1985-10-14 1985-10-14 音声パタ−ン登録方式

Publications (1)

Publication Number Publication Date
JPS6287995A true JPS6287995A (ja) 1987-04-22

Family

ID=16877561

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60228510A Pending JPS6287995A (ja) 1985-10-14 1985-10-14 音声パタ−ン登録方式

Country Status (1)

Country Link
JP (1) JPS6287995A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008111190A1 (ja) * 2007-03-14 2008-09-18 Pioneer Corporation 音響モデル登録装置、話者認識装置、音響モデル登録方法及び音響モデル登録処理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008111190A1 (ja) * 2007-03-14 2008-09-18 Pioneer Corporation 音響モデル登録装置、話者認識装置、音響モデル登録方法及び音響モデル登録処理プログラム
JP4897040B2 (ja) * 2007-03-14 2012-03-14 パイオニア株式会社 音響モデル登録装置、話者認識装置、音響モデル登録方法及び音響モデル登録処理プログラム

Similar Documents

Publication Publication Date Title
CA2001164C (en) Text-processing system
JP2000215313A (ja) デ―タ識別方法およびその装置
JPS6287995A (ja) 音声パタ−ン登録方式
US6438521B1 (en) Speech recognition method and apparatus and computer-readable memory
JP3031081B2 (ja) 音声認識装置
JP2882791B2 (ja) パターン比較方式
JPS6131880B2 (ja)
JP3011984B2 (ja) パターン照合方法
JPS58159598A (ja) 単音節音声認識方式
JP3056745B2 (ja) 音声認識辞書管理装置
JP2844592B2 (ja) 離散単語音声認識装置
JPS63118198A (ja) 音声認識装置
JPS6167899A (ja) 音声認識装置
KR100281581B1 (ko) 동시 조음 모델을 이용한 한국어 연속 숫자 음성인식 방법
JPS59125800A (ja) 音声認識装置
JPS61165797A (ja) 音声認識装置
JPH0535441A (ja) 文書自動作成装置
JPS6289099A (ja) 音声パタ−ン登録消去方式
JPS5898794A (ja) パタンマツチング装置
JPS62111295A (ja) 音声認識装置
JPS6193499A (ja) 音声パタ−ン照合方式
JPS6289098A (ja) 音声パタ−ン更新方式
JPH0553597A (ja) 音声認識装置およびパターン比較方法
JPS59226399A (ja) 音声認識処理方式
JPH08171398A (ja) データ認識装置、辞書作成装置及び学習装置