JP2534243B2 - 標準パタ―ン作成方法 - Google Patents

標準パタ―ン作成方法

Info

Publication number
JP2534243B2
JP2534243B2 JP61290067A JP29006786A JP2534243B2 JP 2534243 B2 JP2534243 B2 JP 2534243B2 JP 61290067 A JP61290067 A JP 61290067A JP 29006786 A JP29006786 A JP 29006786A JP 2534243 B2 JP2534243 B2 JP 2534243B2
Authority
JP
Japan
Prior art keywords
pattern
beginning
minimum
patterns
energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61290067A
Other languages
English (en)
Other versions
JPS63142395A (ja
Inventor
晴剛 安田
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61290067A priority Critical patent/JP2534243B2/ja
Priority to FR878713744A priority patent/FR2604816B1/fr
Priority to DE19873733659 priority patent/DE3733659A1/de
Priority to GB8723297A priority patent/GB2196460B/en
Publication of JPS63142395A publication Critical patent/JPS63142395A/ja
Priority to US07/464,638 priority patent/US5033089A/en
Priority to GB9017697A priority patent/GB2233137B/en
Application granted granted Critical
Publication of JP2534243B2 publication Critical patent/JP2534243B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 技術分野 本発明は、標準パターンの作成方法に関する。
従来技術 パターン認識方式の中で最も一般的なものはパターン
マッチングを利用する方法である。この方法は、あらか
じめ標準パターンを登録しておいて、新たに入力された
未知のパターンが登録されたもののうちのどれに最も類
似しているかを求めて認識するものである。この場合、
あらかじめ登録されている標準パターンの質が性能を左
右することは言うまでもなく、いかに質の高い標準パタ
ーンを形成するかが重要なポイントとなる。ここで、音
声認識におけるパターンマッチングを例にとると、音声
認識には特定話者方式と不特定話者方式があり、不特定
話者方式は、標準パターンをあらかじめメーカー側で作
成してすでに搭載しており、誰の声でも認識できるもの
で、この場合は標準パターン作成のためのデータが正常
であるか否かを確認して使用できる。一方、特定話者方
式は、使用者があらかじめ使用する言葉を登録し、認識
装置のトレーニングをしてから使用する。このため、登
録する音声パターンが正常であるかどうかの確認ができ
ず、標準パターンの質が悪くなる可能性がある。登録の
際に質を劣下するパターンの原因は、音声区間が正確に
抽出されていない場合が圧倒的に多く、発生する際の口
の開閉音、周囲の突発的雑音が発声直前直後に生じた場
合等において、音声のパターンとこれらの雑音が区別で
きず一緒に音声としてとり込んでしまう。又、音声の一
部がとり込めず欠落してしまうこともあり、これらによ
って標準パターンの質の低下を招くことになる。1つの
標準パターンを作成するのに同じ言葉について何回か発
声したパターンを平均化する方法がある。これによる
と、発声変動の統計的情報も含めることができるが、1
つのパターン作成に複数回の発声が必要となるため、そ
の内1回の発声にでも音声区間検出不良が生じると、標
準パターンの質が悪くなる。第8図は、この場合の一例
を示す図で、同図は、音声の冒頭に雑音が添加された例
で、正常なパターン(b)と雑音が添加したパターン
(a)の平均化をとる際に、通常は音声の始端同志、終
端同志を対応づけて平均化するためパターン(b)の冒
頭にパターン(a)の雑音が加算されてしまい、その結
果、平均化されたパターンは不良となってしまう欠点が
ある。この欠点を補う方法として、始端又は終端の一定
長内のエネルギー極小点の有無を調べ、片方に存在し、
もう片方に存在しない場合、その極小点までを存在しな
い方に付加する方法がある。この方法は、第9図に示す
ように、パターン(a)に付加されたノイズN(ノイズ
と仮定(実際にはノイズでないかも知れない)している
ので、その保存しておく)をノイズのないパターン
(b)と平均化する際、語頭のノイズNの部分をパター
ン(b)に付加してパターン(c)のようにして平均化
することにより音声の部分の質を高めようとするもので
ある。ところが、この方式においては、ある言葉を発声
した時にエネルギー極小点が発声によって存在したり、
しなかったり変動する場合、例えば、第10図(a)に示
すような‘イドウ’などやその一定長の閾値前後で極小
点が時間方向に変動した場合(第10図(b))、第10図
(c)に示すのように余計な情報を始端や終端に付加す
ることになりかえって辞書を悪化させる弊害が生じてい
た。
目的 本発明は、上述のごとき事情に鑑みてなされたもの
で、特に、標準パターンの質の劣化を防止することを目
的としてなされたものである。
構成 本発明は、上記目的を達成するために、登録すべき一
種の項目に対して複数のパターンを作成し、それらを平
均化又は独立に登録して作成する標準パターン作成方法
の前記複数のパターンの始端又は終端から一定長内にエ
ネルギー極小点が存在するものと存在しないパターンが
ある場合、存在するパターンの始端又は終端から極小ま
での部分を存在しないパターンに添加する手段を有する
標準パターン作成方法において、パターンの始端又は終
端からの一定長内にエネルギー極小点が存在しないパタ
ーンの始端又は終端の一定長を存在するパターンの始端
又は終端と、エネルギー極小点の始端の場合は次の、終
端の場合は前に属するエネルギーの大なるブロックとの
類似度を比較し、前者の類似性が後者より小なる場合に
上記のパターンの添加を行うことを特徴としたものであ
る。以下、本発明の実施例に基づいて説明する。
第1図は、本発明によるパターン比較方法の実施に使
用される例えば音声認識装置の一部を構成する電気回路
の一例を説明するためのブロック線図、第2図は、本発
明の動作説明をするためのフローチャートで、図中、1
はマイクロフォン、2は前処理部、3は特徴抽出部、4
は入力パターンバッファ、5は辞書パターンバッファ、
6は音声パワー計測部、7は音声区間検出部、8は冒頭
の無音チェック部、9は語尾の無音チェック部、10はブ
ロック類似度照合部、11は比較部、12はパターン付加
部、13は登録照合部、14は辞書メモリで、マイク1から
入力された音声は前処理部2で処理された後、特徴抽出
部3において、その音声の特徴量が抽出される。その特
徴量はパワースペクトル,LPC係数,ケプストラム等が広
く使われているが、本発明はこれらに限定されるもので
はない。同時に音声パワー計測部6において音声パワー
を計測し、音声区間検出部7において音声区間を検出す
る。冒頭の無音チェック部8は冒頭から一定長内に無音
区間(エネルギー極小点)があるかどうかをチェック
し、語尾の無音チェック部9は語尾から一定長内に無音
区間があるかどうかをチェックする。初回の発声は以上
の処理が行われて辞書パターンバッファ5へ格納され、
2回目の発声は、同様の処理で入力パターンバッファ4
へ格納され、辞書パターン5と入力パターンバッファ4
との間での平均化処理が行われ、標準パターンとして辞
書メモリ14に格納される。3回目以降は同様にそれまで
の標準パターンと入力パターンとの間で平均化処理が行
われることになる。
第9図に示したように語頭に雑音(口唇の開閉音や環
境ノイズ)が付加された場合は、冒頭(パターン
(a))の無音チェックによるフラグがセットされ、次
の入力(パターン(b))には雑音がないので前記従来
技術の欄で説明したようにパターン(b)にその部分が
付加され(パターン(c))、音声情報は正常に標準化
され、高品質の標準パターンを得ることができる。とこ
ろが、第10図に示すようにパターン(a)において、音
声中の語頭から一定長内に無音が生じ、パターン(b)
においては無音が生じなかった場合、パターン(c)に
示すように誤った標準パターンを生成してしまう。本発
明はこの誤生成を防止しようとするものである。
本発明においては、第3図に示すように、一方の冒頭
の一定長以内に無音区間が生じ(冒頭の一定長内に無音
区間がある場合を黒い矢印、語尾から逆上って一定長内
に無音区間がある場合を白い矢印にて示す)、もう一方
に生じなかった場合、その冒頭部分a-b間の類似度M0とb
-c間の類似度M1を求める。第3図の場合、どちらも‘i'
‘d’であり、類似度M0>M1となることは明らかであ
り、つまりM0>M1の場合においては、前記従来の処理の
手順を中止させ、冒頭に付加しないで、そのまま平均化
処理を行う。又、第4図のように、パターン(a)の冒
頭にノイズが付加してしまった場合、もしくはパターン
(b)のように音声の冒頭部分が欠落した場合、a-b間
の類似度M0とb-c間の類似度M1はM0<M1となり従来通り
付加することになる。このようにすれば、従来の機能を
そこなわず、更に、高品質な標準パターンが得られる。
次に、第5図に示すように、どちらの冒頭でも無音区
間を有する時は、前記従来技術においては付加を行わな
かった。しかしながら、第5図の場合、パターン(a)
には雑音が付加しており、その類似度M0:M1を求めるとM
0<M1となり付加した方が良い。従って、本発明におい
ては、パターンの両方に冒頭の無音区間を有する場合に
おいても、パターン(a)とパターン(b)の無音区間
数が異なる場合、同様に相互間の類似度を求め、それが
先述の条件にあてはまる場合においては、語頭のパター
ンを付加し平均化処理を行う。以上においては、語頭に
ついての説明を行ったが、語尾についても同様の処理を
行うことができる。又、冒頭における上述の処理を行う
場合において、一方が語尾の一定長内に無音区間を有す
る場合は、語頭と語尾のどちらに付加すべきかは非常に
判別しにくい。従って、このような場合は、上述の処理
を満たしても語尾の処理結果が判らないため語頭の処理
は行わず(第6図)、両パターンの両方に語尾の一定長
内の無音区間のある場合は上記語頭の処理を行うように
する(第7図)。
効果 以上の説明から明らかなように、本発明の処理を行う
ことにより、より高品質な標準パターンを得ることが可
能となる。
【図面の簡単な説明】
第1図は、本発明の実施に使用される電気回路の一例を
示すブロック線図、第2図は、本発明の動作説明をする
ためのフローチャート、第3図乃至第7図は、本発明の
動作説明をするためのパターン図、第8図乃至第10図
は、従来技術を説明するためのパターン図である。 1……マイクロフォン,2……前処理部,3……特徴抽出
部,4……入力パターンバッファ,5……辞書パターンバッ
ファ,6……音声パワー計測部,7……音声区間検出部,8…
…冒頭の無音チェック部,9……語尾の無音チェック部,1
0……ブロック類似度照合部,11……比較部,12……パタ
ーン付加部,13……登録照合部,14……辞書メモリ。
フロントページの続き (56)参考文献 特開 昭58−52698(JP,A) 特開 昭57−202599(JP,A) 特開 昭60−216391(JP,A) 特開 昭61−236598(JP,A) 特開 昭60−207197(JP,A) 特開 昭59−195292(JP,A)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】登録すべき一種の項目に対して複数のパタ
    ーンを作成し、それらを平均化又は独立に登録して作成
    する標準パターン作成方法の前記複数のパターンの始端
    又は終端から一定長内にエネルギー極小点が存在するも
    のと、存在しないパターンがある場合、存在するパター
    ンの始端又は終端から極小までの部分を、存在しないパ
    ターンに添加する手段を有する標準パターン作成方法に
    おいて、パターンの始端又は終端からの一定長内にエネ
    ルギー極小点が存在しないパターンの始端又は終端から
    の一定長を、存在するパターンの始端又は終端からの一
    定長と、始端の場合はエネルギー極小点に続く次の、ま
    た、終端の場合は前に属するエネルギーの大なるブロッ
    クの一定長との類似度を比較し、前者の類似性が後者よ
    り小なる場合に上記のパターンの添加を行うことを特徴
    とする標準パターン作成方法。
  2. 【請求項2】平均化するパターンの両方に上記極小点を
    有する場合においても、相互のパターンが有するエネル
    ギー極小点の個数が異なる場合に、特許請求の範囲第
    (1)項に記載の処理を行うことを特徴とする特許請求
    の範囲第(1)項に記載の標準パターン作成方法。
  3. 【請求項3】始端に関して前記特許請求の範囲(1)項
    又は(2)項に記載の処理をする条件を満たす場合、相
    互のパターンのどちらかの終端から一定長にエネルギー
    極小点を有する場合は始端に関する付加は行わず、両方
    の終端にエネルギー極小点が存在する場合は始端に関す
    る付加を行うことを特徴とする特許請求の範囲第(1)
    項又は第(2)項に記載の標準パターン作成方法。
JP61290067A 1986-10-03 1986-12-05 標準パタ―ン作成方法 Expired - Lifetime JP2534243B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP61290067A JP2534243B2 (ja) 1986-12-05 1986-12-05 標準パタ―ン作成方法
FR878713744A FR2604816B1 (fr) 1986-10-03 1987-10-05 Procede de comparaison de formes dans un systeme de reconnaissance de formes
DE19873733659 DE3733659A1 (de) 1986-10-03 1987-10-05 Verfahren zum vergleichen von mustern
GB8723297A GB2196460B (en) 1986-10-03 1987-10-05 Methods for comparing an input voice pattern with a registered voice pattern and voice recognition systems
US07/464,638 US5033089A (en) 1986-10-03 1990-01-05 Methods for forming reference voice patterns, and methods for comparing voice patterns
GB9017697A GB2233137B (en) 1986-10-03 1990-08-13 Methods for forming registered voice patterns for use in pattern comparison in pattern recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61290067A JP2534243B2 (ja) 1986-12-05 1986-12-05 標準パタ―ン作成方法

Publications (2)

Publication Number Publication Date
JPS63142395A JPS63142395A (ja) 1988-06-14
JP2534243B2 true JP2534243B2 (ja) 1996-09-11

Family

ID=17751358

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61290067A Expired - Lifetime JP2534243B2 (ja) 1986-10-03 1986-12-05 標準パタ―ン作成方法

Country Status (1)

Country Link
JP (1) JP2534243B2 (ja)

Also Published As

Publication number Publication date
JPS63142395A (ja) 1988-06-14

Similar Documents

Publication Publication Date Title
TW502249B (en) Segmentation approach for speech recognition systems
JP2007279742A (ja) 話者認証確認方法及び装置
JP3069531B2 (ja) 音声認識方法
EP0240329A2 (en) Noise compensation in speech recognition
JP2534243B2 (ja) 標準パタ―ン作成方法
JP3119510B2 (ja) 音声認識装置
JP5342629B2 (ja) 男女声識別方法、男女声識別装置及びプログラム
JP2534244B2 (ja) 標準パタ―ン作成方法
JPS584198A (ja) 音声認識装置における標準パタ−ン登録方式
US6438521B1 (en) Speech recognition method and apparatus and computer-readable memory
JP3428805B2 (ja) 音声認識のための音声区間始端補正方法及び装置並びに音声認識方法
JP2002516419A (ja) 発声言語における少なくとも1つのキーワードを計算器により認識する方法および認識装置
JP3020999B2 (ja) パターン登録方法
JP3032551B2 (ja) 音声標準パターン登録方法
JP2975772B2 (ja) 音声認識装置
JP4798606B2 (ja) 音声認識装置、およびプログラム
JP2882792B2 (ja) 標準パターン作成方式
JP3605011B2 (ja) 音声認識方法
JP4391031B2 (ja) 音声認識装置
JPH0119597B2 (ja)
JPH034918B2 (ja)
JP3900628B2 (ja) 音声認識装置
JPH0792675B2 (ja) 音声認識装置
JPS59170894A (ja) 音声区間の切り出し方式
JPH0376471B2 (ja)

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term