JPS63226691A - 標準パターン作成方式 - Google Patents

標準パターン作成方式

Info

Publication number
JPS63226691A
JPS63226691A JP62238510A JP23851087A JPS63226691A JP S63226691 A JPS63226691 A JP S63226691A JP 62238510 A JP62238510 A JP 62238510A JP 23851087 A JP23851087 A JP 23851087A JP S63226691 A JPS63226691 A JP S63226691A
Authority
JP
Japan
Prior art keywords
pattern
voice
patterns
section
averaging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62238510A
Other languages
English (en)
Other versions
JP2882792B2 (ja
Inventor
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP62238510A priority Critical patent/JP2882792B2/ja
Priority to DE19873733659 priority patent/DE3733659A1/de
Priority to GB8723297A priority patent/GB2196460B/en
Publication of JPS63226691A publication Critical patent/JPS63226691A/ja
Priority to US07/464,638 priority patent/US5033089A/en
Priority to GB9017697A priority patent/GB2233137B/en
Application granted granted Critical
Publication of JP2882792B2 publication Critical patent/JP2882792B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 五亙光互 本発明は、標準パターン作成方式、より詳細には、パタ
ーン認識における標準パターンの作成方式に関する。
従】」1桁 パターン認識方式の中で最も一般的なものはパターンマ
ツチングを利用する方式である。この方式は、あらかじ
め標準パターンを登録しておき、新たに入力された未知
のパターンが登録されたパターンのうちのどのパターン
に最も類似しているかを求めて認識するものである。こ
の場合、あらかじめ登録されている標準パターンの質が
性能を左右することは言うまでもなく、いかに質の高い
標準パターンを形成するかが重要なポイントとなる。こ
こで音声認識におけるパターンマツチングを例にとると
、音声認識には特定話者方式と不特定話者方式があり、
不特定話者方式は標準パターンをあらかじめメーカー側
で作成してすでに搭載しており、誰の声でも認識できる
もので、この場合は、標準パターン作成のためのデータ
が正常であるか否かを確認して使用できる。一方、特定
話者方式の場合、使用者があらかじめ使用する言葉を登
録し、認識装置のトレーニングをしてがら使用する。こ
のため、登録する音声のパターンが正常であるかどうか
の確認ができず標準パターンの質が悪くなる可能性があ
る。登録の際に質を劣化するパターンの原因は音声区間
だけが正確に抽出されていない場合が圧倒的に多く、発
声する際の・口の開閉音、周囲の突発的雑音が発声直前
、直後に生じた場合、音声のパターンとこれらの雑音が
区別できず一緒に音声としてとり込んでしまう。
又、音声の一部がとり込めず欠落してしまうこともあり
、これらによって標準パターンの質の低下を招くことに
なる。また、1つの標準パターンを作成するのに同じ言
葉について何回か発声したパターン平均化する方法があ
る。而して、この方法によると、発声の変動の統計的情
報も含めることができるが、1つのパターン作成に複数
回の発声が必要となるため、そのうちの1回の発声にで
も音声区間検出不良があると標準パターンの質が悪くな
ってしまう。
第11図は、上述のごとき音声区間不良が発生する例を
説明するための図で、同図は、音声の冒頭に雑音が添付
された例を示す図で、(a)は雑音のついたパターン、
(b)は正常なパターンで、Aは雑音、Bは音声である
。正常なパターン(b)と雑音がついたパターン(a)
の平均をとる際に通常は音声の始端同士、終端同士を対
応づけて平均化するため、音声パターンBの冒頭に雑音
パターンAが加算されてしまい、その結果、平均化され
たパターンが不良となってしまう欠点がある。
特に、特定話者方式の場合、ツメターンの登録が正常に
行われたかどうかによって認識能力が左右される。そこ
で、音声の中で弱い音が冒頭や末尾につく単語音声等で
はそれが欠落しやすいので、あらかじめ登録の際に、正
常なパターンから欠落しやすい部分を強制的に欠落させ
たパターンを登録しておくものが提案された。これなら
ば、誤って単語の検出をしてしまい、パターンの一部が
欠落したとしてもあらかじめ欠落させておいたパターン
との類似性が高くなり、正しい認識が行なえる。しかし
、例えば、英単語のhisとisのように弱い/h/の
音を落としてしまうと同じ音となり、むしろ誤り易いこ
とがある。
また、特定話者方式は装置の使用者があらかじめ音声を
登録するが、この登録の仕方には1回だけ発声するもの
、複数回発声してその平均をとるものなどがある。
第12図は、複数回発声してその平均をとるパターンマ
ツチング法の1つである2値TSP(Binary  
 Time   SpectrumPa t t e 
rn=BTSP)法の一例を説明するための構成図で1
図中、51はマイク等の集音装置、52はフィルタバン
ク、53は最小2乗による補正部、54は2値化部、5
5はBTSPの作成部、56は線形伸縮による1回発声
パターンの加算部、57は辞書部、58はピークパター
ン作成部、59は線形伸縮によるパターン長合わせ部、
60は類似度算出部、61は結果表示部で、マイクから
入力された音声は、バンドパス・フィルタ一群等を利用
して周波数分析され、周波数とその時間変化をパターン
(TSP)として表される。更にこれを周波数上のピー
クを中心として「1」。
他を「O」として2値化して2値のTSP(BTSP)
に変換し、複数回発声して得られたBTSPを重ねて標
準パターンとして登録しておく。未知の音声が入力され
た際、この音声も標準パターン作成時と同様な過程でB
TSPをつくり、あらかじめ登録しである標準パターン
と照合して各標準パターンとの類似度を求める。類似度
は未知音声のBTSPと標準パターンとを重ねた時の「
1」のエレメントの重なり具合からもとめる。通常、誰
の声でも認識できる不特定話者音声認識装置のためには
、一つの登録すべき音声について複数個の標準パターン
を作成するなど演算量を増やす手段を用いるが、この方
法では標準パターンをうまく作れば、たいした演算量の
増加もなく不特定話者用の音声認識装置の実現が容易で
あるというメリットを有している。
このような方法で、標準パターンを作成する場合、平均
をとる全てのパターンは完全であると考えている。しか
し、実際には必ずしもそうではなく、例えばfiveの
語尾の/V/の音やfullの語頭の/f/のような音
はエネルギーが非常に小さいため、これを正確に検出す
ることが難しい、従って、正常なパターンが得にくく、
ひいては標準パターンの質を劣化させるという欠点があ
った。
目     的 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、パターン認識における標準パターンの質の劣化を
防ぐこと、欠落しやすい音声の一部が欠落しても比較的
圧しい認識ができるようなパターンマツチング用テンプ
レートを登録できるようにすること、更には、高品質な
標準パターンを作成する方法を提供すること等を目的と
してなされたものである。
構   成 本発明は、上記目的を達成するために、複数の音声パタ
ーンを平均化することで行う標準パターン作成方法にお
いて、各音声パターン中に、音声生成上の不安定成分を
、該音声パターン平均化の際の必然的要素として存在さ
せたこと、或いは、複数の音声パターンを平均化するこ
とで行う標準パターン作成方法において、複数の音声パ
ターン中に存在する音声生成上の不安定成分を持つパタ
ーンと持たないパターンについて、不安定成分を持たな
いパターンに不安定成分を持つパターンの不安定成分を
付加した後、両者の平均化を行うこと、或いは、複数の
音声パターンを平均化することで行う標準パターン作成
方法において、複数の音声パターン中に存在する音声生
成上の不安定成分を持つパターンについて、不安定成分
の一部を残し、残部を削除したパターンを平均化するこ
と、或いは、複数の音声パターンを平均化することで行
う標準パターン作成方法において、複数の音声パターン
中に存在する音声生成上の不安定成分を持つ複数のパタ
ーンについて、各パターンを不安定成分と安定成分に分
離し、それぞれの成分毎に対応させて平均化した後、両
者を併合することを特徴とすることを特徴としたもので
ある。以下、本発明の実施例に基いて説明する。
第1図は、本発明の一実施例を説明するための構成図で
、この実施例は、登録すべき一種の項目に対して複数の
パターンを作成し、それらを平均化又は独立に登録して
作成する標準パターン作成方式において、前記複数のパ
ターンの始端又は終端から一定長内にエネルギーの極小
が存在するか否かを調べ、存在しないパターンがある場
合、極小を持つパターンの始端又は終端から極小までの
部分を、極小を持たないパターンの定められた位置に添
加して標準パターンとすることを特徴としたものである
第1図において、1は音声入力部、2はパワー測定部、
3は特徴量変換部、4は無音位置計測部、5は無音位置
(冒頭)判定部、6はマーク付加部、7はパターン格納
部、8はマーク判定部、9は冒頭パターン添加部、10
は重ね合せ平均処理部で、まず、マイクロフォン等によ
り音声を入力して電気信号に変換した後、音声パワーを
測定し、又、特徴量に変換する。特徴量としてはパワー
スペクトル、LPG係数、ケプストラム等が広く使われ
ているが、ここではこれらに限定するものではない。測
定したパワーから無音区間が存在するか否かを判定し、
それが存在する場合は、その位置を計測する。その無音
区間の位置が冒頭から一定位置以内に存在するかどうか
を調べ、それによって特徴変換して作られたパターンに
マークを添加する。ここでは一定値の例として冒頭から
100+ms以内に無音があるかどうかによって1例え
ば、あれば−1,なければ+1のごときマークを付加し
てパターンを格納しておく。次に、発声された同じ音声
をこの格納されたパターンに重ね合わせて、平均化する
。この際、先のパターンと同様にマークを付加し、格納
されたパターンと同じマークであるか否かを調べ、マー
クが同じ場合には通常通りの方法であらかじめ格納され
たパターンと入力されたパターンの平均処理をしてパタ
ーンを再度格納する。一方、マークが異なる場合は、一
方のパターンには無音区間があり他方にはそれがないこ
とから口唇の開閉によるノイズ等がついていると考えら
れる。そこで無音区間がない方のパターン(第2図(b
))の先頭に無音区間を有するパターンの先頭から無音
区間までを添加し、パターン(c)のようにしてからあ
らかじめ格納されているパターン(a)と対応づけて平
均をとる。このようにして必要回数だけ重ね合わせた後
にこれを標準パターンとして保持するようにする。この
ため、従来、音声信号の部分と、雑音が重ね合わされて
平均化されていたものが、雑音部と信号部が分離して平
均化できるようになり、信号部の質的劣化が防げるよう
になった。なお5以上に説明した実施例は、音声の冒頭
に発生するノイズによる質劣化の対策であるが、この方
法は音声冒頭のノイズの対策だけでなく音声終端信号の
欠落対策をも可能にする。例えば、ストップのごとき音
声終端近くに促音を持つ単語の場合、促音以後が音声区
間検出部で検出できず欠落してしまう場合が少なくない
。これも欠落するものと完全に検出できるものとが混在
する場合、冒頭のノイズと同様の結果になってしまう。
つまり、第3図に示すととく/p/音を完備したパター
ン(a)と/ p /が欠落したパターン(b)を平均
化すると、パターン(a)の/ p /音はパターン(
b)の/ o /と平均化されてしまうことになる。
第4図は、上述のごとき質の劣化を防止するようにした
パターン比較方式の一実施例を説明するための図で、図
中、11は無音位置(末尾)判定部、12は末尾パター
ン添加部で、その他、第1図に示した実施例と同様の作
用をする部分には、第1図の場合と同一の参照番号が付
しである。而して、この実施例においては、無音区間の
位置が音声末尾Looms以内かどうかを計測し、その
結果に従って前記実施例と同様のマークを付加すれば良
い。一方、同じパターンを平均化する際には、2つのパ
ターンが同じマークの時は、どちらも第3図(a)の状
態であるため、そのまま音声の始端、終端を対応づけて
平均化すれば良く、又、マークが異なる場合は、第3図
におけるパターン(a)と(b)の関係にあることがわ
かる。パターン(b)には/ p /のパターンが失な
われているため、無音区間から末尾までのパターン(a
)をそのままパターン(b)に添加した後、両パターン
の平均化を行なうことになる。こうして、平均化された
パターンの質の劣化を防ぐことができる。なお、本実施
例において、音声入力部はマイクを用いて実現でき、パ
ワー測定部は音声帯域通過フィルターの出力を測定する
ことで実現できる。
又、無音位置計測部は音声が入力されない状態で環境ノ
イズを測定しておき、音声が入力された時に先に計測し
たレベルより小なるパワーの時ここを無音区間と設定す
れば良い。通常、音声は10m5程度の間隔でサンプリ
ングされるため10サンプル以内に無音が発生するか、
或いは、無音が発生して10サンプル以内に音声終端が
あるかどうかの確認によってマークの決定をすれば良い
。なお1以上には音声パターンを例にして本発明を説明
したが、本発明は音声認識に限定するものではない、ま
た、冒頭のノイズ処理、末尾のノイズ処理は独立に使用
しても良く、両方を同時に使用しても良いことは言うま
でもない。更に、音声の冒頭、末尾の定義は必ずしもL
oomsにする必要はないことは容易に理解できよう。
以上の説明から明らかなように、この実施例によると、
突発性のノイズの直後に発声された音声や、音声の末尾
が欠落したパターンから正常な音声信号のみを平均化し
て標準パターンを作成することができる。
第5図は、本発明の他の実施例を説明するための構成図
で、この実施例は、音声を特徴バラメー夕に変換して登
録するパターン登録方式において、入力信号を周波数分
析し、低域周波数成分と高域周波数成分の大きさを比較
する手段、及び、音声の区間を検出する手段を有し、音
声の始端又は終端において高域成分が低域成分に比して
大なる時、この状態の継続長を測定し、該高域成分が強
い部分を本来の長さより短かくしたパターンを登録する
ようにしたことを特徴としたものである。
第5図において、21はマイクロフォン、22は音声区
間検出回路、23はフィルタバンクで、23aは低域領
域フィルタ、23bは高域領域フィルタ、24は乗算部
、25は比較部、26はレジスタ、27はタイムカウン
ト、28は乗算部、29は始端移動部で1例えば 11
 hi sI+のような単語を登録することを考える。
まず、マイクからhisの音声を入力すると音声区間検
出部で単語音声に係るものだけをとり出し、フィルタバ
ンクへ転送する。ここでは便宜上音声区間検出部の次に
フィルタバンクがあるが、これは逆配置であっても差し
支えない。音声区間の検出方法は音声が入力される前の
マイクから信号を測定しておき。
それより大きなエネルギーが検出された部分を音声区間
とするようなものが知られているが、その他どのような
方法であっても問題ない。ただし。
音声検出のズ値をあまり低く設定゛するとわ・ずかな雑
音でも音声と判断してしまう。しかし、これをあまり高
く設定すると、語頭、語尾の小さい音を落してしまうこ
ととなる。又、ここでは周波数分析の方法としてフィル
タバンクを用いているが。
FFT等の方法によっても良いことは言うまでもない、
このフィルタバンクの高域の出力と低域の出力を比較す
るが、通常の音声分析に必要な帯域とされている200
〜600o七中の2000〜6000Hzあたりを高域
、それ以下を低域としている。しかも特に高域が強い音
を検出するため。
低域の2倍より高域のパワーの方が大なる部分が音声区
間の始端又は終端にある時、その部分の長さを計測する
。この場合、音声始端から高域の強い部分の長さを計測
するのは容易であるが、終端での長さを計測するのは始
端程容易ではない。そのため、第6図に示すように高域
大を示す信号(a)と音声区間を示す信号(b)を伴せ
て検出しながら高域信号(a)が立ち上ると共にカウン
タをスタート(T、)L、高域信号の立下りと共にカウ
ンタを止めて(T2)クリアする。これをくり返し、音
声終了信号時に得られている値を終端高域継続長(T、
)であるとする。ここではそれらの継続長を173にし
たパターンを新たに作り、これを登録するようにした。
この関係を第7図に示す。而して、従来は強制的に/n
/の部分を捨てて登録していたが、これではisと区分
がつかない。そこでhとiのわたりの部分も含めて登録
しておくことにより、テンプレートの段階でhisとi
sの区分ができるようにした。区間検出部で切り落とす
場合にはエネルギーの小さな/h/の部分は落しやすい
が、エネルギーの大きな母音部/i/を落とすことはな
い。このため/h/から/ i /へのわたりの部分を
落とすことはまれである。つまりテンプレートのパター
ン長が/h/を欠落した時とほぼ同じ長さにし、/n/
の情報をわずかながら残しておくことで認識精度が向上
することになる。
従って、この実施例によると、音声パターンの一部が欠
落しても正しい認識ができるようなテンプレートが登録
できる。
第8図は、本発明の他の実施例を説明するためのフロー
チャート、第9図は、第8図に示した実施例の実施に使
用して好適な電気−路の一例を示すブロック図で、この
実施例は、音声を集音する機能と、それを特微量に分析
する手段を有し、登録すべき一つの音声について複数回
発声して得られた各特微量(特徴パターン)を処理して
作成するパターン作成方式において、特徴パターンの先
頭又は末尾に周波数の高い成分を有するパターンと該高
周波数成分を有さないものが存在する時、該高周波数成
分の部分をとり除いたパターンを処理し、処理した結果
に高周波数成分の部分を添附して作成するようにしたこ
とを特徴とするものである。
第9図において、31はマイクロフォン、32は音声区
間検出部、33aは高域フィルタ、33bは低域フィル
タ、34は比較部、35a、35bはレジスタ、36a
、36bは平均化部、37は加算部、38はパターンレ
ジスタで、以下、第8図に示したフローチャートを参照
しながら説明する。まず、パターンを作成すべき音声を
入力し。
その音声の語頭か語尾に高い周波数成分が含まれている
かどうかを調べる。あればその部分だけを別に分け、1
つの言葉について何回か発声した音声を各々分けた部分
について平均化し、最終的に両者を結合してパターンを
作成する。つまり、この何回かの発声中にこの高周波成
分を含む部分が欠落しても両者を別々に平均化して最後
に結合するため、欠落が補える。今、第9図において、
マイクから入力された音声は高域と低域の帯域フィルタ
を通り両者の比較によって高周波成分を持つか否かが決
定される。マイクから入力された信号の中から音声区間
だけを検出し、その区間の冒頭か末尾に高域成分がある
かどうかを見る。ある場合はスイッチSがレジスタ35
b側へ倒され、ない場合はレジスタ35aと接触してい
る。つまり冒頭、末尾の高周波数成分がレジスタ35b
へ、その他がレジスタ35aに格納されることになる。
例えば1つの言葉を3回発声するとするなら、3回分が
レジスタ内に貯えられたところで各々のレジスタ内のパ
ターンを平均化し、つなぎ合わせる。
この場合、レジスタ35bの内容が音声区間の冒頭につ
くものならば平均化されたレジスタ35aの先頭にレジ
スタ35bの内容をっけ、末尾のデータがレジスタ35
bに入っている時には末尾につける。この時音声区間の
検出はいくつかの方法が知られているが、入力の信号の
エネルギーの変化を見て、エネルギーの大きい部分を音
声区間とする方法が一般的であるが、これはどのような
方法に従っても良い、又、平均化の方法は特にそれ以後
のパターンの使用目的によっても異なるが。
ここでは例として次のような方法を示しておく。
三つのパターンの平均をとる際に、一番短かいパターン
にパターン長を合わせて均等にデータを取って加え合わ
せる。このようにして出来たパターンは欠落しやすい部
分を完備した質の良い標準パターンとなっている。
第10図は、本発明の他の実施例を説明するための電気
的ブロック図で、この実施例は、特徴パターンの先頭又
は末尾に周波数の高い成分を有するパターンと該高周波
数成分を有さないものが存在する時、該高周波成分を有
さないパターンに有するものの該当する部分を添付して
から処理するようにしたものである。
第10図において、41はマイクロフォン、42は音声
区間検出部、43aは高域フィルタ。
43bは低域フィルタ、44は比較部、45はレジスタ
、46はフラグチェック部、47はパターンつなぎ部、
48は加算部、49はパターンレジスタで、マイクから
の信号に高域があるかどうかのチェックをするまでは、
第8図及び第9図に示した実施例と同様であるので、そ
れ以後について説明をする。まず、冒頭、末尾に高周波
数成分があるかないかでフラグを立ててフラグと共にレ
ジスタに格納する。全ての発声が終ったところでそれら
の発声の中でフラグが他と異なるものが存在するかどう
かのチェックをする。この時、全発声にフラグがあるか
全てにない時、そのまま平均を求め、そうでないときは
フラグがないパターンの先頭、又は末尾にフラグがある
パターンの高域成分の部分をつけ加えた後、平均してパ
ターンレジスタへ登録する。このようにして得られたパ
ターンは欠落部が補われて質の高いものとなっている。
従って、この実施例によると、パターンの欠落があって
も正常な質の高い標準パターンが作成できる。
効   果 以上の説明から明らかなように、本発明によると、突発
性のノイズの直後に発声された音声や、音声の末尾が欠
落したパターンから正常な音声信号のみを平均化して標
準パターンを作成することができる。又、音声パターン
の一部が欠落しても正しい認識ができるようなテンプレ
ートが登録できる。更には、パターンの欠落があっても
、正常な質の高い標準パターンが作成できる等の利点が
ある。
【図面の簡単な説明】
第1図は、本発明の一実施例を説明するためのブロック
線図、第2図は、第1図に示した実施例を説明するため
のパターン図、第3図は、本発明の他の実施例を説明す
るためのパターン図、第4図は、第3図に示した実施例
を実施するためのブロック線図、第5図は、本発明の他
の実施例を説明するためのブロック線図、第6図及び第
7図は、第5図に示した実施例の動作説明をするための
図。 第8図は、本発明の他の実施例を説明するためのフロー
チャート、第9図は、第8図に示した実施例の実施に使
用する電気回路の一例を示すブロック図、第10図は、
本発明の他の実施例を説明するためのブロック図、第1
1図乃至第13図は、本発明の技術背景を説明するため
の図で、第11図は、音声パターン図、第12図は、B
TSP説明図、第13図は、パターン図である。 1・・・音声入力部、2・・・パワー測定部、3・・・
特徴量変換部、4・・・無音位置計測部、5・・・無音
位置(冒頭)判定部、6・・・マーク付加部、7・・・
パターン格納部、8・・・マーク判定部、9・・・冒頭
パターン添加部、10・・・重ね合わせ平均処理部、1
1・・・無音位置(末尾)判定部、12・・・末尾パタ
ーン添加部、21・・・マイクロフォン、22・・・音
声区間検出回路、23・・・フィルタバンク、23a・
・・低域領域フィルタ、23b・・・高域領域フィルタ
、24・・・乗算部、25・・・比較部、26・・・レ
ジスタ、27・・・タイムカウント、28・・・乗算部
、29・・・始終端移動部、31・・・マイクロフォン
、32・・・音声区間検出部、33a・・・高域フィル
タ、33b・・・低域フィルタ、34・・・比較部、3
5a、35b・・・レジスタ、36a、36b・・・平
均化部、37・・・加算部、38・・・パターンレジス
タ、41・・・マイクロフォン、42・・・音声区間検
出部、43a・・・高域フィルタ、43b・・・低域フ
ィルタ、44・・・比較部、45・・・レジスタ、46
・・・フラグチェック部、47由パターンつなぎ部、4
8・・・加算部、49・・・パターンレジスタ。 藁 I 図 ! 2 図 第3図 g 4 図 第5図 第6図 第7図 第8図 第9図

Claims (4)

    【特許請求の範囲】
  1. (1)複数の音声パターンを平均化することで行う標準
    パターン作成方法において、各音声パターン中に、音声
    生成上の不安定成分を、該音声パターン平均化の際の必
    然的要素として存在させたことを特徴とする標準パター
    ン作成方式。
  2. (2)複数の音声パターンを平均化することで行う標準
    パターン作成方法において、複数の音声パターン中に存
    在する音声生成上の不安定成分を持つパターンと持たな
    いパターンについて、不安定成分を持たないパターンに
    不安定成分を持つパターンの不安定成分を付加した後、
    両者の平均化を行うことを特徴とする標準パターン作成
    方式。
  3. (3)複数の音声パターンを平均化することで行う標準
    パターン作成方法において、複数の音声パターン中に存
    在する音声生成上の不安定成分を持つパターンについて
    、不安定成分の一部を残し、残部を削除したパターンを
    平均化することを特徴とする標準パターン作成方式。
  4. (4)複数の音声パターンを平均化することで行う標準
    パターン作成方法において、複数の音声パターン中に存
    在する音声生成上の不安定成分を持つ複数のパターンに
    ついて、各パターンを不安定成分と安定成分に分離し、
    それぞれの成分毎に対応させて平均化した後、両者を併
    合することを特徴とする標準パターン作成方式。
JP62238510A 1986-10-03 1987-09-22 標準パターン作成方式 Expired - Lifetime JP2882792B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP62238510A JP2882792B2 (ja) 1986-10-03 1987-09-22 標準パターン作成方式
DE19873733659 DE3733659A1 (de) 1986-10-03 1987-10-05 Verfahren zum vergleichen von mustern
GB8723297A GB2196460B (en) 1986-10-03 1987-10-05 Methods for comparing an input voice pattern with a registered voice pattern and voice recognition systems
US07/464,638 US5033089A (en) 1986-10-03 1990-01-05 Methods for forming reference voice patterns, and methods for comparing voice patterns
GB9017697A GB2233137B (en) 1986-10-03 1990-08-13 Methods for forming registered voice patterns for use in pattern comparison in pattern recognition

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP23690286 1986-10-03
JP61-236902 1986-10-03
JP62238510A JP2882792B2 (ja) 1986-10-03 1987-09-22 標準パターン作成方式

Publications (2)

Publication Number Publication Date
JPS63226691A true JPS63226691A (ja) 1988-09-21
JP2882792B2 JP2882792B2 (ja) 1999-04-12

Family

ID=26532936

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62238510A Expired - Lifetime JP2882792B2 (ja) 1986-10-03 1987-09-22 標準パターン作成方式

Country Status (1)

Country Link
JP (1) JP2882792B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9129611B2 (en) 2011-12-28 2015-09-08 Fuji Xerox Co., Ltd. Voice analyzer and voice analysis system
US9153244B2 (en) 2011-12-26 2015-10-06 Fuji Xerox Co., Ltd. Voice analyzer

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60216391A (ja) * 1984-04-12 1985-10-29 株式会社リコー 音声認識における辞書作成方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60216391A (ja) * 1984-04-12 1985-10-29 株式会社リコー 音声認識における辞書作成方式

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9153244B2 (en) 2011-12-26 2015-10-06 Fuji Xerox Co., Ltd. Voice analyzer
US9129611B2 (en) 2011-12-28 2015-09-08 Fuji Xerox Co., Ltd. Voice analyzer and voice analysis system

Also Published As

Publication number Publication date
JP2882792B2 (ja) 1999-04-12

Similar Documents

Publication Publication Date Title
EP0077194B1 (en) Speech recognition system
Deshmukh et al. Use of temporal information: Detection of periodicity, aperiodicity, and pitch in speech
US5033089A (en) Methods for forming reference voice patterns, and methods for comparing voice patterns
JPS6060080B2 (ja) 音声認識装置
JPS60200300A (ja) 音声の始端・終端検出装置
JPS63226691A (ja) 標準パターン作成方式
JPS59121099A (ja) 音声区間検出装置
JP2882791B2 (ja) パターン比較方式
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
JPS6194095A (ja) 音声認識装置
JP3049711B2 (ja) 音声処理装置
JPH0682275B2 (ja) 音声認識装置
JP2666296B2 (ja) 音声認識装置
JPH0376471B2 (ja)
JP3063855B2 (ja) 音声認識におけるマッチング距離値の極小値探索方法
JP2844592B2 (ja) 離散単語音声認識装置
JP3020999B2 (ja) パターン登録方法
JPS59170894A (ja) 音声区間の切り出し方式
JP3032551B2 (ja) 音声標準パターン登録方法
JP2901976B2 (ja) パターン照合予備選択方式
JP3063856B2 (ja) 音声認識におけるマッチング距離値の極小値探索方法
JPH0640274B2 (ja) 音声認識装置
JPH05108088A (ja) 音声区間検出装置
JPH02232698A (ja) 音声認識装置
JPS63131197A (ja) パターン比較方法

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080205

Year of fee payment: 9