JPS61254994A - 連続単語認識装置 - Google Patents

連続単語認識装置

Info

Publication number
JPS61254994A
JPS61254994A JP60096208A JP9620885A JPS61254994A JP S61254994 A JPS61254994 A JP S61254994A JP 60096208 A JP60096208 A JP 60096208A JP 9620885 A JP9620885 A JP 9620885A JP S61254994 A JPS61254994 A JP S61254994A
Authority
JP
Japan
Prior art keywords
pattern
word
standard
fixed
patterns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60096208A
Other languages
English (en)
Inventor
藤井 浩美
誠夫 亘理
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP60096208A priority Critical patent/JPS61254994A/ja
Priority to DE8686106172T priority patent/DE3670390D1/de
Priority to EP19860106172 priority patent/EP0202534B1/en
Publication of JPS61254994A publication Critical patent/JPS61254994A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、連続単語認識装置における認識精度の向上技
術に関する。
(従来技術とその問題点) 音声認識は、計算機にデータやコマンドを入力する手段
として有効であり、従来から多くの認識装置が発売され
ている。それらの装置における認識の原理としては、パ
ターンマツチング法が広く用いられている。この方法は
、認識対象となる単語の標準的な音声パターンを1個ま
たは複数個用意しておき、未知の発声、すなわち入力パ
ターンが与えられると標準パターンと比較を行い、最も
類似した標準パターンのカテゴリーである単語を認識結
果とするものである。この方法によって、離散的に発声
された単語の認識においては充分に高い認識率が得られ
ている。
連続発声された単語の場合も、このパターンマツチング
法の原理で認識することができるが、連続した発声では
、前後に連結された音韻の影響のためパターンの物理的
特徴が歪む“調音結合”という現象が起こる。そのため
、離散的に発声された単語の標準パターンとは大幅に異
なるパターンとなり、誤認識を生じる原因となりていた
。また連続発声の場合、母音の無声化や鼻音化、発声の
省略などの変形も起こりやすい。この変形も誤認識の原
因でありた。
これらの調音結合や発声の多様性に対処する方法として
現在提案されているものに“固定パターンを用いた半単
語対標準パターン方式による連続単1wgw&法”があ
る。この方法は、離散発声された単語と連続発声された
単語列から、半単語対標準パターンを作成し、それらを
標準パターンとして用いる点と、利用者以外の話者によ
る変動パターンを標準パターンとして持つことを特徴と
している。変動パターンは、あらかじめ固定的に保持さ
れているため固定パターンと呼ばれるものとする。半単
語対標準パターン方式については特願昭56−0636
66号明細書「連続単語認識装置」(文献1)に詳しく
記載されている。以下に、固定パターンを用いた半単語
対標準パターン方式における半単語対標準パターンの作
成と認識処理について説明する。
まず始めに、固定パターンとして数種の変形を受けた離
散発声を用意し、それと、利用者の離散発声単語とから
離散半単語対パターンを作成する。
固定パターンと離散発声パターンにおける単語中央特徴
点を求め、その特徴点より前半部分と、後半部分をそれ
ぞれ離散半単語対パターンとする。
次に、連続発声単語より連続手単語対パターンを作成す
る。連続発声した単語列と中央特徴点の定められた離散
発声単語との間でパターンマツチングを行うことにより
、対応する特徴点を連続発声単語上に求め、前の単語の
中央特徴点から後の単語の中央特徴点までを連続手単語
対パターンとする、このようにして求められた離散、お
よび連続手単語対パターンを標準パターンとして、パタ
ーンマツチング法による認識処理が行われる。認識結果
は、最大の類似度が得られた標準パターン系列のカテゴ
リ名列として得られる。この際、標準パターンの連結が
不連続にならないように、オートマトン制御のらとにパ
ターンマツチングが行われる。文献lでは、この方法は
調音結合、および発声の多様化に対して有効であるとさ
れている。
すなわち1作成された半単語対標準パターンが、単語間
境界における調音結合による変形の物理的特徴を、その
まま持つことができるためである。
また、発声の多様性に対しては、変動パターンとして固
定パターンが前もって用意されているため登録時の利用
者の発声lこない変動でも正しく認識し得るためである
しかし、固定パターンは、あくまでも利用者以外の話者
の発声である。そのため、固定パターンが利用者の他の
カテゴリーのパターンに類似している場合には、認識時
にエラーが多発する原因となっていた。すなわち、従来
の固定パターンでは。
発声の多様性に対応するには限界があった。
(発明の目的) 本発明は、従来の欠点をなくすと共に、登録の手間を増
すことなく、しかも発声の多様性に、より対応できる変
形標準パターンを用意することができる、高精度の音声
認識装置を提供することを目的とする。
(発明の構成) 本発明による連続単語認識装置は、あらかじめ固定的に
用意されている固定パターンを格納する固定パターン格
納部と、利用者によって発声された登録用パターンを格
納する登録用パターン格納部と、前記固定パターン格納
部と登録用パターン格納部のパターンを用いて、連続単
語対における前の単語の中央特徴点より後の単語単語中
央特徴点までの特徴パラメータよりなる半単語対標準パ
ターンを作成する標準パターン作成部と、前記標準パタ
ーン作成部における標準パターン作成時に得られる情報
をもとに標準パターン格納部の固定半単語対パターンを
修正する固定半単語対パターン修正部と、前記標準パタ
ーン作成部で作成された標準パターン、および前記固定
パターン修正部で得られた修正された固定半単語対パタ
ーンを格納する標準パターン格納部と、利用者によって
発声された入力パターンを格納する入力パターンバッフ
ァと、前記標準パターン格納部の半単語対標準パターン
の連として入力パターンを認識し、半単語対パターンの
連接が接続部位において矛盾が生じないようlこ制御す
るための有限状憧オートマトンの制御のもとに動作する
認識処理部とを有することを特徴とする。
(本発明の原理) 本発明の原理は、利用者により発声された登録パターン
のうち、標準パターンとして切りだした残りの部分、つ
まり、未使用の部分を利用して他人のパターンである固
定パターンを修正することにより、より利用者の音声に
適した修正固定パターンを作成しようとするものである
。すなわち、本発明の構成に、固定パターン修正部を設
けることで、より質の高い標準パターンの作成を可能と
するものである。
(実施例) 第1図は1本発明の構成を示す図である。固定パターン
格納部1には、固定的に標準パターン群が保持されてい
る。ここでいう標準パターンとは、認識の対象となる単
語の音声データであり、一般に特徴ベクトルの時系列で
表現される。上記の固定的に保持されている標準パター
ン(以下固定パターンと呼ぶ)としては、専門家が音声
学の知識をもとに、考えられる変形パターンを発声した
もの、または、多くのパターンの中から各種の変形を受
けたパターンを選んだものを用いる。ここでは、固定パ
ターンを以下のように表すことにする。
B”  (m:発声単語p fi +発声回数)本発明
における連続単語認識装置の動作は、利用者の発声した
登録用パターンと、前記固定パターン格納部1の固定パ
ターンとから半単語対標準パターンを作成する標準パタ
ーン作成モードと、認識処理を行う認識モードとに分か
れている。
標準パターン作成モードでは、離散発声から離散半単語
対パターンを作成し、次に、連続発声から連続半牟梧対
パターンを作成する@そして、最後に固定パターンの修
正を行う。ここでは、認識対象として数字を例にとり、
説明する。
まず、利用者が発声した離散発声“θ″〜“9”の音声
データ(人” ;m=0.1 、・・・、 9   n
=1)が入力されると、それらのデータは特徴パラメー
タの時系列として登録用パターン格納部2に格納される
。標準パターン作成部3では、fL録用パターン格納部
2に保持された離散発声データから単鎖中央特徴点を求
め、その特徴点より前を前半パターン、後を後半パター
ンとして標準パターン格納部4へ送りこむ。単語中央特
徴点の求め方は、前記文献1に記述されている方法と同
じものを用いることができる。すなわち、例えば、′3
”V、、、/)が入力された場合には、その単語区間の
時間的中間点を単語中央特徴点とする。という方法を用
いることができる。この様子を模式的に第2図に示す。
求められた“3”の前半パターンをAI (φ、3)、
後半パターンを人i(3,φ)と表すことにする。同様
にして、固定パターン格納部1の固定パターン(B” 
;m=0,1 、− 、9 、 n = l )lこ対
しても中間特徴点を求め、固定離牧半単語対標準パター
ン (B’(φ、0)、B”(0,φ)〜Bl(φ、9
)、B凰(9,φ) )を作成する。このようにして、
利用者の離散パターンと固定パターンの両方から半単語
対標準パターンを作成し、標準パターン格納部4へ格納
する。
次に、′OO”〜“99″の2桁連続発声が利用者によ
り発声され、離散発声と同様に登録用パターン格納部2
に格納される。標準パターン作成部3では、登録用パタ
ーン格納部2に保持された連続発声のデータから、連続
手単語対パターンを切り出す。連続手単語対パターンと
は、2桁連続発声における1桁目の後半と2桁目の前半
部分である。
連続手単語対パターンの切り出し方は、前記文献1番こ
記載されている方法を用いる。すなわち、2桁の連続発
声を入力パターンとし、それと対応する離散半単語対パ
ターンの連結パターンを標準パターンとして、パターン
マツチングを行い、最適な時間的対応付けがされた場合
の類似度を求める・利用者の離散半単語対パターンと固
定パターンから作成した半単語対パターンのすべての組
み合わせに対して同様に類似度を求め、最も類似度の大
きい組み合わせに対して切り出しを行う。切り出すのは
、1桁目の後半生単語対パターンと2桁目の前半生単語
対パターンに対応する部分である。例として、連続発声
″58”(/gohachi/)が、利用者のパターン
“5”と固定パターン“8”の連結のパターンと最も類
似度が大きいとすると、人!(5,φ)、B’(φ、8
)に対応する部分が、半単語対パターン(5,8)とし
て切りだされ標準パターン格納部41こ格納される。そ
の様子を第3図1こ模式的に示す。
連続手単語対パターンが作成されると、次に固定パター
ン修正部7において固定半単語対パターンの修正が行わ
れる。修正は、連続手単語対パターンの切り出しの際の
未使用部分の情報、すなわち、第3図において(φ、5
)(8,φ)にあたる部分の情報を用いて行われる。こ
こでは、例として、固定パターンをこの未使用部分で置
き換えるという操作を行うことにする。第4図にBl(
φ、5)という固定半単語対パターンの修正の例を示し
た。
考え方は、特定の固定半単語対パターンを、最もその固
定半単語対パターンと似ている連続パターンの未使用部
分で置き換えるというものである。
すなわち、第4図の例でいうと、固定半単語対パターン
Bl(φ、5)に代わる連続パターンの未使用部分は、
切り出しの際に固定半単語対パターンとマツチングされ
た連続パターンの未使用部分うち。
最も距離の小さいものである。修正する固定半単語対パ
ターンの決定の仕方は、いくつか考えられる。たとえば
、連続手単語対パターンの切り出しに用いられた固定半
単語対パターン全てζこ対して修正する方法、距離の小
さいものから数個修正する方法などが考えられる@ 以上説明したように、離散半単語対パターン、連続手単
語対パターンの作成と、固定半単語対パターンの修正が
終了し、それぞれのパターンが標準パターン格納部4に
格納されることによって、標準パターン作成モードが終
了する。
認識モードでは、認識処理部6においてパターンバッフ
ァ5に入力された複数桁連続数字と、標準パターン格納
部4の半単語対パターンの連結パターンをパターンマツ
チングし、認識を行う。認識にあたっては、求められる
結果、および、半単語対パターンの接続に矛盾が生じな
いように有限状態オートマトンで制御を行う。たとえば
、(φ、3)のパターンのあとには、(3,x)x=φ
、0,1,2゜・・・、9が接続しなくてはならない、
という制限である。このような有限状態オートマトンの
制御のもとて認識処理を行う認識処理部6の構成と動作
および有限状態オートマトンは、前記明細書に記されて
いるのでここでは省略する。
結果は、許される半単語対パターンの接続系列の中で、
最も類似度の大きいものから、求められる。たとえば、
(φ、7)(7,6)(6,φ)という系列が得られた
とすると認識結果は“76″となる。
以上、本発明の原理を実施例をもとに説明したが、この
例の記載事項は本発明の範囲を限定するものではない。
たとえば、固定パターンとしては、離散発声パターンだ
けでなく連続発声パターンも用いることができ、その場
合lこ、用いた固定連続発声パターンに対して修正を行
うことも可能である。また、すべての固定パターンを標
準パターンとして認識に用いる必要はなく、一部のみを
用いてもよい。さらに、固定半単語対パターンの修正は
置き換えである必要はなく、平均パターンや重み付けし
た平均パターンを作成する方法、またはパターンを追加
する方法などを用いてもよい。
(発明の効果) 本発明では、登録用パターンの未使用部分を利用するた
め登録の手間を増すことなく、利用者の音声に適した標
準パターンを増やすことができる。
それにより、認識の確実性が上がり認識率が向上する。
さらに、固定パターンを利用者のパターンで修正するこ
とにより、質の悪い固定パターン、すなわち、異なるカ
テゴリーと距離が近くエラーを起こしやすい固定パター
ンを減らすことができる。そのため、誤認識が減少する
という利点が生じる。
【図面の簡単な説明】
第1flは5本発明の基本的な構成を示す図、第2図、
第3図は、標準パターンの切り出しの原理を説明するた
めの図、第4図は、固定半単語対パターンの修正を示す
図である。 図において、 1・・・固定パターン格納部、2・・・登録用パターン
格納部、3・・・標準パターン作成部、4・・・標準パ
ターン格納部、5・・・入力パターンバッファ、6・・
・認識処理部、7・・・固定パターン修正部。

Claims (1)

    【特許請求の範囲】
  1. あらかじめ固定的に用意されている固定パターンを格納
    する固定パターン格納部と;利用者によつて発声された
    登録用パターンを格納する登録用パターン格納部と;前
    記固定パターン格納部と登録用パターン格納部のパター
    ンを用いて、連続単語対における前の単語の中央特徴点
    より後の単語単語中央特徴点までの特徴パラメータより
    なる半単語対標準パターンを作成する標準パターン作成
    部と;前記標準パターン作成部における標準パターン作
    成時に得られる情報をもとに標準パターン格納部の固定
    半単語対パターンを修正する固定半単語対パターン修正
    部と;前記標準パターン作成部で作成された標準パター
    ン、および前記固定パターン修正部で得られた修正され
    た固定半単語対パターンを格納する標準パターン格納部
    と;利用者によつて発声された入力パターンを格納する
    入力パターンバッファと;前記標準パターン格納部の半
    単語対標準パターンの連として入力パターンを認識し、
    半単語対パターンの連接が接続部位において矛盾が生じ
    ないように制御するための有限状態オートマトンの制御
    のもとに動作する認識処理部とを有することを特徴とす
    る連続単語認識装置。
JP60096208A 1985-05-07 1985-05-07 連続単語認識装置 Pending JPS61254994A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP60096208A JPS61254994A (ja) 1985-05-07 1985-05-07 連続単語認識装置
DE8686106172T DE3670390D1 (de) 1985-05-07 1986-05-06 System zur erkennung kontinuierlicher sprache.
EP19860106172 EP0202534B1 (en) 1985-05-07 1986-05-06 Continuous word recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60096208A JPS61254994A (ja) 1985-05-07 1985-05-07 連続単語認識装置

Publications (1)

Publication Number Publication Date
JPS61254994A true JPS61254994A (ja) 1986-11-12

Family

ID=14158841

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60096208A Pending JPS61254994A (ja) 1985-05-07 1985-05-07 連続単語認識装置

Country Status (1)

Country Link
JP (1) JPS61254994A (ja)

Similar Documents

Publication Publication Date Title
US7275034B2 (en) Word-specific acoustic models in a speech recognition system
JP4499389B2 (ja) 音声処理のためのデシジョン・ツリーの質問を生成するための方法および装置
JP2820093B2 (ja) 単音節認識装置
JPS61254994A (ja) 連続単語認識装置
EP0202534B1 (en) Continuous word recognition system
JPH09292899A (ja) 音声認識装置
JP2000214879A (ja) 音声認識装置の適応化方法
JPS61254993A (ja) 連続単語認識装置
JPH04271397A (ja) 音声認識装置
JPS6073592A (ja) 特定話者用音声認識装置
JP3291073B2 (ja) 音声認識方式
JP3818154B2 (ja) 音声認識方法
JPS5934595A (ja) 音声認識処理方式
JP2000122693A (ja) 話者認識方法および話者認識装置
JPS6312000A (ja) 音声認識装置
JPS62111292A (ja) 音声認識装置
JP2712586B2 (ja) 単語音声認識装置用パターンマッチング方式
JPS59195299A (ja) 特定話者音声認識装置
JPS5977500A (ja) 単語音声認識方式
Smyth Segmental sub-word unit classification using a multilayer perceptron
JPH0119596B2 (ja)
JPS62249198A (ja) 単語音声認識装置
JPS63147198A (ja) 単語音声検出方式
JPS62147492A (ja) 音声認識装置における標準パラメ−タの修正方法
JPH0484196A (ja) 連続音声認識用登録パターン作成方法