JPS5818778A - パタン認識方式 - Google Patents

パタン認識方式

Info

Publication number
JPS5818778A
JPS5818778A JP56116969A JP11696981A JPS5818778A JP S5818778 A JPS5818778 A JP S5818778A JP 56116969 A JP56116969 A JP 56116969A JP 11696981 A JP11696981 A JP 11696981A JP S5818778 A JPS5818778 A JP S5818778A
Authority
JP
Japan
Prior art keywords
similarity
standard
unknown
recognition
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56116969A
Other languages
English (en)
Other versions
JPH0226262B2 (ja
Inventor
Hidefumi Oga
大賀 英文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP56116969A priority Critical patent/JPS5818778A/ja
Publication of JPS5818778A publication Critical patent/JPS5818778A/ja
Publication of JPH0226262B2 publication Critical patent/JPH0226262B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は複数の未知バタンの組み合せを認識するバタン
認識方式に関し、特に単語音声を認識するに際し単語音
声の組み合せにより認識対象の数を増大させる場合に、
より高い認識率が得られる方式を提供するものである。
音声単語認識の場合に、認識でき得る語粟数は限られて
おり、無限語案の認識を、音声単語認識装置自体で行な
わせる事は現状では不可能である。
認識時間、又は識別出来得る能力の点から現状はせいぜ
い100〜200単語である。しかし次に示す様な方法
でみかけ上認識語粟数を増大させたり、あるいは認識対
象の数を増大させたりすることが従来から行なわれてい
る。
以下これを第1図、第2図を用いて説明する。
第1図は構成を示すもので、1は音声認識部である。未
知なる音声単語は、周波数分析等により40゛像が抽出
されて未知バタンXに変換され、これは未知バタンエリ
ア2へ格納される。3は標準バタンエリアで、複数の標
準バタンY(d 、 Y(1) 、 Y(21゜・・・
・・・Y (k)・・・・・・Y(8)が格納されてい
る。4は類似度算出部で未知パタンXと標準パタンY 
(k)との類似度S (k)を算出する。6は判定部で
、この類似度の最も高い値mにx S (k) f抽出
しかつこのm(2xS (k)がすでに定められたしき
い値りより大なる時max S (k)を与えたY (
k)を出力する。一方maw 5(klk      
                         
kがLより少なる時には、棄却される。音声認識部1は
 未知バタンエリア2、標準バタンエリア3、類似度算
出部4、判定部6より構成される。
今、この音声認識部1の認識でき得る語雲数が3単語で
あるとし、この音声認識部を使用して見かけ上認識対象
の数を増大させる場合について説明する。
7は音声認識部とは別に標準パタンを格納している標準
バタン格納部であり、これは標準バタン3個分よりなる
ブOyりB、Bo、B1.B2゜Boo 、BOl 、
〜B22.より構成されている。
第2図は、ブロックB、B○、〜B22と、各標準パタ
ンZゆi、Z(1)・・・・・・Z(0,0)、Z(0
゜1)−’−・−Z(0,0,0)−−−−−−Z(2
,2゜2)との関係、および各標準バタン間の概念関係
を示している図である。標準パタン(0、0、0)。
Z(0,0,1)、Z(0,0,2)の−上位概念が標
準パタンz(0,0)であり、Z(o、o)。
Z(o、1 )、Z(0,2)(7)上位概念の標準・
くタンが、Ztc))である事を示す。
以下他の標準パタンについても同様で、こねらの関係を
一般にツリー構造と呼ぶ。例えば住所○○市、○○区、
○○町、を表現する場合、Zlo)。
Z(1)、Z(21に市に対応する標準パタンをZ(0
゜0)〜Z (2、2)に区に対応する標準パタンを、
Z (’O、o 、O)〜Z (2、2、2)K:町ニ
N応する標準パタンを割り合てておく。それぞれの標準
パタンは、点線で囲まれている様にブロック分けしであ
る。ブロックBには、Z(2)、 Z(11、Z(21
が、ブ0ツクBoには、Z(o、o)、Z(o、1)Z
(0,2)がプ07りBooには、Z (o、o、o)
Z(0,0,1)、Z(0,0,2)が格納されている
。他のブロックについても図に示す通りである。
第1図の6は、認識部1からの認識結果を得て、標準バ
タン格納部7から、ブロックを選出し、標準バタンエリ
ア3の内容を変える標準バタン選出部である。
あらかじめ、第2図に示す様な概念関係で、概念の高い
(上位の))lに、3つの未知パタンX((2)。
X(11、X(21’e入力する様に決めておき、まず
、Xす)が入力されると、この時は標準バタンエリア3
の内容はブロックBの内容にし、xゆ)がZ(0)。
Z (1) 、 Z (2)の内のいずれであるかを認
識部1において識別し、一方、標準バタン選出部6は認
識部1からの結果を受け、次の未知パタンに対してブロ
ックBO,B1.B2.の内のいずれを、標準バタンエ
リア3へ与えるべきか判断する。今、X(0)かZ−で
あるとし、次の未知パタンx(1)が入力されると、標
準バタンエリア3の内容は、ブロックBOの内容に変更
され、認識部1は同様にX(1)がZ(0,0)、Z(
0,1)、Z(0,2)の内のいずれであるかを識別し
、一方標準ノ(タン選出部6は次の未知)くタンに対し
て、ブロックBoo、B○1.Bo2の内のいずれ・と
標準ノくタンエリア3へ与えるべきか判断する。x(1
)がZ(0,0)であるとし、次の未知ノくタンx(2
)が人力されると、標準ノくタン3の内容は、ブロック
Booの内容に変更され、認識部1は同様にx(2)が
Z(0,0,o)、z(Olo、1)、z(Olo。
2)の内のいずれであるかを識別し、結果を出力する。
x(2)がZ(o、o、o)fあルトスルト、結局、未
知パタンxlO)、x(1)、x(2)ハ、Z(01゜
Z(o、0)、Z(0,o、0)であると認識される事
になり、認識部の語粟数は3単語であるが、見かけ上、
27個の対象を識別する事が可能となり、単語の組み合
せが、概念構成に々つでいるため、利用者がほとんど負
担を感じることなくXa>。
X(11、X(21を発声する事が出来る。
しかし音声認識部自体の認識率をaとすると、最終的に
は、この場合の認識、率は、QX(Ax(1:=Q’で
あり、a〈1であるため、α>a3 であるから、結局
、認識率が減少してしまう事は、避けがたい。
またX(01の時点で誤認識を行った場合には、\1)
x(2)に対して選ばれる標準パタ/は全く異なったも
のになり、さらに誤認識が増長される。したがってより
高い認識率で、見かけ上認識対象の数を増大させる手段
が強く望まれる。
本発明はこのような点に鑑みてなされたものであり、以
下その一実施例を説明する。
第3図は本発明の一実施例を示すもので1は、未知バタ
ンエリア2と標準バタンエリア3と、類似度算出部4よ
り構成され、これらの機能は第1図のものと同様である
。類似度算出部4から、各標準パタンと未知バタン間の
類似度、5(2)、5(1)。
5(2)・・・・・・S (k) 、・・・・・・5(
8)が出力されている。
10は末文シバタンエリア2と、標準バタンエリア3に
与えられていた過去の状態における類似度を格納してお
く類似度格納部である。11は、標準バタン選出部で、
認識部1から出力される類似度5((2)、5(1)・
・・・・・5(k)・・・・・・5(K)と過去の類似
度を格納している類似度格納部1oとの内容により、次
の未知バタンに対して与えるべき標準バタン全選出する
ためのものである。7は標準バタン格納部で、ここには
第1図で示したと同様、各標準パタンかトリー構造でブ
ロック割けされて格納さJlている。標準バタンの選出
が終った時点で、類似度格納部1oは類似度SI:))
、5(k)・・・・・・5(K)の内標準バタン選出部
7からの指令によりM個はど取り込み、その内容を更新
し、その後、標準バタンエリア3の内容は、次の未知バ
タンに対しての標準パタンになる様に、標準バタン格納
部7がら標準バタンエリア3へ、標準パタンの転送が行
ナワれる。
第2図で示す様な標準パタンを認識する場合について、
本発明の考え方を第3図に従い、M=2として、説明す
る。未知バタンはX(ol 、 X(1) 、 X(2
)の順に第1図の説明で述べた同様に、概念の高い順に
入力される。X lo)が入力されると、標準バタンエ
リア3の内容はブロックBの内容、すなわちZ(0) 
、 Z(1) 、 Z(21になり、かつ類似度格納部
10の内容はクリアされる。認識部はXfQlとZ(o
)。
Z (1) 、 Z (2)との類似度5(o) 、 
5(1) 、 5(21を出力し標準バタン選出部11
ば、類似度格納部1oの内容がクリアされているため、
510) 、 5(1) 、 S(2+の内で最も高い
値S1と次に高い値S2を選び、Slと、5s4−与え
た標準パタンの下位概念の標準バタンブロックを選出し
、選出が終了すると、Slと82を、類似度格納部10
へ格納する。今、$1がS (o)、S 2が5(1)
であるとすると、ブロックBOとブロックB1が選らば
れ、標準バタンエリア3へ標準パタンの転送が行なわれ
、類似度格納部10へはS−と5(1)が格納される。
次に、未知バタンx(1)が入力されると、認識部1で
は、次の類似度が算出される。
S (o r o ) : X (1)とZ(o、o)
S(o、1):Xh)とZ(011) S(0,2):X(1)とZ(0,2)S (1、o)
:X(1)とZ(1、o)S(1,1):X(1)とZ
(1,1)S(112):X(IL!:Z(1,2)標
準バタン選出部11では、これらの類似度と類似度格納
部1oとの内容により、 が計算され、S’ (o 、 o ) 〜8’(,1,
2)ノ内で最も高い値の81と、次に高い値の82が選
ばれ、同様に31,82を与えた標準パタンの下位概念
   ゛の標準パタンのブロックを選出する。選出が終
了すると同様に81.S2を与えた認識部1からの類似
度が、類似度格納部10へさらに格納される、。
今、S1力;S(o、o)、S2が、S(1,o)で、
与えられたすると、ブロックBooと、ブロックB10
が選ばれ、標準バタンエリア3へ転送され、類似度格納
部へは、S(o、o)と、S(1jo)が、さらに格納
される。
次にx(2)が入力されると、認識部1では次の類毎度
が算出される。
s(o、o、o):X(2)とZ(o、o、o)S(0
,o、1):X21とZ(o、o、1)S (0,o 
、2)::)Q2)とZ(0,0,2)S(1、o、o
):η2)とZ(1、o、o)S(1,o、1):x(
2)とZ(1、o、1)S(1、o、2):瞭2))と
Z(1,0,2)標準バタン選出部11では、 の計算が行なわれて、これらのS’(o、o、o)〜S
’(1,0,2)の内で最も類似度の高い値S1を選出
し、Slを与えた標準バタンの組み合せが最終的な認識
結果となる。
曲成におイー’c、S(0,0) 、8(11Q)St
)LS(1)は類似度格納部1oの内容であり、今S1
がs’(o、o、o)であるとすると、S’(o、o、
o)は、S(o、o、o)とS(o、o)とSゆ)より
計算されるものであり、S−はX(OfとZに)の類似
度でありs(o、o)はx(1)とZ(o、o)の類似
度でありS(o、o、o)は、x(2)とZ(o。
o、0)の類似度であるから、結局X−はZ(Of。
x(1)はZ(0,0)X(21はZ(o、o、o)と
認識される。
最終的゛なSlがあるしきい値りより大なる時にのみ認
識結果を出力し、しきい値りより小なる時には棄却する
様にすれば誤認識を防ぐ事も出来る。
この様にすれば、従来の方法に比べ、認識部自体で標準
パタンの処理する個数はM倍になるが、複数の未知バタ
ンの組み合せの場合には、認識率が向上する。従来の方
法では、標準バタンエリア3へ転送するブロックは1個
であったが、本発明の場合は、可能性のあるブロックM
個を抽出し標準バタンエリアへ与えるために、正解であ
るべき伸率バタンと未知パタンとの類似度が類似度の最
も高い値からM番目内に入っておれば良い事になる。正
′解であるべき標準パタンと未知バタン間の類似度が最
も高い値になる時の率aと、高い値からM番目内に入っ
ている時の率αMはa< aMであり、従来の方法では
、標準パタンのトリー構造の段数がT段であるとすると
、(未知パタンの数は1個必要)認識率はalとなり、
本発明の場合は6Mとなり、α1〈α青 であるため、
本発明の場合には、全体として認識率が向上する事にな
る。
また従来の方法では、未知パタンXE)で、誤まってし
まうと、次の”1)X(2)は、無意味なものとなるが
、本発明の場合にはX−のみでX−が何であるかを判断
せず、次のx(1)の時点における類似度とx(2)の
時点における類似度が累積されて判断されるために、X
−の正解であるべき標準パタンの類似度がM番目内に入
っているならば、X(1)、x(2)は決して、無意味
なものとならず、むしろ良い結果をもたらす事になる。
つまりXE)の時点で、正解であるべき標準パタンとX
−間の類似度が第1番目に高い値でなくても、最終的に
は\11.]62)の時点の類似度の累積で、未知パタ
ンの組み合せが判断されるため、X (o)の時点にお
ける正解であるべき標準パタンか最終的には、選ばれる
可能性が大きくなる。
また選出されるブロックM個は、累積類似度から、(式
(1) 、 (2)による、)選出されているが、処理
を簡単にするためには、単に、認識部から出力される類
似度から、次の標準ノくタンエリアへ転送するブロック
M個を選出しても、従来の方法に比べα〈6Mであるか
ら、認識率は向上する。
また式(1)、(2)では累積類似度は、ただ単に加算
し未知パタンの組み合せにおける類似度を算出している
。これは、市街距離なる類似度の算出方法でこれ以外に
、ユークリッド距離で未知ノくタンの組み合せにおける
類似度を算出しても良い。この場合には式(1)(2)
は以下の様になる。
S’(o、o)=51館1四7 ・・・・・・(3)・
・・・・・・・・・・・・(4) (S(0,0,1)MS(1,0,2)についても同様
)このように本発明によれば認識率を低下させるこ第1
図は従来のバタン認識方式を示すブロック図、第2図は
標準バタンの構成の例を説明する説明図、第3図は本発
明のバタン認識方式の一構成例を示すブロック図である
111・・・・・認識部、2・・・・・・未知バタンエ
リア、3・・・・・・標準バタンエリア、4・・・・・
・類似度算出部、1o・・・・・・類似度格納部、11
・・・・・・標準バタン選出部、7・・・・・・標準バ
タン格納部。
代理人の氏名 弁理士 中 尾 敏 男 ほか1名桑 
1 因

Claims (1)

    【特許請求の範囲】
  1. (1)未知バタンと複数の標準パタンとの類似度を算出
    する認識部と、認識部とは別に複数の標準バタンを格納
    している標準バタン格納部と、認識部から出力される類
    似度を高い順に複数個抽出し、これらの類似度を与えた
    標準パタンに基づいて前前記認識部に未知バタンか与え
    られる毎に、認識部の標準パタンの内容を更新して、未
    知バタンを認識する事を特徴とするバタン認識方式。 (2、特許請求の範囲第1項において、認識部に与えら
    れた過去の未知バタンと標準バタン間の類似度を記憶し
    、認識部に新たな未知バタンと標準パタンか与えられる
    毎に、その内容を更新する類似度格納部を有し、類似度
    格納部の内容と、認識部から出力される類似度によって
    累積類似度を求め、この累積類似度から前記標準バタン
    選出部が、認識部に与える標準パタンを、前記標準バタ
    ン格納部から選出する事を特徴とするバタン認識方式。
JP56116969A 1981-07-24 1981-07-24 パタン認識方式 Granted JPS5818778A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56116969A JPS5818778A (ja) 1981-07-24 1981-07-24 パタン認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56116969A JPS5818778A (ja) 1981-07-24 1981-07-24 パタン認識方式

Publications (2)

Publication Number Publication Date
JPS5818778A true JPS5818778A (ja) 1983-02-03
JPH0226262B2 JPH0226262B2 (ja) 1990-06-08

Family

ID=14700231

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56116969A Granted JPS5818778A (ja) 1981-07-24 1981-07-24 パタン認識方式

Country Status (1)

Country Link
JP (1) JPS5818778A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03104247A (ja) * 1989-09-19 1991-05-01 Fujitsu Ltd ウエハ・スケール半導体装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04163955A (ja) * 1990-10-29 1992-06-09 Yamaha Corp 半導体装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54148327A (en) * 1978-05-12 1979-11-20 Fujitsu Ltd Graphic recognizing device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54148327A (en) * 1978-05-12 1979-11-20 Fujitsu Ltd Graphic recognizing device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03104247A (ja) * 1989-09-19 1991-05-01 Fujitsu Ltd ウエハ・スケール半導体装置

Also Published As

Publication number Publication date
JPH0226262B2 (ja) 1990-06-08

Similar Documents

Publication Publication Date Title
JP2739945B2 (ja) 音声認識方法
US7949524B2 (en) Speech recognition correction with standby-word dictionary
US6751595B2 (en) Multi-stage large vocabulary speech recognition system and method
JP4867804B2 (ja) 音声認識装置及び会議システム
JPH096390A (ja) 音声認識対話処理方法および音声認識対話装置
JP2001265326A (ja) 演奏位置検出方法および楽譜表示装置
JP2002123289A (ja) 音声対話装置
JPH0540497A (ja) 話者適応音声認識装置
JPS5818778A (ja) パタン認識方式
JPH0225517B2 (ja)
JP2005284209A (ja) 音声認識方式
JP2005038160A (ja) 画像生成装置およびその画像生成方法、ならびにコンピュータ読み取り可能な記録媒体
KR100931790B1 (ko) 음성인식 시스템에서 발음명칭목록을 이용한 인식사전 생성 방법 및 그를 이용한 유사발음명칭 처리 방법
JP4236502B2 (ja) 音声認識装置
JP3663012B2 (ja) 音声による入力装置
JP3315565B2 (ja) 音声認識装置
JPH02109100A (ja) 音声入力装置
JP3695448B2 (ja) 音声認識装置、音声認識方法、及びプログラム
JPS6126133A (ja) 音声認識入力装置
JPH06337700A (ja) 音声合成装置
JP2001343991A (ja) 音声合成処理装置
JPS5915992A (ja) 音声認識方式
JPS5946697A (ja) 音声認識方式
JPH1185182A (ja) 話者認識方法及び装置
JPH04128899A (ja) 音声認識装置