JPS6132186A - パタ−ン認識装置 - Google Patents

パタ−ン認識装置

Info

Publication number
JPS6132186A
JPS6132186A JP15285484A JP15285484A JPS6132186A JP S6132186 A JPS6132186 A JP S6132186A JP 15285484 A JP15285484 A JP 15285484A JP 15285484 A JP15285484 A JP 15285484A JP S6132186 A JPS6132186 A JP S6132186A
Authority
JP
Japan
Prior art keywords
pattern
dictionary
language processing
string
pattern recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP15285484A
Other languages
English (en)
Inventor
Saiji Kageyama
斎司 蔭山
Yasuaki Nakano
中野 康明
Kunihiro Okada
邦弘 岡田
Toshitsugu Ozaki
尾崎 俊従
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP15285484A priority Critical patent/JPS6132186A/ja
Publication of JPS6132186A publication Critical patent/JPS6132186A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明はパターン認識装置に関する。
〔発明の背景〕
文字パターン又は音声パターンを認識するパターン認識
においては、入カバターンとあらかじめメモリ内に登録
された標準パターンとを比較して認識している。この標
準パターンの集合を辞書と呼ぶ。以下の説明では後述す
る単語辞書と区別すス+−甑 慴油パカーり小櫨A九バ
カー1ノ綽愈シ睡ぶ。第1図に示したように万人用パタ
ーン辞書(不特定筆者の書く文字パターンを認識するた
めの標準パターンの集合又は不特定話者の発生する音声
パターンを認識するための標準パターンの集合)を用い
る場合、■十分な認識率が得られない、或いは■十分な
認識率を得ようとするとパターン辞書容量(つまりコス
ト)や認識時間が莫大で非実用的なものになる等の問題
点があった。
これらの問題点を解決するための方法として、従来、第
2図と第3図に示した2つの方式が提案されている。
第2図に示した方式は、パターン認識の結果得られる記
号列に対し、後処理として言語処理(■単語照合、■文
字列のマルコフモデルに基づく文脈処理、■構文解析そ
の他)を行うものである。
この方式で例えば単語照合を行う場合、単語辞書に万人
があるびん度以上で使用するすべての単語を格納してお
くことが必要になる。このため万人用単語辞書の容量が
大きくなる。しかし上記単語の多くは、本パターン認識
装置の各ユーザ個人が使用することは極めて少ないもの
であるため、メモリコストが不当に高くなる。また万人
用の単語辞書を用いる方式では、正解率も十分には高く
できなかった。例えば「入水」という文字パターン列を
「入来」と誤読したとき、単語辞書に「入来Jという単
語が含まれているとき単語照合によってはこの誤読を検
出・除去することができない。
また、第2図の方式で広く用いられる方法では、パター
ン認識の結果得られる候補の中から言語処理によって適
格性を判断しているが、この方法は正解候補が必がパタ
ーン認識の結果に含まれることを前提としている。しか
し、万人用のパターン辞書を用いたときはこの前提を満
すのは困難である。
次に第3図に示した方式は、パターン認識用の辞書とし
て個人用パターン辞書(個人専用の標準パターンの集合
)を用いるものである。本方式により、万人用パターン
辞書を用いる場合より、認識率と認識速度を高め、辞書
容量(つまりコスト)を低減できたが、低品質の文字パ
ターン、音声パターンに対しては未だ十分な認識率が得
られなかった。また■片板名のrカ」と漢字の「力」の
ような同形異字、或いは■「億」と「憶」のような類似
形状文字を文字単位で認識することは極めて難しいとい
う問題点もあった6 また第4図に示したように、キーボード入力に対して言
語処理を行う場合についても、言語処理用辞書を万人用
のものでなく個人専用のものにすることにより、言語処
理についての辞書容量(つまりコスト)の低減と正解率
の向上が計られてきた。しかし本方式には、漢字(常用
漢字で約2000、JIS第1水準で約3000)を含
む日本語文章を入力するとき、人間のキーボード操作の
負担が大きいという問題点があった。特にキーボードに
不慣れな素人への負担は大きく、入力速度は遅く、疲労
も大きかった。
〔発明の目的〕
本発明の目的は、上記従来発明の欠点を解消できるパタ
ーン認識装置を提供することにある。
〔発明の概要〕
上記の目的を達成するために、本発明では第5図に示し
たように、入カバターン(文字パターン、音声パターン
など)に対するパターン認識処理を個人用パターン辞書
を用いて行うとともに、パターン認識処理の後処理とし
て言語処理を行いその言語処理のための辞書としても個
人用辞書を用いるものである。ここで個人用辞書とはそ
の内容の少なくとも一部又は全部が個人専用の内容から
なる辞書のことである。辞書の内容とは、パターン辞書
の場合標準パターンのことであり、言語処理用辞書の場
合第6図(a)に記したように、■単語、■カテゴリ列
についての遷移確率、■その他のことである。
〔発明の実施例〕
本発明の実施例を説明する前に本発明の基本手順を第6
図(a) 、  (b) 、  (c)のPAD(Pr
ogram Analysis Diagram)によ
り示す。本PADについての注意事項は以下の通りであ
る。
(ED=雷門処理とは、カテゴリ列を構成するカテC□
、(U)の誤りを発見又は修正する処理のことである。
例えば言語処理として単語照合を行う場合。
D、1.は、■個人Pが過去に入力したことのある単語
(単語を構成するカテゴリの列)、又は■個人Pが将来
入力する可能性が十分高いと推定された単語、の集合で
ある。
また例えば言語処理としてマルコフモデルに基づく文脈
処理を行う場合、D、1.には■個人Pが過去に入力し
たことのあるカテゴリ列についての遷移確率、又はd個
人Pが将来入力する可能性が十分高いと推定されたカテ
ゴリ列についての遷移確率が格納しである。
O:未知パターン列u = uzy uzt ”””t
 u、lに対しパターン認識、言語処理を施すとき、各
各の出力として得られる答カテゴリ列 Cpra  (u ) 、C,rat (u )の長さ
がNから変わる場合(どちらか一方の長さがNから変る
場合と両方の長さが変る場合がある)についても識と言
語処理を行うことができる。
■=パターン認識で各U、に対し一個以上の候補カテゴ
リC1(u−) HC” (u、) e ・=”・tc
”″(u、)  (ここでL n > 1 )を出力し
、言語処理ではC” (u、) 、 CJ″(us) 
t ”””tC”(u、)  (ここで1<jl<Ll
t 1<jzりL2.・・・・・・*1<j−<L−)
  という1個以上の(L、xL、x・・・・・・XL
、通り)候補カテゴリ列に対し答カテゴリ列cp*at
 (u)を求める場合についても、言語処理のための個
人辞書を同じように利用することができる。
e=言語処理として形態素解析、構文解析、意味解析、
その他を行う場合についても、各言語処理におけるアル
ゴリズム、データのうち個人専用に用いるものを個人用
辞書とみなすことにより同様にして、個人辞書を利用し
た言語処理を行うことができる。
以下本発明の実施例を第7図を用いて説明する。
初めに、入カバターン列70a (文字パターン、音声
パターン、その他のパターンの列)がパターン観測部7
1に入力される。パターン観測部71は入カバターン列
70aを電気信号に変換されたパターン列71aに変換
する。電気信号に変換されたパターン列71aは切り出
し部72により単位パターン毎に切り出され、単位パタ
ーン列72aに変換される。
単位パターン列72aを構成する各単位パターンはパタ
ーン認識部73へ入力される。パターン認識部73は、
パターン認識のための個人用パターン辞書74に属する
各標準パターン74aと上。
記単位パターンとの間の類似性を評価した後、その評価
値に基づいて、上記単位パターンに対し1つの答カテゴ
リ又は1個以上の候補カテゴリを出力する。こうしてパ
ターン認識部73の出力としてカテゴリ列73aが出力
される。〔72aの単位パターン列U=U□、u2・・
・・・・Uイを単位パターンu、(ここで1 < n 
< N )が構成し、U、の答カテゴリがC□、(u、
)であり、u、の1個以上の候補カテゴリがC1(uj
 * C” (uj y ”””tC”(u、、)  
(ここでり、>1)であるとする。このときC11@ 
 (u 1)g C1,、@  (u 2) H”’ 
”’ yC,、、(us)又はC” (ul)、C” 
(u2)、−−、c” (un)(ここで1 < j 
1 < L 1* 1 < jxりL2.・・・・・・
、1<jN<LN )がカテゴリ列73aである。) 言語処理部75は、言語処理のための個人用辞書76に
属する各内容76aとカテゴリ列73aとの間の言語処
理の結果に基づいて、カテゴリ列75aを出力する。言
語処理としては、単語照合、マルコフモデルに基づく文
脈処理、形態素解析、構文解析、意味解析などを使うこ
とができる。
70a、71a、72a、・・・・・・などの信号の制
御は制御部77で行う。71,72.・・・、77の各
処理部と記憶部は、光電変換装置、マイクロホン、μm
プロセッサ、メモリ、表示装置などにより実現すること
ができる。
また個人用辞書(パターン認識のためのもの74及び言
語処理のためのもの76)の内容をユーザ毎に入れ換え
るためには、プロツピディスクなどに予め記憶しておい
た各個人用辞書の内容をその都度74と76の記憶部に
ロードし直せ4fよい。
〔発明の効果〕
本発明によれば、次の■〜■に示す効果を達成すること
ができた。
■ パターン認識において個人用ノ(ターン辞書を用い
たため、パターンの認識率が良く、少数個の候補カテゴ
リ内に正解カテゴリを必ず入れることができるようにな
った。前述したよう番こ、正解が候補に含まれているこ
とが言語処理が正しく動作する条件の一つである。また
)(ターン辞書容量を低減し、認識速度も向上できた。
■ パターン認識用辞書と言語処理用辞書の両方を個人
用辞書にしたことにより、言語処理時間を実用的なもの
にすることができた。
例えば、言語処理として単語照合を行う場合、言語処理
時間(つまり単語照合時間)Tは、T=N、、・ N7
.、・ t N、、=に’ ここでNim:入力候補カテゴリ列の場合の数N、、、
:単語辞書的単語数 t :単語照合1回当りの時間 K :パターン認識で正解カテゴリを 99%候補に上げるために必要 な平均候補数 Ω :平均単語長 となる。
ここでパターン認識用辞書D P t * と言語処理
用辞書D□、のそれぞれを万人用、個人用とした各場合
についてのTを計算してみる。
fi=3 とすると、第8図が得られる。
木表の要点は次の■〜0である。
■ D Ptm l DAl。の両者を個人用にしたと
きのTが4つの場合のうちで最小であり、実用化できる
ものである。
■ D P t * を万人用とした場合Tが実現不可
能になる。
[相] D□、を個人用にして、D□、を万人用にした
場合、両方を個人用にした場合と比べTが3〜40倍に
なる。(この場合はDti*を万人用にしたため次の■
に示す効果が得られず、実用的方式になりえない。) ■ 言語処理において個人用辞書を用いたため、■ 辞
書内に未登録のため正解を落す現象がなくなった(例え
ば言語処理として単語照合を行う場合、通常の単語辞書
に存在しないような′摂動′や゛章動′ (天文学分野
の専門用語)なども正解にできるようになった。)■ 
ユーザ個人は絶対に使わない内容が辞書に格納されなく
なった。そのため辞書容量(つまりコスト)を低減し、
処理速度を向上できるとともに、思わぬ誤りをおかすこ
ともなくなった。例えば言語処理として単語照合を行う
場合、万人用単語辞書では「入水」というパターン列に
対し“入来′という妨害単語が第1位になっていたのが
、個人用単語辞書(′入来′という単語を含まない)を
用いることにより、1入水′という正解を得ることがで
きるようになった。
■ 個人用辞書を用いたパターン認識の後処理として言
語処理を用いたことにより、パターン認識部では識別で
きなかった同形異字や類似形状文字も言語処理部で識別
できるようになった。
■ キーボード入力の熱処理として個人用辞書を利用し
た言語処理を施していた場合と比べて、キーボード操作
という人間への負担が激減した。
また、パターン認識用のパターン辞書と言語処理用の辞
書を、制限された複数人の利用者グループ(例えば職場
グループ)毎に専用化した場合についても、利用者−人
毎に専用化した場合と同様の効果を得ることができる。
【図面の簡単な説明】
第1図〜第4図は従来の例を示す図、第5図は本発明の
概要を示す図、第6図(a)、(b)。 (c)は本発明の基本手順を示す図、第7図は本発明の
実施例を示す図、第8図は種々の言語処理辞書を組合せ
た場合の認識処理時間を示す図である。 71・・・パターン観測部、72・・・切り出し部、7
3・・・パターン認識部、74・・・パターン認識のた
めの個人用パターン辞書、75・・・言語処理部、76
・・・言語処理のための個人用辞書、77・・・制御部
、70a・・・入カバターン列、71a・・・電気信号
に変換されたパターン列、72a・・・切り出された単
位パターン列、73a・・・カテゴリ列、74a・・・
標準パターン、75a・・・出力カテゴリ列、76a・
・・辞書76の各内容。 ¥J  l  図 第 2 口 fJ 3 図     % 4 凹 ■  5  図

Claims (1)

    【特許請求の範囲】
  1. 入力に対しパターン認識処理を行う手段と、上記パター
    ン認識処理の後処理として言語処理を行う手段とを有す
    るパターン認識装置において、上記パターン認識を行う
    手段及び上記言語処理を行う手段は、それぞれ利用者又
    は利用者グループ毎に専用化した辞書を有していること
    を特徴とするパターン認識装置。
JP15285484A 1984-07-25 1984-07-25 パタ−ン認識装置 Pending JPS6132186A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15285484A JPS6132186A (ja) 1984-07-25 1984-07-25 パタ−ン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15285484A JPS6132186A (ja) 1984-07-25 1984-07-25 パタ−ン認識装置

Publications (1)

Publication Number Publication Date
JPS6132186A true JPS6132186A (ja) 1986-02-14

Family

ID=15549574

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15285484A Pending JPS6132186A (ja) 1984-07-25 1984-07-25 パタ−ン認識装置

Country Status (1)

Country Link
JP (1) JPS6132186A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7007233B1 (en) 1999-03-03 2006-02-28 Fujitsu Limited Device and method for entering a character string

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7007233B1 (en) 1999-03-03 2006-02-28 Fujitsu Limited Device and method for entering a character string

Similar Documents

Publication Publication Date Title
EP1617409B1 (en) Multimodal method to provide input to a computing device
JP2009521718A (ja) 分散収集された知識を用いる自動文法生成
JP3476007B2 (ja) 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
CN112800184B (zh) 基于Target-Aspect-Opinion联合抽取的短文本评论情感分析方法
CN112185361B (zh) 一种语音识别模型训练方法、装置、电子设备及存储介质
Jain et al. “UTTAM” An Efficient Spelling Correction System for Hindi Language Based on Supervised Learning
Mengliev et al. Utilizing lexicographic resources for sentiment classification in Uzbek language
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
CN112965909B (zh) 测试数据、测试用例生成方法及系统、存储介质
JP4008313B2 (ja) 質問タイプ学習装置、質問タイプ学習プログラム、同プログラムを記録した記録媒体、学習サンプルが記録されている記録媒体、質問タイプ同定装置、質問タイプ同定プログラム、同プログラムを記録した記録媒体
JPH08263478A (ja) 中国語簡繁体字文書変換装置
CN109346060A (zh) 语音识别方法、装置、设备及存储介质
JP4220151B2 (ja) 音声対話装置
CN114861669A (zh) 一种融入拼音信息的中文实体链接方法
JPS6132186A (ja) パタ−ン認識装置
CN111563379A (zh) 基于中文词向量模型的文本识别方法、装置及存储介质
JP3952964B2 (ja) 読み情報決定方法及び装置及びプログラム
Shakil et al. Cognitive Devanagari (Marathi) text-to-speech system
JP4206253B2 (ja) 自動音声応答装置及び自動音声応答方法
KR20040050394A (ko) 원시언어를 대상언어로 번역하기 위한 번역엔진 장치 및그 번역방법
Henrich et al. LISGrammarChecker: Language Independent Statistical Grammar Checking
Yusof et al. Identifying Relation Between Miriek and Kenyah Badeng Language by Using Morphological Analyzer
Wang et al. A hybrid language model based on statistics and linguistic rules
CN113919329A (zh) 识别方法、识别系统、电子设备和存储介质
JPS62224859A (ja) 日本語処理方式