JPS6049481A - 単語認識装置 - Google Patents

単語認識装置

Info

Publication number
JPS6049481A
JPS6049481A JP58157595A JP15759583A JPS6049481A JP S6049481 A JPS6049481 A JP S6049481A JP 58157595 A JP58157595 A JP 58157595A JP 15759583 A JP15759583 A JP 15759583A JP S6049481 A JPS6049481 A JP S6049481A
Authority
JP
Japan
Prior art keywords
word
character
recognition
information
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58157595A
Other languages
English (en)
Other versions
JPH069065B2 (ja
Inventor
Masato Suda
正人 須田
Yoshiaki Kurosawa
由明 黒沢
Yoshikatsu Nakamura
中村 好勝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP58157595A priority Critical patent/JPH069065B2/ja
Publication of JPS6049481A publication Critical patent/JPS6049481A/ja
Publication of JPH069065B2 publication Critical patent/JPH069065B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は印刷・手書文字や音声入力された単語データ等
からなる入力単語を簡易に、且つ効果的に認識すること
のできるパターン認識装置に関する。
〔発明の技術的背景とその問題点〕
印刷・手書文字や音声入力された単語データ等からなる
入力単語に対する文字認識(パターン認識)は、基本的
にはその文字(パター/)の特徴を個々に検出して行わ
れる。しかし、その単語について認識する場合、上記側
々の文字(パターン)認識結果を単に組合せるだけでは
不十分なことが多い。例えば上記単語を構成する成る文
字の認識が不十分な場合、その単語に対する認識結果が
得られなくなる。そこで従来では、例えば第1図に示す
如く認識装置を構成し、個々の文字認識結果が不十分な
場合であっても、単語認識結果が得られるように工夫さ
れている。この装置については、特願昭56−1381
63号に詳しく紹介されるが、その要点について説明す
ると、光電変換部1を介して原稿2から読取られた入力
単語を画処理部3に与え、その特徴検出を行ったのち文
字認識部4にて上記入力単語を構成する文字について個
々に文字認識する。しかるのち、単語認識部5において
、上記文字認識結果情報と、単語辞書6に予め登録され
た単語との間の類似度を計算し、例えば最大類似度値を
得る単語を前記入力単語の認識結果としてめるようにし
たもδである。
上記類似度計算は、単語辞書6に登録された第j番目の
n文字からなる単語の文字列asJ +a2 j −a
 n jと、n文字からなる入力単語の各文字認識結果
QX 、Qt〜Qnとの間の類似度Sjを、Piをal
jとQi間の類似度として等として算出する。そして単
語辞書6に登録された全ての単語についてそれぞれめら
れた上記各類似度を相互に比較し、その最大類似度値S
jを有する単語を認識結果としてめることによシ行われ
る。
このような単語認識処理、つまシ所謂後処理を行うこと
によって、個々の文字認識結果が不十分な場合であって
も相当高い精度で入力単語に対する正□しい認識結果を
得ることがり能となる。
ところが、入力単語を構成する文字列の全てが必ずしも
単語認識に対して重要な意味を持つとは限らない。例え
ば入力単語が製品に対する品種名と、その品種に対する
通し番号とによって構成されることがらシ、この場合上
記品種名が認識対象として重要な意味を持ち、且つ通し
番号が補助的な意味しか持たないことがある。
これにも拘らず、前述した後処理を、入力単語を構成す
る文字列の全ての文字を対象として行う為には、膨大な
量の単語を単語辞書6に登録しておくことが必要となる
。この為、その辞書構成が複雑化し、また処理所要時間
が長くなることが否めなかった。つまフ、入力単語を構
成する文字列中の認識処理において補助的な意味しか持
たない文字列を含めた上で前述した単語認識処理を行う
ので、辞書登録される単語数が膨大な数となった。これ
故、辞書d〜困難化する等の不具合も生じた。
〔発明の目的〕
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、入力単語が認識処理に対して重
要な意味を有する文字列と補助的な意味を持つ文字列と
によって構成される場合であっても、これを簡易に且つ
効率良く認識することのできる実用性の高いパター7認
識装置を提供することにある。
〔発明の概要〕
本発明は入力単語の各パターンをそれぞれ認識する手段
と、そのパターン認識結果情報と単語辞書に登録された
単語との類似度から上記パターン認識結果情報に対する
単語認識結果をめる手段とを具備した文字認識装置にお
いて、前記単語辞書に登録された各単語に単語認識処理
の対象としない文字位置の文字を指定する情報を持たせ
、この情報によシ指定された文字を除く残pの部分につ
いてのみ単語認識処理を実行させるようにしたものであ
る。そして、上記情報によって指定された文字について
鉱、その文字位置のパターン認識結果のうち、第1順位
の候補を、或いは上記情報で指定されるカテゴリの中で
最高順位の候補をそれぞれ採用するようにし次ものであ
る。そして、これらの認識結果を組合せて前記入力単語
に対する認識結果を得るようにしたものである。
つtb、入力単語を構成する文字列中の上部情報によっ
て指定されない文字列についてのみ単語辞書を用いた類
似度計算による認識処理を行い、その認識結果と他の文
字列に対するノくターyg識結果の候補とを組合せるこ
とによって簡易に且つ効率良く入力単語を認識するよう
にしたものである。
〔発明の効果〕
かくして本発明によれば、入力単語の各文字についてそ
れぞれ文字認識結果を得、そのうちの例えば重要な意味
を持つ文字列に対してのみその文字認識結果情報と単語
辞書に登録された単語との類似度計算によってその認識
結果をめて補助的な意味を有する文字列の文字認識結果
と組合せて最終的な認識結果を得るので、簡易にして十
分に高い精度で高速に認識処理を実行することが可能と
なる。即ち、後処理としての単語認識を、入力単語を構
成する文字列中の重要な意味を持つ文字列についてのみ
行うので、その辞書構成を簡単化し、また補助的な意味
を・持つ文字列に左右されることなしに高速に上記単語
認識処理を実行することができる。従って、処理効率の
向上を図ることができ、単語辞書の構成の簡略化を図シ
得る等の実用上多大な効果が奏せられる。
〔発明の実施例〕
以下、図面を参照して本発明の一笑施例につき説明する
第2図は実施例装置の概略構成図である。印刷・手書文
字からなる単語データや音声入力された単語データから
なる入力単語は文字認識部11に導ひかれて、その文字
毎にそれぞれ文字認識される。そして、この文字認識部
11にて入力単語の各文字についてそれぞれめられた各
文字認識結果Crlは、単語情報バッファ12に一旦格
納されるようになっている。単語類似度計算部13はコ
ントロール部14の制御を受けて、前記単語清報バッフ
ァ12に格納された文字認識結果情報と単語辞書1st
1c予め登録された単語との間の類似度を計算し、その
計算した類似度値を相互に比較して前記文字認識結果情
報に対する単語認識結果をめている。前記コントロール
部15紘、次に説明するQrテーブル16や前記バッフ
ァ12からの情報を受けて認識処理動作を制御するもの
であシ、また前記単語類似度計算部13から与えられる
単語認識結果、および前記単語情報バッファ12から得
られる文字認識結果を文字認識制御部77に与えている
。この文字認識制御部17にて前記入力単語に対する最
終的な認識結果がめられる。
ところで前記単語辞書15は、認識対象とする単語の情
報をめ登録したものであるが、入力単語がその認識処理
において重要な意味を持つ文字列と、補助的な意味しか
有さない文字列とによって構成される場合、これに対応
して上記補助的な意味しか有さない文字列の各文字を特
定された文字記号r*JriJ等に置換えた文字列によ
シ構成される単語として辞書登録している。即ち今、入
力単語がrSN103J rTp551 J rR8O
O4J等のように、品種を示す上位2文字からなる認識
処理において重要な文字列と、下位3文字で示される通
し番号の如き、補助的な意味を有する文字列とによって
構成されるものとする。この場合、これらの5文字につ
いて従来装置で見られるように単語認識処理を実行する
ものとすると、単語辞書15には第3図(a)に例示す
るようにその文字の全ての組合せによって生成される単
語を、この例では3000種類の単語を辞書登録してお
くことが必要となる。これに対して本装置では上述した
ように下位3文字が認識処理に対して補助的な意味しか
有せず、その認識処理に紘直接的に関与しないことから
、これを特殊な記号、例えば「*」に置き換えて前記上
位2文字の文字列毎にまとめられる単語として第3図(
b)に示す如く辞書登録している。これによって、その
登録単語数は、この例では高々3個で良いことになる。
前記計算部13は、とのよンにして辞書登録され、単語
辞書15から順に読出される単語が上記特殊記号「*」
を含むものか否かを判定しておシ、その判定結果に従っ
て、上記「*」で示される文字を除く各文字についてそ
れぞれ類似度計算を行っている。つまシ、コントロール
部14に、入力単語を構成する文字列の各文字認識結果
のうち、「*」で置換された文字を除く文字について、
即ち、認識処理において重要な意味を持つ文字列部分に
ついてのみ前記類似度計算による単語認識処理を行わせ
ている。この認識処理はQrテーブル16を用いて重み
付は処理を行い乍ら実行される。そして、その認識結果
を制御部17に与え、且つ前記「*」で置換された文字
位置に対応する入力単語の文字についてめられた文字認
識結果のうち、例えば第1順位の候補を前記バッファ1
2から読出し上記制御部17に与え、それらを組合せて
いる。このようにして組合せられた、重要な文字列に対
する単語認識結果と補助的な文字列についてめられた各
文字認識結果とによって前記入力単語にかくしてこのよ
うに構成された装置に対してrsNOOOJなる単語が
与えられたとすると、文字認識部11にてこれらの各文
字についてそれぞれ文字認識が行われ、その認識結果が
単語清報バッファ12に格納される。例えば第1番目の
文字について、「5」「S」「6」・・・なる文字認識
結果が得られると、その候補順位に従って上記各文字認
識結果がバッファ12に格納される3、また同様にして
第2番目の文字についてもその認識結果がrNJ rH
J rMJ・・・のようにめられ、その候補順位に従っ
てバッファ12に格納される。更に第3〜第5番目の文
字についても、その文字認識結果がrOJrOJ「6」
・・・とじて、その候補順位に従ってバッファ12に格
納される。従って、第4図にその処理概念を模式的に示
すように、単語情報バッファ12には、入力単語の文字
認識結果がその文字位置に対応して、且つその候補順位
に従って格納されることに″なる。そして次に、この例
では上位2文字が重要な意味を有する文字列であシ、そ
のことが単語辞書15から読出される単語の文字データ
の「*」なる文字記号から知らしめられるので、上記上
位2文字について文字認識結果と辞書単語との間の類似
度計算が実行される。この類似度計算処理による単語認
識によって上位2文字の単語認識結果がrSNJである
と判定される。また下位3文字については、前記「*」
なる記号によって補助的な意味を有する文字列であると
判定されることから、文字認識結果の第1候補文字「0
」がそれぞれ認識結果として採用される。そして、ごれ
らの各認識結果が組合せられて、前記入力単語の認識結
果がr 5NOOOJとしてめられる。
さて、第5図乃至第7図は上述した認識処理を実行する
本装置の処理の流れの一例を示すものである。即ち、第
5図に全体の流れを示すように、処理の開始に先立って
初期値設定が行われ、同時にパラメータj、SMが10
1に設定される。しかるのち、パラメータjの値をイン
クリメントし、そのjの値で示される単語(文字列ai
j)を単語辞書15から読出す。この単語aijと入力
単語の各パターン認識結果との間の類似度計算が第6図
に示す如く行われて、その類似度Sijが計算される。
そ“して、この類似度Sijが、既にめられた他の単語
との類似度の最大値SMよシ大きいか否かが判定され、
上記類似度SijがSM 、1:り大きい場合にはこれ
によって上記最大値sMを更新し、更にはこの最大値S
Mを得る単語を特定するjの値を一時レジスタに格納す
る。この一連の処理を、単語辞書15に登録された全て
の単語について繰返し実行する。そして、この処理でめ
られた認識結果を整理して第7図に示す如く単語認識結
果がめられ、出力される。
上記単語類似度Sljの計算は第6図に示すように、先
ず類似度Sjを0にイニシャライズし、l−1に設定し
てから行われる。そして、単語の文字位置1番目の文字
が、単語認識処理対象外の文字、例えばr*Jr!Jで
あるかを判定する。そして、その文字が「*」である場
合には、そのi番目のフラッグFiを「1」にセットし
、また「!」である場合には、上記フラッグFiを「2
」にセットする。更に上記文字位置1番目の文字が上記
「*」「!」以外の場合には、これを単語認識対象文字
であると判定し、パラメータrを111にセットする。
このパラメータrに従って、単語情報バッファ12から
入力文字列のi番目の文字についてのr番目の候補(パ
ターン認識情報)Crtを読み出し、この候補が前記文
字aijに等しいか否かを判定する。そして、上記文字
と候補とが一致したとき、その候補に対する重み(類似
度の情報)Qrを前記Qrテーブル16からめ、これを
その文字候補に対する類似度として登録する。この処理
を、文字位置i番目の文字についてめられた全ての候補
についてそれぞれ実行し、しかるのち、前記フラッグF
iを10″にセットする。
以上の処理を入力単語を構成する各斐字についてそれぞ
れ繰返し実行することによって、単語類似度Sjがめら
れることになる。
一方、前記認識結果の出力処理は第7図に示すようにし
て行われる。先ず一時レジスタが指示する文字列aij
を結果レジスタにセットする。そして、このセットされ
た文字列aijの各文字について、そのフラッグFiが
101かwlmか、或いは121であるかを判定する。
そして、そのフラッグFiが10“である場合には、先
にめられた類似度結果によって示される認識文字を出力
する。この場合、フラッグFiが”11゜f21で示さ
れる文字を除く残シの部分について最大類似度を得る単
語が選択されることは、云うまでもない。そして、フラ
ッグF1が111で示される文字、つまシ単語の文字記
号が「*」で示される場合には、その文字位置の認識結
果として、第1番目の文字位置における第1順位の候補
が選択され、この候補を結果レジスタにセットする。ま
た文字記号が「!」で示され、フラッグF1が121で
ある場合には、第1番目の文字位置の候補中、例えば記
号「!」で指定されるカテゴリに該当するもの、具体的
には例えば数字のみを選択し、その中の最高順位の候補
を取出して結果レジスタにセットする。このようにして
結果レジスタにめられた各候補からなる文字列が単語認
識結果として出力される。
このように本装置では、入力単語を構成する文字列中の
重要な意味を有する文字列(文字群)に対してのみ単語
認識処理を行うので、単語辞書15に準備する単語数が
少なくて良い。しかも、この少ない単語を有効に利用し
て効率良く、且つ高速に精度の高い認識処理を行うこと
ができる。故に入力単語中の補助的な意味しか有さない
文字列によって、その認識処理効率が妨げられることが
なく、また辞書構成の簡易化を図、!7得るので実用上
絶大なる効果が奏せられる。
尚、本発明は上記実施例に限定されるものでにない。例
えば入力単語の文字数や、重要な意味を持つ文字の数ま
たその位置等は仕様に応じて定めることができるもので
あシ、また文字は漢字、仮名、数字等であればよい。要
するに本発明はその要旨を逸脱しない範囲で種々変形し
て実施することができる。
【図面の簡単な説明】
第1図はパターン認識装置の基本構成図、第2図は本発
明の一実施例装置の概略構成図、第3図(a) (b)
は単語辞書の構成を示す図、第4図は本発明の認識処理
の概念を模式的に示す図、第5図乃至第7図は認識処理
の流れを示す図である。 11・・・文字認識部、12・・・単語情報バッファ、
13・・・単語類似度計算部、14・・・コントロール
部、15・・・単語辞書、16・・・Qrテーブル11
7・・・文字認識制御部。 出願人代理人 弁理士 鈴 江 武 彦第1図 第2図 第3図 第4図 第5図 第6図

Claims (1)

  1. 【特許請求の範囲】 (1)入力単語の各パターンについてそれぞれパターン
    認識する手段と、これらのパターン認識結果情報と単語
    辞書に予め登録された単語との類似度から上記パターン
    認識結果情報に対する単語認識結果をめる手段とを具備
    し、前記単語辞書に登録された各単語は単語認識処理の
    対象としない位置の文字を指定する情報を持ち、この情
    報によシ指定された文字を除く残りの部分についてのみ
    上記単語認識処理を実行してなることを特徴とするパタ
    ーン認識装置。 (2ン 入力単語は、印刷・手書入力された文字列、あ
    るいは音声入力された音声パターンからなる文字列とし
    て与えられるものである特許請求の範囲第1項記載のパ
    ターン認識装置。 (3)単語認識結果は、情報によって単語認識対象から
    除かれた位置の文字として、パターン。 認識結果の第1順位の候補を採用するものである特許請
    求の範囲第1項記載のパターン認識装置。 (4)単語認識結果は、情報によって単語認識対象から
    除かれた位置の文字として、パターン認識結果のうち上
    記情報によシ示される特定のカテゴリの中で最高順位の
    候補を採用するものである特許請求の範囲第1項記載の
    パターン認識装置。
JP58157595A 1983-08-29 1983-08-29 単語認識装置 Expired - Lifetime JPH069065B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58157595A JPH069065B2 (ja) 1983-08-29 1983-08-29 単語認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58157595A JPH069065B2 (ja) 1983-08-29 1983-08-29 単語認識装置

Publications (2)

Publication Number Publication Date
JPS6049481A true JPS6049481A (ja) 1985-03-18
JPH069065B2 JPH069065B2 (ja) 1994-02-02

Family

ID=15653141

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58157595A Expired - Lifetime JPH069065B2 (ja) 1983-08-29 1983-08-29 単語認識装置

Country Status (1)

Country Link
JP (1) JPH069065B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04102901U (ja) * 1991-01-31 1992-09-04 積水化成品工業株式会社 ヘアーカーラ

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08306428A (ja) * 1995-04-28 1996-11-22 Fuji Hoon Seisakusho:Kk 電線接続部品

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04102901U (ja) * 1991-01-31 1992-09-04 積水化成品工業株式会社 ヘアーカーラ

Also Published As

Publication number Publication date
JPH069065B2 (ja) 1994-02-02

Similar Documents

Publication Publication Date Title
US4379288A (en) Means for encoding ideographic characters
US5109352A (en) System for encoding a collection of ideographic characters
US4903206A (en) Spelling error correcting system
KR950013127B1 (ko) 영어 문자 인식 방법 및 시스템
JPS61502495A (ja) 暗号解析装置
GB2248328A (en) Conversion of phonetic Chinese to character Chinese
JPH11505052A (ja) 語彙辞書の検索範囲を削減するシステム及び方法
JPH0765165A (ja) ニューラル・ネットワークによるパターン認識方法及び装置
CN115393875B (zh) 基于MobileNetV3的五线谱识别与简谱转换的方法及系统
JPS6049481A (ja) 単語認識装置
KR940007932B1 (ko) 표의문자 식별장치 및 처리방법
GB2071018A (en) Improvements in method and apparatus for information processing
JPH0247788B2 (ja)
JPS5842904B2 (ja) 手書きカナ・漢字の文字認識装置
JPS61114388A (ja) 文字入力装置
JPH0795337B2 (ja) 単語認識方式
JPH0632086B2 (ja) パターン認識装置
JPH07271920A (ja) 文字認識装置
JPS6015784A (ja) オンラインくずし字大分類方式
JPH02148277A (ja) パターン認識装置
JPS61114387A (ja) オンライン手書き文字認識装置
JP3331302B2 (ja) 文字認識後処理装置
JPS63268082A (ja) パタ−ン認識装置
JPS59121527A (ja) 日本語入力方式
JPS63138479A (ja) 文字認識装置