JPS6121581A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS6121581A
JPS6121581A JP59139684A JP13968484A JPS6121581A JP S6121581 A JPS6121581 A JP S6121581A JP 59139684 A JP59139684 A JP 59139684A JP 13968484 A JP13968484 A JP 13968484A JP S6121581 A JPS6121581 A JP S6121581A
Authority
JP
Japan
Prior art keywords
characters
word
area
words
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59139684A
Other languages
English (en)
Inventor
Yukikazu Kaburayama
蕪山 幸和
▲はい▼ 東善
Touzen Hai
Eiichiro Yamamoto
山本 栄一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59139684A priority Critical patent/JPS6121581A/ja
Publication of JPS6121581A publication Critical patent/JPS6121581A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 【産業上の利用骨!〕 本発明は、帳票に所定様式で記録された文字を認識する
装置に関し、特に表記部と読み部を持つ単語辞書を用い
て記録された文字の認識精度を向上させる方法に関する
。   ″ 情報処理装置の情報人力装置と、して使用される文字認
識装置は特殊な磁気インクで印刷された小切手の口座番
号を読み取る装装置から始まり、郵便番号や銀行の口座
番号の読み取り、更に各種帳票類の読み取り等情報処理
技術の発達に伴いその利用範囲が急速に拡大されて来た
。 認識する文字としては、主に印刷された文字。 手書き文字があり、又文字認識の対象としては数字、英
字、カナ文字、漢字、署名等がある。 上記ような文字認識装置は各種各様の人が取扱うため、
取扱いが便利でしかも何処にでも置ける大きさで構成す
る必要があり、又このような制限された大きさで構成し
、より正確にしかも迅速に文字を認識す゛ることが必要
課題であり、このような課題を克服した文字認識装置の
開発が要望されていた。 〔従来の技術〕 従来の文字認識装置の一般的な機能を図面を参照して説
明する。 第2図は従来の文字認識システムの構成図を示す。 第2図に示す文字認識システムは以下に述べる機能部分
で構成されている。即ち。 帳票上の文字を光学的に読取った文字パターンの濃度値
、或いはコントラスト値を電気信号に変換する観測部1
゜ 文字パターンに含まれている種々の雑音を除去する前処
理部2゜ 文字パターンを特徴付け・るパラメタの検出を行う特徴
抽出部3゜ 特徴パラメタにもとづいた文字カテゴリの識別を行う認
識部4゜ 文字カテゴリに属する文字パターンが持つべき特徴パラ
メタのデータを記憶している認識辞書5゜認識された文
字列の情報を調べて前後関係から誤って認識された文字
の検出を行い正しい文字へ訂正する後処理部6゜ 全体の動作を制御すると共に格納している帳票様式に関
するデータにより帳票様式の読取り観測を行わせる制御
部7゜ から構成されている。 上記文字認識装置は以下の動作にて文字を認識する。即
ち、帳票(図示してない)の所定様式と所定様式に記入
されている文字を制御部7の制御のもとに観測部1で光
学的に読取り、電気信号に変換した読取りデータを前処
理部2に出力し不要な雑音を除去し、そのデータを特徴
抽出部3に出力する。 尚帳票(図示してない)の所定様式に関する情報は制御
部7に記録されているものとする。又この情報は、所定
様式の帳票(図示してない)を枠の集合と考え2例えば
最初の枠は姓名の表記部でN個の枠に分離されており、
その開始位置はAから等の情報である。 特徴抽出部3では、入力したデータ(文字パターン)を
特徴付けるパラメタの検出を行い、その特徴パラメタを
認識部4に出力する。認識部4では、各種文字パターン
が持つべき特徴パラメタを格納している認識辞書5と照
合して、特定の候補  ′文字を認識し出力する。 このような文字認識装置で1例えば漢字の単語を認識す
る場合、認識辞書5内に単語名のみを含んだ単語辞書を
持ち認識する方法と、単語名と読みを含んだ単語辞書を
持ち認識する方法とが従来実施されていた。 〔発明が解決しようとする問題点〕 しかし、上記のような従来方法2例えば認識辞書5内に
単語名のみを含、んだ単語辞書を持ち認識する方法では
、類似した単語が存在した場合は認識精度が低下すると
言う問題点があり、又単語名と読みを含んだ単語辞書を
持ち認識する方法では。 読みの記入漏れがあった場合は認識処理が不可能どなる
問題点があった。 〔問題点を解決するための°手段〕 本発明は、上記問題点を解消した新規な文字認識装置を
実現することを目的とするものであり。 該問題点は、帳票上に記録されている文字(単語)数を
検出するための検出手段と、前記単語表記部の情報と前
記単語読み部の情報を貯蔵する単語辞書と、前記単語表
記部内に記入されている文字数情報と前記単語読み部内
に記入されている文字数情報とに基づいて前記帳票上の
文字(単語)を認識出力する検索テーブルとを設けてな
る本発明による文字認識装置により解決される。 〔作用〕 即ち、単語(例えば、漢字)を表記部と読み部で表現し
、制御部で検出した表記部の文字数と読み部の文字数を
キーとし、又この両キーでは表記部の文字数を上位のキ
ーとし、てソートした単語専用の単語辞書と9表記部の
文字数のキーと読み部の文字数のキーとの組合わせによ
り与えられたキーを持つ単語辞書内の単語の集合を示す
情報1例えば開始番地と終了番地を得る検索テーブルと
をした処理が可能となる装置を提供する。 〔実施例〕 以下本発明の要旨を第1図に示す実施例により具体的に
説明する。 第1図(A)は本発明に係る単語認識装置の一実施例を
示すブロックダイヤグラム、第1図(B)は本発明に係
る単語認識装置の単語辞書の一実施例、第1図(C)は
本発明に係る単語認識装置の検索テーブルの一実施例、
第1図(D)は本発明に係る帳票記入例、第1図(E)
は本発明に係る認識候補例をそれぞれ示す。 図において、a、a’は表記部類域、b、b’は読み部
類域−1Cはキー領域、dは番地領域をそれぞれ示す。 尚全図を通じて同一記号は同一対象物又は内容を示す。 第1図(A)に示す本実施例は、観測部1.認識辞書5
の従来の構成部分と。 規定された様式に沿って文字(単語)を記入する帳票8
゜ 帳票8に記入された文字パターンの特徴パラメタを抽出
し認識辞書5とで文字カテゴリ (記入された単語の候
補文字)の識別選択を行う特徴抽出認識部9゜ 特徴抽出認識部9から出力された単語の候補文字から1
つの単語を認識する単語処理部10゜単語処理部10が
複数の候補文字から1つの単語を゛認識するための検索
テーブル11゜ 単語処理部10が複数の候補文字から1つの単語を認識
するためのデータを記憶している単語辞書12とから構
成されている。 尚単語辞書12は一般に既知の文字(本実施例で   
   −は姓名を認識する場合とする)をなるべく多゛
く記憶していことが望ましいが1本実施例では第1図(
B)に示す様に16個の姓でなっているものとする。又
この単語辞書12は表記部類域aの文字数を第1のキー
、読み部類域すの文字数を第2のキーとして順次に並べ
ている。 検索テーブル11は第1図(C)に示す様に1表記部領
域a′の文字数9例えばrlJと読み部類域b′の文種
数9例えば「3」とにより、それを満足する姓の単語辞
書12での開始番地と終了番地(単語辞書12のキー領
域Cの番号1〜16)を求める様になっている。 又、読み部類域b′の文字数をゼロとすることにより、
読み部eM3jAbが指定されなくとも表記部類域aの
文字数を満足する姓の単語辞書12での開始番地と終了
番地が得られる様になっている。 尚表記部類域a及び読み部eJIJ!!ibの文字数検
出は1本実施例では、制御部7内の帳票8様式(帳票様
式をテーブルとして持つ)と照合し観測部lで読取る場
合に、規定枠内への文字の記入の有無を制御部7で判定
して検出する。 即ち2例えば第1図(D)の表記部’a’f4Maは3
つの枠で構成されているデータが制御部7内テーブルに
記録されており、3つの枠の検出時に文字記入の有無も
検出し1表記部領域aの文字数は2と判定する。 次に、第1図(E)に示す認識候補は次の様にして選択
される。即ち1表記部領域aの「小」に一番類似してい
る語を似ている順番に例えば1位(例えば、「小J)か
ら4位(例えば、「火」)まで選別する。同様に「山」
も1位(例えば、「少」)から4位(例えば、「±」)
まで選別する。 又同様に読み部s1域すでもそれぞれの候補を1位から
4位まで選別する。 次に本実施例の動作を説明する。 第1図(D)に示す帳票8上に記入された表記領域aの
「小山」と、読部領域すの「コヤマ」と言う姓を入力し
、観測部1.特徴抽出認識部9゜認識辞書部5で構成さ
れる文字認識機能部分で認識し、各文字の候補文字(第
1図(E)に示す様に似ていると判断された複数の文字
)が単語処理部10に出力されたものとする。 単語処理部lOでは、認識候補の組合わせで出来る語(
表記部類域aと読み部類域b)の内、単語辞書12に存
在し、キー領域Cの順位の小さいものを結果として出力
するも9として、以下の手順で処理を行う。 (1):検索テーブル11で表記部領域a′の文字数「
2」、読み部領域b′の文字数「3」から単語の開始番
地「5」、終了番地「9」を得る。 +21 : (11項で得られた単語辞書12の番地内
にある5つの語について、第1図(E)に示す候補文字
で構成出来るか否かを検索する。構成出来る場合は。 構成した語と各候補の順位の和を記憶する。 +31 : (21項での結果、「小山 コヤマ」が単
語辞書12の番地「6」より得られ、その順位の和は。 1+2+1+1+2=7 となる。この単語「小山 コヤマ」を認識した単語とし
て出力する。 (4):第1図(E)に示す候補文字の中に構成出来る
候補文字がある場合は(3)項で動作は終了となるが、
候補文字が無かった場合は、候補文字の1位「小生 コ
ヤア」を出力する。又逆に複数の単語が得られた場合は
、順位の和の小さい単語を出力する。 (5):記入者が読み部領域すの記入を忘れた場合は。 検索テーブル11を表記部領域a′の文字数「2」。 読み部領域b′の文字数「0」でアクセスし、開始番地
「3」、終了番地「15」を得て、以下同様の動作を表
記部領域aのみで行う。これにより。 「小山」・・・順位の和3.「小川」・・・順位の和4
が得られ、順位の和の小さい「小山」を出力する。 向上記の実施例では表記部vA域aめみでも処理が可能
となっているが、類似した単語の多い場合は表記部w4
域aのみ°の処理では不完全で、誤処理(例えば、松本
−松本等)をする可能性が比較的大となるため、より正
確を期するためには読み部領域すの併記が必要となる。     次に他の実施例の動作を説明する。 第3図(A)は他の実施例の単語辞書(■)。 第3図(B)は他の実施例の検索テーブル(II)をそ
れぞれ示す。 本実施例は第1図に示す実施例の変形したものであり、
装置の構成は同じで単語辞書12と検索テーブル11が
、第3図に示す様に単語辞書12(n)と検索テーブル
11(II)となる。 単語辞書1,2(n)は単語辞書12と同じ語より構成
されるが、ソートのキーが異なり第1のキーは表記部領
域aの先頭文字、第2のキーは表記部aの文字数、第3
のキーは読み部すの文字数とする。 第1のキーは、実際には文字コードを使うが1本実施例
では音読みを五十音順で配列した。 単語辞書12(I[)のソートの相違により、検索テー
ブル11(II)も第3図(B)に示すようになる。尚
本実施′例の場合でも、読み部領域すでの記入漏れを考
慮し、読み部す文字数=0のキーも設定している。 第1図(E)の候補文字による処理手順を以下に“説明
する。 (1):検索テーブル11(”II)のキー領域Cの「
小。 2.3」をアクセスして開始番地「2」、終了番地「4
」を得る。 ゛ (2)二単語辞書12(II)のキー領域Cの2番地か
ら4番地の単語と照合することにより。 「小山 コヤマ」・・・順位の和7 を得る。 (3):同様に[川、2,3J、r心、  2. 3’
)」のキーにより検索テーブルIf(Uンをアク!スし
ても検索テーブル11(II”>にキーがないため失敗
となる。 +41 : 4位の[火、2,3Jによる処理は、順位
が4位であり、順位の和が7より小さいものが得られる
可能性は無いので処理は行わず、(2ト項で得られた「
小山 コヤマ」を出力する。 本実施例は、単語辞書12(■)が大きい場合アクセス
する量が第1図i示す実施例に比べて少なくなる効果が
ある。 〔発明の効果〕 以上のような本発明によれば、単語が高精度で読み取れ
ると共に、読み部が万−記入漏れとなって−も読み取り
精度は従来以上に向上させることが出来ると言う効果が
ある。
【図面の簡単な説明】
第1図(A)は本発明゛に係る単語認識装置の−実施例
を示すブロックダイヤグラム。 第1図(B)は本発明に係る単語認識装置の単語辞書の
一実施例。 第1図(C)゛は本発明に係る単語認識装置の検索デー
プルの一実施例。 第1図(D)は本発明に係る帳票記入例。 第1図(E)は本発明に係る認識候補例。 第2図は従来の文字認識システムの構成図。 第3図(A)は他の実施例の単語辞書(■)。 第3図(B)は他の実施例の検索テーブル(n)をそれ
ぞれ示す。 図において。 ■は観測部、      5は認識辞書。 7は制御部、      8は帳票。 9は特徴抽出・認識部、 10は単語処理部。 11は検索テーブル。 12は単語辞書。 をそれぞ軌示す。 冬1 目 tB) 畢1 口 (D)

Claims (3)

    【特許請求の範囲】
  1. (1)単語表記部と単語読み部とを有する所定様式の帳
    票の枠と、前記帳票の枠内に記録された文字とを認識す
    る装置において、前記帳票上に記録されている文字(単
    語)数を検出するための検出手段と、前記単語表記部の
    情報と前記単語読み部の情報を貯蔵する単語辞書と、前
    記単語表記部内に記入されている文字数情報と前記単語
    読み部内に記入されている文字数情報とに基づいて前記
    帳票上の文字(単語)を認識出力する検索テーブルとを
    設けたことを特徴とする文字認識装置。
  2. (2)前記単語辞書から情報を取出す場合、該単語表記
    部に記入された文字数を上位のキーとしたことを特徴と
    する特許請求の範囲第1項記載の文字認識装置。
  3. (3)前記検索テーブルは、該単語表記部の文字数をキ
    ーとして検索する場合のテーブルと、該単語表記部の文
    字数と該単語読み部の文字数とをキーとして検索する場
    合のテーブルとを備えたことを特徴とする特許請求の範
    囲第1項、第2項記載の文字認識装置。
JP59139684A 1984-07-05 1984-07-05 文字認識装置 Pending JPS6121581A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59139684A JPS6121581A (ja) 1984-07-05 1984-07-05 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59139684A JPS6121581A (ja) 1984-07-05 1984-07-05 文字認識装置

Publications (1)

Publication Number Publication Date
JPS6121581A true JPS6121581A (ja) 1986-01-30

Family

ID=15251017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59139684A Pending JPS6121581A (ja) 1984-07-05 1984-07-05 文字認識装置

Country Status (1)

Country Link
JP (1) JPS6121581A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5144935A (en) * 1990-10-03 1992-09-08 Mitsubishi Denki Kabushiki Kaisha Ignition coil unit for an internal combustion engine

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5144935A (en) * 1990-10-03 1992-09-08 Mitsubishi Denki Kabushiki Kaisha Ignition coil unit for an internal combustion engine

Similar Documents

Publication Publication Date Title
US4903206A (en) Spelling error correcting system
US5161245A (en) Pattern recognition system having inter-pattern spacing correction
US8411958B2 (en) Apparatus and method for handwriting recognition
JPS6121581A (ja) 文字認識装置
JP3945075B2 (ja) 辞書機能を備えた電子装置及び情報検索処理プログラムを記憶した記憶媒体
JP4054453B2 (ja) 文字認識装置およびプログラム記録媒体
JPS592191A (ja) 手書き日本語文の認識処理方式
JP3924899B2 (ja) テキスト検索装置およびテキスト検索方法
JPH0441388B2 (ja)
JPS6394365A (ja) 日本文文書誤り検定装置
JP3045886B2 (ja) 手書き入力機能付き文字処理装置
JPH01106263A (ja) 文書の格納検索装置
JPH0256086A (ja) 文字認識の後処理方法
JP2560959B2 (ja) 文字認識後処理方式
JPH0340434B2 (ja)
JP2000251017A (ja) 単語辞書作成装置および単語認識装置
JPS60225273A (ja) 単語検索方式
JPH02148174A (ja) Ocrによる住所データベース検索装置
JPS63268082A (ja) パタ−ン認識装置
JP3007697B2 (ja) 単語照合装置及び単語照合方法
JPH05258100A (ja) 文字認識装置
JPH0528132A (ja) 単語辞書照合装置
JPH0546815A (ja) 光学式文字読取装置における住所単語照合方法
JPS63188284A (ja) 文字読取装置
JPH02136959A (ja) 日本文訂正候補抽出装置