JPS5953984A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS5953984A
JPS5953984A JP57163765A JP16376582A JPS5953984A JP S5953984 A JPS5953984 A JP S5953984A JP 57163765 A JP57163765 A JP 57163765A JP 16376582 A JP16376582 A JP 16376582A JP S5953984 A JPS5953984 A JP S5953984A
Authority
JP
Japan
Prior art keywords
category
information
field
recognition
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57163765A
Other languages
English (en)
Other versions
JPH024035B2 (ja
Inventor
Yuji Kawakita
川喜田 裕司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57163765A priority Critical patent/JPS5953984A/ja
Publication of JPS5953984A publication Critical patent/JPS5953984A/ja
Publication of JPH024035B2 publication Critical patent/JPH024035B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明け、文字認識装置の後処理に係り、フィールド単
位でカテゴリを定義してそのカテゴリに属する単語群を
登録し、フィールド単イSfで認識した複数の候補文字
の中からそのフィー7Lド単位に定義されたカテゴリに
勇する単語群に基ついて認識結果を決定するようになっ
た文字認識装置に関するものである。
〔従来技術と問題点〕
文字認識装置には、帳票上の情報を光学的に走査して画
像情報を(4、その画像情報からフィールトノいイJ′
7′仲数の候補文字を認識し、フィールド単位T認識し
た複数の候補文字の中から認識結果を決定」−るもθ)
がある。このような+1に識結果の決定を行う文字認識
装置の後処理において、従来は。
フィールド単位に、文字単位のカテコ゛す、例えば英字
、数字、カナなどのようブjものを指定し、そσ)カデ
ゴリ内で認識結果の決定を行っていた。しかし、漢字、
ひらがな寺、その認ij!fl!対象が広くなってくる
と、文字単位のカテゴリでは認識結果を決定し得ブよい
場会が多くなってくる。
〔発明の目的〕
本発明は、上記の問題を解決するものであって、認識対
象が広くなっても認識結果の決定か工り正確に行い得る
文字認識装置を提供することを目的とするものである。
〔発明の+11成〕 そのたK)に本発明の文字認識装置は、帳票上σ〕情報
を光学的にノ[査して読取り画像情報を得る光学走査部
、画像′lTv報を2値化された内容で配憶する画像記
憶γ41!、帳票上のフィールドの位僧や文事数などフ
ィールド単位のフォーマット情報を有するフォーマット
情報部、」二記画像M11憶部に配憶された内容をフォ
ーマット情報に従ってフィールド単位で読、出して複数
の候補文字を選択する認識部、該認識部において選択さ
れた候補文字の中から1組の単語を認識結果として決定
するN4 Nm結果決定部、及び認識結果として決定さ
れた単語を出力する出力部を備えた文字認fi&装置に
おいて、−り記フォーマット情報部は、フィールド単位
に氏名や住所、職業、品名などのカテゴリを指可する情
報を有し、上配昭鎗結果決定部の中に、上記カテゴリ毎
に夫々に施する複数の単語が登@ネれるカテゴリ計°憶
手段、フィールド単位に上i+3)禰−−マ・ソト情°
報部により指定されるカテゴリに属する単語群を上記カ
テゴリ記憶手段〃)ら選択するカテコ゛り選択手段、上
記認識部により選゛択された105!の候補   □文
字の中ρ)ら上記カテゴリ選択手段により訳択された単
語1#を検索してJ絹の単語をポ折轄呆として決定ず7
−1検索決定手段を備えたことをlトケ徴とする4、の
である。
〔発明の実施例〕
以−ト、本発明の実施例を図面を参照しつつ説明する。
第1図は本発明の1実施例を示すプロ・ツク図、第2図
はフィールドとカテゴリとの関係伺はを示ず図、第3図
は入力文字と認識結果、候補文字及びカテゴリの対応例
を示す図である。図において、■は光学走査部、2は画
像配憶部、3tま認識部、4けフォーマ・ソト情報部、
5けカテコ゛り選択手段、6は検索決定手段、7はカテ
コ゛り配憶部%8け出力手段、9け帳票、10ないし1
2はフィールド、13ないし15iカテゴリ、16は゛
フォーマ・ソト情報を示す。
第1図においで、光学走査部1は、帳票上σ−)′1行
報な光学的して走:rトシて読取り、画像情報なイ悸る
ものであって、その画1m情報か画像11目、は部2に
送られる。画は記憶部2では、光学走;帥rib 1カ
・ら送られてきlこ9!、IJ j牙情独ゲ2値化され
プこ1ノE ’、’;−ごi1ル・1.葎さオする。1
1り識部3では、フリーザ・・ノ) 情報i゛11X4
のフォーマット情報が参照され、画像11−!慎重2 
K *i1憶された内容がフィールド単位で読d〜され
、対応する複数の候補文字が選択される。フォーマ・ソ
ト情報部4には、後述するように帳票上の各フィールド
に関するフォーマット情報及びカテコ゛り指定情報を有
している。カテゴリ選択手段5では、ツーオーマット情
報部4により指定されるカテコ゛りに属する単語群がカ
テゴリ記憶部7から選択さ才する。カテゴリにけ、例え
ば氏名、住所、V、菜、品名lx、どかあり、カテゴリ
記憶部7には、夫々のカテコ゛1ノ毎に属する単語群が
登録されている。検索決定手段6では1選択されたツノ
テゴリに属する単語群を検索し、認識部3で抽出された
複数σ)候補文字の中ρ・ら認識結果を決定し、その認
識結果か出力手段8に送られる。
フィールドとカテゴリとの関係を第2図を参照しつつ説
明する。婬2図において、110※票9上には、フィー
ルド10ないし12があって、夫々のフィールドソへカ
テゴリ化可′Iiヒな認識対象フ、イールドであるとす
る。そのカテゴリに1夫々フイールド10が1)、フィ
ールド11がa1フィールド12がCである。これらの
事項に基づいて、フォーマット情報16としてd1夫々
のフィールド毎に1例工ばそのフィールドの行位償やフ
ィールド位置(左右の4511ハ゛)1文字数、読、取
りモード(数字、英字、カナ・・・・・等)そσ)他フ
ィールドを特徴づける情報と、更に、そのフィールドの
カテゴリが登録される。例えばフィールド10が、氏名
のフィールドであるとすると、カテゴリ14の中には、
その認識対象となる氏名の単語群が登録される。
次に第3図を参照しつつ、帳票9上のフィールド10に
A。l:3oCoが1.ρ・れた場合について説明する
。ここでフィールド10のカテゴリは1)であり、カテ
ゴリbの単語群には、■A3 B4 ”+1、■Ao 
Bo Go、■AiB7Cい・・・などの単語が登録さ
れているとする。
そこで、認+1へIB 3では、Aoに対しん、 A3
. A、・・・、BOに対しB、 、 Ho、 B4.
 、、、、Coに対しCI + ”0 * 06 * 
”’が類似度の市Jい順で認識され、A−o Bs C
sがg識結呆とされ、フォーマット・111報部4では
カテコ゛すbか指定されてカテゴリ選択手段5に↓って
カテゴリbの単語群が選択された場合、カテゴIJ l
)の単語群をtl索する。しかし、カテゴIJ bの単
語群にけ。
AoB、 C,なる単語は登録されていないから、次位
以降の候補文字をも対象にして検索することによって、
AoBoCoなる認識結果を決定することかできる。
以上説明したように%認識対象となるフィールドにハ′
1氏名、住所、職業、品名などカテゴリ化可能なものが
多々あることから、このカテゴリ毎に集めた文字のかた
まり(単語)をカテゴリ毎に区別して記憶し、認識対象
となるフィールドにそのカテゴリを指定する。そして、
その区別して記憶された単語を選択し、検索することに
より、よシ正確な認識結果を得ることができる。
〔発明の効果〕
以上の説明から明らかなように、本発明によれ    
゛ば、帳票上のフィールド単位に書ρ・れる内容をカテ
ゴリ化し、七〇カテゴリに属する単語を予め登録し、カ
テゴリ毎に選択して単語の検索を行うようにしたので、
より正確な認識結果を決定することができ、しかも検索
する単語の範囲が限定されるので、無駄な検索が少なく
なり、検索効率が向上し、処理速1rを向上させること
ができる。
【図面の簡単な説明】
i¥f1図は本発明の1実施例を示すブロック図。 堕2図はフィールドとカテゴリとの関係付けを示す図、
第3図は入力文字と認識結果、候補文字及びカテゴリの
対応例を示す図である・ 1・・・光学疋査部、2 ・r=像ii’ IJi部、
3・” ’ag R部、4・・・フA−マ・V)情報部
、5・・・カテゴリ選択手段、6・・・検索決W手段、
7・・カテゴリ記憶1<B、8・・・出力相二段、9・
・・+lji、s票、10ないし12・・・フィールド
。 13ないし15・・カテゴリ、16・・・フ→−マ・ソ
ト情報。 特許出願人 ′畠士】1u株式会社 代理人弁理士  京 谷 四 部 45 ・3 牙 1 薗 ′fZ  図 オ 31コ

Claims (1)

    【特許請求の範囲】
  1. 帳票上の情報を光学的に走査して読取り画像情報を得る
    光学走査部、画像情報を2値化された内容で配憶する画
    像Me憶部、帳票上のフィールドの位11′fや文字数
    などフィールド単位のフォーマット情報を有するフォー
    マット情報部、上記画像記憶部に記憶された内容をフォ
    ーマット情報に従ってフィールド午’BjT読出して複
    数の候補文字を選択する認鐘部、該認識部において選択
    された候補文字の中〃・ら1絹の単語ケ認識結果として
    決定するψ識結釆決足部、及び認識結果として決定され
    た単語を出力する出力部を備えた文字i色I!I′iI
    !装置次において、上記ツメ−マット情報部は、フィー
    ルド単位に氏名や住所、職業、品名などのカテゴリを指
    定する情報をIT L 、上記Mg識結果決定部の中に
    、上記カテゴリ毎に夫々に属する複数の単語が登録され
    るカテゴリ記憶手段、フィールド単位に上R1フォーマ
    ・ソト情報部により指定されるカテゴリに属する檗語群
    を上言1コカテゴリ記憶手段から私択するカテゴリ選択
    手段、」二記認識部により選択された複数の候補文字の
    中から上記カテゴリ選択手段により選択された単語群を
    検索してJ絹の単語を選択結果として決定する検索決定
    手段を備えたことを!1庁徴とする文字認識装置。
JP57163765A 1982-09-20 1982-09-20 文字認識装置 Granted JPS5953984A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57163765A JPS5953984A (ja) 1982-09-20 1982-09-20 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57163765A JPS5953984A (ja) 1982-09-20 1982-09-20 文字認識装置

Publications (2)

Publication Number Publication Date
JPS5953984A true JPS5953984A (ja) 1984-03-28
JPH024035B2 JPH024035B2 (ja) 1990-01-25

Family

ID=15780280

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57163765A Granted JPS5953984A (ja) 1982-09-20 1982-09-20 文字認識装置

Country Status (1)

Country Link
JP (1) JPS5953984A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62216074A (ja) * 1986-03-18 1987-09-22 Akio Hisama 名刺自動読取整理装置
JPH01169696U (ja) * 1988-05-20 1989-11-30

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62216074A (ja) * 1986-03-18 1987-09-22 Akio Hisama 名刺自動読取整理装置
JPH01169696U (ja) * 1988-05-20 1989-11-30

Also Published As

Publication number Publication date
JPH024035B2 (ja) 1990-01-25

Similar Documents

Publication Publication Date Title
US7081975B2 (en) Information input device
JP2816241B2 (ja) 画像情報検索装置
EP0117336A2 (en) Picture image filing apparatus
JPH11161681A (ja) 検索結果を表示するための装置および方法、並びに、検索結果を出力するために一連の命令を記録したコンピュータ読み取り可能な記録媒体
KR870011552A (ko) 문서 등록 방식
JPH0345952B2 (ja)
JPS5947641A (ja) 名刺デ−タベ−ス作成装置
US20060045340A1 (en) Character recognition apparatus and character recognition method
EP0144006B1 (en) An improved method of character recognitionand apparatus therefor
JPH1166196A (ja) 文書画像認識装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPS5953984A (ja) 文字認識装置
CN113438379A (zh) 信息处理装置以及记录媒体
JPH09198404A (ja) 文書処理方法及び装置
JPS60160475A (ja) 文書フアイル検索方式
KR100210492B1 (ko) 영문 접촉문자 분리기능을 개선한 문서 인식장치 및 그 방법
JPS6154569A (ja) 文書画像処理方式
JPH04104367A (ja) ファイルシステム
JP3720405B2 (ja) 領域識別装置及び方法
JPH09269970A (ja) 文字認識方法とその装置
JPS60123961A (ja) デ−タ記憶方法
JPS5949628B2 (ja) 光学式文字読取装置
JPH04348475A (ja) 画像情報検索方法及びその装置
JPH0554120A (ja) 文書分離方式
NL1006757C2 (nl) Retrospectieve conversie.
JPH02166587A (ja) 単語検索方式