JPS5953984A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPS5953984A JPS5953984A JP57163765A JP16376582A JPS5953984A JP S5953984 A JPS5953984 A JP S5953984A JP 57163765 A JP57163765 A JP 57163765A JP 16376582 A JP16376582 A JP 16376582A JP S5953984 A JPS5953984 A JP S5953984A
- Authority
- JP
- Japan
- Prior art keywords
- category
- information
- field
- recognition
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明け、文字認識装置の後処理に係り、フィールド単
位でカテゴリを定義してそのカテゴリに属する単語群を
登録し、フィールド単イSfで認識した複数の候補文字
の中からそのフィー7Lド単位に定義されたカテゴリに
勇する単語群に基ついて認識結果を決定するようになっ
た文字認識装置に関するものである。
位でカテゴリを定義してそのカテゴリに属する単語群を
登録し、フィールド単イSfで認識した複数の候補文字
の中からそのフィー7Lド単位に定義されたカテゴリに
勇する単語群に基ついて認識結果を決定するようになっ
た文字認識装置に関するものである。
文字認識装置には、帳票上の情報を光学的に走査して画
像情報を(4、その画像情報からフィールトノいイJ′
7′仲数の候補文字を認識し、フィールド単位T認識し
た複数の候補文字の中から認識結果を決定」−るもθ)
がある。このような+1に識結果の決定を行う文字認識
装置の後処理において、従来は。
像情報を(4、その画像情報からフィールトノいイJ′
7′仲数の候補文字を認識し、フィールド単位T認識し
た複数の候補文字の中から認識結果を決定」−るもθ)
がある。このような+1に識結果の決定を行う文字認識
装置の後処理において、従来は。
フィールド単位に、文字単位のカテコ゛す、例えば英字
、数字、カナなどのようブjものを指定し、そσ)カデ
ゴリ内で認識結果の決定を行っていた。しかし、漢字、
ひらがな寺、その認ij!fl!対象が広くなってくる
と、文字単位のカテゴリでは認識結果を決定し得ブよい
場会が多くなってくる。
、数字、カナなどのようブjものを指定し、そσ)カデ
ゴリ内で認識結果の決定を行っていた。しかし、漢字、
ひらがな寺、その認ij!fl!対象が広くなってくる
と、文字単位のカテゴリでは認識結果を決定し得ブよい
場会が多くなってくる。
本発明は、上記の問題を解決するものであって、認識対
象が広くなっても認識結果の決定か工り正確に行い得る
文字認識装置を提供することを目的とするものである。
象が広くなっても認識結果の決定か工り正確に行い得る
文字認識装置を提供することを目的とするものである。
〔発明の+11成〕
そのたK)に本発明の文字認識装置は、帳票上σ〕情報
を光学的にノ[査して読取り画像情報を得る光学走査部
、画像′lTv報を2値化された内容で配憶する画像記
憶γ41!、帳票上のフィールドの位僧や文事数などフ
ィールド単位のフォーマット情報を有するフォーマット
情報部、」二記画像M11憶部に配憶された内容をフォ
ーマット情報に従ってフィールド単位で読、出して複数
の候補文字を選択する認識部、該認識部において選択さ
れた候補文字の中から1組の単語を認識結果として決定
するN4 Nm結果決定部、及び認識結果として決定さ
れた単語を出力する出力部を備えた文字認fi&装置に
おいて、−り記フォーマット情報部は、フィールド単位
に氏名や住所、職業、品名などのカテゴリを指可する情
報を有し、上配昭鎗結果決定部の中に、上記カテゴリ毎
に夫々に施する複数の単語が登@ネれるカテゴリ計°憶
手段、フィールド単位に上i+3)禰−−マ・ソト情°
報部により指定されるカテゴリに属する単語群を上記カ
テゴリ記憶手段〃)ら選択するカテコ゛り選択手段、上
記認識部により選゛択された105!の候補 □文
字の中ρ)ら上記カテゴリ選択手段により訳択された単
語1#を検索してJ絹の単語をポ折轄呆として決定ず7
−1検索決定手段を備えたことをlトケ徴とする4、の
である。
を光学的にノ[査して読取り画像情報を得る光学走査部
、画像′lTv報を2値化された内容で配憶する画像記
憶γ41!、帳票上のフィールドの位僧や文事数などフ
ィールド単位のフォーマット情報を有するフォーマット
情報部、」二記画像M11憶部に配憶された内容をフォ
ーマット情報に従ってフィールド単位で読、出して複数
の候補文字を選択する認識部、該認識部において選択さ
れた候補文字の中から1組の単語を認識結果として決定
するN4 Nm結果決定部、及び認識結果として決定さ
れた単語を出力する出力部を備えた文字認fi&装置に
おいて、−り記フォーマット情報部は、フィールド単位
に氏名や住所、職業、品名などのカテゴリを指可する情
報を有し、上配昭鎗結果決定部の中に、上記カテゴリ毎
に夫々に施する複数の単語が登@ネれるカテゴリ計°憶
手段、フィールド単位に上i+3)禰−−マ・ソト情°
報部により指定されるカテゴリに属する単語群を上記カ
テゴリ記憶手段〃)ら選択するカテコ゛り選択手段、上
記認識部により選゛択された105!の候補 □文
字の中ρ)ら上記カテゴリ選択手段により訳択された単
語1#を検索してJ絹の単語をポ折轄呆として決定ず7
−1検索決定手段を備えたことをlトケ徴とする4、の
である。
以−ト、本発明の実施例を図面を参照しつつ説明する。
第1図は本発明の1実施例を示すプロ・ツク図、第2図
はフィールドとカテゴリとの関係伺はを示ず図、第3図
は入力文字と認識結果、候補文字及びカテゴリの対応例
を示す図である。図において、■は光学走査部、2は画
像配憶部、3tま認識部、4けフォーマ・ソト情報部、
5けカテコ゛り選択手段、6は検索決定手段、7はカテ
コ゛り配憶部%8け出力手段、9け帳票、10ないし1
2はフィールド、13ないし15iカテゴリ、16は゛
フォーマ・ソト情報を示す。
はフィールドとカテゴリとの関係伺はを示ず図、第3図
は入力文字と認識結果、候補文字及びカテゴリの対応例
を示す図である。図において、■は光学走査部、2は画
像配憶部、3tま認識部、4けフォーマ・ソト情報部、
5けカテコ゛り選択手段、6は検索決定手段、7はカテ
コ゛り配憶部%8け出力手段、9け帳票、10ないし1
2はフィールド、13ないし15iカテゴリ、16は゛
フォーマ・ソト情報を示す。
第1図においで、光学走査部1は、帳票上σ−)′1行
報な光学的して走:rトシて読取り、画像情報なイ悸る
ものであって、その画1m情報か画像11目、は部2に
送られる。画は記憶部2では、光学走;帥rib 1カ
・ら送られてきlこ9!、IJ j牙情独ゲ2値化され
プこ1ノE ’、’;−ごi1ル・1.葎さオする。1
1り識部3では、フリーザ・・ノ) 情報i゛11X4
のフォーマット情報が参照され、画像11−!慎重2
K *i1憶された内容がフィールド単位で読d〜され
、対応する複数の候補文字が選択される。フォーマ・ソ
ト情報部4には、後述するように帳票上の各フィールド
に関するフォーマット情報及びカテコ゛り指定情報を有
している。カテゴリ選択手段5では、ツーオーマット情
報部4により指定されるカテコ゛りに属する単語群がカ
テゴリ記憶部7から選択さ才する。カテゴリにけ、例え
ば氏名、住所、V、菜、品名lx、どかあり、カテゴリ
記憶部7には、夫々のカテコ゛1ノ毎に属する単語群が
登録されている。検索決定手段6では1選択されたツノ
テゴリに属する単語群を検索し、認識部3で抽出された
複数σ)候補文字の中ρ・ら認識結果を決定し、その認
識結果か出力手段8に送られる。
報な光学的して走:rトシて読取り、画像情報なイ悸る
ものであって、その画1m情報か画像11目、は部2に
送られる。画は記憶部2では、光学走;帥rib 1カ
・ら送られてきlこ9!、IJ j牙情独ゲ2値化され
プこ1ノE ’、’;−ごi1ル・1.葎さオする。1
1り識部3では、フリーザ・・ノ) 情報i゛11X4
のフォーマット情報が参照され、画像11−!慎重2
K *i1憶された内容がフィールド単位で読d〜され
、対応する複数の候補文字が選択される。フォーマ・ソ
ト情報部4には、後述するように帳票上の各フィールド
に関するフォーマット情報及びカテコ゛り指定情報を有
している。カテゴリ選択手段5では、ツーオーマット情
報部4により指定されるカテコ゛りに属する単語群がカ
テゴリ記憶部7から選択さ才する。カテゴリにけ、例え
ば氏名、住所、V、菜、品名lx、どかあり、カテゴリ
記憶部7には、夫々のカテコ゛1ノ毎に属する単語群が
登録されている。検索決定手段6では1選択されたツノ
テゴリに属する単語群を検索し、認識部3で抽出された
複数σ)候補文字の中ρ・ら認識結果を決定し、その認
識結果か出力手段8に送られる。
フィールドとカテゴリとの関係を第2図を参照しつつ説
明する。婬2図において、110※票9上には、フィー
ルド10ないし12があって、夫々のフィールドソへカ
テゴリ化可′Iiヒな認識対象フ、イールドであるとす
る。そのカテゴリに1夫々フイールド10が1)、フィ
ールド11がa1フィールド12がCである。これらの
事項に基づいて、フォーマット情報16としてd1夫々
のフィールド毎に1例工ばそのフィールドの行位償やフ
ィールド位置(左右の4511ハ゛)1文字数、読、取
りモード(数字、英字、カナ・・・・・等)そσ)他フ
ィールドを特徴づける情報と、更に、そのフィールドの
カテゴリが登録される。例えばフィールド10が、氏名
のフィールドであるとすると、カテゴリ14の中には、
その認識対象となる氏名の単語群が登録される。
明する。婬2図において、110※票9上には、フィー
ルド10ないし12があって、夫々のフィールドソへカ
テゴリ化可′Iiヒな認識対象フ、イールドであるとす
る。そのカテゴリに1夫々フイールド10が1)、フィ
ールド11がa1フィールド12がCである。これらの
事項に基づいて、フォーマット情報16としてd1夫々
のフィールド毎に1例工ばそのフィールドの行位償やフ
ィールド位置(左右の4511ハ゛)1文字数、読、取
りモード(数字、英字、カナ・・・・・等)そσ)他フ
ィールドを特徴づける情報と、更に、そのフィールドの
カテゴリが登録される。例えばフィールド10が、氏名
のフィールドであるとすると、カテゴリ14の中には、
その認識対象となる氏名の単語群が登録される。
次に第3図を参照しつつ、帳票9上のフィールド10に
A。l:3oCoが1.ρ・れた場合について説明する
。ここでフィールド10のカテゴリは1)であり、カテ
ゴリbの単語群には、■A3 B4 ”+1、■Ao
Bo Go、■AiB7Cい・・・などの単語が登録さ
れているとする。
A。l:3oCoが1.ρ・れた場合について説明する
。ここでフィールド10のカテゴリは1)であり、カテ
ゴリbの単語群には、■A3 B4 ”+1、■Ao
Bo Go、■AiB7Cい・・・などの単語が登録さ
れているとする。
そこで、認+1へIB 3では、Aoに対しん、 A3
. A、・・・、BOに対しB、 、 Ho、 B4.
、、、、Coに対しCI + ”0 * 06 *
”’が類似度の市Jい順で認識され、A−o Bs C
sがg識結呆とされ、フォーマット・111報部4では
カテコ゛すbか指定されてカテゴリ選択手段5に↓って
カテゴリbの単語群が選択された場合、カテゴIJ l
)の単語群をtl索する。しかし、カテゴIJ bの単
語群にけ。
. A、・・・、BOに対しB、 、 Ho、 B4.
、、、、Coに対しCI + ”0 * 06 *
”’が類似度の市Jい順で認識され、A−o Bs C
sがg識結呆とされ、フォーマット・111報部4では
カテコ゛すbか指定されてカテゴリ選択手段5に↓って
カテゴリbの単語群が選択された場合、カテゴIJ l
)の単語群をtl索する。しかし、カテゴIJ bの単
語群にけ。
AoB、 C,なる単語は登録されていないから、次位
以降の候補文字をも対象にして検索することによって、
AoBoCoなる認識結果を決定することかできる。
以降の候補文字をも対象にして検索することによって、
AoBoCoなる認識結果を決定することかできる。
以上説明したように%認識対象となるフィールドにハ′
1氏名、住所、職業、品名などカテゴリ化可能なものが
多々あることから、このカテゴリ毎に集めた文字のかた
まり(単語)をカテゴリ毎に区別して記憶し、認識対象
となるフィールドにそのカテゴリを指定する。そして、
その区別して記憶された単語を選択し、検索することに
より、よシ正確な認識結果を得ることができる。
1氏名、住所、職業、品名などカテゴリ化可能なものが
多々あることから、このカテゴリ毎に集めた文字のかた
まり(単語)をカテゴリ毎に区別して記憶し、認識対象
となるフィールドにそのカテゴリを指定する。そして、
その区別して記憶された単語を選択し、検索することに
より、よシ正確な認識結果を得ることができる。
以上の説明から明らかなように、本発明によれ
゛ば、帳票上のフィールド単位に書ρ・れる内容をカテ
ゴリ化し、七〇カテゴリに属する単語を予め登録し、カ
テゴリ毎に選択して単語の検索を行うようにしたので、
より正確な認識結果を決定することができ、しかも検索
する単語の範囲が限定されるので、無駄な検索が少なく
なり、検索効率が向上し、処理速1rを向上させること
ができる。
゛ば、帳票上のフィールド単位に書ρ・れる内容をカテ
ゴリ化し、七〇カテゴリに属する単語を予め登録し、カ
テゴリ毎に選択して単語の検索を行うようにしたので、
より正確な認識結果を決定することができ、しかも検索
する単語の範囲が限定されるので、無駄な検索が少なく
なり、検索効率が向上し、処理速1rを向上させること
ができる。
i¥f1図は本発明の1実施例を示すブロック図。
堕2図はフィールドとカテゴリとの関係付けを示す図、
第3図は入力文字と認識結果、候補文字及びカテゴリの
対応例を示す図である・ 1・・・光学疋査部、2 ・r=像ii’ IJi部、
3・” ’ag R部、4・・・フA−マ・V)情報部
、5・・・カテゴリ選択手段、6・・・検索決W手段、
7・・カテゴリ記憶1<B、8・・・出力相二段、9・
・・+lji、s票、10ないし12・・・フィールド
。 13ないし15・・カテゴリ、16・・・フ→−マ・ソ
ト情報。 特許出願人 ′畠士】1u株式会社 代理人弁理士 京 谷 四 部 45 ・3 牙 1 薗 ′fZ 図 オ 31コ
第3図は入力文字と認識結果、候補文字及びカテゴリの
対応例を示す図である・ 1・・・光学疋査部、2 ・r=像ii’ IJi部、
3・” ’ag R部、4・・・フA−マ・V)情報部
、5・・・カテゴリ選択手段、6・・・検索決W手段、
7・・カテゴリ記憶1<B、8・・・出力相二段、9・
・・+lji、s票、10ないし12・・・フィールド
。 13ないし15・・カテゴリ、16・・・フ→−マ・ソ
ト情報。 特許出願人 ′畠士】1u株式会社 代理人弁理士 京 谷 四 部 45 ・3 牙 1 薗 ′fZ 図 オ 31コ
Claims (1)
- 帳票上の情報を光学的に走査して読取り画像情報を得る
光学走査部、画像情報を2値化された内容で配憶する画
像Me憶部、帳票上のフィールドの位11′fや文字数
などフィールド単位のフォーマット情報を有するフォー
マット情報部、上記画像記憶部に記憶された内容をフォ
ーマット情報に従ってフィールド午’BjT読出して複
数の候補文字を選択する認鐘部、該認識部において選択
された候補文字の中〃・ら1絹の単語ケ認識結果として
決定するψ識結釆決足部、及び認識結果として決定され
た単語を出力する出力部を備えた文字i色I!I′iI
!装置次において、上記ツメ−マット情報部は、フィー
ルド単位に氏名や住所、職業、品名などのカテゴリを指
定する情報をIT L 、上記Mg識結果決定部の中に
、上記カテゴリ毎に夫々に属する複数の単語が登録され
るカテゴリ記憶手段、フィールド単位に上R1フォーマ
・ソト情報部により指定されるカテゴリに属する檗語群
を上言1コカテゴリ記憶手段から私択するカテゴリ選択
手段、」二記認識部により選択された複数の候補文字の
中から上記カテゴリ選択手段により選択された単語群を
検索してJ絹の単語を選択結果として決定する検索決定
手段を備えたことを!1庁徴とする文字認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57163765A JPS5953984A (ja) | 1982-09-20 | 1982-09-20 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57163765A JPS5953984A (ja) | 1982-09-20 | 1982-09-20 | 文字認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5953984A true JPS5953984A (ja) | 1984-03-28 |
| JPH024035B2 JPH024035B2 (ja) | 1990-01-25 |
Family
ID=15780280
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57163765A Granted JPS5953984A (ja) | 1982-09-20 | 1982-09-20 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5953984A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS62216074A (ja) * | 1986-03-18 | 1987-09-22 | Akio Hisama | 名刺自動読取整理装置 |
| JPH01169696U (ja) * | 1988-05-20 | 1989-11-30 |
-
1982
- 1982-09-20 JP JP57163765A patent/JPS5953984A/ja active Granted
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS62216074A (ja) * | 1986-03-18 | 1987-09-22 | Akio Hisama | 名刺自動読取整理装置 |
| JPH01169696U (ja) * | 1988-05-20 | 1989-11-30 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH024035B2 (ja) | 1990-01-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7081975B2 (en) | Information input device | |
| JP2816241B2 (ja) | 画像情報検索装置 | |
| EP0117336A2 (en) | Picture image filing apparatus | |
| JPH11161681A (ja) | 検索結果を表示するための装置および方法、並びに、検索結果を出力するために一連の命令を記録したコンピュータ読み取り可能な記録媒体 | |
| KR870011552A (ko) | 문서 등록 방식 | |
| JPH0345952B2 (ja) | ||
| JPS5947641A (ja) | 名刺デ−タベ−ス作成装置 | |
| US20060045340A1 (en) | Character recognition apparatus and character recognition method | |
| EP0144006B1 (en) | An improved method of character recognitionand apparatus therefor | |
| JPH1166196A (ja) | 文書画像認識装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JPS5953984A (ja) | 文字認識装置 | |
| CN113438379A (zh) | 信息处理装置以及记录媒体 | |
| JPH09198404A (ja) | 文書処理方法及び装置 | |
| JPS60160475A (ja) | 文書フアイル検索方式 | |
| KR100210492B1 (ko) | 영문 접촉문자 분리기능을 개선한 문서 인식장치 및 그 방법 | |
| JPS6154569A (ja) | 文書画像処理方式 | |
| JPH04104367A (ja) | ファイルシステム | |
| JP3720405B2 (ja) | 領域識別装置及び方法 | |
| JPH09269970A (ja) | 文字認識方法とその装置 | |
| JPS60123961A (ja) | デ−タ記憶方法 | |
| JPS5949628B2 (ja) | 光学式文字読取装置 | |
| JPH04348475A (ja) | 画像情報検索方法及びその装置 | |
| JPH0554120A (ja) | 文書分離方式 | |
| NL1006757C2 (nl) | Retrospectieve conversie. | |
| JPH02166587A (ja) | 単語検索方式 |