JP3422924B2 - 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JP3422924B2
JP3422924B2 JP08167898A JP8167898A JP3422924B2 JP 3422924 B2 JP3422924 B2 JP 3422924B2 JP 08167898 A JP08167898 A JP 08167898A JP 8167898 A JP8167898 A JP 8167898A JP 3422924 B2 JP3422924 B2 JP 3422924B2
Authority
JP
Japan
Prior art keywords
character recognition
character
item
characters
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP08167898A
Other languages
English (en)
Other versions
JPH11282955A (ja
Inventor
秀樹 松野
真一 江口
義博 永野
亘一 千葉
勝利 小原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Ltd
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Fujitsu Frontech Ltd filed Critical Fujitsu Ltd
Priority to JP08167898A priority Critical patent/JP3422924B2/ja
Priority to US09/185,604 priority patent/US6320983B1/en
Publication of JPH11282955A publication Critical patent/JPH11282955A/ja
Application granted granted Critical
Publication of JP3422924B2 publication Critical patent/JP3422924B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、例えば金融機関
等で使用される帳票処理装置に適用され、読み取られた
帳票から利用者が選択した項目を文字認識により判定す
る文字認識装置、文字認識方法およびその方法をコンピ
ュータに実行させるプログラムを記録したコンピュータ
読み取り可能な記録媒体に関する。
【0002】
【従来の技術】近年、文字情報をイメージデータ(イメ
ージ)として読み取ってから文字認識する装置として、
光学式文字読み取り装置(OCR装置)等のイメージデ
ータ読取装置が開発され、各種産業においては、このイ
メージデータ読取装置を幅広く利用することにより、業
務の効率化等を図っている。
【0003】例えば、金融機関等における窓口業務を行
なうオペレータは、上述のイメージデータ読取装置を用
いて、帳票媒体(帳票)を効率的に処理することを通じ
て、業務の効率化を図っている。
【0004】特に、上述のような帳票処理を行なうよう
な業務の効率化を図るためには、同一種類の帳票媒体
(認識処理専用帳票)の多量処理を行なうだけでなく、
多種多様なフォーマットを有する帳票を自動的に処理す
ることが要求されている。
【0005】そこで、複数種類の帳票媒体について、イ
メージデータ読取装置を用いた帳票媒体の処理について
図15,図16,図17を参照して説明する。図15は
一般的な帳票処理装置のシステム構成を示す模式図、図
16は図15に示した帳票処理装置の動作の一例を説明
する図、そして、図17は図15に示した帳票処理装置
の動作の変形例を示す図である。
【0006】帳票処理装置1000は、図15に示した
如く、帳票についてのイメージデータを読み取るイメー
ジデータ読取装置1001、演算処理を行う電子計算機
1002、およびデータの書き込みおよび読み出しを行
うハードディスク1003より構成される。イメージデ
ータ読取装置1001は、電子計算機1002に接続さ
れ、電子計算機1002からの制御に基づいてイメージ
データの読取動作を行なう。なお、このイメージデータ
読取装置1001としては、例えばイメージスキャナや
FAXが用いられている。
【0007】また、イメージデータ読取装置1001を
制御する制御装置としての電子計算機1002は、オペ
レータからの命令,データ等を入力するキーボードある
いはマウス等の入力部(図15においてはキーボードの
み図示)1002−1,計算機本体1002−2および
データあるいは制御情報等を表示するディスプレイ10
02−3により構成されている。なお、イメージデータ
読取装置1001により読み取られたイメージデータの
文字認識処理は、電子計算機本体1002−2により行
なわれる。
【0008】さらに、1003はハードディスクであ
り、このハードディスク1003は、電子計算機100
2に接続され、例えば図16に示すように、予め帳票種
類毎に認識すべき文字データの位置情報および文字の種
類、桁数等を指定した情報(以下「定義体情報」と称
す)1003A〜1003C,…を格納する。
【0009】なお、上述のイメージデータ読取装置10
01の代わりに、図16,図17に示すような、イメー
ジデータ読取認識装置1005を用いることもできる。
このイメージ読取認識装置1005は、イメージデータ
読取装置1001と同様のイメージデータの読取動作を
行なうとともに文字認識をも行なうことができる。
【0010】このイメージデータ読取認識装置1005
を用いて、例えば図16に示すように、電気料金払込通
知書1004上に記載された文字データを認識する場合
について説明する。その際には、まず、オペレータによ
るキーボード1002−1の操作により帳票種別(この
場合は電気料金払込通知書(帳票B)1004に対応す
る定義体情報1003B)を指示する。
【0011】続いて、電子計算機1002では、ハード
ディスク1003のアクセスを通じで、指示された帳票
の定義体情報1003Bを引出してイメージデータ読取
認識装置1005に通知する。
【0012】これにより、イメージデータ読取認識装置
1005では、電子計算機1002からの制御情報とし
ての定義体情報1003Bに基づいて、イメージデータ
の読み取りと文字認識処理とを行なうことができる。
【0013】しかしながら、上述の図16に示すような
帳票を処理する手法においては、オペレータの指示によ
り読み取りたい帳票毎に定義体情報を指示する必要があ
る。この手法では、オペレータに負担がかかるほか、定
義体が多くなると指示を間違えたりする。さらに、数千
種類もの帳票を処理することが要求される場合には、オ
ペレータが指示することは現実的に困難となる。
【0014】このため、図17に示すように、帳票10
04の定められた位置1004aには、予め帳票毎に異
なった帳票を判別するためのID番号(この場合は‘0
102’)を記載することにより、上述したようにオペ
レータが帳票種別を指示することなく、自動的に帳票の
読取処理を行なうという方法が考えられている。
【0015】この方法によれば、イメージデータ読取認
識装置1005にて帳票のイメージデータを読み取る際
に、最初に定められた位置1004aに記されたID番
号を認識し、続いて認識したID番号に対応した定義体
情報(この場合は1003B)を使用することにより、
文字認識を行なうことができる。
【0016】ところが、イメージデータを読み取る際
に、イメージデータ読取装置1001やイメージデータ
読取認識装置1005等の光学的読取装置(例えば帳票
処理装置)において帳票等をセットする位置が変動する
場合がある。このような場合には、例えばハードディス
ク1003に定義体情報が予め格納されている帳票と同
一の帳票が読み取られた場合でも、文字データの領域や
図形領域等のイメージの基準点(物理原点)からの座標
が定義体情報におけるものと同一にならないため、帳票
処理装置等においては、同一のレイアウトではないと判
定される。
【0017】帳票処理装置等においては、読み取られた
イメージデータのレイアウトと定義体情報におけるレイ
アウトとを一致させてからイメージデータの文字認識を
行なわないと、文字認識処理が正常に行なわれないこと
がある。このため、まず、それぞれのイメージの基準点
を抽出してそれぞれのイメージの基準点からの座標を比
較してレイアウトの一致の判定を行なっている。
【0018】このように、従来、イメージスキャナ等で
帳票を読み込む際に、帳票の回転方向をオペレータが指
定し、その指定された方向に帳票のイメージデータを回
転させた後に、文字認識等の各種の処理が行われてい
た。あるいは、あらかじめ定められた帳票については、
その帳票上の補正マーク等の特定情報が利用され、正方
向に帳票を回転させる等の方法が採られていた。
【0019】帳票が例えば銀行の振り込み依頼書であっ
た場合、以上のようにして帳票の読み取り方向が補正さ
れたイメージデータに対して文字認識処理を施せば、振
り込み方法として確認される預金種目が判別することが
できる。通常、OCR(Optical Charac
ter Reader)認識によるイメージ読み取り機
構が設けられている。このため、振り込み依頼書にはO
CR用の用紙が用いられ、その用紙に預金種目を指定す
るためのマーキング欄や文字が印刷されている。これら
プレ印字された預金種目のマーキング欄や文字は、イメ
ージ読み取りの際に、ドロップアウトさせ、依頼者が書
き込んだマークだけが残るように処理される。
【0020】また、以上の預金種目の判別方法の他に、
ファームアウトのように、未記入帳票のイメージをあら
かじめ登録しておき、依頼者がマークを記入した帳票の
イメージを読み込んだ際に、両イメージ間の差分からど
の預金種目が選択されたのかを判別する方法や、OCR
帳票を用いることで、媒体使用に基づいて選択マークエ
リアであることの定義をあらかじめ行っておくことで、
どの預金種目が選択されたのかを判別する方法がある。
【0021】
【発明が解決しようとする課題】ところが、上述した従
来例では、帳票から選択種目をマーキングにより確認す
る場合、OCR方式が必須のイメージ読み取り機構とな
るため、その機構に対応させて専用の用紙を用意するこ
とが必須条件であった。今日の銀行の利用状況から見
て、その使用枚数は膨大な数となり、一般の用紙に比べ
てコストが嵩んでいた。また、OCR専用の機構を設け
るため、専用の光学素子を組み込む必要があり、部品点
数が増加した。それゆえ、装置および用紙についてコス
トが嵩むとともに汎用性に欠けるという問題点があっ
た。また、ファームアウト方式の場合には、未記入帳票
のイメージを登録しておく必要があるので、事前準備が
煩雑となり、用紙などの仕様変更の度にイメージを差し
替えるなどの手間がかかるという問題点があった。
【0022】この発明は、上述した従来例による問題を
解消するため、ドロップアウトさせなくても選択マーク
の文字認識を行えるように、帳票用紙として専用用紙に
限らず一般の用紙でも文字認識できるようにして、イメ
ージ読み取り機構および帳票用紙の低コスト化を図ると
ともに、帳票の仕様変更に関係なく文字認識することが
可能な文字認識装置、文字認識方法およびその方法をコ
ンピュータに実行させるプログラムを記録したコンピュ
ータ読み取り可能な記録媒体を提供することを目的とす
る。
【0023】
【課題を解決するための手段】上述した課題を解決し、
目的を達成するため、請求項1の発明に係る文字認識装
置は、選択肢として文字で表記された複数の種目が1グ
ループとして印刷されてなる用紙を光学的に読み取って
得られたイメージデータに基づいて文字認識を行う文字
認識装置であって、あらかじめ複数種のマークが用意さ
れ、前記複数の種目には、前記複数種のマークのいずれ
か1つが付与されたマーク付き文字の種目からなるグル
ープと前記複数種のマークのいずれも付与されていない
無印文字の種目からなるグループとが存在し、前記各グ
ループにマークの種類と各文字の文字認識結果を示す特
徴データとを対応させてあらかじめ登録しておくデータ
ベースと、前記文字認識で得られた前記イメージデータ
の文字認識結果を前記データベースに登録されている
徴データに照合する照合手段と、前記照合手段の照合結
果に基づいて前記複数種のマークからマークの種類
推定する推定手段と、前記推定手段により推定された
マークの種類に応じてマーク付き文字の種目を選択肢と
するか、それともマーク付き文字の種目以外の種目を選
択肢とするかを判定する第1判定手段と、前記データベ
ースを参照して、マーク付き文字の種目を選択肢とする
判定が下された場合には、前記文字認識結果のうちで無
印文字の種目に相当する文字認識結果に基づいて同一グ
ループ内のマーク付き文字の種目を選択肢として判定
し、一方、マーク付き文字の種目以外の種目を選択肢と
する判定が下された場合には、前記文字認識結果のうち
で無印文字の種目の文字認識結果に基づいて同一グルー
プ内の無印文字の種目を選択肢として判定する第2判定
手段と、を備えたことを特徴とす
【0024】この請求項1の発明によれば、データベー
スを参照して、イメージデータの文字認識結果を特徴デ
ータに照合し、照合結果に基づいて複数種のマークから
マークの種類を1つ推定し、マーク付き文字の種目の場
合、文字認識結果のうちで無印文字の種目に相当する文
字認識結果に基づいて同一グループ内のマーク付き文字
の種目を選択肢として判定し、一方、マーク付き文字の
種目以外の種目の場合、文字認識結果のうちで無印文字
の種目の文字認識結果に基づいて同一グループ内の無印
文字の種目を選択肢として判定するようにしたので、
ロップアウトが不要となって用紙としてOCR用紙のよ
うな専用用紙に限らず一般の用紙でも選択項目に関して
文字認識することができ、これにより、イメージ読み取
り機構および帳票用紙の低コスト化を図るとともに、帳
票の仕様変更に関係なく文字認識することが可能であ
る。
【0025】
【0026】
【0027】
【0028】
【0029】
【0030】
【0031】
【0032】
【0033】また、請求項の発明に係る文字認識装置
は、請求項の発明において、前記第1判定手段は、前
記推定手段により前記複数の種目についてすべて無印
字の推定結果が得られた場合、選択肢無しとして判定す
ること特徴とする。
【0034】この請求項の発明によれば、複数の種目
についてすべて無印文字の推定結果が得られた場合に
択肢無しとして判定するようにしたので、マーク忘れの
用紙を確実に判別することが可能である。
【0035】
【0036】
【0037】また、請求項の発明に係る文字認識装置
は、請求項1または2の発明において、前記推定手段
は、前記照合手段の照合結果から複数の候補を抽出し、
前記複数の候補のうちで同種のマークの数が一番多い種
類のマークを最終候補として推定することを特徴とす
る。
【0038】この請求項の発明によれば、複数の候補
のうちで同種のマークの数が一番多い種類のマークを最
終候補として推定するようにしたので、複数の候補から
マークの傾向を容易かつ高い確率で把握することがで
き、これにより、選択項目の認識率を向上させることが
可能である。
【0039】また、請求項の発明に係る文字認識方法
は、選択肢として文字で表記された複数の種目が1グル
ープとして印刷されてなる用紙を光学的に読み取って得
られたイメージデータに基づいて文字認識を行う文字認
識方法であって、データベースには、あらかじめ複数種
のマークが用意され、前記複数の種目には、前記複数種
のマークのいずれか1つが付与されたマーク付き文字の
種目からなるグループと前記複数種のマークのいずれも
付与されていない無印文字の種目からなるグループとが
存在し、前記各グループにマークの種類と各文字の文字
認識結果を示す特徴データとを対応させてあらかじめ登
録しておき、前記文字認識で得られた前記イメージデー
タの文字認識結果を前記データベースに登録されている
特徴データに照合する照合工程と、前記照合工程の照合
結果に基づいて前記複数種のマークからマークの種類を
1つ推定する推定工程と、前記推定工程により推定され
たマークの種類に応じてマーク付き文字の種目を選択肢
とするか、それともマーク付き文字の種目以外の種目を
選択肢とするかを判定する第1判定工程と、前記データ
ベースを参照して、マーク付き文字の種目を選択肢とす
る判定が下された場合には、前記文字認識結果のうちで
無印文字の種目に相当する文字認識結果に基づいて同一
グループ内のマーク付き文字の種目を選択肢として判定
し、一方、マーク付き文字の種目以外の種目を選択肢と
する判定が下された場合には、前記文字認識結果のうち
で無印文字の種目の文字認識結果に基づいて同一グルー
プ内の無印文字の種目を選択肢として判定する第2判定
工程と、を含んだことを特徴とする。
【0040】この請求項の発明によれば、データベー
スを参照して、イメージデータの文字認識結果を特徴デ
ータに照合し、照合結果に基づいて複数種のマークから
マークの種類を1つ推定し、マーク付き文字の種目の場
合、文字認識結果のうちで無印文字の種目に相当する文
字認識結果に基づいて同一グループ内のマーク付き文字
の種目を選択肢として判定し、一方、マーク付き文字の
種目以外の種目の場合、文字認識結果のうちで無印文字
の種目の文字認識結果に基づいて同一グループ内の無印
文字の種目を選択肢として判定する工程にしたので、ド
ロップアウトが不要となって用紙としてOCR用紙のよ
うな専用用紙に限らず一般の用紙でも選択項目に関して
文字認識することができ、これにより、イメージ読み取
り機構および帳票用紙の低コスト化を図るとともに、帳
票の仕様変更に関係なく文字認識することが可能であ
る。
【0041】また、請求項5の発明に係る文字認識方法
は、請求項4の発明において、前記第1判定工程は、前
記推定工程により前記複数の種目についてすべて無印文
字の推定結果が得られた場合、選択肢無しとして判定す
ること特徴とする。
【0042】この請求項5の発明によれば、複数の種目
についてすべて無印文字の推定結果が得られた場合に選
択肢無しとして判定する工程にしたので、マーク忘れの
用紙を確実に判別することが可能である。
【0043】また、請求項6の発明に係る文字認識方法
は、前記推定工程は、前記照合工程の照合結果から複数
の候補を抽出し、前記複数の候補のうちで同種のマーク
の数が一番多い種類のマークを最終候補として推定する
ことを特徴とする。
【0044】この請求項6の発明によれば、複数の候補
のうちで同種のマークの数が一番多い種類のマークを最
終候補として推定する工程にしたので、複数の候補から
マークの傾向を容易かつ高い確率で把握することがで
き、これにより、選択項目の認識率を向上させることが
可能である。
【0045】また、請求項7の発明に係る記録媒体は、
選択肢として文字で表記された複数の種目が1グループ
として印刷されてなる用紙を光学的に読み取って得られ
たイメージデータに基づいて文字認識を行うことをコン
ピュータに実行させるプログラムを記録したコンピュー
タ読み取り可能な記録媒体であって、あらかじめ複数種
のマークが用意され、前記複数の種目には、前記複数種
のマークのいずれか1つが付与されたマーク付き文字の
種目からなるグループと前記複数種のマークのいずれも
付与されていない無印文字の種目からなるグループとが
存在し、前記各グループにマークの種類と各文字の文字
認識結果を示す特徴データとを対応させてあらかじめ登
録しておくデータベースが設けられ、前記コンピュータ
に、前記文字認識で得られた前記イメージデータの文字
認識結果を前記データベースに登録されている特徴デー
タに照合する照合手順と、前記照合手順の照合結果に基
づいて前記複数種のマークからマークの種類を1つ推定
する推定手順と、前記推定手順により推定されたマーク
の種類に応じてマーク付き文字の種目を選択肢とする
か、それともマーク付き文字の種目以外の種目を選択肢
とするかを判定する第1判定手順と、前記データベース
を参照して、マーク付き文字の種目を選択肢とする判定
が下された場合には、前記文字認識結果のうちで無印文
字の種目に相当する文字認識結果に基づいて同一グルー
プ内のマーク付き文字の種目を選択肢として判定し、一
方、マーク付き文字の種目以外の種目を選択肢とする判
定が下された場合には、前記文字認識結果のうちで無印
文字の種目の文字認識結果に基づいて同一グループ内の
無印文字の種目を選択肢として判定する第2判定手順
と、を実行させるためのプログラムを記録している。
【0046】この請求項7の発明によれば、データベー
スを参照して、イメージデータの文字認識結果を特徴デ
ータに照合し、照合結果に基づいて複数種のマークから
マークの種類を1つ推定し、マーク付き文字の種目の場
合、文字認識結果のうちで無印文字の種目に相当する文
字認識結果に基づいて同一グループ内のマーク付き文字
の種目を選択肢として判定し、一方、マーク付き文字の
種目以外の種目の場合、文字認識結果のうちで無印文字
の種目の文字認識結果に基づいて同一グループ内の無印
文字の種目を選択肢として判定する手順にしたので、ド
ロップアウトが不要となって用紙としてOCR用紙のよ
うな専用用紙に限らず一般の用紙でも選択項目に関して
文字認識することができ、これにより、イメージ読み取
り機構および帳票用紙の低コスト化を図るとともに、帳
票の仕様変更に関係なく文字認識することが可能であ
る。
【0047】また、請求項8の発明に係る記録媒体は、
請求項7の発明において、前記第1判定手順は、前記推
定手順により前記複数の種目についてすべて無印文字の
推定結果が得られた場合、選択肢無しとして判定するこ
と特徴とする。
【0048】この請求項8の発明によれば、複数の種目
についてすべて無印文字の推定結果が得られた場合に選
択肢無しとして判定する手順にしたので、マーク忘れの
用紙を確実に判別することが可能である。
【0049】また、請求項9の発明に係る記録媒体は、
前記推定手順は、前記照合手順の照合結果から複数の候
補を抽出し、前記複数の候補のうちで同種のマークの数
が一番多い種類のマークを最終候補として推定すること
を特徴とする。
【0050】この請求項9の発明によれば、複数の候補
のうちで同種のマークの数が一番多い種類のマークを最
終候補として推定する手順にしたので、複数の候補から
マークの傾向を容易かつ高い確率で把握することがで
き、これにより、選択項目の認識率を向上させることが
可能である。
【0051】
【0052】
【0053】
【0054】
【0055】
【発明の実施の形態】以下に添付図面を参照して、文字
認識装置、文字認識方法およびその方法をコンピュータ
に実行させるプログラムを記録したコンピュータ読み取
り可能な記録媒体に係る好適な実施の形態を詳細に説明
する。
【0056】まず、構成について説明する。図1はこの
発明の一実施の形態にかかる帳票処理装置の全体構成を
示す機能ブロック図である。ここで、図1に示す帳票処
理装置30は、私製伝票等のように多種多様なフォーマ
ットを有する帳票から読み取ったイメージデータ(イメ
ージ)に基づいて、この情報の認識を行なうものであ
る。
【0057】この帳票処理装置30は、例えば金融機関
の各支店(営業店)毎に設置されたクライアントと、地
区センタに設置されたサーバとが、交換回線等を介して
接続されることにより構成され、各営業店における帳票
処理を地区センタのサーバにより一括して行なうシステ
ムに適用可能である。
【0058】この帳票処理装置30は、上記システムに
おいて、帳票のイメージデータのレイアウトを解析する
ことにより処理対象の帳票のフォーマットを認識し、こ
の帳票のフォーマットの認識結果に基づいて帳票の文字
認識を実施する。これにより、帳票処理装置専用に作成
された帳票だけでなく、任意のフォーマットで情報が記
入された帳票の認識処理を行なうことができる。ここ
で、帳票処理装置30は、機能的には図1に示すよう
に、レイアウト認識処理ブロック16,文字認識処理ブ
ロック17およびオペレータ確認/修正処理ブロック1
8を備えている。
【0059】レイアウト認識処理ブロック16は、イメ
ージデータ読取装置により読み取られたイメージデータ
19のレイアウト認識処理を行なうブロックであり、解
析前処理部1,レイアウト解析処理部2,レイアウト照
合処理部3およびレイアウト編集処理部4を備えてい
る。
【0060】ここで、解析前処理部1は、レイアウト解
析処理に先立って、レイアウトの変動要因を少なくして
解析精度を高めるものである。この解析前処理部1は、
認識対象イメージデータ19の形式変換後に、解析処理
用の低密度イメージの作成を行うとともに、解析処理時
に精度低下の要因となるイメージデータ上のゴミ等の除
去を行う。
【0061】また、レイアウト解析処理部2は、解析用
辞書13を参照して、読み取ったイメージデータからレ
イアウトの特徴である罫線項目および項目データを抽出
して、レイアウトの構成を解析し、この抽出した罫線項
目および項目データによりレイアウトを論理的に表現す
る。
【0062】すなわち、レイアウト解析処理部2は、読
み取ったイメージデータから、帳票固有の特徴を抽出
し、この特徴により認識すべき情報の存在する位置を特
定する手段として機能する。
【0063】具体的には、レイアウト解析処理部2は、
認識対象イメージのレイアウトを解析して、レイアウト
を構成している各種の構成要素(罫線項目および項目デ
ータ)をレイアウト特徴として抽出する。さらに、この
レイアウト解析処理部2は、後段のレイアウト照合処理
部3でのレイアウト照合処理時に登録済レイアウト情報
を検索するために、この抽出されたレイアウト特徴から
レイアウトの大まかな制約条件であるレイアウトのキー
情報を作成する。
【0064】このレイアウト解析処理部2は、イメージ
のレイアウトの特徴を抽出し、その抽出されたレイアウ
トの特徴に基づいてレイアウトの構成を解析する。ま
た、レイアウトの特徴抽出では、罫線の抽出や罫線項目
の抽出等が実施されるとともに、レイアウト解析すなわ
ち表構造解析が実施される。
【0065】ここで、レイアウトが罫線により構成され
る表構造を有している場合には、罫線抽出処理でレイア
ウトの罫線から形成される最小矩形である罫線項目が抽
出され、抽出された罫線項目に基づいて、表構造解析処
理で罫線項目により構成される表構造が解析されるよう
になっている。
【0066】また、レイアウトが罫線を持たない無罫線
表構造を有している場合には、罫線項目抽出処理でレイ
アウトの項目データが抽出され、抽出されたレイアウト
の項目データに基づいて、表構造解析処理で無罫線表構
造が解析されるようになっている。
【0067】さらに、レイアウト解析処理部2が罫線項
目や項目データを抽出してから、レイアウトの論理的な
原点(論理原点)を抽出するように構成されている。具
体的には、レイアウト解析処理部2においては、ラベリ
ング処理によるラベル画像の作成,レイアウト照合用の
帳票イメージの論理原点および斜度情報の抽出,罫線デ
ータの抽出と罫線項目により構成される表構造の解析,
項目データの抽出と無罫線表時の項目表構造の解析およ
び見出し領域の決定と見出し項目の認識,対応する項目
データの決定(見出し解析処理)、が行なわれる。
【0068】なお、ラベリング処理によるラベル画像の
作成処理は、入力されたイメージデータ(2値画像デー
タ)から連結成分(2値画像において1つに繋がった画
像の成分)を算出して、各連結成分母にラベルを付けた
ラベル画像を作成する処理のことである。なお、このラ
ベリング処理については、例えば「連結領域の抽出装置
および方法」(特開平08−55219号)が公知であ
る。
【0069】また、罫線項目の抽出処理は、罫線に囲ま
れた文字や図形等のデータから罫線部分を抽出して、罫
線部分とデータ部分とを分離する処理のことである。な
お、この罫線項目の抽出処理については、例えば「画像
抽出方式」(特開平06−309498号)が公知であ
る。
【0070】さらに、見出し解析処理は、イメージ中の
見出し領域(見出し項目)を決定して、この見出し領域
中の見出し項目情報を認識して、対応する項目データを
決定するものである。
【0071】すなわち、この実施の形態においては、レ
イアウト解析処理部2において見出し項目および見出し
項目と対応する項目データを判別することにより、文字
認識処理ブロック17において見出し項目の文字認識処
理を行なうことなく直ちに項目データの文字認識を行な
えるようにしている。
【0072】ところで、レイアウト照合処理部3は、レ
イアウト解析処理部2で抽出されたレイアウトの特徴
(罫線項目および項目データ)を制約検索条件として、
レイアウトデータベース(レイアウトDB)14から候
補レイアウトを検索する。さらに、このレイアウト照合
処理部3は、一致している候補レイアウトがあるかどう
かを照合して、レイアウト解析処理部2で特定された位
置でのイメージを認識し、特定された位置における情報
を判別する。
【0073】ここで、レイアウトDB14は、候補レイ
アウト情報を記憶している候補レイアウト記憶部であ
り、この実施の形態においては、候補レイアウト情報と
して圧縮された候補レイアウト情報を記憶している。な
お、このときのレイアウト情報の圧縮処理については、
後述にて詳細に説明する。
【0074】また、レイアウトDB14には、レイアウ
ト解析処理部2でのレイアウト解析結果を補正するため
のレイアウト補正情報が格納されている。この実施の形
態においては、後述するレイアウト編集処理部4におい
て、このレイアウト補正情報を用いてレイアウト解析結
果を補正することにより、その後の処理を高い精度で行
なえるようになっている。
【0075】さらに、レイアウトDB14の内容は、後
述するように、候補レイアウト情報を、レイアウト認識
処理ブロック16やオペレータ確認/修正処理ブロック
18での処理結果に基づいて学習,更新されるようにな
っており、これにより、オペレータ等による候補レイア
ウト情報のレイアウトDB14への登録操作を不要とし
て操作の簡素化を図っている。
【0076】また、レイアウト照合処理部3は、レイア
ウト解析処理部2で抽出された論理原点を基準にして、
一致している候補レイアウトがあるかどうかを照合する
ようにしている。
【0077】すなわち、レイアウト照合処理部3は、レ
イアウト解析処理部2で作成されたレイアウトキー情報
を使用して、レイアウトDB14に格納されているレイ
アウト情報を検索照合し、一致するレイアウト情報を取
得するものである。
【0078】また、上述のレイアウト照合処理部3は、
レイアウトの検索照合を行なう際には、まず大まかな制
約条件であるレイアウトキー情報を制約条件としてレイ
アウトDB14を検索し、検索の結果得られた複数の候
補レイアウトに対して、更に詳細な照合を行うことによ
り一致するレイアウトを決定する。
【0079】具体的には、レイアウト照合処理部3にお
いては、候補レイアウトに対する詳細な照合処理の際
に、制約条件の大まかなものから順に、罫線項目ビット
マトリクスの照合,罫線項目位置と罫線項目属性の詳細
な照合,項目データ位置の照合,見出し位置と見出し内
容の照合および領域イメージ(ユニークイメージ)の特
徴データ照合、が行われる。
【0080】ここで、罫線項目ビットマトリクスの照合
処理とは、レイアウト解析処理部2で抽出されたレイア
ウトの特徴を圧縮処理し、この圧縮したレイアウトの特
徴を制約検索条件として、レイアウトDB14から圧縮
した候補レイアウトを検索することにより、一致してい
る候補レイアウトがあるかどうかを照合するものであ
る。
【0081】すなわち、この実施の形態においては、レ
イアウトDB14が圧縮した候補レイアウト情報を記憶
して、レイアウト照合処理部3において圧縮処理したレ
イアウト情報を作成して圧縮したレイアウト情報どうし
を照合することにより、レイアウト照合処理の高速化を
図っているのである。
【0082】さらに、レイアウト編集処理部4は、レイ
アウト照合処理部3でレイアウトDB14を検索照合し
た結果、レイアウトDB14に一致するレイアウトが存
在する場合には、前述のごとく、レイアウトDB14か
ら取得したレイアウト補正情報に基づいてレイアウト解
析結果を補正した後に、補正されたレイアウト情報をレ
イアウト認識結果20として出力する。
【0083】なお、レイアウト補正情報を用いた補正内
容は、見出し位置と見出し内容の補正と、見出しにリン
クする項目データ位置および項目データ属性の補正であ
る。
【0084】また、レイアウト編集処理部4は、レイア
ウト照合処理部3でレイアウトDB14を検索照合した
結果、レイアウトDB14に一致するレイアウトが存在
しない場合には、新規レイアウトとして、レイアウト解
析結果をそのままレイアウト情報(レイアウト認識結果
20)として出力する。
【0085】ところで、文字認識処理ブロック17は、
レイアウト認識処理ブロック16からのレイアウト認識
結果20の文字認識処理を行なうブロックであり、文字
認識用定義体作成部5,文字認識処理部6および知識処
理部7を備えている。
【0086】ここで、文字認識用定義体作成部5は、レ
イアウト認識結果20として出力されるレイアウト情報
をもとに、文字認識処理部6で使用する文字認識対象の
項目データ位置と項目データ属性を定義した文字認識用
定義体(一時定義体)21を作成するものである。
【0087】レイアウト認識結果20の項目データ情報
は、解析対象イメージの左上端からの絶対座標で出力す
るが、イメージ読み取り時の用紙位置の変動により、解
析対象イメージの左上端が常に一定の位置になるとは限
らない。このため、文字認識用定義体処理部5では、解
析対象イメージに合わせてその都度、文字認識用定義体
21を動的に作成する。
【0088】また、文字認識処理部6は、文字認識定義
体作成処理部5で、レイアウト情報より作成された文字
認識用定義体21を使用して、文字認識対象の項目デー
タについて文字認識処理を行ない、認識結果のコードデ
ータを取得する。
【0089】さらに、知識処理部7は、文字認識処理部
6の認識結果コードデータを、認識結果の補正情報を記
録した知識データベース(知識DB)15を参照して補
正し、文字認識結果22として出力する。
【0090】そして、オペレータ確認/修正処理ブロッ
ク18は、レイアウト認識結果20および文字認識結果
22が、端末装置(例えば図1におけるクライアント1
0)に表示されて、オペレータによりイメージデータの
処理結果の確認および修正処理が行なわれるブロックで
ある。このオペレータ確認/修正処理ブロック18は、
レイアウト画面表示処理部8および文字認識結果画面表
示処理部9を備えている。
【0091】ここで、レイアウト画面表示処理部8は、
オペレータによるレイアウト認識結果20および文字認
識結果22の修正および確認のため、レイアウト認識結
果20のレイアウト情報をもとに、認識対象イメージと
見出し位置や見出し内容および対応する項目位置等の解
析結果をクライアント10のディスプレイに表示する。
【0092】この実施の形態においては、従来の修正お
よび確認処理を拡張して、認識結果のコードデータと、
対応する帳票イメージ上の見出し内容や項目データとを
リンクしてクライアント10のディスプレイに表示する
ことにより、レイアウト情報の修正および確認処理を行
えるようになっている。
【0093】また、文字認識結果画面表示処理部9は、
レイアウト画面表示処理部8の表示に合わせて、文字認
識対象イメージの認識項目に対応する文字認識結果のコ
ードデータを画面表示する。
【0094】さらに、クライアント10においては、デ
ィスプレイ表示された認識対象イメージと対応するレイ
アウト認識結果20や文字認識結果22がオペレータに
より確認され、必要に応じてレイアウト認識結果20お
よび文字認識結果22の修正が行なわれる。
【0095】なお、図1に示す帳票処理装置30は、上
述したレイアウト認識処理ブロック16,文字認識処理
ブロック17およびオペレータ確認/修正処理ブロック
18のほかに、レイアウトログ情報作成処理部11およ
び知識ログ情報作成処理部12も備えている。
【0096】ここで、レイアウトログ情報作成処理部1
1は、レイアウト認識結果20のレイアウト情報に、オ
ペレータによる修正内容を補正データとして付加してレ
イアウトDB学習情報25を作成することにより、レイ
アウトDB14に格納されるレイアウト補正情報を作成
する。なお、作成されたレイアウト補正情報は、補正内
容が判断された上、レイアウトDB14に学習登録され
る。
【0097】また、レイアウトログ情報作成処理部11
は、レイアウト認識結果20のレイアウト情報に、オペ
レータによる修正内容を補正データとして付加して解析
用辞書学習情報24を作成する。その作成された解析用
辞書学習情報24は、補正内容が判断された上、解析用
辞書13に学習登録される。
【0098】さらに、知識ログ情報作成処理部12は、
文字認識結果22のコードデータに、オペレータによる
修正内容を補正データとして付加して知識DB15用の
知識学習情報23を作成する。その作成された学習デー
タは、知識DB15に学習登録される。
【0099】上述の構成により、この発明の一実施の形
態にかかる帳票処理装置30においては、任意のフォー
マットを有する帳票のイメージデータ19が読み取られ
ると、このイメージデータ19のレイアウトが解析され
ることにより処理対象の帳票のフォーマットが認識さ
れ、この帳票のフォーマットの認識結果に基づいて帳票
の文字認識が行なわれる。そして、レイアウト認識結果
20および文字認識結果22は、オペレータにより確認
され、必要に応じて修正される。
【0100】つぎに、帳票処理装置30に適用される文
字認識装置について具体的に説明する。図2はこの発明
の一実施の形態による帳票処理装置に適用される文字認
識装置の構成を機能的に示す機能ブロック図である。こ
の文字認識装置は、文字認識処理ブロック17の一機能
を実現する装置であって、通常の文字認識機能の他に、
帳票にあらかじめ印刷された所定の選択項目に関して、
どの選択項目がどのように選択されたのかを分別するた
めの分別文字認識機能を有している。すなわち、選択項
目については、マーキングが施されることを前提とす
る。以下の説明では、その分別文字認識機能だけを取り
出して説明する。
【0101】図2に示した文字認識装置は、装置全体の
制御を行う処理システム100およびこの処理システム
100の制御に従って帳票に印刷されている選択項目や
その選択項目への書き込みを認識する機能を果たすため
の文字認識プログラム200を備えている。また、この
文字認識装置は、文字認識プログラム200に加え、上
述した文字認識を支援するデバイスとして、データをキ
ー入力するためのキーボード300、帳票などのイメー
ジを読み取るためのイメージスキャナ400、各種デー
タの書き込みおよび読み出しを行うためのハードディス
ク500および各種データを可視表示するためのディス
プレイ600より構成される。さらに、この文字認識装
置は、上記文字認識プログラム200の処理を支援する
ため、文字認識のための辞書機能をもつ特徴辞書700
を備えている。
【0102】処理システム100は、レイアウト認識プ
ログラム200を使用するアプリケーションプログラム
101、このアプリケーションプログラム101を動作
させるオペレーティングシステム(OS)102、この
OS102の制御に従ってI/Oデバイス群104を制
御するデバイスドライバ103、および、このデバイス
ドライバ103の制御で各種デバイス(キーボード30
0,イメージスキャナ400,ハードディスク500お
よびディスプレイ600)の入出力を制御するI/Oド
ライバ群104より構成される。この処理システム10
0は、図示せぬが、各種のプログラム実行中のワークエ
リアとして使用するRAMを備えている。
【0103】文字認識プログラム200は、文字認識エ
ンジン制御部201、特徴抽出処理部202、特徴照合
処理部203、マーク判定処理部204、および、分別
文字認識処理部205より構成され、前述の分別文字認
識機能を実現するものである。文字認識エンジン制御部
201は、文字認識全体の処理を制御する機能を果たす
部分である。
【0104】特徴抽出処理部202は、文字認識エンジ
ン制御部201からレイアウト認識後の帳票のイメージ
データを受け取り、通常の文字認識として特徴辞書70
0を参照して文字認識処理を施す機能を果たす部分であ
る。ここで、通常の文字認識処理とは、イメージデータ
から文字の形状を解析して文字を特定する処理を指す。
この文字認識処理の具体的な手法としては、パターンマ
ッチング,ベクトル解析などがある。この実施の形態1
では、特徴辞書700がベクトル解析対応の辞書機能を
有しており、その機能に対応させて特徴抽出処理部20
2により特徴抽出が行われる。特徴抽出処理部202
は、抽出結果すなわちベクトル情報に関する特徴データ
を文字認識エンジン制御部201へ通知する。
【0105】特徴照合処理部203は、特徴抽出処理部
202で抽出された特徴データを特徴辞書700内の預
金種目DB701に照合して、特徴データにマッチする
預金種目を判別する機能を果たす部分である。すなわ
ち、特徴辞書700は特徴データに対応させて文字を登
録した構成となる。この実施の形態1では、銀行の振り
込み依頼書を例に挙げることから、振り込みの際の預金
種目の選択が必要となる。その預金種目として、普通預
金、当座預金、貯蓄預金およびその他の預金の4種類が
ある。特徴照合処理部203は、以上の4種類の預金種
目のいずれに該当するのかを特徴データの照合により抽
出し、その照合結果を文字認識エンジン制御部201へ
通知する。
【0106】マーク判定処理部204は、文字認識エン
ジン制御部201から特徴照合処理部203の照合結果
を受け取り、その照合結果に基づくとともにあらかじめ
用意されたマーク判定ルールに従ってどの預金種目に対
してマーキングが施されたのかを判定する機能を果たす
部分である。上記マーク判定処理部204は、マーク判
定により得られた結果を文字認識エンジン制御部201
へ通知する。
【0107】分別文字認識処理部205は、上記特徴抽
出処理部202の通常の文字認識結果と上記マーク判定
処理部204の文字認識結果とに基づいてどの預金種目
が選択されたのかを預金種目毎に分別して文字認識処理
を行う機能を果たす部分である。この分別文字認識処理
205で得られた分別文字認識結果は、文字認識エン
ジン制御部201に通知される。
【0108】なお、文字認識エンジン制御部201は、
分別文字認識処理部205から得た分別文字認識結果を
処理結果としてアプリケーションプログラム101に送
出して、分別文字認識機能にかかる処理を終了する。
【0109】次に、預金種目DB701について説明す
る。図3は預金種目DB701の内容の一例を示した図
である。預金種目のグループとしては、“フ”,
“ト”,“チ”および“ソ”よりなる第1グループ、
“普”,“当”,“貯”および“他”よりなる第2グル
ープ、そして、“1”,“2”,“4”および“9”よ
りなる第3グループがある。ここでは、いずれのグルー
プを使用する帳票が読み取られても、使用者がどのよう
に預金種目を選択するのか、その記入の仕方をあらかじ
め分類しておくことにする。
【0110】一つ目は、選択種目の1文字を円で囲む○
付け記入の仕方、二つ目は、選択種目の1文字に対して
レ点を書き込む記入の仕方、そして、三つ目は、選択種
目の1文字に対して横書きで消し線(二重線)を書き込
む記入の仕方である。なお、選択種目の文字に何も記入
されていない場合の分類は、無印として区別する。以上
の分類に従って、預金種目DB701には、第1〜第3
グループについて、それぞれ4分類した選択種目の文字
に特徴データが対応付けて記憶される。
【0111】次に、上述した文字認識装置で使用する帳
票のフォーマットの種類について図4〜図6を参照して
説明する。図4,図5,図6はそれぞれ帳票のフォーマ
ットの種類を示す図である。
【0112】図4において、801は帳票の一種である
振り込み依頼書を示している。この振り込み依頼書80
1には、依頼人記入欄,振込先記入欄,預金種目記入欄
などが罫線により設けられている。801aは上記各欄
のうちで預金種目記入欄を示している。この預金種目記
入欄801aは、一例として4つに区分され、各区分領
域には、それぞれ普通預金を表す「1.普通」,当座預
金を表す「2.当座」,貯蓄預金を表す「4.貯蓄」,
その他の預金を表す「9.他」が点線の円で囲まれた形
であらかじめ印刷されている。すなわち、「1.普
通」,「2.当座」,「4.貯蓄」および「9.他」は
プレ印刷による固定リテラルとなる。
【0113】利用者が例えば普通預金から振り込みを行
う場合には、預金種目記入欄801aの先頭欄に印刷さ
れている円をなぞればよく、それによりその円内に印刷
されている「1.普通」が選択されたことになる。同様
に、当座預金、貯蓄預金、その他の預金で振り込みを行
う場合には、それぞれの内容を表す「2.当座」,
「4.貯蓄」,「9.他」を囲む円をなぞることで所要
の振り込みを行うことができる。
【0114】図5において、802は前述の振り込み依
頼書801とは異なるフォーマットをもつ振り込み依頼
書を示している。この振り込み依頼書802には、振込
先記入欄,預金種目記入欄,受取人記入欄および依頼人
記入欄などが罫線により設けられている。802aは上
記各欄のうちで預金種目記入欄を示している。この預金
種目記入欄802aは、一例として4つに区分され、各
区分領域はそれぞれ“普通預金”,“当座預金”,“貯
蓄預金”,“その他の預金”に対応しており、各区分領
域内に点線の円があらかじめ印刷されている。この振り
込み依頼書802は、前述の図4の振り込み依頼書80
1とは異なり、固定リテラルがないフォーマットを有す
る。
【0115】利用者が例えば普通預金から振り込みを行
う場合には、預金種目記入欄802aの先頭欄に印刷さ
れている円をなぞればよく、それによりその記入区分領
域に該当する“普通”が選択されたことになる。同様
に、当座預金、貯蓄預金、その他の預金で振り込みを行
う場合には、それぞれに該当する区分領域内の円をなぞ
ることで所要の振り込みを行うことができる。
【0116】図6において、803は前述の振り込み依
頼書801や802とは異なるフォーマットをもつ振り
込み依頼書を示している。この振り込み依頼書803に
は、振込先記入欄,預金種目記入欄,受取人記入欄およ
び依頼人記入欄などが罫線により設けられている。80
3aは上記各欄のうちで預金種目記入欄を示している。
この預金種目記入欄803aは、一例として4つに区分
され、各区分領域には、それぞれ普通預金を表す
「フ」,当座預金を表す「ト」,貯蓄預金を表す
「チ」,その他の預金を表す「ソ」が点線の円で囲まれ
た形であらかじめ印刷されている。すなわち、「フ」,
「ト」,「チ」および「ソ」はプレ印刷による固定リテ
ラルとなる。
【0117】利用者が例えば普通預金から振り込みを行
う場合には、預金種目記入欄803aの先頭欄に印刷さ
れている円をなぞればよく、それによりその円内に印刷
されている「フ」が選択されたことになる。同様に、当
座預金、貯蓄預金、その他の預金で振り込みを行う場合
には、それぞれの内容を表す「ト」,「チ」,「ソ」を
囲む円をなぞることで所要の振り込みを行うことができ
る。
【0118】なお、各振り込み依頼書801,802お
よび803について、使用者によっては、円をなぞらず
にレ点を書き込む場合もある。その場合には、円をなぞ
った場合と同様にその預金種目を選択したものとして判
断される。これに対して、預金種目の文字に消し線(二
重線)が書き込まれた場合には、その預金種目の選択対
象から除外するものとして判断される。
【0119】次に、動作について説明する。図7はこの
一実施の形態による全体動作を説明するフローチャー
ト、図8は読み取り処理を説明するフローチャート、図
9および図10はレイアウト認識処理を説明するフロー
チャート、図11は分別文字認識処理を説明するフロー
チャート、図12は分別文字認識処理におけるマーク判
定処理を説明する図、そして、図13はこの発明の一実
施の形態による分別文字認識処理手順を説明する図であ
る。
【0120】まず、全体動作について図7を参照して説
明する。この図7に示した全体動作には、帳票処理装置
30としての動作が含まれる。すなわち、帳票処理とし
ての一連の流れを説明する上で、前述した分別文字認識
処理の前提となる動作説明を含める。そこで、ステップ
S1において、まず帳票イメージを読み取るための読み
取り処理が実施され、続くステップS2において帳票の
イメージデータに基づくレイアウト認識処理が実施され
る。そして、ステップS2のレイアウト認識結果に基づ
いて前述した分別文字認識処理が実施される。
【0121】次に、個々の動作の内で読み取り処理につ
いて図8を参照して説明する。読み取り処理では、ま
ず、イメージ認識処理したい帳票のイメージデータの読
み取りが行われる(ステップS101)。なお、帳票の
用紙は、どの方向から読み取られてもよい。例えば、罫
線項目のある帳票が読み取られた場合には、その読み取
られたイメージデータが、図示せぬイメージデータ格納
メモリに一旦格納され(ステップS102)、用紙の読
み取り方向を補正するための図示せぬ回転イメージデー
タ格納メモリにも最初のみ格納される(ステップS10
3)。このようにして、読み取り処理が終了する。
【0122】続いて、レイアウト認識処理について図9
および図10を参照して説明する。レイアウト認識処理
では、まず、上記イメージデータ格納メモリに格納され
たイメージデータに基づいて罫線項目が抽出される(図
9、ステップS201)。ここで、罫線項目が抽出でき
たか、否か判定され(ステップS202)、抽出できた
場合には、図示せぬ罫線項目格納メモリにその抽出罫線
項目が格納される(ステップS203)。一方、抽出で
きなかった場合には、処理はステップS212(図10
参照)へ移行する。
【0123】罫線項目が抽出できた場合には、ステップ
S204において、抽出罫線項目に基づいて罫線項目の
形状が解析され、続くステップS205において、罫線
項目毎に縦長か、それとも横長かの判定に従って分類が
行われる。以上のステップS204およびステップS2
05の処理は、すべての罫線項目について分類が終了す
るまで繰り返し実施される。
【0124】その結果、横長の罫線項目の情報について
は、図示せぬ横長罫線項目メモリに一旦格納され(ステ
ップS206)、横長罫線項目が縦長罫線項目よりも多
い場合には(ステップS207)、文字認識を施して
(ステップS208)、文字認識が可能であれば(ステ
ップS209)、レイアウト認識処理が終了する。一
方、ステップS207の判定で横長罫線項目の方が少な
い場合には、帳票用紙の読み取り方向が誤っているもの
として、ステップS210においてイメージデータ格納
メモリに格納されているイメージデータが90度回転補
正され、その回転補正後のイメージデータが前述の回転
イメージデータ格納メモリに格納される。その後、処理
はステップS201に戻り、以降同様の処理が再度開始
される。
【0125】また、ステップS209の判定で文字認識
が不能であれば、読み取りイメージが180度回転して
いる可能性があるため、前述の回転イメージデータ格納
メモリに格納されているイメージデータが一旦前記イメ
ージデータ格納メモリに移動され、そのイメージデータ
格納メモリに移動されたイメージデータが180度回転
補正される。その回転補正後のイメージデータは回転イ
メージデータ格納メモリに格納される(ステップS21
1)。その後、処理はステップS201に戻り、以降同
様の処理が再度開始される。
【0126】また、ステップS202において罫線項目
を抽出できなかった場合には、処理はステップS212
へ移行して、まず前記回転イメージデータ格納メモリに
格納されたイメージデータからラベリング情報を抽出
し、続くステップS213においてラベリング情報を図
示せぬラベリング情報メモリに格納する。そして、所定
の文字領域統合ルールに従ってラベリング情報格納メモ
リに格納されたラベリング情報における個々のラベリン
グが文字列として統合され、項目データ例えば“振り込
み依頼書”などの文字列が統合結果として抽出され(ス
テップS214)、図示せぬ統合結果メモりに格納され
る(ステップS215)。
【0127】続いて、統合結果の文字列が縦長の文字列
数よりも横長の文字列数の方が多い場合には(ステップ
S216)、文字認識を施して(ステップS217)、
文字認識が可能であれば(ステップS218)、レイア
ウト認識処理が終了する。一方、ステップS216の判
定で横長の文字列数の方が少ない場合には、帳票用紙の
読み取り方向が誤っているものとして、ステップS21
9においてイメージデータ格納メモリに格納されている
イメージデータが90度回転補正され、その回転補正後
のイメージデータが前述の回転イメージデータ格納メモ
リに格納される。その後、処理はステップS212に戻
り、以降同様の処理が再度開始される。
【0128】また、ステップS218の判定で文字認識
が不能であれば、読み取りイメージが180度回転して
いる可能性があるため、前述の回転イメージデータ格納
メモリに格納されているイメージデータが一旦前記イメ
ージデータ格納メモリに移動され、そのイメージデータ
格納メモリに移動されたイメージデータが180度回転
補正される。その回転補正後のイメージデータは回転イ
メージデータ格納メモリに格納される(ステップS22
0)。その後、処理はステップS212に戻り、以降同
様の処理が再度開始される。
【0129】続いて、分別文字認識処理について図1
1,図12および図13を参照して説明する。この分別
文字認識処理は、前述したレイアウト認識処理により得
られた罫線項目内の文字認識をする処理であり、ここで
は、罫線項目である預金種目欄内の文字認識を例に挙げ
て説明する。説明上、図6に示した振り込み依頼書80
3を例に挙げて説明する。この振り込み依頼書803に
は預金種目欄803aが設けられており、その預金種目
欄803aにプレ印刷されているフ,ト,チ,ソのいず
れの預金種目が選択されたのかを分別文字認識により判
別することになる。
【0130】そこで、以下に説明する分別文字認識処理
では、すでに前述のレイアウト認識処理により預金種目
欄803aが抽出され、その預金種目欄803aに対し
て分別文字認識が行われるものとして説明する。まず、
前述の罫線項目メモリに格納された預金種目欄803a
のイメージデータが読み出され、そのイメージデータに
基づいて通常の文字認識が行われる(ステップS30
1)。この通常の文字認識では、イメージデータに基づ
いてイメージの特徴から特徴データが抽出され、この抽
出特徴データと特徴辞書700に登録されている特徴デ
ータとの照合から仮の文字が認識される。そして、この
文字認識結果である特徴データは処理システム100の
メモリに一時格納される(ステップS302)。
【0131】今度は、その特徴データを特徴辞書700
内の預金種目DB701に照合され(ステップS30
3)、その照合結果から、その預金種目DB701に登
録されている第1〜第3グループのいずれの文字に該当
するのか推定される(ステップS304)。なお、この
推定は、預金種目欄にプレ印刷されている固定リテラル
全てについて実施される。
【0132】例えば、図13(a)のように預金種目欄
803aの先頭の文字フに対して○でマーキングが行わ
れた場合には、図13(b)のイメージのように先頭の
○付きフの文字のイメージデータは認識が困難となる。
このため、ステップS303の照合処理により図12に
示した如く1位から例えば10位までの候補文字が抽出
される。この候補群は、特徴データの照合により類似度
が一番高ものから順位付けされたものである。図12に
おいては、○付きチの文字が1位の候補として挙げら
れ、フ単独の文字が10位の候補として挙げられてい
る。この1位から10位までの候補の傾向と見ると、1
位から9位まではすべて○付き文字が候補として挙げら
れている。すなわち、○付きフ文字に関する文字認識の
傾向から、○付きの文字が高い認識率で判定されている
ことがわかる。○付きフ文字は、候補として4位にラン
クされている。
【0133】したがって、ステップS304では、候補
に挙がった文字の傾向から、すなわちマーク判定ルール
に従ってマークの傾向から、文字そのものよりもどのよ
うなマークが付されているのか、その推定が行われる。
したがって、図12の例では、認識対象の文字は○付き
の文字であることが推定の結果得られる。
【0134】このように、ステップS304において○
付き文字が推定された場合には、処理はステップS30
6へ移行する。このステップS306において、○付き
文字の場合には、○付きの場合の分別文字認識の規則性
に従って、○が選択の意志を示すことから、その○を付
した文字が依頼者の希望する文字であると判断する。こ
の○付き文字が推定された場合には、○と分けて文字を
認識することが困難なことから、同預金種目欄803a
にプレ印刷されている固定リテラルを文字認識すること
により容易に判断することができる。すなわち、第1〜
第3グループをそれぞれ構成する固定リテラルは既知と
なっているため、○付けされた固定リテラル以外の他の
固定リテラルを文字認識すれば、どのグループに属する
のか一義的に求めることができる。これにより、グルー
プが判明すれば、○付けされた固定リテラルすなわち選
択された預金種目を表す文字を抽出することができる。
【0135】このように、○付けられた文字すなわち選
択された預金種目が抽出されると、続くステップS30
9において、その抽出された預金種目とステップS30
1による文字認識結果とが分別文字認識結果として出力
される。これにより、ディスプレイ600には、図13
(c)のように、預金種目として“フ”が表示出力され
る。
【0136】また、図13(a)の例とは異なるケース
で、ステップS304のマーク判定で預金種目欄内の固
定リテラルすべてについて無印が確認された場合には、
続くステップS305においてマーク選択無しとして処
理され、さらに続くステップS309において、ステッ
プS301の文字認識で得られた仮の文字認識結果がす
べて正規の文字認識結果として出力される。このような
場合には、預金種目の選択がないことから、そのような
メッセージを通知する画面をディスプレイ上に形成して
依頼者へ知らせるようにすればよい。
【0137】また、図13(a)の例とは異なるケース
で、ステップS304のマーク判定でレ点が確認された
場合には、処理はステップS307へ移行する。ステッ
プS304においては、レ点も○付けと同様にその預金
種目を選択する意思の表れと判断されるので、マーク判
定ルールに従って照合結果から候補の傾向を推定するこ
とにより、レ点が推定される。したがって、ステップS
307においても、前述したステップS306の○付け
の場合と同様に処理が実行される。
【0138】すなわち、第1〜第3グループをそれぞれ
構成する固定リテラルは既知となっているため、レ点が
付された固定リテラル以外の他の固定リテラルを文字認
識すれば、どのグループに属するのか一義的に求めるこ
とができる。これにより、グループが判明すれば、レ点
が付された固定リテラルすなわち選択された預金種目を
表す文字を抽出することができる。
【0139】また、図13(a)の例とは異なるケース
で、ステップS304のマーク判定で消し線(二重線)
が確認された場合には、処理はステップS308へ移行
する。ステップS304において、消し線の場合には、
レ点および○付けとは逆に選択肢から排除する預金種目
を意志表示するものと判断されるので、マーク判定ルー
ルに従って照合結果から候補の傾向を推定することによ
り、消し線が推定される。したがって、ステップS30
8においては、前述したステップS306およびステッ
プS307の場合とは異なり、消し線以外の文字が認識
結果として抽出される。
【0140】すなわち、第1〜第3グループをそれぞれ
構成する固定リテラルは既知となっているため、消し線
が付された固定リテラル以外の固定リテラルを文字認識
すれば、どのグループに属するのか一義的に求めること
ができ、かつ、選択した預金種目がわかる。
【0141】なお、上記の例では、図6に示した振り込
み依頼書803を例に挙げたが、その他の振り込み依頼
書801,802にも上記処理は適用可能である。例え
ば、振り込み依頼書801の場合には、前述の振り込み
依頼書803と同様に、預金種目欄801aに関して、
マークされた預金種目以外の文字認識から選択された預
金種目を判定することができる。また、振り込み依頼書
802の場合には、預金種目欄802a内には固定リテ
ラルが配置されておらず、欄外に固定リテラルが配置さ
れている。このような場合には、あらかじめ文字認識の
規則を決めておき、マークされた文字以外の文字が認識
できなかった場合、欄外で、各預金種目の領域の上方も
しくは下方の文字を文字認識することで対処することが
できる。
【0142】また、複数の預金種目にマークが付された
場合にも、同様の処理が施される。すなわち、マークさ
れた預金種目以外の文字認識結果からグループを判定し
て、マークされた預金種目を判断する処理が行われる。
したがって、マークが複数の預金種目に対して行われて
も、少なくとも1つの無印の預金種目の文字があれば、
選択された預金種目を判別することが可能となる。その
一例として、図13(d)のように、文字“フ”の他に
文字“ソ”についても○付きのマークが付された場合に
は、図13(e)のイメージのように、フとソの位置に
ついて文字認識が困難となる。このような場合でも、他
の文字を認識することで、図13(f)のように、ディ
スプレイ600に、預金種目として“フ”と“ソ”を表
示させることができる。
【0143】以上説明したいように、この実施の形態に
よれば、ドロップアウトによりマークだけを残すような
文字認識機構が不要となり、また、そのような機構に対
応させて特別な帳票を用意する必要がなく、一般の用紙
を用いて文字認識することができる。これにより、イメ
ージ読み取り機構および帳票用紙の低コスト化を図ると
ともに、帳票の仕様変更に関係なく文字認識することが
可能である。
【0144】また、預金種目DB701にマーク無しの
預金種目についてもあらかじめ登録するようにしたの
で、マークのない預金種目についての文字認識を確実に
行うことが可能である。
【0145】また、預金項目についてすべてマーク無し
の推定結果が得られた場合に選択預金種目無しとして判
定するようにしたので、マーク忘れの用紙を確実に判別
することが可能である。
【0146】また、消し線のマークが推定された場合、
そのマークをもつ預金種目以外の預金種目を選択預金種
目として判定するようにしたので、入力されたイメージ
データの文字認識結果からそのまま選択預金種目を得る
ことが可能である。
【0147】また、複数の候補のうちで同種のマークの
数が一番多い種類のマークを最終候補として推定するよ
うにしたので、複数の候補からマークの傾向を容易かつ
高い確率で把握することができ、これにより、選択項目
の認識率を向上させることが可能である。
【0148】さて、前述した実施の形態では、金融機関
分野において、帳票として振り込み依頼書を例に挙げた
が、この発明は、これに限定されず、選択肢を表す固定
リテラルをプレ印刷した用紙における文字認識であれ
ば、他の分野にも適用することができる。例えば、アン
ケートの回答など、各種の用途に適用することが可能で
ある。
【0149】また、前述した実施の形態では、マークの
種類として、○付け、消し線、レ点を例に挙げたが、こ
の発明は、これに限定されず、×印など、その他のマー
クを適用してもよく、その際には、預金種目DB701
のようにあらかじめデータベース化して登録しておけば
よい。
【0150】さて、前述した実施の形態では、預金種目
欄に並ぶ預金種目を一括して通常の文字認識してその結
果からマーク判定を行うことで選択された預金種目を判
別するようしたが、預金種目の並ぶ規則性に着目すれ
ば、何番目の位置の預金種目がマークされたか、そのマ
ーク位置に応じて特徴照合処理部203の照合結果を得
るようにしてもよい。これについて以下に説明する。図
14には上記実施の形態の一変形例による預金種目の内
容の一部(第1グループ)が示されている。なお、第
2,第3グループについても同様であり、図14では省
略されている。
【0151】前述した預金種目DB701には、預金種
目を表す文字、その特徴データ、その分類(無印,○付
け,レ点または消し線)が対応付けて記憶されていた
が、この変形例においては、図14に示したように、さ
らに左側から配置される順番が対応付けて記憶される。
すなわち、預金種目欄には、預金種目が左側より普通預
金、当座預金、貯蓄預金、その他の預金の順番で配置さ
れるため、例えば、“フトチソ”表記の場合には、
“フ”、“ト”、“チ”、“ソ”に対して位置情報が
1,2,3,4のように与えられる。したがって、例え
ば1番目の位置にある預金種目にマークの傾向が強けれ
ば、すなわち、候補としてマーク付きを挙げていれば、
確実に普通預金に対してマークが行われているものと推
定することができる。この位置による預金種目の推定と
ともにマークの種類(○付き、レ点、消し線)が推定で
きれば、高い認識率で、選択された預金種目を判別する
ことが可能となる。
【0152】以上、この発明を一実施の形態およびその
変形例により説明したが、この発明の主旨の範囲内で種
々の変形が可能であり、これらをこの発明の範囲から排
除するものではない。
【0153】
【発明の効果】以上説明したように、請求項1の発明に
よれば、データベースを参照して、イメージデータの文
字認識結果を特徴データに照合し、照合結果に基づいて
複数種のマークからマークの種類を1つ推定し、マーク
付き文字の種目の場合、文字認識結果のうちで無印文字
の種目に相当する文字認識結果に基づいて同一グループ
内のマーク付き文字の種目を選択肢として判定し、一
方、マーク付き文字の種目以外の種目の場合、文字認識
結果のうちで無印文字の種目の文字認識結果に基づいて
同一グループ内の無印文字の種目を選択肢として判定す
るようにしたので、ドロップアウトが不要となって用紙
としてOCR用紙のような専用用紙に限らず一般の用紙
でも選択項目に関して文字認識することができ、これに
より、イメージ読み取り機構および帳票用紙の低コスト
化を図るとともに、帳票の仕様変更に関係なく文字認識
することが可能な文字認識装置が得られるという効果を
奏する。
【0154】また、請求項2の発明によれば、請求項1
の発明において、複数の種目についてすべて無印文字の
推定結果が得られた場合に選択肢無しとして判定するよ
うにしたので、マーク忘れの用紙を確実に判別すること
が可能である。
【0155】また、請求項3の発明によれば、請求項1
または2の発明において、複数の候補のうちで同種のマ
ークの数が一番多い種類のマークを最終候補として推定
するようにしたので、複数の候補からマークの傾向を容
易かつ高い確率で把握することができ、これにより、選
択項目の認識率を向上させることが可能である。
【0156】また、請求項4の発明によれば、データベ
ースを参照して、イメージデータの文字認識結果を特徴
データに照合し、照合結果に基づいて複数種のマークか
らマークの種類を1つ推定し、マーク付き文字の種目の
場合、文字認識結果のうちで無印文字の種目に相当する
文字認識結果に基づいて同一グループ内のマーク付き文
字の種目を選択肢として判定し、一方、マーク付き文字
の種目以外の種目の場合、文字認識結果のうちで無印文
字の種目の文字認識結果に基づいて同一グループ内の無
印文字の種目を選択肢として判定する工程にしたので、
ドロップアウトが不要となって用紙としてOCR用紙の
ような専用用紙に限らず一般の用紙でも選択項目に関し
て文字認識することができ、これにより、イメージ読み
取り機構および帳票用紙の低コスト化を図るとともに、
帳票の仕様変更に関係なく文字認識することが可能であ
る。
【0157】また、請求項5の発明によれば、請求項4
の発明において、複数の種目についてすべて無印文字の
推定結果が得られた場合に選択肢無しとして判定する工
程にしたので、マーク忘れの用紙を確実に判別すること
が可能である。
【0158】また、請求項6の発明によれば、請求項4
または5の発明において、複数の候補のうちで同種のマ
ークの数が一番多い種類のマークを最終候補として推定
する工程にしたので、複数の候補からマークの傾向を容
易かつ高い確率で把握することができ、これにより、選
択項目の認識率を向上させることが可能である。
【0159】また、請求項7の発明によれば、データベ
ースを参照して、イメージデータの文字認識結果を特徴
データに照合し、照合結果に基づいて複数種のマークか
らマークの種類を1つ推定し、マーク付き文字の種目の
場合、文字認識結果のうちで無印文字の種目に相当する
文字認識結果に基づいて同一グループ内のマーク付き文
字の種目を選択肢として判定し、一方、マーク付き文字
の種目以外の種目の場合、文字認識結果のうちで無印文
字の種目の文字認識結果に基づいて同一グループ内の無
印文字の種目を選択肢として判定する手順にしたので、
ドロップアウトが不要となって用紙としてOCR用紙の
ような専用用紙に限らず一般の用紙でも選択項目に関し
て文字認識することができ、これにより、イメージ読み
取り機構および帳票用紙の低コスト化を図るとともに、
帳票の仕様変更に関係なく文字認識することが可能であ
る。
【0160】また、請求項8の発明によれば、請求項7
の発明において、複数の種目についてすべて無印文字の
推定結果が得られた場合に選択肢無しとして判定する手
順にしたので、マーク忘れの用紙を確実に判別すること
が可能である。
【0161】また、請求項9の発明によれば、請求項7
または8の発明において、複数の候補のうちで同種のマ
ークの数が一番多い種類のマークを最終候補として推定
する手順にしたので、複数の候補からマークの傾向を容
易かつ高い確率で把握することができ、これにより、選
択項目の認識率を向上させることが可能である。
【0162】
【0163】
【0164】
【0165】
【0166】
【0167】
【0168】
【図面の簡単な説明】
【図1】この発明の一実施の形態にかかる帳票処理装置
の全体構成を示す機能ブロック図である。
【図2】この発明の一実施の形態による帳票処理装置に
適用される文字認識装置の構成を機能的に示す機能ブロ
ック図である。
【図3】この一実施の形態による預金種目DBの内容の
一例を示す図である。
【図4】この一実施の形態において帳票のフォーマット
の一例を示す図である。
【図5】この一実施の形態において帳票のフォーマット
の他の例を示す図である。
【図6】この一実施の形態において帳票のフォーマット
のさらに他の例を示す図である。
【図7】この一実施の形態による全体動作を説明するフ
ローチャートである。
【図8】この一実施の形態において読み取り処理を説明
するフローチャートである。
【図9】この一実施の形態においてレイアウト認識処理
を説明するフローチャートである。
【図10】この一実施の形態においてレイアウト認識処
理を説明するフローチャートである。
【図11】この一実施の形態において分別文字認識処理
を説明するフローチャートである。
【図12】この一実施の形態において分別文字認識処理
におけるマーク判定処理を説明する図である。
【図13】この発明の一実施の形態による分別文字認識
処理手順を説明する図である。
【図14】この発明の一実施の形態の一変形例による預
金種目DBの内容の一例を示す図である。
【図15】一般的な帳票処理装置のシステム構成を示す
模式図である。
【図16】図15に示した帳票処理装置の動作の一例を
説明する図である。
【図17】図15に示した帳票処理装置の動作の変形例
を示す図である。
【符号の説明】
100 処理システム 101 アプリケーションプログラム 200 文字認識プログラム 201 文字認識エンジン制御部 202 特徴抽出処理部 203 特徴照合処理部 204 マーク判定処理部 205 分別文字認識処理部 300 キーボード 400 イメージスキャナ 500 ハードディスク 600 ディスプレイ 700 特徴辞書 701 預金種目DB 801,802,803 振り込み依頼書 801a,802a,803a 預金種目欄
───────────────────────────────────────────────────── フロントページの続き (72)発明者 永野 義博 神奈川県川崎市中原区上小田中4丁目1 番1号 富士通株式会社内 (72)発明者 千葉 亘一 神奈川県川崎市中原区上小田中4丁目1 番1号 富士通株式会社内 (72)発明者 小原 勝利 神奈川県川崎市中原区上小田中4丁目1 番1号 富士通株式会社内 (56)参考文献 特開 平6−266884(JP,A) 特開 平9−62789(JP,A) 特開 平9−163057(JP,A) 特開 平8−44825(JP,A) 特開 平11−238092(JP,A) 特開 平10−11531(JP,A) 特開 昭55−124877(JP,A) 特開 平4−205076(JP,A) 国際公開97/005561(WO,A1) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82 G06F 19/00

Claims (9)

    (57)【特許請求の範囲】
  1. 【請求項1】 選択肢として文字で表記された複数の
    が1グループとして印刷されてなる用紙を光学的に読
    み取って得られたイメージデータに基づいて文字認識を
    行う文字認識装置であって、 あらかじめ複数種のマークが用意され、前記複数の種目
    には、前記複数種のマークのいずれか1つが付与された
    マーク付き文字の種目からなるグループと前記複数種の
    マークのいずれも付与されていない無印文字の種目から
    なるグループとが存在し、前記各グループにマークの種
    類と各文字の文字認識結果を示す特徴データとを対応さ
    せてあらかじめ登録しておくデータベースと、 前記文字認識で得られた前記イメージデータの文字認識
    結果を前記データベースに登録されている特徴データ
    照合する照合手段と、 前記照合手段の照合結果に基づいて前記複数種のマーク
    からマークの種類1つ推定する推定手段と、前記推定手段により推定されたマークの種類に応じてマ
    ーク付き文字の種目を選択肢とするか、それともマーク
    付き文字の種目以外の種目を選択肢とするかを判定する
    第1判定手段と、 前記データベースを参照して、マーク付き文字の種目を
    選択肢とする判定が下された場合には、前記文字認識結
    果のうちで無印文字の種目に相当する文字認識結果に基
    づいて同一グループ内のマーク付き文字の種目を選択肢
    として判定し、一方、マーク付き文字の種目以外の種目
    を選択肢とする判定が下された場合には、前記文字認識
    結果のうちで無印文字の種目の文字認識結果に基づいて
    同一グループ内の無印文字の種目を選択肢として判定す
    る第2判定手段と、 を備えたことを特徴とする文字認識装置。
  2. 【請求項2】 前記第1判定手段は、前記推定手段によ
    り前記複数の種目についてすべて無印文字の推定結果が
    得られた場合、選択肢無しとして判定すること特徴とす
    る請求項1記載の文字認識装置。
  3. 【請求項3】 前記推定手段は、前記照合手段の照合結
    果から複数の候補を抽出し、前記複数の候補のうちで同
    種のマークの数が一番多い種類のマークを最終候補とし
    て推定することを特徴とする請求項1または2に記載の
    文字認識装置。
  4. 【請求項4】 選択肢として文字で表記された複数の種
    目が1グループとして印刷されてなる用紙を光学的に読
    み取って得られたイメージデータに基づいて文字認識を
    行う文字認識方法であって、 データベースには、あらかじめ複数種のマークが用意さ
    れ、前記複数の種目には、前記複数種のマークのいずれ
    か1つが付与されたマーク付き文字の種目からなるグル
    ープと前記複数種のマークのいずれも付与されていない
    無印文字の種目からなるグループとが存在し、前記各グ
    ループにマークの種類と各文字の文字認識結果を示す特
    徴データとを対応させてあらかじめ登録しておき、前記
    文字認識で得られた前記イメージデータの文字認識結果
    を前記データベースに登録されている特徴データに照合
    する照合工程と、 前記照合工程の照合結果に基づいて前記複数種のマーク
    からマークの種類を1つ推定する推定工程と、 前記推定工程により推定されたマークの種類に応じてマ
    ーク付き文字の種目を選択肢とするか、それともマーク
    付き文字の種目以外の種目を選択肢とするかを判定する
    第1判定工程と、 前記データベースを参照して、マーク付き文字の種目を
    選択肢とする判定が下された場合には、前記文字認識結
    果のうちで無印文字の種目に相当する文字認識結果に基
    づいて同一グループ内のマーク付き文字の種目を選択肢
    として判定し、一方、マーク付き文字の種目以外の種目
    を選択肢とする判定が下された場合には、前記文字認識
    結果のうちで無印文字の種目の文字認識結果に基づいて
    同一グループ内の無印文字の種目を選択肢として判定す
    る第2判定工程と、 を含んだことを特徴とする文字認識方法。
  5. 【請求項5】 前記第1判定工程は、前記推定工程によ
    り前記複数の種目についてすべて無印文字の推定結果が
    得られた場合、選択肢無しとして判定すること特徴とす
    る請求項4記載の文字認識方法。
  6. 【請求項6】 前記推定工程は、前記照合工程の照合結
    果から複数の候補を抽出し、前記複数の候補のうちで同
    種のマークの数が一番多い種類のマークを最終候補とし
    て推定することを特徴とする請求項4または5に記載の
    文字認識方法。
  7. 【請求項7】 選択肢として文字で表記された複数の種
    目が1グループとして印刷されてなる用紙を光学的に読
    み取って得られたイメージデータに基づいて文字認識を
    行うことをコンピュータに実行させるプログラムを記録
    したコンピュータ読み取り可能な記録媒体であって、 あらかじめ複数種のマークが用意され、前記複数の種目
    には、前記複数種のマークのいずれか1つが付与された
    マーク付き文字の種目からなるグループと前記複数種の
    マークのいずれも付与されていない無印文字の種目から
    なるグループとが存在し、前記各グループにマークの種
    類と各文字の文字認識結果を示す特徴データとを対応さ
    せてあらかじめ登録しておくデータベースが設けられ、 前記コンピュータに、 前記文字認識で得られた前記イメージデータの文字認識
    結果を前記データベースに登録されている特徴データに
    照合する照合手順と、 前記照合手順の照合結果に基づいて前記複数種のマーク
    からマークの種類を1つ推定する推定手順と、 前記推定手順により推定されたマークの種類に応じてマ
    ーク付き文字の種目を選択肢とするか、それともマーク
    付き文字の種目以外の種目を選択肢とするかを判定する
    第1判定手順と、 前記データベースを参照して、マーク付き文字の種目を
    選択肢とする判定が下された場合には、前記文字認識結
    果のうちで無印文字の種目に相当する文字認識結果に基
    づいて同一グループ内のマーク付き文字の種目を選択肢
    として判定し、一方、マーク付き文字の種目以外の種目
    を選択肢とする判定が下された場合には、前記文字認識
    結果のうちで無印文字の種目の文字認識結果に基づいて
    同一グループ内の無印文字の種目を選択肢として判定す
    る第2判定手順と、 を実行させるためのプログラムを記録したコンピュータ
    読み取り可能な記録媒体。
  8. 【請求項8】 前記第1判定手順は、前記推定手順によ
    り前記複数の種目についてすべて無印文字の推定結果が
    得られた場合、選択肢無しとして判定すること特徴とす
    る請求項7記載のコンピュータ読み取り可能な記録媒
    体。
  9. 【請求項9】 前記推定手順は、前記照合手順の照合結
    果から複数の候補を抽出し、前記複数の候補のうちで同
    種のマークの数が一番多い種類のマークを最終候補とし
    て推定することを特徴とする請求項7または8に記載の
    コンピュータ読み取り可能な記録媒体。
JP08167898A 1998-03-27 1998-03-27 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 Expired - Lifetime JP3422924B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP08167898A JP3422924B2 (ja) 1998-03-27 1998-03-27 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US09/185,604 US6320983B1 (en) 1998-03-27 1998-11-03 Method and apparatus for character recognition, and computer-readable recording medium with a program making a computer execute the method recorded therein

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08167898A JP3422924B2 (ja) 1998-03-27 1998-03-27 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JPH11282955A JPH11282955A (ja) 1999-10-15
JP3422924B2 true JP3422924B2 (ja) 2003-07-07

Family

ID=13753023

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08167898A Expired - Lifetime JP3422924B2 (ja) 1998-03-27 1998-03-27 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (2)

Country Link
US (1) US6320983B1 (ja)
JP (1) JP3422924B2 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4450888B2 (ja) * 1999-05-28 2010-04-14 富士通株式会社 帳票認識方法
JP3467437B2 (ja) * 1999-09-16 2003-11-17 富士通株式会社 文字認識装置及びその方法とプログラム記録媒体
ES2208164T3 (es) * 2000-02-23 2004-06-16 Ser Solutions, Inc Metodo y aparato para procesar documentos electronicos.
JP3867512B2 (ja) * 2000-06-29 2007-01-10 富士ゼロックス株式会社 画像処理装置および画像処理方法、並びにプログラム
GB2381637B (en) * 2001-10-31 2005-04-27 James Au-Yeung Apparatus and method for determining selection data from pre-printed forms
JP2004102320A (ja) * 2002-09-04 2004-04-02 Fujitsu Ltd 帳票処理装置、帳票処理方法、及びその方法をコンピュータに行わせるプログラム
US7059301B2 (en) * 2003-02-20 2006-06-13 Caterpillar Inc. End of injection rate shaping
JP2005234790A (ja) * 2004-02-18 2005-09-02 Ricoh Co Ltd 手書き帳票処理システム、手書き帳票処理方法
US20080090724A1 (en) * 2006-10-11 2008-04-17 Mistyurik John D Date-coding system and method
US8208725B2 (en) * 2007-06-21 2012-06-26 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
US8144989B2 (en) * 2007-06-21 2012-03-27 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
US8340430B2 (en) * 2007-07-10 2012-12-25 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
US8023770B2 (en) 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for identifying the orientation of a digital image
US8023741B2 (en) 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for detecting numerals in a digital image
US8160365B2 (en) * 2008-06-30 2012-04-17 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
JP5561856B2 (ja) * 2010-05-24 2014-07-30 株式会社Pfu 帳票作成装置、帳票作成プログラム、および帳票作成方法
US9076058B2 (en) 2013-01-29 2015-07-07 Sharp Laboratories Of America, Inc. Methods, systems and apparatus for determining orientation in a document image
JP6193830B2 (ja) * 2014-09-18 2017-09-06 富士通フロンテック株式会社 帳票認識装置、帳票認識方法、及び、プログラム
JP6784273B2 (ja) 2018-04-02 2020-11-11 日本電気株式会社 画像処理装置、画像処理方法およびプログラム
JP7133844B2 (ja) * 2018-10-26 2022-09-09 ネットスマイル株式会社 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム
JP7111143B2 (ja) * 2020-10-22 2022-08-02 日本電気株式会社 画像処理装置、画像処理方法およびプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6002799A (en) * 1986-07-25 1999-12-14 Ast Research, Inc. Handwritten keyboardless entry computer system
US5038382A (en) * 1989-10-13 1991-08-06 International Business Machines Corporation Multi-scale recognizer for hand drawn strokes
US5347295A (en) * 1990-10-31 1994-09-13 Go Corporation Control of a computer through a position-sensed stylus
US5555101A (en) * 1991-07-22 1996-09-10 Cardiff Software, Inc. Forms creation and interpretation system
JP2951814B2 (ja) 1993-02-25 1999-09-20 富士通株式会社 画像抽出方式
JP3368511B2 (ja) 1994-08-11 2003-01-20 富士通株式会社 連結領域の抽出装置及び方法
US5737440A (en) * 1994-07-27 1998-04-07 Kunkler; Todd M. Method of detecting a mark on a oraphic icon
JPH0962789A (ja) 1995-08-28 1997-03-07 Oki Electric Ind Co Ltd 光学式文字読取装置のマーク認識方法

Also Published As

Publication number Publication date
US6320983B1 (en) 2001-11-20
JPH11282955A (ja) 1999-10-15

Similar Documents

Publication Publication Date Title
JP3422924B2 (ja) 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US6501864B1 (en) Data medium handling apparatus and data medium handling method
CN100380386C (zh) 帐票处理方法与系统、识别帐票的方法及图像处理装置
US6721451B1 (en) Apparatus and method for reading a document image
KR100314637B1 (ko) 좌표검출태블릿을갖는필기데이터입력장치
US5867596A (en) Method for diagram recognition by using recognizing rules and system for implementing the method
JP4996940B2 (ja) 帳票認識装置およびそのプログラム
JP3294995B2 (ja) 帳票読取装置
CA2477745A1 (en) Extracting text written on a check
JP2008003740A (ja) 入力修正方法、追記情報処理方法、追記情報処理装置、およびプログラム
JPH11161736A (ja) 文字認識方法
JP3463008B2 (ja) 媒体処理方法及び媒体処理装置
JP4807618B2 (ja) 画像処理装置及び画像処理プログラム
JP3463009B2 (ja) 媒体処理方法及び媒体処理装置
JPH08263587A (ja) 文書入力方法および文書入力装置
Yamashita et al. A document recognition system and its applications
JP3904292B2 (ja) 補助帳簿連動記帳装置
WO2019194029A1 (ja) 画像処理装置、画像処理方法、及びプログラムを記憶する記憶媒体
JPH11102416A (ja) 帳票読取方向判定装置および帳票読取方向判定方法
JP2000090192A (ja) 住所および郵便番号の文字列修正方法
JPH06103402A (ja) 名刺認識装置
JP2001005804A (ja) 文字認識装置を利用したデータベース登録方法
JPH0327471A (ja) 画像登録方式
JP3000349B2 (ja) キー入力編集方法及び編集装置
WO2021140682A1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030408

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080425

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090425

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090425

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100425

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120425

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130425

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140425

Year of fee payment: 11

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term