JP3525997B2 - 文字認識方法 - Google Patents
文字認識方法Info
- Publication number
- JP3525997B2 JP3525997B2 JP33018297A JP33018297A JP3525997B2 JP 3525997 B2 JP3525997 B2 JP 3525997B2 JP 33018297 A JP33018297 A JP 33018297A JP 33018297 A JP33018297 A JP 33018297A JP 3525997 B2 JP3525997 B2 JP 3525997B2
- Authority
- JP
- Japan
- Prior art keywords
- logical
- character
- block
- character string
- recognition method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Description
イアウトを検出して、データ部分の文字列の認識を行う
文字認識方法に関する。
認識する文字認識方法が用いられている。この文字認識
においては、指定された位置のイメージを取り出し、文
字認識する。
英字の種類があり、文字の文字フォントは、活字、手書
き文字がある。これらの文字を正確に認識するには、文
字の位置、種類やフォント名という文字の定義を定めて
おく必要がある。
来技術の説明図である。
この振込依頼書は、29の文字列C1〜C29を有す
る。振込人は、C2に示すように、株式会社「あいうシ
ステム」である。そして、振込指定日は、C3、C4に
示すように、平成9年7月20日である。
5)、科目(C6)、口座番号(C7)受取人名(C
8)、振込金額(C9)が並ぶ。振込先の見出しに対応
するデータ分は、C10、C11、C16、C17、C
22、C23である。科目の見出しに対応するデータ部
分は、C12、C18、C24である。口座番号の見出
しに対応するデータ部分は、C13、C19、C25で
ある。
は、C14、C20、C26である。振込金額の見出し
に対応するデータ部分は、C15、C21、C27であ
る。最後に、見出し「振込合計」(C28)と、そのデ
ータ部分(C29)が記入されている。
識するには、データ部分の位置、データ名を定義してお
く必要がある。又、データ部分の文字種が判っていれ
ば、そのデータ部分の文字認識範囲を限定でき、高い精
度の文字認識が可能となる。この文字認識範囲を限定す
るため、データ部分の文字カテゴリー、文字フォント種
類を定義する必要がある。
0に対し、位置、データ名(振込先)、文字カテゴリー
(漢字)、文字フォント(活字)が定義される。従来
は、帳票毎に、文字を読み取る位置等を定義した定義情
報を事前に作成して、認識装置に登録する。
上のイメージを切り出し、文字認識していた。
術では、定義情報を登録する必要があるため、予め定義
情報を登録した帳票しか、文字認識できない。例えば、
金融機関において、振込の自動入力を行う場合に、企業
が作成する振込依頼書のフォーマットは、様々である。
このような各帳票の定義情報を予め作成しておくこと
は、手間がかかるという問題がある。
その帳票のフォーマットが変更になった場合に、定義情
報を変更する必要があるという問題もある。
予め作成する必要のない文字認識方法を提供するにあ
る。
から帳票の文字のレイアウトを自動的に検出する文字認
識方法を提供することにある。
義情報を自動的に検出して、帳票のデータ部分を文字認
識するための文字認識方法を提供することにある。
の文字とを有する罫線を有しない帳票の文字を認識する
文字認識方法である。そして、本発明は、帳票のイメー
ジデータを走査し、黒画素が連続する部分をラベルとし
て抽出し、抽出したラベル間の位置関係から各文字列を
抽出するステップと、前記抽出した文字列の行及び列方
向の位置関係から前記罫線を有しない帳票の見出し部分
とデータ部分とを判別するステップと、前記見出し部分
の文字列を見出し辞書を用いて認識して、前記データ部
分の文字属性を決定するステップと、前記文字属性に従
い、前記データ部分の文字列を認識するステップとを有
し、前記判別するステップは、前記文字列の抽出により
得た前記文字列の開始座標の比較による位置関係から同
一の論理行を構成する文字列を抽出するステップと、前
記文字列の開始座標又は終了座標から、前記文字列の並
びが同じ論理行をブロックとして抽出するステップと、
前記各ブロックにおいて、前記文字列の開始又は終了座
標から、同じ列を構成する文字列を論理列として抽出す
るステップと、前記論理列の位置関係から前記論理列間
の対応関係を決定するステップと、前記ブロックの位置
関係から前記論理列の見出し部分を決定するステップと
を有する。
分の文字とを有する罫線を有しない帳票の文字を認識す
る際に、帳票のイメージデータを走査し、黒画素が連続
する部分をラベルとして抽出し、抽出したラベル間の位
置関係から各文字列を抽出して、抽出した文字列の行及
び列方向の位置関係から罫線を有しない帳票の見出し部
分を判別する。そして、予め登録した見出し認識辞書を
用いて、見出し部分の文字列を認識して、データ部分の
文字属性を決定する。その文字属性に従い、データ部分
の文字列を認識する。更に、罫線を有しない帳票から文
字列の位置関係から、論理行及び論理列を構成する単位
に分類するため、文字列の抽出結果としての文字列自体
の開始、終了座標を使用している。このため、文字列自
体から論理行及び論理列、ブロックの分類という複雑な
表構造解析が可能となる。
て、見出しの文字認識を行うため、自動的にデータ部分
の文字属性を決定できる。しかも、見出し部分は、汎用
性があり、文字種類も限られているため、容易に見出し
部分の文字認識ができる。更に、データ部分は、決定さ
れた文字属性に応じて、文字認識するため、文字認識の
精度が向上する。
文字認識装置の構成図、図2は、本発明の一実施の形態
の全体処理フロー図である。
を光学的に読み取る。キーボード2は、オペレータが各
種の入力を行うためのものである。ディスプレイ3は、
認識結果等を表示する。プロセッサ(CPU)4は、文
字認識を行う。記憶ユニット5は、CPU4の処理に必
要なデータ等を格納するものである。
と、カテゴリー/フォント別辞書51〜5nを格納す
る。見出し文言辞書50は、予め定められた見出し文言
とそのイメージデータを格納する。カテゴリー/フォン
ト別辞書51〜5nは、データ部分の文字認識のため、
文字認識カテゴリー/文字フォント別の辞書を格納す
る。
部40と、文字列の並びから見出し部分を判別する見出
し判別部41と、見出し部分の文字認識を行う見出し認
識部42と、データ部分の文字認識を行うデータ認識部
43とを有する。尚、後述するように、これら各部は、
CPU4が行う処理をブロックで表現したものである。
タから文字列を抽出する。
の文字列を抽出して、論理行構成部を抽出する。
理行を抽出して、表構成部を抽出する。
理列を抽出する。
ブロックを統合して、各論理列間のリンクを設定する。
各ブロックに、所定のルールでブロック属性を付与す
る。
出し部分を抽出する。
いて、見出し部分を文字認識して、データ部分の文字の
属性(データ名、位置、文字カテゴリー、文字フォン
ト)を決定する。
従い、カテゴリー/フォント別辞書51〜5nを選択し
て、データ部分の文字認識を行う。
説明する。尚、図31に示した振込依頼書を帳票の例と
して使用する。
図4は、図2の論理行抽出処理の説明図、図5は、論理
行抽出処理のフロー図、図6は、図5の抽出処理の動作
説明図、図7は、他の論理行抽出処理のフロー図、図8
は、別の論理行抽出処理の説明図、図9は、各処理に使
用されるテーブルの説明図である。
図9により説明する。
を走査して、黒画素が連続する部分をラベルとして抽出
する。図では、文字「1」、「2」、「3」、「4」の
4つのラベルが抽出される。抽出したラベルの内、しき
い値以内の距離にあるラベルを、同じ文字列を構成する
ラベルとして抽出する。図3では、文字「1」と文字
「2」とが、同一の文字列を構成する。文字「3」と文
字「4」とが、同一の文字列を構成する。そして、図の
四角で囲まれた部分が、文字列部分として、抽出され
る。
文字列テーブルT1で示される。文字列テーブルT1
は、文字列データ番号と、開始座標(X、Y)、終了座
標(X、Y)、入れ子情報、論理行リンク先アドレス、
論理列リンク先アドレスとで構成される。
る。そして、文字列テーブルT1に、各文字列のデータ
番号と開始座標と終了座標が格納される。
図9により説明する。
判定して、横方向に並ぶ項目データ(文字列)を論理行
を構成するグループとして抽出する処理である。図31
の例では、図4に示すように、7つの論理行L1〜L7
が抽出される。
る。
合う2つの文字列を抽出する。
を参照したかを判定する。全文字列を参照した場合に
は、処理を終了する。
には、Y座標の許容値YAを算出する。これは、帳票が
斜行して、読み取られた場合を想定している。
座標の差ΔYを算出する。そして、その差が許容値以内
かを判定する。
ップS15に進む。その差が許容値を越えていれば、ス
テップS16に進む。
いても、帳票の斜行のために、それぞれの文字列全体が
斜行している。このため、この斜行を考慮して、文字列
が水平に並んでいるかを判定する。
度とした場合に、tanθ=0.087である。最大斜
度の範囲内で、同じY座標を持つと判断できるY座標の
範囲(許容値)YAは、文字列間の開始X座標の差ΔX
を用いて、下記のように、算出できる。
「100」である。従って、許容値YAは、8.7とな
る。この結果から、開始X座標がX1、X2である2つ
の文字列は、Y座標の差ΔYが、8ドット以内ならば、
同じ論理行を構成する文字列と判断できる。逆に、Y座
標の差ΔYが8ドットを越えるならば、同じ論理行を構
成しない文字列と判断する。
構成すると判断した場合には、両文字列をリンクする論
理行テーブルを作成する。図9に示すように、論理行テ
ーブルT2は、論理行番号と開始座標(X、Y)と終了
座標(X、Y)と文字列数と先頭文字列アドレスとで構
成される。
L2には、文字列C2と文字列C3を含む開始座標、終
了座標が設定され、文字列数は「2」が設定され、先頭
アドレスとして、文字列2のアドレスが設定される。そ
して、文字列テーブルT1の文字列2の論理行リンク先
アドレスに、文字列3のアドレスが設定される。
文字列C29を含む開始座標、終了座標が設定され、文
字列数は「2」が設定され、先頭アドレスとして、文字
列28のアドレスが設定される。
構成しないと判断した場合には、両文字列をリンクしな
い論理行テーブルを作成する。例えば、図31及び図4
の例では、論理行L1には、文字列C1の開始座標、終
了座標が設定され、文字列数は「1」が設定され、先頭
アドレスとして、文字列1のアドレスが設定される。そ
して、ステップS10に戻る。
字列を論理行に分類して、論理行テーブルT2を作成す
る。
ある。
ータから計算する。例えば、帳票の外接矩形をイメージ
データから求める。そして、外接矩形の傾きを計算す
る。
帳票のイメージデータを回転する。そして、前述の文字
列抽出処理を行う。
合う2つの文字列を抽出する。
を参照したかを判定する。全文字列を参照した場合に
は、処理を終了する。
には、比較する2つの文字列の開始Y座標の差ΔYを算
出する。そして、その差が誤差範囲以内かを判定する。
その差が誤差範囲以内なら、両文字列は、同一の論理行
を構成すると判断して、ステップS25に進む。その差
が誤差範囲を越えていれば、両文字列は、同一の論理行
を構成しないと判断して、ステップS26に進む。
構成すると判断した場合には、両文字列をリンクする論
理行テーブルを作成する。そして、ステップS22に戻
る。
構成しないと判断した場合には、両文字列をリンクしな
い論理行テーブルを作成する。そして、ステップS22
に戻る。
傾きを補正する。その後、論理行の抽出処理を行う。
る。
トマップを、水平方向に投影する。そして、水平方向の
ビット列毎に、黒画素をカウントする。このようにする
と、水平投影されたビット列の黒画素数は、図8のグラ
フのように、文字列の存在する部分で、山を形成する。
座標)に、論理行が存在すると判定する。そして、論理
行が存在する位置(Y座標)を有する文字列を、1ツの
論理行を構成する文字列として抽出する。このようにし
ても、論理行を構成する文字列を抽出することができ
る。
0乃至図14を用いて説明する。
11は、表構造部抽出処理の動作説明図、図12は、表
構造部抽出処理のフロー図、図13は、ブロックテーブ
ルの説明図、図14は、他の表構造部抽出処理の説明図
である。
理行が、同じ行構造を持つか判定する。図11に示すよ
うに、上下に隣り合う論理行の間で、左側に位置する文
字列から順に参照する。そして、両文字列の開始X座標
又は終了X座標が、一致するかを判定する。即ち、両文
字列の開始X座標又は終了X座標の差が、誤差範囲にあ
るかを判定する。そして、2つの論理行の全ての文字列
の開始X座標又は終了X座標が一致する場合に、同じ行
構造を持つと判断する。そして、同じ行構造を持つ論理
行をブロックに纏める。
L5の間で、論理行L4の文字列C10、C11、C1
2、C13、C14の開始X座標が、論理行L5の文字
列C16、C17、C18、C19、C20の開始X座
標と一致し、且つ論理行L4の文字列C15の終了X座
標が、論理行L5の文字列C21の終了X座標と一致す
る。従って、2つ論理行L4、L5は、同じ行構造を持
つため、1つのブロックに分類される。
の行構造を持つため、1つのブロックに分類される。こ
のようにして、図31の例では、図10に示すように、
論理行L4、L5、L6が、1つのブロックB4に分類
される。他の各論理行は、各々1つブロックを構成す
る。
隣り合う2つの論理行を抽出する。
る。全論理行を参照した場合には、処理を終了する。
には、各論理行を構成する文字列を左側から抽出する。
そして、各論理行間の2つ文字列の開始X座標又は終了
X座標のいずれかが一致するかを判定する。2つの論理
行間において、全文字列が一致するか判定する。
列が一致する場合には、2つの論理行をリンクするブロ
ックテーブルT3を作成する。そして、ステップS30
に戻る。
3は、ブロック番号、開始座標、終了座標、文字列数、
論理行数、論理列数、先頭論理行アドレス、先頭論理列
アドレス、属性を有する。
番号4のブロックB4は、3つの論理行L4〜L6をリ
ンクするため、開始座標は、3つの論理行の先頭座標に
設定され、終了座標は、3つの論理行の終了座標に設定
される。又、文字列数は、「18」に設定され、論理行
数は、「3」に設定される。先頭論理行アドレスは、論
理行4のアドレスに設定される。
のいずれかが一致しない場合には、2つの論理行をリン
クしないブロックテーブルT3を作成する。そして、ス
テップS30に戻る。
番号3のブロックB3は、1つの論理行L3で構成され
ているため、開始座標は、1つの論理行L3の先頭座標
に設定され、終了座標は、1つの論理行L3の終了座標
に設定される。又、文字列数は、論理行L3の文字列数
である「5」に設定され、論理行数は、「1」に設定さ
れる。先頭論理行アドレスは、論理行3のアドレスに設
定される。
のようなブロックテーブルが作成される。そして、後述
するように、最も論理行数の多いブロックと、その上側
のブロックと、その下側のブロックとを、表構造部とし
て抽出する。
である。
に、イメージデータのビットマップを、水平方向に投影
する。そして、水平方向のビット列毎に、黒画素をカウ
ントする。このようにすると、水平投影されたビット列
の黒画素数は、図14のグラフのように、論理行の存在
する部分で、山を形成する。
造が等間隔で規則的な並びを持つ。そこで、等間隔で同
じ黒画素数を持つ部分Bを、表構造を構成する部分とし
て判断する。この部分を構成している論理行を抽出す
る。このようにしても、表構造部を構成する論理行を抽
出することができる。
至図18をもちいて説明する。
6は、論理列抽出処理のフロー図、図17は、論理列テ
ーブルの説明図、図18は、更新された文字列テーブル
の説明図である。
構造の文字列を論理列として分類する。図15に示すよ
うに、上下に隣り合うブロックにおいて、文字列が、同
じ列構造を持つか判定する。上下に隣り合うブロックの
間で、左側に位置する文字列から順に参照する。そし
て、両文字列の開始X座標又は終了X座標が、一致する
かを判定する。即ち、両文字列の開始X座標又は終了X
座標の差が、誤差範囲にあるかを判定する。そして、2
ツの文字列の開始X座標又は終了X座標が一致する場合
に、同じ列構造を持つと判断する。そして、同じ列構造
を持つ文字列を論理列に纏める。
理行L4の文字列C10、C11、C12、C13、C
14の開始X座標が、論理行L5の文字列C16、C1
7、C18、C19、C20の開始X座標と一致する。
論理行L4の文字列C15の終了X座標が、論理行L5
の文字列C21の終了X座標と一致する。
7、C18、C19、C20の開始X座標が、論理行L
6の文字列C22、C23、C24、C25、C26の
開始X座標と一致する。論理行L5の文字列C21の終
了X座標が、論理行L6の文字列C27の終了X座標と
一致する。
27は、6ツの論理列R10〜R15に分類される。
ロック情報を抽出する。
る。全ブロックを参照した場合には、処理を終了する。
合には、抽出したブロックの論理行数が「1」であるか
を調べる。
の開始X座標又は終了X座標が一致するかを判定する。
そして、一致する場合には、論理列テーブルT4を、一
致内容に従い、作成する。そして、ステップS40に戻
る。
は、論理列番号、開始座標、終了座標、文字列数、先頭
文字列アドレスを有する。
7の論理列が設定される。そしてブロックB4の論理列
R10は、3つの文字列C10、C16、C22を纏め
るため、開始座標は、3つの論理列の先頭座標に設定さ
れ、終了座標は、3つの論理列の終了座標に設定され
る。又、文字列数は、「3」に設定され、先頭論理列ア
ドレスは、文字列10のアドレスに設定される。そし
て、図18に示すように、文字列テーブルT1の文字列
C10の論理列リンク先アドレス欄に、文字列16のア
ドレスが設定される。論理列R11においても、同様に
設定される。
文字列の論理列テーブルT4を作成する。そして、ステ
ップS40に戻る。
号3の論理列R3は、1つの文字列C3で構成されてい
るため、開始座標は、1つの文字列C3の先頭座標に設
定され、終了座標は、1つの文字列C3の終了座標に設
定される。又、文字列数は、「1」に設定され、先頭文
字列アドレスは、文字列3のアドレスに設定される。
のような論理列テーブルT4が作成される。
いて、図19乃至図24を用いて説明する。
20は、入れ子処理の説明図、図21は、更新された文
字列テーブルの説明図、図22は、更新された論理列テ
ーブルの説明図、図23は、ブロック統合及び属性付与
処理のフロー図、図24は、グループテーブルの説明図
である。
設定するため行われる。ブロック統合処理は、表構造部
として抽出した部分について、最も論理行数の多いブロ
ックと、その上側に位置するブロックとが、同じ論理列
構造を持つかを判定する。同じ論理列構造を持つ場合に
は、2つのブロックを纏めて、1つの論理列構造となる
ように、論理列を再作成する。
ブロックB4と、その上側のブロックB3とが、同じ論
理列構造をもつか判定する。D部分において、ブロック
B4の4ツの論理列R12〜R15と、ブロックB3の
4ツの論理列R6〜R9は、同じX位置を持つ。従っ
て、D部分は、同じ論理列構造を持つと判断される。C
部分では、ブロックB3が、1つの論理列R5を持つの
に対し、ブロックB4が、2つの論理列R10、R11
を持つ。このため、列構造が異なる。
め、ブロックB3とブロックB4とは、同一の論理列構
造を持つと判断する。そして、ブロックB3の論理列と
ブロックB4の論理列とを統合する。即ち、論理列R1
0、R11は、論理列R5と統合され、論理列R12
は、論理列R6と統合され、論理列R13は、論理列R
7と統合され、論理列R14は、論理列R8と統合さ
れ、論理列R15は、論理列R9に統合される。これに
より、両ブロックの論理列のリンク関係が設定される。
は、この統合に従い、更新される。例えば、論理列R5
(論理列番号5)の終了座標は、論理列R11の終了座
標に更新され、論理列R5の文字列数は、論理列R1
0、R11の文字列を含むように、「7」に更新され
る。論理列R10、R11は、統合されたため、論理列
R10,R11の文字列数は、「0」に更新される。
い、設定される。図21の文字列テーブルT1におい
て、文字列C5の論理列リンク先アドレスは、文字列1
0のアドレスに設定される。
ータを定義するため、入れ子情報を設定する。図19の
場合には、図20に示すように、文字列C5は、文字列
C10と文字列C11に対し意味を持つ。従って、2つ
の文字列C10、C11間に入れ子情報を設定する。こ
れにより、2つの文字列が、1列を構成することを示
す。
の列と見なすため、両文字列C10、C11に、入れ子
フラグ(ON)を設定し、且つ枝番を付与する。これに
より、2つの文字列がペアとなっていることを示す。
又、文字列C10とC11を同一の列とするため、文字
列C10の論理列リンク先アドレスに、文字列C11の
アドレスを設定する。同様に、文字列C11の論理列リ
ンク先アドレスに、文字列C16のアドレスを設定す
る。
ックに属性を設定する。帳票上で最も多くの論理行を持
つブロックを、ボディブロック属性に設定する。ボディ
ブロックの上に位置するブロックを、ヘッダブロック属
性に設定する。ボディブロックの下に位置するブロック
を、フッタブロック属性に設定する。
て、論理行数の最も多いブロックを抽出する。そして、
そのブロックに、ボディブロック属性(=2)を設定す
る。図13に示すように、ブロックB4に、ボディブロ
ック属性(=2)を設定する。
ィブロックと、その上のブロックとを参照し、同じ論理
列構造を持つかを判定する。同じ列構造の場合には、上
のブロックにヘッダブロック属性(=1)を設定する。
図13に示すように、ブロックB3に、ヘッダブロック
属性(=1)を設定する。そして、両ブロックの論理列
間の統合を行う。
ブロックに、フッタブロック属性(=3)を設定する。
図13に示すように、ブロックB5に、フッタブロック
属性(=3)を設定する。
ク、フッタブロックをグループに纏める。図24に示す
ように、グループテーブルT5を作成する。グループテ
ーブルT5に、グループ番号、開始座標、終了座標、ブ
ロック数、先頭ブロックアドレスが設定される。図24
に示すように、図13の例では、グループ番号3に、ブ
ロック数が「3」に設定され、先頭ブロックアドレス
が、ブロック3のアドレスに設定される。
プ情報を設定する。図24に示すように、図13の例で
は、グループ番号1に、ブロック数が「1」に設定さ
れ、先頭ブロックアドレスが、ブロック1のアドレスに
設定される。グループ番号2に、ブロック数が「1」に
設定され、先頭ブロックアドレスが、ブロック2のアド
レスに設定される。そして、終了する。
し、ブロックに属性を付与する。
び図26により説明する。
図、図26は、更新される文字列テーブルの説明図であ
る。
として可能性のある部分を抽出する。見出し部分は、前
の処理で設定したブロック属性を利用して、以下のルー
ルで抽出する。
がある。
る文字列を除き、見出しの可能性がある。
の可能性がある。
は、点線で囲んだ文字列C1〜C9、C28が、見出し
の可能性のある部分として抽出される。そして、図26
に示すように、文字列テーブルT1において、見出しの
可能性のある文字列C1〜C9、C28に、見出しフラ
グ「1」が設定される。
タとに区別される。
9により説明する。
28は、見出し認識辞書の説明図、図29は、見出し認
識処理の説明図である。
を抽出する。全文字列を参照したかを調べる。全文字列
を参照した場合には、終了する。
には、その文字列の見出しフラグがオン(「1])かを
調べる。見出しフラグがオンでないと、ステップS60
に戻る。見出しフラグがオンであると、その文字列を見
出し辞書50を用いて文字認識する。見出し辞書50ー
1は、図28に示すように、予め定められた文言のイメ
ージデータと、その見出し識別コードとを有する。例え
ば、識別コード「振込先」に対し、振込先の漢字のイメ
ージデータを格納する。見出し部分の文字列のイメージ
データは、見出し辞書50ー1と照合され、見出し認識
が行われる。
る見出しを見つけると、その見出し識別コードを得る。
そして、図28に示す見出し識別テーブル50ー2を用
いて、データ部分の文字の定義(カテゴリー、フォント
名)を得る。見出し識別テーブル50ー2は、各見出し
識別コードに対応した文字認識カテゴリー、文字フォン
ト名を格納する。これにより、見出し部分の識別コード
(機能名)、文字認識カテゴリー(漢字、数字、英
字)、文字フォント名(活字、手書き文字)が判る。
字列は、文字列テーブルT1のその見出しの文字列の論
理列リンク先アドレスにより判る。従って、図29に示
すように、論理列リンク先アドレスの示す文字列の機能
名、認識カテゴリー、フォント名欄に、認識により得た
機能名、認識カテゴリー、フォントを設定する。そし
て、ステップS60に戻る。
辞書50ー1に一致した見出しパターンが無い文字列
は、データ部分である。このため、予め定めた認識カテ
ゴリー、フォントを、文字列テーブルT1に設定する。
そして、ステップS60に戻る。
ンク先は、文字列C10であるため、文字列C10に、
文字列C5の認識結果である機能名、認識カテゴリー、
フォントが設定される。又、文字列C2は、見出しと判
定されたが、見出し辞書に一致するパターンがないた
め、データ部と判定される。そして、予め定めた認識カ
テゴリー(漢字)、フォント(活字)が、文字列テーブ
ルT1に設定される。
出し認識を行う。そして、対応するデータ部の文字属性
を得る。
る。
を抽出する。全文字列を参照したかを調べる。全文字列
を参照した場合には、終了する。
には、その文字列の見出しフラグがオン(「1])かを
調べる。見出し部分は、見出しフラグがオンである。見
出しフラグがオンであることは、データでないことを示
す。従って、見出しフラグがオンの場合には、ステップ
S60に戻る。
その文字列は、データ部分である。従って、その文字列
の認識カテゴリー、フォント名を文字列テーブルT1か
ら抽出する。そして、その認識カテゴリー、フォント名
に従い、辞書51〜5n(図1参照)を選択して、その
文字列を文字認識する。そして、ステップS70に戻
る。
容に対応した最適の文字認識方式を用いて文字認識する
ことが出来る。このため、高い精度の文字認識が可能と
なる。又、文字列の並びから見出し部分とデータ部分と
を自動判別しているため、データ部分の属性を自動認識
できる。
の位置関係から、見出し部分とデータ部分を判別してい
るが、判別した結果を登録しておき、次回からは、この
判別結果を使用して、帳票のデータ部分を文字認識して
も良い。
が、本発明の主旨の範囲内で種々の変形が可能であり、
これらを本発明の範囲から排除するものではない。
次の効果を奏する。
画素が連続する部分をラベルとして抽出し、抽出したラ
ベル間の位置関係から各文字列を抽出して、抽出した文
字列の行及び列方向の位置関係から罫線を有しない帳票
の見出し部分を判別して、見出しの認識を行うため、罫
線を有しない帳票でも、自動的にデータ部分の文字属性
を決定できる。又、罫線を有しない帳票から文字列の位
置関係から、論理行及び論理列を構成する単位に分類す
るため、文字列の抽出結果としての文字列自体の開始、
終了座標を使用しているため、文字列自体から論理行及
び論理列、ブロックの分類という複雑な表構造解析が可
能となる。
り、文字種類も限られているため、容易に見出し部分の
文字認識ができる。
属性に応じて、文字認識するため、文字認識の精度が向
上する。
る。
る。
明図である。
る。
図である。
図である。
図である。
図である。
ー図である。
明図である。
る。
図である。
である。
る。
Claims (6)
- 【請求項1】見出し部分の文字とデータ部分の文字とを
有する罫線を有しない帳票の文字を認識する文字認識方
法において、 前記帳票のイメージデータを走査し、黒画素が連続する
部分をラベルとして抽出し、抽出したラベル間の位置関
係から各文字列を抽出するステップと、 前記抽出した文字列の行及び列方向の位置関係から前記
罫線を有しない帳票の見出し部分とデータ部分とを判別
するステップと、 前記見出し部分の文字列を見出し辞書を用いて認識し
て、前記データ部分の文字属性を決定するステップと、 前記文字属性に従い、前記データ部分の文字列を認識す
るステップとを有し、 前記判別するステップは、 前記文字列の抽出により得た前記文字列の開始座標の比
較による位置関係から同一の論理行を構成する文字列を
抽出するステップと、 前記文字列の開始又は終了座標から、前記文字列の並び
が同じ論理行をブロックとして抽出するステップと、 前記各ブロックにおいて、前記文字列の開始又は終了座
標から、同じ列を構成する文字列を論理列として抽出す
るステップと、 前記論理列の位置関係から前記論理列間の対応関係を決
定するステップと、 前記ブロックの位置関係から前記論理列の見出し部分を
決定するステップとを有する ことを 特徴とする文字認識方法。 - 【請求項2】請求項1の文字認識方法において、 前記ブロックを抽出するステップは、 前記文字列の並びが同じ論理行の数を抽出するステップ
であり、 前記見出し部分を決定するステップは、 前記論理行数が最大であるブロックをデータ部分として
決定し、そのブロックの上及び下に位置するブロックを
見出し部分として決定するステップを含むことを特徴と
する文字認識方法。 - 【請求項3】請求項1の文字認識方法において、 前記ブロックを抽出するステップは、 上下に位置する前記論理行の位置関係から、2つの論理
行が同一の行構造を有するかを判断して、ブロックにま
とめるステップを含むことを特徴とする文字認識方法。 - 【請求項4】請求項1の文字認識方法において、 前記論理列を抽出するステップは、 前記各ブロックの論理行を構成する文字列が上下に位置
するかを判断して、論理列にまとめるステップを含むこ
とを特徴とする文字認識方法。 - 【請求項5】請求項4の文字認識方法において、 前記論理列を抽出するステップは、 前記論理行数が最も多いブロックと、そのブロックの上
に位置する論理行を有するブロックが同じ列構造を持つ
かを判定して、論理列にまとめるステップを含むことを
特徴とする文字認識方法。 - 【請求項6】請求項1の文字認識方法において、 前記論理列の対応関係を決定するステップは、 各論理列が上下に対応位置に位置するかを判断して、各
論理列の対応関係を判定するステップを含むことを特徴
とする文字認識方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33018297A JP3525997B2 (ja) | 1997-12-01 | 1997-12-01 | 文字認識方法 |
US09/084,356 US6549662B1 (en) | 1997-12-01 | 1998-05-27 | Method of recognizing characters |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33018297A JP3525997B2 (ja) | 1997-12-01 | 1997-12-01 | 文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11161736A JPH11161736A (ja) | 1999-06-18 |
JP3525997B2 true JP3525997B2 (ja) | 2004-05-10 |
Family
ID=18229751
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP33018297A Expired - Lifetime JP3525997B2 (ja) | 1997-12-01 | 1997-12-01 | 文字認識方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6549662B1 (ja) |
JP (1) | JP3525997B2 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3975626B2 (ja) * | 1999-11-11 | 2007-09-12 | 株式会社オーク製作所 | レーザ描画装置 |
US7447987B2 (en) * | 2004-05-21 | 2008-11-04 | Sap Ag | Method for automatically positioning a data string in a column on an electronic display |
JP2006065477A (ja) * | 2004-08-25 | 2006-03-09 | Fuji Xerox Co Ltd | 文字認識装置 |
JP2006178802A (ja) * | 2004-12-24 | 2006-07-06 | Hitachi Ltd | 帳票定義自動作成方法 |
JP4646300B2 (ja) * | 2005-04-28 | 2011-03-09 | キヤノンマーケティングジャパン株式会社 | 繰り返し行決定装置、繰り返し行決定方法、プログラム及び記録媒体 |
JP5150344B2 (ja) * | 2008-04-14 | 2013-02-20 | 株式会社東芝 | 機械翻訳装置および機械翻訳プログラム |
JP4825243B2 (ja) * | 2008-06-20 | 2011-11-30 | 富士通フロンテック株式会社 | 帳票認識装置、方法、データベース作成装置、方法、及びプログラム |
US8131720B2 (en) * | 2008-07-25 | 2012-03-06 | Microsoft Corporation | Using an ID domain to improve searching |
JP5318742B2 (ja) * | 2009-12-14 | 2013-10-16 | 富士通フロンテック株式会社 | 文字認識方法、文字認識装置および文字認識プログラム |
JP5775839B2 (ja) * | 2012-03-14 | 2015-09-09 | 株式会社日立製作所 | 表構造解析装置及び表構造解析方法 |
JP2013218424A (ja) * | 2012-04-05 | 2013-10-24 | Zero Four Co Ltd | 翻訳装置および翻訳方法 |
JP6065467B2 (ja) * | 2012-08-30 | 2017-01-25 | コニカミノルタ株式会社 | 表計算ソフトのレイアウト保持装置 |
JP5701839B2 (ja) | 2012-10-26 | 2015-04-15 | 株式会社東芝 | 電子機器および方法 |
US20140304579A1 (en) * | 2013-03-15 | 2014-10-09 | SnapDoc | Understanding Interconnected Documents |
JP6081298B2 (ja) * | 2013-06-10 | 2017-02-15 | 富士通フロンテック株式会社 | 文字認識装置、文字認識方法、および文字認識プログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5504822A (en) * | 1986-09-19 | 1996-04-02 | Holt; Arthur W. | Character recognition system |
US5179650A (en) * | 1988-01-21 | 1993-01-12 | Kabushiki Kaisha Toshiba | Method and apparatus for editing documents |
US5136520A (en) * | 1990-03-02 | 1992-08-04 | Milliken Research Corporation | System for assigning discrete time periods for dye applicators in a textile dyeing apparatus |
DE69132130T2 (de) * | 1990-05-15 | 2000-09-28 | Canon K.K., Tokio/Tokyo | Gerät und Verfahren zur Informationserkennung |
AU656057B2 (en) * | 1992-03-27 | 1995-01-19 | Milliken & Company | Method and apparatus for reproducing blended colorants on an electronic display |
JP3302147B2 (ja) * | 1993-05-12 | 2002-07-15 | 株式会社リコー | 文書画像処理方法 |
DE69426714T2 (de) * | 1993-06-30 | 2001-08-02 | Canon K.K., Tokio/Tokyo | Dokumentverarbeitungsverfahren und Gerät |
JPH07182465A (ja) * | 1993-12-22 | 1995-07-21 | Hitachi Ltd | 文字認識方法 |
IT1272259B (it) * | 1994-05-30 | 1997-06-16 | Texas Instruments Italia Spa | Procedimento ed apparecchio per il riconoscimento dei caratteri |
US6208744B1 (en) * | 1994-12-14 | 2001-03-27 | Casio Computer Co., Ltd. | Document image processor and method for setting a document format conforming to a document image |
JPH09134157A (ja) * | 1995-11-09 | 1997-05-20 | Fujitsu Ltd | ヒント付け方法及びフォントファイル構成方法 |
US6201894B1 (en) * | 1996-01-23 | 2001-03-13 | Canon Kabushiki Kaisha | Method and apparatus for extracting ruled lines or region surrounding ruled lines |
-
1997
- 1997-12-01 JP JP33018297A patent/JP3525997B2/ja not_active Expired - Lifetime
-
1998
- 1998-05-27 US US09/084,356 patent/US6549662B1/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US6549662B1 (en) | 2003-04-15 |
JPH11161736A (ja) | 1999-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6687401B2 (en) | Pattern recognizing apparatus and method | |
JP3345224B2 (ja) | パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置 | |
JP3525997B2 (ja) | 文字認識方法 | |
Spitz | Determination of the script and language content of document images | |
US7580571B2 (en) | Method and apparatus for detecting an orientation of characters in a document image | |
JP3640972B2 (ja) | ドキュメントの解読又は解釈を行う装置 | |
US7181068B2 (en) | Mathematical expression recognizing device, mathematical expression recognizing method, character recognizing device and character recognizing method | |
US7437001B2 (en) | Method and device for recognition of a handwritten pattern | |
US20020141660A1 (en) | Document scanner, system and method | |
JP4996940B2 (ja) | 帳票認識装置およびそのプログラム | |
JP3294995B2 (ja) | 帳票読取装置 | |
JP2713622B2 (ja) | 表形式文書読取装置 | |
JP3452774B2 (ja) | 文字認識方法 | |
JP2004139484A (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
JP4280355B2 (ja) | 文字認識装置 | |
JP2012141670A (ja) | 帳票認識装置、方法およびプログラム | |
JP3215176B2 (ja) | 文書画像処理装置及び文書画像処理方法 | |
JP5041775B2 (ja) | 文字切出方法及び文字認識装置 | |
JP3463008B2 (ja) | 媒体処理方法及び媒体処理装置 | |
JP4046941B2 (ja) | 文書書式識別装置および識別方法 | |
Yamashita et al. | A document recognition system and its applications | |
JP3223878B2 (ja) | 文字列照合装置、方法及び記録媒体 | |
JP3812719B2 (ja) | 文書検索装置 | |
JP2917427B2 (ja) | 図面読取装置 | |
JP3673616B2 (ja) | 商品券識別方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20030916 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20031208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040210 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080227 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090227 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090227 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100227 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110227 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110227 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120227 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130227 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130227 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140227 Year of fee payment: 10 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |