JP3525997B2 - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JP3525997B2
JP3525997B2 JP33018297A JP33018297A JP3525997B2 JP 3525997 B2 JP3525997 B2 JP 3525997B2 JP 33018297 A JP33018297 A JP 33018297A JP 33018297 A JP33018297 A JP 33018297A JP 3525997 B2 JP3525997 B2 JP 3525997B2
Authority
JP
Japan
Prior art keywords
logical
character
block
character string
recognition method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP33018297A
Other languages
English (en)
Other versions
JPH11161736A (ja
Inventor
勝利 小原
真一 江口
義博 永野
秀樹 松野
亘一 千葉
裕 勝又
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Ltd
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Fujitsu Frontech Ltd filed Critical Fujitsu Ltd
Priority to JP33018297A priority Critical patent/JP3525997B2/ja
Priority to US09/084,356 priority patent/US6549662B1/en
Publication of JPH11161736A publication Critical patent/JPH11161736A/ja
Application granted granted Critical
Publication of JP3525997B2 publication Critical patent/JP3525997B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、帳票の文字列のレ
イアウトを検出して、データ部分の文字列の認識を行う
文字認識方法に関する。
【0002】データの自動入力のため、帳票上の文字を
認識する文字認識方法が用いられている。この文字認識
においては、指定された位置のイメージを取り出し、文
字認識する。
【0003】帳票上の文字の文字種類は、漢字、数字、
英字の種類があり、文字の文字フォントは、活字、手書
き文字がある。これらの文字を正確に認識するには、文
字の位置、種類やフォント名という文字の定義を定めて
おく必要がある。
【0004】
【従来の技術】図31は、帳票の説明図、図32は、従
来技術の説明図である。
【0005】図31は、帳票として振込依頼書を示す。
この振込依頼書は、29の文字列C1〜C29を有す
る。振込人は、C2に示すように、株式会社「あいうシ
ステム」である。そして、振込指定日は、C3、C4に
示すように、平成9年7月20日である。
【0006】次に、見出し部分として、振込先(C
5)、科目(C6)、口座番号(C7)受取人名(C
8)、振込金額(C9)が並ぶ。振込先の見出しに対応
するデータ分は、C10、C11、C16、C17、C
22、C23である。科目の見出しに対応するデータ部
分は、C12、C18、C24である。口座番号の見出
しに対応するデータ部分は、C13、C19、C25で
ある。
【0007】受取人名の見出しに対応するデータ部分
は、C14、C20、C26である。振込金額の見出し
に対応するデータ部分は、C15、C21、C27であ
る。最後に、見出し「振込合計」(C28)と、そのデ
ータ部分(C29)が記入されている。
【0008】このような帳票において、データ部分を認
識するには、データ部分の位置、データ名を定義してお
く必要がある。又、データ部分の文字種が判っていれ
ば、そのデータ部分の文字認識範囲を限定でき、高い精
度の文字認識が可能となる。この文字認識範囲を限定す
るため、データ部分の文字カテゴリー、文字フォント種
類を定義する必要がある。
【0009】図32に示すように、例えば、文字列C1
0に対し、位置、データ名(振込先)、文字カテゴリー
(漢字)、文字フォント(活字)が定義される。従来
は、帳票毎に、文字を読み取る位置等を定義した定義情
報を事前に作成して、認識装置に登録する。
【0010】そして、登録された定義情報に従い、帳票
上のイメージを切り出し、文字認識していた。
【0011】
【発明が解決しようとする課題】しかしながら、従来技
術では、定義情報を登録する必要があるため、予め定義
情報を登録した帳票しか、文字認識できない。例えば、
金融機関において、振込の自動入力を行う場合に、企業
が作成する振込依頼書のフォーマットは、様々である。
このような各帳票の定義情報を予め作成しておくこと
は、手間がかかるという問題がある。
【0012】又、帳票の定義情報を登録したとしても、
その帳票のフォーマットが変更になった場合に、定義情
報を変更する必要があるという問題もある。
【0013】本発明の目的は、帳票の文字の定義情報を
予め作成する必要のない文字認識方法を提供するにあ
る。
【0014】本発明の他の目的は、帳票の文字列の並び
から帳票の文字のレイアウトを自動的に検出する文字認
識方法を提供することにある。
【0015】本発明の更に他の目的は、帳票の文字の定
義情報を自動的に検出して、帳票のデータ部分を文字認
識するための文字認識方法を提供することにある。
【0016】本発明は、見出し部分の文字とデータ部分
の文字とを有する罫線を有しない帳票の文字を認識する
文字認識方法である。そして、本発明は、帳票のイメー
ジデータを走査し、黒画素が連続する部分をラベルとし
て抽出し、抽出したラベル間の位置関係から各文字列を
抽出するステップと、前記抽出した文字列の行及び列方
向の位置関係から前記罫線を有しない帳票の見出し部分
とデータ部分とを判別するステップと、前記見出し部分
の文字列を見出し辞書を用いて認識して、前記データ部
分の文字属性を決定するステップと、前記文字属性に従
い、前記データ部分の文字列を認識するステップとを
し、前記判別するステップは、前記文字列の抽出により
得た前記文字列の開始座標の比較による位置関係から同
一の論理行を構成する文字列を抽出するステップと、前
記文字列の開始座標又は終了座標から、前記文字列の並
びが同じ論理行をブロックとして抽出するステップと、
前記各ブロックにおいて、前記文字列の開始又は終了座
標から、同じ列を構成する文字列を論理列として抽出す
るステップと、前記論理列の位置関係から前記論理列間
の対応関係を決定するステップと、前記ブロックの位置
関係から前記論理列の見出し部分を決定するステップと
を有する
【0017】本発明では、見出し部分の文字とデータ部
分の文字とを有する罫線を有しない帳票の文字を認識す
る際に、帳票のイメージデータを走査し、黒画素が連続
する部分をラベルとして抽出し、抽出したラベル間の位
置関係から各文字列を抽出して、抽出した文字列の行及
び列方向の位置関係から罫線を有しない帳票の見出し部
分を判別する。そして、予め登録した見出し認識辞書を
用いて、見出し部分の文字列を認識して、データ部分の
文字属性を決定する。その文字属性に従い、データ部分
の文字列を認識する。更に、罫線を有しない帳票から文
字列の位置関係から、論理行及び論理列を構成する単位
に分類するため、文字列の抽出結果としての文字列自体
の開始、終了座標を使用している。このため、文字列自
体から論理行及び論理列、ブロックの分類という複雑な
表構造解析が可能となる。
【0018】帳票の見出し部分とデータ部分とを判別し
て、見出しの文字認識を行うため、自動的にデータ部分
の文字属性を決定できる。しかも、見出し部分は、汎用
性があり、文字種類も限られているため、容易に見出し
部分の文字認識ができる。更に、データ部分は、決定さ
れた文字属性に応じて、文字認識するため、文字認識の
精度が向上する。
【0019】
【発明の実施の形態】図1は、本発明の一実施の形態の
文字認識装置の構成図、図2は、本発明の一実施の形態
の全体処理フロー図である。
【0020】図1に示すように、スキャナー1は、帳票
を光学的に読み取る。キーボード2は、オペレータが各
種の入力を行うためのものである。ディスプレイ3は、
認識結果等を表示する。プロセッサ(CPU)4は、文
字認識を行う。記憶ユニット5は、CPU4の処理に必
要なデータ等を格納するものである。
【0021】記憶ユニット5は、見出し文言辞書50
と、カテゴリー/フォント別辞書51〜5nを格納す
る。見出し文言辞書50は、予め定められた見出し文言
とそのイメージデータを格納する。カテゴリー/フォン
ト別辞書51〜5nは、データ部分の文字認識のため、
文字認識カテゴリー/文字フォント別の辞書を格納す
る。
【0022】CPU4は、文字列を抽出する文字列抽出
部40と、文字列の並びから見出し部分を判別する見出
し判別部41と、見出し部分の文字認識を行う見出し認
識部42と、データ部分の文字認識を行うデータ認識部
43とを有する。尚、後述するように、これら各部は、
CPU4が行う処理をブロックで表現したものである。
【0023】図2に従い、文字認識処理を説明する。
【0024】(S1)CPU4は、帳票のイメージデー
タから文字列を抽出する。
【0025】(S2)CPU4は、行方向に同一の並び
の文字列を抽出して、論理行構成部を抽出する。
【0026】(S3)CPU4は、同じ行構造を持つ論
理行を抽出して、表構成部を抽出する。
【0027】(S4)CPU4は、同じ列構造を持つ論
理列を抽出する。
【0028】(S5)CPU4は、表構造部を構成する
ブロックを統合して、各論理列間のリンクを設定する。
各ブロックに、所定のルールでブロック属性を付与す
る。
【0029】(S6)CPU4は、ブロック属性から見
出し部分を抽出する。
【0030】(S7)CPU4は、見出し辞書50を用
いて、見出し部分を文字認識して、データ部分の文字の
属性(データ名、位置、文字カテゴリー、文字フォン
ト)を決定する。
【0031】(S8)CPU4は、データ部分の属性に
従い、カテゴリー/フォント別辞書51〜5nを選択し
て、データ部分の文字認識を行う。
【0032】以下、図3乃至図30を用いて、各処理を
説明する。尚、図31に示した振込依頼書を帳票の例と
して使用する。
【0033】図3は、図2の文字列抽出処理の説明図、
図4は、図2の論理行抽出処理の説明図、図5は、論理
行抽出処理のフロー図、図6は、図5の抽出処理の動作
説明図、図7は、他の論理行抽出処理のフロー図、図8
は、別の論理行抽出処理の説明図、図9は、各処理に使
用されるテーブルの説明図である。
【0034】先ず、文字列抽出処理について、図3及び
図9により説明する。
【0035】図3に示すように、帳票のイメージデータ
を走査して、黒画素が連続する部分をラベルとして抽出
する。図では、文字「1」、「2」、「3」、「4」の
4つのラベルが抽出される。抽出したラベルの内、しき
い値以内の距離にあるラベルを、同じ文字列を構成する
ラベルとして抽出する。図3では、文字「1」と文字
「2」とが、同一の文字列を構成する。文字「3」と文
字「4」とが、同一の文字列を構成する。そして、図の
四角で囲まれた部分が、文字列部分として、抽出され
る。
【0036】図9に示すように、抽出された文字列は、
文字列テーブルT1で示される。文字列テーブルT1
は、文字列データ番号と、開始座標(X、Y)、終了座
標(X、Y)、入れ子情報、論理行リンク先アドレス、
論理列リンク先アドレスとで構成される。
【0037】図31の例では、29の文字列が抽出され
る。そして、文字列テーブルT1に、各文字列のデータ
番号と開始座標と終了座標が格納される。
【0038】次に、論理行抽出処理について、図4乃至
図9により説明する。
【0039】論理行抽出処理は、各文字列の位置関係を
判定して、横方向に並ぶ項目データ(文字列)を論理行
を構成するグループとして抽出する処理である。図31
の例では、図4に示すように、7つの論理行L1〜L7
が抽出される。
【0040】この処理を、図5、図6、図9で説明す
る。
【0041】(S10)文字列テーブルT1から、隣り
合う2つの文字列を抽出する。
【0042】(S11)文字列テーブルT1の全文字列
を参照したかを判定する。全文字列を参照した場合に
は、処理を終了する。
【0043】(S12)全文字列を参照していない場合
には、Y座標の許容値YAを算出する。これは、帳票が
斜行して、読み取られた場合を想定している。
【0044】(S13)比較する2つの文字列の開始Y
座標の差ΔYを算出する。そして、その差が許容値以内
かを判定する。
【0045】(S14)その差が許容値以内なら、ステ
ップS15に進む。その差が許容値を越えていれば、ス
テップS16に進む。
【0046】図6に示すように、文字列が水平に並んで
いても、帳票の斜行のために、それぞれの文字列全体が
斜行している。このため、この斜行を考慮して、文字列
が水平に並んでいるかを判定する。
【0047】例えば、図6に示す様に、最大斜度θを5
度とした場合に、tanθ=0.087である。最大斜
度の範囲内で、同じY座標を持つと判断できるY座標の
範囲(許容値)YAは、文字列間の開始X座標の差ΔX
を用いて、下記のように、算出できる。
【0048】YA=ΔX×0.087 図6の例では、ΔXは、(X2ーX1)であるから、
「100」である。従って、許容値YAは、8.7とな
る。この結果から、開始X座標がX1、X2である2つ
の文字列は、Y座標の差ΔYが、8ドット以内ならば、
同じ論理行を構成する文字列と判断できる。逆に、Y座
標の差ΔYが8ドットを越えるならば、同じ論理行を構
成しない文字列と判断する。
【0049】(S15)2つの文字列が同一の論理行を
構成すると判断した場合には、両文字列をリンクする論
理行テーブルを作成する。図9に示すように、論理行テ
ーブルT2は、論理行番号と開始座標(X、Y)と終了
座標(X、Y)と文字列数と先頭文字列アドレスとで構
成される。
【0050】例えば、図31及び図4の例では、論理行
L2には、文字列C2と文字列C3を含む開始座標、終
了座標が設定され、文字列数は「2」が設定され、先頭
アドレスとして、文字列2のアドレスが設定される。そ
して、文字列テーブルT1の文字列2の論理行リンク先
アドレスに、文字列3のアドレスが設定される。
【0051】同様に、論理行L7には、文字列C28と
文字列C29を含む開始座標、終了座標が設定され、文
字列数は「2」が設定され、先頭アドレスとして、文字
列28のアドレスが設定される。
【0052】そして、ステップS10に戻る。
【0053】(S16)2つの文字列が同一の論理行を
構成しないと判断した場合には、両文字列をリンクしな
い論理行テーブルを作成する。例えば、図31及び図4
の例では、論理行L1には、文字列C1の開始座標、終
了座標が設定され、文字列数は「1」が設定され、先頭
アドレスとして、文字列1のアドレスが設定される。そ
して、ステップS10に戻る。
【0054】このようにして、図4に示すように、各文
字列を論理行に分類して、論理行テーブルT2を作成す
る。
【0055】図7は、他の論理行抽出処理のフロー図で
ある。
【0056】(S20)帳票全体の傾きを、イメージデ
ータから計算する。例えば、帳票の外接矩形をイメージ
データから求める。そして、外接矩形の傾きを計算す
る。
【0057】(S21)求めた傾きを補正するように、
帳票のイメージデータを回転する。そして、前述の文字
列抽出処理を行う。
【0058】(S22)文字列テーブルT1から、隣り
合う2つの文字列を抽出する。
【0059】(S23)文字列テーブルT1の全文字列
を参照したかを判定する。全文字列を参照した場合に
は、処理を終了する。
【0060】(S24)全文字列を参照していない場合
には、比較する2つの文字列の開始Y座標の差ΔYを算
出する。そして、その差が誤差範囲以内かを判定する。
その差が誤差範囲以内なら、両文字列は、同一の論理行
を構成すると判断して、ステップS25に進む。その差
が誤差範囲を越えていれば、両文字列は、同一の論理行
を構成しないと判断して、ステップS26に進む。
【0061】(S25)2つの文字列が同一の論理行を
構成すると判断した場合には、両文字列をリンクする論
理行テーブルを作成する。そして、ステップS22に戻
る。
【0062】(S26)2つの文字列が同一の論理行を
構成しないと判断した場合には、両文字列をリンクしな
い論理行テーブルを作成する。そして、ステップS22
に戻る。
【0063】このように、帳票全体の傾きを検出して、
傾きを補正する。その後、論理行の抽出処理を行う。
【0064】図8は、別の論理行抽出処理の説明図であ
る。
【0065】図8に示すように、イメージデータのビッ
トマップを、水平方向に投影する。そして、水平方向の
ビット列毎に、黒画素をカウントする。このようにする
と、水平投影されたビット列の黒画素数は、図8のグラ
フのように、文字列の存在する部分で、山を形成する。
【0066】そこで、ビット列の山が存在する位置(Y
座標)に、論理行が存在すると判定する。そして、論理
行が存在する位置(Y座標)を有する文字列を、1ツの
論理行を構成する文字列として抽出する。このようにし
ても、論理行を構成する文字列を抽出することができ
る。
【0067】次に、表構成部の抽出処理について、図1
0乃至図14を用いて説明する。
【0068】図10は、表構造部抽出処理の説明図、図
11は、表構造部抽出処理の動作説明図、図12は、表
構造部抽出処理のフロー図、図13は、ブロックテーブ
ルの説明図、図14は、他の表構造部抽出処理の説明図
である。
【0069】表構造部の抽出処理は、上下に隣り合う論
理行が、同じ行構造を持つか判定する。図11に示すよ
うに、上下に隣り合う論理行の間で、左側に位置する文
字列から順に参照する。そして、両文字列の開始X座標
又は終了X座標が、一致するかを判定する。即ち、両文
字列の開始X座標又は終了X座標の差が、誤差範囲にあ
るかを判定する。そして、2つの論理行の全ての文字列
の開始X座標又は終了X座標が一致する場合に、同じ行
構造を持つと判断する。そして、同じ行構造を持つ論理
行をブロックに纏める。
【0070】図11では、上下に隣り合う論理行L4、
L5の間で、論理行L4の文字列C10、C11、C1
2、C13、C14の開始X座標が、論理行L5の文字
列C16、C17、C18、C19、C20の開始X座
標と一致し、且つ論理行L4の文字列C15の終了X座
標が、論理行L5の文字列C21の終了X座標と一致す
る。従って、2つ論理行L4、L5は、同じ行構造を持
つため、1つのブロックに分類される。
【0071】同様に、論理行L6も、論理行L5と同一
の行構造を持つため、1つのブロックに分類される。こ
のようにして、図31の例では、図10に示すように、
論理行L4、L5、L6が、1つのブロックB4に分類
される。他の各論理行は、各々1つブロックを構成す
る。
【0072】図12により、詳細に説明する。
【0073】(S30)論理行テーブルT2から上下に
隣り合う2つの論理行を抽出する。
【0074】(S31)全論理行を参照したかを調べ
る。全論理行を参照した場合には、処理を終了する。
【0075】(S32)全論理行を参照していない場合
には、各論理行を構成する文字列を左側から抽出する。
そして、各論理行間の2つ文字列の開始X座標又は終了
X座標のいずれかが一致するかを判定する。2つの論理
行間において、全文字列が一致するか判定する。
【0076】(S33)2つ論理行間において、全文字
列が一致する場合には、2つの論理行をリンクするブロ
ックテーブルT3を作成する。そして、ステップS30
に戻る。
【0077】図13に示すように、ブロックテーブルT
3は、ブロック番号、開始座標、終了座標、文字列数、
論理行数、論理列数、先頭論理行アドレス、先頭論理列
アドレス、属性を有する。
【0078】図10に示した例で説明すると、ブロック
番号4のブロックB4は、3つの論理行L4〜L6をリ
ンクするため、開始座標は、3つの論理行の先頭座標に
設定され、終了座標は、3つの論理行の終了座標に設定
される。又、文字列数は、「18」に設定され、論理行
数は、「3」に設定される。先頭論理行アドレスは、論
理行4のアドレスに設定される。
【0079】(S34)2つ論理行間において、文字列
のいずれかが一致しない場合には、2つの論理行をリン
クしないブロックテーブルT3を作成する。そして、ス
テップS30に戻る。
【0080】図10に示した例で説明すると、ブロック
番号3のブロックB3は、1つの論理行L3で構成され
ているため、開始座標は、1つの論理行L3の先頭座標
に設定され、終了座標は、1つの論理行L3の終了座標
に設定される。又、文字列数は、論理行L3の文字列数
である「5」に設定され、論理行数は、「1」に設定さ
れる。先頭論理行アドレスは、論理行3のアドレスに設
定される。
【0081】このようにして、図10の例では、図13
のようなブロックテーブルが作成される。そして、後述
するように、最も論理行数の多いブロックと、その上側
のブロックと、その下側のブロックとを、表構造部とし
て抽出する。
【0082】図14は、他の表構造部抽出処理の説明図
である。
【0083】この実施の形態では、図14に示すよう
に、イメージデータのビットマップを、水平方向に投影
する。そして、水平方向のビット列毎に、黒画素をカウ
ントする。このようにすると、水平投影されたビット列
の黒画素数は、図14のグラフのように、論理行の存在
する部分で、山を形成する。
【0084】そして、表構造を構成する部分は、行の構
造が等間隔で規則的な並びを持つ。そこで、等間隔で同
じ黒画素数を持つ部分Bを、表構造を構成する部分とし
て判断する。この部分を構成している論理行を抽出す
る。このようにしても、表構造部を構成する論理行を抽
出することができる。
【0085】次に、論理列抽出処理について、図15乃
至図18をもちいて説明する。
【0086】図15は、論理列抽出処理の説明図、図1
6は、論理列抽出処理のフロー図、図17は、論理列テ
ーブルの説明図、図18は、更新された文字列テーブル
の説明図である。
【0087】論理列抽出処理は、ブロック単位に、同じ
構造の文字列を論理列として分類する。図15に示すよ
うに、上下に隣り合うブロックにおいて、文字列が、同
じ列構造を持つか判定する。上下に隣り合うブロックの
間で、左側に位置する文字列から順に参照する。そし
て、両文字列の開始X座標又は終了X座標が、一致する
かを判定する。即ち、両文字列の開始X座標又は終了X
座標の差が、誤差範囲にあるかを判定する。そして、2
ツの文字列の開始X座標又は終了X座標が一致する場合
に、同じ列構造を持つと判断する。そして、同じ列構造
を持つ文字列を論理列に纏める。
【0088】図15では、ブロックB4内において、論
理行L4の文字列C10、C11、C12、C13、C
14の開始X座標が、論理行L5の文字列C16、C1
7、C18、C19、C20の開始X座標と一致する。
論理行L4の文字列C15の終了X座標が、論理行L5
の文字列C21の終了X座標と一致する。
【0089】同様に、論理行L5の文字列C16、C1
7、C18、C19、C20の開始X座標が、論理行L
6の文字列C22、C23、C24、C25、C26の
開始X座標と一致する。論理行L5の文字列C21の終
了X座標が、論理行L6の文字列C27の終了X座標と
一致する。
【0090】従って、ブロックB4の文字列C10〜C
27は、6ツの論理列R10〜R15に分類される。
【0091】図16により、詳細に説明する。
【0092】(S40)ブロックテーブルT3から各ブ
ロック情報を抽出する。
【0093】(S41)全ブロックを参照したかを調べ
る。全ブロックを参照した場合には、処理を終了する。
【0094】(S42)全ブロックを参照していない場
合には、抽出したブロックの論理行数が「1」であるか
を調べる。
【0095】(S43)抽出したブロック内の各文字列
の開始X座標又は終了X座標が一致するかを判定する。
そして、一致する場合には、論理列テーブルT4を、一
致内容に従い、作成する。そして、ステップS40に戻
る。
【0096】図17に示すように、論理列テーブルT4
は、論理列番号、開始座標、終了座標、文字列数、先頭
文字列アドレスを有する。
【0097】図15に示した例で説明すると、全部で1
7の論理列が設定される。そしてブロックB4の論理列
R10は、3つの文字列C10、C16、C22を纏め
るため、開始座標は、3つの論理列の先頭座標に設定さ
れ、終了座標は、3つの論理列の終了座標に設定され
る。又、文字列数は、「3」に設定され、先頭論理列ア
ドレスは、文字列10のアドレスに設定される。そし
て、図18に示すように、文字列テーブルT1の文字列
C10の論理列リンク先アドレス欄に、文字列16のア
ドレスが設定される。論理列R11においても、同様に
設定される。
【0098】(S44)論理行数が1ツの場合、1つの
文字列の論理列テーブルT4を作成する。そして、ステ
ップS40に戻る。
【0099】図15に示した例で説明すると、論理列番
号3の論理列R3は、1つの文字列C3で構成されてい
るため、開始座標は、1つの文字列C3の先頭座標に設
定され、終了座標は、1つの文字列C3の終了座標に設
定される。又、文字列数は、「1」に設定され、先頭文
字列アドレスは、文字列3のアドレスに設定される。
【0100】このようにして、図15の例では、図17
のような論理列テーブルT4が作成される。
【0101】次に、ブロック統合及び属性付与処理につ
いて、図19乃至図24を用いて説明する。
【0102】図19は、ブロック統合処理の説明図、図
20は、入れ子処理の説明図、図21は、更新された文
字列テーブルの説明図、図22は、更新された論理列テ
ーブルの説明図、図23は、ブロック統合及び属性付与
処理のフロー図、図24は、グループテーブルの説明図
である。
【0103】ブロック統合処理は、論理列間のリンクを
設定するため行われる。ブロック統合処理は、表構造部
として抽出した部分について、最も論理行数の多いブロ
ックと、その上側に位置するブロックとが、同じ論理列
構造を持つかを判定する。同じ論理列構造を持つ場合に
は、2つのブロックを纏めて、1つの論理列構造となる
ように、論理列を再作成する。
【0104】図19に示すように、最も論理行数の多い
ブロックB4と、その上側のブロックB3とが、同じ論
理列構造をもつか判定する。D部分において、ブロック
B4の4ツの論理列R12〜R15と、ブロックB3の
4ツの論理列R6〜R9は、同じX位置を持つ。従っ
て、D部分は、同じ論理列構造を持つと判断される。C
部分では、ブロックB3が、1つの論理列R5を持つの
に対し、ブロックB4が、2つの論理列R10、R11
を持つ。このため、列構造が異なる。
【0105】しかし、D部分の列構造が同じであるた
め、ブロックB3とブロックB4とは、同一の論理列構
造を持つと判断する。そして、ブロックB3の論理列と
ブロックB4の論理列とを統合する。即ち、論理列R1
0、R11は、論理列R5と統合され、論理列R12
は、論理列R6と統合され、論理列R13は、論理列R
7と統合され、論理列R14は、論理列R8と統合さ
れ、論理列R15は、論理列R9に統合される。これに
より、両ブロックの論理列のリンク関係が設定される。
【0106】図22に示すように、論理列テーブルT4
は、この統合に従い、更新される。例えば、論理列R5
(論理列番号5)の終了座標は、論理列R11の終了座
標に更新され、論理列R5の文字列数は、論理列R1
0、R11の文字列を含むように、「7」に更新され
る。論理列R10、R11は、統合されたため、論理列
R10,R11の文字列数は、「0」に更新される。
【0107】又、文字列のリンク関係が、この統合に従
い、設定される。図21の文字列テーブルT1におい
て、文字列C5の論理列リンク先アドレスは、文字列1
0のアドレスに設定される。
【0108】ここで、複数の文字列で、1つの意味のデ
ータを定義するため、入れ子情報を設定する。図19の
場合には、図20に示すように、文字列C5は、文字列
C10と文字列C11に対し意味を持つ。従って、2つ
の文字列C10、C11間に入れ子情報を設定する。こ
れにより、2つの文字列が、1列を構成することを示
す。
【0109】図21では、文字列C10とC11を同一
の列と見なすため、両文字列C10、C11に、入れ子
フラグ(ON)を設定し、且つ枝番を付与する。これに
より、2つの文字列がペアとなっていることを示す。
又、文字列C10とC11を同一の列とするため、文字
列C10の論理列リンク先アドレスに、文字列C11の
アドレスを設定する。同様に、文字列C11の論理列リ
ンク先アドレスに、文字列C16のアドレスを設定す
る。
【0110】次に、抽出した表構造部を構成する各ブロ
ックに属性を設定する。帳票上で最も多くの論理行を持
つブロックを、ボディブロック属性に設定する。ボディ
ブロックの上に位置するブロックを、ヘッダブロック属
性に設定する。ボディブロックの下に位置するブロック
を、フッタブロック属性に設定する。
【0111】図23のフローに従い、説明する。
【0112】(S50)ブロックテーブルT3を参照し
て、論理行数の最も多いブロックを抽出する。そして、
そのブロックに、ボディブロック属性(=2)を設定す
る。図13に示すように、ブロックB4に、ボディブロ
ック属性(=2)を設定する。
【0113】(S51)図19で説明したように、ボデ
ィブロックと、その上のブロックとを参照し、同じ論理
列構造を持つかを判定する。同じ列構造の場合には、上
のブロックにヘッダブロック属性(=1)を設定する。
図13に示すように、ブロックB3に、ヘッダブロック
属性(=1)を設定する。そして、両ブロックの論理列
間の統合を行う。
【0114】(S52)ボディブロックの下に位置する
ブロックに、フッタブロック属性(=3)を設定する。
図13に示すように、ブロックB5に、フッタブロック
属性(=3)を設定する。
【0115】(S53)ヘッダブロック、ボディブロッ
ク、フッタブロックをグループに纏める。図24に示す
ように、グループテーブルT5を作成する。グループテ
ーブルT5に、グループ番号、開始座標、終了座標、ブ
ロック数、先頭ブロックアドレスが設定される。図24
に示すように、図13の例では、グループ番号3に、ブ
ロック数が「3」に設定され、先頭ブロックアドレス
が、ブロック3のアドレスに設定される。
【0116】(S54)それ以外のブロックに、グルー
プ情報を設定する。図24に示すように、図13の例で
は、グループ番号1に、ブロック数が「1」に設定さ
れ、先頭ブロックアドレスが、ブロック1のアドレスに
設定される。グループ番号2に、ブロック数が「1」に
設定され、先頭ブロックアドレスが、ブロック2のアド
レスに設定される。そして、終了する。
【0117】このようにして、ブロックの論理列を統合
し、ブロックに属性を付与する。
【0118】次に、見出し部分の抽出処理を、図25及
び図26により説明する。
【0119】図25は、見出し部分の抽出処理の説明
図、図26は、更新される文字列テーブルの説明図であ
る。
【0120】見出し部分の抽出処理は、文字列の見出し
として可能性のある部分を抽出する。見出し部分は、前
の処理で設定したブロック属性を利用して、以下のルー
ルで抽出する。
【0121】(A)ヘッダブロックは、見出しの可能性
がある。
【0122】(B)フッタブロックは、最も右に位置す
る文字列を除き、見出しの可能性がある。
【0123】(C)それ以外のブロックは、全て見出し
の可能性がある。
【0124】図25に示すように、図31の帳票例で
は、点線で囲んだ文字列C1〜C9、C28が、見出し
の可能性のある部分として抽出される。そして、図26
に示すように、文字列テーブルT1において、見出しの
可能性のある文字列C1〜C9、C28に、見出しフラ
グ「1」が設定される。
【0125】このようにして、文字列は、見出しとデー
タとに区別される。
【0126】次に、見出し認識処理を、図27乃至図2
9により説明する。
【0127】図27は、見出し認識処理のフロー図、図
28は、見出し認識辞書の説明図、図29は、見出し認
識処理の説明図である。
【0128】図27の処理フローに従い説明する。
【0129】(S60)文字列テーブルT1から文字列
を抽出する。全文字列を参照したかを調べる。全文字列
を参照した場合には、終了する。
【0130】(S61)全文字列を参照していない場合
には、その文字列の見出しフラグがオン(「1])かを
調べる。見出しフラグがオンでないと、ステップS60
に戻る。見出しフラグがオンであると、その文字列を見
出し辞書50を用いて文字認識する。見出し辞書50ー
1は、図28に示すように、予め定められた文言のイメ
ージデータと、その見出し識別コードとを有する。例え
ば、識別コード「振込先」に対し、振込先の漢字のイメ
ージデータを格納する。見出し部分の文字列のイメージ
データは、見出し辞書50ー1と照合され、見出し認識
が行われる。
【0131】(S62)見出し辞書50ー1に、一致す
る見出しを見つけると、その見出し識別コードを得る。
そして、図28に示す見出し識別テーブル50ー2を用
いて、データ部分の文字の定義(カテゴリー、フォント
名)を得る。見出し識別テーブル50ー2は、各見出し
識別コードに対応した文字認識カテゴリー、文字フォン
ト名を格納する。これにより、見出し部分の識別コード
(機能名)、文字認識カテゴリー(漢字、数字、英
字)、文字フォント名(活字、手書き文字)が判る。
【0132】そして、その見出しに対応するデータの文
字列は、文字列テーブルT1のその見出しの文字列の論
理列リンク先アドレスにより判る。従って、図29に示
すように、論理列リンク先アドレスの示す文字列の機能
名、認識カテゴリー、フォント名欄に、認識により得た
機能名、認識カテゴリー、フォントを設定する。そし
て、ステップS60に戻る。
【0133】(S63)見出し部分と判定され、見出し
辞書50ー1に一致した見出しパターンが無い文字列
は、データ部分である。このため、予め定めた認識カテ
ゴリー、フォントを、文字列テーブルT1に設定する。
そして、ステップS60に戻る。
【0134】図29では、見出し文字列C5の論理列リ
ンク先は、文字列C10であるため、文字列C10に、
文字列C5の認識結果である機能名、認識カテゴリー、
フォントが設定される。又、文字列C2は、見出しと判
定されたが、見出し辞書に一致するパターンがないた
め、データ部と判定される。そして、予め定めた認識カ
テゴリー(漢字)、フォント(活字)が、文字列テーブ
ルT1に設定される。
【0135】このようにして、見出し辞書を用いて、見
出し認識を行う。そして、対応するデータ部の文字属性
を得る。
【0136】図30は、データ認識処理のフロー図であ
る。
【0137】(S70)文字列テーブルT1から文字列
を抽出する。全文字列を参照したかを調べる。全文字列
を参照した場合には、終了する。
【0138】(S71)全文字列を参照していない場合
には、その文字列の見出しフラグがオン(「1])かを
調べる。見出し部分は、見出しフラグがオンである。見
出しフラグがオンであることは、データでないことを示
す。従って、見出しフラグがオンの場合には、ステップ
S60に戻る。
【0139】(S72)見出しフラグがオンでないと、
その文字列は、データ部分である。従って、その文字列
の認識カテゴリー、フォント名を文字列テーブルT1か
ら抽出する。そして、その認識カテゴリー、フォント名
に従い、辞書51〜5n(図1参照)を選択して、その
文字列を文字認識する。そして、ステップS70に戻
る。
【0140】このようにして、データ部分を見出しの内
容に対応した最適の文字認識方式を用いて文字認識する
ことが出来る。このため、高い精度の文字認識が可能と
なる。又、文字列の並びから見出し部分とデータ部分と
を自動判別しているため、データ部分の属性を自動認識
できる。
【0141】上述の実施の形態では、各帳票毎に、文字
の位置関係から、見出し部分とデータ部分を判別してい
るが、判別した結果を登録しておき、次回からは、この
判別結果を使用して、帳票のデータ部分を文字認識して
も良い。
【0142】以上、本発明の実施の形態により説明した
が、本発明の主旨の範囲内で種々の変形が可能であり、
これらを本発明の範囲から排除するものではない。
【0143】
【発明の効果】以上説明したように、本発明によれば、
次の効果を奏する。
【0144】(1)帳票のイメージデータを走査し、黒
画素が連続する部分をラベルとして抽出し、抽出したラ
ベル間の位置関係から各文字列を抽出して、抽出した文
字列の行及び列方向の位置関係から罫線を有しない帳票
の見出し部分を判別して、見出しの認識を行うため、罫
線を有しない帳票でも、自動的にデータ部分の文字属性
を決定できる。又、罫線を有しない帳票から文字列の位
置関係から、論理行及び論理列を構成する単位に分類す
るため、文字列の抽出結果としての文字列自体の開始、
終了座標を使用しているため、文字列自体から論理行及
び論理列、ブロックの分類という複雑な表構造解析が可
能となる。
【0145】(2) しかも、見出し部分は、汎用性があ
り、文字種類も限られているため、容易に見出し部分の
文字認識ができる。
【0146】(3) 更に、データ部分は、決定された文字
属性に応じて、文字認識するため、文字認識の精度が向
上する。
【図面の簡単な説明】
【図1】本発明の一実施の形態の構成図である。
【図2】本発明の一実施の形態の処理フロー図である。
【図3】図2の文字列抽出処理の説明図である。
【図4】図2の論理行抽出処理の説明図である。
【図5】図4の論理行抽出処理のフロー図である。
【図6】図5の論理行抽出処理の動作説明図である。
【図7】図2の他の論理行抽出処理のフロー図である。
【図8】図2の別の論理行抽出処理のフロー図である。
【図9】図3の処理のテーブルの説明図である。
【図10】図2の表構造部抽出処理の説明図である。
【図11】図10の表構造部抽出処理の動作説明図であ
る。
【図12】図10の表構造部抽出処理のフロー図であ
る。
【図13】図12の処理のためのブロックテーブルの説
明図である。
【図14】図2の他の表構造部抽出処理の説明図であ
る。
【図15】図2の論理列抽出処理の説明図である。
【図16】図15の論理列抽出処理のフロー図である。
【図17】図16の処理のための論理列テーブルの説明
図である。
【図18】図16の処理のための文字列テーブルの説明
図である。
【図19】図2のブロック統合処理の説明図である。
【図20】図2の入れ子処理の説明図である。
【図21】図19の処理のための文字列テーブルの説明
図である。
【図22】図19の処理のための論理列テーブルの説明
図である。
【図23】図2のブロック統合及び属性付与処理のフロ
ー図である。
【図24】図23の処理のためのグループテーブルの説
明図である。
【図25】図2の見出し部分の抽出処理の説明図であ
る。
【図26】図25の処理のための文字列テーブルの説明
図である。
【図27】図2の見出し認識処理のフロー図である。
【図28】図2の処理のための見出し認識辞書の説明図
である。
【図29】図27の見出し認識処理の説明図である。
【図30】図2のデータ認識処理のフロー図である。
【図31】従来技術を説明するための帳票の説明図であ
る。
【図32】従来技術の説明図である。
【符号の説明】
1 スキャナー 4 プロセッサ 5 記憶ユニット 50 見出し辞書 51〜5n カテゴリー・フォント別辞書 C1〜C29 文字列 L1〜L7 論理行 B1〜B5 ブロック R1〜R17 論理列
───────────────────────────────────────────────────── フロントページの続き (72)発明者 永野 義博 神奈川県川崎市中原区上小田中4丁目1 番1号 富士通株式会社内 (72)発明者 松野 秀樹 神奈川県川崎市中原区上小田中4丁目1 番1号 富士通株式会社内 (72)発明者 千葉 亘一 神奈川県川崎市中原区上小田中4丁目1 番1号 富士通株式会社内 (72)発明者 勝又 裕 神奈川県川崎市中原区上小田中4丁目1 番1号 富士通株式会社内 (56)参考文献 特開 平7−152859(JP,A) 特開 平4−23185(JP,A) 特開 平5−67189(JP,A) 特開 平8−55184(JP,A) 特開 平8−30718(JP,A) 特開 平8−221510(JP,A) 特開 平8−315069(JP,A) 特開 平9−62859(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】見出し部分の文字とデータ部分の文字とを
    有する罫線を有しない帳票の文字を認識する文字認識方
    法において、 前記帳票のイメージデータを走査し、黒画素が連続する
    部分をラベルとして抽出し、抽出したラベル間の位置関
    係から各文字列を抽出するステップと、 前記抽出した文字列の行及び列方向の位置関係から前記
    罫線を有しない帳票の見出し部分とデータ部分とを判別
    するステップと、 前記見出し部分の文字列を見出し辞書を用いて認識し
    て、前記データ部分の文字属性を決定するステップと、 前記文字属性に従い、前記データ部分の文字列を認識す
    るステップとを有し、 前記判別するステップは、 前記文字列の抽出により得た前記文字列の開始座標の比
    較による位置関係から同一の論理行を構成する文字列を
    抽出するステップと、 前記文字列の開始又は終了座標から、前記文字列の並び
    が同じ論理行をブロックとして抽出するステップと、 前記各ブロックにおいて、前記文字列の開始又は終了座
    標から、同じ列を構成する文字列を論理列として抽出す
    るステップと、 前記論理列の位置関係から前記論理列間の対応関係を決
    定するステップと、 前記ブロックの位置関係から前記論理列の見出し部分を
    決定するステップとを有する ことを 特徴とする文字認識方法。
  2. 【請求項2】請求項の文字認識方法において、 前記ブロックを抽出するステップは、 前記文字列の並びが同じ論理行の数を抽出するステップ
    であり、 前記見出し部分を決定するステップは、 前記論理行数が最大であるブロックをデータ部分として
    決定し、そのブロックの上及び下に位置するブロックを
    見出し部分として決定するステップを含むことを特徴と
    する文字認識方法。
  3. 【請求項3】請求項の文字認識方法において、 前記ブロックを抽出するステップは、 上下に位置する前記論理行の位置関係から、2つの論理
    行が同一の行構造を有するかを判断して、ブロックにま
    とめるステップを含むことを特徴とする文字認識方法。
  4. 【請求項4】請求項の文字認識方法において、 前記論理列を抽出するステップは、 前記各ブロックの論理行を構成する文字列が上下に位置
    するかを判断して、論理列にまとめるステップを含むこ
    とを特徴とする文字認識方法。
  5. 【請求項5】請求項の文字認識方法において、 前記論理列を抽出するステップは、 前記論理行数が最も多いブロックと、そのブロックの上
    に位置する論理行を有するブロックが同じ列構造を持つ
    かを判定して、論理列にまとめるステップを含むことを
    特徴とする文字認識方法。
  6. 【請求項6】請求項の文字認識方法において、 前記論理列の対応関係を決定するステップは、 各論理列が上下に対応位置に位置するかを判断して、各
    論理列の対応関係を判定するステップを含むことを特徴
    とする文字認識方法。
JP33018297A 1997-12-01 1997-12-01 文字認識方法 Expired - Lifetime JP3525997B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP33018297A JP3525997B2 (ja) 1997-12-01 1997-12-01 文字認識方法
US09/084,356 US6549662B1 (en) 1997-12-01 1998-05-27 Method of recognizing characters

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33018297A JP3525997B2 (ja) 1997-12-01 1997-12-01 文字認識方法

Publications (2)

Publication Number Publication Date
JPH11161736A JPH11161736A (ja) 1999-06-18
JP3525997B2 true JP3525997B2 (ja) 2004-05-10

Family

ID=18229751

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33018297A Expired - Lifetime JP3525997B2 (ja) 1997-12-01 1997-12-01 文字認識方法

Country Status (2)

Country Link
US (1) US6549662B1 (ja)
JP (1) JP3525997B2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3975626B2 (ja) * 1999-11-11 2007-09-12 株式会社オーク製作所 レーザ描画装置
US7447987B2 (en) * 2004-05-21 2008-11-04 Sap Ag Method for automatically positioning a data string in a column on an electronic display
JP2006065477A (ja) * 2004-08-25 2006-03-09 Fuji Xerox Co Ltd 文字認識装置
JP2006178802A (ja) * 2004-12-24 2006-07-06 Hitachi Ltd 帳票定義自動作成方法
JP4646300B2 (ja) * 2005-04-28 2011-03-09 キヤノンマーケティングジャパン株式会社 繰り返し行決定装置、繰り返し行決定方法、プログラム及び記録媒体
JP5150344B2 (ja) * 2008-04-14 2013-02-20 株式会社東芝 機械翻訳装置および機械翻訳プログラム
JP4825243B2 (ja) * 2008-06-20 2011-11-30 富士通フロンテック株式会社 帳票認識装置、方法、データベース作成装置、方法、及びプログラム
US8131720B2 (en) * 2008-07-25 2012-03-06 Microsoft Corporation Using an ID domain to improve searching
JP5318742B2 (ja) * 2009-12-14 2013-10-16 富士通フロンテック株式会社 文字認識方法、文字認識装置および文字認識プログラム
JP5775839B2 (ja) * 2012-03-14 2015-09-09 株式会社日立製作所 表構造解析装置及び表構造解析方法
JP2013218424A (ja) * 2012-04-05 2013-10-24 Zero Four Co Ltd 翻訳装置および翻訳方法
JP6065467B2 (ja) * 2012-08-30 2017-01-25 コニカミノルタ株式会社 表計算ソフトのレイアウト保持装置
JP5701839B2 (ja) 2012-10-26 2015-04-15 株式会社東芝 電子機器および方法
US20140304579A1 (en) * 2013-03-15 2014-10-09 SnapDoc Understanding Interconnected Documents
JP6081298B2 (ja) * 2013-06-10 2017-02-15 富士通フロンテック株式会社 文字認識装置、文字認識方法、および文字認識プログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5504822A (en) * 1986-09-19 1996-04-02 Holt; Arthur W. Character recognition system
US5179650A (en) * 1988-01-21 1993-01-12 Kabushiki Kaisha Toshiba Method and apparatus for editing documents
US5136520A (en) * 1990-03-02 1992-08-04 Milliken Research Corporation System for assigning discrete time periods for dye applicators in a textile dyeing apparatus
DE69132130T2 (de) * 1990-05-15 2000-09-28 Canon K.K., Tokio/Tokyo Gerät und Verfahren zur Informationserkennung
AU656057B2 (en) * 1992-03-27 1995-01-19 Milliken & Company Method and apparatus for reproducing blended colorants on an electronic display
JP3302147B2 (ja) * 1993-05-12 2002-07-15 株式会社リコー 文書画像処理方法
DE69426714T2 (de) * 1993-06-30 2001-08-02 Canon K.K., Tokio/Tokyo Dokumentverarbeitungsverfahren und Gerät
JPH07182465A (ja) * 1993-12-22 1995-07-21 Hitachi Ltd 文字認識方法
IT1272259B (it) * 1994-05-30 1997-06-16 Texas Instruments Italia Spa Procedimento ed apparecchio per il riconoscimento dei caratteri
US6208744B1 (en) * 1994-12-14 2001-03-27 Casio Computer Co., Ltd. Document image processor and method for setting a document format conforming to a document image
JPH09134157A (ja) * 1995-11-09 1997-05-20 Fujitsu Ltd ヒント付け方法及びフォントファイル構成方法
US6201894B1 (en) * 1996-01-23 2001-03-13 Canon Kabushiki Kaisha Method and apparatus for extracting ruled lines or region surrounding ruled lines

Also Published As

Publication number Publication date
US6549662B1 (en) 2003-04-15
JPH11161736A (ja) 1999-06-18

Similar Documents

Publication Publication Date Title
US6687401B2 (en) Pattern recognizing apparatus and method
JP3345224B2 (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
JP3525997B2 (ja) 文字認識方法
Spitz Determination of the script and language content of document images
US7580571B2 (en) Method and apparatus for detecting an orientation of characters in a document image
JP3640972B2 (ja) ドキュメントの解読又は解釈を行う装置
US7181068B2 (en) Mathematical expression recognizing device, mathematical expression recognizing method, character recognizing device and character recognizing method
US7437001B2 (en) Method and device for recognition of a handwritten pattern
US20020141660A1 (en) Document scanner, system and method
JP4996940B2 (ja) 帳票認識装置およびそのプログラム
JP3294995B2 (ja) 帳票読取装置
JP2713622B2 (ja) 表形式文書読取装置
JP3452774B2 (ja) 文字認識方法
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JP4280355B2 (ja) 文字認識装置
JP2012141670A (ja) 帳票認識装置、方法およびプログラム
JP3215176B2 (ja) 文書画像処理装置及び文書画像処理方法
JP5041775B2 (ja) 文字切出方法及び文字認識装置
JP3463008B2 (ja) 媒体処理方法及び媒体処理装置
JP4046941B2 (ja) 文書書式識別装置および識別方法
Yamashita et al. A document recognition system and its applications
JP3223878B2 (ja) 文字列照合装置、方法及び記録媒体
JP3812719B2 (ja) 文書検索装置
JP2917427B2 (ja) 図面読取装置
JP3673616B2 (ja) 商品券識別方法及び装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030916

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20031208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040210

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080227

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090227

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090227

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100227

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110227

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110227

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120227

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130227

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130227

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140227

Year of fee payment: 10

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term