JP4213558B2 - 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置 - Google Patents

文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置 Download PDF

Info

Publication number
JP4213558B2
JP4213558B2 JP2003357941A JP2003357941A JP4213558B2 JP 4213558 B2 JP4213558 B2 JP 4213558B2 JP 2003357941 A JP2003357941 A JP 2003357941A JP 2003357941 A JP2003357941 A JP 2003357941A JP 4213558 B2 JP4213558 B2 JP 4213558B2
Authority
JP
Japan
Prior art keywords
character
characters
character string
document
circumscribed rectangle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003357941A
Other languages
English (en)
Other versions
JP2005122543A (ja
Inventor
浩明 武部
克仁 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2003357941A priority Critical patent/JP4213558B2/ja
Publication of JP2005122543A publication Critical patent/JP2005122543A/ja
Application granted granted Critical
Publication of JP4213558B2 publication Critical patent/JP4213558B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)

Description

この発明は、文書画像から文字列のレイアウトに係る情報を取得する文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置に関し、特に、電子文書の文書レイアウト構造を精度よく抽出できる文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置に関する。
近年、所定のファイル形式により記憶された帳票などの電子文書から、文字列や表などの文書要素のレイアウトを抽出するニーズが高まってきている。たとえば、上記帳票と同一の文書レイアウト構造を維持しつつファイル形式を変換するような場合に、文書レイアウトを抽出し、新しいファイル形式にしたがって電子文書を作成する必要が生じる。さらに、電子文書に対して新たな項目の挿入や削除、レイアウトを指定するタグのタグ付けなどの編集作業をおこなうためには、文書レイアウトの抽出は重要となってくる。
たとえば、特許文献1には、文書中に複数行にまたがる文字がある場合に、その文字を適切に切り出すことにより文書レイアウトを抽出することのできる文字認識装置が開示されている。この文字認識装置では、行切り出し処理により上下に隣り合う2行を切り出して、切り出された上下2行にまたがる外接矩形を有する文字を抽出し、その文字を単独で切り出す処理をおこなう。
特開平7−13994号公報
しかしながら、上記特許文献1に代表される従来技術では、本来複数行であるものを単一行として切り出してしまう切り出し誤りが発生した場合に、文書レイアウトの抽出を正しくおこなうことができないという問題があった。
具体的には、帳票などの文書では、一行が途中で複数行に分かれるような場合が多々あり、特に、それら複数行の行間が小さいような場合には、全体を一行として検出してしまうという問題があった。
この発明は、上述した従来技術による問題点を解消するためになされたものであり、電子文書の文書レイアウト構造を精度よく抽出できる文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置を提供することを目的とする。
上述した課題を解決し、目的を達成するため、本発明は、文書画像から文字列のレイアウトに係る情報を取得する文書レイアウト解析プログラムであって、前記文書画像の所定の領域の中にある各文字に対して、それぞれの文字の外接矩形の座標順に第1の番号を付与する第1の番号付与手順と、前記各文字に対して第2の番号を付与する第2の番号付与手順と、前記各文字を1乃至複数の文字列として認識する文字列認識手順とをコンピュータに実行させ、前記第2の番号付与手順は、前記第2の番号を付与が付与されていない文字であって、当該の文字の外接矩形を含み、かつ、前記領域の所定の角を1角とする外接矩形領域が、前記第2の番号を付与されていない他の文字を含まない文字のうち、前記第1の番号として最も小さい番号を付与されている文字から順に第2の番号を付与し、前記文字列認識手順は、付与されている前記第2の番号が小さい順に文字を連結していき、連結された全ての文字を含む外接矩形領域が、連結されていない他の文字の外接矩形と重複する場合に、前記連結された全ての文字から最後に連結された文字を除外した文字を文字列と認識することを特徴とする。
また、本発明は、前記文字列認識手順によって認識された文字列のレイアウトを補正するレイアウト補正手順をさらにコンピュータに実行させることを特徴とする。
また、本発明は、前記文字列検出手段は、電子文書を仮想的にプリントアウトすることにより各文字に係る情報を取得して、取得した文字に係る情報に基づいて該文書中の文字列を検出することを特徴とする。
また、本発明は、前記文字番号付与手順は、複数の文字の文字領域が重複している場合に、該文字領域の重複部分の重心を通る水平線または垂直線により分割されてできる複数の領域の組み合わせのうち、分割されてできた複数の領域の面積の総和が最大となる組み合わせを選択し、該組み合わせに対応する複数の領域を囲む各矩形を前記文字を囲む文字矩形にそれぞれ設定することを特徴とする。
また、本発明は、文書画像から文字列のレイアウトに係る情報を取得する文書レイアウト解析プログラムを記録したコンピュータ読み取り可能な記録媒体であって、前記文書画像の所定の領域の中にある各文字に対して、それぞれの文字の外接矩形の座標順に第1の番号を付与する第1の番号付与手順と、前記各文字に対して第2の番号を付与する第2の番号付与手順と、前記各文字を1乃至複数の文字列として認識する文字列認識手順とをコンピュータに実行させるための文書レイアウト解析プログラムを記録し、前記第2の番号付与手順は、前記第2の番号を付与が付与されていない文字であって、当該の文字の外接矩形を含み、かつ、前記領域の所定の角を1角とする外接矩形領域が、前記第2の番号を付与されていない他の文字を含まない文字のうち、前記第1の番号として最も小さい番号を付与されている文字から順に第2の番号を付与し、前記文字列認識手順は、付与されている前記第2の番号が小さい順に文字を連結していき、連結された全ての文字を含む外接矩形領域が、連結されていない他の文字の外接矩形と重複する場合に、前記連結された全ての文字から最後に連結された文字を除外した文字を文字列と認識することを特徴とする。
また、本発明は、文書画像から文字列のレイアウトに係る情報を取得する文書レイアウト解析方法であって、前記文書画像の所定の領域の中にある各文字に対して、それぞれの文字の外接矩形の座標順に第1の番号を付与する第1の番号付与工程と、前記各文字に対して第2の番号を付与する第2の番号付与工程と、前記各文字を1乃至複数の文字列として認識する文字列認識工程とを含み、前記第2の番号付与工程は、前記第2の番号を付与が付与されていない文字であって、当該の文字の外接矩形を含み、かつ、前記領域の所定の角を1角とする外接矩形領域が、前記第2の番号を付与されていない他の文字を含まない文字のうち、前記第1の番号として最も小さい番号を付与されている文字から順に第2の番号を付与し、前記文字列認識工程は、付与されている前記第2の番号が小さい順に文字を連結していき、連結された全ての文字を含む外接矩形領域が、連結されていない他の文字の外接矩形と重複する場合に、前記連結された全ての文字から最後に連結された文字を除外した文字を文字列と認識することを特徴とする。
また、本発明は、文書画像から文字列のレイアウトに係る情報を取得する文書レイアウト解析装置であって、前記文書画像の所定の領域の中にある各文字に対して、それぞれの文字の外接矩形の座標順に第1の番号を付与する第1の番号付与手段と、前記各文字に対して第2の番号を付与する第2の番号付与手段と、前記各文字を1乃至複数の文字列として認識する文字列認識手段とを備え、前記第2の番号付与手段は、前記第2の番号を付与が付与されていない文字であって、当該の文字の外接矩形を含み、かつ、前記領域の所定の角を1角とする外接矩形領域が、前記第2の番号を付与されていない他の文字を含まない文字のうち、前記第1の番号として最も小さい番号を付与されている文字から順に第2の番号を付与し、前記文字列認識手段は、付与されている前記第2の番号が小さい順に文字を連結していき、連結された全ての文字を含む外接矩形領域が、連結されていない他の文字の外接矩形と重複する場合に、前記連結された全ての文字から最後に連結された文字を除外した文字を文字列と認識することを特徴とする。
本発明によれば、文書画像中の各文字に係る情報を取得し、取得した各文字に係る情報に基づいて文書画像中の文字列を検出し、検出した文字列に対し文字列レイアウト解析をおこない、その文字列レイアウト解析の解析結果に基づき、文字列レイアウトを再設定することにより文字列レイアウトを補正することとしたので、電子文書の文書レイアウト構造を精度よく抽出できるという効果を奏する。
また、本発明によれば、文書画像中の各文字に係る情報を取得し、取得した各文字に係る情報に基づいて文書画像中の文字列を検出し、検出された文字列に含まれる文字を1つずつ選択し、その文字列を囲む文字列矩形の所定の角を一角とし、かつ、選択された文字を囲む文字矩形を含む第1の矩形検査領域内に、当該文字の番号よりも順序が後ろの番号の文字が含まれないように各文字に番号を付与し、付与された番号順に各文字を1つずつ追加して文字列を設定し、その文字列にすでに追加されている文字と新たに追加した文字とを含む第2の矩形検査領域内にその文字列にすでに追加されている文字および新たに追加した文字以外の文字が含まれた場合に、新たに追加した文字を除外するとともにすでに追加されている文字を連結して1つの文字列として再設定し、文字列のレイアウトを補正することとしたので、文書レイアウトの抽出を精度よく、かつ効率的におこなうことができるという効果を奏する。
また、本発明によれば、電子文書を仮想的にプリントアウトすることにより各文字に係る情報を取得して、取得した文字に係る情報に基づいて文書中の文字列を検出することとしたので、文字認識誤りに起因する誤読文字がなく、100%正しい文字の情報を取得できるとともに、電子文書を一旦紙に印刷してそれをスキャナで読み取ることにより各文字の座標情報を取得するなどの作業を省き、効率的に各文字の情報を取得することができるという効果を奏する。
また、本発明によれば、複数の文字の文字領域が重複している場合に、文字領域の重複部分の重心を通る水平線または垂直線により分割されてできる複数の領域の組み合わせのうち、分割されてできた複数の領域の面積の総和が最大となる組み合わせを選択し、その組み合わせに対応する複数の領域を囲む各矩形を文字を囲む文字矩形にそれぞれ設定することとしたので、たとえ複数の文字の文字領域が重複している場合でも、各文字の文字領域を適切に設定することができるという効果を奏する。
以下に添付図面を参照して、この発明に係る文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置の好適な実施の形態を詳細に説明する。
まず、本発明に係る文書レイアウト解析処理の概念について説明する。図1は、本発明に係る文書レイアウト解析処理の概念を説明する概念図である。図1に示すように、この文書レイアウト解析処理では、はじめに、従来の文字列レイアウト解析方法を用いて文字列レイアウト解析処理をおこない、1行として判定される文字列10を抽出する。ここで、文字列10は、1行の文字列が途中で2行に分かれているにもかかわらず、文字列の抽出誤りが発生し、全体が1行として抽出されている。
その後、本発明に係る文書レイアウト解析処理では、抽出された文字列10内の各文字に読み取り順序を設定する。その際、文字列10に含まれる文字を1つずつ選択し、その文字列10を囲む文字列矩形の原点11を一角とし、かつ、選択された文字を囲む文字矩形を含む矩形検査領域12内に、当該文字の番号よりも順序が後ろの番号の文字が含まれないように各文字に読み取り順序を付与する。図1の例では、番号「6」に対応する文字が選択された場合に、矩形検査領域12内に「6」より順序が後ろの番号の文字が含まれないように各文字の番号を設定している。
続いて、番号順に各文字を1つずつ追加して文字列を設定する。その際、すでに追加されている文字と新たに追加した文字とを囲む矩形検査領域13内に、文字列にすでに追加されている文字および新たに追加した文字以外の文字が含まれた場合に、新たに追加した文字を除外するとともにすでに追加されている文字を連結して1つの文字列14a〜14dとして再設定する。図1の例では、番号「1」から「5」が連結された文字列に番号「6」の文字が新たに追加された場合に、矩形検査領域13内に「1」〜「6」以外の番号の文字「9」が含まれるので、「6」の文字を除外して文字列「I」14aを設定している。
このようにして、各文字列14a〜14dを設定して文字列10の抽出誤りを補正し、正しい文字列のレイアウト15a〜15dを得ることにより、文書レイアウトの抽出を精度よく、かつ効率的におこなうことができる。
つぎに、本実施例に係る文書レイアウト解析装置の機能的構成について説明する。図2は、本実施例に係る文書レイアウト解析装置の機能的構成を示す機能ブロック図である。図2に示すように、この文書レイアウト解析装置は、入力部20、表示部21、記憶部22および制御部23を有する。
入力部20は、マウスやキーボードなどの入力デバイスであり、表示部21は、ディスプレイなどの表示デバイスである。記憶部22は、ハードディスク装置などの記憶デバイスであり、電子文書データ22a、文字データ22bおよびレイアウトデータ22cを記憶している。
電子文書データ22aは、文書レイアウトを復元する電子文書のデータや、復元された文書レイアウトに基づいて新たに作成された電子文書のデータを記憶したものである。文字データ22bは、後述の文字列検出部23aにより取得された文字の文字コードおよび座標位置のデータを記憶したものである。レイアウトデータ22cは、後述のレイアウト補正部23cにより抽出された文字列レイアウトのデータを記憶したものである。
制御部23は、文書レイアウト解析装置全体を制御する制御部であり、文字列検出部23a、文字番号付与部23b、レイアウト補正部23cおよび文書編集処理部23dを有する。
文字列検出部23aは、電子文書データ22aとして記憶部22に記憶された電子文書を仮想的にプリントアウトすることにより、電子文書中に含まれる文字の座標位置の情報を取得して、取得した文字の座標位置の情報に基づいて文書中の文字列を検出する検出部である。ここで、「仮想的にプリントアウトする」とは、電子文書を所定の形式のファイルに出力することを意味する。また、この文字列検出部23aは、後述の文書編集処理部23dによる電子文書の編集処理のために、電子文書を仮想的にプリントアウトすることにより、各文字の文字コードを取得する。
仮想的なプリントアウトは、電子文書中に含まれる文字の文字コードおよび座標位置の情報を取得することによりおこなわれるので、取得されたそれらの情報を利用する。さらに、文字列検出部23aは、検出した文字コードおよび文字の座標位置の情報を文字データ22bとして記憶部22に記憶する処理をおこなう。
文字番号付与部23bは、文字列検出部23aにより検出された文字列内の各文字に読み取り順序の番号を付与する付与部である。具体的には、文字番号付与部23bは、文字列10に含まれる文字を1つずつ選択し、その文字列10を囲む文字列矩形の原点11を一角とし、かつ、選択された文字を囲む文字矩形を含む矩形検査領域内12に、当該文字の番号よりも順序が後ろの番号の文字が含まれないように各文字に読み取り順序を付与する。この読み取り順序付与処理については、後に図7および図8を用いて詳しく説明する。
また、この文字番号付与部23bは、複数の文字の文字領域が重複している場合に、その重複を解消する処理をおこなう。具体的には、文字領域の重複部分の重心を通る水平線または垂直線により分割されてできる複数の領域の組み合わせを求め、その組み合わせのうち、分割されてできた複数の領域の面積の総和が最大となる組み合わせを選択し、その組み合わせに対応する複数の領域を囲む各矩形をそれぞれの文字を囲む外接矩形として設定する。
図3は、文字領域の重複解消化処理における文字の重複領域の分割方法を説明する説明図であり、図4は、図3に示した分割方法により分割された文字領域を説明する説明図である。図3の例では、ある文字の文字領域30と、別の文字の文字領域31とが重複している。このような場合、文字番号付与部23bは、文字領域30および31の重複部分32の重心33を求め、この重心33を通る水平線および垂直線を文字領域30および31を分割する分割線として設定する。
そして、図4に示されるように、図3に示した分割線により分割される4つの分割候補40〜43のうち、分割後の2つの領域の面積の和が最大となるもの(図4の例では、分割候補41がそれに該当する。)を選択し、選択された領域を囲む矩形を文字の新たな外接矩形として設定する処理をおこなう。ここでは、2つの文字領域30および31が重複している場合について説明したが、2つ以上の文字の文字領域が重複している場合でも同様の処理をおこなうことができる。
図2の説明に戻ると、レイアウト補正部23cは、文字番号付与部23bにより付与された番号順に各文字を1つずつ追加して文字列を設定し、文字列検出部23aにより検出された文字列レイアウトを補正する補正部である。
具体的には、レイアウト補正部23cは、すでに追加されている文字と新たに追加した文字とを囲む矩形検査領域13内に、文字列にすでに追加されている文字および新たに追加した文字以外の文字が含まれた場合に、新たに追加した文字を除外するとともにすでに追加されている文字を連結して1つの文字列14a〜14dとして生成する。この文字列生成処理については、後に図9および図10を用いて詳しく説明する。また、レイアウト補正部23cは、このようにして補正した文字列レイアウトの情報をレイアウトデータ22cとして記憶部22に記憶する処理をおこなう。
文書編集処理部23dは、レイアウト補正部23cにより補正された文字列レイアウトに基づいて、電子文書のファイル形式を変換したり、文字列レイアウトの情報が得られた電子文書に対する新たな項目の挿入や削除、レイアウトを指定するタグのタグ付けなどのユーザからの編集を受け付けたりして新たな電子文書を作成し、電子文書データ22aとして記憶部に記憶する編集処理部である。
つぎに、本実施例に係る文書レイアウト解析処理の処理手順について説明する。図5は、本実施例に係る文書レイアウト解析処理の処理手順を示すフローチャートである。図5に示すように、まず、文書レイアウト解析装置の文字列検出部23aは、電子文書を仮想的にプリントアウトすることにより、電子文書中の文字の文字コードおよび座標位置の文字情報を取得する(ステップS501)。そして、文字列検出部23aは、取得した文字の座標位置の情報を基にして、文字列レイアウトを解析し、文字列を検出する処理をおこなう(ステップS502)。
続いて、文字番号付与部23bおよびレイアウト補正部23cは、検出された文字列内の各文字に読み取り順序の番号を付与し、その読み取り順序に基づいて文字を連結し、文字列を生成することによりステップS502で検出した文字列レイアウトを補正する(ステップS503)。この文字列レイアウト補正処理については、後に図6〜図10で詳しく説明する。その後、文書編集処理部23dは、補正された文字列レイアウトに基づいて、電子文書のファイル形式の変換や編集などの電子文書の編集処理をおこなう(ステップS504)。
つぎに、図5に示した文字列レイアウト補正処理の処理手順について説明する。図6は、図5に示した文字列レイアウト補正処理の処理手順を示すフローチャートである。図6に示すように、まず、文字番号付与部23bは、各文字列に含まれる文字を選択する(ステップS601)。具体的には、文字番号付与部23bは、文字を囲む外接矩形の重心が文字列を囲む外接矩形内にある場合に、その文字が当該文字列に含まれると判定し、当該文字列に含まれると判定された文字を選択する処理をおこなう。そして、文字番号付与部23bは、図3および図4で説明したように、複数の文字の文字領域が重複している場合に、その重複を解消する処理をおこなう(ステップS602)。
続いて、文字番号付与部23bは、文字列内の各文字に対して、読み取り順序を付与する処理をおこなう(ステップS603)。この読み取り順序付与処理については、後に図7および図8において詳しく説明する。その後、レイアウト補正部23cは、各文字に付与された読み取り順序を基にして各文字を連結し、レイアウトが補正された文字列を生成する処理をおこなう(ステップS604)。この文字列生成処理については、後に図9および図10において詳しく説明する。
つぎに、図6に示した文字の読み取り順序付与処理の処理手順について説明する。図7は、図6に示した文字の読み取り順序付与処理の処理手順を示すフローチャートであり、図8は、図7に示した読み取り順序付与処理の処理の一例を示す図である。
図7に示すように、まず、文字番号付与部23bは、文字列Zに含まれる全文字を未読文字に設定する(ステップS701)。ここで、未読文字とは、まだ読み取り順序が付与されていない文字のことである。続いて、文字番号付与部23bは、文字の外接矩形の左上点のy座標が小さい順に文字に番号を付与する(ステップS702)。以降、文字Xi(i=1,2,3,・・・)に付与された番号をindex(Xi)で表す。
ここで、座標の原点は、文字列Zを囲む外接矩形の左上点とし、その原点から右に行くにしたがってx座標が増加し、その原点から下に行くにしたがってy座標が増加するものとする。図8には、各文字に番号が付けられた文字列10が原点11の位置とともに示されている。なお、y座標が同じ場合には、左側にある文字から順に番号を付与することとする。
続いて、文字番号付与部23bは、変数orderの値を1に設定し、また、変数startの値を1に設定する(ステップS703)。そして、文字番号付与部23bは、index(Xi)≧startを満たす文字Xiのうち、番号index(Xi)が最小になる未読文字Xi=Tがあるかどうかを調べ(ステップS704)、番号index(Xi)が最小になる未読文字Xi=Tがない場合には(ステップS704,No)、そのままこの読み取り順序付与処理を終了する。
index(Xi)≧startを満たす文字Xiのうち、番号index(Xi)が最小になる未読文字Xi=Tがある場合には(ステップS704,Yes)、文字番号付与部23bは、index(Xi)≧startを満たす文字Xiのうち、番号index(Xi)が最小になる未読文字Xi=Tを選択し(ステップS705)、文字列Zの原点11を一角とし、かつ未読文字Tの外接矩形を含む外接矩形を、未読文字Tに対応する矩形検査領域として算出する処理をおこなう(ステップS706)。図8には、原点11を一角とし、かつ番号が「(1)」である未読文字の外接矩形を含んだ矩形検査領域80が示されている。
その後、文字番号付与部23bは、未読文字Tに対する矩形検査領域と、他の未読文字の外接矩形とが重複しているかどうかを調べ(ステップS707)、他の未読文字の外接矩形と重複している場合には(ステップS707,Yes)、未読文字Tに対して読み取り順序を設定することなしに、変数startの値をindex(T)+1とし(ステップS708)、ステップS704以降の処理を継続する。
図8では、番号が「(1)」である文字に対応する矩形検査領域80内に、番号が「(4)」〜「(8)」の未読文字の外接矩形が重複しているため、ステップS707の判定は「Yes」となる。したがって、この段階では番号が「(1)」の文字に対して読み取り順序を設定せず、番号が「(2)」の文字をつぎの検査対象として選択する。また、番号が「(2)」および「(3)」の文字に対しても同様に、ステップS707の判定は「Yes」となり、読み取り順序の設定はおこなわない。
ステップS707において、未読文字Tに対する矩形検査領域と、他の未読文字の外接矩形とが重複していない場合には(ステップS707,No)、文字番号付与部23bは、未読文字Tの読み取り順序を変数orderの値とし、さらに、未読文字Tを既読文字に設定する(ステップS709)。その後、文字番号付与部23bは、変数orderの値に1を加算し、変数startの値を0に設定して(ステップS710)、ステップS704以降の処理を継続する。
図8には、番号「(4)」の未読文字Tに対応する矩形検査領域81が示されている。矩形検査領域81は、番号「(4)」の未読文字T以外の未読文字を含んでいないので、番号「(4)」の未読文字Tには「1」の読み取り順序が設定される。同様にして、番号が「(5)」〜「(8)」の文字に対して、読み取り順序「2」〜「5」が設定される。
さらに、図8には、番号が「(1)」の文字に対する矩形検査領域82が再び算出された場合が示されている。矩形検査領域82では、矩形検査領域80の場合とは異なり、番号「(4)」〜「(8)」の文字が既読文字となっているため、番号「(1)」の未読文字T以外の未読文字の外接矩形が矩形検査領域82に重複しない。したがって、番号が「(1)」の文字に対して、「6」の読み取り順序が設定される。同様にして、番号が「(2)」および「(3)」の未読文字に対して、「7」および「8」の読み取り順序が設定される。
さらに、番号が「(9)」の未読文字Tに対しては、それに対応する矩形検査領域83に番号が「(19)」〜「(27)」である未読文字の外接矩形が重複するため、読み取り順序の割り当ては後回しとなる。これは、番号が「(10)」〜「(18)」の未読文字に対しても同様である。
その後、番号が「(19)」の未読文字Tに対して矩形検査領域(図示せず)を算出すると、その矩形検査領域は、番号が「(9)」〜「(18)」、「(20)」〜「(27)」である未読文字の外接矩形と重複しないことがわかる。したがって、番号が「(19)」の未読文字に対して「9」の読み取り順序を割り当てる。以下同様にして、すべての文字に対して読み取り順序「1」〜「27」を割り当てることができる。
つぎに、図6に示した文字列生成処理の処理手順について説明する。図9は、図6に示した文字列生成処理の処理手順を示すフローチャートであり、図10は、図9に示した文字列生成処理の処理の一例を示す図である。
図9に示すように、まず、レイアウト補正部23cは、変数lineの値を1に、変数rの値を1に設定する(ステップS901)。そして、レイアウト補正部23cは、変数lineの番号が割り振られた文字列lineを空集合として生成する(ステップS902)。
そして、レイアウト補正部23cは、読み取り順序がrである文字を文字列lineの文字要素に追加し(ステップS903)、文字が追加された文字列lineの外接矩形を矩形検査領域として算出する(ステップS904)。図10には、読み取り順序が「1」である文字が文字列「I」に追加され、その文字列「I」に対して算出された矩形検査領域100が示されている。
続いて、レイアウト補正部23cは、矩形検査領域が文字列lineに属する文字以外の文字の外接矩形と重複しているかどうかを調べ(ステップS905)、文字列lineに属する文字以外の文字の外接矩形と重複している場合には(ステップS905,Yes)、ステップS902以降の処理を継続する。
矩形検査領域が文字列lineに属する文字以外の文字の外接矩形と重複していない場合には(ステップS905,No)、レイアウト補正部23cは、変数rの値に1を加算し(ステップS907)、変数rの値が当該文字列に含まれる全文字数以下であるかどうかを調べる(ステップS908)。全文字数以下である場合には(ステップS908,Yes)、レイアウト補正部23cは、ステップS903以降の処理を継続する。全文字数以下である場合には(ステップS908,Yes)、レイアウト補正部23cは、そのままこの文字列生成処理を終了する。
図10の矩形検査領域100には、文字列「I」に読み取り順序が「1」である文字が1つだけ追加されている。この場合、矩形検査領域100は、読み取り順序が「1」以外の文字の外接矩形と重複しないので、読み取り順序が「2」の文字が文字列「I」に追加される。さらに、読み取り順序が「1」および「2」の文字からなる文字列「I」の矩形検査領域(図示せず)は、読み取り順序が「1」および「2」以外の文字の外接矩形と重複しないので、読み取り順序が「3」の文字が文字列「I」に追加される。同様にして、読み取り順序が「6」の文字までが文字列「I」に追加される。
ところが、読み取り順序が「6」の文字の外接矩形と、読み取り順序が「1」〜「5」の文字の外接矩形とを囲む矩形検査領域101は、文字列「I」に属していない文字「9」の外接矩形と重複する。そのため、読み取り順序が「6」の文字を文字列「I」から除外して、読み取り順序が「1」〜「5」の文字の外接矩形を連結することにより文字列「I」を生成する。
続いて、新たに文字列「II」を空集合として生成する。そして、読み取り順序が「6」の文字を文字列「II」に追加し、文字列「II」の矩形検査領域102を算出する。この場合、矩形検査領域102に読み取り順序が「6」以外の文字の外接矩形が重複していないので、読み取り順序が「7」の文字を文字列「II」に追加して、読み取り順序が「6」および「7」の文字を含む文字列「II」の矩形検査領域(図示せず)を算出する。この矩形検査領域は、読み取り順序が「6」および「7」以外の文字の外接矩形と重複しないので、読み取り順序が「8」の文字を文字列「II」に追加する。
以下同様に、読み取り順序が「8」および「9」の文字を文字列「II」に追加する。ところが、読み取り順序が「9」の文字を文字列「II」に追加した場合、文字列「II」の矩形検査領域103は、文字列「II」に属していない文字「10」〜「17」の外接矩形と重複する。そのため、読み取り順序が「9」の文字を文字列「II」から除外して、読み取り順序が「6」〜「8」の文字の外接矩形を連結することにより文字列「II」を生成する。以下同様にして、すべての文字列「I」〜「IV」を生成することができる。
ところで、上記実施例で説明した文書レイアウト解析装置および文書レイアウト解析方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーションなどのコンピュータシステムで実行することによって実現することができる。そこで、以下に、上記実施例で説明した文書レイアウト解析装置(文書レイアウト解析方法)と同様の機能を有する文書レイアウト解析プログラムを実行するコンピュータシステムについて説明する。
図11は、本実施例に係るコンピュータシステムの構成を示すシステム構成図であり、図12は、このコンピュータシステムに係る本体部の構成を示すブロック図である。図11に示すように、本実施例に係るコンピュータシステム200は、本体部201と、本体部201からの指示によって表示画面202aに画像などの情報を表示するためのディスプレイ202と、このコンピュータシステム200に種々の情報を入力するためのキーボード203と、ディスプレイ202の表示画面202a上の任意の位置を指定するためのマウス204とを備える。
また、このコンピュータシステム200に係る本体部201は、図12に示すように、CPU221と、RAM222と、ROM223と、ハードディスクドライブ(HDD)224と、CD−ROM209を受け入れるCD−ROMドライブ225と、フレキシブルディスク(FD)208を受け入れるFDドライブ226と、ディスプレイ202、キーボード203ならびにマウス204を接続するI/Oインターフェース227と、ローカルエリアネットワークまたはワイドエリアネットワーク(LAN/WAN)206に接続するLANインターフェース228とを備える。
さらに、このコンピュータシステム200には、インターネットなどの公衆回線207に接続するためのモデム205が接続されるとともに、LANインターフェース228およびLAN/WAN206を介して、他のコンピュータシステム(PC)211、サーバ212ならびにプリンタ213などが接続される。
そして、このコンピュータシステム200は、所定の記録媒体に記録された文書レイアウト解析プログラムを読み出して実行することで文書レイアウト解析装置(文書レイアウト解析方法)を実現する。ここで、所定の記録媒体とは、フレキシブルディスク(FD)208、CD−ROM209、MOディスク、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」の他に、コンピュータシステム200の内外に備えられるハードディスクドライブ(HDD)224や、RAM222、ROM223などの「固定用の物理媒体」を含むものである。
さらに、所定の記録媒体は、モデム205を介して接続される公衆回線207や、他のコンピュータシステム211ならびにサーバ212が接続されるLAN/WAN206などのように、プログラムの送信に際して短期にプログラムを保持する「通信媒体」など、コンピュータシステム200によって読み取り可能な文書レイアウト解析プログラムを記録する、あらゆる記録媒体を含むものである。
すなわち、文書レイアウト解析プログラムは、上記した「可搬用の物理媒体」、「固定用の物理媒体」、「通信媒体」などの記録媒体に、コンピュータ読み取り可能に記録されるものであり、コンピュータシステム200は、このような記録媒体から文書レイアウト解析プログラムを読み出して実行することで文書レイアウト解析装置および文書レイアウト解析方法を実現する。なお、文書レイアウト解析プログラムは、コンピュータシステム200によって実行されることに限定されるものではなく、他のコンピュータシステム211またはサーバ212が文書レイアウト解析プログラムを実行する場合や、これらが協働して文書レイアウト解析プログラムを実行するような場合にも、本発明を同様に適用することができる。
上述してきたように、本実施例では、文字列検出部23aが、文書画像中の各文字に係る情報を取得し、取得した各文字に係る情報に基づいて文書画像中の文字列を検出し、検出した文字列に対し文字列レイアウト解析をおこない、文字番号付与部23bおよびレイアウト補正部23cが、文字列レイアウト解析の解析結果に基づき、文字列レイアウトを再設定することにより文字列レイアウトを補正することとしたので、電子文書の文書レイアウト構造を精度よく抽出できる。
また、本実施例では、文字列検出部23aが、文書画像中の各文字の座標情報を取得し、取得した座標情報に基づいて文書画像中の文字列を検出し、文字番号付与部23bが、検出された文字列に含まれる文字を1つずつ選択し、その文字列を囲む外接矩形の所定の角を一角とし、かつ、選択された文字を囲む外接矩形を含む矩形検査領域内に、当該文字の番号よりも順序が後ろの番号の文字が含まれないように各文字に番号を付与し、レイアウト補正部23cが、付与された番号順に各文字を1つずつ追加して文字列を設定し、その文字列にすでに追加されている文字と新たに追加した文字とを含む矩形検査領域内にその文字列にすでに追加されている文字および新たに追加した文字以外の文字が含まれた場合に、新たに追加した文字を除外するとともにすでに追加されている文字を連結して1つの文字列として再設定し、文字列のレイアウトを補正することとしたので、文書レイアウトの抽出を精度よく、かつ効率的におこなうことができる。
また、本実施例では、文字列検出部23aが、電子文書を仮想的にプリントアウトすることにより電子文書中の各文字の情報を取得することとしたので、文字列認識誤りに起因する誤読文字がなく、100%正しい文字の情報を取得でき、電子文書を一旦紙に印刷してそれをスキャナで読み取ることにより各文字の情報を取得するなどの作業を省き、効率的に各文字の情報を取得することができる。
また、本実施例では、文字列検出部23aが、複数の文字の文字領域が重複している場合に、文字領域の重複部分の重心を通る水平線または垂直線により分割されてできる複数の領域の組み合わせを求め、その組み合わせのうち、分割されてできた複数の領域の面積の総和が最大となる組み合わせを選択し、その組み合わせに対応する複数の領域を囲む各矩形をそれぞれの文字を囲む外接矩形として設定することとしたので、たとえ複数の文字の文字領域が重複している場合でも、各文字の文字領域を適切に設定することができる。
さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、上記特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施例にて実施されてもよいものである。
例えば、本実施例では、電子文書が横書きの文書の場合について説明したが、本発明はこれに限定されるものではなく、縦書きの電子文書にも同様に本発明を適用することができる。たとえば、図7のステップS702では、文字の外接矩形の左上点のy座標が小さい順に文字に番号を付与することとしたが、縦書きの文書の場合には、y座標の代わりにx座標の小さい順に文字に番号を付与するなど、処理を適切に変更しておこなうことにより縦書きの電子文書にも容易に対処することができる。
また、本実施例では、電子文書を仮想的にプリントアウトすることにより、電子文書中に含まれる文字の文字コードや座標位置の情報を取得することとしたが、本発明はこれに限定されるものではなく、上記文字に係る情報が内部情報として記述されている電子文書から直接それらの情報を取得することとしてもよい。
また、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
(付記1)文書画像から文字列のレイアウトに係る情報を取得する文書レイアウト解析プログラムであって、
前記文書画像中の各文字に係る情報を取得し、取得した各文字に係る情報に基づいて該文書画像中の文字列を検出する文字列検出手順と、
前記文字列検出手順により検出した文字列に対し文字列レイアウト解析をおこなう文字列レイアウト解析手順と、
前記文字列レイアウト解析手順による解析結果に基づき、文字列レイアウトを再設定することにより文字列レイアウトを補正するレイアウト補正手順と、
をコンピュータに実行させることを特徴とする文書レイアウト解析プログラム。
(付記2)文書画像から文字列のレイアウトに係る情報を取得する文書レイアウト解析プログラムであって、
前記文書画像中の各文字に係る情報を取得し、取得した各文字に係る情報に基づいて該文書画像中の文字列を検出する文字列検出手順と、
前記文字列検出手順により検出された文字列に含まれる文字を1つずつ選択し、該文字列を囲む文字列矩形の所定の角を一角とし、かつ、選択された文字を囲む文字矩形を含む第1の矩形検査領域内に、当該文字の番号よりも順序が後ろの番号の文字が含まれないように各文字に番号を付与する文字番号付与手順と、
前記文字番号付与手順により付与された番号順に各文字を1つずつ追加して文字列を設定し、該文字列にすでに追加されている文字と新たに追加した文字とを含む第2の矩形検査領域内に該文字列にすでに追加されている文字および新たに追加した文字以外の文字が含まれた場合に、新たに追加した文字を除外するとともにすでに追加されている文字を連結して1つの文字列として再設定し、文字列のレイアウトを補正するレイアウト補正手順と、
をコンピュータに実行させることを特徴とする文書レイアウト解析プログラム。
(付記3)前記文字列検出手段は、電子文書を仮想的にプリントアウトすることにより各文字に係る情報を取得して、取得した文字に係る情報に基づいて該文書中の文字列を検出することを特徴とする付記2に記載の文書レイアウト解析プログラム。
(付記4)前記文字番号付与手順は、複数の文字の文字領域が重複している場合に、該文字領域の重複部分の重心を通る水平線または垂直線により分割されてできる複数の領域の組み合わせのうち、分割されてできた複数の領域の面積の総和が最大となる組み合わせを選択し、該組み合わせに対応する複数の領域を囲む各矩形を前記文字を囲む文字矩形にそれぞれ設定することを特徴とする付記2または3に記載の文書レイアウト解析プログラム。
(付記5)文書画像から文字列のレイアウトに係る情報を取得する文書レイアウト解析プログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記文書画像中の各文字に係る情報を取得し、取得した各文字に係る情報に基づいて該文書画像中の文字列を検出する文字列検出手順と、
前記文字列検出手順により検出された文字列に含まれる文字を1つずつ選択し、該文字列を囲む文字列矩形の所定の角を一角とし、かつ、選択された文字を囲む文字矩形を含む第1の矩形検査領域内に、当該文字の番号よりも順序が後ろの番号の文字が含まれないように各文字に番号を付与する文字番号付与手順と、
前記文字番号付与手順により付与された番号順に各文字を1つずつ追加して文字列を設定し、該文字列にすでに追加されている文字と新たに追加した文字とを含む第2の矩形検査領域内に該文字列にすでに追加されている文字および新たに追加した文字以外の文字が含まれた場合に、新たに追加した文字を除外するとともにすでに追加されている文字を連結して1つの文字列として再設定し、文字列のレイアウトを補正するレイアウト補正手順と、
をコンピュータに実行させるための文書レイアウト解析プログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
(付記6)文書画像から文字列のレイアウトに係る情報を取得する文書レイアウト解析方法であって、
前記文書画像中の各文字に係る情報を取得し、取得した各文字に係る情報に基づいて該文書画像中の文字列を検出する文字列検出工程と、
前記文字列検出工程により検出された文字列に含まれる文字を1つずつ選択し、該文字列を囲む文字列矩形の所定の角を一角とし、かつ、選択された文字を囲む文字矩形を含む第1の矩形検査領域内に、当該文字の番号よりも順序が後ろの番号の文字が含まれないように各文字に番号を付与する文字番号付与工程と、
前記文字番号付与工程により付与された番号順に各文字を1つずつ追加して文字列を設定し、該文字列にすでに追加されている文字と新たに追加した文字とを含む第2の矩形検査領域内に該文字列にすでに追加されている文字および新たに追加した文字以外の文字が含まれた場合に、新たに追加した文字を除外するとともにすでに追加されている文字を連結して1つの文字列として再設定し、文字列のレイアウトを補正するレイアウト補正工程と、
を含んだことを特徴とする文書レイアウト解析方法。
(付記7)文書画像から文字列のレイアウトに係る情報を取得する文書レイアウト解析装置であって、
前記文書画像中の各文字に係る情報を取得し、取得した各文字に係る情報に基づいて該文書画像中の文字列を検出する文字列検出手段と、
前記文字列検出手段により検出された文字列に含まれる文字を1つずつ選択し、該文字列を囲む文字列矩形の所定の角を一角とし、かつ、選択された文字を囲む文字矩形を含む第1の矩形検査領域内に、当該文字の番号よりも順序が後ろの番号の文字が含まれないように各文字に番号を付与する文字番号付与手段と、
前記文字番号付与手段により付与された番号順に各文字を1つずつ追加して文字列を設定し、該文字列にすでに追加されている文字と新たに追加した文字とを含む第2の矩形検査領域内に該文字列にすでに追加されている文字および新たに追加した文字以外の文字が含まれた場合に、新たに追加した文字を除外するとともにすでに追加されている文字を連結して1つの文字列として再設定し、文字列のレイアウトを補正するレイアウト補正手段と、
を備えたことを特徴とする文書レイアウト解析装置。
以上のように、本発明に係る文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置は、文書レイアウト構造を精度よく抽出することが必要な文書レイアウト解析システムに有用である。
本発明に係る文書レイアウト解析処理の概念を説明する概念図である。 本実施例に係る文書レイアウト解析装置の機能的構成を示す機能ブロック図である。 文字領域の重複解消化処理における文字の重複領域の分割方法を説明する説明図である。 図3に示した分割方法により分割された文字領域を説明する説明図である。 本実施例に係る文書レイアウト解析処理の処理手順を示すフローチャートである。 図5に示した文字列レイアウト補正処理の処理手順を示すフローチャートである。 図6に示した文字の読み取り順序付与処理の処理手順を示すフローチャートである。 図7に示した読み取り順序付与処理の処理の一例を示す図である。 図6に示した文字列生成処理の処理手順を示すフローチャートである。 図9に示した文字列生成処理の処理の一例を示す図である。 本実施例に係るコンピュータシステムの構成を示す図である。 図11に示したコンピュータシステムに係る本体部の構成を示すブロック図である。
符号の説明
10 文字列
11 原点
12、13、80〜83、100〜103 矩形検査領域
14a〜14d 補正後の文字列
15a〜15d 補正後の文字列レイアウト
20 入力部
21 表示部
22 記憶部
22a 電子文書データ
22b 文字データ
22c レイアウトデータ
23 制御部
23a 文字列検出部
23b 文字番号付与部
23c レイアウト補正部
23d 文書編集処理部
30、31 文字領域
32 重複部分
33 重複部分の重心
40〜43 分割文字領域

Claims (4)

  1. 文書画像から文字列のレイアウトに係る情報を取得する文書レイアウト解析プログラムであって、
    前記文書画像の所定の領域の中にある各文字に対して、それぞれの文字の外接矩形の座標順に第1の番号を付与する第1の番号付与手順と、
    前記各文字に対して第2の番号を付与する第2の番号付与手順と、
    前記各文字を1乃至複数の文字列として認識する文字列認識手順と
    をコンピュータに実行させ、
    前記第2の番号付与手順は、前記第2の番号を付与が付与されていない文字であって、当該の文字の外接矩形を含み、かつ、前記領域の所定の角を1角とする外接矩形領域が、前記第2の番号を付与されていない他の文字を含まない文字のうち、前記第1の番号として最も小さい番号を付与されている文字から順に第2の番号を付与し、
    前記文字列認識手順は、付与されている前記第2の番号が小さい順に文字を連結していき、連結された全ての文字を含む外接矩形領域が、連結されていない他の文字の外接矩形と重複する場合に、前記連結された全ての文字から最後に連結された文字を除外した文字を文字列と認識することを特徴とする文書レイアウト解析プログラム。
  2. 文書画像から文字列のレイアウトに係る情報を取得する文書レイアウト解析プログラムを記録したコンピュータ読み取り可能な記録媒体であって、
    前記文書画像の所定の領域の中にある各文字に対して、それぞれの文字の外接矩形の座標順に第1の番号を付与する第1の番号付与手順と、
    前記各文字に対して第2の番号を付与する第2の番号付与手順と、
    前記各文字を1乃至複数の文字列として認識する文字列認識手順と
    をコンピュータに実行させるための文書レイアウト解析プログラムを記録し、
    前記第2の番号付与手順は、前記第2の番号を付与が付与されていない文字であって、当該の文字の外接矩形を含み、かつ、前記領域の所定の角を1角とする外接矩形領域が、前記第2の番号を付与されていない他の文字を含まない文字のうち、前記第1の番号として最も小さい番号を付与されている文字から順に第2の番号を付与し、
    前記文字列認識手順は、付与されている前記第2の番号が小さい順に文字を連結していき、連結された全ての文字を含む外接矩形領域が、連結されていない他の文字の外接矩形と重複する場合に、前記連結された全ての文字から最後に連結された文字を除外した文字を文字列と認識することを特徴とする記録媒体。
  3. 文書画像から文字列のレイアウトに係る情報を取得する文書レイアウト解析方法であって、
    前記文書画像の所定の領域の中にある各文字に対して、それぞれの文字の外接矩形の座標順に第1の番号を付与する第1の番号付与工程と、
    前記各文字に対して第2の番号を付与する第2の番号付与工程と、
    前記各文字を1乃至複数の文字列として認識する文字列認識工程と
    を含み、
    前記第2の番号付与工程は、前記第2の番号を付与が付与されていない文字であって、当該の文字の外接矩形を含み、かつ、前記領域の所定の角を1角とする外接矩形領域が、前記第2の番号を付与されていない他の文字を含まない文字のうち、前記第1の番号として最も小さい番号を付与されている文字から順に第2の番号を付与し、
    前記文字列認識工程は、付与されている前記第2の番号が小さい順に文字を連結していき、連結された全ての文字を含む外接矩形領域が、連結されていない他の文字の外接矩形と重複する場合に、前記連結された全ての文字から最後に連結された文字を除外した文字を文字列と認識することを特徴とする文書レイアウト解析方法。
  4. 文書画像から文字列のレイアウトに係る情報を取得する文書レイアウト解析装置であって、
    前記文書画像の所定の領域の中にある各文字に対して、それぞれの文字の外接矩形の座標順に第1の番号を付与する第1の番号付与手段と、
    前記各文字に対して第2の番号を付与する第2の番号付与手段と、
    前記各文字を1乃至複数の文字列として認識する文字列認識手段と
    を備え、
    前記第2の番号付与手段は、前記第2の番号を付与が付与されていない文字であって、当該の文字の外接矩形を含み、かつ、前記領域の所定の角を1角とする外接矩形領域が、前記第2の番号を付与されていない他の文字を含まない文字のうち、前記第1の番号として最も小さい番号を付与されている文字から順に第2の番号を付与し、
    前記文字列認識手段は、付与されている前記第2の番号が小さい順に文字を連結していき、連結された全ての文字を含む外接矩形領域が、連結されていない他の文字の外接矩形と重複する場合に、前記連結された全ての文字から最後に連結された文字を除外した文字を文字列と認識することを特徴とする文書レイアウト解析装置。
JP2003357941A 2003-10-17 2003-10-17 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置 Expired - Fee Related JP4213558B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003357941A JP4213558B2 (ja) 2003-10-17 2003-10-17 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003357941A JP4213558B2 (ja) 2003-10-17 2003-10-17 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置

Publications (2)

Publication Number Publication Date
JP2005122543A JP2005122543A (ja) 2005-05-12
JP4213558B2 true JP4213558B2 (ja) 2009-01-21

Family

ID=34614687

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003357941A Expired - Fee Related JP4213558B2 (ja) 2003-10-17 2003-10-17 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置

Country Status (1)

Country Link
JP (1) JP4213558B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201001303A (en) * 2008-06-27 2010-01-01 Univ Nat Taiwan Science Tech System and method for recognizing document immediately
JP5712487B2 (ja) 2009-09-04 2015-05-07 株式会社リコー 画像処理装置、画像処理システム、画像処理方法、及びプログラム
JP5812702B2 (ja) * 2011-06-08 2015-11-17 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 文字の読み順を決定するための読み順決定装置、方法及びプログラム

Also Published As

Publication number Publication date
JP2005122543A (ja) 2005-05-12

Similar Documents

Publication Publication Date Title
US8107727B2 (en) Document processing apparatus, document processing method, and computer program product
JP3822277B2 (ja) 文字テンプレートセット学習マシン動作方法
JP3425408B2 (ja) 文書読取装置
JP6590355B1 (ja) 学習モデル生成装置、文字認識装置、学習モデル生成方法、文字認識方法、及びプログラム
JP5663866B2 (ja) 情報処理装置及び情報処理プログラム
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JP4998220B2 (ja) 帳票データ抽出プログラム、帳票データ抽出装置および帳票データ抽出方法
KR100570224B1 (ko) 전표정의데이터 작성방법 및 전표처리장치
JP4785655B2 (ja) 文書処理装置及び文書処理方法
JP2021043478A (ja) 情報処理装置、その制御方法及びプログラム
US7680329B2 (en) Character recognition apparatus and character recognition method
JPH11184894A (ja) 論理要素抽出方法および記録媒体
US9049400B2 (en) Image processing apparatus, and image processing method and program
CN109726369A (zh) 一种基于标准文献的智能模板化题录技术实现方法
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
JP2008108114A (ja) 文書処理装置および文書処理方法
JP4213558B2 (ja) 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置
JP4518212B2 (ja) 画像処理装置及びプログラム
JP4517822B2 (ja) 画像処理装置及びプログラム
US20170249299A1 (en) Non-transitory computer readable medium and information processing apparatus and method
JPH11328306A (ja) 文書画像の論理要素抽出方法、装置および記録媒体
JP5712415B2 (ja) 帳票処理システム及び帳票処理方法
JP2009087378A (ja) 帳票処理装置
JP4521377B2 (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JP4646300B2 (ja) 繰り返し行決定装置、繰り返し行決定方法、プログラム及び記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050413

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080408

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080904

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081028

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081030

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4213558

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131107

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees