JP4443443B2 - 文書画像レイアウト解析プログラム、文書画像レイアウト解析装置、および文書画像レイアウト解析方法 - Google Patents
文書画像レイアウト解析プログラム、文書画像レイアウト解析装置、および文書画像レイアウト解析方法 Download PDFInfo
- Publication number
- JP4443443B2 JP4443443B2 JP2005061529A JP2005061529A JP4443443B2 JP 4443443 B2 JP4443443 B2 JP 4443443B2 JP 2005061529 A JP2005061529 A JP 2005061529A JP 2005061529 A JP2005061529 A JP 2005061529A JP 4443443 B2 JP4443443 B2 JP 4443443B2
- Authority
- JP
- Japan
- Prior art keywords
- text block
- text
- document image
- extraction
- clique
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Geometry (AREA)
- Computer Graphics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Image Analysis (AREA)
Description
例えば、基礎要素の集合に対して、それらの近接性(文字成分同士が比較的密に配置されている)と同質性(文字成分の大きさがほぼ同じ大きさである)に基づいて統合し、行を生成する。同様に、行の集合に対して、それらの近接性と同質性に基づき統合して段(テキストブロック)を生成することで、テキストブロックを抽出できる(例えば、特許文献1参照)。
例えば、特許文献1記載の方式では、テキストブロック同士が入り組んで配置されている場合や、テキストブロックと図が入り組んで配置されている場合などに、文字成分を過統合して、複数行の文字列をまとめて1行としてしまうことがある。また、特許文献2記載の方式では、テキストブロックが他の文書要素と矩形で分離できない形で配置されている場合に、正しくテキストブロックを抽出することは非常に難しい。
図1は、本実施の形態の概略を示す図である。本発明に係る文書画像レイアウト解析装置は、抽出条件記憶手段1、テキストブロック抽出手段2、およびテキストブロック統合手段3を有する。
[第1の実施の形態]
以下の実施の形態では、セパレータ(テキストブロック間の境界)とする空白領域の大きさを示すパラメータのセット(パラメータセット)を、複数用意する。そして、各パラメータセットを初期値として、再帰的なテキストブロック抽出処理(特願2004−059954参照)を実行する。このようにして生成された複数のテキストブロック抽出結果を統合することにより、テキストブロックの抽出精度を向上させる。
図2は、本実施の形態に用いるコンピュータのハードウェア構成例を示す図である。コンピュータ100は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、バス108を介してRAM(Random Access Memory)102、ハードディスクドライブ(HDD:Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105、通信インタフェース106、およびLANインタフェース107が接続されている。
図5は、文書画像レイアウト解析処理の手順を示すフローチャートである。以下、図5に示す処理を、ステップ番号に沿って説明する。なお、この処理は、R0,R1,・・・,Rp_num-1から一度に統合結果を求める並列方式である。
[ステップS12]テキストブロック抽出部122は、iがp_num未満か否かを判断する。p_num未満であれば処理がステップS13に進められる。p_num以上であれば処理がステップS16に進められる。
[ステップS14]テキストブロック抽出部122は、ステップS13のテキストブロック抽出結果を、Riに代入する。
図6は、テキストブロック抽出処理の手順を示すフローチャートである。以下、図6に示す処理をステップ番号に沿って説明する。
図7は、連結成分属性付与処理の手順を示すフローチャートである。以下、図7に示す処理をステップ番号に沿って説明する。
[ステップS32]テキストブロック抽出部122は、ステップS31の処理で得られた連結成分の集合Sに基づいて、セパレータ判別処理を行う。セパレータとは、テキストブロック間の境界を表す連結成分(例えば、文章を区切る罫線など)である。ここでは、テキストブロック抽出部122は、連結成分の外接矩形の長い辺の長さがある一定値以上であり、かつ外接矩形の縦横比がある一定値以上であるとき、その連結成分はセパレータであると判別する。
[ステップS35]テキストブロック抽出部122は、階層化処理が終わると集合Saに対して、文字認識処理を行う。
[ステップS36]テキストブロック抽出部122は、集合Saに対して、文字成分・フレーム・図判別処理を行う。具体的には、連結成分に文字成分フラグ“CH”がついている場合、その連結成分の“親”が存在するならば、その“親”に文字成分フラグ“CH”がついていないときは“親”にフレームフラグ“FR”をつける。
以上のような処理で、文書画像中の全ての連結成分に対して、文字成分、セパレータ、図、フレーム、ノイズのいずれかの属性を付与することができる。
図11は、再帰的テキストブロック抽出処理の手順を示す一例のフローチャートである。以下、図11に示す処理をステップ番号に沿って説明する。
Mn,x(Q,W)={T∈M(Q,W)|min(TX,TY)≧n and max(TX,TY)≧x}
ここで、TXはM(Q,W)に含まれるQにおけるW極大空白矩形Tの横(X方向)の長さを表し、TYはTの縦(Y方向)の長さを表す。min(TX,TY)≧nは、TX,TYのうち短いほうが制御パラメータn以上であることを示し、max(TX,TY)≧xはTX,TYのうち長いほうが制御パラメータx以上であることを示す。
次に、テキストブロック抽出結果の統合処理(ステップS16)について詳細に説明する。
[ステップS52]テキストブロック統合部123は、j<t(i)_numが満たされるか否かを判断する。jがt(i)_num未満であれば、処理がステップS53に進められる。j=t(i)_numであれば、テキストブロック抽出結果統合処理が終了する。
[ステップS55]テキストブロック統合部123は、Ti jをSTに登録する。
[ステップS56]テキストブロック統合部123は、Ti jに連結するテキストブロックを探索する。
[ステップS58]テキストブロック統合部123は、jの値をインクリメント(1加算)して、処理をステップS52に進める。
[ステップS61]テキストブロック統合部123は、Ti jに対して少なくとも一部が重複するテキストブロックを、他のテキストブロック抽出結果(並列方式の場合{Ti j|i=0,1,2,・・・,p_num−1、j=0,1,2,・・・,t(i)_num−1})から取得し、重複するテキストブロックの集合を{Tm N(k)}(m≠i)とする。また、重複するテキストブロックの個数をxi jとする。
[ステップS63]テキストブロック統合部123は、k<xi jか否かを判断する。kがxi j未満であれば処理がステップS64に進められる。kがxi j以上であれば、現在実行している連結集合探索処理が終了し、呼び出し元に処理が戻される。
[ステップS66]テキストブロック統合部123は、Tm N(k)をSTに登録する。
このようにして、連結集合探索処理が再帰的に実行される。
図16は、最適組み合わせ探索処理の手順を示すフローチャートである。以下、図16に示す処理をステップ番号に沿って説明する。
[ステップS75]テキストブロック統合部123は、抽出された組み合わせ候補を、テキストブロックの認識コストと言語コストの値により順位付けし、最小コストの組み合わせを最終結果とする。
[ステップS81]テキストブロック統合部123は、各クリークについて認識コストを計算する。認識コストとは、テキストブロック内の文字認識を行い、そのときの認識の確からしさを示す数値である。文字認識が正確であるほど、認識コストの値は小さくなる。
[ステップS84]テキストブロック統合部123は、選択した2つのクリークの認識コストと言語コストの両方を比較し、有意な差があるか否かを判定する。認識コストにおける有意な差は例えば10を用い、言語コストにおける有意な差は例えば50を用いる。その場合、認識コストと言語コストとの何れか一方で有意な差があれば、コストの値が小さい方のクリークを、優位なクリークとする。なお、認識コストによる優位なクリークと、言語コストによる優位なクリークとが異なるクリークとなる場合、例えば、有意な差がないと判断する。
[ステップS85]テキストブロック統合部123は、比較対象のクリークそれぞれの認識コストと言語コストとを正規化した値の和を取る。このとき、認識コストの正規化値には、正読確率が用いられる。言語コストの正規化値には、言語コストの逆数を定数倍したものが用いられる。
[ステップS88]テキストブロック統合部123は、優位と判定されたクリークに得点(例えば、1点)を加点する。
以上のような処理によって、複数のパラメータセット毎に生成されたテキストブロックを統合することができる。
図18は、解析対象の文書画像の例を示す図である。図18に示す文書画像300には、横書きの見出し、縦書きの文章等が混在している。このような文書画像300が文書画像レイアウト解析部120に入力されると、テキストブロック抽出部122によって、パラメータセット毎にテキストブロック抽出処理が行われる。
図22は、連結集合の第1の例を示す図である。連結集合341は、テキストブロック抽出結果301に含まれていた2つのテキストブロック317,318と、テキストブロック抽出結果302に含まれていた3つのテキストブロック329〜331とで構成されている。
図23は、グラフとクリークとの第1の例を示す図である。連結集合341から生成されたグラフ40には、5つのノードが含まれる。各ノードがテキストブロックを示している。グラフ40では、各ノードに、対応するテキストブロックの識別番号が付与されている。
図24は、コスト計算結果を示す図である。この例では、クリーク41の認識コストが「105」、言語コストが「250」である。クリーク42の認識コストが「160」、言語コストが「1440」である。クリーク43の認識コストが「235」、言語コストが「780」である。
図25は、連結集合の第2の例を示す図である。連結集合342は、テキストブロック抽出結果301に含まれていた3つのテキストブロック313,314,316と、テキストブロック抽出結果302に含まれていた5つのテキストブロック323〜325,327,328とで構成されている。
図26は、グラフとクリークとの第2の例を示す図である。連結集合342から生成されたグラフ50には、8つのノードが含まれる。このようなグラフ50から、両立可能な論理的に必要最小限の組み合わせが、クリーク51,52,53,・・・として求められる。
2つの連結集合341,342それぞれの最小コストクリークに含まれるテキストブロックが、テキストブロック抽出結果の統合結果に含められる。
第2の実施の形態は、テキストブロック抽出結果の統合を、テキストブロック抽出結果が得られる毎に、逐次実行するものである(逐次方式)。
[ステップS81]テキストブロック抽出部122は、パラメータセットの識別番号を示すiの初期値を0にセットする。
[ステップS83]テキストブロック抽出部122は、ステップS82のテキストブロック抽出結果を、Riに代入する。
[ステップS85]テキストブロック抽出部122は、iがp_num未満か否かを判断する。p_num未満であれば処理がステップS86に進められる。p_num以上であれば処理が終了する。
[ステップS88]テキストブロック統合部123が、テキストブロック抽出結果RiとRi-1とを統合する。統合処理の詳細は、図14に示した第1の実施の形態におけるテキストブロック抽出結果統合処理と同様である。
[ステップS90]テキストブロック抽出部122は、iをインクリメント(1加算)し、処理をステップS85に進める。
また、テキストブロック抽出結果を逐次統合する毎に、統合結果を認識コストや言語コストで評価し、評価結果が所定値未満(正規化した値で評価する場合は、所定値以上)となった時点で、文書画像レイアウト解析処理を終了させることもできる。これにより、所定の条件を満たす評価が得られた以後は、テキストブロック抽出処理等を行わずにすみ、処理時間を短縮することができる。
上記の実施の形態では、セパレータ抽出のための初期パラメータを変えることで、複数のテキストブロック抽出結果を生成しているが、全く異なる手法で複数のテキストブロック抽出処理を行い、その結果を統合することもできる。例えば、特許文献1や特許文献2記載の技術でテキストブロックを抽出し、その抽出結果を統合することもできる。テキストブロック抽出処理の多様性が増すほど、より精度の高い統合結果を得ることができる。
以上説明した実施の形態の主な技術的特徴は、以下の付記の通りである。
コンピュータを、
テキストブロックを抽出するための条件を定義した複数の抽出条件を記憶する抽出条件記憶手段、
前記抽出条件記憶手段に記憶された前記テキストブロック抽出条件それぞれに従って、前記文書画像からテキストブロックを抽出するテキストブロック抽出手段、
前記テキストブロック抽出手段で抽出された複数のテキストブロック抽出結果それぞれに含まれるテキストブロックの文字認識を行い、文字認識結果に基づいてテキストブロックが示す範囲の正確性を判定し、正確性が高いテキストブロックを選択してテキストブロック統合結果として出力するテキストブロック統合手段、
として機能させることを特徴とする文書画像レイアウト解析プログラム。
テキストブロックを抽出するための条件を定義した複数の抽出条件を記憶する抽出条件記憶手段と、
前記抽出条件記憶手段に記憶された前記テキストブロック抽出条件それぞれに従って、前記文書画像からテキストブロックを抽出するテキストブロック抽出手段と、
前記テキストブロック抽出手段で抽出された複数のテキストブロック抽出結果それぞれに含まれるテキストブロックの文字認識を行い、文字認識結果に基づいてテキストブロックが示す範囲の正確性を判定し、正確性が高いテキストブロックを選択してテキストブロック統合結果として出力するテキストブロック統合手段と、
を有することを特徴とする文書画像レイアウト解析装置。
テキストブロック抽出手段が、予めテキストブロックを抽出するための条件を定義した複数の抽出条件が記憶された抽出条件記憶手段を参照し、前記テキストブロック抽出条件それぞれに従って、前記文書画像からテキストブロックを抽出し、
テキストブロック統合手段が、前記テキストブロック抽出手段で抽出された複数のテキストブロック抽出結果それぞれに含まれるテキストブロックの文字認識を行い、文字認識結果に基づいてテキストブロックが示す範囲の正確性を判定し、正確性が高いテキストブロックを選択してテキストブロック統合結果として出力する、
ことを特徴とする文書画像レイアウト解析方法。
前記コンピュータを、
テキストブロックを抽出するための条件を定義した複数の抽出条件を記憶する抽出条件記憶手段、
前記抽出条件記憶手段に記憶された前記テキストブロック抽出条件それぞれに従って、前記文書画像からテキストブロックを抽出するテキストブロック抽出手段、
前記テキストブロック抽出手段で抽出された複数のテキストブロック抽出結果それぞれに含まれるテキストブロックの文字認識を行い、文字認識結果に基づいてテキストブロックが示す範囲の正確性を判定し、正確性が高いテキストブロックを選択してテキストブロック統合結果として出力するテキストブロック統合手段、
として機能させることを特徴とする文書画像レイアウト解析プログラムを記録したコンピュータ読み取り可能な記録媒体。
2 テキストブロック抽出手段
3 テキストブロック統合手段
4 文書画像
5a,5b,・・・ テキストブロック抽出結果
6 テキストブロック統合結果
Claims (8)
- 文書画像に含まれるテキストのレイアウトを解析して、文字認識の処理対象とする範囲を示すテキストブロックを抽出する文書画像レイアウト解析プログラムにおいて、
コンピュータを、
テキストブロックを抽出するための条件を定義した複数の抽出条件を記憶する抽出条件記憶手段、
前記抽出条件記憶手段に記憶された前記テキストブロック抽出条件それぞれに従って、前記文書画像からテキストブロックを抽出するテキストブロック抽出手段、
前記テキストブロック抽出手段で抽出された複数のテキストブロック抽出結果それぞれに含まれるテキストブロックのうち領域が重複するテキストブロック同士を関連づけて連結集合とし、前記連結集合に既に含まれるテキストブロックの少なくとも一部と重複する他のテキストブロックを順次前記連結集合に含め、前記連結集合に含まれるテキストブロックそれぞれに対応するノードと、領域の直接の重複関係が存在しないテキストブロックに対応するノード間を接続する線とで構成されたグラフを生成し、前記グラフ内のノードの組み合わせのうち、すべてのノード間が互いに線で結ばれている組み合わせをクリークとして抽出し、抽出されたクリークそれぞれに含まれるノードに対応するテキストブロックの文字認識を行い、文字認識結果に基づいてクリークが示す組み合わせの正確性を判定し、組み合わせの正確性が高いクリークに含まれるノードそれぞれに対応するテキストブロックをテキストブロック統合結果として出力するテキストブロック統合手段、
として機能させることを特徴とする文書画像レイアウト解析プログラム。 - 前記テキストブロック統合手段は、クリークに含まれるノードに対応するテキストブロックの文字認識による認識の確からしさを示す正読確率が高いほど、当該クリークが示す組み合わせの正確性を高く評価することを特徴とする請求項1記載の文書画像レイアウト解析プログラム。
- 前記テキストブロック統合手段は、クリークに含まれるノードに対応するテキストブロックの文字認識結果における文章が言語的に自然であるほど、当該クリークが示す組み合わせの正確性を高く評価することを特徴とする請求項1記載の文書画像レイアウト解析プログラム。
- 前記テキストブロック統合手段は、クリークに含まれるノードに対応するテキストブロックのテキストブロック毎の文字認識による認識の確からしさを示す正読確率と、文字認識結果における文章が言語的な自然さを示す数値とを正規化し、当該クリークに含まれるテキストブロック毎の正規化した値の和を、当該クリークが示す組み合わせの正確性を示す値とすることを特徴とする請求項1記載の文書画像レイアウト解析プログラム。
- 前記テキストブロック統合手段は、クリークに含まれるテキストブロックが示す範囲の正確性をクリーク毎に数値化し、クリークを2つずつ対比し、正確性を示す数値が対比相手の前記組み合わせよりも所定値以上の差で高く評価されているクリークに得点を与え、最も得点の高いクリークに含まれるノードに対応するテキストブロックをテキストブロック統合結果として出力することを特徴とする請求項1記載の文書画像レイアウト解析プログラム。
- 前記抽出条件記憶手段には、テキストブロック間の境界を示すセパレータと判定するための、前記セパレータに含まれるべき空白領域の大きさを示す条件が前記抽出条件として格納されていることを特徴とする請求項1記載の文書画像レイアウト解析プログラム。
- 文書画像に含まれるテキストのレイアウトを解析して、文字認識の処理対象とする範囲を示すテキストブロックを抽出する文書画像レイアウト解析装置において、
テキストブロックを抽出するための条件を定義した複数の抽出条件を記憶する抽出条件記憶手段と、
前記抽出条件記憶手段に記憶された前記テキストブロック抽出条件それぞれに従って、前記文書画像からテキストブロックを抽出するテキストブロック抽出手段と、
前記テキストブロック抽出手段で抽出された複数のテキストブロック抽出結果それぞれに含まれるテキストブロックのうち領域が重複するテキストブロック同士を関連づけて連結集合とし、前記連結集合に既に含まれるテキストブロックの少なくとも一部と重複する他のテキストブロックを順次前記連結集合に含め、前記連結集合に含まれるテキストブロックそれぞれに対応するノードと、領域の直接の重複関係が存在しないテキストブロックに対応するノード間を接続する線とで構成されたグラフを生成し、前記グラフ内のノードの組み合わせのうち、すべてのノード間が互いに線で結ばれている組み合わせをクリークとして抽出し、抽出されたクリークそれぞれに含まれるノードに対応するテキストブロックの文字認識を行い、文字認識結果に基づいてクリークが示す組み合わせの正確性を判定し、組み合わせの正確性が高いクリークに含まれるノードそれぞれに対応するテキストブロックをテキストブロック統合結果として出力するテキストブロック統合手段と、
を有することを特徴とする文書画像レイアウト解析装置。 - 文書画像に含まれるテキストのレイアウトを解析して、文字認識の処理対象とする範囲を示すテキストブロックを抽出するための文書画像レイアウト解析方法において、
テキストブロック抽出手段が、予めテキストブロックを抽出するための条件を定義した複数の抽出条件が記憶された抽出条件記憶手段を参照し、前記テキストブロック抽出条件それぞれに従って、前記文書画像からテキストブロックを抽出し、
テキストブロック統合手段が、前記テキストブロック抽出手段で抽出された複数のテキストブロック抽出結果それぞれに含まれるテキストブロックのうち領域が重複するテキストブロック同士を関連づけて連結集合とし、前記連結集合に既に含まれるテキストブロックの少なくとも一部と重複する他のテキストブロックを順次前記連結集合に含め、前記連結集合に含まれるテキストブロックそれぞれに対応するノードと、領域の直接の重複関係が存在しないテキストブロックに対応するノード間を接続する線とで構成されたグラフを生成し、前記グラフ内のノードの組み合わせのうち、すべてのノード間が互いに線で結ばれている組み合わせをクリークとして抽出し、抽出されたクリークそれぞれに含まれるノードに対応するテキストブロックの文字認識を行い、文字認識結果に基づいてクリークが示す組み合わせの正確性を判定し、組み合わせの正確性が高いクリークに含まれるノードそれぞれに対応するテキストブロックをテキストブロック統合結果として出力する、
ことを特徴とする文書画像レイアウト解析方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005061529A JP4443443B2 (ja) | 2005-03-04 | 2005-03-04 | 文書画像レイアウト解析プログラム、文書画像レイアウト解析装置、および文書画像レイアウト解析方法 |
US11/175,127 US7627176B2 (en) | 2005-03-04 | 2005-07-05 | Apparatus, method, and computer program for analyzing document layout |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005061529A JP4443443B2 (ja) | 2005-03-04 | 2005-03-04 | 文書画像レイアウト解析プログラム、文書画像レイアウト解析装置、および文書画像レイアウト解析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006244309A JP2006244309A (ja) | 2006-09-14 |
JP4443443B2 true JP4443443B2 (ja) | 2010-03-31 |
Family
ID=36970964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005061529A Expired - Fee Related JP4443443B2 (ja) | 2005-03-04 | 2005-03-04 | 文書画像レイアウト解析プログラム、文書画像レイアウト解析装置、および文書画像レイアウト解析方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7627176B2 (ja) |
JP (1) | JP4443443B2 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7756871B2 (en) * | 2004-10-13 | 2010-07-13 | Hewlett-Packard Development Company, L.P. | Article extraction |
US20060224953A1 (en) * | 2005-04-01 | 2006-10-05 | Xiaofan Lin | Height-width estimation model for a text block |
JP2007141159A (ja) * | 2005-11-22 | 2007-06-07 | Fuji Xerox Co Ltd | 画像処理装置、画像処理方法、及び画像処理プログラム |
US20100257160A1 (en) * | 2006-06-07 | 2010-10-07 | Yu Cao | Methods & apparatus for searching with awareness of different types of information |
JP2009130870A (ja) * | 2007-11-28 | 2009-06-11 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
JP5262493B2 (ja) * | 2008-09-17 | 2013-08-14 | 株式会社リコー | 画像処理装置、画像処理方法、プログラムおよびコンピュータ読み取り可能な記憶媒体 |
JP5412903B2 (ja) * | 2009-03-17 | 2014-02-12 | コニカミノルタ株式会社 | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム |
US8214903B2 (en) * | 2009-10-02 | 2012-07-03 | International Business Machines Corporation | Analysis of scripts |
JP5577948B2 (ja) * | 2010-08-24 | 2014-08-27 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
US9082339B2 (en) * | 2011-11-04 | 2015-07-14 | Facebook, Inc. | Rendering texts on electronic devices |
US9628865B2 (en) * | 2012-09-10 | 2017-04-18 | Apple Inc. | Enhanced closed caption feature |
JP5735126B2 (ja) * | 2013-04-26 | 2015-06-17 | 株式会社東芝 | システムおよび筆跡検索方法 |
RU2604668C2 (ru) * | 2014-06-17 | 2016-12-10 | Общество с ограниченной ответственностью "Аби Девелопмент" | Визуализация машинно-генерируемого изображения документа |
JP6352695B2 (ja) * | 2014-06-19 | 2018-07-04 | 株式会社東芝 | 文字検出装置、方法およびプログラム |
CN105678207A (zh) * | 2014-11-19 | 2016-06-15 | 富士通株式会社 | 用于从给定图像中识别目标铭板图像的内容的装置和方法 |
EP3258420A1 (en) | 2016-06-16 | 2017-12-20 | Kabushiki Kaisha Toshiba | Delivery handling apparatus, delivery handling method, and delivery handling program |
CN106503634B (zh) * | 2016-10-11 | 2020-02-14 | 讯飞智元信息科技有限公司 | 一种图像对齐方法及装置 |
US10347293B1 (en) * | 2018-07-31 | 2019-07-09 | Droplr, Inc. | Detecting, redacting, and scoring confidential information in video |
CN112487138A (zh) * | 2020-11-19 | 2021-03-12 | 华为技术有限公司 | 带格式文本的信息抽取方法和装置 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2887803B2 (ja) | 1989-04-01 | 1999-05-10 | 富士ゼロックス株式会社 | 文書画像処理装置 |
US5680479A (en) * | 1992-04-24 | 1997-10-21 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
US5588072A (en) * | 1993-12-22 | 1996-12-24 | Canon Kabushiki Kaisha | Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks |
JPH08284797A (ja) | 1995-04-11 | 1996-10-29 | Takeyoshi Maeda | 燃料を必要としない元始力エンジンである |
US5999647A (en) * | 1995-04-21 | 1999-12-07 | Matsushita Electric Industrial Co., Ltd. | Character extraction apparatus for extracting character data from a text image |
US5774579A (en) * | 1995-08-11 | 1998-06-30 | Canon Kabushiki Kaisha | Block selection system in which overlapping blocks are decomposed |
US5848191A (en) * | 1995-12-14 | 1998-12-08 | Xerox Corporation | Automatic method of generating thematic summaries from a document image without performing character recognition |
JPH10187890A (ja) | 1996-10-28 | 1998-07-21 | Fujitsu Ltd | 言語解析装置 |
JP4170441B2 (ja) | 1997-11-28 | 2008-10-22 | 富士通株式会社 | 文書画像傾き検出装置および文書画像傾き検出プログラムの記憶媒体 |
JP3912463B2 (ja) | 1998-09-29 | 2007-05-09 | 富士ゼロックス株式会社 | 論理構造抽出装置及び論理構造抽出方法 |
US6446035B1 (en) * | 1999-05-05 | 2002-09-03 | Xerox Corporation | Finding groups of people based on linguistically analyzable content of resources accessed |
US6993205B1 (en) * | 2000-04-12 | 2006-01-31 | International Business Machines Corporation | Automatic method of detection of incorrectly oriented text blocks using results from character recognition |
JP2002092549A (ja) | 2000-09-20 | 2002-03-29 | Ricoh Co Ltd | 文字認識方法および記録媒体 |
JP4031189B2 (ja) | 2000-09-28 | 2008-01-09 | 株式会社東芝 | 文書認識装置及び文書認識方法 |
JP4421134B2 (ja) * | 2001-04-18 | 2010-02-24 | 富士通株式会社 | 文書画像検索装置 |
JP3912215B2 (ja) | 2002-07-25 | 2007-05-09 | Jfeスチール株式会社 | 転炉吹錬制御方法 |
JP4480421B2 (ja) | 2004-03-04 | 2010-06-16 | 富士通株式会社 | 文書画像レイアウト解析プログラム |
-
2005
- 2005-03-04 JP JP2005061529A patent/JP4443443B2/ja not_active Expired - Fee Related
- 2005-07-05 US US11/175,127 patent/US7627176B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20060204096A1 (en) | 2006-09-14 |
US7627176B2 (en) | 2009-12-01 |
JP2006244309A (ja) | 2006-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4443443B2 (ja) | 文書画像レイアウト解析プログラム、文書画像レイアウト解析装置、および文書画像レイアウト解析方法 | |
US11501061B2 (en) | Extracting structured information from a document containing filled form images | |
US8131087B2 (en) | Program and apparatus for forms processing | |
JP2973944B2 (ja) | 文書処理装置および文書処理方法 | |
US8224090B2 (en) | Apparatus and method for analyzing and determining correlation of information in a document | |
US8208765B2 (en) | Search and retrieval of documents indexed by optical character recognition | |
JP5663866B2 (ja) | 情報処理装置及び情報処理プログラム | |
EP0854433A2 (en) | Caption and photo extraction from scanned document images | |
US20090028445A1 (en) | Character image feature dictionary preparation apparatus, document image processing apparatus having the same, character image feature dictionary preparation program, recording medium on which character image feature dictionary preparation program is recorded, document image processing program, and recording medium on which document image processing program is recorded | |
JP2004348591A (ja) | 文書検索方法及び装置 | |
JP6003705B2 (ja) | 情報処理装置及び情報処理プログラム | |
Yalniz et al. | Ottoman archives explorer: A retrieval system for digital Ottoman archives | |
US10438097B2 (en) | Recognition device, recognition method, and computer program product | |
KR101118628B1 (ko) | 지능형 인식 라이브러리 및 관리 도구를 활용한 고문서 이미지 데이터 인식 및 처리 방법 | |
JP2008310772A (ja) | 情報処理装置、その制御プログラムおよび該制御プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに制御方法 | |
CN114724153A (zh) | 一种表格还原方法、装置及相关设备 | |
US20130329263A1 (en) | Image processing apparatus, and image processing method and program therefor | |
JP2006309347A (ja) | 対象文書からキーワードを抽出する方法、システムおよびプログラム | |
JP4480421B2 (ja) | 文書画像レイアウト解析プログラム | |
US20080044086A1 (en) | Image processing system, image processing method, computer readable medium and computer data signal | |
JPH08320914A (ja) | 表認識方法および装置 | |
JP2001043316A (ja) | 文書画像処理方法、文書画像処理装置及び記録媒体 | |
Riba et al. | ORE Open Research Exeter | |
JP3269918B2 (ja) | 文章領域の読み順設定方法 | |
Luo | Concept-based large-scale video database browsing and retrieval via visualization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090618 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090623 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090824 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100112 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100112 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130122 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130122 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140122 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |