JP4480421B2 - 文書画像レイアウト解析プログラム - Google Patents
文書画像レイアウト解析プログラム Download PDFInfo
- Publication number
- JP4480421B2 JP4480421B2 JP2004059954A JP2004059954A JP4480421B2 JP 4480421 B2 JP4480421 B2 JP 4480421B2 JP 2004059954 A JP2004059954 A JP 2004059954A JP 2004059954 A JP2004059954 A JP 2004059954A JP 4480421 B2 JP4480421 B2 JP 4480421B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- document image
- integrated
- extracted
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Description
図21では、文書画像300において、2つのテキストブロック310、320が抽出されていることを示している。図22では、図21のようなテキストブロック310、320における行抽出結果(行a〜n)を示している。ここで、a〜hの行は正しく抽出できているが、j〜nの行は左右にわたり過統合しており、さらに、i、k、m及びnの行は上下にわたり過統合している。これらの行を文字認識しても正しい文章が得られない。
テキストブロック領域を囲む適切な空白領域の大きさは文書画像の各領域によって異なり、固定した条件では、適切な空白領域を選択することは難しい。
このような場合、テキストブロック領域330のように、図などの他の文書要素と簡単な矩形で分離できないような形で配置されているため、特許文献2の方式であるようなテキストブロック領域を囲む適切な空白領域を選択してテキストブロック領域を切り出すことは、さらに困難である。
この文書画像レイアウト解析プログラムは、コンピュータに、文書画像における空白領域を仮想的なセパレータとして抽出し、前記仮想的なセパレータを越えたテキスト要素の統合を禁止するもとで、複数の前記テキスト要素を統合して統合テキスト要素として抽出し、抽出した前記統合テキスト要素がテキストブロックとして適合か不適合かを検証し、不適合の場合は、前記空白領域の大きさを制御パラメータにより変化させ、不適合とされた前記統合テキスト要素に対して前記仮想的なセパレータを再抽出し、新たな前記統合テキスト要素を抽出する処理を再帰的に繰り返す、処理を実行させるとともに、前記コンピュータに、前記抽出した前記統合テキスト要素における行において、前記行を囲む文字列矩形内に含まれる、連結成分あるいは前記連結成分を統合したものを文字認識して認識信頼度が高いものを文字候補とし、前記文字列矩形の一角を原点とした2次元座標を用いて番号付けされた前記文字候補を含む、前記原点を一角とした矩形検査領域を前記番号順に設定し、前記矩形検査領域内に前記文字候補より後ろの前記番号の前記文字候補を含まないという条件の下で、前記文字候補の読み取り順序を決定し、統合する前記文字候補より後ろの前記読み取り順序のものを含まないという条件の下で、前記読み取り順序に応じて前記文字候補を順番に統合して生成される新たな生成行が、前記文字列矩形内において前記行の垂直方向に複数存在するときに、前記行を含んだテキストブロックをテキストブロックとして不適合であると判定する、処理を実行させる。
この文書画像レイアウト解析プログラムは、コンピュータに、文書画像における空白領域を仮想的なセパレータとして抽出し、前記仮想的なセパレータを越えたテキスト要素の統合を禁止するもとで、複数の前記テキスト要素を統合して統合テキスト要素として抽出し、抽出した前記統合テキスト要素がテキストブロックとして適合か不適合かを検証し、不適合の場合は、前記空白領域の大きさを制御パラメータにより変化させ、不適合とされた前記統合テキスト要素に対して前記仮想的なセパレータを再抽出し、新たな前記統合テキスト要素を抽出する処理を再帰的に繰り返す、処理を実行させるとともに、前記コンピュータに、前記抽出した前記統合テキスト要素内に含まれる行において、所定の行数以上の前記行が、前記統合テキスト要素内にある連結成分から推定される前記統合テキスト要素の平均文字間隔よりも大きい同一の空白領域と交差するとき、抽出された前記統合テキスト要素をテキストブロックとして不適合であると判定する、処理を実行させる。
図1は、本発明の文書画像レイアウト解析プログラムの原理を示す図である。
本発明の文書画像レイアウト解析プログラムは、文書画像レイアウトを解析する処理をコンピュータ10に機能させるプログラムである。このプログラムは、コンピュータ10に、文書画像における空白領域を仮想的なセパレータ(以下仮想セパレータという)として抽出し(ステップS1)、仮想セパレータを越えたテキスト要素の統合を禁止するもとで、複数のテキスト要素を統合して統合テキスト要素として抽出する(ステップS2)処理を実行させる。
図2乃至図5は、本発明の文書画像レイアウト解析プログラムによる文書画像レイアウト解析処理の概要を示す図である。
なお、制御パラメータは、再帰回数と統合テキスト要素の大きさやそれに含まれる文字の大きさに基づいて設定される。
また、抽出した統合テキスト要素に対して行またはテキストブロックとして適合か不適合かを検証し、その検証の結果、統合テキスト要素が不適合の場合は、行またはテキストブロックとしての条件が満たされるまで、空白領域の大きさを制御パラメータにより変化させ、仮想セパレータの再抽出及び、統合テキスト要素を抽出する処理を再帰的に繰り返すので、正しい文章として認識可能になる適切な統合テキスト要素を抽出することができる。
図6は、文書画像レイアウト解析プログラムを適用する文書画像レイアウト解析装置のハードウェア構成例である。
ROM102は、CPU101が実行する基本的なプログラムやデータを格納している。
HDD104は、CPU101が実行するOS(Operation System)や、本発明の文書画像レイアウト解析プログラムなど各種アプリケーションプログラム、図示しないスキャナなどの光学機器によって読み込んだ文書画像データなどの各種データを格納している。
通信I/F107は、例えば、インターネットなどのネットワーク120と接続して、ネットワーク120上に接続された他の装置との通信を行う。
なお、以下では、前述した統合テキスト要素はテキストブロックであるとして説明を進めるが、行であってもよい。
文書画像レイアウト解析処理は、図のように、連結成分属性付与処理(ステップS10)と、再帰的テキストブロック抽出処理(ステップS20)からなる。
図8は、連結成分属性付与処理の流れを示す一例のフローチャートである。
例えば、HDD104に格納された文書画像がCPU101の制御のもと取り出されると、その文書画像に対し、まずラベリング処理が行われる。
例えば「た」という文字成分は、黒画素による3つの連結成分201、202、203からなる。ラベリング処理では、連結成分201、202、203を囲む最小の長方形である外接矩形201a、202a、203aの座標値(XY座標)を得ることで、黒画素の連結成分の情報を取得する。このような処理を文書画像中の全ての連結成分に対し行う(ステップS11)。
図10は、階層化処理の具体例を示す図である。
この図のように連結成分220は、重なり統合の結果、例えば、文字認識結果の信頼度が高い外接矩形領域221、222、223、224を“子”として有している。このように、文字認識結果の信頼度が高い“子”をある一定数以上有している場合、その連結成分220は複数の文字を囲んだフレームである可能性があるので、連結成分220にフレームフラグ“FR”をつける(ステップS15)。
以上のような処理で、文書画像中の全ての連結成分に対して、文字成分、セパレータ、図、フレーム、ノイズのいずれかの属性を付与することができる。
図12は、再帰的テキストブロック抽出処理の流れを示す一例のフローチャートである。
文書画像における空白矩形とは、文書画像内の矩形領域であって、内部に黒画素を含まないものである。そして、空白矩形の集合のうち、自分以外に自分自身を含む空白矩形が存在しないものを極大空白矩形という。
文書画像内のある矩形領域Pを表している。この矩形領域P内には、図7のステップ10で説明した処理により得られた外接矩形の集合S={Ri∈P,i=1,2,…,n}が与えられている(図ではn=5の場合について示している)。ここで、矩形領域Pにおける空白矩形(以下PにおけるS空白矩形と称す)の集合を、矩形領域P内の矩形領域であり、集合Sに属する全ての矩形と重ならないものとする。また、PにおけるS空白矩形の集合のうち、自分以外に自分自身を含むPにおけるS空白矩形が存在しないものをPにおけるS極大空白矩形という。以下、PにおけるS極大空白矩形の集合をM(P,S)で表す。図13では、M(P,S)のうち矩形領域P内で最大となる、PにおけるS極大空白矩形230を示している。
Mn,x(P,S)={T∈M(P,S)|min(TX,TY)≧n and max(TX,TY)≧x}
ここで、TXはM(P,S)に含まれるPにおけるS極大空白矩形Tの横(X方向)の長さを表し、TYはTの縦(Y方向)の長さを表す。min(TX,TY)≧nは、TX,TYのうち短いほうが制御パラメータn以上であることを示し、max(TX,TY)≧xはTX,TYのうち長いほうが制御パラメータx以上であることを示す(ステップS21)。
ところで、前述した連結成分属性付与処理によって外接矩形に付与された属性をもとに、外接矩形の集合Sのうち、文字成分の外接矩形の集合を“C”、フレームやセパレータ、図など文字成分以外の外接矩形の集合を“H”として、“H”は、他の外接矩形との統合を禁止するリンク禁止領域として分類されているものとする。
すなわち、i<lであるか否かを判断し(ステップS25)、i<lである場合には、抽出したテキストブロックBiがテキストブロック適合性条件(詳細は後述する)を満たすか否かを判断し(ステップS26)、満たす場合にはiをインクリメントして(ステップS27)、ステップS24の処理に戻る。i=lとなった場合、すなわち矩形領域P内の全てのテキストブロックBiがテキストブロック適合性条件を満たした場合には、文書画像内の矩形領域Pに対する処理を終了して、別の矩形領域に対してステップS21からの処理を繰り返す(リターン)。
ステップS23の処理におけるテキストブロック抽出結果が、テキストブロックとしての条件(テキストブロック適合性条件)を満たすかどうかを判断するために、以下の2つの処理を行う。
ステップS30:テキストブロックを構成する各行について、行が、行の方向(縦または横)の垂直方向にわたって、文字を2文字以上含まないか判断する。
図のようにテキストブロック240において、行241〜245が得られているものとする。このとき、行242、244、245については、行方向の垂直方向にわたり2文字以上の文字を含んでいる。すなわち、抽出された行はその領域内に、行の垂直方向に複数の行を有している。このような行242、244、245は、文字認識を行っても正しい文章が得られないため、行として不適合であるとともに、このような行242、244、245を含むテキストブロック240は、テキストブロックとして不適合であると判定される。
図16は、図15のテキストブロックの空白領域を示した図である。
図17は、テキストブロック適合性検証処理の1つめの処理の詳細を示すフローチャートである。
行生成は、行Ljにおける文字候補MLjに付与される読み取り順序に応じて生成される。
行Ljに含まれる文字候補MLj(外接矩形で図示している)は、例えば、その外接矩形の左上点のY座標の小さい順にソートされる。Y座標が同一の場合は、X座標が小さい順にソートされる。これにより、文字候補MLjは、図のように番号(1)〜(16)と番号付けされる。
文字候補MLjを図18で示したような処理で決定した読み取り順序(付与された読み取り番号)に従って順に統合して、新たに行Ljkを生成する。ここで、図19のように、読み取り番号5の文字候補MLjを統合して外接矩形271(点線で図示している)で表される行Ljkを生成しようとすると、読み取り番号5より後ろの、読み取り番号8の文字候補MLjがその外接矩形271に含まれてしまう。この場合、読み取り番号5の文字候補MLjの統合をせず、読み取り番号1〜4の文字候補MLjを1つの行Lj1として確定する。このように、統合する文字候補MLjより後ろの読み取り順序のものを含まないという条件の下で、読み取り順序に応じて文字候補MLjを順番に統合して新たな生成行とする。同様にして、図のように新たに行Lj2、Lj3、Lj4が生成される(ステップS34)。
図20は、テキストブロック適合性検証処理の2つめの処理の詳細を示すフローチャートである。
以上のように、本発明によれば、従来技術では困難であった、テキストブロック同士が入り組んで配置されている場合や、テキストブロックと図が入り組んで配置されている場合や、テキストブロックが他の文書要素と矩形で分離できない形で配置されている場合であっても、テキストブロックを正しく抽出することができる。これにより、雑誌や広告などの複雑なレイアウト構造を持つ文書に対して、テキストブロックを高精度に抽出することができる。
(付記1) 文書画像レイアウトを解析する処理をコンピュータに機能させる文書画像レイアウト解析プログラムにおいて、
コンピュータに、
文書画像における空白領域を仮想的なセパレータとして抽出し、
前記仮想的なセパレータを越えたテキスト要素の統合を禁止するもとで、複数の前記テキスト要素を統合して統合テキスト要素として抽出する、
処理を実行させることを特徴とする文書画像レイアウト解析プログラム。
抽出した前記統合テキスト要素が行またはテキストブロックとして適合か不適合かを検証し、
不適合の場合は、前記空白領域の大きさを制御パラメータにより変化させ、不適合とされた前記統合テキスト要素に対して前記仮想的なセパレータを再抽出し、新たな前記統合テキスト要素を抽出する処理を再帰的に繰り返す、
処理を更に実行させることを特徴とする付記1記載の文書画像レイアウト解析プログラム。
前記文字列矩形の一角を原点とし、前記原点を一角として前記文字候補を含むような矩形検査領域を設定し、
前記矩形検査領域内に前記文字候補より後ろの読み取り順序のものを含まないという条件の下で、前記文字候補の前記読み取り順序を決定し、
統合する前記文字候補より後ろの前記読み取り順序のものを含まないという条件の下で、前記読み取り順序に応じて前記文字候補を順番に統合して生成される新たな生成行が、前記文字列矩形内において前記行の垂直方向に複数存在するときに、前記行を行として不適合であると判定することを特徴とする付記2記載の文書画像レイアウト解析プログラム。
前記文字列矩形の一角を原点とし、前記原点を一角として前記文字候補を含むような矩形検査領域を設定し、
前記矩形検査領域内に前記文字候補より後ろの読み取り順序のものを含まないという条件の下で、前記文字候補の前記読み取り順序を決定し、
統合する前記文字候補より後ろの前記読み取り順序のものを含まないという条件の下で、前記読み取り順序に応じて前記文字候補を順番に統合して生成される新たな生成行が、前記文字列矩形内において前記行の垂直方向に複数存在するときに、前記行を含んだテキストブロックをテキストブロックとして不適合であると判定することを特徴とする付記2記載の文書画像レイアウト解析プログラム。
コンピュータに、
抽出した前記行において、前記行を囲む文字列矩形内に含まれる、連結成分あるいは前記連結成分を統合したものを文字認識して認識信頼度が高いものを文字候補とし、
前記文字列矩形の一角を原点とし、前記原点を一角として前記文字候補を含むような矩形検査領域を設定し、
前記矩形検査領域内に前記文字候補より後ろの読み取り順序のものを含まないという条件の下で、前記文字候補の前記読み取り順序を決定し、
統合する前記文字候補より後ろの前記読み取り順序のものを含まないという条件の下で、前記読み取り順序に応じて前記文字候補を順番に統合して生成される新たな生成行が、前記文字列矩形内において前記行の垂直方向に複数存在するときに、抽出した前記行は行として不適合であると判定する、
処理を実行させることを特徴とする行抽出結果検証プログラム。
コンピュータに、
抽出した前記テキストブロックに含まれる行において、前記行を囲む文字列矩形内に含まれる、連結成分あるいは前記連結成分を統合したものを文字認識して認識信頼度が高いものを文字候補とし、
前記文字列矩形の一角を原点とし、前記原点を一角として前記文字候補を含むような矩形検査領域を設定し、
前記矩形検査領域内に前記文字候補より後ろの読み取り順序のものを含まないという条件の下で、前記文字候補の前記読み取り順序を決定し、
統合する前記文字候補より後ろの前記読み取り順序のものを含まないという条件の下で、前記読み取り順序に応じて前記文字候補を順番に統合して生成される新たな生成行が、前記文字列矩形内において前記行の垂直方向に複数存在するときに、前記行を含んだテキストブロックをテキストブロックとして不適合であると判定する、
処理を実行させることを特徴とするテキストブロック抽出結果検証プログラム。
コンピュータに、
抽出した前記テキストブロックに含まれる行において、所定の行数以上の前記行が、前記テキストブロック内にある連結成分から推定される前記テキストブロックの平均文字間隔よりも大きい同一の空白領域と交差するとき、抽出された前記テキストブロックをテキストブロックとして不適合であると判定する、
処理を実行させることを特徴とするテキストブロック抽出結果検証プログラム。
コンピュータに、
文書画像における空白領域を仮想的なセパレータとして抽出し、
前記仮想的なセパレータに基いて生成される閉領域を抽出することにより文書要素を抽出し、
抽出した文書要素のうちテキスト要素が行またはテキストブロックとして適合か不適合かを検証し、
不適合の場合は、前記空白領域の大きさを制御パラメータにより変化させ、不適合とされたテキスト要素に対して前記仮想的なセパレータを再抽出し、前記文書要素を抽出する処理を再帰的に繰り返す、
処理を実行させることを特徴とする文書画像レイアウト解析プログラム。
文書画像における空白領域を仮想的なセパレータとして抽出する仮想セパレータ抽出手段と、
前記仮想的なセパレータを越えたテキスト要素の統合を禁止するもとで、複数の前記テキスト要素を統合して統合テキスト要素として抽出する統合テキスト要素抽出手段と、
を有することを特徴とする文書画像レイアウト解析装置。
不適合の場合は、前記仮想セパレータ抽出手段は、前記空白領域の大きさを制御パラメータにより変化させ、不適合とされた前記統合テキスト要素に対して前記仮想的なセパレータを再抽出し、前記統合テキスト要素抽出手段は、新たな前記統合テキスト要素を抽出する処理を再帰的に繰り返すことを特徴とする付記10記載の文書画像レイアウト解析装置。
20 文書画像
21a、21b、21c、21d、21e、23a、23b、23c、23d、23e 仮想セパレータ
22a、22b、22c、22d、22e、24a、24b、24c、24d、24e、24f テキストブロック
Claims (3)
- 文書画像レイアウトを解析する処理をコンピュータに機能させる文書画像レイアウト解析プログラムにおいて、
コンピュータに、
文書画像における空白領域を仮想的なセパレータとして抽出し、
前記仮想的なセパレータを越えたテキスト要素の統合を禁止するもとで、複数の前記テキスト要素を統合して統合テキスト要素として抽出し、
抽出した前記統合テキスト要素が行として適合か不適合かを検証し、
不適合の場合は、前記空白領域の大きさを制御パラメータにより変化させ、不適合とされた前記統合テキスト要素に対して前記仮想的なセパレータを再抽出し、新たな前記統合テキスト要素を抽出する処理を再帰的に繰り返す、
処理を実行させるとともに、
前記コンピュータに、
前記抽出した前記統合テキスト要素における行において、前記行を囲む文字列矩形内に含まれる、連結成分あるいは前記連結成分を統合したものを文字認識して認識信頼度が高いものを文字候補とし、
前記文字列矩形の一角を原点とした2次元座標を用いて番号付けされた前記文字候補を含む、前記原点を一角とした矩形検査領域を前記番号順に設定し、
前記矩形検査領域内に前記文字候補より後ろの前記番号の前記文字候補を含まないという条件の下で、前記文字候補の読み取り順序を決定し、
統合する前記文字候補より後ろの前記読み取り順序のものを含まないという条件の下で、前記読み取り順序に応じて前記文字候補を順番に統合して生成される新たな生成行が、前記文字列矩形内において前記行の垂直方向に複数存在するときに、前記行を行として不適合であると判定する、
処理を実行させることを特徴とする文書画像レイアウト解析プログラム。 - 文書画像レイアウトを解析する処理をコンピュータに機能させる文書画像レイアウト解析プログラムにおいて、
コンピュータに、
文書画像における空白領域を仮想的なセパレータとして抽出し、
前記仮想的なセパレータを越えたテキスト要素の統合を禁止するもとで、複数の前記テキスト要素を統合して統合テキスト要素として抽出し、
抽出した前記統合テキスト要素がテキストブロックとして適合か不適合かを検証し、
不適合の場合は、前記空白領域の大きさを制御パラメータにより変化させ、不適合とされた前記統合テキスト要素に対して前記仮想的なセパレータを再抽出し、新たな前記統合テキスト要素を抽出する処理を再帰的に繰り返す、
処理を実行させるとともに、
前記コンピュータに、
前記抽出した前記統合テキスト要素における行において、前記行を囲む文字列矩形内に含まれる、連結成分あるいは前記連結成分を統合したものを文字認識して認識信頼度が高いものを文字候補とし、
前記文字列矩形の一角を原点とした2次元座標を用いて番号付けされた前記文字候補を含む、前記原点を一角とした矩形検査領域を前記番号順に設定し、
前記矩形検査領域内に前記文字候補より後ろの前記番号の前記文字候補を含まないという条件の下で、前記文字候補の読み取り順序を決定し、
統合する前記文字候補より後ろの前記読み取り順序のものを含まないという条件の下で、前記読み取り順序に応じて前記文字候補を順番に統合して生成される新たな生成行が、前記文字列矩形内において前記行の垂直方向に複数存在するときに、前記行を含んだテキストブロックをテキストブロックとして不適合であると判定する、
処理を実行させることを特徴とする文書画像レイアウト解析プログラム。 - 文書画像レイアウトを解析する処理をコンピュータに機能させる文書画像レイアウト解析プログラムにおいて、
コンピュータに、
文書画像における空白領域を仮想的なセパレータとして抽出し、
前記仮想的なセパレータを越えたテキスト要素の統合を禁止するもとで、複数の前記テキスト要素を統合して統合テキスト要素として抽出し、
抽出した前記統合テキスト要素がテキストブロックとして適合か不適合かを検証し、
不適合の場合は、前記空白領域の大きさを制御パラメータにより変化させ、不適合とされた前記統合テキスト要素に対して前記仮想的なセパレータを再抽出し、新たな前記統合テキスト要素を抽出する処理を再帰的に繰り返す、
処理を実行させるとともに、
前記コンピュータに、
前記抽出した前記統合テキスト要素内に含まれる行において、所定の行数以上の前記行が、前記統合テキスト要素内にある連結成分から推定される前記統合テキスト要素の平均文字間隔よりも大きい同一の空白領域と交差するとき、抽出された前記統合テキスト要素をテキストブロックとして不適合であると判定する、
処理を実行させることを特徴とする文書画像レイアウト解析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004059954A JP4480421B2 (ja) | 2004-03-04 | 2004-03-04 | 文書画像レイアウト解析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004059954A JP4480421B2 (ja) | 2004-03-04 | 2004-03-04 | 文書画像レイアウト解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005250816A JP2005250816A (ja) | 2005-09-15 |
JP4480421B2 true JP4480421B2 (ja) | 2010-06-16 |
Family
ID=35031245
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004059954A Expired - Fee Related JP4480421B2 (ja) | 2004-03-04 | 2004-03-04 | 文書画像レイアウト解析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4480421B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4443443B2 (ja) | 2005-03-04 | 2010-03-31 | 富士通株式会社 | 文書画像レイアウト解析プログラム、文書画像レイアウト解析装置、および文書画像レイアウト解析方法 |
JP5310206B2 (ja) * | 2009-04-08 | 2013-10-09 | コニカミノルタ株式会社 | 文書処理装置、文書処理方法および文書処理プログラム |
US8594422B2 (en) | 2010-03-11 | 2013-11-26 | Microsoft Corporation | Page layout determination of an image undergoing optical character recognition |
JP5577948B2 (ja) * | 2010-08-24 | 2014-08-27 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
KR102122561B1 (ko) * | 2018-11-27 | 2020-06-12 | 삼성생명보험주식회사 | 문서 이미지 상에서 글자를 인식하기 위한 방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01269184A (ja) * | 1988-04-20 | 1989-10-26 | Fujitsu Ltd | 文書中の領域境界抽出方式 |
JPH09114923A (ja) * | 1995-10-23 | 1997-05-02 | Ricoh Co Ltd | 領域分割装置 |
JPH11219407A (ja) * | 1997-11-28 | 1999-08-10 | Fujitsu Ltd | 文書画像認識装置および文書画像認識プログラムの記憶媒体 |
JP2000105836A (ja) * | 1998-09-29 | 2000-04-11 | Fuji Xerox Co Ltd | 論理構造抽出装置 |
-
2004
- 2004-03-04 JP JP2004059954A patent/JP4480421B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01269184A (ja) * | 1988-04-20 | 1989-10-26 | Fujitsu Ltd | 文書中の領域境界抽出方式 |
JPH09114923A (ja) * | 1995-10-23 | 1997-05-02 | Ricoh Co Ltd | 領域分割装置 |
JPH11219407A (ja) * | 1997-11-28 | 1999-08-10 | Fujitsu Ltd | 文書画像認識装置および文書画像認識プログラムの記憶媒体 |
JP2000105836A (ja) * | 1998-09-29 | 2000-04-11 | Fuji Xerox Co Ltd | 論理構造抽出装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2005250816A (ja) | 2005-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4443443B2 (ja) | 文書画像レイアウト解析プログラム、文書画像レイアウト解析装置、および文書画像レイアウト解析方法 | |
JP3302147B2 (ja) | 文書画像処理方法 | |
US6466694B2 (en) | Document image processing device and method thereof | |
JP2579397B2 (ja) | 文書画像のレイアウトモデルを作成する方法及び装置 | |
JP4918776B2 (ja) | 電子文書比較プログラム、電子文書比較装置および電子文書比較方法 | |
JPH08185474A (ja) | 文書画像分割装置 | |
JPH0668301A (ja) | 文字認識方法及び装置 | |
US20100211871A1 (en) | Information processor, information processing method, and computer readable medium | |
Zhou et al. | Easy generation of personal Chinese handwritten fonts | |
US20120134591A1 (en) | Image processing apparatus, image processing method and computer-readable medium | |
JP4549400B2 (ja) | 文書認識プログラム、文書認識装置、および文書認識方法 | |
JP4480421B2 (ja) | 文書画像レイアウト解析プログラム | |
JPH11184894A (ja) | 論理要素抽出方法および記録媒体 | |
JP2009251872A (ja) | 情報処理装置及び情報処理プログラム | |
KR101118628B1 (ko) | 지능형 인식 라이브러리 및 관리 도구를 활용한 고문서 이미지 데이터 인식 및 처리 방법 | |
JPH10214340A (ja) | 矩形分類方法 | |
JP5009256B2 (ja) | 文書データ作成装置、文書データ作成方法および文書データ作成プログラム | |
US8077977B2 (en) | Image processing system, image processing method, computer readable medium and computer data signal | |
JP4390523B2 (ja) | 最小領域による合成画像の分割 | |
US8165404B2 (en) | Method and apparatus for creating document data, and computer program product | |
JP2004282701A5 (ja) | ||
JP5673277B2 (ja) | 画像処理装置およびプログラム | |
JPH09120443A (ja) | 画像処理方法とその装置 | |
JP4882929B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP7365845B2 (ja) | 学習装置、学習方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070223 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090903 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100316 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100316 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130326 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140326 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |