JP2010231637A - 文書画像処理装置、文書画像処理方法および文書画像処理プログラム - Google Patents
文書画像処理装置、文書画像処理方法および文書画像処理プログラム Download PDFInfo
- Publication number
- JP2010231637A JP2010231637A JP2009080167A JP2009080167A JP2010231637A JP 2010231637 A JP2010231637 A JP 2010231637A JP 2009080167 A JP2009080167 A JP 2009080167A JP 2009080167 A JP2009080167 A JP 2009080167A JP 2010231637 A JP2010231637 A JP 2010231637A
- Authority
- JP
- Japan
- Prior art keywords
- heading
- candidate
- headline
- feature
- document image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Processing Or Creating Images (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】読み順が大領域の直前に位置する小領域を第1の候補として判定するステップ(S14)と、第1の候補ごとに、関連付けられる大領域の特徴との差異に基づいて各第1の候補が見出しであるか否かの評価処理を行なうステップ(S16)と、読み順が第1の見出しの直前に位置する小領域を第2の候補として判定するステップ(S20)と、第2の候補ごとに、関連付けられる第1の見出しの特徴との差異に基づいて各第2の候補が見出しであるか否かの評価処理を行なうステップ(S24)と、第1の見出しおよび第2の見出しと判定された小領域を、見出し領域として抽出するステップ(S28)とを備える。
【選択図】図7
Description
従来例1では、特定のサイズである10ポイント以上の領域を見出しとし、10ポイント未満であれば見出しとはしないという特徴区分を設けるとする。その場合、図41(A)の文書では、図42に示されるように、領域1a,3aを見出しとして正しく抽出することができる。
(全体システム構成)
本実施の形態においては、代表的に、本発明に係る文書画像処理装置の一形態であるMFP(Multi Function Peripheral)について説明する。なお、本発明に係る文書画像処理装置は、MFPに限らず、複写機、ファクシミリ装置、スキャナ装置などにも適用可能である。
図2を参照して、MFP1は、制御部100と、メモリ部102と、画像読取部104と、プリント部106と、通信インターフェイス部108と、データ格納部110とを含む。
図3を参照して、パーソナルコンピュータPCは、オペレーティングシステム(OS:Operating System)を含む各種プログラムを実行するCPU(Central Processing Unit)201と、CPU201でのプログラムの実行に必要なデータを一時的に記憶するメモリ部213と、CPU201で実行されるプログラムを不揮発的に記憶するハードディスク部(HDD:Hard Disk Drive)211とを含む。また、ハードディスク部211には、MFP1で生成された電子化文書を表示するための閲覧アプリケーションが記憶されており、このようなプログラムは、入出力インターフェイス部217またはCD−ROMドライブ215によって、それぞれメモリカード(たとえばSDカード)217aまたはCD−ROM(Compact Disk-Read Only Memory)215aなどから読取られる。
図4を参照して、MFP1の機能構成としては、画像読取部104と、画像前処理部12と、画像バッファ部13と、圧縮処理部14と、電子化文書生成部15と、画像解析部16と、しおりデータ生成部17と、送信部18と、画像処理部19と、プリント部106とを含む。MFP1の機能は、主としてMFP1の制御部100やメモリ部102(図2)などによって実現される。
抽出部164は、評価処理部163により見出しと判定された小領域を、見出し領域として抽出する。抽出された見出し領域の情報(位置情報など)は、しおりデータ生成部17へ送られる。
図5を参照して、電子化文書400は、ヘッダ部402と、文書画像部404と、しおりデータ部406と、フッタ部408とからなる。ヘッダ部402およびフッタ部408には、電子化文書400の属性についての情報、たとえば作成日時・作成者・著作権情報などが格納される。文書画像部404には、各ページに対応する文書画像が格納される。なお、この文書画像は、上述したように圧縮された状態で格納されてもよい。しおりデータ部406には、文書画像に含まれる見出し領域すなわち、見出しと判定された文字列要素領域を特定するためのしおりデータが格納される。
MFP1が実行する処理のうち、画像解析部16が実行する見出し領域抽出処理が最も特徴的な処理である。したがって、以下に、見出し領域抽出処理の詳細について説明する。
図10(A)には、図7のステップS6で判別された行領域の一部が示されていると仮定する。図10(B)には、図10(A)に示した行領域に対して行なわれた文字列要素領域の判別結果が示される。
図11には、ページ単位で生成された文字列要素領域の例が示されている。
図16を参照して、上述の見出し1候補領域2,5,7,11,15,18,22は、それぞれに関連付けられる大領域と区分可能な特徴区分として、次のような特徴区分が設定されている。すなわち、見出し1候補を含む区分として、インデント量0.5以上1.5未満(「0.5,1.5」)が設定され、大領域を含む区分として、0.5未満1.5以下(見出し1候補の区分以外)が設定されている。
図17に示されるように、見出し1候補領域2のインデント量が1.0であり、それに関連付けられた大領域3のインデント量が0であるとする。その場合、図18に示されるように、見出し1候補と、それに関連付けられる大領域との中央値を求める。そして、見出し1候補の近傍で中央値を含む区間を“見出し1候補を含む区分”とする。つまり、本実施の形態では、見出し1候補の特徴値の前後所定範囲を見出し1を含む区分として設定する。それ以外を“大領域を含む区分”とする。
=((Ka1×(Ca1―Ca2)―Ka2×(Ca3―Ca4))*Ka3)
/(Sa1+Sa2) …(1)
ただし、Ca1:a−i)の個数、Ca2:a−ii)の個数、Ca3:a−iii)の個数、Ca4:a−iv)の個数、Sa1:見出し1候補の個数の総数、Sa2:大領域の個数の総数、Ka1,Ka2:係数(それぞれ:1)、Ka3:係数(:10)とする。
なお、見出し評価度の算出は、以下の式(2)のように、見出し1候補の個数のみから求めることも可能である。
=((Ka1×(Ca1)―Ka2×(Ca3))*Ka3)/(Sa1) …(2)
あるいは、見出し評価度の算出は、以下の式(3)のように、大領域の個数のみから求めることも可能である。
=((Ka2×(Ca4))*Ka3―Ka1×(Ca2))/(Sa2) …(3)
図7を再度参照して、上述のような見出し1候補評価処理が終わると、変数Nを“1”とする(ステップS18)。変数Nは、大領域を基準とした配置順位(階層)を管理するためのものである。
図22において、見出し2候補(文字列要素領域1,4,10,14,17,21)をハッチングで示している。見出し2候補は、見出し1と判定された領域2,5,7,11,15,18,22の直前(直上)に存在している。
ステップS24において、見出しN+1候補評価処理を実行する。
図26を参照して、見出し2候補10,14については、b−i)の個数すなわち、行頭文字種が数字である見出し2候補の個数は、4個(領域10,14,17,21)である。b−ii)の個数すなわち、行頭文字種が数字である見出し1の個数は、0個である。b−iii)の個数すなわち、行頭文字種が数字以外である見出し2候補の個数は、2個(領域1,4)である。b−iv)の個数すなわち、行頭文字種が数字以外である見出し1の個数は、8個(領域2,5,7,9,11,15,18,22)である。
=((Kb1×(Cb1―Cb2)―Kb2×(Cb3―Cb4))*Kb3)
/(Sb1+Sb2) …(4)
ただし、Cb1:b−i)の個数、Cb2:b−ii)の個数、Cb3:b−iii)の個数、Cb4:b−iv)の個数、Sb1:見出しN+1候補の個数の総数、Sb2:見出しNの個数の総数、Kb1,Kb2:係数(それぞれ:1)、Kb3:係数(:10)とする。
再び図7を参照して、見出しN+1候補評価処理が終わると、変数Nを1だけインクリメントし(ステップS26)、ステップS20に戻る。そして、見出しN+1候補が存しなくなるまで、ステップS20〜S26の処理が繰り返される。
上述のように、本実施の形態によると、設定した特徴区分により見出しNおよび見出しN+1候補をグループ化することで、階層的な見出しを持つ文書に対して見出し領域を適切に抽出することができる。その結果、適切なしおりを付加したPDFを生成することができる。
上記実施の形態では、見出しN+1候補の特徴と見出しNの特徴とを比較して、見出しN+1候補と、それに関連付けられる見出しNとを区分可能な特徴区分を設定した。
上記実施の形態では、見出しN+1候補についての見出し評価度の算出には、上記式(4)を用いた。
本変形例では、入力され文書画像のデータから、図34に示すように、ページPG1bにおいて、文字列要素領域CE1b〜CE16bが抽出されているものとする。ページPG1bに示す文書は、「見出し2候補」に相当する文字列要素領域1b,4b,10b,14bのインデント量にばらつきがある。
…(5)
なお、上述のように、Cb2:第3の区分(見出しN+1候補を含む特徴区分)に含まれる見出しNの個数(b−ii)の個数)、Cb4:第4の区分(関連する見出しNを含む特徴区分)に含まれる見出しNの個数(b−iv)の個数)、Sb2:見出しNの個数の総数、Kb1,Kb2:係数(それぞれ:1)、Kb3:係数(:10)である。
=((Kb1×(Cb1)―Kb2×(Cb3))*Kb3)/(Sb1) …(6)
あるいは、個数Cb2,Cb3によるマイナス評価を除いて、評価度の算出を簡略化してもよい。つまり、以下のような式(7)〜(9)を用いて、見出し評価度を算出してもよい。
/(Sb1+Sb2) …(7)
見出し評価度=((Kb1×(Cb1)3)/(Sb1) …(8)
見出し評価度=((Kb2×(Cb4))*Kb3)/(Sb2) …(9)
このような式(7)〜(9)を用いた見出し度の評価は、スタイルの統一性が低い文書に対して有効的である。
上記の実施の形態では、図23のステップS308において、見出しN+1候補群と見出しN群をグループ化した。しかしながら、本来見出しとなるべき小領域であっても、つまり、見出しN+1の階層と同じ階層の小領域があったとしても、同じ見出しN+1候補群とならない可能性がある。たとえば、当該小領域と大領域との距離の相違等の理由により、小領域が見出し1にならなかった場合には、小領域は、見出しN+1にもならない。このような不都合を解消するために、ステップS312(見出しN+1の決定)の後で、見出しN+1と同じ特徴を持つ小領域があるかどうかを検索する。そして、あると判断されれば、その小領域を新たな見出しN+1として追加する処理を追加してもよい。
Claims (13)
- 文書画像から、見出し領域を抽出するための文書画像処理装置であって、
前記文書画像を構成する複数の文字列要素領域を小領域と大領域とに分類するための分類手段と、
読み順が前記大領域の直前に位置する小領域を第1の候補として判定するための第1の候補判定手段と、
前記第1の候補ごとに、関連付けられる大領域の特徴との差異に基づいて各前記第1の候補が見出しであるか否かの評価処理を行なうことにより、前記第1の候補の少なくとも一部を第1の見出しと判定するための第1の評価処理手段と、
読み順が前記第1の見出しの直前に位置する小領域を第2の候補として判定するための第2の候補判定手段と、
前記第2の候補ごとに、関連付けられる第1の見出しの特徴との差異に基づいて各前記第2の候補が見出しであるか否かの評価処理を行なうことにより、前記第2の候補の少なくとも一部を第2の見出しと判定するための第2の評価処理手段と、
前記第1の見出しおよび前記第2の見出しと判定された小領域を、前記見出し領域として抽出するための抽出手段とを備える、文書画像処理装置。 - 前記第1の評価処理手段は、
前記第1の候補ごとに、複数のスタイル種別のうち、前記関連付けられる大領域と特徴が異なるスタイル種別について、前記第1の候補の特徴を含み、かつ、前記関連付けられる大領域の特徴を含まない第1の特徴区分を設定するための第1の設定手段と、
設定された前記第1の特徴区分に含まれる特徴を有する、前記関連付けられる大領域および前記第1の候補の少なくとも一方をグループ化するための第1のグループ化手段と、
前記第1の候補ごとに、前記第1のグループ化手段によりグループ化された各領域群の大きさに基づいて、第1の見出し評価度を算出するための第1の算出手段と、
算出された前記第1の見出し評価度に基づいて、各前記第1の候補の論理要素が見出しであるか否かを判定するため第1の見出し判定手段とを含み、
前記第2の評価処理手段は、
前記第2の候補ごとに、前記複数のスタイル種別のうち、前記関連付けられる第1の見出しと特徴が異なるスタイル種別について、前記第2の候補の特徴を含み、かつ、前記関連付けられる第1の見出しの特徴を含まない第2の特徴区分を設定するため第2の設定手段と、
設定された前記第2の特徴区分に含まれる特徴を有する、前記関連付けられる第1の見出しおよび前記第2の候補の少なくとも一方をグループ化するための第2のグループ化手段と、
前記第2の候補ごとに、前記第2のグループ化手段によりグループ化された各領域群の大きさに基づいて、第2の見出し評価度を算出するための第2の算出手段と、
算出された前記第2の見出し評価度に基づいて、各前記第2の候補の論理要素が見出しであるか否かを判定するため第2の見出し判定手段とを含む、請求項1に記載の文書画像処理装置。 - 前記第2のグループ化手段は、前記第2の候補ごとに、前記第2の特徴区分に含まれる特徴を有する、前記関連付けられる第1の見出しおよび前記第2の候補の両方をグループ化し、
前記第2の算出手段は、第1の見出し群および第2の候補群の大きさから、前記第2の評価度を算出する、請求項2に記載の文書画像処理装置。 - 前記第2のグループ化手段は、さらに、前記第2の候補ごとに、前記第2の特徴区分に含まれない特徴を有する、前記関連付けられる第1の見出しおよび前記第2の候補の少なくとも一方をグループ化し、
前記第2の算出手段は、さらに、前記第2の特徴区分に含まれない各領域群の大きさを、前記第2の評価度の算出に用いる、請求項2または3に記載の文書画像処理装置。 - 前記第2の設定手段は、さらに、前記第2の候補ごとの前記第2の見出し評価度の値に差異がなければ、前記第2の特徴区分を変更する、請求項2〜4のいずれかに記載の文書画像処理装置。
- 前記複数のスタイル種別は、インデント量、行揃え、前後の文字列要素領域との距離、文字列修飾、先頭文字種、終端文字種、言語種別、文字サイズ、行高さ、文字間隔、フォント、文字修飾、文字色、背景色のうちのいずれかを含む、請求項2〜5のいずれかに記載の文書画像処理装置。
- 前記第2のグループ化手段は、前記第2の候補の特徴値の前後所定範囲を前記第2の特徴区分として設定する、請求項2〜6のいずれかに記載の文書画像処理装置。
- 前記第2のグループ化手段は、前記第2の候補の特徴値と前記関連付けられる第1の見出しの特徴値との間を区切り点とし、前記区切り点よりも前記第2の候補の特徴値側の特徴を含むように前記第2の特徴区分を設定する、請求項2〜6のいずれかに記載の文書画像処理装置。
- 前記第2の見出しと判定された小領域および他の小領域の特徴を比較し、前記他の小領域のうち前記判定された小領域と類似した特徴を有する小領域を、新たな第2の見出しとして判定するための手段をさらに備える、請求項1〜8のいずれかに記載の文書画像処理装置。
- 前記第2の見出しが抽出された場合に、前記第2の見出しを前記第1の見出しに置き換えて、前記第2の候補判定手段および前記第2の評価処理手段の処理を繰り返すための手段をさらに備える、請求項1〜9のいずれかに記載の文書画像処理装置。
- 前記第2の評価処理手段は、前記第2の候補ごとに、前記関連付けられる第1の見出しについての前記関連付けられる大領域の特徴と比較し、対応の前記関連付けられる大領域の特徴と類似する前記第2の候補を、見出しの候補から除外するための手段をさらに含む、請求項1〜10のいずれかに記載の文書画像処理装置。
- 文書画像を記憶する記憶部を備えた文書画像処理装置によって実行される、前記記憶部に記憶された前記文書画像から見出し領域を抽出するための方法であって、
前記文書画像を構成する複数の文字列要素領域を小領域と大領域とに分類するステップと、
読み順が前記大領域の直前に位置する小領域を第1の候補として判定するステップと、
前記第1の候補ごとに、関連付けられる大領域の特徴との差異に基づいて各前記第1の候補が見出しであるか否かの評価処理を行なうことにより、前記第1の候補の少なくとも一部を第1の見出しと判定するステップと、
読み順が前記第1の見出しの直前に位置する小領域を第2の候補として判定するステップと、
前記第2の候補ごとに、関連付けられる第1の見出しの特徴との差異に基づいて各前記第2の候補が見出しであるか否かの評価処理を行なうことにより、前記第2の候補の少なくとも一部を第2の見出しと判定するステップと、
前記第1の見出しおよび前記第2の見出しと判定された小領域を、前記見出し領域として抽出するステップとを備える、文書画像処理方法。 - 文書画像から見出し領域を抽出するためのプログラムであって、
前記文書画像を構成する複数の文字列要素領域を小領域と大領域とに分類するステップと、
読み順が前記大領域の直前に位置する小領域を第1の候補として判定するステップと、
前記第1の候補ごとに、関連付けられる大領域の特徴との差異に基づいて各前記第1の候補が見出しであるか否かの評価処理を行なうことにより、前記第1の候補の少なくとも一部を第1の見出しと判定するステップと、
読み順が前記第1の見出しの直前に位置する小領域を第2の候補として判定するステップと、
前記第2の候補ごとに、関連付けられる第1の見出しの特徴との差異に基づいて各前記第2の候補が見出しであるか否かの評価処理を行なうことにより、前記第2の候補の少なくとも一部を第2の見出しと判定するステップと、
前記第1の見出しおよび前記第2の見出しと判定された小領域を、前記見出し領域として抽出するステップとをコンピュータに実行させる、文書画像処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009080167A JP5412916B2 (ja) | 2009-03-27 | 2009-03-27 | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム |
US12/727,311 US8611666B2 (en) | 2009-03-27 | 2010-03-19 | Document image processing apparatus, document image processing method, and computer-readable recording medium having recorded document image processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009080167A JP5412916B2 (ja) | 2009-03-27 | 2009-03-27 | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010231637A true JP2010231637A (ja) | 2010-10-14 |
JP5412916B2 JP5412916B2 (ja) | 2014-02-12 |
Family
ID=42783826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009080167A Expired - Fee Related JP5412916B2 (ja) | 2009-03-27 | 2009-03-27 | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8611666B2 (ja) |
JP (1) | JP5412916B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160110151A (ko) * | 2015-03-09 | 2016-09-21 | 캐논 가부시끼가이샤 | 시스템 및 제어 방법 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10162809B2 (en) * | 2013-10-11 | 2018-12-25 | Conduent Business Services, Llc | Method and apparatus for customized handwriting entry zones |
US9454696B2 (en) | 2014-04-17 | 2016-09-27 | Xerox Corporation | Dynamically generating table of contents for printable or scanned content |
US10713519B2 (en) * | 2017-06-22 | 2020-07-14 | Adobe Inc. | Automated workflows for identification of reading order from text segments using probabilistic language models |
US11494555B2 (en) * | 2019-03-29 | 2022-11-08 | Konica Minolta Business Solutions U.S.A., Inc. | Identifying section headings in a document |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0888755A (ja) * | 1994-09-19 | 1996-04-02 | Sharp Corp | 画像処理装置 |
JPH09297765A (ja) * | 1996-05-01 | 1997-11-18 | Ricoh Co Ltd | 文書画像処理方法 |
JPH11250041A (ja) * | 1998-02-27 | 1999-09-17 | Toshiba Corp | 文書処理装置および文書処理方法 |
JP2006350867A (ja) * | 2005-06-17 | 2006-12-28 | Ricoh Co Ltd | 文書処理装置、文書処理方法、プログラム及び情報記録媒体 |
JP2008305088A (ja) * | 2007-06-06 | 2008-12-18 | Konica Minolta Business Technologies Inc | 文書処理装置、文書処理方法および文書処理プログラム |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0823864B2 (ja) * | 1986-03-29 | 1996-03-06 | 株式会社東芝 | 見出し判定方法 |
CA2078423C (en) * | 1991-11-19 | 1997-01-14 | Per-Kristian Halvorsen | Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information |
US5689342A (en) * | 1994-11-17 | 1997-11-18 | Canon Kabushiki Kaisha | Image processing method and apparatus which orders text areas which have been extracted from an image |
US5892842A (en) * | 1995-12-14 | 1999-04-06 | Xerox Corporation | Automatic method of identifying sentence boundaries in a document image |
US6327387B1 (en) * | 1996-12-27 | 2001-12-04 | Fujitsu Limited | Apparatus and method for extracting management information from image |
US7099507B2 (en) * | 1998-11-05 | 2006-08-29 | Ricoh Company, Ltd | Method and system for extracting title from document image |
JP2000251067A (ja) | 1999-02-25 | 2000-09-14 | Sumitomo Metal Ind Ltd | 文書解析方法及び装置並びに記録媒体 |
KR100319756B1 (ko) * | 2000-01-21 | 2002-01-09 | 오길록 | 논문 문서영상 구조 분석 방법 |
US20030042319A1 (en) * | 2001-08-31 | 2003-03-06 | Xerox Corporation | Automatic and semi-automatic index generation for raster documents |
JP4218758B2 (ja) * | 2004-12-21 | 2009-02-04 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 字幕生成装置、字幕生成方法、及びプログラム |
JPWO2006112507A1 (ja) * | 2005-04-20 | 2008-12-11 | 株式会社アイ・ピー・ビー | 調査対象文書の索引語抽出装置及び文書特徴分析装置 |
US9098581B2 (en) * | 2005-07-27 | 2015-08-04 | Hewlett-Packard Development Company, L.P. | Method for finding text reading order in a document |
KR100664311B1 (ko) * | 2005-11-18 | 2007-01-04 | 삼성전자주식회사 | 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법 |
US7743327B2 (en) * | 2006-02-23 | 2010-06-22 | Xerox Corporation | Table of contents extraction with improved robustness |
US8189920B2 (en) * | 2007-01-17 | 2012-05-29 | Kabushiki Kaisha Toshiba | Image processing system, image processing method, and image processing program |
JP4398988B2 (ja) * | 2007-03-26 | 2010-01-13 | 株式会社東芝 | 構造化文書を管理する装置、方法およびプログラム |
US20090110288A1 (en) * | 2007-10-29 | 2009-04-30 | Kabushiki Kaisha Toshiba | Document processing apparatus and document processing method |
US8233671B2 (en) * | 2007-12-27 | 2012-07-31 | Intel-Ge Care Innovations Llc | Reading device with hierarchal navigation |
-
2009
- 2009-03-27 JP JP2009080167A patent/JP5412916B2/ja not_active Expired - Fee Related
-
2010
- 2010-03-19 US US12/727,311 patent/US8611666B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0888755A (ja) * | 1994-09-19 | 1996-04-02 | Sharp Corp | 画像処理装置 |
JPH09297765A (ja) * | 1996-05-01 | 1997-11-18 | Ricoh Co Ltd | 文書画像処理方法 |
JPH11250041A (ja) * | 1998-02-27 | 1999-09-17 | Toshiba Corp | 文書処理装置および文書処理方法 |
JP2006350867A (ja) * | 2005-06-17 | 2006-12-28 | Ricoh Co Ltd | 文書処理装置、文書処理方法、プログラム及び情報記録媒体 |
JP2008305088A (ja) * | 2007-06-06 | 2008-12-18 | Konica Minolta Business Technologies Inc | 文書処理装置、文書処理方法および文書処理プログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160110151A (ko) * | 2015-03-09 | 2016-09-21 | 캐논 가부시끼가이샤 | 시스템 및 제어 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP5412916B2 (ja) | 2014-02-12 |
US8611666B2 (en) | 2013-12-17 |
US20100245875A1 (en) | 2010-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6336124B1 (en) | Conversion data representing a document to other formats for manipulation and display | |
JP4590433B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
US8508756B2 (en) | Image forming apparatus having capability for recognition and extraction of annotations and additionally written portions | |
EP2162859B1 (en) | Image processing apparatus, image processing method, and computer program | |
KR102403964B1 (ko) | 화상 처리 장치, 화상 처리 방법, 및 저장 매체 | |
US8170862B2 (en) | Document image processing device and document image processing program for maintaining layout in translated documents | |
US8538154B2 (en) | Image processing method and image processing apparatus for extracting heading region from image of document | |
JP5412903B2 (ja) | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム | |
JP5915628B2 (ja) | 画像形成装置、テキストデータの埋め込み方法及び埋め込みプログラム | |
JP2010020468A (ja) | 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体 | |
JP4785655B2 (ja) | 文書処理装置及び文書処理方法 | |
JP2009146064A (ja) | 画像処理装置、画像処理方法、そのプログラム及び記憶媒体 | |
JPWO2021084702A1 (ja) | 文書画像解析装置、文書画像解析方法およびプログラム | |
JP2011065621A (ja) | 情報処理装置及び情報処理プログラム | |
JP5412916B2 (ja) | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム | |
CN110245570B (zh) | 扫描文本分段方法、装置、计算机设备和存储介质 | |
US9049400B2 (en) | Image processing apparatus, and image processing method and program | |
US20120014612A1 (en) | Document processing apparatus and computer readable medium | |
JP2004363786A (ja) | 画像処理装置 | |
JP2019125353A (ja) | 電子文書中の文字列塊を推測する方法 | |
JP2007310501A (ja) | 情報処理装置、その制御方法、及びプログラム | |
JP2012015896A (ja) | 画像処理装置 | |
JP5098614B2 (ja) | 文章処理装置の制御方法および文章処理装置 | |
JP5310206B2 (ja) | 文書処理装置、文書処理方法および文書処理プログラム | |
US20230205910A1 (en) | Information processing device, confidentiality level determination program, and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110905 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130219 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130410 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20130415 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131015 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131028 |
|
LAPS | Cancellation because of no payment of annual fees |