JP4856925B2 - 画像処理装置、画像処理方法及び画像処理プログラム - Google Patents
画像処理装置、画像処理方法及び画像処理プログラム Download PDFInfo
- Publication number
- JP4856925B2 JP4856925B2 JP2005295412A JP2005295412A JP4856925B2 JP 4856925 B2 JP4856925 B2 JP 4856925B2 JP 2005295412 A JP2005295412 A JP 2005295412A JP 2005295412 A JP2005295412 A JP 2005295412A JP 4856925 B2 JP4856925 B2 JP 4856925B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- extraction
- area
- extracted
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/263—Language identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Processing Or Creating Images (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
(1)言語に依存しない(多くの言語でも白地が区切りとして使われる)ので、行方向(横書き/縦書き)についての知識を必要としない。
(2)大局的な処理なので、局所的な判断間違いが累積する可能性が少ない。
(3)複雑なレイアウトにも、柔軟に対応できる。
などが挙げられる。
r⊆r′ならば、Q(r)≦Q(r′)
を満たす評価関数Qである。例えば、関数Q(r)を矩形rの面積とすると、上記の性質は満たされる。「最大白矩形問題」とは、Cの要素r0,r1,・・・,rn(ri⊂rb;i=0,1,・・・,n)と重ならないような矩形のうち、Qの値が最大になるものを見つける問題である。この問題の拡張として、非特許文献1,2においては、「極大白矩形」、すなわち、それ以上拡張するとCの要素のいずれかと重なり合ってしまうような白矩形を、Qの値が大きい順に数え上げるアルゴリズムを提案している。
図1は、本発明の第1の実施の形態にかかる画像処理装置の構成を示すブロック図である。本図に示すように画像処理装置100の内部は、画像入力処理部101と、第1の領域抽出部102と、言語種別判定部103と、属性判定部104と、抽出判断部105と、第2の領域抽出部106と、記憶部107を備え、入力処理された画像データに対してレイアウト解析処理して、文字列を含む領域を抽出する処理を行う。
t=a・min(w,h)
とすれば良い。さらに、文書領域のセパレータとしての適当でない形をした白矩形、例えば、長さが短いものや幅が狭すぎるものは、文字の間の隙間である可能性が高いので、そのような白矩形を除外するための拘束条件を設定する。これには、文書領域内にある黒矩形の大きさの分布から文字のサイズsを推定し、例えば、bを定数として、幅も高さもb・sより小さいような極大白矩形を、数え上げの際に除外するようにすれば良い。
図18は、第2の実施の形態にかかる画像処理装置1600の構成を示すブロック図である。上述した第1の実施の形態にかかる画像処理装置100とは、言語種別判定部103とは処理が異なる言語種別判定部1601に変更され、抽出判断部105とは処理が異なる抽出判断部1602に変更された構成を有している点で異なる。以下の説明では、上述した第1の実施の形態と同一の構成要素には同一の符号を付してその説明を省略している。なお、第1の実施の形態の画像処理装置100では、文書画像データ全体から言語の種別を判定していたのに対し、本実施の形態の画像処理装置1600は、文書領域毎に言語の種別を判定している点で異なる。
上述した実施の形態における画像処理装置は、第2の領域抽出部106による抽出処理の後に特に処理は行わなかった。しかしながら、本発明は、第1の領域抽出部102及び第2の領域抽出部106による抽出処理のみに制限するものではない。そこで、第3の実施の形態に係る画像処理装置1800では、さらに抽出する構成を備えた場合について説明する。
図24は、第4の実施の形態にかかる画像処理装置2400の構成を示すブロック図である。上述した第3の実施の形態にかかる画像処理装置1800とは、言語種別判定部103とは処理が異なる言語種別判定部1601に変更され、抽出判断部105とは処理が異なる抽出判断部1602に変更された構成を有している点で異なる。以下の説明では、上述した第3の実施の形態と同一の構成要素には同一の符号を付してその説明を省略している。また、言語種別判定部1601及び抽出判断部1602は、第2の実施の形態の画像処理装置1600で用いられた構成要素と同一の構成要素とし、説明を省略する。
101 画像入力処理部
102 第1の領域抽出部
103、1601 言語種別判定部
104 属性判定部
105、1602 抽出判断部
106 第2の領域抽出部
107、1801 記憶部
111 白矩形抽出部
112 白矩形分割部
121 後処理修正部
122 大文字修正部
123 読み順修正部
501 文書領域
701a 日本語縦用修正部
701b 日本語横用修正部
701c ヨーロッパ系言語用修正部
702a 日本語用大文字修正部
702b ヨーロッパ系言語用大文字修正部
703a 日本語用読み順修正部
703b ヨーロッパ系言語用読み順修正部
901 文書領域
902 文書領域
903 文書領域
1501 文書領域
1802 目的別抽出判断部
1803 第3の領域抽出部
1811a 日本語OCR用領域抽出部
1811b ヨーロッパ系言語OCR用領域抽出部
2601 CPU
2602 ROM
2603 RAM
2604 外部記憶装置
2605 表示装置
2606 入力装置
2607 通信I/F
2608 バス
2700 デジタル複合機
2701 スキャナ部
2702 プリンタ部
Claims (23)
- 文書画像データを、それ以上拡張すると内部に黒画素を含んでしまう極大白矩形の系列 をセパレータとして用いて、文字を含む文書領域毎に分割して抽出する第1の領域抽出手段と、
前記文書画像データで用いられた言語の種別を判定する種別判定手段と、
前記第1の領域抽出手段により抽出された前記文書領域に対して、前記種別判定手段により判定された言語の種別の書字方向に応じた規則に基づいて分割又は結合して文書領域を抽出する第2の領域抽出手段と、
を備えたことを特徴とする画像処理装置。 - 前記種別判定手段により判定された前記言語の種別により、前記第1の領域抽出手段により抽出された前記文書領域から、さらに抽出を行うか否か判定する抽出判定手段と、をさらに備え、
前記第2の領域抽出手段は、前記抽出判定手段により抽出すると判定された場合に、前記種別判定手段により判定された言語の種別の書字方向に応じた規則に基づいて分割又は結合して文書領域を抽出すること、
を特徴とする請求項1に記載の画像処理装置。 - 前記第1の領域抽出手段により抽出された前記文書領域の属性を判定する属性判定手段と、をさらに備え、
前記第2の領域抽出手段は、前記第1の領域抽出手段により抽出された前記文書領域に対して、前記種別判定手段により判定された前記言語の種別の書字方向、及び前記属性判定手段により判定された前記属性、に応じた規則に基づいて分割又は結合して文書領域を抽出すること、
を特徴とする請求項1に記載の画像処理装置。 - 前記種別判定手段により判定された前記言語の種別及び前記属性判定手段により判定された前記属性により、前記第1の領域抽出手段により抽出された前記文書領域から、さら に抽出を行うか否か判定する抽出判定手段と、をさらに備え、
前記第2の抽出手段は、前記抽出判定手段により抽出すると判定された場合に、前記第1の領域抽出手段により抽出された前記文書領域に対して、前記種別判定手段により判定された前記言語の種別の書字方向、及び前記属性判定手段により判定された前記属性、に応じた規則に基づいて分割又は結合して文書領域を抽出すること、
を特徴とする請求項3に記載の画像処理装置。 - 前記種別判定手段は、前記文書画像データ全体から言語の種別を判定し、
前記抽出判定手段は、前記種別判定手段により判定された前記言語の種別により、前記第1の領域抽出手段により抽出された前記文書領域に対して、さらに抽出を行うか否か判定すること、
を特徴とする請求項2に記載の画像処理装置。 - 前記種別判定手段は、前記文書画像データの、前記第1の領域抽出手段により抽出された前記文書領域毎に言語の種別を判定し、
前記抽出判定手段は、前記第1の領域抽出手段により抽出された前記文書領域毎に、前記種別判定手段により判定された前記言語の種別により、さらに抽出するか否か判定すること、
を特徴とする請求項2又は4に記載の画像処理装置。 - 前記第2の領域抽出手段により抽出された前記文書領域に対して、文書画像データを使用するアプリケーション又はタスクに応じた規則により分割又は結合にして文書領域を抽出する第3の領域抽出手段と、
を、さらに備えたことを特徴とする請求項1乃至6のいずれか1つに記載の画像処理装置。 - 前記文書画像データを使用するアプリケーション又はタスクに適した抽出を行うか否か判定する第2の抽出判定手段と、
前記第3の領域抽出手段は、前記第2の抽出判定手段により抽出すると判定された場合に、前記第2の領域抽出手段により抽出された前記文書領域に対して、前記アプリケーシ ョン又はタスクに応じた規則により分割又は結合にして文書領域を抽出すること、
を特徴とする請求項7に記載の画像処理装置。 - 前記属性判定手段は、前記文書画像データの属性として、前記第1の領域抽出手段により抽出された前記文書領域内に含まれている文字の方向及び文字サイズのうち少なくとも1つ以上を判定すること、
を特徴とする請求項3に記載の画像処理装置。 - 言語の種別と、属性と、当該言語の種別の書字方向及び当該属性に応じた抽出の規則と、を対応付けた抽出規則対応情報を記憶する記憶手段と、をさらに備え、
前記第2の領域抽出手段は、前記種別判定手段により判定された前記言語の種別と、前記属性判定手段により判定された前記属性と、前記抽出規則対応情報で対応付けられた前 記規則に基づいて、前記第1の領域抽出手段により抽出された前記文書領域に対して分割又は結合して、文書領域を抽出すること、
を特徴とする請求項3に記載の画像処理装置。 - 前記第2の領域抽出手段は、前記第1の領域抽出手段により抽出された前記文書領域に対して、異なる行方向の文字列が含まれている文書領域を行方向が異なる文字列毎に文書領域の分割、文字サイズが大きい文字を含む文書領域同士の結合、前記文書領域の読み順に従って文書領域同士の結合のうち少なくとも1つ以上を行うことで、文書領域を抽出すること、
を特徴とする請求項1乃至10のいずれか1つに記載の画像処理装置。 - 文書画像データを、それ以上拡張すると内部に黒画素を含んでしまう極大白矩形の系列 をセパレータとして用いて、文字を含む文書領域毎に分割して抽出する第1の領域抽出ステップと、
前記文書画像データで用いられた言語の種別を判定する種別判定ステップと、
前記第1の領域抽出ステップにより抽出された前記文書領域に対して、前記種別判定ステップにより判定された言語の種別の書字方向に応じた規則に基づいて分割又は結合して文書領域を抽出する第2の領域抽出ステップと、
を備えたことを特徴とする画像処理方法。 - 前記種別判定ステップにより判定された前記言語の種別により、前記第1の領域抽出ステップにより抽出された前記文書領域から、さらに抽出を行うか否か判定する抽出判定ステップと、をさらに備え、
前記第2の領域抽出ステップは、前記抽出判定ステップにより抽出すると判定された場合に、前記種別判定ステップにより判定された言語の種別の書字方向に応じた規則に基づいて分割又は結合して文書領域を抽出すること、
を特徴とする請求項12に記載の画像処理方法。 - 前記第1の領域抽出ステップにより抽出された前記文書領域の属性を判定する属性判定ステップと、をさらに備え、
前記第2の領域抽出ステップは、前記第1の領域抽出ステップにより抽出された前記文書領域に対して、前記種別判定ステップにより判定された前記言語の種別の書字方向、及び前記属性判定ステップにより判定された前記属性、に応じた規則に基づいて分割又は結合して文書領域を抽出すること、
を特徴とする請求項13に記載の画像処理方法。 - 前記種別判定ステップにより判定された前記言語の種別及び前記属性判定ステップにより判定された前記属性により、前記第1の領域抽出ステップにより抽出された前記文書領域から、さらに抽出を行うか否か判定する抽出判定ステップと、をさらに備え、
前記第2の抽出ステップは、前記抽出判定ステップにより抽出すると判定された場合に、前記第1の領域抽出ステップにより抽出された前記文書領域に対して、前記種別判定ステップにより判定された前記言語の種別の書字方向、及び前記属性判定ステップにより判定された前記属性、に応じた規則に基づいて分割又は結合して文書領域を抽出すること、
を特徴とする請求項14に記載の画像処理方法。 - 前記種別判定ステップは、前記文書画像データ全体から言語の種別を判定し、
前記抽出判定ステップは、前記種別判定ステップにより判定された前記言語の種別により、前記第1の領域抽出ステップにより抽出された前記文書領域に対して、さらに抽出を行うか否か判定すること、
を特徴とする請求項13に記載の画像処理方法。 - 前記種別判定ステップは、前記文書画像データの、前記第1の領域抽出ステップにより抽出された前記文書領域毎に言語の種別を判定し、
前記抽出判定ステップは、前記第1の領域抽出ステップにより抽出された前記文書領域毎に、前記種別判定ステップにより判定された前記言語の種別により、さらに抽出するか否か判定すること、
を特徴とする請求項13又は15に記載の画像処理方法。 - 前記第2の領域抽出ステップにより抽出された前記文書領域に対して、文書画像データを使用するアプリケーション又はタスクに応じた規則により分割又は結合にして文書領域を抽出する第3の領域抽出ステップと、
を、さらに備えたことを特徴とする請求項12乃至17のいずれか1つに記載の画像処理方法。 - 前記文書画像データを使用するアプリケーション又はタスクに適した抽出を行うか否か判定する第2の抽出判定ステップと、
前記第3の領域抽出ステップは、前記第2の抽出判定ステップにより抽出すると判定された場合に、前記第2の領域抽出ステップにより抽出された前記文書領域に対して、前記アプリケーション又はタスクに応じた規則により分割又は結合にして文書領域を抽出すること、
を特徴とする請求項18に記載の画像処理方法。 - 前記属性判定ステップは、前記文書画像データの属性として、前記第1の領域抽出ステップにより抽出された前記文書領域内に含まれている文字の方向及び文字サイズのうち少なくとも1つ以上を判定すること、
を特徴とする請求項14に記載の画像処理方法。 - 前記第2の領域抽出ステップは、言語の種別と、属性と、当該言語の種別の書字方向及 び当該属性に応じた抽出の規則と、を対応付けた、記憶手段に記憶された抽出規則対応情報から、前記種別判定ステップにより判定された前記言語の種別と、前記属性判定ステップにより判定された前記属性と、対応付けられた、前記規則に基づいて、前記第1の領域抽出ステップにより抽出された前記文書領域に対して分割又は結合して、文書領域を抽出すること、
を特徴とする請求項14に記載の画像処理方法。 - 前記第2の領域抽出ステップは、前記第1の領域抽出ステップにより抽出された前記文書領域に対して、異なる行方向の文字列が含まれている文書領域を行方向が異なる文字列毎に文書領域の分割、文字サイズが大きい文字を含む文書領域同士の結合、前記文書領域の読み順に従って文書領域同士の結合のうち少なくとも1つ以上を行うことで、文書領域を抽出すること、
を特徴とする請求項12乃至21のいずれか1つに記載の画像処理方法。 - 請求項12乃至22のいずれか1つに記載された画像処理方法をコンピュータで実行させることを特徴とする画像処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005295412A JP4856925B2 (ja) | 2005-10-07 | 2005-10-07 | 画像処理装置、画像処理方法及び画像処理プログラム |
US11/518,910 US8041113B2 (en) | 2005-10-07 | 2006-09-12 | Image processing device, image processing method, and computer program product |
CNB2006101599928A CN100424716C (zh) | 2005-10-07 | 2006-09-29 | 图像处理装置,图像处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005295412A JP4856925B2 (ja) | 2005-10-07 | 2005-10-07 | 画像処理装置、画像処理方法及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007102715A JP2007102715A (ja) | 2007-04-19 |
JP4856925B2 true JP4856925B2 (ja) | 2012-01-18 |
Family
ID=37910829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005295412A Expired - Fee Related JP4856925B2 (ja) | 2005-10-07 | 2005-10-07 | 画像処理装置、画像処理方法及び画像処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8041113B2 (ja) |
JP (1) | JP4856925B2 (ja) |
CN (1) | CN100424716C (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4977452B2 (ja) * | 2006-01-24 | 2012-07-18 | 株式会社リコー | 情報管理装置、情報管理方法、情報管理プログラム、記録媒体及び情報管理システム |
US8380650B2 (en) * | 2007-01-29 | 2013-02-19 | Nec Corporation | Information extraction rule making support system, information extraction rule making support method, and information extraction rule making support program |
CN101276363B (zh) * | 2007-03-30 | 2011-02-16 | 夏普株式会社 | 文档图像的检索装置及文档图像的检索方法 |
JP5402099B2 (ja) * | 2008-03-06 | 2014-01-29 | 株式会社リコー | 情報処理システム、情報処理装置、情報処理方法およびプログラム |
US8463738B2 (en) * | 2008-03-06 | 2013-06-11 | Nec Corporation | Attribute extraction method, system, and program |
JP4577420B2 (ja) * | 2008-07-10 | 2010-11-10 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP4577421B2 (ja) * | 2008-07-10 | 2010-11-10 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP4577419B2 (ja) * | 2008-07-10 | 2010-11-10 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP2010211439A (ja) * | 2009-03-10 | 2010-09-24 | Fuji Xerox Co Ltd | 文字出力装置およびプログラム |
JP5005005B2 (ja) | 2009-07-30 | 2012-08-22 | インターナショナル・ビジネス・マシーンズ・コーポレーション | コンテンツ読み上げ順序を視覚化するための視覚化プログラム、視覚化方法、及び視覚化装置 |
US8000528B2 (en) * | 2009-12-29 | 2011-08-16 | Konica Minolta Systems Laboratory, Inc. | Method and apparatus for authenticating printed documents using multi-level image comparison based on document characteristics |
JP5812702B2 (ja) * | 2011-06-08 | 2015-11-17 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 文字の読み順を決定するための読み順決定装置、方法及びプログラム |
JP5994251B2 (ja) * | 2012-01-06 | 2016-09-21 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
JP5652428B2 (ja) * | 2012-05-15 | 2015-01-14 | コニカミノルタ株式会社 | 画像出力装置、画像出力方法、及び、プログラム |
CN103049183B (zh) * | 2012-12-07 | 2016-06-22 | 腾讯科技(深圳)有限公司 | 一种应用于社交平台的媒体内容展示方法及系统 |
CN103902993A (zh) * | 2012-12-28 | 2014-07-02 | 佳能株式会社 | 文档图像识别方法和设备 |
JP5865856B2 (ja) | 2013-02-27 | 2016-02-17 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置及びこれを備えた画像形成装置 |
CN104376317B (zh) * | 2013-08-12 | 2018-12-14 | 福建福昕软件开发股份有限公司北京分公司 | 一种将纸质文件转换为电子文件的方法 |
JP6729486B2 (ja) * | 2017-05-15 | 2020-07-22 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置、情報処理プログラム及び情報処理方法 |
JP6554193B1 (ja) * | 2018-01-30 | 2019-07-31 | 三菱電機インフォメーションシステムズ株式会社 | 記入領域抽出装置および記入領域抽出プログラム |
JP6954229B2 (ja) * | 2018-05-25 | 2021-10-27 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置及び画像形成装置 |
JP2020027598A (ja) * | 2018-12-27 | 2020-02-20 | 株式会社シグマクシス | 文字認識装置、文字認識方法及び文字認識プログラム |
US11562593B2 (en) * | 2020-05-29 | 2023-01-24 | Microsoft Technology Licensing, Llc | Constructing a computer-implemented semantic document |
US11367296B2 (en) * | 2020-07-13 | 2022-06-21 | NextVPU (Shanghai) Co., Ltd. | Layout analysis |
CN111832476A (zh) * | 2020-07-13 | 2020-10-27 | 上海肇观电子科技有限公司 | 版面分析方法、阅读辅助设备、电路和介质 |
CN113033338B (zh) * | 2021-03-09 | 2024-03-29 | 太极计算机股份有限公司 | 电子报头版头条新闻位置识别方法及装置 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3187895B2 (ja) | 1991-05-02 | 2001-07-16 | 株式会社リコー | 文字領域抽出方法 |
EP0701220B1 (en) * | 1994-09-12 | 2001-07-04 | Adobe Systems Inc. | Method and apparatus for viewing electronic documents |
JPH103516A (ja) * | 1996-06-17 | 1998-01-06 | Canon Inc | 情報処理方法及び装置 |
JP3835652B2 (ja) * | 1997-09-10 | 2006-10-18 | 株式会社リコー | 文書画像の日本語英語判定方法および記録媒体 |
US6047251A (en) * | 1997-09-15 | 2000-04-04 | Caere Corporation | Automatic language identification system for multilingual optical character recognition |
JP3850995B2 (ja) | 1998-08-18 | 2006-11-29 | 株式会社リコー | 文書画像処理方法および文書画像処理方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体 |
US6393145B2 (en) * | 1999-01-12 | 2002-05-21 | Microsoft Corporation | Methods apparatus and data structures for enhancing the resolution of images to be rendered on patterned display devices |
JP2001056837A (ja) * | 1999-08-19 | 2001-02-27 | Ricoh Co Ltd | 文書認識方法および記録媒体 |
JP4521942B2 (ja) | 2000-07-24 | 2010-08-11 | キヤノン株式会社 | 文書管理装置及び方法 |
JP3962891B2 (ja) * | 2000-08-09 | 2007-08-22 | 富士ゼロックス株式会社 | 文書画像処理装置、文書画像処理方法、及び記憶媒体 |
JP2002342343A (ja) * | 2001-05-18 | 2002-11-29 | Ricoh Co Ltd | 文書管理システム |
JP4616522B2 (ja) * | 2001-07-12 | 2011-01-19 | 株式会社リコー | 文書認識装置、文書画像の領域識別方法、プログラム及び記憶媒体 |
JP4111787B2 (ja) | 2002-09-11 | 2008-07-02 | 株式会社リコー | 行切り出し装置、行切り出し方法、プログラム及び記録媒体 |
US6810136B2 (en) * | 2002-10-18 | 2004-10-26 | Olive Software Inc. | System and method for automatic preparation of data repositories from microfilm-type materials |
JP4678712B2 (ja) | 2003-07-31 | 2011-04-27 | 株式会社リコー | 言語識別装置、プログラム及び記録媒体 |
CN100382096C (zh) | 2003-08-20 | 2008-04-16 | 奥西-技术有限公司 | 文档扫描设备及方法 |
US20070035780A1 (en) * | 2005-08-02 | 2007-02-15 | Kabushiki Kaisha Toshiba | System and method for defining characteristic data of a scanned document |
-
2005
- 2005-10-07 JP JP2005295412A patent/JP4856925B2/ja not_active Expired - Fee Related
-
2006
- 2006-09-12 US US11/518,910 patent/US8041113B2/en not_active Expired - Fee Related
- 2006-09-29 CN CNB2006101599928A patent/CN100424716C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1945599A (zh) | 2007-04-11 |
JP2007102715A (ja) | 2007-04-19 |
CN100424716C (zh) | 2008-10-08 |
US20070081179A1 (en) | 2007-04-12 |
US8041113B2 (en) | 2011-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4856925B2 (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
JP5659563B2 (ja) | 識別方法、識別装置およびコンピュータプログラム | |
JP4546291B2 (ja) | 画像処理装置およびその制御方法 | |
JP3359095B2 (ja) | 画像処理方法及び装置 | |
JP3302147B2 (ja) | 文書画像処理方法 | |
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
US7391917B2 (en) | Image processing method | |
JP3253356B2 (ja) | 文書画像の領域識別方法 | |
CN102782702B (zh) | 在光学字符识别(ocr)过程中的段落识别 | |
US8355578B2 (en) | Image processing apparatus, image processing method, and storage medium | |
EP1473642A2 (en) | Information processing apparatus, method, storage medium and program | |
JPH0668300A (ja) | 文書画像のレイアウトモデルを作成する方法及び装置 | |
JPH10162150A (ja) | ページ解析システム | |
JPH08235349A (ja) | ページ解析システム | |
JP4785655B2 (ja) | 文書処理装置及び文書処理方法 | |
US20150046784A1 (en) | Extraction device for composite graph in fixed layout document and extraction method thereof | |
US20090274369A1 (en) | Image processing device, image processing method, program, and storage medium | |
US8538154B2 (en) | Image processing method and image processing apparatus for extracting heading region from image of document | |
JP2006085665A (ja) | 画像処理装置、画像処理プログラム、記憶媒体、画像処理方法および画像形成装置 | |
US8023735B2 (en) | Image processing apparatus for extracting representative characteristic from image data and storing image data to be associated with representative characteristic | |
JP2006221569A (ja) | 文書処理システム、文書処理方法、プログラムおよび記憶媒体 | |
JP3837193B2 (ja) | 文字行抽出方法および装置 | |
JP5950700B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2006253842A (ja) | 画像処理装置、画像形成装置、プログラム、記憶媒体および画像処理方法 | |
JP2007310501A (ja) | 情報処理装置、その制御方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080917 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110510 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110701 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110701 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111025 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111031 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141104 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4856925 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |