JP5950700B2 - 画像処理装置、画像処理方法及びプログラム - Google Patents
画像処理装置、画像処理方法及びプログラム Download PDFInfo
- Publication number
- JP5950700B2 JP5950700B2 JP2012129016A JP2012129016A JP5950700B2 JP 5950700 B2 JP5950700 B2 JP 5950700B2 JP 2012129016 A JP2012129016 A JP 2012129016A JP 2012129016 A JP2012129016 A JP 2012129016A JP 5950700 B2 JP5950700 B2 JP 5950700B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- area
- column
- column arrangement
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000004458 analytical method Methods 0.000 claims description 93
- 238000000034 method Methods 0.000 claims description 54
- 238000010586 diagram Methods 0.000 description 12
- 230000001771 impaired effect Effects 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000005192 partition Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00204—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
- H04N1/00209—Transmitting or receiving image data, e.g. facsimile data, via a computer, e.g. using e-mail, a computer network, the internet, I-fax
- H04N1/00222—Transmitting or receiving image data, e.g. facsimile data, via a computer, e.g. using e-mail, a computer network, the internet, I-fax details of image data generation or reproduction, e.g. scan-to-email or network printing
- H04N1/00225—Transmitting or receiving image data, e.g. facsimile data, via a computer, e.g. using e-mail, a computer network, the internet, I-fax details of image data generation or reproduction, e.g. scan-to-email or network printing details of image data generation, e.g. scan-to-email or network scanners
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00331—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0008—Connection or combination of a still picture apparatus with another apparatus
- H04N2201/0065—Converting image data to a format usable by the connected apparatus or vice versa
- H04N2201/0068—Converting from still picture data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0081—Image reader
Description
画像処理装置100は、スキャナ101、CPU102、メモリ103、ハードディスク104、及びネットワークI/F105を備える。なお、画像処理装置100が備える構成はこれらに限定されず、画像処理装置が一般に備える構成も備える。スキャナ101は、読みとった文書の紙面情報を画像データに変換する。CPU102は、画像データに電子文書生成処理を施すためのプログラムを実行し、各種処理の制御を行う。メモリ103は、該プログラムを実行する際のワークメモリやデータの一時保存などに利用される。ハードディスク104は、該プログラムやデータを格納するための記憶部である。ネットワークI/F105は、外部装置とデータの入出力を行うためのインタフェースである。
まず、図7を参照して、セクション602を更に小さいセクション及び段組に分割する方法について説明する。図7は、図6のセクション602について、縦横方向に文字領域のヒストグラムをとった例を示している。ヒストグラム700は、縦軸方向ヒストグラムである。セクション内を縦軸方向に走査し、存在した文字領域数がヒストグラムの高さとなっている。ヒストグラム710は、横軸方向ヒストグラムである。セクション内を横軸方向に走査し、存在した文字領域数がヒストグラムの高さ(幅)となっている。なお、上記のように文字領域数をヒストグラムの高さとする方法は一例であり、文字領域の幅、高さ、あるいは文字数、行数をヒストグラムの高さに用いてもよい。このヒストグラム中の谷となる部分から、セクション又は段組を区切る境界の候補として用いることで、段組配置を求めていく。
以降の処理は、実施例1と同様であるため説明を省略する。
ステップS301において、段組配置解析部204は、文字領域1401から1404の全ての組方向が横であるため、文書の組方向も横と判断する。
「Table」要素は、x、y属性で指定される位置に「col」属性によって指定された幅の列、「row」属性によって指定された高さの行で表を出力する。ここでは表領域1420が記述されている。すなわち、論理構造の観点で本文の途中に含まれるべきではないキャプション領域を除外して段組配置を決定することができている。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (9)
- 画像から電子文書を生成する画像処理装置であって、
前記画像から複数の文字領域を特定する特定手段と、
前記複数の文字領域それぞれに対して文字認識処理を実行する文字認識手段と、
前記電子文書の仕様で表現可能な段組配置の中から、前記複数の文字領域を再現するのに最も適した段組配置を選択する選択手段と、
前記選択した段組配置と前記文字認識手段による文字認識結果とに基づいて、前記電子文書を生成する生成手段と
を備えたことを特徴とする画像処理装置。 - 前記選択手段は、前記電子文書の仕様で表現可能な段組配置の中から、前記複数の文字領域のうちの本文領域を再現するのに最も適した段組配置を選択することを特徴とする請求項1に記載の画像処理装置。
- 前記複数の文字領域間の論理構造を解析する解析手段を更に有し、
前記選択手段は、前記解析手段で解析された前記複数の文字領域間の論理構造の再現率が最も高い段組配置を、前記複数の文字領域を再現するのに最も適した段組配置として選択することを特徴とする請求項1に記載の画像処理装置。 - 前記解析手段で解析された論理構造は、前記複数の文字領域の読み順を含み、
前記選択手段は、前記段組配置の本文として前記複数の文字領域を配置したときに、前記複数の文字領域が前記読み順に従った連続性を持っているほど、前記論理構造の再現率が高いと判断することを特徴とする請求項3に記載の画像処理装置。 - 前記解析手段で解析された論理構造は、各文字領域の文字数に応じて判断される前記複数の文字領域それぞれの重要度を含み、
前記選択手段は、前記段組配置の本文として前記複数の文字領域を配置したときに、当該本文として配置された複数の文字領域の重要度が高いほど、前記解析された論理構造の再現率が高いと判断することを特徴とする請求項3に記載の画像処理装置。 - 前記複数の文字領域それぞれの文字数を解析する解析手段を更に有し、
前記選択手段は、前記電子文書の仕様で表現可能な段組配置それぞれにしたがって前記複数の文字領域を配置したときに本文として配置される文字領域の文字数に基づいて、前記電子文書の仕様で表現可能な段組配置の中から前記複数の文字領域を再現するのに最も適した段組配置を選択することを特徴とする請求項1に記載の画像処理装置。 - 前記生成手段は、前記複数の文字領域のうち、前記選択手段で選択された段組配置の本文として配置されない文字領域を、本文から独立した自由配置文字領域とした前記電子文書を生成することを特徴とする請求項1に記載の画像処理装置。
- コンピュータを、請求項1乃至7のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
- 画像から電子文書を生成する画像処理装置で実行される画像処理方法であって、
前記画像から複数の文字領域を特定する特定ステップと、
前記複数の文字領域それぞれに対して文字認識処理を実行する文字認識ステップと、
前記電子文書の仕様で表現可能な段組配置の中から、前記複数の文字領域を再現するのに最も適した段組配置を選択する選択ステップと、
前記選択した段組配置と前記文字認識ステップによる文字認識結果とに基づいて、前記電子文書を生成する生成ステップと
を備えたことを特徴とする画像処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012129016A JP5950700B2 (ja) | 2012-06-06 | 2012-06-06 | 画像処理装置、画像処理方法及びプログラム |
US13/905,891 US9049400B2 (en) | 2012-06-06 | 2013-05-30 | Image processing apparatus, and image processing method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012129016A JP5950700B2 (ja) | 2012-06-06 | 2012-06-06 | 画像処理装置、画像処理方法及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2013254321A JP2013254321A (ja) | 2013-12-19 |
JP2013254321A5 JP2013254321A5 (ja) | 2015-07-23 |
JP5950700B2 true JP5950700B2 (ja) | 2016-07-13 |
Family
ID=49715091
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012129016A Expired - Fee Related JP5950700B2 (ja) | 2012-06-06 | 2012-06-06 | 画像処理装置、画像処理方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9049400B2 (ja) |
JP (1) | JP5950700B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6891073B2 (ja) * | 2017-08-22 | 2021-06-18 | キヤノン株式会社 | スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム |
JP2020198546A (ja) * | 2019-06-03 | 2020-12-10 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
WO2021084702A1 (ja) * | 2019-10-31 | 2021-05-06 | 楽天株式会社 | 文書画像解析装置、文書画像解析方法およびプログラム |
JP2021189952A (ja) * | 2020-06-03 | 2021-12-13 | 株式会社リコー | 画像処理装置、方法およびプログラム |
US11367296B2 (en) * | 2020-07-13 | 2022-06-21 | NextVPU (Shanghai) Co., Ltd. | Layout analysis |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5349368A (en) * | 1986-10-24 | 1994-09-20 | Kabushiki Kaisha Toshiba | Machine translation method and apparatus |
US5094289A (en) | 1990-09-19 | 1992-03-10 | American Colloid Company | Roasted carbon molding (foundry) sand and method of casting |
US5680479A (en) | 1992-04-24 | 1997-10-21 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
US5689342A (en) | 1994-11-17 | 1997-11-18 | Canon Kabushiki Kaisha | Image processing method and apparatus which orders text areas which have been extracted from an image |
JP3683923B2 (ja) | 1994-11-17 | 2005-08-17 | キヤノン株式会社 | 文字領域の順序付け方法 |
JPH10134066A (ja) * | 1996-10-29 | 1998-05-22 | Matsushita Electric Ind Co Ltd | 文章集約装置 |
JP3962891B2 (ja) * | 2000-08-09 | 2007-08-22 | 富士ゼロックス株式会社 | 文書画像処理装置、文書画像処理方法、及び記憶媒体 |
JP4181310B2 (ja) * | 2001-03-07 | 2008-11-12 | 昌和 鈴木 | 数式認識装置および数式認識方法 |
JP3956114B2 (ja) * | 2002-06-28 | 2007-08-08 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 表示制御方法、これを用いたプログラム、情報処理装置及び光学式文字読み取り装置 |
JP2004178010A (ja) * | 2002-11-22 | 2004-06-24 | Toshiba Corp | 文書処理装置並びにその方法及びプログラム |
JP4251629B2 (ja) | 2003-01-31 | 2009-04-08 | キヤノン株式会社 | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 |
US7391917B2 (en) | 2003-02-13 | 2008-06-24 | Canon Kabushiki Kaisha | Image processing method |
JP4343213B2 (ja) * | 2006-12-25 | 2009-10-14 | 株式会社東芝 | 文書処理装置および文書処理方法 |
JP4590433B2 (ja) | 2007-06-29 | 2010-12-01 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
JP5376795B2 (ja) | 2007-12-12 | 2013-12-25 | キヤノン株式会社 | 画像処理装置、画像処理方法、そのプログラム及び記憶媒体 |
US8261180B2 (en) * | 2009-04-28 | 2012-09-04 | Lexmark International, Inc. | Automatic forms processing systems and methods |
JP2012027723A (ja) * | 2010-07-23 | 2012-02-09 | Sony Corp | 情報処理装置、情報処理方法及び情報処理プログラム |
JP5179559B2 (ja) * | 2010-11-12 | 2013-04-10 | シャープ株式会社 | 画像処理システムを制御する制御装置、画像形成装置、画像読取装置、制御方法、画像処理プログラム及びコンピュータ読み取り可能な記録媒体 |
JP5275325B2 (ja) * | 2010-11-29 | 2013-08-28 | シャープ株式会社 | 画像処理装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体 |
-
2012
- 2012-06-06 JP JP2012129016A patent/JP5950700B2/ja not_active Expired - Fee Related
-
2013
- 2013-05-30 US US13/905,891 patent/US9049400B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20130329263A1 (en) | 2013-12-12 |
US9049400B2 (en) | 2015-06-02 |
JP2013254321A (ja) | 2013-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101334483B1 (ko) | 문서를 디지털화하는 장치 및 방법과, 컴퓨터 판독가능 기록 매체 | |
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
US7705848B2 (en) | Method of identifying semantic units in an electronic document | |
US8209600B1 (en) | Method and apparatus for generating layout-preserved text | |
JP5663866B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP4785655B2 (ja) | 文書処理装置及び文書処理方法 | |
JP2004005453A (ja) | 文書画像レイアウトの解体と再表示の方法およびシステム | |
JP5950700B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2008146605A (ja) | 画像処理装置及びその制御方法 | |
US8538154B2 (en) | Image processing method and image processing apparatus for extracting heading region from image of document | |
JP2003288334A (ja) | 文書処理装置及び文書処理方法 | |
US20120017144A1 (en) | Content analysis apparatus and method | |
KR20090066196A (ko) | 화상 처리 장치 및 화상 처리 프로그램 | |
JP5790082B2 (ja) | 文書認識装置、文書認識方法、プログラム及び記憶媒体 | |
US8600175B2 (en) | Apparatus and method of processing image including character string | |
JP2008129793A (ja) | 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体 | |
JP2008108114A (ja) | 文書処理装置および文書処理方法 | |
CN107666550B (zh) | 图像形成装置和文档电子化方法 | |
JP2009251872A (ja) | 情報処理装置及び情報処理プログラム | |
JP2007310501A (ja) | 情報処理装置、その制御方法、及びプログラム | |
JP2010231637A (ja) | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム | |
JPH0460759A (ja) | 文書作成支援装置 | |
JPH11232439A (ja) | 文書画像構造解析方法 | |
JP4213558B2 (ja) | 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置 | |
JP2003256769A (ja) | 数式認識装置および数式認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150604 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150604 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160412 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160510 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160607 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5950700 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |