JP2013254321A - 画像処理装置、画像処理方法及びプログラム - Google Patents
画像処理装置、画像処理方法及びプログラム Download PDFInfo
- Publication number
- JP2013254321A JP2013254321A JP2012129016A JP2012129016A JP2013254321A JP 2013254321 A JP2013254321 A JP 2013254321A JP 2012129016 A JP2012129016 A JP 2012129016A JP 2012129016 A JP2012129016 A JP 2012129016A JP 2013254321 A JP2013254321 A JP 2013254321A
- Authority
- JP
- Japan
- Prior art keywords
- character
- column arrangement
- arrangement
- logical structure
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000004458 analytical method Methods 0.000 claims description 92
- 238000000034 method Methods 0.000 description 54
- 238000010586 diagram Methods 0.000 description 12
- 230000001771 impaired effect Effects 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000005192 partition Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00204—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
- H04N1/00209—Transmitting or receiving image data, e.g. facsimile data, via a computer, e.g. using e-mail, a computer network, the internet, I-fax
- H04N1/00222—Transmitting or receiving image data, e.g. facsimile data, via a computer, e.g. using e-mail, a computer network, the internet, I-fax details of image data generation or reproduction, e.g. scan-to-email or network printing
- H04N1/00225—Transmitting or receiving image data, e.g. facsimile data, via a computer, e.g. using e-mail, a computer network, the internet, I-fax details of image data generation or reproduction, e.g. scan-to-email or network printing details of image data generation, e.g. scan-to-email or network scanners
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00331—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0008—Connection or combination of a still picture apparatus with another apparatus
- H04N2201/0065—Converting image data to a format usable by the connected apparatus or vice versa
- H04N2201/0068—Converting from still picture data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0081—Image reader
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Processing Or Creating Images (AREA)
Abstract
【解決手段】電子文書の仕様で表現可能な段組配置の中から、入力画像における文字領域の位置と、入力画像から解析された論理構造とを最も再現可能な段組配置を選択して電子文書を生成する。
【選択図】図1
Description
画像処理装置100は、スキャナ101、CPU102、メモリ103、ハードディスク104、及びネットワークI/F105を備える。なお、画像処理装置100が備える構成はこれらに限定されず、画像処理装置が一般に備える構成も備える。スキャナ101は、読みとった文書の紙面情報を画像データに変換する。CPU102は、画像データに電子文書生成処理を施すためのプログラムを実行し、各種処理の制御を行う。メモリ103は、該プログラムを実行する際のワークメモリやデータの一時保存などに利用される。ハードディスク104は、該プログラムやデータを格納するための記憶部である。ネットワークI/F105は、外部装置とデータの入出力を行うためのインタフェースである。
まず、図7を参照して、セクション602を更に小さいセクション及び段組に分割する方法について説明する。図7は、図6のセクション602について、縦横方向に文字領域のヒストグラムをとった例を示している。ヒストグラム700は、縦軸方向ヒストグラムである。セクション内を縦軸方向に走査し、存在した文字領域数がヒストグラムの高さとなっている。ヒストグラム710は、横軸方向ヒストグラムである。セクション内を横軸方向に走査し、存在した文字領域数がヒストグラムの高さ(幅)となっている。なお、上記のように文字領域数をヒストグラムの高さとする方法は一例であり、文字領域の幅、高さ、あるいは文字数、行数をヒストグラムの高さに用いてもよい。このヒストグラム中の谷となる部分から、セクション又は段組を区切る境界の候補として用いることで、段組配置を求めていく。
以降の処理は、実施例1と同様であるため説明を省略する。
ステップS301において、段組配置解析部204は、文字領域1401から1404の全ての組方向が横であるため、文書の組方向も横と判断する。
「Table」要素は、x、y属性で指定される位置に「col」属性によって指定された幅の列、「row」属性によって指定された高さの行で表を出力する。ここでは表領域1420が記述されている。すなわち、論理構造の観点で本文の途中に含まれるべきではないキャプション領域を除外して段組配置を決定することができている。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (9)
- 画像から電子文書を生成する画像処理装置であって、
前記画像から文字領域を特定する特定手段と、
前記特定された文字領域の論理構造を解析する解析手段と、
前記電子文書の仕様で表現可能な段組配置の中から、前記特定された文字領域の前記画像における位置と、前記解析された論理構造とを最も再現可能な段組配置を選択する選択手段と、
前記選択した段組配置の情報と、前記選択した段組配置によっては前記画像における位置を再現できない前記文字領域の属性情報とを少なくとも含む前記電子文書を生成する生成手段と
を備えたことを特徴とする画像処理装置。 - 前記選択手段は、前記電子文書の仕様で表現可能な段組配置の中から、前記画像における位置を再現できる前記特定された文字領域の数が所定数以上である段組配置を候補配置として選択し、前記候補配置から、前記解析された論理構造を最も再現可能な段組配置を選択することを特徴とする請求項1に記載の画像処理装置。
- 前記属性情報は、前記選択した段組配置によっては前記画像における位置を再現できない前記文字領域の位置の情報及び文字の組方向の情報を含むことを特徴とする請求項1又は2に記載の画像処理装置。
- 前記解析された論理構造は、前記特定された文字領域の読み順を含み、
前記選択手段は、前記候補配置に前記特定された文字領域を配置したときに、前記文字領域が前記読み順に従った連続性を持っているほど、前記解析された論理構造が高く再現されている前記候補配置であると判断する手段を有することを特徴とする請求項1から3のいずれか1つに記載の画像処理装置。 - 前記解析された論理構造は、文字領域の文字数に応じて判断された前記特定された文字領域の重要度を含み、
前記選択手段は、前記候補配置に前記特定された文字領域を配置したときに、当該配置された文字領域の重要度が高いほど、前記解析された論理構造が高く再現されている前記候補配置であると判断する手段を有することを特徴とする請求項1から4のいずれか1つに記載の画像処理装置。 - 前記選択手段は、前記特定された文字領域のうち、図、写真又は表に付随するキャプションについての文字領域の位置及び論理構造を考慮せずに、段組配置を選択することを特徴とする請求項1から5のいずれか1つに記載の画像処理装置。
- 前記解析された論理構造は、前記特定された文字領域を解析して得られた、誤って特定された文字領域の情報を含み、
前記選択手段は、前記候補配置に前記特定された文字領域を配置したときに、前記誤って特定された文字領域が多く配置されるほど、前記解析された論理構造が低く再現されている前記候補配置であると判断する手段を有することを特徴とする請求項1から6のいずれか1つに記載の画像処理装置。 - 画像から電子文書を生成する画像処理装置で実行される画像処理方法あって、
前記画像から文字領域を特定する特定ステップと、
前記特定された文字領域の論理構造を解析する解析ステップと、
前記電子文書の仕様で表現可能な段組配置の中から、前記特定された文字領域の前記画像における位置と、前記解析された論理構造とを最も再現可能な段組配置を選択する選択ステップと、
前記選択した段組配置の情報と、前記選択した段組配置によっては前記画像における位置を再現できない前記文字領域の属性情報とを少なくとも含む前記電子文書を生成する生成ステップと
を備えたことを特徴とする画像処理方法。 - コンピュータを請求項1から7に記載の画像処理装置として機能させるための、プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012129016A JP5950700B2 (ja) | 2012-06-06 | 2012-06-06 | 画像処理装置、画像処理方法及びプログラム |
US13/905,891 US9049400B2 (en) | 2012-06-06 | 2013-05-30 | Image processing apparatus, and image processing method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012129016A JP5950700B2 (ja) | 2012-06-06 | 2012-06-06 | 画像処理装置、画像処理方法及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2013254321A true JP2013254321A (ja) | 2013-12-19 |
JP2013254321A5 JP2013254321A5 (ja) | 2015-07-23 |
JP5950700B2 JP5950700B2 (ja) | 2016-07-13 |
Family
ID=49715091
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012129016A Expired - Fee Related JP5950700B2 (ja) | 2012-06-06 | 2012-06-06 | 画像処理装置、画像処理方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9049400B2 (ja) |
JP (1) | JP5950700B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190021161A (ko) * | 2017-08-22 | 2019-03-05 | 캐논 가부시끼가이샤 | 스캔 화상에 대해 파일명 등을 설정하기 위한 장치, 그 제어 방법 및 저장 매체 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020198546A (ja) * | 2019-06-03 | 2020-12-10 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
JP6838209B1 (ja) * | 2019-10-31 | 2021-03-03 | 楽天株式会社 | 文書画像解析装置、文書画像解析方法およびプログラム |
JP2021189952A (ja) * | 2020-06-03 | 2021-12-13 | 株式会社リコー | 画像処理装置、方法およびプログラム |
US11367296B2 (en) * | 2020-07-13 | 2022-06-21 | NextVPU (Shanghai) Co., Ltd. | Layout analysis |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10134066A (ja) * | 1996-10-29 | 1998-05-22 | Matsushita Electric Ind Co Ltd | 文章集約装置 |
JP2004178010A (ja) * | 2002-11-22 | 2004-06-24 | Toshiba Corp | 文書処理装置並びにその方法及びプログラム |
JP2007095102A (ja) * | 2006-12-25 | 2007-04-12 | Toshiba Corp | 文書処理装置および文書処理方法 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5349368A (en) * | 1986-10-24 | 1994-09-20 | Kabushiki Kaisha Toshiba | Machine translation method and apparatus |
US5094289A (en) | 1990-09-19 | 1992-03-10 | American Colloid Company | Roasted carbon molding (foundry) sand and method of casting |
US5680479A (en) | 1992-04-24 | 1997-10-21 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
JP3683923B2 (ja) | 1994-11-17 | 2005-08-17 | キヤノン株式会社 | 文字領域の順序付け方法 |
US5689342A (en) | 1994-11-17 | 1997-11-18 | Canon Kabushiki Kaisha | Image processing method and apparatus which orders text areas which have been extracted from an image |
JP3962891B2 (ja) * | 2000-08-09 | 2007-08-22 | 富士ゼロックス株式会社 | 文書画像処理装置、文書画像処理方法、及び記憶媒体 |
JP4181310B2 (ja) * | 2001-03-07 | 2008-11-12 | 昌和 鈴木 | 数式認識装置および数式認識方法 |
JP3956114B2 (ja) * | 2002-06-28 | 2007-08-08 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 表示制御方法、これを用いたプログラム、情報処理装置及び光学式文字読み取り装置 |
JP4251629B2 (ja) | 2003-01-31 | 2009-04-08 | キヤノン株式会社 | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 |
US7391917B2 (en) | 2003-02-13 | 2008-06-24 | Canon Kabushiki Kaisha | Image processing method |
JP4590433B2 (ja) | 2007-06-29 | 2010-12-01 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
JP5376795B2 (ja) | 2007-12-12 | 2013-12-25 | キヤノン株式会社 | 画像処理装置、画像処理方法、そのプログラム及び記憶媒体 |
US8261180B2 (en) * | 2009-04-28 | 2012-09-04 | Lexmark International, Inc. | Automatic forms processing systems and methods |
JP2012027723A (ja) * | 2010-07-23 | 2012-02-09 | Sony Corp | 情報処理装置、情報処理方法及び情報処理プログラム |
JP5179559B2 (ja) * | 2010-11-12 | 2013-04-10 | シャープ株式会社 | 画像処理システムを制御する制御装置、画像形成装置、画像読取装置、制御方法、画像処理プログラム及びコンピュータ読み取り可能な記録媒体 |
JP5275325B2 (ja) * | 2010-11-29 | 2013-08-28 | シャープ株式会社 | 画像処理装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体 |
-
2012
- 2012-06-06 JP JP2012129016A patent/JP5950700B2/ja not_active Expired - Fee Related
-
2013
- 2013-05-30 US US13/905,891 patent/US9049400B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10134066A (ja) * | 1996-10-29 | 1998-05-22 | Matsushita Electric Ind Co Ltd | 文章集約装置 |
JP2004178010A (ja) * | 2002-11-22 | 2004-06-24 | Toshiba Corp | 文書処理装置並びにその方法及びプログラム |
JP2007095102A (ja) * | 2006-12-25 | 2007-04-12 | Toshiba Corp | 文書処理装置および文書処理方法 |
Non-Patent Citations (1)
Title |
---|
石谷 康人,外1名: "紙文書を対象としたピボットXML文書に基づくXML文書変換システム", 電子情報通信学会技術研究報告 VOL.103 NO.658 PRMU2003−215〜230 パター, vol. 第103巻 第658号, JPN6016016691, 12 February 2004 (2004-02-12), JP, pages 7 - 12, ISSN: 0003312605 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190021161A (ko) * | 2017-08-22 | 2019-03-05 | 캐논 가부시끼가이샤 | 스캔 화상에 대해 파일명 등을 설정하기 위한 장치, 그 제어 방법 및 저장 매체 |
KR102408019B1 (ko) * | 2017-08-22 | 2022-06-14 | 캐논 가부시끼가이샤 | 스캔 화상에 대해 파일명 등을 설정하기 위한 장치, 그 제어 방법 및 저장 매체 |
Also Published As
Publication number | Publication date |
---|---|
JP5950700B2 (ja) | 2016-07-13 |
US9049400B2 (en) | 2015-06-02 |
US20130329263A1 (en) | 2013-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101334483B1 (ko) | 문서를 디지털화하는 장치 및 방법과, 컴퓨터 판독가능 기록 매체 | |
US8209600B1 (en) | Method and apparatus for generating layout-preserved text | |
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
US7705848B2 (en) | Method of identifying semantic units in an electronic document | |
JP5663866B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP4785655B2 (ja) | 文書処理装置及び文書処理方法 | |
JP5950700B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
US8538154B2 (en) | Image processing method and image processing apparatus for extracting heading region from image of document | |
US20120017144A1 (en) | Content analysis apparatus and method | |
KR20090066196A (ko) | 화상 처리 장치 및 화상 처리 프로그램 | |
KR102287149B1 (ko) | Pdf 문서에서 텍스트 라인 정보를 기초로 단락의 구분선을 표시하는 전자 장치 및 그 동작 방법 | |
JP5790082B2 (ja) | 文書認識装置、文書認識方法、プログラム及び記憶媒体 | |
JP2008129793A (ja) | 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体 | |
US20240104290A1 (en) | Device dependent rendering of pdf content including multiple articles and a table of contents | |
JP2008108114A (ja) | 文書処理装置および文書処理方法 | |
JP2009251872A (ja) | 情報処理装置及び情報処理プログラム | |
JPH0460759A (ja) | 文書作成支援装置 | |
JP6030915B2 (ja) | 画像再配置方法、画像再配置システム、および画像再配置プログラム | |
JP4213558B2 (ja) | 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置 | |
CN110147537A (zh) | 一种基于位置关系的pdf表格抽取方法 | |
US20240119218A1 (en) | Device dependent rendering of pdf content | |
JP5343584B2 (ja) | 情報処理装置及びプログラム | |
CN117542056A (zh) | 图文数据生成文本的方法、装置、存储介质及处理器 | |
JP2005190439A (ja) | 情報処理装置、情報処理方法、プログラム及び記録媒体 | |
CN116542226A (zh) | 非编辑文档的表格抽取方法、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150604 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150604 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160412 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160510 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160607 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5950700 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |