JP7172649B2 - 画像処理装置および画像処理プログラム - Google Patents
画像処理装置および画像処理プログラム Download PDFInfo
- Publication number
- JP7172649B2 JP7172649B2 JP2019010934A JP2019010934A JP7172649B2 JP 7172649 B2 JP7172649 B2 JP 7172649B2 JP 2019010934 A JP2019010934 A JP 2019010934A JP 2019010934 A JP2019010934 A JP 2019010934A JP 7172649 B2 JP7172649 B2 JP 7172649B2
- Authority
- JP
- Japan
- Prior art keywords
- page
- document
- document data
- control unit
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00795—Reading arrangements
- H04N1/00798—Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity
- H04N1/00801—Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity according to characteristics of the original
- H04N1/00806—According to type of the original, e.g. colour paper or transparency, or reading a plurality of different types of original
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00795—Reading arrangements
- H04N1/00798—Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity
- H04N1/00816—Determining the reading area, e.g. eliminating reading of margins
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Facsimiles In General (AREA)
- Control Or Security For Electrophotography (AREA)
Description
なお、原稿の表面を白紙と検出し、裏面を白紙と検出しなかった場合に、原稿の裏表セットミスであると報知する画像読取装置が知られている(特許文献1参照)。
図1は、本実施形態にかかるシステム1の構成を簡易的に示している。システム1は、画像処理装置10およびスキャナー20を含んでいる。システム1を、画像読取システム等と記載してもよい。スキャナー20を、画像読取装置と記載してもよい。
本実施形態では、原稿32の両面のうち、本体部21の方を向く面、つまり第1読取部29により読み取られる面を「一方の面」と呼ぶ。原稿32の両面のうち、蓋22の方を向く面、つまり第2読取部30により読み取られる面を「他方の面」と呼ぶ。
図3は、制御部11が画像処理プログラム12に従って実行する、読取順序の正否判定処理をフローチャートにより示している。
この場合、制御部11は、1ページ目の文書データを解析することにより「見出し領域」を検出する。見出し領域とは、文書の見出しに該当する文字列を含んだ領域である。見出しを、表題、タイトル、ヘッドライン等とも言う。
制御部11は、見出し領域の検出に成功し、且つ、下部空白領域の検出に成功したページの文書データを、第1のタイプ(以下、タイプa)に分類する。
また、制御部11は、見出し領域の検出に成功し、且つ、下部空白領域の検出に成功しなかったページの文書データを、第2のタイプ(以下、タイプb)に分類する。
また、制御部11は、見出し領域の検出に成功せず、且つ、下部空白領域の検出に成功したページの文書データを、第3のタイプ(以下、タイプc)に分類する。
また、制御部11は、見出し領域の検出に成功せず、且つ、下部空白領域の検出に成功しなかったページの文書データを、第4のタイプ(以下、タイプd)に分類する。
図4は、推測規則40の例を示している。推測規則40は、一種のテーブルであり、所定の記憶領域(例えば、記憶部16)に予め記憶されている。推測規則40は、前ページのページタイプと後ページのページタイプとの対応関係を規定している。
また、推測規則40によれば、前ページのページタイプがタイプbであれば、後ページのページタイプはタイプcまたはタイプdと推測される。これは、見出し領域が有り且つ下部空白領域が無いページの次のページは、見出し領域が無いページの可能性が高いからである。
また、推測規則40によれば、前ページのページタイプがタイプcであれば、後ページのページタイプはタイプaまたはタイプbと推測される。これは、見出し領域が無く且つ下部空白領域が有るページの次のページは、見出し領域が有るページの可能性が高いからである。
また、推測規則40によれば、前ページのページタイプがタイプdであれば、後ページのページタイプはタイプcまたはタイプdと推測される。これは、見出し領域が無く且つ下部空白領域が無いページの次のページは、見出し領域が無いページの可能性が高いからである。
一方、ユーザーが、原稿32A,32Bの束を、原稿32Bの裏面32B‐2を下方にしてスキャナー20にセットしてしまうこともある。つまり、裏面32B‐2が給紙トレイ31に相対する向きで原稿32Bを給紙トレイ31に載置し、原稿32Bの上に、裏面32A‐2を下方にして原稿32Aを載置して、スキャナー20で原稿32B,32Aを読み取ったケースが、Case2に該当する。
図5では、スペースの都合上、スキャナー20が読み取る複数の原稿32として二枚の原稿32A,32Bを示しているが、言うまでもなくスキャナー20は三枚以上の原稿32を連続的に読み取ることが可能である。
ステップS110では、制御部11は、1ページ目の文書データIM1を解析することにより、文書データIM1をいずれかのページタイプに分類する。文書データIM1内の文字列「ABCDE」は見出しの一例である。よって、ステップS110では、制御部11は、文字列「ABCDE」を含む見出し領域50を検出する。また、文書データIM1内の下部にハッチングを施して示した領域52は下部空白領域である。つまり、ステップS110では、制御部11は、下部空白領域52を検出する。図5において、文書データIM1,IM2,IM3,IM4内の破線による矩形は、余白領域54を区画している。つまり、文書データIM1,IM2,IM3,IM4の外縁を示す実線による各矩形と、文書データIM1,IM2,IM3,IM4内の破線による各矩形とで挟まれた枠状の領域が、余白領域54である。見出し領域や下部空白領域はいずれも、余白領域54よりも内側の領域内で検出される。制御部11は、文書データIM1から見出し領域50および下部空白領域52の検出に成功したことに応じて、文書データIM1をタイプaに分類する。
ステップS110では、制御部11は、1ページ目の文書データIM4を解析することにより、文書データIM4をいずれかのページタイプに分類する。これまでの説明から判るように、文書データIM4はタイプcに分類される。
ステップS110の次のステップS120では、制御部11は、2ページ目の文書データIM3を解析することにより、文書データIM3をいずれかのページタイプに分類する。これまでの説明から判るように、文書データIM3はタイプdに分類される。
このように本実施形態によれば、画像処理装置10は、複数の原稿32の読取結果に対する処理を実行する制御部11を備える。制御部11は、複数の原稿32の読み取りにより生成された複数ページ分の文書データを取得する。そして、制御部11は、取得したページ毎の文書データを対象として、文書の見出しに該当する見出し領域の検出を実行する(ステップS110,S120)。そして、制御部11は、前記ページ毎の文書データにおける見出し領域の有無に基づいてページの前後関係を推測することにより、原稿32の読取順序の正否を判定する(ステップS130,S150,S160)。
このように、制御部11は、原稿32の読取順序の正否を適切に判定することができる。
前記構成によれば、見出し領域および下部空白領域という二つの要素それぞれの有無に基づいて、ページの前後関係をより的確に推測することができる。そのため、原稿32の読取順序の正否を判定した結果も、より信頼性の高いものとなる。
前記構成によれば、文書データ内から見出し領域を精度良く検出することができる。
また、本実施形態によれば、制御部11は、原稿32の読取順序が正しくないと判定した場合に、原稿32の読取順序が正しくない旨を外部へ通知する。
前記構成によれば、ユーザーに、スキャナー20に対する原稿セットの向きの誤り、つまり原稿32の読取順序が正しくないことを認識させることができる。
前記構成によれば、制御部11は、複数ページ分の文書データを、取得したときのページ順の逆に並び替えることにより、正しい読取順序に対応したページ順で保存することができる。
Claims (6)
- 複数の原稿の読取結果に対する処理を実行する制御部を備える画像処理装置であって、
前記制御部は、
前記複数の原稿の読み取りにより生成された複数ページ分の文書データを取得し、
前記取得したページ毎の文書データを対象として、文書の見出しに該当する見出し領域の検出を実行し、
前記ページ毎の文書データにおける前記見出し領域の有無に基づいてページの前後関係を推測することにより、前記原稿の読取順序の正否を判定する、ことを特徴とする画像処理装置。 - 前記制御部は、前記ページ毎の文書データを対象として、ページ内下部の空白領域である最も下方の行を含む下部空白領域の検出を実行し、前記ページ毎の文書データにおける前記見出し領域の有無および前記下部空白領域の有無に基づいてページの前後関係を推測することにより、前記原稿の読取順序の正否を判定する、ことを特徴とする請求項1に記載の画像処理装置。
- 前記制御部は、前記文書データに含まれる文字列のフォントサイズ及び又は行間に基づいて前記見出し領域を検出する、ことを特徴とする請求項1または請求項2に記載の画像処理装置。
- 前記制御部は、前記原稿の読取順序が正しくないと判定した場合に、前記原稿の読取順序が正しくない旨を外部へ通知する、ことを特徴とする請求項1~請求項3のいずれかに記載の画像処理装置。
- 前記制御部は、前記原稿の読取順序が正しくないと判定した場合に、前記複数ページ分の文書データを並べ替えて保存する、ことを特徴とする請求項1~請求項4のいずれかに記載の画像処理装置。
- 複数の原稿の読取結果に対する処理をコンピューターに実行させる画像処理プログラムであって、
前記複数の原稿の読み取りにより生成された複数ページ分の文書データを取得する機能と、
前記取得したページ毎の文書データを対象として、文書の見出しに該当する見出し領域を検出する機能と、
前記ページ毎の文書データにおける前記見出し領域の有無に基づいてページの前後関係を推測することにより、前記複数の原稿の読取順序の正否を判定する機能と、を実行させることを特徴とする画像処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019010934A JP7172649B2 (ja) | 2019-01-25 | 2019-01-25 | 画像処理装置および画像処理プログラム |
US16/752,047 US10997406B2 (en) | 2019-01-25 | 2020-01-24 | Image processing apparatus for determining proper reading order of documents |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019010934A JP7172649B2 (ja) | 2019-01-25 | 2019-01-25 | 画像処理装置および画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020120308A JP2020120308A (ja) | 2020-08-06 |
JP7172649B2 true JP7172649B2 (ja) | 2022-11-16 |
Family
ID=71732494
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019010934A Active JP7172649B2 (ja) | 2019-01-25 | 2019-01-25 | 画像処理装置および画像処理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10997406B2 (ja) |
JP (1) | JP7172649B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110138992A (zh) * | 2018-02-08 | 2019-08-16 | 精工爱普生株式会社 | 收据处理装置、程序的存储介质以及报告的制作方法 |
JP2022128202A (ja) * | 2021-02-22 | 2022-09-01 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、情報処理システム、及び情報処理プログラム |
JP2023124453A (ja) * | 2022-02-25 | 2023-09-06 | セイコーエプソン株式会社 | 画像読取システム、画像読取装置、画像読取方法及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001251483A (ja) | 2000-03-08 | 2001-09-14 | Ricoh Co Ltd | 画像入力装置 |
JP2007142631A (ja) | 2005-11-16 | 2007-06-07 | Ricoh Co Ltd | 画像形成装置 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5131053A (en) * | 1988-08-10 | 1992-07-14 | Caere Corporation | Optical character recognition method and apparatus |
JP3302147B2 (ja) * | 1993-05-12 | 2002-07-15 | 株式会社リコー | 文書画像処理方法 |
US7529408B2 (en) * | 2005-02-23 | 2009-05-05 | Ichannex Corporation | System and method for electronically processing document images |
JP4297890B2 (ja) * | 2005-06-29 | 2009-07-15 | シャープ株式会社 | 画像読取装置及び画像記録装置 |
JP2007036732A (ja) | 2005-07-27 | 2007-02-08 | Ricoh Co Ltd | 画像読み取り装置および画像形成装置 |
JP2008028858A (ja) * | 2006-07-24 | 2008-02-07 | Ricoh Co Ltd | 画像読取装置、画像読取方法および画像読取プログラム |
US8594422B2 (en) * | 2010-03-11 | 2013-11-26 | Microsoft Corporation | Page layout determination of an image undergoing optical character recognition |
JP5676942B2 (ja) * | 2010-07-06 | 2015-02-25 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
US8619340B2 (en) * | 2010-10-29 | 2013-12-31 | Xerox Corporation | Augmenting page orientation direction detection in a digital document processing environment |
JP2013168858A (ja) * | 2012-02-16 | 2013-08-29 | Fuji Xerox Co Ltd | 画像処理装置及びプログラム |
-
2019
- 2019-01-25 JP JP2019010934A patent/JP7172649B2/ja active Active
-
2020
- 2020-01-24 US US16/752,047 patent/US10997406B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001251483A (ja) | 2000-03-08 | 2001-09-14 | Ricoh Co Ltd | 画像入力装置 |
JP2007142631A (ja) | 2005-11-16 | 2007-06-07 | Ricoh Co Ltd | 画像形成装置 |
Also Published As
Publication number | Publication date |
---|---|
US20200242347A1 (en) | 2020-07-30 |
JP2020120308A (ja) | 2020-08-06 |
US10997406B2 (en) | 2021-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7172649B2 (ja) | 画像処理装置および画像処理プログラム | |
TWI513271B (zh) | 用於掃描多頁文件之掃描系統及方法 | |
US11941903B2 (en) | Image processing apparatus, image processing method, and non-transitory storage medium | |
US10375269B2 (en) | Image processing device, image reading device, and image forming apparatus | |
JP2013031090A (ja) | 画像読取装置、及び、読取制御プログラム | |
US9858513B2 (en) | Document file output apparatus, document file output method, and computer readable medium | |
US11258915B2 (en) | Reading apparatus and reading control method | |
US11206333B2 (en) | Image reading and learning apparatus, method, and program product for determining a missing page using a learned model and deriving the learned model | |
JP2016072833A (ja) | 画像読取装置 | |
US20220182497A1 (en) | Image processing system, image processing apparatus, control method | |
US11082576B2 (en) | Image reading apparatus, image reading method, and image reading system | |
JP7192441B2 (ja) | 情報処理装置、情報処理装置の画像回転方法、およびプログラム | |
JP2020120309A (ja) | 画像処理装置および画像処理プログラム | |
US20230208999A1 (en) | Image reading system, image reading method, non-transitory computer-readable storage medium storing program | |
US20220109764A1 (en) | Non-transitory computer-readable recording medium for generating image data | |
US20240129416A1 (en) | Method of producing image data and image reading system | |
JP5526958B2 (ja) | 情報処理装置、および、プログラム | |
JP6648839B2 (ja) | 画像読取装置 | |
JP4622239B2 (ja) | 通番再印字システム及び方法 | |
US20190012757A1 (en) | Image processing apparatus and image processing method | |
JP2008028782A (ja) | 原稿仕分装置及び原稿仕分方法 | |
JP2000293633A (ja) | 画像読取装置と該画像読取装置の制御方法、及び文書管理システム | |
JP2010116256A (ja) | 画像読取装置 | |
JP2024067335A (ja) | 原稿読取システム及びコンピュータプログラム | |
CN114662475A (zh) | 信息处理装置、信息处理方法以及计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211104 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220708 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220719 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220914 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221004 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221017 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7172649 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |