JP7172649B2 - 画像処理装置および画像処理プログラム - Google Patents

画像処理装置および画像処理プログラム Download PDF

Info

Publication number
JP7172649B2
JP7172649B2 JP2019010934A JP2019010934A JP7172649B2 JP 7172649 B2 JP7172649 B2 JP 7172649B2 JP 2019010934 A JP2019010934 A JP 2019010934A JP 2019010934 A JP2019010934 A JP 2019010934A JP 7172649 B2 JP7172649 B2 JP 7172649B2
Authority
JP
Japan
Prior art keywords
page
document
document data
control unit
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019010934A
Other languages
English (en)
Other versions
JP2020120308A (ja
Inventor
英一 原田
潔 水庫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2019010934A priority Critical patent/JP7172649B2/ja
Priority to US16/752,047 priority patent/US10997406B2/en
Publication of JP2020120308A publication Critical patent/JP2020120308A/ja
Application granted granted Critical
Publication of JP7172649B2 publication Critical patent/JP7172649B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • H04N1/00798Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity
    • H04N1/00801Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity according to characteristics of the original
    • H04N1/00806According to type of the original, e.g. colour paper or transparency, or reading a plurality of different types of original
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • H04N1/00798Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity
    • H04N1/00816Determining the reading area, e.g. eliminating reading of margins

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Facsimiles In General (AREA)
  • Control Or Security For Electrophotography (AREA)

Description

本発明は、画像処理装置および画像処理プログラムに関する。
原稿の両面を読み取り可能なシートフィードスキャナーにより、複数の原稿を連続して両面読取することができる。ユーザーが複数の原稿からなる原稿の束をシートフィードスキャナーへセットするときに、原稿の束の表裏を誤ってセットすると、原稿の束の最終シートの裏面から読み取りが開始されてしまう。
なお、原稿の表面を白紙と検出し、裏面を白紙と検出しなかった場合に、原稿の裏表セットミスであると報知する画像読取装置が知られている(特許文献1参照)。
特開2007‐36732号公報
しかしながら、前記文献1のように白紙を原稿の裏面と判別する手法では、原稿の裏面にも印刷がされている場合には原稿の表裏を判別することができない。そのため、いずれのページにも文書が含まれている複数ページ分の読取データから、原稿が正しい順序で読み取られたか否かを判定することが困難であった。
複数の原稿の読取結果に対する処理を実行する制御部を備える画像処理装置であって、前記制御部は、前記複数の原稿の読み取りにより生成された複数ページ分の文書データを取得し、前記取得したページ毎の文書データを対象として、文書の見出しに該当する見出し領域の検出を実行し、前記ページ毎の文書データにおける前記見出し領域の有無に基づいてページの前後関係を推測することにより、前記原稿の読取順序の正否を判定する。
システムの構成を簡易的に示すブロック図。 搬送経路を含むスキャナーの機械的構造を簡易的に示す図。 読取順序の正否判定処理を示すフローチャート。 推測規則の例を示す図。 複数の原稿が正しい向きでスキャナーにセットされ読み取られた事例Case1と、複数の原稿が間違った向きでスキャナーにセットされ読み取られた事例Case2とを説明する図。 UI画面の例を示す図。
以下、各図を参照しながら本発明の実施形態を説明する。各図は、本実施形態を説明するための例示に過ぎない。各図は例示であるため、互いに整合していなかったり、一部が省略されていたりする場合がある。
1.システムの概略説明:
図1は、本実施形態にかかるシステム1の構成を簡易的に示している。システム1は、画像処理装置10およびスキャナー20を含んでいる。システム1を、画像読取システム等と記載してもよい。スキャナー20を、画像読取装置と記載してもよい。
画像処理装置10は、例えば、パーソナルコンピューター、スマートフォン、タブレット型端末、携帯電話機、サーバー或いはそれらと同程度の処理能力を有する情報処理装置によって実現される。画像処理装置10は、制御部11、表示部13、操作受付部14、通信インターフェイス15、記憶部16等を備える。インターフェイスをIFと略して表記する。制御部11は、プロセッサーとしてのCPU11a、ROM11b、RAM11c等を有する一つ又は複数のICや、その他の不揮発性メモリー等を含んで構成される。
制御部11では、プロセッサーつまりCPU11aが、ROM11bや、その他のメモリー等に保存されたプログラムに従った演算処理を、RAM11c等をワークエリアとして用いて実行することにより、画像処理装置10を制御する。制御部11は、例えば、画像処理プログラム12に従った処理を実行する。なお、プロセッサーは、一つのCPUに限られることなく、複数のCPUや、ASIC(Application Specific Integrated Circuit)等のハードウェア回路により処理を行う構成としてもよいし、CPUとハードウェア回路とが協働して処理を行う構成としてもよい。
表示部13は、視覚的情報を表示するための手段であり、例えば、液晶ディスプレイや、有機ELディスプレイ等により構成される。表示部13は、ディスプレイと、ディスプレイを駆動するための駆動回路とを含む構成であってもよい。操作受付部14は、ユーザーによる操作を受け付けるための手段であり、例えば、物理的なボタンや、タッチパネルや、マウスや、キーボード等によって実現される。むろん、タッチパネルは、表示部13の一機能として実現されるとしてもよい。表示部13および操作受付部14を含めて、画像処理装置10の操作パネルと呼ぶことができる。
表示部13や操作受付部14は、画像処理装置10の構成の一部であってもよいが、画像処理装置10に対して外付けされた周辺機器であってもよい。通信IF15は、画像処理装置10が公知の通信規格を含む所定の通信プロトコルに準拠して有線又は無線で外部と通信を実行するための一つまたは複数のIFの総称である。記憶部16は、例えば、ハードディスクドライブや不揮発性メモリーにより構成される。記憶部16は制御部11の一部であってもよい。
スキャナー20は、複数の原稿を連続的に読み取り可能なシードフィードスキャナーである。スキャナー20は、知られているように、原稿をイメージセンサーを用いて光学的に読み取り、読取結果としての画像データを生成し、出力する。画像処理装置10は通信IF15を介してスキャナー20と接続している。画像処理装置10は、スキャナー20から出力された画像データを入力し、入力した画像データに対する処理を実行する。
図2は、搬送経路23を含むスキャナー20の機械的構造を簡易的に示している。スキャナー20は、本体部21と、本体部21の所定面を覆う蓋22とを備える。蓋22は本体部21に対して開閉可能である。本体部21と蓋22との間には、原稿32の搬送経路23が確保されている。スキャナー20は、搬送経路23の上流の供給口24から原稿32を一枚単位で筐体内へ取り込む。そして、スキャナー20は、供給口24から取り込んだ原稿32について、ローラー25a,25b,26a,26b,28a,28b等を回転させることにより、搬送経路23内を搬送し、搬送経路23の下流の排出口27から外部へ排出する。
ローラー25a,25b,26a,26b,28a,28bは、原稿32を搬送するためにスキャナー20が有する搬送部の一部を構成する。図示は省略しているが、搬送部は、各ローラーを回転させるためのモーター等を含む。対のローラー25a,25bは搬送経路23を挟んで互いに相対している。同様に、対のローラー26a,26bは搬送経路23を挟んで互いに相対しており、対のローラー28a,28bは搬送経路23を挟んで互いに相対している。ローラー25aは蓋22に配設され、ローラー25bは本体部21に配設されている。ローラー26aは蓋22に配設され、ローラー26bは本体部21に配設されている。ローラー28aは蓋22に配設され、ローラー28bは本体部21に配設されている。ローラー25a,25bは、搬送経路23途中の読取部29,30よりも、搬送の上流に在る。ローラー26a,26bは、読取部29,30よりも下流に在る。ローラー28a,28bは、ローラー25a,25bよりも更に上流に在り、供給口24の近傍に配設されている。
供給口24の近傍には、原稿32を載置可能な給紙トレイ31が配設されている。原稿32は、印刷が施されたシート状の媒体であり、典型的には紙である。給紙トレイ31に載置された原稿32の束の下から順に原稿32を一枚単位で搬送経路23へ連続的に取り込む、いわゆるADF(Auto Document Feeder)を、搬送部は含んでいる。ローラー28a,28bをADFと解してもよい。
本体部21に配設された読取部29を第1読取部29と呼び、蓋22に配設された読取部30を第2読取部30と呼ぶ。第1読取部29および第2読取部30は、それぞれにイメージセンサーや光源や各種光学系を備える。第1読取部29および第2読取部30のそれぞれにおいて、イメージセンサーは、光源が照射する光の原稿32からの反射光を受光し、受光量に応じて生成した電荷を画像データとして出力する。イメージセンサーは、複数の光電変換素子が主走査方向に並んで構成されている。主走査方向とは、原稿32の搬送方向に対して交差する方向である。ここで言う交差とは、直交を意味するが、厳密な直交だけでなく、実際の部品取り付け精度等に起因して生じる程度の誤差を含む意味であってもよい。図2においては、主走査方向は、図2の紙面に対して垂直な方向である。
スキャナー20は、原稿32の両面を読み取ることが可能である。すなわち、第1読取部29は、搬送経路23内を搬送される原稿32の本体部21の方を向く面を読み取り、第2読取部30は、搬送経路23内を搬送される原稿32の蓋22の方を向く面を読み取る。
本実施形態では、原稿32の両面のうち、本体部21の方を向く面、つまり第1読取部29により読み取られる面を「一方の面」と呼ぶ。原稿32の両面のうち、蓋22の方を向く面、つまり第2読取部30により読み取られる面を「他方の面」と呼ぶ。
あるいは、スキャナー20は、第1読取部29および第2読取部30のうち第1読取部29のみを有し、原稿32の一つの面の読み取りの後に原稿32を反転させる機構を有する機種であってもよい。この場合は、原稿32の両面のうち、最初に本体部21の方を向いている面、つまり第1読取部29により先に読み取られる面が「一方の面」であり、前記反転後に第1読取部29により読み取られる面が「他方の面」である。
理想的には、原稿32の「表面」が「一方の面」となり、原稿32の「裏面」が「他方の面」となる。原稿32の表面および裏面は、原稿の内容に依拠して予め決められている。ユーザーは、原稿32の表面が下方つまり本体部21の方を向くように、原稿32を給紙トレイ31に載置する。ただし、ユーザーの間違いにより、裏面が本体部21の方を向いた状態の原稿32が給紙トレイ31に載置されてしまうこともある。スキャナー20は、原稿32の一方の面を第1読取部29により読み取った結果である画像データ、原稿32の他方の面を第2読取部30又は第1読取部29により読み取った結果である画像データ、の順で一枚の原稿32につき2ページ分の画像データを画像処理装置10へ出力する。
画像処理装置10とスキャナー20とは、図示しないネットワークを通じて接続するとしてもよい。画像処理装置10は、独立した一つの情報処理装置によって実現されるだけでなく、ネットワークを介して互いに通信可能に接続した複数の情報処理装置によって実現されてもよい。あるいは、画像処理装置10およびスキャナー20は、それらが一体の装置であってもよい。つまり、以下に説明する画像処理装置10が実行する処理は、スキャナー20の一部分である画像処理装置10が実行する、と解してもよい。
2.読取順序の正否判定処理:
図3は、制御部11が画像処理プログラム12に従って実行する、読取順序の正否判定処理をフローチャートにより示している。
ステップS100では、制御部11は、上述のようにスキャナー20が複数の原稿32の両面読取により出力した複数ページ分の画像データを、通信IF15を介して取得する。本実施形態では、スキャナー20は、両面に文書が印刷された原稿32を読み取るものとする。以下では、スキャナー20が原稿32を読み取ることにより画像処理装置10へ出力する画像データを、「文書データ」と呼ぶ。
スキャナー20からは、1枚目の原稿32の一方の面の読取結果である文書データ、1枚目の原稿32の他方の面の読取結果である文書データ、2枚目の原稿32の一方の面の読取結果である文書データ、2枚目の原稿32の他方の面の読取結果である文書データ…という順序で、複数ページ分の文書データが出力される。そのため、ステップS100で制御部11は、結果的に、複数の原稿32それぞれの一方の面の読み取りにより生成された複数ページ分の文書データを、複数の奇数番目のページ(奇数ページ)の文書データとして取得し、前記複数の原稿32それぞれの他方の面の読み取りにより生成された複数ページ分の文書データを、複数の偶数番目のページ(偶数ページ)の文書データとして取得することになる。
ステップS110では、制御部11は、ステップS100で取得した複数ページ分の文書データのうちの1ページ目の文書データを解析することにより、この1ページ目の文書データを、いずれかのページタイプに分類する。
この場合、制御部11は、1ページ目の文書データを解析することにより「見出し領域」を検出する。見出し領域とは、文書の見出しに該当する文字列を含んだ領域である。見出しを、表題、タイトル、ヘッドライン等とも言う。
制御部11は、見出し領域の検出の対象とするページの文書データから、文字認識により、文字列を抽出する。そして、制御部11は、抽出した文字列のうち、相対的に大きいフォントサイズによる文字列であって、他の文字列との行間として、他の文字列同士の行間よりも広い行間あるいは所定値以上の行間が確保されている文字列を、見出し領域として検出する。例えば、制御部11は、前記抽出した文字列を、フォントサイズの違いに応じて分類し、分類した文字列の中で最も大きいフォントサイズの文字列について、上述した行間の条件を加味して、見出し領域に該当するか否かを判断してもよい。なお、制御部11は、上述したようなフォントサイズまたは行間のいずれか一方の条件に基づいて見出し領域を検出してもよい。
また、制御部11は、1ページ目の文書データを解析することにより「下部空白領域」を検出する。下部空白領域とは、ページ内下部の空白領域のことである。空白領域とは、文字、図形、写真画像などのオブジェクトが何も印刷されていない領域を意味する。制御部11は、下部空白領域の検出の対象とするページの文書データにおいて、上下左右の余白領域を特定する。原稿32の各面においては、余白、縁、マージン等と呼ばれる、何も印刷しない余白領域が上下左右の端部に確保されていることが一般的である。そのため、制御部11はページ単位の文書データの上下左右の各端における所定幅の領域を、余白領域として特定する。そして、制御部11は、下部空白領域の検出の対象とするページの文書データにおける余白領域を除いた領域内の、空白領域であって最も下方の行を含む空白領域を、下部空白領域として検出する。前記最も下方の行に文字列が存在していれば、下部空白領域の存在が成立せず、下部空白領域は検出されない。
制御部11は、見出し領域の検出結果および下部空白領域の検出結果に基づいて、1ページ目の文書データを分類する。
制御部11は、見出し領域の検出に成功し、且つ、下部空白領域の検出に成功したページの文書データを、第1のタイプ(以下、タイプa)に分類する。
また、制御部11は、見出し領域の検出に成功し、且つ、下部空白領域の検出に成功しなかったページの文書データを、第2のタイプ(以下、タイプb)に分類する。
また、制御部11は、見出し領域の検出に成功せず、且つ、下部空白領域の検出に成功したページの文書データを、第3のタイプ(以下、タイプc)に分類する。
また、制御部11は、見出し領域の検出に成功せず、且つ、下部空白領域の検出に成功しなかったページの文書データを、第4のタイプ(以下、タイプd)に分類する。
ステップS120では、制御部11は、ステップS100で取得した複数ページ分の文書データのうち、現時点でステップS110または前回のステップS120による分類を終えているページの次のページについて、文書データを解析することにより、いずれかのページタイプに分類する。ステップS110とステップS120とは、対象のページが異なるだけで、処理は同じである。つまり、ステップS120においても、制御部11は、対象のページの文書データについて見出し領域の検出および下部空白領域の検出を実行し、それら見出し領域の検出結果および下部空白領域の検出結果に基づいて、タイプa,b,c,dのいずれかに分類する。ステップS110の次に実行するステップS120では、制御部11は、当然、ステップS100で取得した複数ページ分の文書データのうちの2ページ目の文書データを対象として、前記分類を行う。
ステップS130では、制御部11は、連続する二ページ分の文書データの前後関係を推測し、その前後関係が適切であるか否かを判定する。ここで言う、連続する二ページ分の文書データとは、ステップS120で分類の対象としたページ(以下、後ページ)の文書データと、後ページの一つ前のページ(以下、前ページ)の文書データとを指す。ステップS110→S120の流れで実行するステップS130では、ステップS100で取得した複数ページ分の文書データのうちの1ページ目が前ページに該当し、2ページ目が後ページに該当する。
制御部11は、推測規則40を参照することにより、連続する二ページ分の文書データの前後関係を推測する。
図4は、推測規則40の例を示している。推測規則40は、一種のテーブルであり、所定の記憶領域(例えば、記憶部16)に予め記憶されている。推測規則40は、前ページのページタイプと後ページのページタイプとの対応関係を規定している。
推測規則40によれば、前ページのページタイプがタイプaであれば、後ページのページタイプはタイプaまたはタイプbと推測される。これは、見出し領域が有り且つ下部空白領域が有るページの次のページは、見出し領域が有るページの可能性が高いからである。
また、推測規則40によれば、前ページのページタイプがタイプbであれば、後ページのページタイプはタイプcまたはタイプdと推測される。これは、見出し領域が有り且つ下部空白領域が無いページの次のページは、見出し領域が無いページの可能性が高いからである。
また、推測規則40によれば、前ページのページタイプがタイプcであれば、後ページのページタイプはタイプaまたはタイプbと推測される。これは、見出し領域が無く且つ下部空白領域が有るページの次のページは、見出し領域が有るページの可能性が高いからである。
また、推測規則40によれば、前ページのページタイプがタイプdであれば、後ページのページタイプはタイプcまたはタイプdと推測される。これは、見出し領域が無く且つ下部空白領域が無いページの次のページは、見出し領域が無いページの可能性が高いからである。
制御部11は、前ページのページタイプと推測規則40とに基づいて、後ページのページタイプを推測する。そして、推測した後ページのページタイプのいずれかと、ステップS120で分類した後ページのページタイプとが合う場合に、連続する二ページ分の文書データの前後関係が適切である(ステップS130において“Yes”)と判定し、ステップS140へ進む。一方、制御部11は、推測した後ページのページタイプのいずれとも、ステップS120で分類した後ページのページタイプが合わない場合に、連続する二ページ分の文書データの前後関係が適切でない(ステップS130において“No”)と判定し、ステップS160へ進む。
ステップS140では、制御部11は、ステップS100で取得した複数ページ分の文書データのうちの最終ページを「後ページ」としたステップS130の判定を終えたか否かにより、処理を分岐する。つまり、制御部11は、最終ページを後ページとしたステップS130の判定を終えたとステップS140で判定した場合(ステップS140において“Yes”)、ステップS150へ進み、最終ページを後ページとしたステップS130の判定を終えていないとステップS140で判定した場合(ステップS140において“No”)、ステップS120以下を繰り返す。これまでの説明から判るように、ステップS120以下を繰り返すサイクルにおいては、前回のステップS130における後ページが今回のステップS130における前ページとなり、前回のステップS130における後ページの次のページが今回のステップS130における後ページとなる。
ステップS150では、制御部11は、原稿32の読取順序が正当であると判定する。ステップS150では、制御部11は、さらに「通常処理」を実施し、フローチャートを終了する。通常処理については、後述する。
一方、ステップS160では、制御部11は、原稿32の読取順序が不当であると判定する。ステップS160では、制御部11は、さらに「誤セット対応処理」を実施し、フローチャートを終了する。誤セット対応処理については、後述する。
図5は、複数の原稿が正しい向きでスキャナー20にセットされて読み取られた事例(Case1)と、複数の原稿が間違った向きでスキャナー20にセットされて読み取られた事例(Case2)とを説明する図である。符号32Aは、ある一枚の原稿32を示し、符号32Bは、原稿32Aとは異なる一枚の原稿32を示している。また、符号32A‐1は、原稿32Aの表面を示し、符号32A‐2は、原稿32Aの裏面を示している。符号32B‐1は、原稿32Bの表面を示し、符号32B‐2は、原稿32Bの裏面を示している。原稿32A,32Bはいずれも両面に文書が印刷された原稿32である。原稿32A,32Bの関係においては、原稿32Aが先頭の原稿32であり、原稿32Bが原稿32Aの次の原稿32である。
従って、原稿32Aの表面32A‐1を下方にして、つまり表面32A‐1が給紙トレイ31に相対する向きで原稿32Aを給紙トレイ31に載置し、原稿32Aの上に、表面32B‐1を下方にして原稿32Bを載置して、スキャナー20で原稿32A,32Bを読み取ったケースが、Case1に該当する。
一方、ユーザーが、原稿32A,32Bの束を、原稿32Bの裏面32B‐2を下方にしてスキャナー20にセットしてしまうこともある。つまり、裏面32B‐2が給紙トレイ31に相対する向きで原稿32Bを給紙トレイ31に載置し、原稿32Bの上に、裏面32A‐2を下方にして原稿32Aを載置して、スキャナー20で原稿32B,32Aを読み取ったケースが、Case2に該当する。
図5では、スペースの都合上、スキャナー20が読み取る複数の原稿32として二枚の原稿32A,32Bを示しているが、言うまでもなくスキャナー20は三枚以上の原稿32を連続的に読み取ることが可能である。
符号IM1は、スキャナー20による表面32A‐1の読取結果としての文書データを示している。符号IM2は、スキャナー20による裏面32A‐2の読取結果としての文書データを示している。符号IM3は、スキャナー20による表面32B‐1の読取結果としての文書データを示している。符号IM4は、スキャナー20による裏面32B‐2の読取結果としての文書データを示している。文書データIM1,IM2,IM3,IM4はそれぞれが、ページ単位の画像データである。図5において、符号IM1,IM2,IM3,IM4とともに括弧書きで記載した番号1,2,3,4は、画像処理装置10の制御部11がスキャナー20から取得したときのページ単位の各文書データの順序、つまりページ順である。
Case1においては、制御部11は、文書データIM1を1ページ目の文書データとして取得し、文書データIM2を2ページ目の文書データとして取得し、文書データIM3を3ページ目の文書データとして取得し、文書データIM4を4ページ目の文書データとして取得する。一方、Case2においては、制御部11は、文書データIM4を1ページ目の文書データとして取得し、文書データIM3を2ページ目の文書データとして取得し、文書データIM2を3ページ目の文書データとして取得し、文書データIM1を4ページ目の文書データとして取得する。
Case1を参照して図3のフローチャートを具体的に説明する。
ステップS110では、制御部11は、1ページ目の文書データIM1を解析することにより、文書データIM1をいずれかのページタイプに分類する。文書データIM1内の文字列「ABCDE」は見出しの一例である。よって、ステップS110では、制御部11は、文字列「ABCDE」を含む見出し領域50を検出する。また、文書データIM1内の下部にハッチングを施して示した領域52は下部空白領域である。つまり、ステップS110では、制御部11は、下部空白領域52を検出する。図5において、文書データIM1,IM2,IM3,IM4内の破線による矩形は、余白領域54を区画している。つまり、文書データIM1,IM2,IM3,IM4の外縁を示す実線による各矩形と、文書データIM1,IM2,IM3,IM4内の破線による各矩形とで挟まれた枠状の領域が、余白領域54である。見出し領域や下部空白領域はいずれも、余白領域54よりも内側の領域内で検出される。制御部11は、文書データIM1から見出し領域50および下部空白領域52の検出に成功したことに応じて、文書データIM1をタイプaに分類する。
ステップS110の次のステップS120では、制御部11は、2ページ目の文書データIM2を解析することにより、文書データIM2をいずれかのページタイプに分類する。文書データIM2内の文字列「FGHIJ」は見出しの一例である。よって、ステップS110の次のステップS120では、制御部11は、文字列「FGHIJ」を含む見出し領域51を検出する。また、文書データIM2内では、最も下方の行まで文字列が存在しているため、下部空白領域は検出されない。制御部11は、文書データIM2から見出し領域51の検出に成功し、下部空白領域を検出できなかったことに応じて、文書データIM2をタイプbに分類する。
ステップS110,S120の後のステップS130では、制御部11は、1ページ目の文書データIM1と2ページ目の文書データIM2との前後関係を推測し、その前後関係が適切であるか否かを判定する。文書データIM1のページタイプは、タイプaであり、推測規則40によれば、前ページがタイプaであるときに推測される後ページはタイプa又はタイプbである。文書データIM2のページタイプは、タイプbである。従って、前ページである文書データIM1のページタイプから推測した後ページのページタイプと、後ページである文書データIM2のページタイプとが合うことにより、制御部11は、ステップS130において“Yes”と判定し、ステップS140へ進む。
ステップS140の“No”の判定を経て、2回目のステップS120では、制御部11は、3ページ目の文書データIM3を解析することにより、文書データIM3をいずれかのページタイプに分類する。文書データIM3内では、ページの最も上方の行から最も下方の行まで文字列が存在しており、見出し領域、下部空白領域はいずれも検出されない。よって、制御部11は、文書データIM3をタイプdに分類する。2回目のステップS120の後のステップS130では、制御部11は、2ページ目の文書データIM2と3ページ目の文書データIM3との前後関係を推測し、その前後関係が適切であるか否かを判定する。文書データIM2のページタイプは、タイプbであり、推測規則40によれば、前ページがタイプbであるときに推測される後ページはタイプc又はタイプdである。文書データIM3のページタイプは、タイプdである。従って、前ページである文書データIM2のページタイプから推測した後ページのページタイプと、後ページである文書データIM3のページタイプとが合うことにより、制御部11は、ステップS130において“Yes”と判定し、ステップS140へ進む。
ステップS140の“No”の判定を経て、3回目のステップS120では、制御部11は、4ページ目の文書データIM4を解析することにより、文書データIM4をいずれかのページタイプに分類する。文書データIM4内では、ページの最も上方の行から文字列が存在している一方で、下部にハッチングを施して示すように下部空白領域53が存在する。従って、制御部11は、文書データIM4から見出し領域を検出できず、下部空白領域53の検出に成功したことに応じて、文書データIM4をタイプcに分類する。3回目のステップS120の後のステップS130では、制御部11は、3ページ目の文書データIM3と4ページ目の文書データIM4との前後関係を推測し、その前後関係が適切であるか否かを判定する。文書データIM3のページタイプは、タイプdであり、推測規則40によれば、前ページがタイプdであるときに推測される後ページはタイプc又はタイプdである。文書データIM4のページタイプは、タイプcである。従って、前ページである文書データIM3のページタイプから推測した後ページのページタイプと、後ページである文書データIM4のページタイプとが合うことにより、制御部11は、ステップS130において“Yes”と判定し、ステップS140へ進む。Case1では、文書データIM4が最終ページであるため、制御部11は、ステップS140において“Yes”と判定し、ステップS150へ進む。
Case2を参照して図3のフローチャートを具体的に説明する。
ステップS110では、制御部11は、1ページ目の文書データIM4を解析することにより、文書データIM4をいずれかのページタイプに分類する。これまでの説明から判るように、文書データIM4はタイプcに分類される。
ステップS110の次のステップS120では、制御部11は、2ページ目の文書データIM3を解析することにより、文書データIM3をいずれかのページタイプに分類する。これまでの説明から判るように、文書データIM3はタイプdに分類される。
ステップS110,S120の後のステップS130では、制御部11は、1ページ目の文書データIM4と2ページ目の文書データIM3との前後関係を推測し、その前後関係が適切であるか否かを判定する。文書データIM4のページタイプは、タイプcであり、推測規則40によれば、前ページがタイプcであるときに推測される後ページはタイプa又はタイプbである。文書データIM3のページタイプは、タイプdである。従って、前ページである文書データIM4のページタイプから推測した後ページのページタイプと、後ページである文書データIM3のページタイプとが合わず、制御部11は、ステップS130において“No”と判定し、ステップS160へ進む。
上述したように、ステップS150では、制御部11は「通常処理」を実施する。通常処理とは、例えば、スキャナー20から取得した複数ページ分の文書データを所定フォーマットの一つのファイルとした上で、所定の保存先(例えば、記憶部16)へ保存する処理である。ステップS150においては、ステップS100で取得した複数ページ分の文書データに関するページの前後関係が、推定規則40から見て適切であることから、原稿32の読取順序が正当であると判定する。そのため、通常処理では、制御部11は、スキャナー20から取得した複数ページ分の文書データについて、ページの並び替えをすることなく、取得したときのページ順で一つのファイルに纏めて、保存する。
ステップS160では、制御部11は「誤セット対応処理」を実施する。ステップS160においては、ステップS100で取得した複数ページ分の文書データに関するページの前後関係が、推定規則40から見て適切でないことから、原稿32の読取順序が不当であると判定する。そこで、誤セット対応処理では、制御部11は、例えば、原稿32の読取順序が正しくない旨を外部へ通知する。
図6は、誤セット対応処理の一つとしての前記通知のために制御部11が表示部13に表示させるユーザーインターフェイス(UI)画面60を例示している。UI画面60は、メッセージ61を含んでいる。メッセージ61は、スキャナー20による原稿32の読取順序が正しくない旨をユーザーに認識させるための文字列であり、例えば「原稿セットの向き(表裏の読取順)が間違っています。」といった内容である。メッセージ61を視認したユーザーは、例えば、UI画面60内のOKボタン63を、操作受付部14を操作することにより押下した上で、原稿32の再スキャンを実行することができる。再スキャンに際しては、ユーザーは、複数の原稿32を正しい向きでスキャナー20の給紙トレイ31へ載置した上で、それら複数の原稿32の読み取りをスキャナー20に実行させる。
UI画面60は、ページ並べ替えボタン62を含むものであってもよい。メッセージ61を視認したユーザーは、例えば、ページ並べ替えボタン62を、操作受付部14を操作することにより押下する。制御部11は、ページ並べ替えボタン62の押下を検知すると、誤セット対応処理の一つとして、ページ並べ替え処理を実行する。ページ並べ替え処理は、スキャナー20から取得した複数ページ分の文書データを並べ替えて保存する処理である。
図5のCase2を参照すると、制御部11は、文書データIM4を1ページ目の文書像データ、文書像データIM3を2ページ目の文書データ、文書データIM2を3ページ目の文書データ、文書データIM1を4ページ目の文書データとして、それぞれ取得済みである。従って、Case2に対応してステップS160で実行するページ並べ替え処理では、制御部11は、文書データIM4,IM3,IM2,IM1の順序を逆に並べ替えて、文書データIM1を1ページ目の文書データ、文書データIM2を2ページ目の文書データ、文書データIM3を3ページ目の文書データ、文書データIM4を4ページ目の文書データとした上で、それら文書データIM1,IM2,IM3,IM4を前記所定フォーマットの一つのファイルとして所定の保存先(例えば、記憶部16)へ保存する。
制御部11は、スキャナー20から取得した複数ページ分の文書データを、スキャナー20から取得したページの順序で並べてメッセージ61とともに、あるいはメッセージ61の表示の代わりに、UI画面60に表示させるとしてもよい。具体的には、図5のCase2に示したように、文書データIM4,IM3,IM2,IM1を、画面左側を先頭にして並べてUI画面60内に表示する。このように、原稿32Bの裏面32B‐2、原稿32Bの表面32B‐1、原稿32Aの裏面32A‐2、原稿32Aの表面32A‐1の順で並んだ各ページの文書データを、UI画面60を介して視認したユーザーは、スキャナー20に対する原稿セットの向きの誤り、つまり原稿32の読取順序が正しくないことを、より具体的に認識することができる。
上述したように、制御部11は、UI画面60を介したユーザーからの指示に応じてページ並べ替え処理を実行する。ただし、別の実施例として、制御部11は、ステップS160ではUI画面60を表示させることなく、ページ並べ替え処理を実行するとしてもよ。つまり、制御部11は、ステップS160では、ページ並べ替え処理を実行すべき旨のユーザーからの指示を受けることなく、自動的にページ並べ替え処理を実行するとしてもよい。
3.まとめ:
このように本実施形態によれば、画像処理装置10は、複数の原稿32の読取結果に対する処理を実行する制御部11を備える。制御部11は、複数の原稿32の読み取りにより生成された複数ページ分の文書データを取得する。そして、制御部11は、取得したページ毎の文書データを対象として、文書の見出しに該当する見出し領域の検出を実行する(ステップS110,S120)。そして、制御部11は、前記ページ毎の文書データにおける見出し領域の有無に基づいてページの前後関係を推測することにより、原稿32の読取順序の正否を判定する(ステップS130,S150,S160)。
前記構成によれば、制御部11は、ページ毎の文書データを少なくとも見出し領域の有無に応じて分類し、分類に基づいてページの前後関係を推測する。そして、推測した通りの前後関係が、前記取得したページ順の文書データ間で保たれていれば原稿の読取順序は正しいと判定し、推測した通りの前後関係が、前記取得したページ順の文書データ間で保たれていなければ原稿の読取順序は正しくないと判定する。
このように、制御部11は、原稿32の読取順序の正否を適切に判定することができる。
また、本実施形態によれば、制御部11は、前記ページ毎の文書データを対象として、ページ内下部の空白領域(下部空白領域)の検出を実行する(ステップS110,S120)。そして、制御部11は、前記ページ毎の文書データにおける見出し領域の有無および下部空白領域の有無に基づいてページの前後関係を推測することにより、原稿32の読取順序の正否を判定する(ステップS130,S150,S160)。
前記構成によれば、見出し領域および下部空白領域という二つの要素それぞれの有無に基づいて、ページの前後関係をより的確に推測することができる。そのため、原稿32の読取順序の正否を判定した結果も、より信頼性の高いものとなる。
なお、本実施形態は、ページ毎の文書データを対象として、見出し領域および下部空白領域を検出する態様に限定されず、見出し領域のみの検出を実行する態様も含む。つまり、制御部11は、ステップS110,S120で、対象の文書データから見出し領域の検出を実行し、見出し領域の有無に応じて文書データのページタイプを分類する。また、制御部11が、ステップS130の判定のために参照する推測規則40も、見出し領域の有無に応じた複数のページタイプ間の前後関係を規定する情報であってもよい。また、制御部11は、例えば、1ページ目の文書データについては、見出し領域を有するページタイプであると推測し、1ページ目の文書データが見出し領域を有さないページタイプであれば、1ページ目に続く2ページ目との前後関係が、推測に反する、つまり適切でない(ステップS130において“No”)と判定してもよい。
また、制御部11は、文書データのページタイプを、より細かく分類してもよい。例えば、制御部11は、文書データ内の見出し領域の位置に応じて、文書データを異なるページタイプに分類する。具体的には、制御部11は、ページ内で最も上方の文字列を見出し領域として検出した場合と、前記最も上方の文字列以外の文字列を見出し領域として検出した場合とで、文書データを異なるページタイプに分類する。制御部11は、前記最も上方の文字列を見出し領域として検出した文書データについては、これまでに説明したタイプaまたはタイプbに分類する。一方、前記最も上方の文字列以外の文字列を見出し領域として検出した文書データのページタイプについては、タイプa~dとは異なる第5のタイプ(以下、タイプe)に分類する。そして、制御部11は、タイプeについては、例えば、下部空白領域を有さないタイプbやタイプdの文書データを前ページとしたときの後ページの一つとなり得る旨の推測をして、ステップS130の判定を行うとしてもよい。
また、本実施形態によれば、制御部11は、文書データに含まれる文字列のフォントサイズ及び又は行間に基づいて見出し領域を検出する。
前記構成によれば、文書データ内から見出し領域を精度良く検出することができる。
また、本実施形態によれば、制御部11は、原稿32の読取順序が正しくないと判定した場合に、原稿32の読取順序が正しくない旨を外部へ通知する。
前記構成によれば、ユーザーに、スキャナー20に対する原稿セットの向きの誤り、つまり原稿32の読取順序が正しくないことを認識させることができる。
また、本実施形態によれば、制御部11は、原稿32の読取順序が正しくないと判定した場合に、前記複数ページ分の文書データを並べ替えて保存する。
前記構成によれば、制御部11は、複数ページ分の文書データを、取得したときのページ順の逆に並び替えることにより、正しい読取順序に対応したページ順で保存することができる。
また、本実施形態は、複数の原稿32の読取結果に対する処理をコンピューターに実行させる画像処理プログラム12を開示する。つまり、画像処理プログラム12は、複数の原稿32の読み取りにより生成された複数ページ分の文書データを取得する機能と、前記取得したページ毎の文書データを対象として、文書の見出しに該当する見出し領域を検出する機能と、前記ページ毎の文書データにおける前記見出し領域の有無に基づいてページの前後関係を推測することにより、前記複数の原稿の読取順序の正否を判定する機能と、をCPU11aに実行させる。むろん、画像処理装置10が実行する各工程を含んだ方法の発明を、本実施形態から捉えることも可能である。
なお、本実施形態は、片面だけに文書が印刷された複数の原稿32について、スキャナー20がそれら原稿32の片面を連続的に片面読取することにより生成した複数ページ分の文書データを、処理する場面においても適用可能である。つまり、複数の原稿32の片面を連続的に読み取ることにより生成された複数ページ分の文書データに対して、上述したような見出し領域等の検出やページの前後関係の推測を実行することにより、原稿32の読取順序の正否を判定することができる。
1…システム、10…画像処理装置、11…制御部、12…画像処理プログラム、13…表示部、14…操作受付部、15…通信IF、16…記憶部、20…スキャナー、23…搬送経路、29…第1読取部、30…第2読取部、31…給紙トレイ、32,32A,32B…原稿、32A‐1,32B‐1…表面、32A‐2,32B‐2…裏面、40…推測規則、50,51…見出し領域、52,53…下部空白領域、54…余白領域、60…UI画面、61…メッセージ、62…ページ並べ替えボタン

Claims (6)

  1. 複数の原稿の読取結果に対する処理を実行する制御部を備える画像処理装置であって、
    前記制御部は、
    前記複数の原稿の読み取りにより生成された複数ページ分の文書データを取得し、
    前記取得したページ毎の文書データを対象として、文書の見出しに該当する見出し領域の検出を実行し、
    前記ページ毎の文書データにおける前記見出し領域の有無に基づいてページの前後関係を推測することにより、前記原稿の読取順序の正否を判定する、ことを特徴とする画像処理装置。
  2. 前記制御部は、前記ページ毎の文書データを対象として、ページ内下部の空白領域である最も下方の行を含む下部空白領域の検出を実行し、前記ページ毎の文書データにおける前記見出し領域の有無および前記下部空白領域の有無に基づいてページの前後関係を推測することにより、前記原稿の読取順序の正否を判定する、ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記制御部は、前記文書データに含まれる文字列のフォントサイズ及び又は行間に基づいて前記見出し領域を検出する、ことを特徴とする請求項1または請求項2に記載の画像処理装置。
  4. 前記制御部は、前記原稿の読取順序が正しくないと判定した場合に、前記原稿の読取順序が正しくない旨を外部へ通知する、ことを特徴とする請求項1~請求項3のいずれかに記載の画像処理装置。
  5. 前記制御部は、前記原稿の読取順序が正しくないと判定した場合に、前記複数ページ分の文書データを並べ替えて保存する、ことを特徴とする請求項1~請求項4のいずれかに記載の画像処理装置。
  6. 複数の原稿の読取結果に対する処理をコンピューターに実行させる画像処理プログラムであって、
    前記複数の原稿の読み取りにより生成された複数ページ分の文書データを取得する機能と、
    前記取得したページ毎の文書データを対象として、文書の見出しに該当する見出し領域を検出する機能と、
    前記ページ毎の文書データにおける前記見出し領域の有無に基づいてページの前後関係を推測することにより、前記複数の原稿の読取順序の正否を判定する機能と、を実行させることを特徴とする画像処理プログラム。
JP2019010934A 2019-01-25 2019-01-25 画像処理装置および画像処理プログラム Active JP7172649B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019010934A JP7172649B2 (ja) 2019-01-25 2019-01-25 画像処理装置および画像処理プログラム
US16/752,047 US10997406B2 (en) 2019-01-25 2020-01-24 Image processing apparatus for determining proper reading order of documents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019010934A JP7172649B2 (ja) 2019-01-25 2019-01-25 画像処理装置および画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2020120308A JP2020120308A (ja) 2020-08-06
JP7172649B2 true JP7172649B2 (ja) 2022-11-16

Family

ID=71732494

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019010934A Active JP7172649B2 (ja) 2019-01-25 2019-01-25 画像処理装置および画像処理プログラム

Country Status (2)

Country Link
US (1) US10997406B2 (ja)
JP (1) JP7172649B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110138992A (zh) * 2018-02-08 2019-08-16 精工爱普生株式会社 收据处理装置、程序的存储介质以及报告的制作方法
JP2022128202A (ja) * 2021-02-22 2022-09-01 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム、及び情報処理プログラム
JP2023124453A (ja) * 2022-02-25 2023-09-06 セイコーエプソン株式会社 画像読取システム、画像読取装置、画像読取方法及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001251483A (ja) 2000-03-08 2001-09-14 Ricoh Co Ltd 画像入力装置
JP2007142631A (ja) 2005-11-16 2007-06-07 Ricoh Co Ltd 画像形成装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5131053A (en) * 1988-08-10 1992-07-14 Caere Corporation Optical character recognition method and apparatus
JP3302147B2 (ja) * 1993-05-12 2002-07-15 株式会社リコー 文書画像処理方法
US7529408B2 (en) * 2005-02-23 2009-05-05 Ichannex Corporation System and method for electronically processing document images
JP4297890B2 (ja) * 2005-06-29 2009-07-15 シャープ株式会社 画像読取装置及び画像記録装置
JP2007036732A (ja) 2005-07-27 2007-02-08 Ricoh Co Ltd 画像読み取り装置および画像形成装置
JP2008028858A (ja) * 2006-07-24 2008-02-07 Ricoh Co Ltd 画像読取装置、画像読取方法および画像読取プログラム
US8594422B2 (en) * 2010-03-11 2013-11-26 Microsoft Corporation Page layout determination of an image undergoing optical character recognition
JP5676942B2 (ja) * 2010-07-06 2015-02-25 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
US8619340B2 (en) * 2010-10-29 2013-12-31 Xerox Corporation Augmenting page orientation direction detection in a digital document processing environment
JP2013168858A (ja) * 2012-02-16 2013-08-29 Fuji Xerox Co Ltd 画像処理装置及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001251483A (ja) 2000-03-08 2001-09-14 Ricoh Co Ltd 画像入力装置
JP2007142631A (ja) 2005-11-16 2007-06-07 Ricoh Co Ltd 画像形成装置

Also Published As

Publication number Publication date
US20200242347A1 (en) 2020-07-30
JP2020120308A (ja) 2020-08-06
US10997406B2 (en) 2021-05-04

Similar Documents

Publication Publication Date Title
JP7172649B2 (ja) 画像処理装置および画像処理プログラム
TWI513271B (zh) 用於掃描多頁文件之掃描系統及方法
US11941903B2 (en) Image processing apparatus, image processing method, and non-transitory storage medium
US10375269B2 (en) Image processing device, image reading device, and image forming apparatus
JP2013031090A (ja) 画像読取装置、及び、読取制御プログラム
US9858513B2 (en) Document file output apparatus, document file output method, and computer readable medium
US11258915B2 (en) Reading apparatus and reading control method
US11206333B2 (en) Image reading and learning apparatus, method, and program product for determining a missing page using a learned model and deriving the learned model
JP2016072833A (ja) 画像読取装置
US20220182497A1 (en) Image processing system, image processing apparatus, control method
US11082576B2 (en) Image reading apparatus, image reading method, and image reading system
JP7192441B2 (ja) 情報処理装置、情報処理装置の画像回転方法、およびプログラム
JP2020120309A (ja) 画像処理装置および画像処理プログラム
US20230208999A1 (en) Image reading system, image reading method, non-transitory computer-readable storage medium storing program
US20220109764A1 (en) Non-transitory computer-readable recording medium for generating image data
US20240129416A1 (en) Method of producing image data and image reading system
JP5526958B2 (ja) 情報処理装置、および、プログラム
JP6648839B2 (ja) 画像読取装置
JP4622239B2 (ja) 通番再印字システム及び方法
US20190012757A1 (en) Image processing apparatus and image processing method
JP2008028782A (ja) 原稿仕分装置及び原稿仕分方法
JP2000293633A (ja) 画像読取装置と該画像読取装置の制御方法、及び文書管理システム
JP2010116256A (ja) 画像読取装置
JP2024067335A (ja) 原稿読取システム及びコンピュータプログラム
CN114662475A (zh) 信息处理装置、信息处理方法以及计算机可读介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211104

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220914

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221017

R150 Certificate of patent or registration of utility model

Ref document number: 7172649

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150