JPWO2019008919A1 - 原稿読取装置 - Google Patents

原稿読取装置 Download PDF

Info

Publication number
JPWO2019008919A1
JPWO2019008919A1 JP2018555549A JP2018555549A JPWO2019008919A1 JP WO2019008919 A1 JPWO2019008919 A1 JP WO2019008919A1 JP 2018555549 A JP2018555549 A JP 2018555549A JP 2018555549 A JP2018555549 A JP 2018555549A JP WO2019008919 A1 JPWO2019008919 A1 JP WO2019008919A1
Authority
JP
Japan
Prior art keywords
document
character string
image
page
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018555549A
Other languages
English (en)
Other versions
JP6638830B2 (ja
Inventor
恵子 森田
恵子 森田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Publication of JPWO2019008919A1 publication Critical patent/JPWO2019008919A1/ja
Application granted granted Critical
Publication of JP6638830B2 publication Critical patent/JP6638830B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00026Methods therefor
    • H04N1/00039Analysis, i.e. separating and studying components of a greater whole
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/21Intermediate information storage
    • H04N1/2166Intermediate information storage for mass storage, e.g. in document filing systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3872Repositioning or masking
    • H04N1/3873Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3877Image rotation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/21Intermediate information storage
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Library & Information Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Computational Linguistics (AREA)
  • Facsimiles In General (AREA)
  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

原稿読取装置(20)は、原稿の画像を光学的に読み取る原稿読取部(5)と、原稿読取部(5)により読み取られた原稿画像において指定された領域に含まれる文字列を認識する文字列認識部(102)と、原稿読取部5により読み取られた原稿画像を記憶装置に保存する画像保存制御部(103)とを備え、画像保存制御部(103)は、原稿の前ページの原稿画像において文字列認識部(102)により認識された文字列と当ページの原稿画像において文字列認識部(102)により認識された文字列とが異なる場合、前ページまでの原稿画像を1ファイルとして記憶装置(92)に保存する。

Description

本発明は、紙媒体の原稿を電子化する原稿読取装置に関する。
ページ数の多い原稿を複合機でスキャンしてファイル化する際、ファイルサイズが大きくなる場合は複数ファイルに分割することでファイルサイズを抑えようとすることがある。このとき、分割する単位をファイルサイズや一定のページ数で指定すると、原稿によってはユーザーにとって望まない原稿ページ位置で分割されることがある。また、分割するページ位置をユーザーが手動で指定するのは非常に手間がかかる。そこで、分割するページ位置を自動で指定することが求められる。
下記特許文献1には、複数ページからなる原稿を読み取って電子文書を作成可能な画像形成装置において、読み取った原稿画像を文字認識して抽出した行単位の文字列から、ユーザーから与えられた条件に基づいて、章分け箇所の候補行を抽出して該候補行の画像に仮マーカー付けし、前記仮マーカー付けした候補行を含むページの画像を表示して、ユーザーからの指示に基づいて前記候補行が章分け箇所であることを確定し、前記確定された章分け箇所にマーカー付けして原稿画像を修正するとともに、該章分け箇所の行から抽出した文字列と前記章分け箇所とを関連付けしたリンク情報を含むアウトラインデータを生成し、すべての原稿画像と、該アウトラインデータとからリンク情報付の電子文書を生成することが開示されている。
特開2010−109420号公報
上記特許文献1において章分け基準とは文字サイズ等が定義されている。しかしながら、文字サイズ等のルールを基準にして判断するのに有効なものは、予めそのルールを意識して作られた原稿に対してのみであるという問題がある。
本発明は、上記の問題を解決するためになされたもので、複数ページからなる原稿をスキャンしてファイル化する際に、ユーザーが分割するページ位置を指定しなくても、ユーザーにとって好適と想定されるページ位置で原稿を複数のファイルに分割して保存することを目的とする。
本発明の一局面に係る原稿読取装置は、原稿の画像を光学的に読み取る原稿読取部と、前記原稿読取部による原稿の読取で得られた原稿画像における任意の位置の領域の指定を受け付ける指定受付部と、前記原稿読取部による原稿の読取で得られた原稿画像において、前記指定受付部による指定の受付により指定された領域に含まれる文字列を認識する文字列認識部と、前記原稿読取部により読み取られた原稿画像を記憶する記憶装置と、前記原稿読取部により読み取られた原稿画像を前記記憶装置に記憶させる画像保存制御部とを備え、前記画像保存制御部は、前記原稿の前ページの原稿画像において前記文字列認識部により認識された文字列と、当ページの原稿画像において前記文字列認識部により認識された文字列とが異なる場合、前記前ページまでの原稿画像を1ファイルとし、当ページ以降のページを別ファイルとして前記記憶装置に保存するファイル分割処理を行うものである。
本発明によれば、複数ページからなる原稿をスキャンしてファイル化する際に、ユーザーが分割するページ位置を指定しなくても、ユーザーにとって好適と想定されるページ位置で原稿を複数のファイルに分割して保存することができる。
本発明の一実施形態に係る原稿読取装置を備えた画像形成装置の構造を示す正面断面図である。 画像成形装置の主要内部構成を概略的に示す機能ブロック図である。 文字列認識指定領域の設定例を示す図である。 文字列認識指定領域の別の設定例を示す図である。 画像形成装置によるファイル分割処理を示すフローチャートである。 スキャンした原稿画像をページ分割して別ファイルとして保存する例を示す図である。 上下反転した原稿画像の向きを正してページ分割して別ファイルとして保存する例を示す図である。 指定領域が空白であるページを前ページとは別のファイルとして保存する例を示す図である。 指定領域が空白であるページを前ページと同じファイルとして保存する例を示す図である。
以下、本発明の一実施形態に係る原稿読取装置について図面を参照して説明する。図1は、本発明の一実施形態に係る原稿読取装置を備えた画像形成装置の構造を示す正面断面図である。画像形成装置1は、例えば、コピー機能、プリンター機能、スキャナー機能、及びファクシミリ機能等の複数の機能を兼ね備えた複合機である。
画像形成装置1は、装置本体11と、装置本体11の上方に対向配置された原稿読取装置20と、原稿読取装置20と装置本体11との間に設けられた連結部30とから概略構成される。
原稿読取装置20は、連結部30の上端部に支持されている。原稿読取装置20は、原稿読取部5、原稿搬送部6等を備えて構成されている。
原稿読取部5は、原稿読取部筐体の上面開口に装着された、原稿を載置するためのコンタクトガラス161を備えている。コンタクトガラス161には、載置された原稿を読み取る原稿固定読取部(図略)と、原稿搬送部6により搬送される原稿を読み取る原稿搬送読取部(図略)とがある。原稿読取部5は、さらに、コンタクトガラス161に載置された原稿を押さえる開閉自在の原稿押さえカバー162と、コンタクトガラス161の原稿固定読取部に載置された原稿、及びコンタクトガラス161の原稿搬送読取部へ搬送される原稿の各画像を読み取る読取ユニット163とを備えている。読取ユニット163は、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)等のイメージセンサーを用いて原稿の画像を光学的に読み取り、画像データを生成する。
原稿搬送部6は、原稿が載置される原稿載置台61と、画像読み取り済みの原稿が排出される原稿排出部66と、原稿搬送機構65と、を備える。原稿搬送機構65は、図略の給紙ローラー、搬送ローラー、及び用紙反転機構を備えている。原稿搬送機構65は、給紙ローラー及び搬送ローラーの駆動により、原稿載置台61に載置された原稿を1枚ずつ繰り出してコンタクトガラス161の原稿搬送読取部へ搬送して読取ユニット163による読取を可能とした後、原稿排出部66へと排出する。また、原稿搬送機構65は、用紙反転機構が原稿を表裏反転させてコンタクトガラス161の原稿搬送読取部へ再搬送することで、当該原稿の両面の画像を読取ユニット163により読取可能にしている。
さらに原稿搬送部6は、その前面側が上方に移動可能となるように原稿読取部5に対して回動自在に設けられている。原稿搬送部6の前面側を上方に移動させて原稿台としてのコンタクトガラス161上面を開放することにより、コンタクトガラス161の上面に読み取り原稿、例えば見開き状態にされた書籍等をユーザーが載置できるようになっている。
原稿読取装置20の前面に操作部47が配置されている。操作部47は、画像形成装置1が実行可能な各種動作及び処理についてユーザーから画像形成動作実行指示や原稿読取動作実行指示等の指示を受け付ける。操作部47は、ユーザーへの操作案内等を表示する表示部473を備えている。
装置本体11は、画像形成部12、定着部13、給紙部14、用紙排出部15等を備えて構成されている。
画像形成装置1が原稿読取動作を行う場合、原稿搬送部6により搬送されてくる原稿、又はコンタクトガラス161に載置された原稿の画像を原稿読取部5が光学的に読み取り、画像データを生成する。原稿読取部5により生成された画像データは内蔵HDD又はネットワーク接続されたコンピューター等に保存される。
画像形成装置1が画像形成動作を行う場合は、上記原稿読取動作により生成された画像データ、又はネットワーク接続されたコンピューターやスマートフォン等のユーザー端末装置から受信した画像データ、又は内蔵HDDに記憶されている画像データ等に基づいて、画像形成部12が、給紙部14から給紙される記録媒体としての用紙Pにトナー像を形成する。画像形成部12の画像形成ユニット12M、12C、12Y、及び12Bは、感光体ドラムと、感光体ドラムへトナーを供給する現像装置と、トナーを収容するトナーカートリッジと、帯電装置と、露光装置と、1次転写ローラー126とをそれぞれ備えている。
中間転写ベルト125上に転写される各色のトナー画像は、転写タイミングを調整して中間転写ベルト125上で重ね合わされ、カラーのトナー像となる。2次転写ローラー210は、中間転写ベルト125の表面に形成されたカラーのトナー像を、中間転写ベルト125を挟んで駆動ローラー125Aとのニップ部Nにおいて、給紙部14から搬送ローラー対により搬送路190を搬送されてきた用紙Pに転写させる。この後、定着部13が、用紙P上のトナー像を熱圧着により用紙Pに定着させる。定着処理の完了したカラー画像形成済みの用紙Pは、排出トレイ151に排出される。
次に、画像形成装置1の構成を説明する。図2は画像形成装置1の主要内部構成を示す機能ブロック図である。
原稿読取部5は、制御ユニット10による制御の下、光照射部及びCCDセンサー等を有する上記の読取機構163を備える。原稿読取部5は、光照射部により原稿を照射し、その反射光をCCDセンサーで受光することにより、原稿から画像を読み取る。
画像メモリー32は、原稿読取部5による読取で得られた原稿画像のデータを一時的に記憶したり、画像形成部12のプリント対象となるデータを一時的に保存する領域である。
画像処理部31は、画像メモリー32から原稿読取部5で読み取られた画像を読み出して画像処理する。例えば、画像処理部31は、原稿読取部5により読み取られた画像が画像形成部12により画像形成された後の品質を向上させるために、シェーディング補正等の予め定められた画像処理を行う。
画像形成部12は、原稿読取部5で読み取られた印刷データ、ネットワーク接続されたコンピューターから受信した印刷データ等の画像形成を行う。
操作部47は、画像形成装置1が実行可能な各種動作及び処理についてユーザーからの指示を受け付ける。操作部47は、液晶表示器でできたタッチパネル式の表示部473を備える。操作部47は、原稿読取部5による原稿の読取で得られた原稿画像における任意の位置の領域の指定をユーザーから受け付ける。操作部47は、特許請求の範囲における指定受付部の一例である。
表示部473は、画像形成装置1が通常動作モードにあるときに、操作画面、プレビュー画面、印刷ジョブ状況の確認画面等の各種表示をする。一方、表示部473は、画像形成装置1がスリープモードにあるときには消灯する。
HDD(ハードディスクドライブ)92は、原稿読取部5によって読み取られた原稿画像等を記憶する大容量の記憶装置である。
駆動モーター70は、画像形成部12の各回転部材及び搬送ローラー対等に回転駆動力を付与する駆動源である。
制御ユニット10は、プロセッサー、RAM、ROM及び専用のハードウェア回路等から構成される。プロセッサーは、例えば、CPU、MPU、ASIC等である。制御ユニット10は、制御部100、文字列認識部102、及び画像保存制御部103を備えている。なお、HDD92又は上記ROMに原稿読取プログラムが記憶されており、制御ユニット10は、当該原稿読取プログラムに従って動作することにより、本実施形態で示す下記原稿読取処理の実行に必要な動作を制御部100、文字列認識部102、及び画像保存制御部103として行う。なお、当該原稿読取プログラムによらず、制御ユニット10が、ハード回路としての制御部100、文字列認識部102、及び画像保存制御部103を備えるようにしてもよい。
制御部100は、画像形成装置1の全体的な動作を司るものであり、原稿読取部5、原稿給送部6、画像メモリー32、画像処理部31、画像形成部12、操作部47、及びHDD92等と接続され、これら各部の駆動制御を行う。
文字列認識部102は、原稿読取部5により読み取られた原稿画像において指定された領域に含まれる文字列を認識する。より詳細には、文字列認識部102は、OCR(Optical Character Recognition)技術を用いて、原稿画像において指定された領域に含まれる文字列を認識する。
図3Aは、文字列認識指定領域の設定例を示す図である。例えば、原稿タイプ「片面原稿」の原稿の場合、各ページのヘッダーに章番号や見出し等が記載されることがある。従って、各ページのヘッダーにおいて章番号や見出し等が記載される領域の始点及び終点のXY座標を、ユーザーが操作部47の操作(例えばタッチパネルに対するスライド操作)により指定して、操作部47が当該指定を受け付けることにより、文字列認識指定領域110を設定する。
図3Bは、文字列認識指定領域の別の設定例を示す図である。例えば、原稿タイプ「見開き原稿」の原稿の場合、奇数ページと偶数ページとでヘッダーの左右対称の位置に章番号や見出し等が記載されることがある。従って、奇数ページのヘッダーにおいて章番号や見出し等が記載される領域の始点及び終点のXY座標をユーザーが操作部47の操作により指定して文字列認識指定領域110Aを設定し、偶数ページには奇数ページと左右対称となる位置に文字列認識指定領域110Bを設定する。
更に、文字列認識部102は、原稿画像において指定された領域が空白であると認識した場合、当該原稿画像を180度回転した画像において、指定された領域に含まれる文字列を認識する。これにより、原稿の中に上下反転したページが混ざっている場合において、ユーザーがページの向きを直さなくとも原稿画像の向きを正すことができ、ユーザーの利便性を向上させることができる。なお、原稿画像を180度回転させるか否かはユーザーが任意に設定することができる。
画像保存制御部103は、原稿読取部5により読み取られた原稿画像を複数のファイルに分割してHDD92やネットワーク接続されたコンピューターが有する図略のストレージ装置等の記憶装置に保存する。特に、画像保存制御部103は、原稿の前ページの原稿画像において文字列認識部102により認識された文字列と当ページの原稿画像において文字列認識部102により認識された文字列とが異なる場合、前ページまでの原稿画像を1ファイルとして記憶装置に保存するファイル分割処理を行う。画像保存制御部103は、更に、当ページ以降のページを別ファイルとして記憶装置に保存する。なお、画像保存制御部103は、文字列認識部102により認識された文字列から原稿画像のファイル名を生成する。これにより、ユーザーが手動でファイル名を設定する手間が省け、ユーザーの利便性を向上させることができる。
次に、画像形成装置1によるファイル分割処理を説明する。図4は、画像形成装置1によるファイル分割処理を示すフローチャートである。
まず、原稿読取部5が原稿給送部6から1枚ずつ搬送される原稿をスキャンして当該原稿の画像を光学的に読み取る(S1)。原稿読取部5により読み取られた原稿画像は画像メモリー32に一時的に保存される。
原稿の1ページのスキャンが完了すると、ファイル分割処理が開始され、文字列認識部102が、画像メモリー32に一時保存された原稿画像を読み出して、指定された領域に含まれる文字列を認識する(S2)。
文字列認識部102が、原稿画像において指定された領域に文字列を認識できない場合、すなわち、当該指定された領域が空白であると判断した場合(S3でYES)、当ページが上下反転している可能性がある。従って、ユーザーが原稿画像の180度回転を許可している場合には(S4でYES)、文字列認識部102は、原稿画像を180度回転して(S5)当該回転した画像において指定された領域に含まれる文字列を認識する(S6)。
文字列認識部102が文字列を認識できたならば、すなわち、指定された領域が空白でないならば(S3でNO又はS7でNO)、画像保存制御部103が、原稿の前ページの原稿画像において文字列認識部102により認識された文字列と、当ページの原稿画像において文字列認識部102により認識された文字列とを比較する(S8)。そして、画像保存制御部103は、前ページと当ページとで文字列が異なっていると判断した場合(S8でYES)、前ページまでの原稿画像を1ファイルとして記憶装置に保存する(S9)。これにより、前ページと当ページとでファイルが分割され、前ページまでの原稿画像を含むファイルが記憶装置に保存される。
この場合、画像保存制御部103は、原則としては、比較対象とする上記両文字列の大きさやフォントについては、上記異なっているか否かの判断の要素とはせず、当該両文字列を構成する各文字同士がキャラクター(テキスト)として一致するか否かにより、上記異なっているか否かの判断を行う。但し、画像保存制御部103は、上記比較対象とする上記両文字列について、文字列の大きさ又はフォントが、予め定められた文字数(例えば、当該文字例をなす全文字数の1/2となる文字数)以上異なるか否かを判定し、文字列の大きさ又はフォントが、当該予め定められた文字数以上異なると判定した場合に、比較対象とする上記両文字列が異なっていると判断するようにしてもよい。
画像保存制御部103により、前ページと当ページとで文字列が同じであると判断されるか(S8でNO)、又はステップS9で前ページまでの原稿画像を含むファイルの保存の完了後に、原稿の次ページがあると判断されれば(S10でYES)、ステップS1へ戻って原稿読取部5が原稿の次ページを読み取る。一方、画像保存制御部103は、原稿の次ページがないと判断すると(S10でNO)、当ページの原稿画像を含む未保存の原稿画像を1ファイルとして記憶装置に保存して(S11)、原稿読取処理が終了する。
図5は、スキャンした原稿画像をページ分割して別ファイルとして保存する例を示す図である。例えば、原稿の第1ページ及び第2ページのヘッダーに文字列「4-19xxx」が記載され、第3ページ及び第4ページのヘッダーに文字列「4-20yyy」が記載されている場合、上記の原稿読取処理が行われると、文字列認識部102及び画像保存制御部103により、原稿の第1ページ及び第2ページの原稿画像がファイル名「4-19xxx.pdf」として保存され、第3ページ及び第4ページの原稿画像がファイル名「4-20yyy.pdf」として保存される。
図6は、上下反転した原稿画像の向きを正してページ分割して別ファイルとして保存する例を示す図である。例えば、図5と同じ原稿において第3ページの上下が反転していた場合、文字列認識部102により、当該ページの原稿画像を180度回転して文字列「4-20yyy.pdf」が認識されて、画像保存制御部103により、原稿の第1ページ及び第2ページの原稿画像がファイル名「4-19xxx.pdf」として保存され、第3ページ及び第4ページの原稿画像がファイル名「4-20yyy.pdf」として保存される。
ところで、原稿の全てのページにおいて指定領域に文字が記載されているとは限らず、奇数ページ又は偶数ページのいずれか一方のページのヘッダーにのみ章番号や見出し等が記載されることがある。その場合、他方のページの原稿画像において指定された領域には文字は記載されておらず空白である。そのようなページの原稿画像については、前ページの続きとみなして前ページの原稿画像と同じファイルで保存するか、それとも前ページとは別のファイルとして保存するかを、ユーザーが操作部47の操作により指示を入力して任意に設定する。操作部47は当該指示を受け付ける。画像保存制御部103は当該指示に従って、ファイルを区切るページ位置を設定し、各ファイルを作成する。
図4へ戻り、文字列認識部102により指定領域が空白であると判断された場合であって(S3でYES)、原稿画像を180度回転するように設定されていない場合(S4でNO)、又は原稿画像を180度回転した画像においても指定領域に文字列が認識されない、すなわち、指定領域が空白である場合において(S7でYES)、指定領域が空白であるページを前ページの続きとする設定がなされていない場合には(S12でNO)、画像保存制御部103は、前ページまでの原稿画像を1ファイルとして記憶装置に保存する(S9)。これにより、指定領域が空白である当ページが前ページと分離され、前ページまでの原稿画像を含むファイルが記憶装置に保存される。
図7は、指定領域が空白であるページを前ページとは別のファイルとして保存する例を示す図である。例えば、原稿の第3ページの指定領域が空白である場合、画像保存制御部103により、第2ページまでの原稿画像がファイル名「4-19xxx.pdf」として保存される。一方、第3ページ以降の原稿画像は、第4ページの原稿画像の指定領域において認識された文字列「4-20yyy」に基づいて、画像保存制御部103により、ファイル名「4-20yyy.pdf」として保存される。
一方、指定領域が空白であるページを前ページの続きとする設定がされている場合には(S12でYES)、画像保存制御部103により前ページまでの原稿画像の保存は行われず、原稿の次ページがあれば(S10でYES)、ステップS1へ戻って原稿読取部5が原稿の次ページを読み取る。
図8は、指定領域が空白であるページを前ページと同じファイルとして保存する例を示す図である。例えば、原稿の第3ページの指定領域が空白である場合、第3ページは第2ページの続きとして扱われ、画像保存制御部103により、第3ページまでの原稿画像がファイル名「4-19xxx.pdf」として記憶装置に保存され、第4ページの原稿画像がファイル名「4-20yyy.pdf」として記憶装置に保存される。
この本実施形態によれば、複数ページからなる原稿をスキャンしてファイル化する際に、ユーザーが分割するページ位置を指定しなくても、ユーザーにとって好適と想定されるページ位置で原稿を複数のファイルに分割して保存することができる。これにより、ユーザーが分割するページ位置を手動で指定する手間が省け、ユーザーの利便性を向上させることができる。
なお、本実施形態によれば、原稿の1ページのスキャンが完了するごとに指定された領域の文字列認識及びページ分割処理を行なっている。すなわち、文字列認識部102は、原稿読取部5による原稿の1ページの読取が完了するごとに、指定された領域の文字列認識を行い、画像保存制御部103は、前記ファイル分割処理を行なっている。これに対して、原稿の全ページをスキャンして全ページの原稿画像データを画像メモリー32に蓄積してから各ページの指定領域の文字列認識及びページ分割処理を行ってもよい。すなわち、文字列認識部102は、原稿読取部5による原稿の全ページを読み取って全ページの原稿画像データをメモリー32(記憶装置)に蓄積した後に、各ページの前記指定された領域の文字列認識を行い、画像保存制御部103は、前記ファイル分割処理を行うようにしてもよい。
以上、本発明の実施形態について説明したが、本発明は上記実施の形態の構成に限られず種々の変形が可能である。例えば、また、ユーザーは、操作部47の操作により、原稿画像において文字列を読み取るべき領域として、ヘッダーの領域に限らず、フッターや小口側の領域を指定してもよい。この場合、文字列認識部102は、当該指定された領域で文字列を認識する。
また、上記実施形態において、画像保存制御部103は、上記のS1において原稿読取部5により読み取られた原稿画像のデータ量が予め定められたデータ量を超える場合に、S2乃至S11に示すファイル分割処理を行うようにしてもよい。
また、上記実施形態では、本発明に係る原稿読取装置を複合機に搭載した例を説明しているが、これは一例に過ぎず、本発明に係る原稿読取装置は、例えば、コピー機、ファクシミリ装置、スキャナー装置に搭載することも可能である。
また、図1乃至図8を用いて上記実施形態により示した構成及び処理は、本発明の一実施形態に過ぎず、本発明を当該構成及び処理に限定する趣旨ではない。

Claims (11)

  1. 原稿の画像を光学的に読み取る原稿読取部と、
    前記原稿読取部による原稿の読取で得られた原稿画像における任意の位置の領域の指定を受け付ける指定受付部と、
    前記原稿読取部による原稿の読取で得られた原稿画像において、前記指定受付部による指定の受付により指定された領域に含まれる文字列を認識する文字列認識部と、
    前記原稿読取部により読み取られた原稿画像を記憶する記憶装置と、
    前記原稿読取部により読み取られた原稿画像を前記記憶装置に記憶させる画像保存制御部とを備え、
    前記画像保存制御部は、前記原稿の前ページの原稿画像において前記文字列認識部により認識された文字列と、当ページの原稿画像において前記文字列認識部により認識された文字列とが異なる場合、前記前ページまでの原稿画像を1ファイルとし、当ページ以降のページを別ファイルとして前記記憶装置に保存するファイル分割処理を行う原稿読取装置。
  2. 前記画像保存制御部は、前記原稿読取部により読み取られた原稿画像のデータ量が予め定められたデータ量を超える場合に、前記ファイル分割処理を行う請求項1に記載の原稿読取装置。
  3. 前記画像保存制御部は、前記文字列認識部により認識された文字列から前記原稿画像のファイル名を生成する請求項1に記載の原稿読取装置。
  4. 前記文字列認識部は、前記原稿の奇数ページ及び偶数ページで前記指定された領域を左右対称にして文字列を認識する請求項1に記載の原稿読取装置。
  5. 前記文字列認識部は、前記指定された領域が空白であると認識した場合、前記原稿画像を180度回転した画像において前記指定された領域に含まれる文字列を認識する請求項1に記載の原稿読取装置。
  6. 前記画像保存制御部は、前記文字列認識部により前記原稿の当ページの原稿画像において前記指定された領域が空白であると認識された場合、当ページの原稿画像を、前ページまでの原稿画像とともに1ファイルとし、当ページの次のページ以降のページを別ファイルとして、前記ファイル分割処理を行う請求項1に記載の原稿読取装置。
  7. 前記画像保存制御部は、前記文字列認識部により前記原稿の当ページの原稿画像において前記指定された領域が空白であると認識された場合、当ページの原稿画像を、次ページ以降の原稿画像とともに1ファイルとし、当ページの前ページ以前のページを別の1ファイルとして、前記ファイル分割処理を行う請求項1に記載の原稿読取装置。
  8. 前記画像保存制御部は、前記文字列認識部において前記両文字列の大きさやフォントについては異なっているか否かの判断をせず、当該両文字列を構成する各文字同士がキャラクターとして異なると認識された場合に、前記原稿の前ページの原稿画像において前記文字列認識部により認識された文字列と、当ページの原稿画像において前記文字列認識部により認識された文字列とが異なるものとして、前記ファイル分割処理を行う請求項1に記載の原稿読取装置。
  9. 前記画像保存制御部は、前記文字列認識部により、文字列の大きさ又はフォントが、予め定められた文字数以上異なると認識された場合に、前記原稿の前ページの原稿画像において前記文字列認識部により認識された文字列と、当ページの原稿画像において前記文字列認識部により認識された文字列とが異なるものとして、前記ファイル分割処理を行う請求項1に記載の原稿読取装置。
  10. 前記文字列認識部は、前記原稿読取部による原稿の1ページの読取が完了するごとに、前記指定された領域の文字列認識を行い、前記画像保存制御部は、前記ファイル分割処理を行う請求項1に記載の原稿読取装置。
  11. 前記文字列認識部は、前記原稿読取部による原稿の全ページを読み取って全ページの原稿画像データを前記記憶装置に蓄積した後に、各ページの前記指定された領域の文字列認識を行い、前記画像保存制御部は、前記ファイル分割処理を行う請求項1に記載の原稿読取装置。
JP2018555549A 2017-07-03 2018-05-17 原稿読取装置 Expired - Fee Related JP6638830B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017130707 2017-07-03
JP2017130707 2017-07-03
PCT/JP2018/019076 WO2019008919A1 (ja) 2017-07-03 2018-05-17 原稿読取装置

Publications (2)

Publication Number Publication Date
JPWO2019008919A1 true JPWO2019008919A1 (ja) 2019-07-04
JP6638830B2 JP6638830B2 (ja) 2020-01-29

Family

ID=64950818

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018555549A Expired - Fee Related JP6638830B2 (ja) 2017-07-03 2018-05-17 原稿読取装置

Country Status (4)

Country Link
US (1) US10397416B2 (ja)
JP (1) JP6638830B2 (ja)
CN (1) CN109479081B (ja)
WO (1) WO2019008919A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6983675B2 (ja) * 2018-01-23 2021-12-17 キヤノン株式会社 スキャン画像に関連する情報を設定するための装置、方法、プログラム、およびシステム
US11544664B2 (en) * 2018-03-21 2023-01-03 Walmart Apollo, Llc System and methods for tracking an item in a distributed environment
EP4284925A1 (en) 2021-01-26 2023-12-06 California Institute of Technology Allosteric conditional guide rnas for cell-selective regulation of crispr/cas
JP2023023590A (ja) * 2021-08-05 2023-02-16 京セラドキュメントソリューションズ株式会社 画像処理装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5860075A (en) * 1993-06-30 1999-01-12 Matsushita Electric Industrial Co., Ltd. Document data filing apparatus for generating visual attribute values of document data to be filed
JPH11282849A (ja) * 1998-03-27 1999-10-15 Canon Inc 画像検査装置及び方法
KR101188393B1 (ko) * 2004-07-12 2012-10-05 삼성전자주식회사 동영상 연속촬영을 통한 전자문서 생성방법 및 장치
JP5040201B2 (ja) * 2006-07-18 2012-10-03 富士ゼロックス株式会社 文書ファイル処理プログラム、方法、及び装置
JP2008165386A (ja) * 2006-12-27 2008-07-17 Canon It Solutions Inc 文書管理装置、文書管理方法、文書管理プログラム
JP4861251B2 (ja) * 2007-05-31 2012-01-25 キヤノン株式会社 画像処理装置およびその制御方法
JP4934124B2 (ja) 2008-10-28 2012-05-16 シャープ株式会社 画像形成装置
US8509534B2 (en) * 2010-03-10 2013-08-13 Microsoft Corporation Document page segmentation in optical character recognition
CN103186911B (zh) * 2011-12-28 2015-07-15 北大方正集团有限公司 一种处理扫描书数据的方法及装置
JP5582151B2 (ja) * 2012-01-12 2014-09-03 コニカミノルタ株式会社 画像形成装置及び同装置における文書データのプレビュー表示方法
US20140115436A1 (en) * 2012-10-22 2014-04-24 Apple Inc. Annotation migration
JP5835381B2 (ja) * 2014-03-17 2015-12-24 富士ゼロックス株式会社 画像処理装置及びプログラム
JP6545573B2 (ja) * 2015-08-25 2019-07-17 シャープ株式会社 画像処理装置、画像形成装置及び章分け処理方法

Also Published As

Publication number Publication date
US10397416B2 (en) 2019-08-27
CN109479081B (zh) 2019-12-17
JP6638830B2 (ja) 2020-01-29
WO2019008919A1 (ja) 2019-01-10
US20190141203A1 (en) 2019-05-09
CN109479081A (zh) 2019-03-15

Similar Documents

Publication Publication Date Title
JP6638830B2 (ja) 原稿読取装置
JP4559675B2 (ja) 画像形成装置及び画像形成方法
JP2009100211A (ja) 画像読取装置及び画像読取方法
US9898237B1 (en) System and method of printing using mixed paper sizes
JP4997210B2 (ja) 画像形成装置
JP3996452B2 (ja) 画像形成装置及び方法
US9118860B2 (en) Image forming apparatus capable of drawing stamp on recording sheets, and image forming method
JP2009210782A (ja) 画像形成装置
US20210385352A1 (en) Image reading device and image reading method
JP6583164B2 (ja) 画像形成装置
US9712704B2 (en) Scanner providing centered alignment marks
JP7354816B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム
JP6470071B2 (ja) 画像処理装置
JP6818505B2 (ja) 画像切出装置、複合機、画像切出方法及び画像切出用プログラム
JP3629969B2 (ja) 画像認識装置
JP2011004356A (ja) 画像形成装置
US9201615B2 (en) Image forming device and method for displaying image information
JP5963643B2 (ja) 画像形成装置及び画像形成方法
JP6604314B2 (ja) 画像読取装置、画像形成装置、画像読取方法
JP7215311B2 (ja) 画像読取り装置、画像読取り方法およびコンピュータプログラム
JP2024016764A (ja) 画像読取装置及び画像形成装置
JP5951561B2 (ja) 画像形成装置及び画像形成方法
JP2017170843A (ja) 画像形成装置及び画像形成方法
JP6022656B2 (ja) 画像処理装置
JP2021190919A (ja) 画像形成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181022

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191001

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191209

R150 Certificate of patent or registration of utility model

Ref document number: 6638830

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees