JP2017011605A - 画像形成装置 - Google Patents
画像形成装置 Download PDFInfo
- Publication number
- JP2017011605A JP2017011605A JP2015127577A JP2015127577A JP2017011605A JP 2017011605 A JP2017011605 A JP 2017011605A JP 2015127577 A JP2015127577 A JP 2015127577A JP 2015127577 A JP2015127577 A JP 2015127577A JP 2017011605 A JP2017011605 A JP 2017011605A
- Authority
- JP
- Japan
- Prior art keywords
- page
- document
- control unit
- image forming
- forming apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Control Or Security For Electrophotography (AREA)
- Facsimiles In General (AREA)
Abstract
【課題】文書をスキャナーにて電子データ化する際、文書抜け等のミスを防止する技術を提供する。
【解決手段】画像形成装置は、複数ページの文書を一括してスキャンするスキャン実行処理部を備える。ページ情報管理部60の目次ページ認識部61は、読み込んだ文書において、目次ページを認識する。ページ番号/見出し文字列認識部62は、文書に記載されているページ番号及び見出しを認識する。ページ情報制御部63は、実際にスキャンした文書の枚数と上記で認識した情報とを関連付け、前回と今回のスキャンした文書から抽出された情報を比較し、ページに抜け又は余分が発生しているか否かを判断し、抜け又は余分が発生していると判断した場合、警告を表示する。また、ページ情報制御部63は、その場合、ユーザーの指示のもと、抜け部分の追加や余分部分の削除を行う。
【選択図】図2
【解決手段】画像形成装置は、複数ページの文書を一括してスキャンするスキャン実行処理部を備える。ページ情報管理部60の目次ページ認識部61は、読み込んだ文書において、目次ページを認識する。ページ番号/見出し文字列認識部62は、文書に記載されているページ番号及び見出しを認識する。ページ情報制御部63は、実際にスキャンした文書の枚数と上記で認識した情報とを関連付け、前回と今回のスキャンした文書から抽出された情報を比較し、ページに抜け又は余分が発生しているか否かを判断し、抜け又は余分が発生していると判断した場合、警告を表示する。また、ページ情報制御部63は、その場合、ユーザーの指示のもと、抜け部分の追加や余分部分の削除を行う。
【選択図】図2
Description
本発明は、画像形成装置に係り、例えばHDD(Hard Disk Drive)等の大容量記憶装置を備える画像形成装置に関する。
複合機等の画像形成装置は、文書をスキャンし電子化して保存する機能を有するものがある。ユーザーは、例えば、数ページや数10ページの文書を一括してスキャンし、1つのファイルとして保存することができる。
その様な技術として、例えば、読み取った複数ページからなる画像データから目次ページの目次項目と、目次項目の階層構成情報と、目次項目に対応する対応ページ番号を抽出し、さらに各ページの画像ページ番号を抽出して、目次項目と画像データとの関連付け情報を自動的に作成する技術がある(例えば特許文献1参照)。
ところで、ユーザーが文書をスキャンして保存する場合に、セットミスや搬送不具合による文書抜けが発生することがある。一般に、ユーザーは、文書をセットし所定の設定をした後は、実行ボタンを押すことになり、文書1枚毎にチェックを行うことは無い。したがって、文書抜け等のスキャンミスは、保存完了後にPC等でチェックすることで判明することになり、対策の技術が求められていた。特許文献1に開示の技術では、文書の目次と読み取った画像データとの関連づけは可能であるが、文書抜け等のミスの回避については対応ができておらず別の技術が求められていた。
本発明はこのような状況に鑑みてなされたものであり、上記課題を解決できる技術を提供することを目的とする。
本発明は、複数ページの文書を一括してスキャンする機能を備える画像形成装置であって、前記スキャナー機能が読み込んだ文書において、目次ページを認識する目次ページ認識部と、それぞれの文書に記載されているページ番号及び見出しを認識するページ番号/見出し文字列認識部と、実際にスキャンした文書の枚数と認識した情報とを関連付け、前回のスキャンした文書から抽出された情報と今回スキャンした文書から抽出した情報とを比較し、ページに抜け又は余分が発生しているか否かを判断するページ情報制御部と、を有する。
また、ページ情報制御部は、前記文書から抽出したページ番号及び見出しを抽出元の文書のデータと関連づけて所定のテーブルに記録してもよい。
また、前記ページ情報制御部は、スキャンした文書に抜け又は余分が発生していると判断した場合、警告を表示してもよい。
また、前記ページ情報制御部は、スキャンした文書に抜けが発生していると判断した場合、抜けが発生している箇所に、追加でスキャンした文書を挿入する機能を備えてもよい。
また、前記ページ情報制御部は、スキャンした文書に余分が発生していると判断した場合、余分の文書を削除する機能を備えてもよい。
また、ページ情報制御部は、前記文書から抽出したページ番号及び見出しを抽出元の文書のデータと関連づけて所定のテーブルに記録してもよい。
また、前記ページ情報制御部は、スキャンした文書に抜け又は余分が発生していると判断した場合、警告を表示してもよい。
また、前記ページ情報制御部は、スキャンした文書に抜けが発生していると判断した場合、抜けが発生している箇所に、追加でスキャンした文書を挿入する機能を備えてもよい。
また、前記ページ情報制御部は、スキャンした文書に余分が発生していると判断した場合、余分の文書を削除する機能を備えてもよい。
本発明によると、文書をスキャナーにて電子データ化する際、文書抜け等のミスを防止する技術を実現できる。
以下、本発明を実施するための形態(以下、「実施形態」という)について図面を参照して説明する。
図1は、画像形成装置10の概略構成を示すブロック図である。画像形成装置10は、例えば、複合機(MFP)やプリンター等である。
画像形成装置10は、制御部20と、通信処理部22と、記憶部24と、印刷実行処理部31と、スキャン実行処理部32と、ユーザーIF40と、ページ情報管理部60とを備える。
通信処理部22は、有線LANや無線LAN、USB通信等の通信インターフェイスであり、PC等の外部機器と通信可能に接続される。
記憶部24は、ハードディスク(HDD)やRAM(Random Access Memory)、外部から着脱可能に配置されるメモリカード等であり、印刷処理時に画像データとして一時的に蓄積されたり、スキャン実行処理部32でスキャンしたデータを保存したり、ユーザーの操作履歴を記憶したりする。
制御部20は、MPU(Micro-Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等を備え、各構成要素を統括的に制御することで、印刷出力処理や、原稿等の読み取り処理、構成要素の動作のステータス監視処理や動作制御等を行う。
印刷実行処理部31は、一般的な印刷実行機能を有し、制御部20からの指示により印刷動作を実行する。スキャン実行処理部32は、一般的な構成であって、スキャナー、プラテンガラス、原稿読取スリット等を備え、制御部20の指示により原稿の読み取り処理を実行する。なお、スキャン実行処理部32は、ADF(Auto Document Feeder)を備え、原稿を自動的に給紙可能となっている。つまり、はじめに原稿をADF上にセットすることで、例えば、数十枚の原稿を自動的に読み取らせることができる。
ユーザーIF40は、表示パネル部41と、操作ボタン部42を備える。表示パネル部41は、画像形成装置10に関するステータス情報や操作情報等を表示する。操作ボタン部42は、画像形成装置10に対するユーザー操作を受け付ける。なお、操作ボタン部42は、表示パネル部41と一体に構成されるタッチパネル式のIFや物理的ボタンのIFがあり、それらが組み合わさったインターフェイスであってもよい。
ページ情報管理部60は、紙文書を電子データに変更する際、OCR技術を用いて、目次に記載されているページ番号、各ページに記載されているページ番号、実際のスキャン枚数および見出し文字列を抽出し、電子データ(画像データ)と関連づける。なお、ページ番号や見出し文字列等の抽出技術及び関連づけの技術は、公知の技術(例えば、特許文献1の技術)を用いればよい。
さらに、ページ情報管理部60は、その関連づけを利用して、スキャン漏れ、不要なページの混入等のミスを判断する。ページ情報管理部60は、そのミスを逐次判断しながら進め、または読み込み完了後直ぐに判断することで、電子データ化した後に再度全てのスキャンをし直す手間を省くことを可能とする。
図2は、ページ情報管理部60の構成を示すブロック図である。ページ情報管理部60は、上記機能を実現するために、目次ページ認識部61と、ページ番号/見出し文字列認識部62と、ページ情報制御部63とを備える。
目次ページ認識部61は、スキャンされた文書が目次もしくはページ番号が記載されている文書かどうかを認識する。ページ番号/見出し文字列認識部62は、スキャンした各文書のページ番号および見出し文字列を認識し、各文書の情報として保存する。ページ情報制御部63は、ページ情報テーブルの作成・更新・保存を制御する。なお、目次ページ認識部61、ページ番号/見出し文字列認識部62、ページ情報制御部63の具体的な動作は後述の図6〜8を参照し説明する。
図3〜5は、ページ情報テーブルの例である。ここでは、10ページの文書をスキャンする例を示す。図3は、スキャンした文書が全部揃っている場合のテーブル例である。図4は、スキャンした文書が1ページ不足している場合のテーブル例である。図5は、スキャンした文書が1ページ余分となっている場合のテーブル例である。
ページ情報テーブルの項目は、ここでは、「各ページに記載のページ番号」「実ページ番号」「見出し1」「見出し2」「見出し3」の5項目である。なお、各ページとは、読み込んだ1ページ分の文書という意味である。
ページ番号/見出し文字列認識部62は、各文書に記載されているページ番号を抽出し、ページ番号の認識処理を行い、「各ページに記載のページ番号」に記録する。このとき、認識できなかった場合は「NULL」とする。
「実ページ番号」は、スキャンした枚数の通し番号である。「見出し1」「見出し2」「見出し3」は、ページ番号/見出し文字列認識部62で認識した各ページに記載されている見出し文字列である。
過不足無くスキャンが成功した場合の図3の例では、「各ページに記載のページ番号」が「NULL」、「i」〜「iv」、「1」〜「5」となって、「実ページ番号」が「1」〜「10」となっている。「見出し1」は、「実ページ」の「6」〜「10」に対応する項目に関連づけられている。「見出し2」は、「実ページ」の「6」〜「9」に対応する項目に関連づけられている。そして、「見出し3」は「実ページ」の「7」に対応する項目に関連づけられている。
図4に示す、スキャンした文書が1ページ不足している場合のテーブル例では、「各ページに記載のページ番号」の「3」が抜けている。すなわち、読み込んだ文書の第3ページの「見出し1」が「2.コンポーネント分析」、「見出し2」が「2.1概要」を含むページが抜けた状態である。
一方、図5に示す、スキャンした文書が1ページ余分となっている場合のテーブル例では、「実ページ」の「10」に対応する文書からは「各ページに記載のページ番号」に対応する文字列を抽出できず、「NULL」となっている。本来であれば「5」が抽出される必要がある。そして、「実ページ」の「11」に対応する文書から、「各ページに記載のページ番号」として「5」が抽出されている。つまり、「実ページ」の「10」に対応する文書が余分になっている。
図6は、複数の文書をスキャンしている途中でページの挿入を行う場合のフローチャートである。図7は、複数ページの文書を最後までスキャンしてからページの挿入を行う場合のフローチャートである。図8は、メッセージが表示されて1ページ分の文書を挿入する場合のフローチャートである。
複数ページの文書のスキャン途中でページの挿入を行う場合の処理を図6を参照して説明する。ユーザーがスキャン実行処理部32のADFに複数ページの文書をセットして、所定のボタンを押下しスキャンを開始すると(S200)、目次ページ認識部61は、スキャンした文書が目次ページか否かを判断する(S201)。
スキャンした文書が目次ページで無い場合(S201のN)、ページ番号/見出し文字列認識部62は、ページ番号及び見出し文字列を抽出し(S202)、ページ情報として実ページ番号とともに関連づけして記憶部24に保存する(S203)。
つぎに、ページ情報制御部63は、ページ抜けを判断する(S204)。具体的には、ページ情報制御部63は、スキャンしたページ情報とその前のページ情報とを比較して、例えばページ番号や見出し文字列の章番号が連続になっていない場合、ページが抜けていると判断する。
ページ抜けが発生していると判断すると(S204のY)、ページ情報制御部63は、判断結果を警告メッセージとして表示パネル部41に表示する(S205)。例えば、
本来抽出されるページ番号を表示し、新たに文書をセットし追加スキャンをするようにユーザーに促す表示をする。
本来抽出されるページ番号を表示し、新たに文書をセットし追加スキャンをするようにユーザーに促す表示をする。
追加スキャンがなされた場合(S206のY)、追加された文書がスキャンされページ情報が抽出されると、その追加で抽出されたページ情報がページ情報テーブルに追加される(S207)。追加スキャンがなされなかった場合(S206のN)、ページ情報制御部63はメッセージ内容を保存する(S209)。ユーザーは、後にそのメッセージ内容を確認し、文書が適正に電子化されているか判断できる。
その後、スキャンするページの残りが無ければ(S208のN)、処理は終了する。スキャンするページの残りがあれば(S208のY)、次のページのスキャンに処理が移り(S211)、S201の目次判別処理に戻る。
S201で読み込んだ文書が目次ページであると判断されると(S201のY)、ページ番号/見出し文字列認識部62は、ページ番号及び見出し文字列を抽出し、ページ情報テーブルを作成する(S210)。ただし、目次ページが2文書(目次2ページ目)以降の場合は、既存のページ情報テーブルに抽出した情報を追加し更新する。つまり、目次ページが終了したと判断されるまでは、暫定的なページ情報テーブルの扱いとなる。その後、次のページのスキャンに進む(S211)。また、ページ抜けの判断で抜け無しの場合(S204のN)、次のページのスキャンに進む(S211)。
つづいて、図7を参照して、複数枚の文書を最後までスキャンしてからページの挿入を行う場合の処理を説明する。ユーザーがスキャン実行処理部32のADFに複数ページの文書をセットして、所定のボタンを押下しスキャンを開始すると(S300)、目次ページ認識部61は、スキャンした文書が目次ページか否かを判断する(S301)。
スキャンした文書が目次ページで無い場合(S301のN)、ページ番号/見出し文字列認識部62は、ページ番号及び見出し文字列を抽出し(S302)、ページ情報として実ページ番号とともに関連づけして記憶部24に保存する(S303)。
つぎに、ページ情報制御部63は、ページ抜けを判断する(S304)。ページ抜けが発生していると判断すると(S304のY)、ページ情報制御部63は、判断結果を警告すべきメッセージとしてその内容を記憶部24に保存する(S305)。
その後、スキャンするページの残りが無ければ(S306のN)、ページ情報制御部63は、表示パネル部41に保存した判断結果(警告メッセージ)を表示パネル部41に表示する(S307)。ユーザーは、その警告メッセージをもとに読み込んだ文書を検証し、直ぐに再度スキャンするか否かを判断することができる。
スキャンページの残りがあれば(S306のY)、次のスキャンに処理が移り(S309)、S301の目次判別処理に戻る。
S301で読み込んだ文書が目次ページであると判断されると(S301のY)、ページ番号/見出し文字列認識部62は、ページ番号及び見出し文字列を抽出し、ページ情報テーブルを作成する(S308)。また、ページ抜けの判断で抜け無しの場合(S304のN)、次のページのスキャンに進む(S309)。
つぎに、図8を参照して、メッセージが表示されてページを挿入する場合のフローチャートを説明する。なお、ページ情報制御部63が、表示パネル部41にメッセージを表示され、その場でユーザーの指示により文書の追加、挿入、削除する機能を実行する。
ページ情報制御部63は、すでに保存されている電子化データ(ファイル)のうち、文書を新たに挿入したいファイルの選択をユーザーに促し、取得する(S400)。
つぎに、ページ情報制御部63は、挿入を希望する箇所を指定、すなわち、ページ挿入希望の前後のページの指定をユーザーから受ける(S401)。その結果、ページ情報制御部63は、電子化されたデータを編集可能にオープンする。
ユーザーが挿入希望の文書をスキャン実行処理部32にセットしスキャンをすると(S402)、ページ情報制御部63は、「スキャンしたページを挿入」ボタンを表示パネル部41に表示させユーザーからの押下指示を取得する(S403)。ページ情報制御部63は、スキャンしたページをオープンしたデータの指定箇所に挿入し、ページ情報テーブルを更新する(S404)。
挿入希望の紙文書が残っていれば(S405のY)、S400の処理に戻る。残っていなければ(S405のN)、ユーザーが表示パネル部41に表示した「完了」ボタンを押下することで、電子化したデータがクローズされ、上書きされる(S406)。
以上、本実施形態によると、紙文書を電子データに変更する際、目次に記載されているページ番号、各ページに記載されているページ番号、実際のスキャン枚数および見出し文字列より、スキャン漏れ、不要なページの混入を逐次判断しながら進める。その結果、すべて電子データ化した後に再度すべてのスキャンをし直す手間を省くことができる。
以上、本発明を実施形態をもとに説明した。この実施形態は例示であり、それらの各構成要素の組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
10 画像形成装置
20 制御部
22 通信処理部
24 記憶部
31 印刷実行処理部
32 スキャン実行処理部
40 ユーザーIF
41 表示パネル部
42 操作ボタン部
60 ページ情報管理部
61 目次ページ認識部
62 ページ番号/見出し文字列認識部
63 ページ情報制御部
20 制御部
22 通信処理部
24 記憶部
31 印刷実行処理部
32 スキャン実行処理部
40 ユーザーIF
41 表示パネル部
42 操作ボタン部
60 ページ情報管理部
61 目次ページ認識部
62 ページ番号/見出し文字列認識部
63 ページ情報制御部
Claims (5)
- 複数ページの文書を一括してスキャンする機能を備える画像形成装置であって、
前記スキャナー機能が読み込んだ文書において、目次ページを認識する目次ページ認識部と、
それぞれの文書に記載されているページ番号及び見出しを認識するページ番号/見出し文字列認識部と、
実際にスキャンした文書の枚数と認識した情報とを関連付け、前回のスキャンした文書から抽出された情報と今回スキャンした文書から抽出した情報とを比較し、ページに抜け又は余分が発生しているか否かを判断するページ情報制御部と、
を有することを特徴とする画像形成装置。 - ページ情報制御部は、前記文書から抽出したページ番号及び見出しを抽出元の文書のデータと関連づけて所定のテーブルに記録することを特徴とする請求項1に記載の画像形成装置。
- 前記ページ情報制御部は、スキャンした文書に抜け又は余分が発生していると判断した場合、警告を表示することを特徴とする請求項1または2に記載の画像形成装置。
- 前記ページ情報制御部は、スキャンした文書に抜けが発生していると判断した場合、抜けが発生している箇所に、追加でスキャンした文書を挿入する機能を備えることを特徴とする請求項1から3までのいずれかに記載の画像形成装置。
- 前記ページ情報制御部は、スキャンした文書に余分が発生していると判断した場合、余分の文書を削除する機能を備えることを特徴とする請求項1から4までのいずれかに記載の画像形成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015127577A JP2017011605A (ja) | 2015-06-25 | 2015-06-25 | 画像形成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015127577A JP2017011605A (ja) | 2015-06-25 | 2015-06-25 | 画像形成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017011605A true JP2017011605A (ja) | 2017-01-12 |
Family
ID=57762026
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015127577A Pending JP2017011605A (ja) | 2015-06-25 | 2015-06-25 | 画像形成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017011605A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020057876A (ja) * | 2018-09-28 | 2020-04-09 | ブラザー工業株式会社 | 画像読取装置 |
-
2015
- 2015-06-25 JP JP2015127577A patent/JP2017011605A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020057876A (ja) * | 2018-09-28 | 2020-04-09 | ブラザー工業株式会社 | 画像読取装置 |
JP7159762B2 (ja) | 2018-09-28 | 2022-10-25 | ブラザー工業株式会社 | 画像読取装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10528679B2 (en) | System and method for real time translation | |
JP7159608B2 (ja) | 操作画面の表示装置、画像処理装置及びプログラム | |
KR100788444B1 (ko) | 로그 데이터 기록 장치 및 로그 데이터 기록 방법 | |
US8166382B2 (en) | Data processing apparatus, method of registering electronic document, and computer program | |
CN103186355A (zh) | 打印控制装置及打印控制方法 | |
US20070177227A1 (en) | Code information printing apparatus, printing method, restoration apparatus, and restoration method | |
US8208173B2 (en) | Image forming apparatus, image reading apparatus, and control method thereof | |
US20200314250A1 (en) | Image processing apparatus, method for controlling the same, and storage medium | |
JP2013196479A (ja) | 情報処理システム、情報処理プログラム、情報処理方法 | |
US20180013915A1 (en) | Processing apparatus, processing method, and non-transitory computer readable medium | |
JP2011039580A (ja) | 文書処理装置、文書処理方法およびプログラム | |
JP2006221569A (ja) | 文書処理システム、文書処理方法、プログラムおよび記憶媒体 | |
US10175904B2 (en) | Processing apparatus and non-transitory computer readable medium for selecting a memory area | |
JP2017135561A (ja) | 受信した画像データを扱う画像処理装置、画像処理方法、及びプログラム | |
JP4983464B2 (ja) | 帳票画像処理装置及び帳票画像処理プログラム | |
JP2012015896A (ja) | 画像処理装置 | |
US10638001B2 (en) | Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data | |
US20040196471A1 (en) | Image forming apparatus and image forming method for making image output setting easily | |
JP4644741B2 (ja) | 画像処理装置 | |
JP2017011605A (ja) | 画像形成装置 | |
JP2000322417A (ja) | 画像ファイリング装置及び方法及び記憶媒体 | |
JP6201686B2 (ja) | テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム | |
JP2017004455A (ja) | 画像処理装置、画像処理システム、画像処理方法及びプログラム | |
US11587348B2 (en) | Document classification system and non-transitory computer readable recording medium storing document classification program | |
US11206336B2 (en) | Information processing apparatus, method, and non-transitory computer readable medium |