JP2014220772A - 画像処理装置及びその制御方法とプログラム - Google Patents

画像処理装置及びその制御方法とプログラム Download PDF

Info

Publication number
JP2014220772A
JP2014220772A JP2013100704A JP2013100704A JP2014220772A JP 2014220772 A JP2014220772 A JP 2014220772A JP 2013100704 A JP2013100704 A JP 2013100704A JP 2013100704 A JP2013100704 A JP 2013100704A JP 2014220772 A JP2014220772 A JP 2014220772A
Authority
JP
Japan
Prior art keywords
image data
document
difference
still image
reading area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013100704A
Other languages
English (en)
Inventor
克幸 ▲高▼橋
克幸 ▲高▼橋
Katsuyuki Takahashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2013100704A priority Critical patent/JP2014220772A/ja
Publication of JP2014220772A publication Critical patent/JP2014220772A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • H04N1/10Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa using flat picture-bearing surfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Input (AREA)
  • Facsimiles In General (AREA)

Abstract

【課題】 複数枚の原稿をスキャンし保存する処理を、原稿の交換や、原稿の読み取り処理の終了指示の手間を省いた操作によって実現できるようにする。
【解決手段】 読取領域に原稿がない状態の背景画像データと、読取領域内で原稿が静止したときの原稿の静止画データとを記憶し、読取領域の原稿の枚数が1枚のとき、背景画像データと原稿の静止画データとの差分に基づいて、読取領域に含まれる原稿の画像データを抽出し、読取領域の原稿の枚数が複数のとき、読取領域の原稿の枚数が現在の枚数よりも1枚少ないときの原稿の静止画データと、読取領域の原稿の枚数が現在の枚数のときの原稿の静止画データと背景画像データとに基づいて、読取領域に最近に置かれた原稿の画像データを抽出する。こうして抽出された画像データから文書ファイルを作成するとともに、画像データを抽出した後、撮影した読取領域の画像データと背景画像データとの差が所定値以下になると、文書ファイルの作成を完了する。
【選択図】 図7

Description

本発明は、原稿を読み取って得られた画像データを処理する技術に関する。
従来、図2に示すような書画台に原稿を載せることによって、その原稿の画像をカメラ部で撮影して読み取っていく撮影装置がある。例えば特許文献1には、原稿台上の原稿の画像データに射影補正、拡大縮小等の画像処理を施して記憶装置に原稿画像データとして蓄積し、プロジェクタに投影する技術が記載されている。
特開2006−115334号公報
しかしながら、従来の技術では、複数枚の原稿を読み取って保存する際には、1枚の原稿を読み取った後、必ずその原稿を除去してから次の原稿を読み込ませるというステップを踏む必要があり手間がかかっていた。また、複数枚の原稿を読み取った後、その原稿の画像データの保存操作の終了を指示するために、その保存操作終了を指示するためのキーを設ける必要があった。
本発明の目的は、上記従来技術の問題点を解決することにある。
本発明の特徴は、複数枚の原稿を読み取る際、読み取り済の原稿を除去しなくても複数枚の原稿を読み取る技術を提供することにある。
上記目的を達成するために本発明の一態様に係る画像処理装置は以下のような構成を備える。即ち、
読取領域を撮影して撮影した画像データを出力する撮影手段と、
前記撮影手段から出力された前記読取領域に原稿がない状態の背景画像データと、前記読取領域内で原稿が静止したときの原稿の静止画データとを記憶する記憶手段と、
前記読取領域の原稿の枚数が1枚のとき、前記背景画像データと前記原稿の静止画データとの差分に基づいて、前記読取領域に含まれる原稿の画像データを抽出する第1の抽出手段と、
前記読取領域の原稿の枚数が複数のとき、前記読取領域の原稿の枚数が現在の枚数よりも1枚少ないときの前記記憶手段に記憶されている原稿の静止画データと、前記読取領域の原稿の枚数が現在の枚数のときの前記記憶手段に記憶されている原稿の静止画データと、前記背景画像データとに基づいて、前記読取領域に最近に置かれた原稿の画像データを抽出する第2の抽出手段と、
前記第1及び第2の抽出手段により抽出された画像データから文書ファイルを作成する作成手段と、
前記第1の抽出手段が前記画像データを抽出した後、前記撮影手段が撮影した前記読取領域の画像データと前記背景画像データとの差が所定値以下になると、前記作成手段による前記文書ファイルの作成を完了することを特徴とする。
本発明によれば、複数枚の原稿を読み取る際、読み取り済の原稿を除去しなくても複数枚の原稿を読み取ることができる。
本発明の実施形態1に係る画像読取システムの構成を説明する図。 実施形態1に係るカメラスキャナを説明する外観図。 実施形態1に係るカメラスキャナのコントローラ部の構成を説明するブロック図。 実施形態1に係るカメラスキャナのコントローラ部のCPUが実行する制御用プログラムの機能構成図。 実施形態1に係る撮影処理部の処理を説明するフローチャート。 実施形態1に係る撮影処理部が撮影する読取領域の画像データと、射影変換した画像とを説明する図。 実施形態1に係る画像認識部の処理を説明するフローチャート。 実施形態1に係る画像認識部の処理を説明するフローチャートで、(A)は、図7のS708の1ページ目の原稿の画像データの抽出処理を説明するフローチャート、(B)は、図7のS710の2ページ目以降の原稿の画像データの抽出処理を説明するフローチャート。 実施形態1に係る画像認識部の処理を説明するフローチャートで、(A)は、図8(B)のS811の差分画像データの生成と差分量の算出処理を説明するフローチャート、(B)は、図8(B)のS812の差分画像データから画像データを抽出する処理を説明するフローチャート。 実施形態1に係る背景画像データの格納処理、及び原稿の画像データの格納処理を説明する図。 実施形態1に係る1ページ目の原稿の静止画像データの一例とともに、図8(A)の処理を説明する図。 実施形態1に係る画像認識部が実行する2ページ目以降の原稿の画像データの処理を説明する図。 実施形態1に係る抽出画像データの画像属性の一例を示す図。 実施形態1に係る画像変換部が実行する処理を説明するフローチャート。 実施形態1に係る画像変換部が実行する処理を説明するフローチャートで、(A)は、図14のS1402の処理を示すフローチャート、(B)はS1403,S1405の処理を示すフローチャート。 実施形態1に係る画像変換部が保存する画像データと、その属性を説明する模式図。 図14のS1407で生成する出力ファイルのフォーマットの一例であるXML形式のテキストファイルの記述例を示す図。 実施形態1に係る画像変換部による、図14のS1407の出力ファイルの生成処理手順を説明するフローチャート。 本発明の実施形態2に係る原稿画像の一例を示す図。 実施形態2に係る画像認識部による図7のS710の2ページ目以降の原稿の画像データの抽出処理を説明するフローチャート。 本発明の実施形態2に係る画像変換部が実行する処理を説明するフローチャート。 実施形態2に係る画像変換部が保存する属性を説明する図。
以下、添付図面を参照して本発明の実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る本発明を限定するものでなく、また本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。
[実施形態1]
図1は、本発明の実施形態1に係る画像読取システムの構成を説明する図である。
カメラスキャナ101は、イーサネット(登録商標)等のLAN104を介してホストコンピュータ102及びプリンタ103と接続されている。このシステムでは、ホストコンピュータ102からの指示によりカメラスキャナ101が画像を読み取って生成した画像データをホストコンピュータコンピュータ102に送信するスキャン機能を実行できる。また、この画像データをプリンタ103により印刷するプリント機能を実行できる。また、ホストコンピュータ102を介さずに、ユーザがカメラスキャナ101へ直接指示することにより、スキャン機能及びプリント機能を実行できる。
図2は、実施形態1に係るカメラスキャナ101を説明する外観図である。
カメラスキャナ101は、大きく分けて、コントローラ部201、カメラ部202、腕部203、短焦点プロジェクタ207を備えている。カメラスキャナ101の本体であるコントローラ部201と、カメラスキャナ101の入力装置であるカメラ部202とは、腕部203により連結されている。腕部203は関節を用いて自由に曲げ伸ばしが可能である。短焦点プロジェクタ207は、書画台204等に、操作を補助する画像を投影して表示する。
図2では、カメラスキャナ101が書画台204上に設置されている様子を表している。カメラ部202のレンズは、書画台204方向に向けられており、破線で囲まれた読み取り領域205内の画像を読み取ることができる。図2の例では、読み取り領域205内に原稿206が置かれている。
図3は、実施形態1に係るカメラスキャナ101のコントローラ部201の構成を説明するブロック図である。図3において、前述の図1及び図2と共通する部分は同じ記号で示している。
コントローラ部201は、主にシステムバス301に接続されたCPU302と各種I/Fコントローラ回路とを有している。CPU302は、コントローラ部201全体の動作を制御する中央演算装置である。RAM303は揮発性メモリである。ROM304は不揮発性メモリで、CPU302の起動用プログラムコード等を格納している。HDD305はRAM303と比較して大容量なハードディスクドライブ(HDD)である。HDD305には、CPU302が実行する、カメラスキャナ101の制御用プログラムコードが格納されている。CPU302は、カメラスキャナ101の電源オン等の起動時、ROM304に格納されている起動用プログラムコードを実行する。この起動用プログラムコードは、CPU302に、HDD305に格納されている制御用プログラムコードを読み出してRAM303に展開させる。CPU302は起動用プログラムコードを実行した後、RAM303に展開した制御用プログラムコードを実行して、コントローラ部201全体の動作を制御する。またCPU302は、制御用プログラムの動作に用いるデータもRAM303に格納して読み書きを行う。HDD305にはさらに、制御用プログラムの動作に必要な各種設定や、また、カメラ部202で撮影して得られた画像データを格納することができ、CPU302によって読み書きされる。またCPU302はネットワークI/F306を介してネットワーク104上の他の機器との通信を行う。
画像処理プロセッサ307は、RAM303或いはHDD305に格納された画像データを読み出して処理し、またRAM303或いはHDD305へ書き戻す。この画像処理プロセッサ307が実行する画像処理は、回転、変倍、色変換等を含む。カメラI/F308はカメラ部202と接続され、CPU302からの指示に応じてカメラ部202から画像データを取得してRAM303へ書き込む。またCPU302からの制御コマンドをカメラ部202へ送信し、カメラ部202の設定を行う。表示制御部309は、CPU302の指示に応じて表示部への画像データの表示を行う。ここでは、短焦点プロジェクタ207とタッチパネル330が表示制御部309に接続されている。シリアルI/F310は、シリアル信号の入出力を行う。ここで、シリアルI/F310はタッチパネル330に接続され、CPU302はタッチパネル330で押下が検知されたときに、シリアルI/F310を介して、その押下された位置の座標を取得する。オーディオコントローラ311はスピーカ340と接続され、CPU302の指示に応じて音声データをアナログ音声信号に変換してスピーカ340を通じて音を出力する。USBコントローラ312は、CPU302の指示に応じて外付けのUSBデバイスを制御する。ここではUSBメモリやSDカードなどの外部メモリ350がUSBコントローラ312に接続され、外部メモリ350へのデータの読み書きを行う。
図4は、実施形態1に係るカメラスキャナ101のコントローラ部201のCPU302が実行する制御用プログラムの機能構成図である。図4の401が制御用プログラム全体を示し、この制御用プログラム401は前述のようにHDD305に格納され、CPU302が起動時にRAM303に展開して実行することにより、これら機能が達成される。
メイン制御部402はプログラムの本体であり、この制御用プログラム401の各モジュールを制御して、カメラスキャナ101の制御用プログラムを実行する。操作表示部403は、メイン制御部402からの描画要求を受け、表示制御部309を介して、短焦点プロジェクタ207或いはタッチパネル330への描画処理を実行する。また操作表示部403は、タッチパネル330が押下されたときにシリアルI/F310を介して、その押下位置の座標を受信し、描画中の操作画面の内容と、その座標を対応させて、その操作内容(押下されたボタン等)を判定する。そして、この操作内容をメイン制御部402へ通知することにより、タッチパネル330からの操作者の操作を受け付ける。
ネットワーク通信部404は、ネットワークI/F306を介して、ネットワーク104の他の機器とTCP/IPによる通信を行う。データファイル管理部405は、制御用プログラム401の実行において必要な設定データ等をHDD305上の所定の領域へ保存して管理する。画像ファイル管理部406は、カメラI/F308を介して入力した画像データや、画像処理プロセッサ307で処理した画像データを、HDD305の所定の領域へ保存して管理する。撮影処理部407は、カメラI/F308を介してカメラ部202を制御し、所定のタイミングでカメラ部202で撮影されて得た画像データをRAM303へ取り込む。また、その取り込んだ画像データを解析して、有効な画像データが取得されたときには、その画像データを画像認識部408へ送信する。画像認識部408は、撮影処理部407が取得した画像データの内容を認識して、原稿の画像のデータを抽出する。画像変換部409は、画像認識部408が抽出した原稿の画像データを変換し、適切な画像データに整えたうえで、画像ファイル管理部406を介してHDD305へ格納する。尚、これら撮影処理部407、画像認識部408、画像変換部409の処理については、後で詳細に説明する。
図5は、実施形態1に係る撮影処理部407の処理を説明するフローチャートである。尚、この処理は、HDD305に格納された制御プログラムを、CPU302がRAM303に展開して実行することにより達成されるため、CPU302による処理として説明する。
この処理は、撮影処理部407による処理が起動されることにより開始され、先ずS501で、CPU320は、初期状態の書画台204上の読取領域205の画像を撮影する。この読取領域205は矩形であるが、カメラ部202は厳密には読取領域205の真上にあるわけではないため、撮影された形状は図6(A)に示すように歪んでいる。そこでS502で、CPU302は、その撮影した形状を矩形に変換する射影変換のパラメータを算出する。そしてS503に進み、CPU302は、S302で算出した射影変換パラメータを使用して、S501で撮影した読取領域205の画像データを、図6(B)に示したように矩形に補正する。次にS504に進み、CPU302は、S503で補正した読取領域205の画像データを、読取領域の背景画像として画像認識部408へ送信する。この読取領域の背景画像データを受信した画像認識部408の処理については後述する。
S505以降では、撮影処理部407が、読取領域内に新たに入ってきた物体が所定時間静止したときに撮影する処理を実行する。S505ではまず、CPU302は、カメラ部202から1フレームの画像データを取り込む。次にS506でCPU302は、その取り込んだ画像データを解析し、その中に未撮影の物体があるかどうかを判定する。S506で未撮影の物体がないと判定するとS505へ戻って、カメラ部202からの画像データの取り込みを行う。
S506で未撮影の物体があると判定したときはS507へ進み、CPU302は、S506で検知した物体が所定時間静止したかどうかを判定する。S507で所定時間静止していないと判定するとS505へ戻ってS505〜S507の処理を繰り返す。S507で所定時間静止したと判定するとS508へ進み、CPU302は、カメラ部202からの静止画の画像データを取り込む。そしてS509に進み、CPU302は、今回S508で取り込んだ静止画像データと、前回S508で取り込んだ静止画像データの各画素値の差分を計算し、全ての画素値の差分の絶対値を加算して、2つの静止画像データの差分量を算出する。尚、今回、撮影処理部407が起動された後、初めてS508を実行した場合は、S509において、S501で取り込んだ読取領域205の画像データとの差分量を算出する。
次にS510に進み、CPU302は、S509で算出した差分量が所定の値(ここでの所定の値は「0」に近い)より大きいかどうかを判定することによって、今回取り込んだ静止画像データが、1つ前の静止画像データと相違しているかどうかを判定する。S510で差がないと判定するとS505へ戻って、静止した物体の検知処理を実行する。一方、S510で差があると判定するとS511へ進み、CPU302は、S508で取り込んだ静止画像データを、S502で算出した射影変換パラメータに基づいて射影変換を行う。そしてS512に進み、CPU302は、その変換した静止画像データを画像認識部408へ送信する。この静止画像データを受信したときの画像認識部408の処理も後述する。
以上説明した処理を行うことにより、撮影処理部407は、新しく読取領域205に入った物体(原稿)が静止したときに、その物体の静止画像データを取り込み、画像認識部408へ送信することができる。この時、読み取った画像データの射影変換を行うので、カメラ部202が撮影する画角による画像の歪みを補正した画像データを取得できる。
図7〜図9のフローチャートを参照して、実施形態1に係る画像認識部408の処理について説明する。
図7は、実施形態1に係る画像認識部408の処理を説明するフローチャートである。尚、この処理は、HDD305に格納された制御プログラムを、CPU302がRAM303に展開して実行することにより達成されるため、ここではCPU302による処理として説明する。
画像認識部408の処理が開始されるとまずS701で、CPU302は、読取領域205の背景画像データを受信する。ここで受信するのは、撮影処理部407が図5のS504で送信した読取領域の背景画像の画像データである。そしてS702でCPU302は、その受信した読取領域の背景画像データを、画像ファイル管理部406を介してHDD305へ保存する。
図10(A)は、この背景画像データを保存する状態を説明する模式図である。
ここで画像ファイル管理部406は、HDD305に空のディレクトリ(図10(A)では「/IMGDIR」)を作成し、そのディレクトリに背景画像データ1001を保存する。
次にS703に進み、CPU302は、静止画像データを受信する。ここではまず、1ページ目の静止画像データの受信処理について説明する。ここで受信するのは、撮影処理部407が図5のS512で送信した静止画像データである。静止画像データを受信するとS704に進み、CPU302は、その受信した静止画像データを、画像ファイル管理部406を介してHDD305へ保存する。
図10(B)は、受信した静止画像データを保存したときの模式図である。
ここで画像ファイル管理部406は、背景画像データ1001を保存したのと同じディレクトリに、最新の受信画像データである静止画像データ1002を保存する。
そしてS705に進み、CPU302は、画像処理プロセッサ307へ背景画像データ1001と静止画像データ1002とを送り、2つの画像データの差分画像データと、その差分量を算出する。これ以降、差分画像データと差分量とを算出する際に画像プロセッサ307を用いるが、繰り返しになるため、これ以降、画像プロセッサ307の説明を省略する。次にS706に進み、CPU302は、1ページ目の原稿の画像データを抽出したかどうかを判定する。ここでは、まず1ページ目の原稿の画像データを処理する説明であるためS706の判定がNOであるとする。S706の判定がNOであればS707へ進み、CPU302は、S705で算出した差分量が所定値よりも大きいかどうかを判定する。ここで使用する所定値は「0」に近い値であり、つまり、背景画像データ1001と静止画像データ1002に差があるかどうかを判定する。S707の判定がNO、即ち、背景画像データ1001と静止画像データ1002との間に差が無ければ、1ページ目の原稿が書画台204上に置かれていないと判定してS703へ戻り、次の静止画像データを受信する。一方、S707の判定がYESであればCPU302は、1ページ目の原稿が置かれたと判定してS708へ進み、CPU302は、静止画像データ1002から1ページ目の原稿の画像データを抽出する第1の抽出処理を行う。このS708で行う処理は後に説明する。こうしてS708の処理を実行して後、CPU302はS703へ処理を進め、次の静止画像データを受信する。
次に、2ページ目の原稿の処理を説明する。S703で2つ目の静止画像データを受信するとS704へ進み、CPU302は、その受信した静止画像データを保存する。
図10(C)は、その状態を説明する模式図である。
ここで画像ファイル管理部406は、前回受信した静止画像データ1002を1つ前の受信画像データとして保存し直す。そして、今回受信した静止画像データ1003を、最新の受信画像データとして保存する。
次にS705に進み、CPU302は、1ページ目の画像データの場合と同様に、画像処理プロセッサ307を用いて背景画像データ1001と静止画像データ1003との差分画像データを生成して、その差分量を算出してS706に進む。ここでは2ページ目の原稿の画像データの場合を説明しているため、次のS706の判定はYESとなる。そこでS709進み、CPU302は「0」に近い所定値を用いて、背景画像データ1001と静止画像データ1003に差があるかどうか、即ち、撮影対象となる何らかの物体(原稿)が読取領域205に置かれているかどうかを判定する。S709の判定がYESであればS710へ進み、CPU302は、2ページ目以降の原稿の画像データを抽出する第2の抽出処理を行う。S710の処理は後に説明する。S710の処理が終わるとS703へ戻って、CPU302は、3ページ目以降の原稿の画像データの処理を行う。
S709の判定がNO、即ち、静止画像データ1002と背景画像データ1001との差が無ければ、撮影対象となる原稿が全て取り除かれたということになる。この場合はS711に進み、画像変換部409へ1文書のスキャン終了を通知する。そしてS703に戻り、次の文書の1ページ目の原稿の静止画像データの受信から処理を開始する。
このようにS709で、背景画像データと、撮影した原稿の静止画像データとの差があるかどうかを判定することで、撮影対象の原稿束が書画台204上の読取領域205から取り除かれたかどうかを判定することができる。これにより、ユーザが原稿束を読取領域205から取り除いたときに、CPU302は1文書のスキャンの終了であると判定することが可能になる。
またS706で、1ページ目の原稿の画像データが抽出済みかどうかを判定することにより、ユーザが1枚も原稿を置かない間は、静止画データの処理を開始せずに待機できる。そして、ユーザが1枚以上の原稿を書画台204上に置いて初めて、その原稿の画像データに対する処理を開始できる。また、ユーザが1枚目の原稿の画像データを取得した後、書画台204から全ての枚数の原稿を取り除いた場合に1文書のスキャンが終了したと判定できるようになる。
図8(A)は、図7のS708の1ページ目(1枚目)の原稿の画像データの抽出処理を説明するフローチャートであり、図11の画像例を参照して説明する。
図11(A)は、1ページ目の原稿の静止画像データの一例を示す図である。前述の図7のS705では、背景画像データ1001と静止画像データ1002との差分から、図11(B)に示す多値差分画像データを生成している。
先ずS801でCPU302は、この多値の差分画像データを二値化し、図11(B)に示す二値差分画像データを生成する。更にCPU302は、この二値差分画像データからエッジの抽出及び直線検出を行って図11(C)に示す直線画像データを得る。次にS802に進み、CPU302は、S801で検出した直線を組み合わせて、矩形を成す直線の組を1又は複数検出する。次にS803に進み、CPU302は、S802で検出した矩形について、多値差分画像データ(図11(B))と重ね合わせ、重なった矩形内の画素値の絶対値を加算することにより矩形内の差分量を算出する。このときS802で複数の矩形が検出されている場合は、この差分量の算出処理を、全ての矩形について実行する。
次にS804に進み、CPU302は、S803で算出した差分量が最大である矩形を選択する。尚、図11の例では、図11(D)の直線画像データから検出される矩形は1つなので、図11(D)に示す直線画像データの矩形が選択矩形となる。次にS805に進み、CPU302は、その選択した矩形の内部を有効画素、矩形の外部を無効画素としたマスク画像データ(図11(E))を生成してRAM303に格納する。図11(E)では、白い部分が有効画素、黒い部分が無効画素を表している。次にS806に進み、CPU302は、図11(A)の静止画像データから図11(E)のマスク画像データに基づいて有効画素を抽出して、図11(F)に示す抽出画像データを生成する。
次にS807に進み、CPU302は、画像ファイル管理部406を介して、S806で抽出した、例えば図11(F)に示す画像データをHDD305へ保存する。更に、その画像属性をRAM303に保存する。
図13は、この抽出画像データの画像属性の一例を示す図である。
そしてS808に進み、画像変換部409へ画像属性を送信することにより、1ページ目の画像データの抽出を通知する。
こうして、1ページ目の原稿の画像データが抽出されてHDD305に格納され、またその1ページ目の原稿の画像データの画像属性も記憶される。
次に、書画台204上で、1ページ目の原稿の上に置かれた2ページ目以降の原稿の画像データの抽出処理を説明する。
図8(B)は、図7のS710の2ページ目(2枚目)以降の原稿の画像データの抽出処理を説明するフローチャートで、図12の画像例を参照して説明する。
図12(A)の静止画像データは、2ページ目の原稿の静止画像データの一例を示し、1ページ目の原稿の上に2ページ目の原稿が置かれた状態を撮影した画像データを示している。ここでは1ページ目の原稿の静止画像データの上に2ページ目の原稿の画像データが重なった状態の画像データとなっている。
先ずS811でCPU302は、前回と今回の静止画像データ、即ち、読取領域の原稿の枚数が現在の枚数より1枚少ない1ページ目の原稿の静止画像データと、その上に2ページ目の原稿が置かれた静止画像データとの差分画像データを生成する。ここでは、差分画像データにノイズや照明の影響を受けることをできるだけ避けるため、差分をとるのは原稿が置かれた領域のみに行い、背景領域はできる限りマスクするようにする。このS811の処理の詳細は図9(A)のフローチャートで説明する。
図9(A)は、図8(B)の2ページ目以降の原稿の画像データの抽出処理であるS811の処理を説明するフローチャートである。
先ずS901でCPU302は、1つ前に読み取った原稿のマスクデータを読み出す。例えば2ページ目の原稿の場合は、図8(A)のS805で生成してRAM303に格納された1ページ目の原稿のマスク画像データを読み出す。また3ページ目以降の場合は、後述するS920で格納されたマスク画像データを読み出す。次にS902でCPU302は、S703で受け取った、1ページ目の原稿の上に2ページ目の原稿が載った静止画像データと、S702で格納した背景画像データとの差分をとって差分画像データ(図12(B))を生成する。そして、その差分画像データを二値化してマスク画像データ2(図12(C))を生成する。次にS903に進みCPU302は、マスク画像データ1(図11(E))とマスク画像データ2(図12(C))との和を取ったマスク画像データ3を生成する。そしてS904に進みCPU302は、S903で生成したマスク画像データ3で、S704で保存した1ページ目の原稿の静止画像データのマスク処理を行ってマスク後画像データ(図12(D))を生成する。次にS905に進みCPU302は、S903で生成したマスク画像データ3で、今回受け取った静止画像データ(図12(A))のマスク処理を行ってマスク後画像データ(図12(E))を生成する。そしてS906に進みCPU302は、マスク後画像データ(図12(D))とマスク後画像データ(図12(E))との差分を取って差分画像データ(図12(F))を生成し、その差分量を算出してRAM303に保存する。以上でS811の処理が完了する。
次に図8(B)に戻りS812でCPU302は、図12(F)の差分画像データからの2ページ目の原稿の画像データの抽出処理を行う。このS812の処理の詳細は図9(B)のフローチャートで説明する。
図9(B)は、図8(B)のS812の処理を説明するフローチャートである。
まずS911でCPU302は、S906で生成した図12(F)の差分画像データを二値化して二値差分画像データ(図12(G))を生成する。そして、この二値差分画像データからエッジ抽出及び直線の検出を行う。ここで検出された直線を示したのが、図12(H)の直線画像データである。次にS912に進みCPU302は、S911で検出した直線の中から、矩形を成す直線の組を検出する。図12では、図12(I)の画像データと、図12(J)の画像データの2つの組が矩形として検出されている。
次にS913に進み、CPU302は、これら各直線の組について、図12(F)の差分画像データの該当矩形内の領域の画素値の絶対値を加算し、矩形内の差分量を算出する。そしてS914に進み、CPU302は、その算出した差分量が最大である矩形を選択する。次にS915に進みCPU302は、その選択した矩形内の面積と、図8(A)のS806で抽出した1ページ目の原稿の抽出画像データ(図11(F))の面積との比を算出する。そしてS916でCPU302は、その面積比が、予め決定しておいた所定の範囲(例えば、ほぼ「1」に近い値)内かどうかを判定する。ここで所定の範囲内と判定するとS920へ進み、CPU302は、その選択した矩形から、その矩形内を有効画素、矩形外を無効画素としたマスク画像データを生成してRAM303に記憶する。図12(K)は、このマスク画像データの一例を示す。
そしてS921に進みCPU302は、図12(A)の静止画像データから、図12(K)のマスク画像データに基づいて有効画素を抽出し、2ページ目の原稿の画像データ(図12(L))を生成する。
一方、S916で、面積比が予め決定しておいた所定の範囲内でない場合、つまり、大きすぎる、或いは小さすぎる領域が矩形として検出された場合はS917に進み、CPU302は、その矩形領域を無効として直線の組を破棄する。そしてS918に進み、CPU302は、その破棄した矩形の他に有効な矩形があるかどうかを判定する。ここで他に有効な矩形があればS914へ戻り、CPU302は、矩形内の差分量が次に大きい矩形を選択して有効かどうかの判定処理を継続する。またS918で、他に有効な矩形がなければS919へ進む。S919でCPU302は、S811で生成したマスク画像データ(図12(E))に基づいて、2つ目の静止画像データから有効画像データを抽出して、2ページ目の原稿の抽出画像データ(図12(M))を生成する。以上でS812の画像データの抽出処理が終了する。
以上説明したように、図9(B)において、S914で差分量が最大の矩形を選択することにより、一つ前の原稿の上に、後から重ねて置かれた最近の原稿の領域を検出することができる。またS914,S915で、1つ前の原稿の画像データの面積とかけ離れた面積を持つ矩形を選択対象の矩形から外すことにより、ノイズや照明の変化で画像データの差分を誤検出した場合でも、検出精度を高めることができる。特にS916で用いる所定の面積比を「1」に近い値にすれば、1文書内で原稿サイズが変わらない場合での検知精度を高くすることができる。
また、選択できる矩形がなかった場合は、S919で背景画像データとの差分に基づいたマスク画像データ(図12(C))を用いて画像データを抽出することができる。これにより、精度の高い検出は行えなくても、確実に原稿領域を含む画像データを抽出することが可能となる。
再び図8(B)に戻り、S812による、後から置かれた原稿の画像データの抽出処理が完了するとS813に進み、CPU302は、S807で説明したのと同様にして、抽出した画像データをHDD305へ保存し、画像属性をRAM303へ保存する。そしてS814に進み、CPU302は、その画像属性を画像変換部409へ送信することにより、2ページ目以降の原稿の画像データが抽出できたことを通知する。
尚、3ページ目(3枚目)以降の原稿の画像データを抽出する際も同様にして実行できる。即ち、1つ前の画像データと背景画像データとの差分から得たマスク画像データ1と、現在の画像データと背景画像データとの差分から得たマスク画像データ2とから、現在の原稿(最も後で置かれた最上位の原稿)の画像データを抽出することができる。
次に実施形態1に係る画像変換部409が実行する処理を、図14、図15、図18のフローチャートを参照して説明する。
図14は、実施形態1に係る画像変換部409が実行する処理を説明するフローチャートである。この処理は、HDD305に格納された制御プログラムを、CPU302がRAM303に展開して実行することにより達成されるため、CPU302による処理として説明する。
先ずS1401でCPU302は、図8(A)のS808で送信される1ページ目の原稿の画像データの抽出完了通知を受信したかどうかを判定する。S1401の判定がNOであればS1404に進みCPU302が、図8(B)のS814で通知される2ページ目以降の原稿の画像データの抽出完了通知を受信したかどうかを判定する。S1404の判定がNOであればS1406に進み、CPU302は、図7のS711で通知される1文書のスキャン終了通知を受信したかどうかを判定する。S1406の判定がNOであればS1401へ戻って、通知の受信待ちを続ける。
S1401でCPU302が、1ページ目の原稿の画像データの抽出完了通知を受信したと判定するとS1402に進み、CPU302は、新文書の作成処理を開始する。
図15(A)は、このS1402の処理を示すフローチャートである。
S1501でCPU302は、図16(A)に示すように、HDD305に文書画像保存用の新規ディレクトリを作成する。次にS1502に進み、CPU302は、図16(B)に示すように、RAM303に文書属性とページ属性の領域を確保する。ここでは、文書属性のページ数は「0」であり、ページ属性の領域はまだ空である。尚、ここで確保した領域は、画像ファイル管理部406が管理しており、この領域へのデータの保存/読み出しは、これ以降も画像ファイル管理部406を介して行う。次にS1503に進み、CPU302は、S1501で生成した保存ディレクトリ名を、S1502で確保した文書属性領域に保存してこの処理を終了する。
続いて図14に戻り、S1403でCPU302は、画像データの補正及び画像データ保存処理を行う。
図15(B)は、このS1403の画像データの補正及び画像データ保存処理を説明するフローチャートである。
受信した画像データは、傾いている場合があり、その傾きは図13で示した、画像認識部408が生成した画像属性の中に記録されている。
そこでS1511でCPU302は、その傾きに基づいて画像処理プロセッサ307で、その画像データに逆方向に回転処理を行い、画像として正立するように補正処理を行う。次にS1512に進み、画像処理プロセッサ307を使用して、下地とばし、エッジ強調等の補正処理を行って画像を鮮鋭化させる。そしてS1513に進み、CPU302は、図16(C)に示すように、S1501で作成した文書画像の保存用ディレクトリに、補正した画像データを保存する。そしてS1514に進み、CPU302は、図16(D)に示すように、ページ属性に1ページ目の原稿の画像データの情報を格納し、ページ数を「1」とする。以上でS1403の画像データの補正・保存処理を完了するとS1401へ戻る。
次に図14に戻り、S1404の判定がYES、即ち、2ページ目以降の原稿の画像データの抽出完了通知を受信した場合はS1405に進み、受信した画像データの補正・保存処理を行う。このS1405の処理もS1403と同様に、図15(B)のフローチャートに従った処理である。このとき図15(B)のS1513では、図16(E)に示すように、1ページ目の原稿と同じ保存ディレクトリに、補正後の2ページ目の画像データを保存する。そして、図16(F)に示すようにページ属性を追加して保存し、文書属性のページ数をインクリメントして「2」とする。こうしてS1405の処理が完了するとS1401へ戻る。
これ以降、2ページ目以降の原稿の画像データを受信すると、S1405の処理を繰り返し実行する。こうして図16(G)に示すように文書画像の保存用ディレクトリに画像データが保存され、図16(H)に示すように文書属性とページ属性が保存される。
また図14で、S1406の判定がYES、即ち、1文書のスキャン終了通知を受信するとS1407に進み、CPU302は、出力ファイルの生成処理を行う。このS1407の処理は後に説明する。そしてS1408に進み、CPU302は、S1407で生成した出力ファイルを、予め決められた宛先に送信又は保存する処理を行う。このとき宛先がネットワーク上のPCやサーバであれば、ネットワーク通信部404を介して所定のプロトコルで送信を行う。また宛先が外部メモリ350であれば、データファイル管理部405を介して保存処理を行う。これらの宛先は、データファイル管理部405によってHDD305に記憶されており、ネットワーク通信部404を介して、或いはタッチパネル330からのユーザ操作によって、ユーザが設定することが可能である。
図17は、図14のS1407で生成する出力ファイルのフォーマットの一例であるXML形式のテキストファイルの記述例を示す図である。
マルチページドキュメントは、出力ファイルの先頭に挿入されるヘッダ記述1701、撮影された原稿をページ単位で記述するための電子文書ページ記述1702〜1704、そしてファイルの記述終了を示すフッタ記述1705を有している。
図18は、実施形態1に係る画像変換部409による、図14のS1407の出力ファイルの生成処理手順を説明するフローチャートである。
まずS1801でCPU302は、画像ファイル管理部406を介して、例えば図16(H)に示す管理テーブルより画像情報を含むページデータを取得する。次にS1802に進みCPU302は、取得したページデータが1ページ目か否かを判定する。1ページ目であればS1803へ進み、1ページ目でなければS1804へ進む。S1803でCPU302は、新規のマルチページドキュメントを生成するためのヘッダ記述(例えば図17の1701)を出力する。次にS1804に進みCPU302は、画像ファイル管理部406を介して画像データをHDD305から読み出し、例えば図17に示す電子文書ページ記述1702として記述する。そしてS1805に進みCPU302は、出力ファイルへの書き込みが終了した画像データをHDD305から削除する。次にS1806に進みCPU302は、S1801で取得したページデータが最終ページかどうかを判定し、最終ページであればS1807へ進み、最終ページでなければS1801へ戻る。S1807でCPU302は、ファイルの終端を示す、例えば図17のフッタ記述1705を出力して出力ファイルを生成する。そしてS1808に進みCPU302は、管理テーブルで分類された全てのページデータを出力するまでS1801〜S1808の処理を繰り返して出力ファイルの生成処理を終了する。
以上説明したように本実施形態1によれば、書画台に置かれた複数枚の原稿を読み取って電子文書ファイルを作成することができる。この際、1枚の原稿を読みこんだ後、その原稿を除去することなく、次の原稿を目の原稿の上に積載するようにして、順次原稿を送り込んで読み込ませることができる。
また複数枚の原稿を読み込んだ後、それら複数枚の原稿の画像データを含むファイルの保存は、最初に原稿を読み込んだ後、書画台上で原稿を検出しなくなることで自動的に開始される。このため、原稿の読み取りの操作の終了を指示するキーなどを設ける必要がないという効果もある。
また本実施形態1によれば、新たな原稿を載置した後の静止画像データと、その原稿を載置する前の静止画像データとの差分から、その新たな原稿の画像データを抽出している。これにより、ユーザが、書画台上の読み取り済の原稿を交換しないで、単にその上に原稿を重ねて置いていくだけで、複数枚の原稿の画像データを抽出して保存できる。
また、書画台の背景静止画像データと読取領域内の背景画像データとの差分から、原稿の読み取り操作の終了を判定することにより、読取領域に置いた原稿を取り除くだけで、複数枚の原稿の読み取り終了を判定できるという効果がある。
[実施形態2]
前述の実施形態1では、原稿が静止したときに撮影した静止画像データと、その原稿が置かれる前に撮影した静止画データとの差分から、読取領域205へ原稿が追加して置かれたことを検知して画像データを抽出した。
これに対して実施形態2では、原稿が追加して置かれる場合に加えて、読取領域205から原稿を取り除く操作と、原稿をひっくり返して裏面を撮影する操作を検知して、原稿の画像データを抽出する場合を説明する。尚、実施形態2に係る画像読取システム及びカメラスキャナ等の構成は、前述の実施形態1と同様であるため、その説明を省略する。
図19は、本発明の実施形態2に係る原稿画像の一例を示す図である。
図19(A)の静止画像データは、1ページ目の原稿の上に2ページ目の原稿が置かれたときの静止画像データを示している。図19(B)は、更に2ページ目の原稿の上に3ページ目の原稿が置かれたときの静止画像データを示している。
次に、図19(B)の静止画像データから3ページ目の原稿が取り除かれた場合、撮影される静止画像データは図19(C)に示す静止画像データになる。このとき、画像認識部408が受信している1つ前の静止画像データは図19(B)に示すデータであり、図19(B)と図19(C)の差分画像データは、図19(D)に示すような差分画像データとなる。ここで、前述の実施形態1のように、1つ前の静止画データとの差分画像データに基づいて原稿画像を抽出すると、3ページ目の原稿の領域が抽出されてしまう。
しかし、画像認識部408が受信した2つ前の静止画像データは図19(A)の静止画像データであり、3ページ目の原稿が置かれる前の画像データである。このため、図19(A)の静止画像データと図19(C)の静止画像データとの差分画像データは、図19(E)で示すように、差分量はほとんど「0」となる。つまり、読取領域に最後に置かれた原稿が、その読取領域から取り除かれたかどうかは、現在の静止画データと2つ前の静止画像データとの差分が小さいことで判別できる。
一方、図19(B)の状態で、更にその上に4ページ目の原稿が置かれた場合、画像認識部408が受信する静止画像データは、図19(F)に示す静止画像データのようになる。このとき、図19(F)の静止画像データの1つ前の静止画像データ(図19(B))との差分画像データは、図19(G)に示す差分画像データのようになる。また図19(F)の静止画像データの2つ前の静止画像データ(図19(A))との差分画像データは、図19(H)に示す差分画像データのようになる。つまり、現在の静止画データと2つ前の静止画像データとに差分があることから、原稿が新しく追加されたことが判別できる。尚、1つ前の静止画像データとの差分画像データ(図19(G))は4ページ目の原稿の領域であり、2つ前の静止画像データとの差分画像データ(図19(H))は、3ページ目と4ページ目の原稿の両方の領域となる。従って、読取領域に新たに原稿が置かれたときには、1つ前の静止画像データとの差分量よりも、2つ前の静止画像データとの差分量の方が大きいことが分かる。
更に、図19(B)の状態から、3ページ目の原稿がひっくり返されて裏面が上向きになった場合を考える。このときの静止画像データは、図19(I)に示す静止画像データのようになる。このとき図19(I)の静止画像データの1つ前の静止画像データ(図19(B)との差分画像データは、図19(J)に示す差分画像データのようになる。また図19(I)の静止画像データの2つ前の静止画像データ(図19(A))との差分画像は、図19(K)に示す差分画像データのようになる。つまり、この場合も、2つ前の静止画像データとは差分が存在する。しかし、2つ前の静止画像データとの差分量は、3ページ目の原稿の裏面の領域だけになるのに対し、1つ前の静止画像データとの差分量は、3ページ目の原稿の表面と裏面の両方の領域になる。このため、1つ前の静止画像データとの差分量の方が、2つ前の静止画像データとの差分量よりも大きくなる。この点を用いて、原稿がひっくり返された場合と、原稿が追加された場合を判別することが可能になる。
次に、上記の判別方法を用いた、実施形態2に係る画像認識部408が実行する処理を説明する。ここで、前述の実施形態1で説明した画像認識部408の処理とは、図8(B)の2ページ目以降の原稿の画像データの抽出処理が異なるのみであるので、その処理について図20のフローチャートを参照して説明する。
図20は、実施形態2に係る画像認識部408による図7のS710の2ページ目以降の原稿の画像データの抽出処理を説明するフローチャートである。この処理は、HDD305に格納された制御プログラムを、CPU302がRAM303に展開して実行することにより達成されるため、CPU302による処理として説明する。
まずS2001でCPU302は、受信した静止画像データと、1つ前の静止画像データを使用して図9(A)で示す処理を実行し、差分画像データ1及び差分量データ1として1つ前の静止画像データとの差分画像データと第1の差分量を算出する。次にS2002に進みCPU302は、受信した静止画像データと2つ前の静止画像データとから図9(A)の処理を実行し、差分画像データ2及び差分量2として、2つ前の静止画像データとの差分画像データと第2の差分量を算出する。次にS2003に進みCPU302は、差分量2が「0」に近い所定値以下かどうか、つまり、受信した静止画像データと2つ前の静止画像データとの差分が小さいかどうかを判定する。S2003で差分が所定値よりも小さいときは、最後に置かれた原稿が1枚取り除かれたと判定してS2004へ進み、前回の抽出画像データを削除するように画像変換部409へ通知して2ページ目以降の原稿の画像データの抽出処理を終了する。
一方、S2003で、受信した静止画像データと2つ前の静止画像データとの差分が所定値よりも大きいと判定したときはS2005へ進み、CPU302は、差分量2が差分量1よりも大きいかどうかを判定する。S2005の判定がYES、つまり2つ前の画像データとの差分量2の方が、直前、即ち、1つ前の画像との差分量1よりも大きければ、CPU302は新たに原稿が追加して置かれたと判定してS2006へ進む。S2006でCPU302は、差分画像データ1(1つ前の静止画像との差分画像)から、新たに置かれた原稿の画像データの抽出処理を行う。ここで行う画像抽出処理は、図9(B)のフローチャートで説明した処理と同じである。そしてS2007に進み、その抽出した画像データの画像属性に「おもて面」を設定してS2010に進む。
一方、S2005の判定がNO、つまり、2つ前との差分量2の方が1つ前の差分量1よりも小さければ、CPU302は、最後に置かれた原稿がひっくり返されてうら面が上向きとなったと判定する。そこでS2008へ進み、CPU302は、差分画像データ2(2つ前の静止画像データとの差分画像)から、図9(B)のフローチャートで説明した処理を実行して、その原稿の裏面の画像データを抽出する。そしてS2009に進み、CPU302は、その抽出した画像データの画像属性に「うら面」を設定してS2010に進む。
S2010ではCPU302は、抽出した画像データと画像属性とを保存する。そしてS2011に進み、CPU302は、画像変換部409へ画像データの抽出を通知して、2ページ目以降の原稿の画像データの抽出処理を終了する。
次に実施形態2に係る画像変換部409の処理を図21のフローチャートを参照して説明する。
図21は、本発明の実施形態2に係る画像変換部409が実行する処理を説明するフローチャートである。この処理は、HDD305に格納された制御プログラムを、CPU302がRAM303に展開して実行することにより達成されるため、CPU302による処理として説明する。尚、実施形態1の画像変換部409の処理である図14のフローチャートと同じステップ番号を付した部分については同一の処理であるため、異なる点についてのみ説明する。
図21において、S1405の処理は、図14のS1405と同じく図15(B)で説明した処理であるが、保存する画像属性のみに違いがあるため、図22の属性例を使用して、補足して説明を行う。
図22は、実施形態2に係る画像変換部409が保存する属性を説明する図である。
図19(B)の静止画像データのように、3ページ目の原稿が置かれた状態では、図22(A)のように3ページ分のページ属性が保存されている。ここで図19(F)の静止画像データのように、4ページ目の原稿が追加して置かれたことを検知すると、先に説明したように、画像認識部408がS2007で画像属性に「おもて面」を設定した通知を発行する。従って、図21のS1404で、この通知を受け取る。そこでS1405に進み、CPU302は、例えば図22(B)のように、4ページ目の原稿の画像データの属性としてページ番号4、おもて面、というページ属性を追加する。また図19(B)の静止画像データに対して、図19(I)の静止画像データのように3ページ目の原稿がひっくり返して置かれたことを検知すると、画像認識部408が図20のS2009で画像属性に「うら面」を設定した通知を発行する。従って図21のS1404で、その通知を受け取る。そしてS1405に進み、CPU302は、例えば図22(C)のように、ページ番号3、うら面、というページ属性を追加する。このように、ページ属性として「おもて面」、「うら面」の区別を保存することができる。
また図21のフローチャートでは、実施形態1の画像変換部409の処理に対して、S2101の処理が追加されている。このS2101は、図20のS2004で画像認識部408が発行した画像データ削除通知を受信したかどうかを判定している。S2101で削除通知を受信するとS2102へ進み、CPU302は、図22(A)のページ属性から、図22(D)のように、最後のページ(3ページ目の原稿)のページ属性を削除する。また、その削除したページ属性に保存されていたファイル名から、その3ページ目の原稿の抽出画像データファイルを特定し、そのファイルも削除する。
このように実施形態2によれば、取り除いた原稿の画像データを削除することができるので、ユーザが誤操作した場合にも、そのデータを取り消すことができる。
また、各原稿の画像データごとに、その画像データが「おもて面」であるか「うら面」であるかを示す情報を保持できる。このため、保存した文書画像データをプリンタ103で印刷するときに、「うら面」属性を持つ画像データを用紙のうら面に配置して印刷することができ、原稿をスキャンしたときと同じ面付けで、その原稿を両面で印刷することができる。
また、保存した原稿の画像データを表示するときに、その原稿のおもて面とうら面とを並べて表示するということも可能になる。
以上説明したように上記実施形態1,2によれば、原稿を載置した後の静止画像データと、その原稿を載置する前の静止画像データとの差分から、最後に置かれた原稿の画像データを抽出することができる。これにより、ユーザが原稿を交換しないで重ねて置いていくだけで、原稿の画像データを抽出できるという効果がある。
また、撮影した静止画像データから、原稿の読み取りの終了を判定することにより、ユーザがキーを押す等の特別な操作をしなくても原稿の取り込みを終了することができるという効果がある。
また、静止画像データと背景画像データとの差分から、原稿の読み取り終了を判定することにより、読取領域に置いた原稿を取り除くだけで、原稿の読み取り終了を判定することができる。
(その他の実施形態)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (9)

  1. 読取領域を撮影して撮影した画像データを出力する撮影手段と、
    前記撮影手段から出力された前記読取領域に原稿がない状態の背景画像データと、前記読取領域内で原稿が静止したときの原稿の静止画データとを記憶する記憶手段と、
    前記読取領域の原稿の枚数が1枚のとき、前記背景画像データと前記原稿の静止画データとの差分に基づいて、前記読取領域に含まれる原稿の画像データを抽出する第1の抽出手段と、
    前記読取領域の原稿の枚数が複数のとき、前記読取領域の原稿の枚数が現在の枚数よりも1枚少ないときの前記記憶手段に記憶されている原稿の静止画データと、前記読取領域の原稿の枚数が現在の枚数のときの前記記憶手段に記憶されている原稿の静止画データと、前記背景画像データとに基づいて、前記読取領域に最近に置かれた原稿の画像データを抽出する第2の抽出手段と、
    前記第1及び第2の抽出手段により抽出された画像データから文書ファイルを作成する作成手段と、
    前記第1の抽出手段が前記画像データを抽出した後、前記撮影手段が撮影した前記読取領域の画像データと前記背景画像データとの差が所定値以下になると、前記作成手段による前記文書ファイルの作成を完了する完了手段と、
    を有することを特徴とする画像処理装置。
  2. 前記第2の抽出手段は、
    前記読取領域の原稿の枚数が現在の枚数よりも1枚少ないときの前記記憶手段に記憶されている原稿の静止画データと前記背景画像データとの差分が存在する領域と、前記読取領域の原稿の枚数が現在の枚数のときの前記記憶手段に記憶されている原稿の静止画データと前記背景画像データとの差分が存在する領域との和となる領域を検出し、当該和となる領域から前記最近に置かれた原稿の画像データを抽出することを特徴とする請求項1に記載の画像処理装置。
  3. 前記第1の抽出手段は、
    前記原稿の静止画データと前記背景画像データとの差分画像からエッジ抽出及び直線検出を行う検出手段と、
    前記検出手段により検出された直線から矩形を成す直線の組を抽出する手段と、
    前記矩形を成す直線の組それぞれについて、前記矩形内における前記原稿の静止画データと前記背景画像データとの差分量を算出する算出手段と、
    前記算出手段により算出した前記差分量が最大の矩形を成す直線の組を選択する選択手段と、
    前記選択手段により選択した前記直線の組で構成される矩形内を有効画素としたマスク画像を生成する生成手段とを有し、
    前記マスク画像と前記原稿の静止画データから画像を抽出することを特徴とする請求項1に記載の画像処理装置。
  4. 前記第2の抽出手段は、
    前記選択手段により選択した前記直線の組で構成される矩形の面積と、直前の原稿で抽出した原稿の静止画データの面積との比を算出し、当該算出した前記比が、予め決めた範囲内にあるかどうかを判定する判定手段を有し、
    前記選択手段は、前記判定手段が前記比が前記範囲内でないと判定すると、選択した矩形を成す直線の組を破棄し、当該破棄した矩形を除いた他の矩形の中から、前記差分量が最大の矩形を選択することを特徴とする請求項3に記載の画像処理装置。
  5. 2つ前の前記静止画データと最近の前記静止画データとの差分を算出する手段と、
    前記差分が予め決めた値よりも小さいかどうかを判定する手段と、
    前記差分が前記予め決めた値よりも小さければ、最も上の原稿が除去されたと判定して、当該除去された原稿に対応する画像データを削除する削除手段とを更に有することを特徴とする請求項1乃至4のいずれか1項に記載の画像処理装置。
  6. 1つ前の前記静止画データと最近の前記静止画データとの第1の差分を算出する手段と、
    2つ前の前記静止画データと最近の前記静止画データとの第2の差分を算出する手段と、
    前記第1の差分より前記第2の差分の方が大きい場合、新たに原稿が載置されたと判定する手段とを更に有することを特徴とする請求項1乃至5のいずれか1項に記載の画像処理装置。
  7. 1つ前の前記静止画データと最近の前記静止画データとの第1の差分を算出する手段と、
    2つ前の前記静止画データと最近の前記静止画データとの第2の差分を算出する手段と、
    前記第1の差分より前記第2の差分の方が大きい場合、最も上に載置された原稿はおもて面と判定する手段と、
    前記第1の差分より前記第2の差分の方が小さい場合、最も上に載置された原稿はうら面と判定する手段と、
    を更に有することを特徴とする請求項1乃至6のいずれか1項に記載の画像処理装置。
  8. 読取領域を撮影して撮影した画像データを出力する撮影工程と、
    前記撮影工程で出力された前記読取領域に原稿がない状態の背景画像データと、前記読取領域内で原稿が静止したときの原稿の静止画データとをメモリに記憶する記憶工程と、
    前記読取領域の原稿の枚数が1枚のとき、前記背景画像データと前記原稿の静止画データとの差分に基づいて、前記読取領域に含まれる原稿の画像データを抽出する第1の抽出工程と、
    前記読取領域の原稿の枚数が複数のとき、前記読取領域の原稿の枚数が現在の枚数よりも1枚少ないときの前記メモリに記憶されている原稿の静止画データと、前記読取領域の原稿の枚数が現在の枚数のときの前記メモリに記憶されている原稿の静止画データと、前記背景画像データとに基づいて、前記読取領域に最近に置かれた原稿の画像データを抽出する第2の抽出工程と、
    前記第1及び第2の抽出工程で抽出された画像データから文書ファイルを作成する作成工程と、
    前記第1の抽出工程が前記画像データを抽出した後、前記撮影工程でが撮影した前記読取領域の画像データと前記背景画像データとの差が所定値以下になると、前記作成工程による前記文書ファイルの作成を完了する完了工程と、
    を有することを特徴とする画像処理装置の制御方法。
  9. コンピュータを、請求項1乃至7のいずれか1項に画像処理装置として動作させるためのプログラム。
JP2013100704A 2013-05-10 2013-05-10 画像処理装置及びその制御方法とプログラム Pending JP2014220772A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013100704A JP2014220772A (ja) 2013-05-10 2013-05-10 画像処理装置及びその制御方法とプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013100704A JP2014220772A (ja) 2013-05-10 2013-05-10 画像処理装置及びその制御方法とプログラム

Publications (1)

Publication Number Publication Date
JP2014220772A true JP2014220772A (ja) 2014-11-20

Family

ID=51938820

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013100704A Pending JP2014220772A (ja) 2013-05-10 2013-05-10 画像処理装置及びその制御方法とプログラム

Country Status (1)

Country Link
JP (1) JP2014220772A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017092706A (ja) * 2015-11-10 2017-05-25 コニカミノルタ株式会社 画像形成装置、画像形成システム、及びプログラム
JP2018010368A (ja) * 2016-07-11 2018-01-18 株式会社リコー 工程判断装置及び工程判断方法
WO2019035295A1 (ja) * 2017-08-18 2019-02-21 富士フイルム株式会社 原稿検出装置、原稿検出方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017092706A (ja) * 2015-11-10 2017-05-25 コニカミノルタ株式会社 画像形成装置、画像形成システム、及びプログラム
US10110765B2 (en) 2015-11-10 2018-10-23 Konica Minolta, Inc. Image forming apparatus, image forming system, non-transitory computer readable recording medium on which program is recorded and image forming method
JP2018010368A (ja) * 2016-07-11 2018-01-18 株式会社リコー 工程判断装置及び工程判断方法
JP7111444B2 (ja) 2016-07-11 2022-08-02 株式会社リコー 判断部及び工程判断装置及び工程判断方法
WO2019035295A1 (ja) * 2017-08-18 2019-02-21 富士フイルム株式会社 原稿検出装置、原稿検出方法
JPWO2019035295A1 (ja) * 2017-08-18 2020-07-09 富士フイルム株式会社 原稿検出装置、原稿検出方法
US10999472B2 (en) 2017-08-18 2021-05-04 Fujifilm Corporation Original document detection apparatus and original document detection method

Similar Documents

Publication Publication Date Title
JP6983675B2 (ja) スキャン画像に関連する情報を設定するための装置、方法、プログラム、およびシステム
JP5754653B2 (ja) 画像制御装置及びプログラム
JP6855268B2 (ja) 情報処理装置、情報処理装置の制御方法及びプログラム
US20150116788A1 (en) Image processing apparatus, controlling method thereof, and program
JP2014220772A (ja) 画像処理装置及びその制御方法とプログラム
JP7275552B2 (ja) 画像撮像支援装置及び画像撮像支援方法
JP2017120503A (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
US8854695B2 (en) Image processing apparatus, method, and program
JP5262888B2 (ja) 文書表示制御装置及びプログラム
JP5819887B2 (ja) 印刷設定プログラムおよび電子機器
JP2005354591A (ja) 印刷制御装置および方法
JP6639257B2 (ja) 情報処理装置及びその制御方法
JP2014171023A (ja) 画像処理装置、画像処理方法、およびプログラム
JP2015011588A (ja) 画像処理装置、画像処理方法
JP5944221B2 (ja) 画像処理プログラムおよび画像処理装置、画像読取装置
JP7150967B2 (ja) スキャン画像に関連する情報を設定するための装置、方法、およびプログラム
JP2018191258A (ja) 画像読取装置、画像読取方法及びプログラム
JP5838179B2 (ja) 印刷プレビュープログラムおよび電子機器
JP6234056B2 (ja) 読み取り装置及びその制御方法
JP2014222855A (ja) 画像処理装置、画像処理方法、およびプログラム
JP2017183766A (ja) サーバプログラム、画像生成装置及び画像データ生成方法
JP2014121048A (ja) 画像処理装置、画像処理方法およびプログラム
JP6319186B2 (ja) 画像制御装置及びプログラム
JP2015118538A (ja) 印刷システム、制御方法
JP6474161B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム