JP6077873B2 - Image processing apparatus and image processing method - Google Patents

Image processing apparatus and image processing method Download PDF

Info

Publication number
JP6077873B2
JP6077873B2 JP2013023826A JP2013023826A JP6077873B2 JP 6077873 B2 JP6077873 B2 JP 6077873B2 JP 2013023826 A JP2013023826 A JP 2013023826A JP 2013023826 A JP2013023826 A JP 2013023826A JP 6077873 B2 JP6077873 B2 JP 6077873B2
Authority
JP
Japan
Prior art keywords
image
page
area
document
captured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013023826A
Other languages
Japanese (ja)
Other versions
JP2014155073A (en
JP2014155073A5 (en
Inventor
誠 榎本
誠 榎本
洋介 五十嵐
洋介 五十嵐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2013023826A priority Critical patent/JP6077873B2/en
Publication of JP2014155073A publication Critical patent/JP2014155073A/en
Publication of JP2014155073A5 publication Critical patent/JP2014155073A5/ja
Application granted granted Critical
Publication of JP6077873B2 publication Critical patent/JP6077873B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Input (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本発明は、原稿を読み取る技術に関するものである。   The present invention relates to a technique for reading a document.

現在普及している多くの読み取り装置は、原稿台上に下向きに置かれた原稿をスキャナで読み取るが、近年では原稿台上に上向きに原稿を置き、原稿台上部に取りつけられた撮像装置を用いて原稿を非接触で読み取る装置が提案されている。原稿が上向きで、撮像装置が非接触であることから、ステープラなどで綴じられた原稿などの複数綴りの原稿を、原稿を分離することなく手でめくって置き直しながら連続で読み取る事ができる。特許文献1には、撮影画像から直線を抽出し、直線の垂直方向の色の勾配情報に基づいて、原稿の四辺を推定する技術が開示されている。   Many reading devices that are currently popular use a scanner to read a document placed downward on a document table, but in recent years, an image is placed on the document table and mounted on the top of the document table. An apparatus for reading a document in a non-contact manner has been proposed. Since the document is facing upward and the image pickup apparatus is non-contact, it is possible to continuously read a multi-split document such as a document bound by a stapler or the like while turning and repositioning the document without separating the document. Patent Document 1 discloses a technique for extracting a straight line from a photographed image and estimating the four sides of the document based on color gradient information in the vertical direction of the straight line.

特開2012−14430号公報JP 2012-14430 A

しかし従来の方法では、撮像画像中に存在する複数の原稿の推定をすることができない。その為、両面に印刷された複数原稿は1枚片面毎に撮影する必要があった。本発明はこのような問題に鑑みてなされたものであり、ステープラなどで綴じられた原稿の両面ページを従来よりも少ない撮影回数で取り込むことができる技術を提供することを目的とする。   However, the conventional method cannot estimate a plurality of documents existing in a captured image. Therefore, it is necessary to photograph a plurality of originals printed on both sides one by one. The present invention has been made in view of such a problem, and an object of the present invention is to provide a technique capable of capturing a double-sided page of a document bound by a stapler or the like with a smaller number of times of photographing than before.

本発明の目的を達成するために、例えば、本発明の画像処理装置は、見開き2ページが撮像された撮像画像を取得する取得手段と、
前記撮像画像上の基準領域を取得する基準領域取得手段と、
前記撮像画像中の見開き2ページのうち前記基準領域に対応する第1のページ内の画像を、該見開き2ページにおいて後方側のページの画像として登録し、前記撮像画像中の見開き2ページのうち該第1のページとは異なる第2のページ内の画像を、該見開き2ページにおいて前方側のページの画像として登録する登録手段と
を備えることを特徴とする。
In order to achieve the object of the present invention, for example, an image processing apparatus of the present invention includes an acquisition unit that acquires a captured image obtained by capturing two spread pages;
Reference area acquisition means for acquiring a reference area on the captured image;
Among the two spread pages in the captured image, the image in the first page corresponding to the reference area is registered as an image of the rear page in the two spread pages, and among the two spread pages in the captured image The image processing apparatus includes registration means for registering an image in a second page different from the first page as an image of a front page in the two spread pages .

本発明の構成によれば、ステープラなどで綴じられた原稿の両面ページを従来よりも少ない撮影回数で取り込むことができる。   According to the configuration of the present invention, it is possible to capture a double-sided page of a document bound by a stapler or the like with a smaller number of times of shooting than in the past.

システムの外観例及び構成例を説明する図。2A and 2B illustrate an example of appearance and a configuration of a system. 制御装置101のハードウェア構成例を示すブロック図。FIG. 3 is a block diagram showing an example of a hardware configuration of the control apparatus 101. 制御装置101が行う処理のフローチャート。The flowchart of the process which the control apparatus 101 performs. ステップS312における処理の詳細を示すフローチャート。The flowchart which shows the detail of the process in step S312. 撮影画像の一例を示す図。The figure which shows an example of a picked-up image. 原稿領域の枠を推定する処理を説明する図。The figure explaining the process which estimates the frame of a document area. 原稿領域の枠を推定する処理を説明する図。The figure explaining the process which estimates the frame of a document area. 原稿領域の枠を推定する処理を説明する図。The figure explaining the process which estimates the frame of a document area. 原稿領域の枠を推定する処理を説明する図。The figure explaining the process which estimates the frame of a document area. 補正後の画像を示す図。The figure which shows the image after correction | amendment. 投影例を示す図。The figure which shows the example of a projection. ステップS312における処理の詳細を示すフローチャート。The flowchart which shows the detail of the process in step S312. 撮影画像の一例を示す図。The figure which shows an example of a picked-up image. 原稿領域の枠を推定する処理を説明する図。The figure explaining the process which estimates the frame of a document area. 原稿領域の枠を推定する処理を説明する図。The figure explaining the process which estimates the frame of a document area. 補正後の画像を示す図。The figure which shows the image after correction | amendment. 一致領域、不一致領域を説明する図。The figure explaining a coincidence area and a mismatch area.

以下、添付図面を参照し、本発明の好適な実施形態について説明する。なお、以下説明する実施形態は、本発明を具体的に実施した場合の一例を示すもので、特許請求の範囲に記載の構成の具体的な実施例の1つである。   Preferred embodiments of the present invention will be described below with reference to the accompanying drawings. The embodiment described below shows an example when the present invention is specifically implemented, and is one of the specific examples of the configurations described in the claims.

[第1の実施形態]
先ず、本実施形態に係るシステムの外観例について、図1(b)を用いて説明する。本実施形態では、原稿台上に載置された複数枚綴りの原稿に対し、原稿が1枚めくられる度に撮像を行うことで、それぞれの原稿の裏表に印刷されているページのスキャン画像を生成・取得する。
[First Embodiment]
First, an example of the appearance of a system according to the present embodiment will be described with reference to FIG. In the present embodiment, a scanned image of a page printed on the front and back of each original is obtained by capturing an image of a multi-paged original placed on the original table each time the original is turned. Generate / acquire.

撮影装置102は、原稿台上に載置された複数枚綴りの原稿を撮像するために設けられたものであり、撮像した画像は制御装置101に入力される。投影装置103は、プロジェクタなどにより構成される。撮影装置102及び投影装置103は制御装置101に接続されており、制御装置101によってその動作が制御される。制御装置101は撮影装置102及び投影装置103の動作制御を行うと共に、撮影装置102が撮影した撮影画像から、原稿台上に載置された複数枚綴りの原稿の各ページのスキャン画像を生成する。   The image capturing apparatus 102 is provided to capture an image of a plurality of spelled documents placed on a document table, and the captured image is input to the control apparatus 101. The projection device 103 is configured by a projector or the like. The photographing device 102 and the projection device 103 are connected to the control device 101, and the operation is controlled by the control device 101. The control device 101 controls the operations of the image capturing device 102 and the projection device 103 and generates a scan image of each page of a plurality of spelled documents placed on the document table from the captured images captured by the image capturing device 102. .

制御装置101の機能構成例を図1(a)にブロック図として示す。なお、図1(a)に示した構成は、以下の説明で用いる主要な構成であり、必ずしもこの構成に限るわけではなく、その構成には様々な変形例が考え得る。例えば、撮影装置102や投影装置103は制御装置101内に納められていても良いし、データ記憶部107を制御装置101の外部メモリとして制御装置101に外付けで接続しても良い。図1に示した各機能部の機能に係る説明は、制御装置101の動作を示す図3のフローチャートを用いた説明の中で行う。   A functional configuration example of the control device 101 is shown as a block diagram in FIG. The configuration illustrated in FIG. 1A is a main configuration used in the following description, and is not necessarily limited to this configuration, and various modifications can be considered for the configuration. For example, the photographing apparatus 102 and the projection apparatus 103 may be housed in the control apparatus 101, or the data storage unit 107 may be externally connected to the control apparatus 101 as an external memory of the control apparatus 101. The description relating to the function of each functional unit shown in FIG. 1 will be made in the description using the flowchart of FIG.

また、図1(a)に示した制御装置101を構成する各機能部はいずれもハードウェアで構成しても良いが、データ記憶部107をのぞく各機能部をソフトウェアで構成しても良い。この場合、データ記憶部107をメモリとして有し、且つこのソフトウェアを実行可能な装置は、制御装置101に適用することができる。本実施形態では、データ記憶部107をのぞく各部はソフトウェアで構成するものとし、その場合における制御装置101のハードウェア構成例について、図2のブロック図を用いて説明する。なお、図2に示した構成は、以下の説明で用いる主要な構成であり、必ずしもこの構成に限るわけではなく、その構成には様々な変形例が考え得る。   Further, each of the functional units constituting the control device 101 shown in FIG. 1A may be configured by hardware, but each functional unit excluding the data storage unit 107 may be configured by software. In this case, a device having the data storage unit 107 as a memory and capable of executing this software can be applied to the control device 101. In the present embodiment, each unit excluding the data storage unit 107 is configured by software, and a hardware configuration example of the control device 101 in that case will be described with reference to the block diagram of FIG. The configuration illustrated in FIG. 2 is a main configuration used in the following description, and is not necessarily limited to this configuration, and various modifications can be considered for the configuration.

CPU204はメモリ205に格納されているコンピュータプログラムやデータを用いて処理を実行することで、制御装置101全体の動作制御を行うと共に、制御装置101が行うものとして後述する各処理を実行する。   The CPU 204 executes processing using computer programs and data stored in the memory 205, thereby controlling the operation of the entire control apparatus 101 and executing each process described later as what the control apparatus 101 performs.

メモリ205は、ハードディスク203からロードされたコンピュータプログラムやデータ、撮影装置102から順次送出される各フレームの撮影画像を一時的に記憶するためのエリアを有する。更にメモリ205は、CPU204が各種の処理を実行する際に用いるワークエリアも有する。即ちメモリ205は、各種のエリアを適宜提供することができる。メモリ205は、図1のデータ記憶部107としても機能する。   The memory 205 has an area for temporarily storing computer programs and data loaded from the hard disk 203 and captured images of each frame sequentially transmitted from the imaging apparatus 102. Furthermore, the memory 205 also has a work area used when the CPU 204 executes various processes. That is, the memory 205 can provide various areas as appropriate. The memory 205 also functions as the data storage unit 107 in FIG.

ハードディスク203には、OS(オペレーティングシステム)や制御装置101が行うものとして後述する各処理をCPU204に実行させるためのコンピュータプログラムやデータが保存されている。ハードディスク203に保存されているコンピュータプログラムやデータは、CPU204による制御に従って適宜メモリ205にロードされ、CPU204による処理対象となる。なお、メモリ205に記憶するとして説明したものの一部若しくは全部をハードディスク203に記憶させるようにしても構わない。また、ハードディスク203は、図1のデータ記憶部107としても機能する。   The hard disk 203 stores computer programs and data for causing the CPU 204 to execute processes described later as those performed by the OS (operating system) and the control device 101. Computer programs and data stored in the hard disk 203 are appropriately loaded into the memory 205 under the control of the CPU 204 and are processed by the CPU 204. Note that part or all of what has been described as being stored in the memory 205 may be stored in the hard disk 203. The hard disk 203 also functions as the data storage unit 107 in FIG.

CPU204、メモリ205、ハードディスク203、のそれぞれは共通のバス206に接続されており、互いにこのバス206を介してデータ通信を行うことができる。また、このバス206には上記の撮影装置102及び投影装置103も接続されている。   Each of the CPU 204, the memory 205, and the hard disk 203 is connected to a common bus 206, and data communication can be performed via this bus 206. The bus 206 is also connected with the above-described photographing apparatus 102 and projection apparatus 103.

次に、制御装置101が複数枚綴りの原稿における各ページのスキャン画像を取得するために行う処理について、同処理のフローチャートを示す図3を用いて説明する。なお、図3のフローチャートに従った処理をCPU204に実行させるためのコンピュータプログラムやデータはハードディスク203に保存されている。然るに、CPU204はこのコンピュータプログラムやデータをハードディスク203からメモリ205にロードし、これを用いて処理を実行することで、結果としてCPU204は図3のフローチャートに従った処理を実行することになる。   Next, a process performed by the control apparatus 101 for acquiring a scanned image of each page in a document with a plurality of sheets will be described with reference to FIG. 3 showing a flowchart of the process. Note that computer programs and data for causing the CPU 204 to execute processing according to the flowchart of FIG. 3 are stored in the hard disk 203. However, the CPU 204 loads the computer program and data from the hard disk 203 to the memory 205 and executes processing using the computer program and data. As a result, the CPU 204 executes processing according to the flowchart of FIG.

ステップS301では、CPU204は以下の処理で用いる変数Nを1に初期化する。この変数Nは、スキャンしたページの番号を表すページカウンタとして利用する変数である。   In step S301, the CPU 204 initializes a variable N used in the following processing to 1. This variable N is a variable used as a page counter indicating the number of the scanned page.

ステップS302では、CPU204は撮影制御部104として機能し、撮影装置102に原稿台上に載置されている原稿の撮影を行わせる。これにより、メモリ205には、撮影装置102が原稿台上を撮影した撮影画像が入力される。   In step S <b> 302, the CPU 204 functions as the photographing control unit 104 and causes the photographing apparatus 102 to photograph a document placed on the document table. As a result, a photographed image obtained by photographing the document table by the photographing apparatus 102 is input to the memory 205.

ステップS303では、CPU204は撮影制御部104として機能する。即ちCPU204は、ステップS302でメモリ205に格納した撮影画像(現フレームの撮影画像)、該現フレームより1フレーム前の撮影画像(メモリ205内に既に格納されている)、の2フレームの撮影画像について以下の2点について判断を行う。
(1) 現フレームの撮影画像中に原稿が写っているか否か
(2) 上記2フレーム間で画像内容に変化がないか(原稿が静止しているか否か)
現フレームの撮影画像中に原稿が写っているか否かを判断する方法には様々な方法が考え得る。例えば、予め「原稿が載置されていない状態の原稿台上の撮影画像」を取得しておき、この撮影画像と現フレームの撮影画像との差分が規定量以上であれば、現フレームの撮影画像中に原稿が写っていると判断する。もちろん、現フレームの撮影画像に対して画像認識を行い、該撮影画像中に原稿が写っているか否かを判断するようにしても構わない。もちろん、後述する原稿抽出の処理を実際に適用して原稿が存在するかを推定してもよい。
In step S <b> 303, the CPU 204 functions as the shooting control unit 104. That is, the CPU 204 captures two frames of the captured image (current frame captured image) stored in the memory 205 in step S302 and the captured image one frame before the current frame (already stored in the memory 205). The following two points are judged.
(1) Whether or not the original is captured in the captured image of the current frame (2) Whether or not the image content has changed between the two frames (whether or not the original is stationary)
Various methods can be considered as a method for determining whether or not a document is included in a photographed image of the current frame. For example, if a “captured image on a document table with no document placed” is acquired in advance and the difference between the captured image and the captured image of the current frame is equal to or greater than a specified amount, the current frame is captured. It is determined that the document is included in the image. Of course, image recognition may be performed on the captured image of the current frame, and it may be determined whether or not a document is included in the captured image. Of course, it may be estimated whether a document exists by actually applying a document extraction process described later.

また、上記2フレーム間で画像内容に変化がないか否かを判断する方法にも様々な方法が考え得る。例えば、現フレームの撮像画像中の各画素のRGB値と、現フレームよりも1フレーム前の撮像画像中の各画素のRGB値と、の間のRGB色空間における距離が閾値以上であれば、この2フレーム間で画像内容に変化があると判断する。これは複数フレーム間で行ってもよく、その場合、複数フレーム間の距離の平均が閾値以上であれば変化があったと判断する。なお、RGB値以外の画素値を用いても構わない。原稿が原稿台上に静止しているか否かは、赤外センサなど専用のセンサを用いて判定しても良い。   Various methods can be considered as a method for determining whether or not the image content is changed between the two frames. For example, if the distance in the RGB color space between the RGB value of each pixel in the captured image of the current frame and the RGB value of each pixel in the captured image one frame before the current frame is greater than or equal to the threshold value, It is determined that there is a change in the image content between the two frames. This may be performed between a plurality of frames. In this case, it is determined that there is a change if the average distance between the plurality of frames is equal to or greater than a threshold value. Note that pixel values other than RGB values may be used. Whether the document is stationary on the document table may be determined using a dedicated sensor such as an infrared sensor.

ステップS303における判断の結果、現フレームの撮影画像中に原稿が静止した状態で写っていると判断した場合には、この現フレームの撮影画像を処理対象画像とし、処理はステップS304に進む。一方、現フレームの撮影画像中に原稿が静止した状態で写っていないと判断した場合には、処理はステップS302に戻る。   As a result of the determination in step S303, if it is determined that the document is still in the captured image of the current frame, the captured image of the current frame is set as the processing target image, and the process proceeds to step S304. On the other hand, if it is determined that the original is not captured in the captured image of the current frame, the process returns to step S302.

撮影画像中に原稿が静止した状態で写っているということは、ユーザが原稿をめくっている最中ではなく、原稿をめくった後であると判断することができる。本実施形態では、原稿を1枚めくるごとに該原稿を撮影して見開きのページのスキャン画像を生成するので、撮影画像中には、「原稿をめくった後」の状態が写っていることが必須となる。   The fact that the document is still in the captured image can be determined not to be in the middle of turning the document but to be after the document has been turned. In the present embodiment, every time a document is turned, the document is photographed to generate a scanned image of a facing page. Therefore, the state of “after turning over the document” is reflected in the photographed image. Required.

ステップS304以降では、現フレームの撮影画像、即ち、原稿が静止した状態で写っている撮影画像が処理の対象となる。然るに、原稿が静止した状態で写っている撮影画像を取得することができるのであれば、他の手法によって「原稿が静止した状態で写っている撮影画像」を取得するようにしても構わない。例えば、本装置のユーザが操作可能なインターフェース及び撮影装置102から順次送出される各フレームの撮影画像を閲覧可能な表示画面を設ける。そして、ユーザはこの表示画面に「原稿が静止した状態で写っている撮影画像」が写ったと判断した場合には、インターフェースを操作して撮影指示を入力する。CPU204はこの撮影指示の入力を検知すると、この時点で撮影装置102から取り込んだ撮影画像を以降の処理対象画像とする。   In step S304 and subsequent steps, the captured image of the current frame, that is, the captured image in which the document is stationary is the processing target. However, as long as it is possible to acquire a captured image in which the document is stationary, “a captured image in which the document is stationary” may be acquired by another method. For example, an interface that can be operated by the user of the apparatus and a display screen on which the captured images of the frames sequentially transmitted from the imaging apparatus 102 can be viewed are provided. When the user determines that the “photographed image taken with the document stationary” appears on the display screen, the user operates the interface to input a photographing instruction. When the CPU 204 detects the input of the photographing instruction, the CPU 204 sets the photographed image captured from the photographing apparatus 102 at this time as a processing target image.

ステップS304では、CPU204は画像処理部105として機能し、ステップS303で処理対象画像とした撮影画像に対して、後述の処理のために前処理を行う。具体的には、この撮影画像をグレースケール画像に変換してから公知のエッジの強調処理を行う。公知のエッジ強調手法には、SobelやLaplacianフィルタといった手法が存在する。   In step S304, the CPU 204 functions as the image processing unit 105, and performs preprocessing for the processing to be described later on the captured image set as the processing target image in step S303. Specifically, after this photographed image is converted into a grayscale image, a known edge enhancement process is performed. Known edge enhancement techniques include techniques such as Sobel and Laplacian filters.

ステップS305では、CPU204は画像処理部105として機能し、ステップS304でエッジ強調された画像から、ハフ変換や最小近似法などの公知の手法により線分群(エッジ線群)を抽出する。なお、本実施形態では、数学上の用語に基づき、両端を持つ直線を線分、持たないものを直線と呼ぶ。同じ説明番号を与えた線分を直線と説明する時は、該線分を含む、つまり該線分と傾き及び切片を共有する直線の事を指す。   In step S305, the CPU 204 functions as the image processing unit 105, and extracts a line segment group (edge line group) from the image subjected to edge enhancement in step S304 by a known method such as Hough transform or a minimum approximation method. In the present embodiment, based on mathematical terms, a straight line having both ends is referred to as a line segment, and a straight line having no ends is referred to as a straight line. When a line segment given the same description number is described as a straight line, it refers to a straight line that includes the line segment, that is, shares the slope and intercept with the line segment.

ステップS306では、CPU204は、変数Nの値が1であるか否かを判断する。今判断の結果、N=1であれば、CPU204は「処理対象画像には原稿の表紙ページ(1ページ分の原稿)が写っている」と判断し、処理はステップS307に進む。一方、N≠1であれば、CPU204は「処理対象画像には1枚以上めくった後の状態における原稿が写っている」と判断し、処理はステップS312に進む。   In step S306, the CPU 204 determines whether or not the value of the variable N is 1. If N = 1 as a result of the current determination, the CPU 204 determines that “the cover page of the document (one page of document) is included in the processing target image”, and the process proceeds to step S307. On the other hand, if N ≠ 1, the CPU 204 determines that “the original document in the state after turning one or more sheets is reflected in the processing target image”, and the process proceeds to step S312.

ステップS307では、CPU204は原稿判定部106として機能し、処理対象画像中における原稿領域の枠を推定する。公知の原稿枠推定手法は、特開2012−14430号公報に開示されているように、線分を縦方向、横方向に分類し、原稿四辺の組み合わせ候補を求め、背景と原稿の輝度差が一定であることを利用して画像中の原稿四辺を推定する方法がある。   In step S307, the CPU 204 functions as the document determination unit 106, and estimates the frame of the document area in the processing target image. As disclosed in JP 2012-14430, a known document frame estimation method classifies line segments into a vertical direction and a horizontal direction, obtains a combination candidate of four sides of a document, and determines a luminance difference between the background and the document. There is a method for estimating the four sides of an original in an image using the fact that it is constant.

ステップS308では、CPU204は原稿判定部106として機能し、ステップS307で推定した枠を示す情報(例えば枠の4隅の画像上における画像座標)を、撮影画像内における1ページ目の原稿の枠の情報として、メモリ205に格納する。   In step S308, the CPU 204 functions as the document determination unit 106, and information indicating the frame estimated in step S307 (for example, image coordinates on the images at the four corners of the frame) is used for the frame of the first page of the document in the captured image. Information is stored in the memory 205.

ステップS309では、CPU204は画像処理部105として機能し、ステップS307で推定した枠内の画像を抽出し、該抽出した画像を、1ページ目の原稿のスキャン画像としてメモリ205に格納する。   In step S309, the CPU 204 functions as the image processing unit 105, extracts the image within the frame estimated in step S307, and stores the extracted image in the memory 205 as a scanned image of the first page of the document.

ステップS310ではCPU204は原稿判定部106として機能し、ステップS307で推定した枠内の領域を規定する情報(例えば枠の4隅の画像上における画像座標)を基準原稿位置としてメモリ205に格納する。   In step S310, the CPU 204 functions as the document determination unit 106, and stores in the memory 205 information (for example, image coordinates on the images at the four corners of the frame) that defines the area in the frame estimated in step S307 as the reference document position.

本実施形態では、原稿を綴じた状態、つまり原稿束の表紙が撮影されている状態を基準原稿と呼ぶこととする。その状態から原稿をめくった裏の位置、つまり表紙を1ページ目と数えると偶数ページとなる原稿を裏面原稿と呼ぶこととする。   In the present embodiment, a state where the original is bound, that is, a state where the cover of the original bundle is photographed is referred to as a reference original. From this state, the position of the back side of the document, that is, the document that becomes even pages when the cover is counted as the first page is called a back document.

ステップS311ではCPU204は、変数Nの値を1つインクリメントする。そして処理はステップS317に進む。一方、ステップS312では、CPU204は、原稿判定部106として機能する。そしてCPU204は、処理対象画像から、綴じられた原稿を開いた状態の2枚の原稿のそれぞれの領域を特定し、特定したそれぞれの領域内の画像をNページ目のスキャン画像、(N+1)ページ目のスキャン画像、としてメモリ205に格納する。しかし、処理対象画像に最終ページのみが写っている場合もあり、このときは処理対象画像から最終ページの領域を特定し、特定した領域内の画像をNページ目のスキャン画像としてメモリ205に格納する。ステップS312における処理の詳細については、図4のフローチャートを用いて後述する。   In step S311, the CPU 204 increments the value of the variable N by one. Then, the process proceeds to step S317. On the other hand, in step S <b> 312, the CPU 204 functions as the document determination unit 106. Then, the CPU 204 specifies the areas of the two originals in the state where the bound original is opened from the processing target image, and the image in each of the specified areas is the scan image of the Nth page, (N + 1) page The scanned image of the eye is stored in the memory 205. However, there are cases where only the last page is shown in the processing target image. In this case, the area of the last page is specified from the processing target image, and the image in the specified area is stored in the memory 205 as the scan image of the Nth page. To do. Details of the processing in step S312 will be described later with reference to the flowchart of FIG.

ステップS313では、CPU204は原稿判定部106として機能し、ステップS312で得られた原稿が1枚かどうかを判定する。1枚であれば処理はステップS320に進み、1枚でなければ処理はステップS314に進む。   In step S313, the CPU 204 functions as the document determination unit 106 and determines whether or not the document obtained in step S312 is one. If there is one, the process proceeds to step S320, and if not, the process proceeds to step S314.

ステップS314では、CPU204は原稿判定部106として機能し、メモリ205に格納されている基準原稿位置を、ステップS312で求めた基準原稿位置に更新する。   In step S314, the CPU 204 functions as the document determination unit 106, and updates the reference document position stored in the memory 205 to the reference document position obtained in step S312.

ステップS315では、CPU204は原稿判定部106として機能し、メモリ205にまだ裏面原稿位置が格納されていない場合には、ステップS312で求めた裏面原稿位置をメモリ205に格納する。一方、すでにメモリ205に裏面原稿位置が格納されている場合には、このすでに格納されている裏面原稿位置を、ステップS312で求めた裏面原稿位置に更新する。   In step S <b> 315, the CPU 204 functions as the document determination unit 106, and stores the back side document position obtained in step S <b> 312 in the memory 205 when the back side document position is not yet stored in the memory 205. On the other hand, if the back side document position is already stored in the memory 205, the already stored back side document position is updated to the back side document position obtained in step S312.

ステップS316ではCPU204は、変数Nの値を2つインクリメントする。ステップS317では、CPU204は画像処理部105として機能し、メモリ205にスキャン画像として格納した画像(すなわち不等辺四角形領域)を、元の長方形領域の画像へと補正する演算、いわゆる逆透視変換演算(台形ひずみ補正)を行う。用いられる変換行列のパラメータについては、特開2003−288588号公報に開示されているように、逆透視変換の演算式に4頂点の座標を与える事で、得られる連立方程式を解くことにより抽出できる。   In step S316, the CPU 204 increments the value of the variable N by two. In step S317, the CPU 204 functions as the image processing unit 105, and corrects an image stored as a scanned image in the memory 205 (that is, an unequal square area) into an original rectangular area image, a so-called inverse perspective transformation calculation ( Perform trapezoidal distortion correction). The parameters of the transformation matrix used can be extracted by solving the simultaneous equations obtained by giving the coordinates of the four vertices to the inverse perspective transformation formula as disclosed in Japanese Patent Laid-Open No. 2003-288588. .

ステップS318ではCPU204は画像処理部105として機能し、ステップS317で得られた補正済みスキャン画像について原稿方向を判別する。方向判別処理の手法は公知の技術であり、これについては本実施形態にとって本質ではない。そのため、詳細な説明は省略するが、画像を0°、90°、180°、270°のそれぞれに回転させた状態で計4方向にいくつかの文字を公知の文字認識手法により文字認識し、その際の認識スコアが最も高い方向を正しい方向と判断する方法が一般的である。   In step S318, the CPU 204 functions as the image processing unit 105, and determines the document direction for the corrected scanned image obtained in step S317. The method of direction determination processing is a known technique, and this is not essential for the present embodiment. Therefore, although detailed explanation is omitted, several characters are recognized by a known character recognition method in a total of four directions with the image rotated to 0 °, 90 °, 180 °, and 270 °, respectively. A method of determining the direction with the highest recognition score at that time as the correct direction is common.

ステップS319ではCPU204は画像処理部105として機能し、ステップS318で判断した原稿方向が規定の方向となるように、ステップS317で得られた補正済みスキャン画像を回転させる。これにより、原稿方向が規定の方向となるスキャン画像を得ることができる。そしてCPU204はこの回転済みのスキャン画像をメモリ205に格納する。   In step S319, the CPU 204 functions as the image processing unit 105, and rotates the corrected scanned image obtained in step S317 so that the document direction determined in step S318 becomes a specified direction. Thereby, it is possible to obtain a scanned image in which the document direction is a prescribed direction. Then, the CPU 204 stores the rotated scanned image in the memory 205.

一方、ステップS320では、CPU204は画像処理部105として機能し、ステップS317と同様にして、メモリ205にスキャン画像として格納した画像に対して上記の台形ひずみ補正を行う。   On the other hand, in step S320, the CPU 204 functions as the image processing unit 105, and performs the trapezoidal distortion correction on the image stored as the scan image in the memory 205 in the same manner as in step S317.

ステップS321ではCPU204は画像処理部105として機能し、ステップS318と同様にして、ステップS320で得られた補正済みスキャン画像について原稿方向を判別する。   In step S321, the CPU 204 functions as the image processing unit 105, and determines the document direction of the corrected scanned image obtained in step S320 in the same manner as in step S318.

ステップS322ではCPU204は画像処理部105として機能し、ステップS319と同様にして、ステップS321で判断した原稿方向が規定の方向となるように、ステップS320で得られた補正済みスキャン画像を回転させる。そしてCPU204はこの回転済みのスキャン画像をメモリ205に格納する。   In step S322, the CPU 204 functions as the image processing unit 105, and rotates the corrected scanned image obtained in step S320 so that the document direction determined in step S321 becomes a specified direction, similarly to step S319. Then, the CPU 204 stores the rotated scanned image in the memory 205.

ステップS323ではCPU204は電子文書生成部108として機能し、ここまでの処理で得られた各ページのスキャン画像を表裏の関係を反映して1つの電子文書データへと変換する。   In step S323, the CPU 204 functions as the electronic document generation unit 108, and converts the scanned image of each page obtained by the processing so far into one electronic document data reflecting the front / back relationship.

ステップS324ではCPU204は電子文書生成部108として機能し、ステップS323で生成した電子文書データをメモリ205若しくはハードディスク203に保存する。本実施形態では、電子文書とは画像や文字、図形といったレイアウト情報をページデータとして、複数のページを持つファイルフォーマットを指す。   In step S324, the CPU 204 functions as the electronic document generation unit 108, and stores the electronic document data generated in step S323 in the memory 205 or the hard disk 203. In the present embodiment, an electronic document refers to a file format having a plurality of pages using layout information such as images, characters, and graphics as page data.

次に、上記のステップS312における処理の詳細について、図4のフローチャートを用いて説明する。ステップS401では、CPU204はステップS310で格納した若しくはステップS314で更新した基準原稿位置をメモリ205から読み出す。   Next, details of the processing in step S312 will be described using the flowchart of FIG. In step S <b> 401, the CPU 204 reads out the reference document position stored in step S <b> 310 or updated in step S <b> 314 from the memory 205.

ステップS402では、CPU204は、ステップS401で読み出した基準原稿位置を用いて、処理対象画像中における原稿領域の枠を推定する。本ステップにおける処理の詳細については、以下で具体例を挙げ、そこで説明する。   In step S402, the CPU 204 estimates the frame of the document area in the processing target image using the reference document position read in step S401. Details of the processing in this step will be described below with a specific example.

ステップS403では、CPU204は、ステップS402で原稿領域の枠の推定に成功したか否かを判断する。この判断結果、成功した場合には、処理はステップS404に進み、成功していない場合には、処理はステップS406に進む。   In step S403, the CPU 204 determines whether or not the document area frame has been successfully estimated in step S402. If the determination result is successful, the process proceeds to step S404. If the determination result is not successful, the process proceeds to step S406.

ステップS404では、CPU204は、ステップS402で推定した枠を示す情報(例えば枠の4隅の画像上における画像座標)を、処理対象画像内における(N+1)ページ目の原稿の枠の情報として、メモリ205に格納する。   In step S404, the CPU 204 stores information indicating the frame estimated in step S402 (for example, image coordinates on the image at the four corners of the frame) as information on the frame of the (N + 1) th page of the document in the processing target image. Stored in 205.

ステップS405では、CPU204は、ステップS402で推定した枠内の画像を抽出し、該抽出した画像を、(N+1)ページ目の原稿のスキャン画像としてメモリ205に格納する。   In step S405, the CPU 204 extracts the image within the frame estimated in step S402, and stores the extracted image in the memory 205 as a scanned image of the (N + 1) th page document.

ステップS406では、CPU204は、裏面原稿位置がメモリ205に格納されているか否かを判断する。この判断の結果、格納されていれば、処理はステップS407に進み、格納されていない場合には、処理はステップS408に進む。   In step S <b> 406, the CPU 204 determines whether the back side document position is stored in the memory 205. As a result of this determination, if it is stored, the process proceeds to step S407, and if it is not stored, the process proceeds to step S408.

ステップS407では、CPU204は、メモリ205に格納されている裏面原稿位置を用いて、処理対象画像中におけるもう1つの原稿領域(めくった裏面のページ)の枠を推定する。   In step S <b> 407, the CPU 204 estimates the frame of another document area (turned back page) in the processing target image using the back document position stored in the memory 205.

一方、ステップS408では、CPU204は、ステップS404でメモリ205に格納された(N+1)ページ目の原稿の枠を示す情報を用いて、処理対象画像中におけるもう1つの原稿領域(めくった裏面のページ)の枠を推定する。ステップS407及びS408における処理の詳細については、以下で具体例を挙げ、そこで説明する。   On the other hand, in step S408, the CPU 204 uses the information indicating the frame of the (N + 1) th page of the document stored in the memory 205 in step S404 to use another document area (turned back page) in the processing target image. ) Is estimated. Details of the processes in steps S407 and S408 will be described below with a specific example.

ステップS409では、CPU204は、ステップS407若しくはステップS4082で推定した枠を示す情報(例えば枠の4隅の画像上における画像座標)を、処理対象画像内におけるNページ目の原稿の枠の情報として、メモリ205に格納する。   In step S409, the CPU 204 uses information indicating the frame estimated in step S407 or step S4082 (for example, image coordinates on the image at the four corners of the frame) as information on the frame of the Nth page of the document in the processing target image. Store in the memory 205.

ステップS410では、CPU204は、ステップS407若しくはステップS4082で推定した枠内の画像を抽出し、該抽出した画像を、Nページ目の原稿のスキャン画像としてメモリ205に格納する。   In step S410, the CPU 204 extracts the image within the frame estimated in step S407 or step S4082, and stores the extracted image in the memory 205 as a scanned image of the Nth page document.

次に、図3,4を用いて説明した各処理を、具体例を挙げて説明する。以下の具体例では、左上をステープラで綴じられた2枚の原稿の表紙(1ページ目)、2ページ目(表紙の裏面)、3ページ目(2枚目の原稿)、4ページ目(3ページ目の裏面)のそれぞれのスキャン画像を取得するケースを例にとる。そして以下の説明では、ステップS304で最初に処理対象とする撮影画像は図5(a)に示す如く、このような原稿の表紙を上向きにして原稿台に載置して撮影された画像である。ステップS304で2回目に処理対象とする撮影画像は図5(b)に示す如く、図5(a)に示した状態から原稿を1枚めくり、2ページ目及び3ページ目が見開きのページとして開かれた状態で撮影された画像である。ステップS304で3回目に処理対象とする撮影画像は図5(c)に示す如く、図5(b)に示した状態から原稿を1枚めくり、最終ページである4ページ目が撮影された画像である。   Next, each process described with reference to FIGS. 3 and 4 will be described with specific examples. In the following specific example, the cover (first page), the second page (the back of the cover), the third page (the second document), the fourth page (3) A case where each scanned image on the back side of the page is acquired is taken as an example. In the following description, the photographed image to be processed first in step S304 is an image photographed by placing the document cover face up on the document table as shown in FIG. . As shown in FIG. 5B, the photographed image to be processed for the second time in step S304 turns one original from the state shown in FIG. 5A, and the second and third pages are spread pages. It is the image image | photographed in the open state. As shown in FIG. 5C, the photographed image to be processed for the third time in step S304 is an image obtained by turning one document from the state shown in FIG. 5B and photographing the fourth page as the final page. It is.

先ずステップS301では変数Nが1に初期化され、ステップS302で図5(a)の状態における原稿が撮影される。これにより図5(a)に示すような撮影画像が得られるので、ステップS304、S305では、図5の(a)に示した撮影画像に対して前処理及びハフ変換を行う。ハフ変換の結果、図6(a)に示すような画像が得られたとし、線分(エッジ線)601、602、603、604が抽出された、とする。   First, in step S301, the variable N is initialized to 1, and in step S302, the document in the state shown in FIG. As a result, a photographed image as shown in FIG. 5A is obtained. In steps S304 and S305, preprocessing and Hough transform are performed on the photographed image shown in FIG. Assume that an image as shown in FIG. 6A is obtained as a result of the Hough transform, and line segments (edge lines) 601, 602, 603, and 604 are extracted.

ステップS306では、N=1であるので、1ページ目、すなわち表紙のみ1ページの原稿であると判断し、処理はステップS307に進む。ステップS307では、図5(a)に示した撮影画像中の原稿の枠(線分を四辺とした四角形)を抽出する。特許文献2に記載の方法では、画像中の直線の傾きから、縦方向成分と横方向成分に分類する。縦方向の線分として線分601、603、横方向の線分として線分602、604が分類される。そして、縦方向の2線分と横方向の2線分を組み合わせ(実際にはこの4線分を延長した4直線を組み合わせる)、四角形を形成する。図6(b)に直線により構成される四角形の例を示す。この場合、縦方向の線分601、603、横方向の線分602、604から形成される四角形605(斜線部分)のみが組み合わせとして得られるので、四角形605を原稿領域(原稿四角形)とする。縦線と横線から得られる四角形の組み合わせが複数ある場合は、本実施形態では四角形の面積が最大となる組み合わせを原稿四角形として推定する。   In step S306, since N = 1, it is determined that the first page, that is, only the cover is a one-page document, and the process proceeds to step S307. In step S307, a document frame (a quadrangle with line segments as four sides) in the photographed image shown in FIG. 5A is extracted. In the method described in Patent Document 2, the vertical component and the horizontal component are classified based on the slope of the straight line in the image. Line segments 601 and 603 are classified as vertical line segments, and line segments 602 and 604 are classified as horizontal line segments. Then, two vertical line segments and two horizontal line segments are combined (actually, four straight lines obtained by extending these four line segments are combined) to form a quadrangle. FIG. 6B shows an example of a quadrangle composed of straight lines. In this case, since only the quadrangle 605 (shaded portion) formed from the vertical line segments 601 and 603 and the horizontal line segments 602 and 604 is obtained as a combination, the quadrangle 605 is set as a document area (document square). When there are a plurality of combinations of rectangles obtained from vertical lines and horizontal lines, in the present embodiment, the combination that maximizes the area of the rectangle is estimated as a document rectangle.

ステップS308では、四角形605を規定する情報を原稿枠としてメモリ205に格納する。ステップS309では、撮影画像において四角形605内の画像、即ち、撮影画像において原稿の表紙が写っている領域の画像を抽出し、該抽出した画像を、1ページ目の原稿のスキャン画像としてメモリ205に格納する。ステップS310では、四角形605を規定する情報を基準原稿位置としてメモリ205に格納する。ステップS311では、変数Nの値を1つインクリメントする。   In step S308, information defining the rectangle 605 is stored in the memory 205 as a document frame. In step S309, an image within the rectangle 605 in the photographed image, that is, an image of an area where the cover of the document is shown in the photographed image is extracted, and the extracted image is stored in the memory 205 as a scan image of the first page of the document. Store. In step S310, information defining the rectangle 605 is stored in the memory 205 as a reference document position. In step S311, the value of variable N is incremented by one.

ステップS317では、ステップS309でメモリ205に格納した画像、即ち、撮影画像において原稿の表紙が写っている領域の画像に対して上記の逆透視変換演算(台形ひずみ補正)を行う。これにより、撮影画像において四角形605内の画像は図10(a)に示す如く、長方形の画像1001に変換される。なお、この変換用の行列は、原稿に対する撮影装置102の位置と焦点距離、光軸方向がわかれば固定できるので、撮影装置102の位置が固定であれば、予めこの変換用の行列を求めておいても良い。   In step S317, the reverse perspective transformation calculation (trapezoidal distortion correction) is performed on the image stored in the memory 205 in step S309, that is, the image of the area where the cover of the document is shown in the photographed image. As a result, the image within the quadrangle 605 in the captured image is converted into a rectangular image 1001 as shown in FIG. This conversion matrix can be fixed if the position, focal length, and optical axis direction of the photographing apparatus 102 with respect to the document are known. If the position of the photographing apparatus 102 is fixed, the conversion matrix is obtained in advance. You can leave it.

ステップS318では、ステップS317で得られた補正済みスキャン画像について原稿方向を判別する。ここでは時計回りに0度回転、つまり無回転が正しい方向として判定されたとする。ステップS319では、補正済みスキャン画像に回転をかけずに該補正済みスキャン画像を、1ページ目の原稿のスキャン画像としてメモリ205に格納する。   In step S318, the document orientation of the corrected scanned image obtained in step S317 is determined. Here, it is assumed that 0 ° clockwise rotation, that is, no rotation is determined as the correct direction. In step S319, the corrected scanned image is stored in the memory 205 as the scanned image of the first page of the document without rotating the corrected scanned image.

ここまでで原稿における表紙(1ページ目)のスキャン画像が得られたので、ユーザはその後、原稿の表紙をめくり、図5(b)に示す如く、2ページ目と3ページ目とを見開きの状態にする。そして、ステップS303において現フレームの撮影画像中に原稿が静止した状態で写っている(表紙を開く作業が完了している)と判断されれば、処理はステップS304に進む。   The scanned image of the cover (first page) of the document is obtained so far, and the user then turns the cover of the document and opens the second and third pages as shown in FIG. Put it in a state. If it is determined in step S303 that the document is still in the captured image of the current frame (the operation for opening the cover has been completed), the process proceeds to step S304.

ステップS304、S305では、ステップS302で得られた撮影画像(図5(b))に対して前処理及びハフ変換を行う。ハフ変換の結果、図7(a)に示すような画像が得られたとし、線分(エッジ線)701〜717が抽出された、とする。   In steps S304 and S305, preprocessing and Hough transform are performed on the captured image (FIG. 5B) obtained in step S302. Assume that an image as shown in FIG. 7A is obtained as a result of the Hough transform, and line segments (edge lines) 701 to 717 are extracted.

ステップS306ではN=2であるので、処理はステップS312に進む。ステップS312では、図5(b)の撮影画像からNページ目の画像及び(N+1)目の画像を抽出する。ステップS312では上記の如く、図4のステップS401〜S410の処理を実行する。   Since N = 2 in step S306, the process proceeds to step S312. In step S312, the Nth page image and the (N + 1) th image are extracted from the photographed image of FIG. In step S312, as described above, the processing of steps S401 to S410 in FIG. 4 is executed.

ステップS401では、ステップS310で格納した基準原稿位置(四角形605を規定する情報であり、表紙の枠を規定する情報)をメモリ205から読み出す。   In step S <b> 401, the reference document position (information defining the rectangle 605 and information defining the cover frame) stored in step S <b> 310 is read from the memory 205.

ステップS402では、ステップS401で読み出した基準原稿位置を用いて、処理対象画像中における3ページ目の原稿領域の枠を推定する。具体的には、図7(b)に示す如く、基準原稿位置が規定する枠の4辺のそれぞれからの距離閾値T以下の領域720の範囲から線分を選択する。4線分が領域720内に存在しなければ、Tの値を徐々に大きくしながら近傍範囲を4線分が見つかるまで広げる。閾値Tはたとえば基準原稿位置が規定する枠の短辺の長さの1%を初期値として、1%刻みで広げるなどすればよい。ここでは、線分709、710、711、717の4線分が領域720の内側に見つかったため、これら4線分を含む直線4つを四辺として組み合わせて求められる不等辺四角形721(図7(c))が、3ページ目の原稿領域の枠として推定される。なお、このように領域720を用いて4線分を見つける方法は一例であり、各線分の基準原稿各辺に対する位置の近傍度合いを計算して、得点の高いものから順に組み合わせるなどの方法を用いても良い。   In step S402, the frame of the document area of the third page in the processing target image is estimated using the reference document position read in step S401. Specifically, as shown in FIG. 7B, a line segment is selected from a range of an area 720 that is equal to or less than a distance threshold T from each of the four sides of the frame defined by the reference document position. If the four line segments do not exist in the region 720, the neighborhood range is expanded until the four line segments are found while gradually increasing the value of T. For example, the threshold value T may be increased by 1% with an initial value of 1% of the length of the short side of the frame defined by the reference document position. Here, since four line segments 709, 710, 711, and 717 were found inside the region 720, an unequal quadrangle 721 obtained by combining four straight lines including these four line segments as four sides (FIG. 7 (c) )) Is estimated as the frame of the document area of the third page. Note that the method of finding four line segments using the region 720 is an example, and a method of calculating the degree of proximity of the position with respect to each side of the reference original of each line segment and combining them in order from the highest score is used. May be.

ステップS403では、ステップS402で原稿領域の枠の推定に成功したので、処理はステップS404に進む。   In step S403, since the document area frame has been successfully estimated in step S402, the process proceeds to step S404.

ステップS404では、3ページ目の原稿領域の枠を示す情報(例えば枠の4隅の画像上における画像座標)を、メモリ205に格納する。   In step S <b> 404, information indicating the frame of the document area of the third page (for example, image coordinates on the image at the four corners of the frame) is stored in the memory 205.

ステップS405では、ステップS402で推定した原稿領域の枠(四角形605)内の画像(3ページ目の原稿領域の枠内の画像)を抽出し、該抽出した画像を、3ページ目の原稿のスキャン画像としてメモリ205に格納する。   In step S405, an image within the frame (rectangle 605) of the document area estimated in step S402 is extracted (image within the frame of the document area on the third page), and the extracted image is scanned on the document on the third page. The image is stored in the memory 205 as an image.

ステップS406では、N=2の時点ではまだ裏面原稿位置はメモリ205に格納されていないので、処理はステップS408に進む。   In step S406, since the back side document position is not yet stored in the memory 205 at the time of N = 2, the process proceeds to step S408.

ステップS408では、ステップS404でメモリ205に格納された3ページ目の原稿の枠を示す情報を用いて、2ページ目の原稿領域の枠を推定する。ステップS408における原稿領域の枠の推定方法について、図8を用いて説明する。   In step S408, the frame of the document area of the second page is estimated using the information indicating the frame of the document of the third page stored in the memory 205 in step S404. The document area frame estimation method in step S408 will be described with reference to FIG.

まず、検出した線分を含む直線から、3ページ目の原稿領域の内角801、802、803、804を通る2直線を探索する。綴じられた位置によって、角は完全に重ならないため、角から半径Rまでの距離を許容する。見つからない場合は、徐々に半径Rを広げていく。半径Rはたとえば、基準原稿の短辺の長さの1%とし、1%刻みで広げていけばよい。この結果、702、708の2直線が4辺中の2辺の候補として見つけられた。また、本探索方は一例であって、直線と角との最短距離をスコアとして近い順に組み合わせを絞り込んで行くなどの方法でもよい。次に、その2辺に挟まれる領域810から残る2辺候補となる線分とあわせて、原稿領域を推定する。領域810の中では、前述の公知の原稿推定技術により、原稿枠を推定すればよい。領域810の中には線分701、702、703、704、705、706、707、708の8線分が含まれ、この中から702、708を2辺として含む不等辺四角形の組み合わせから、原稿領域を推測する。ここでは面積が最大になる四辺を原稿領域の枠として推測する手法を用いる。まず、6線分から2線分を組み合わせる15通りが、原稿領域の枠候補の全てである。その中で、不等辺四角形の四辺に線分を含むものは、701、705の組み合わせと、701、708の組み合わせと、703、706の組み合わせの3通りである。面積最大のものとして、701、705の組み合わせより作られる図8(c)の不等辺四角形820が原稿領域の枠として推定された。   First, two straight lines passing through the internal angles 801, 802, 803, and 804 of the document area on the third page are searched from the straight lines including the detected line segments. Since the corners do not overlap completely depending on the bound position, a distance from the corner to the radius R is allowed. If not found, the radius R is gradually increased. The radius R is, for example, 1% of the length of the short side of the reference document and may be widened in increments of 1%. As a result, two straight lines 702 and 708 were found as candidates for two of the four sides. Further, this search method is an example, and a method of narrowing down combinations in ascending order using the shortest distance between the straight line and the corner as a score may be used. Next, the document area is estimated together with the remaining two-side candidate line segments from the area 810 sandwiched between the two sides. In the area 810, the document frame may be estimated by the known document estimation technique described above. The area 810 includes eight line segments 701, 702, 703, 704, 705, 706, 707, and 708. From these, a combination of unequal-sided rectangles including 702 and 708 as two sides is used as a document. Guess the area. Here, a method is used in which the four sides having the maximum area are estimated as the frame of the document area. First, fifteen combinations combining six lines to two lines are all the frame candidates for the document area. Among them, there are three types including a combination of 701 and 705, a combination of 701 and 708, and a combination of 703 and 706 that include line segments on the four sides of the unequal side rectangle. As the largest area, an unequal side quadrangle 820 in FIG. 8C formed from a combination of 701 and 705 was estimated as a frame of the document area.

ステップS409では、不等辺四角形820(2ページ目の原稿領域の枠)を示す情報(例えば枠の4隅の画像上における画像座標)を、処理対象画像内における2ページ目の原稿の枠の情報として、メモリ205に格納する。   In step S409, information indicating the unequal side rectangle 820 (frame of the document area of the second page) (for example, image coordinates on the image at the four corners of the frame) is used as information of the frame of the document of the second page in the processing target image. Is stored in the memory 205.

ステップS410では、CPU204は、不等辺四角形820内の画像を抽出し、該抽出した画像を、2ページ目の原稿のスキャン画像としてメモリ205に格納する。   In step S410, the CPU 204 extracts an image within the unequal side rectangle 820, and stores the extracted image in the memory 205 as a scan image of the second page of the document.

図3に戻って、次に、ステップS313では、2ページ目と3ページ目とを検出したので、処理はステップS314に進む。ステップS314では、基準原稿位置を不等辺四角形721(3ページ目の原稿領域の枠)に更新する。ステップS315では、裏面原稿位置を不等辺四角形820(2ページ目の原稿領域の枠)に更新する。ステップS316では変数Nの値が2つインクリメントされる。これによりN=4となる。   Returning to FIG. 3, since the second page and the third page are detected in step S313, the process proceeds to step S314. In step S314, the reference document position is updated to an unequal side rectangle 721 (frame of the document area on the third page). In step S315, the back side document position is updated to an unequal side rectangle 820 (frame of the document area of the second page). In step S316, the value of the variable N is incremented by two. As a result, N = 4.

ステップS317では、2ページ目のスキャン画像及び3ページ目のスキャン画像に対して上記の逆透視変換演算(台形ひずみ補正)を行うことで、それぞれのスキャン画像は図10(b)の画像1002、図10(c)の画像1003に変換される。   In step S317, the above-described inverse perspective transformation calculation (trapezoidal distortion correction) is performed on the scan image on the second page and the scan image on the third page, so that each scan image is an image 1002, FIG. The image is converted into an image 1003 in FIG.

ステップS318では、画像1002については時計回りに270度回転が正しい方向として判定され、画像1003については時計回りに0度回転が正しいと判定される。ステップS319では、画像1002については反時計回りに270度回転させてから、回転後の画像を2ページ目の原稿のスキャン画像としてメモリ205に格納する。また、ステップS319では、画像1003については回転をかけずに、これを3ページ目のスキャン画像としてメモリ205に格納する。   In step S318, the image 1002 is determined to be rotated in the clockwise direction by 270 degrees, and the image 1003 is determined to be rotated in the clockwise direction by 0 degrees. In step S319, the image 1002 is rotated 270 degrees counterclockwise, and the rotated image is stored in the memory 205 as a scanned image of the second page of the document. In step S319, the image 1003 is stored in the memory 205 as a scanned image of the third page without being rotated.

ここまでで原稿における2ページ目及び3ページ目のスキャン画像が得られたので、ユーザはその後、2枚目の原稿をめくり、図5(c)に示す如く、最終ページが上向きに原稿台上に載置されている状態にする。そして、ステップS303において現フレームの撮影画像中に原稿が静止した状態で写っている(2枚目の原稿をめくる作業が完了している)と判断されれば、処理はステップS304に進む。   Up to this point, since the scanned images of the second and third pages of the document have been obtained, the user then turns the second document and, as shown in FIG. 5C, the last page faces upward on the document table. To the state where it is mounted. If it is determined in step S303 that the original is still in the captured image of the current frame (the operation of turning the second original has been completed), the process proceeds to step S304.

ステップS304、S305では、ステップS302で得られた撮影画像(図5(c))に対して前処理及びハフ変換を行う。ハフ変換の結果、図9(a)に示す如く、線分(エッジ線)901〜904が抽出された、とする。   In steps S304 and S305, preprocessing and Hough transform are performed on the captured image (FIG. 5C) obtained in step S302. As a result of the Hough transform, it is assumed that line segments (edge lines) 901 to 904 are extracted as shown in FIG.

ステップS306ではN=4であるので、処理はステップS312に進む。ステップS312では、図5(c)の撮影画像からNページ目の画像を抽出する。ステップS312では上記の如く、図4のステップS401〜S410の処理を実行する。   Since N = 4 in step S306, the process proceeds to step S312. In step S312, an Nth page image is extracted from the captured image of FIG. In step S312, as described above, the processing of steps S401 to S410 in FIG. 4 is executed.

ステップS401では、ステップS314で更新した基準原稿位置(不等辺四角形721の枠を規定する情報)をメモリ205から読み出す。   In step S <b> 401, the reference document position updated in step S <b> 314 (information defining the frame of the unequal rectangle 721) is read from the memory 205.

ステップS402では、ステップS401で読み出した基準原稿位置を用いて、処理対象画像中における4ページ目の原稿領域の枠を推定する。図9(a)に示す如く、基準原稿位置が規定する枠の4辺のそれぞれからの距離閾値T以下の領域910内には4線分が存在しないので、原稿領域の枠の推定はできない。   In step S402, the frame of the document area of the fourth page in the processing target image is estimated using the reference document position read in step S401. As shown in FIG. 9A, since there are no four line segments in the area 910 that is equal to or smaller than the distance threshold T from each of the four sides of the frame defined by the reference document position, the frame of the document area cannot be estimated.

ステップS403では、ステップS402で原稿領域の枠の推定に成功していないので、処理はステップS406に進む。ステップS406では、裏面原稿位置はメモリ205に格納されているので、処理はステップS407に進む。   In step S403, since the frame of the document area has not been successfully estimated in step S402, the process proceeds to step S406. In step S406, since the back side document position is stored in the memory 205, the process proceeds to step S407.

ステップS407では、裏面原稿位置を用いて、処理対象画像中における4ページ目の原稿領域の枠を推定する。推定方法はステップS402と同様の方法を用いればよい。図9(b)に示す如く、裏面原稿位置が規定する枠の4辺のそれぞれからの距離閾値T以下の領域920の範囲から4線分901〜904を選択する。そしてこれら4線分を含む直線4つを四辺として組み合わせて求められる不等辺四角形930(図9(c))が、4ページ目の原稿領域の枠として推定される。   In step S407, the frame of the fourth page of the document area in the processing target image is estimated using the back side document position. The estimation method may be the same method as in step S402. As shown in FIG. 9B, four line segments 901 to 904 are selected from the range of the area 920 that is equal to or less than the distance threshold T from each of the four sides of the frame defined by the back side document position. Then, an unequal side rectangle 930 (FIG. 9C) obtained by combining four straight lines including these four line segments as four sides is estimated as the frame of the document area of the fourth page.

ステップS409では、不等辺四角形930(4ページ目の原稿領域の枠)を示す情報(例えば枠の4隅の画像上における画像座標)を、処理対象画像内における4ページ目の原稿の枠の情報として、メモリ205に格納する。   In step S409, information indicating an unequal side rectangle 930 (frame of the document area of the fourth page) (for example, image coordinates on the image at the four corners of the frame) is used as information of the frame of the document of the fourth page in the processing target image. Is stored in the memory 205.

ステップS410では、不等辺四角形930(4ページ目の原稿領域の枠)内の画像を抽出し、該抽出した画像を、4ページ目の原稿のスキャン画像としてメモリ205に格納する。   In step S410, an image within the unequal side rectangle 930 (frame of the document area of the fourth page) is extracted, and the extracted image is stored in the memory 205 as a scan image of the document of the fourth page.

図3に戻って、次に、ステップS313では、4ページ目のみを検出したので、処理はステップS320に進む。ステップS320では、ステップS317と同様にして、メモリ205にスキャン画像として格納した「4ページ目の原稿のスキャン画像」に対して上記の台形ひずみ補正を行い、これにより図10(d)に示すような補正済みスキャン画像1004を得る。   Returning to FIG. 3, in step S313, since only the fourth page is detected, the process proceeds to step S320. In step S320, in the same manner as in step S317, the above-mentioned trapezoidal distortion correction is performed on the “scan image of the fourth page of the document” stored as a scan image in the memory 205, and as a result, as shown in FIG. A corrected scan image 1004 is obtained.

ステップS321では、ステップS318と同様にして、ステップS320で得られた補正済みスキャン画像1004について原稿方向を判別する。その結果、時計回りに270度回転すれば良いと判断したので、ステップS322では、補正済みスキャン画像1004を時計回りに270度回転させ、回転済みのスキャン画像をメモリ205に格納する。   In step S321, in the same manner as in step S318, the document orientation is determined for the corrected scanned image 1004 obtained in step S320. As a result, since it is determined that it is only necessary to rotate 270 degrees clockwise, in step S322, the corrected scan image 1004 is rotated 270 degrees clockwise, and the rotated scan image is stored in the memory 205.

ステップS323では、ここまでの処理で得られた4ページ分のスキャン画像を、1ページ目のスキャン画像、2ページ目のスキャン画像、3ページ目のスキャン画像、4ページ目のスキャン画像、の順に並べた1つの電子文書データへと変換する。ステップS324では、ステップS323で生成した電子文書データをメモリ205若しくはハードディスク203に保存する。   In step S323, the scanned images for four pages obtained by the processing so far are processed in the order of the first page scanned image, the second page scanned image, the third page scanned image, and the fourth page scanned image. Convert to a single electronic document data. In step S324, the electronic document data generated in step S323 is stored in the memory 205 or the hard disk 203.

このようにして得られた4ページ分のスキャン画像を投影装置103を用いて適当な面に投影した例を図11に示す。投影画面において領域1101には上記の処理により得られた4ページ分のスキャン画像のそれぞれのサムネイル画像が一覧表示されている。この4ページ分のスキャン画像のうちユーザが不図示の操作部を用いて選択したスキャン画像は領域1102に拡大表示され、ユーザはこのスキャン画像を閲覧したり、上記操作部を操作して適宜編集したりすることができる。表示方法や表示形態については図11に示した表示方法、表示形態に限るものではない。   FIG. 11 shows an example in which the scanned images for four pages obtained in this way are projected onto an appropriate surface using the projection device 103. In the area 1101 on the projection screen, thumbnail images of the scanned images for four pages obtained by the above processing are displayed in a list. Of these four pages of scan images, the scan image selected by the user using an operation unit (not shown) is enlarged and displayed in the area 1102, and the user can view the scan image or edit the operation image by appropriately operating the operation unit. You can do it. The display method and display form are not limited to the display method and display form shown in FIG.

このように、本実施形態によれば、ステープラなどで綴じられた原稿を原稿台上に置き、ページをめくる操作のみで容易に該原稿を電子文書として取り込むことができる。   As described above, according to the present embodiment, an original document bound by a stapler or the like is placed on an original table and the original can be easily captured as an electronic document only by turning the page.

なお、本実施形態では具体的な例を挙げてその処理の流れを説明したが、これは以下に説明する基本構成の一例に過ぎない。基本構成によれば、原稿台上に載置された複数枚綴りの原稿を撮像するために設けられた撮像部が、1枚の原稿がめくられる度に撮像した該原稿の撮像画像を取得する。ここで、撮像部がp(pは2以上の自然数)回目に撮像した撮像画像を撮像画像pとする。このとき、撮像画像pに対し、撮像画像(p−1)から特定されている(2p−3)ページ目の原稿領域と同位置に領域を設定し、該設定した領域から(2p−1)ページ目の原稿領域を特定する。更に、該特定した原稿領域内の画像を(2p−1)ページ目の原稿画像として取得する(第1の取得)。   In the present embodiment, the flow of processing has been described with a specific example, but this is only an example of a basic configuration described below. According to the basic configuration, an imaging unit provided for imaging a multi-page document placed on a document table acquires a captured image of the document that is captured each time one document is turned. . Here, a captured image captured by the imaging unit p (p is a natural number of 2 or more) times is defined as a captured image p. At this time, for the captured image p, an area is set at the same position as the original area of the (2p-3) -th page specified from the captured image (p-1), and from the set area (2p-1) Specify the document area of the page. Further, an image in the specified document area is acquired as a document image of the (2p-1) th page (first acquisition).

そして、撮像画像(p−1)から(2p−4)ページ目の原稿領域が特定されていない場合には、撮像画像p中の(2p−1)ページ目の原稿領域から撮像画像p中における(2p−2)ページ目の原稿領域を特定する(第1の特定)。   If the document area of the (2p-4) th page from the captured image (p-1) is not specified, the document area from the (2p-1) th page of the captured image p in the captured image p is displayed. (2p-2) The document area of the page is specified (first specification).

一方、撮像画像(p−1)から(2p−4)ページ目の原稿領域が特定されている場合には、撮像画像pに対し、(2p−4)ページ目の原稿領域と同位置に領域を設定し、該設定した領域から(2p−2)ページ目の原稿領域を特定する(第2の特定)。   On the other hand, when the document area of the (2p-4) th page from the captured image (p-1) is specified, the area at the same position as the document area of the (2p-4) page with respect to the captured image p. And the document area of the (2p-2) th page is specified from the set area (second specification).

そして、第1の特定若しくは第2の特定により特定された(2p−2)ページ目の原稿領域内の画像を(2p−2)ページ目の画像として取得する(第2の取得)。然るに、このような基本構成に帰着する若しくはこれと同等の構成であれば、様々な変形例が考え得る。   Then, the image in the document area of the (2p-2) th page specified by the first specification or the second specification is acquired as the image of the (2p-2) page (second acquisition). However, various modified examples can be considered as long as it results in such a basic configuration or a configuration equivalent to this.

[第2の実施形態]
第1の実施形態では、原稿束の各原稿サイズが全て同一として処理されるが、前後ページで差分比較することで、原稿束中に異なるサイズの原稿が混在していても処理が可能となる。以下では、第1の実施形態との差分のみについて説明し、以下で特に触れない限りは第1の実施形態と同様であるものとする。然るに、本実施形態でも、図1,2に示したシステムを利用する。
[Second Embodiment]
In the first embodiment, the document bundles are all processed with the same document size, but by comparing the difference between the previous and next pages, it is possible to process even if documents of different sizes are mixed in the document bundle. . Hereinafter, only differences from the first embodiment will be described, and unless otherwise noted, the same as the first embodiment. However, also in this embodiment, the system shown in FIGS.

本実施形態でも制御装置101は図3のフローチャートに従った処理を実行するのであるが、ステップS312では、図4のフローチャートに従った処理の代わりに、図12のフローチャートに従った処理を実行する。   Also in this embodiment, the control apparatus 101 executes the process according to the flowchart of FIG. 3, but in step S312, the process according to the flowchart of FIG. 12 is executed instead of the process according to the flowchart of FIG. .

なお、図12において、ステップS1201、S1202、S1208、S1210、S1211、S1216はそれぞれ、ステップS401、S402、S405、S408、S407、S410と同様の処理である。そのためステップS1201、S1202、S1208、S1210、S1211、S1216のそれぞれに係る説明は省略する。   In FIG. 12, steps S1201, S1202, S1208, S1210, S1211, and S1216 are the same processes as steps S401, S402, S405, S408, S407, and S410, respectively. Therefore, the description regarding each of step S1201, S1202, S1208, S1210, S1211, and S1216 is abbreviate | omitted.

ステップS1203では、CPU204は原稿判定部106として機能し、基準原稿位置で原稿枠が抽出されたか否かを判定し、抽出されていれば処理はステップS1204に進み、抽出されていなければ処理はステップS1209に進む。   In step S1203, the CPU 204 functions as the document determination unit 106 to determine whether a document frame has been extracted at the reference document position. If it has been extracted, the process proceeds to step S1204. If not, the process proceeds to step S1203. The process proceeds to S1209.

ステップS1204では、CPU204は画像処理部105として機能し、ステップS1203で抽出された原稿枠内の画像に対し、差分比較のために逆透視変換による歪み補正を行う。台形補正を行った画像については、後段のステップS317では補正をする必要はない。   In step S1204, the CPU 204 functions as the image processing unit 105, and performs distortion correction by reverse perspective transformation on the image in the document frame extracted in step S1203 for comparison of differences. It is not necessary to correct the trapezoidally corrected image in the subsequent step S317.

ステップS1205ではCPU204は画像処理部105として機能し、ステップS1204で歪み補正処理を行った画像と、2ページ前のスキャン画像と、の差分を求め、それぞれの画像において一致する領域、一致しない領域を特定する。他には、公知の文書解析技術により、画像領域、文字領域、図形領域などの前景を抽出し、各オブジェクトの位置形状から2つの画像間で一致領域、不一致領域の判断をしてもよい。公知の画像解析技術としては、例えば、USP5680478に開示されている方法がある。   In step S1205, the CPU 204 functions as the image processing unit 105, obtains a difference between the image subjected to the distortion correction processing in step S1204 and the scanned image two pages before, and determines a matching area and a non-matching area in each image. Identify. In addition, foregrounds such as an image area, a character area, and a graphic area may be extracted by a known document analysis technique, and a matching area and a mismatching area may be determined between two images from the position shape of each object. As a known image analysis technique, for example, there is a method disclosed in US Pat. No. 5,680,478.

ステップS1206では、CPU204は原稿判定部106として機能し、ステップS1205で得られた差分から、2つの画像間で一致する部分(一致領域)があったか否かを判断する。この判断の結果、一致領域があった場合には、処理はステップS1207に進み、一致領域がなかった場合には、処理はステップS1208に進む。   In step S1206, the CPU 204 functions as the document determination unit 106, and determines whether or not there is a matching portion (matching region) between the two images from the difference obtained in step S1205. As a result of this determination, if there is a matching area, the process proceeds to step S1207, and if there is no matching area, the process proceeds to step S1208.

ステップS1207では、CPU204は原稿判定部106として機能し、上記2ページ前のスキャン画像から一致領域を取り除いた残りの領域の画像を、新たな「2ページ前のスキャン画像」としてメモリ205に格納する。   In step S <b> 1207, the CPU 204 functions as the document determination unit 106, and stores the remaining area image obtained by removing the matching area from the scanned image two pages before in the memory 205 as a new “scanned image two pages before”. .

ステップS1209では、CPU204はメモリ205に裏面原稿位置が既に格納されているか否かを判断する。この判断の結果、格納されている場合には、処理はステップS1211に進み、格納されていない場合には、処理はステップS1210に進む。   In step S1209, the CPU 204 determines whether or not the back side document position is already stored in the memory 205. As a result of this determination, if it is stored, the process proceeds to step S1211. If it is not stored, the process proceeds to step S1210.

ステップS1212では、CPU204は画像処理部105として機能し、裏面原稿位置に基づいて得られるNページ目のスキャン画像に対し、差分比較のために逆透視変換による歪み補正を行う。台形補正を行った画像については、後段のステップS317では補正をする必要はない。   In step S <b> 1212, the CPU 204 functions as the image processing unit 105, and performs distortion correction by reverse perspective transformation for the N-th page scan image obtained based on the back side document position for the difference comparison. It is not necessary to correct the trapezoidally corrected image in the subsequent step S317.

ステップS1213では、CPU204は画像処理部105として機能し、ステップS1212で歪み補正処理を行った画像と、2ページ前のスキャン画像と、の差分を求め、それぞれの画像において一致する領域、一致しない領域を特定する。   In step S1213, the CPU 204 functions as the image processing unit 105, obtains a difference between the image subjected to the distortion correction processing in step S1212 and the scanned image two pages before, and a matching area and a non-matching area in each image. Is identified.

ステップS1214では、CPU204は原稿判定部106として機能し、ステップS1213で得られた差分から、2つの画像間で一致する部分(一致領域)があったか否かを判断する。この判断の結果、一致領域があった場合には、処理はステップS1215に進み、一致領域がなかった場合には、処理はステップS1216に進む。   In step S1214, the CPU 204 functions as the document determination unit 106, and determines whether or not there is a matching portion (matching region) between the two images from the difference obtained in step S1213. As a result of the determination, if there is a matching area, the process proceeds to step S1215. If there is no matching area, the process proceeds to step S1216.

ステップS1215では、CPU204は原稿判定部106として機能し、ステップS1212で歪み補正処理を行った画像から一致領域を取り除いた残りの領域の枠を特定する。 In step S1215, the CPU 204 functions as the document determination unit 106, and specifies a frame of the remaining area obtained by removing the matching area from the image subjected to the distortion correction process in step S1212.

以下では、具体例を挙げて、図3,12のフローチャートに従った処理を説明する。先ず最初に図5(a)の撮影画像が得られ、次に2枚目の撮影画像として、2ページ目と該2ページ目よりもサイズが小さい3ページ目とが開いている状態で撮影された撮影画像(図13(a))が得られたとする。そして次に、3枚目の撮影画像として、3ページ目の裏面である4ページ目と該4ページ目よりもサイズが大きい5ページ目とが開いている状態で撮影された撮影画像(図13(b))が得られたとする。そして最後に4枚目の撮影画像として、図5(c)の撮影画像が得られたとする。このようにして4枚の撮影画像がこの順で得られた場合における、図3,12のフローチャートに従った処理について説明する。   Below, the process according to the flowchart of FIG.3, 12 is demonstrated, giving a specific example. First, the photographed image of FIG. 5A is obtained, and then the second photographed image is photographed with the second page and the third page smaller in size than the second page opened. Assume that a captured image (FIG. 13A) is obtained. Then, as the third photographed image, a photographed image photographed in a state where the fourth page, which is the back surface of the third page, and the fifth page having a size larger than the fourth page are opened (FIG. 13). Suppose that (b)) is obtained. Finally, assume that the captured image of FIG. 5C is obtained as the fourth captured image. A process according to the flowcharts of FIGS. 3 and 12 when four photographed images are obtained in this order will be described.

先ずステップS301では変数Nが1に初期化され、ステップS302では図5(a)に示した撮影画像が得られる。N=1の場合における処理(S303〜S311,S317〜S319)は第1の実施形態で説明した通りである。然るにN=1の場合における処理(S303〜S311,S317〜S319)が完了した時点で、基準原稿位置として図6(b)の四角形605が得られ、1ページ目のスキャン画像として図10(a)の画像1001が得られる。   First, in step S301, the variable N is initialized to 1, and in step S302, the captured image shown in FIG. 5A is obtained. The processing in the case of N = 1 (S303 to S311, S317 to S319) is as described in the first embodiment. However, when the processing in the case of N = 1 (S303 to S311, S317 to S319) is completed, the square 605 of FIG. 6B is obtained as the reference document position, and the scanned image of the first page is shown in FIG. ) Image 1001 is obtained.

N=2の時に、ステップS302で得られた撮影画像が図13(a)に示した画像である。その後、この画像に対してステップS304,S305の処理を行うと、図14(a)に示す如く、線分(エッジ線)1401〜1410が得られる。そしてN=2であるので、処理はステップS306を介してステップS312に進む。ステップS312では図12のフローチャートに従った処理を行う。   When N = 2, the captured image obtained in step S302 is the image shown in FIG. Thereafter, when the processing of steps S304 and S305 is performed on this image, line segments (edge lines) 1401 to 1410 are obtained as shown in FIG. Since N = 2, the process proceeds to step S312 via step S306. In step S312, processing according to the flowchart of FIG. 12 is performed.

ステップS1201,S1202により、基準原稿位置(四角形605の枠)を用いて、図13(a)に示した撮影画像から原稿領域の枠を推定する。その結果、図14(b)に示す如く、領域1411の枠が原稿領域の枠として得られる。原稿領域の枠が得られたので、処理はステップS1203を介してステップS1204に進む。ステップS1204ではこの原稿領域の枠内の画像を抽出し、抽出した画像に対して上記の逆透視変換を行うことで、図16(a)に示す画像を得る。   In steps S1201 and S1202, the frame of the document area is estimated from the photographed image shown in FIG. 13A using the reference document position (frame of rectangle 605). As a result, as shown in FIG. 14B, the frame of the area 1411 is obtained as the frame of the document area. Since the frame of the document area is obtained, the process proceeds to step S1204 via step S1203. In step S1204, an image within the frame of the document area is extracted, and the reverse perspective transformation is performed on the extracted image to obtain the image shown in FIG.

ステップS1205では、図16(a)の画像と図10(a)の画像とで対応する画素位置間のRGB値の差を求める。そして、求めた差が閾値以上となる画素位置が占める領域(不一致領域)、求めた差が閾値未満となる画素位置が占める領域(一致領域)を特定する。ここではそれぞれの画像で一致領域がないので、処理はステップS1206を介してステップS1208に進む。   In step S1205, the RGB value difference between the corresponding pixel positions in the image of FIG. 16A and the image of FIG. Then, an area occupied by pixel positions where the obtained difference is equal to or greater than the threshold (mismatch area) and an area occupied by pixel positions where the obtained difference is less than the threshold (matching area) are specified. Here, since there is no matching area in each image, the process proceeds to step S1208 via step S1206.

ステップS1208では、図16(a)の画像を(N+1)ページ目(3ページ目)のスキャン画像としてメモリ205に格納する。そして、裏面原稿位置はまだメモリ205に格納されていないため、処理はステップS1209を介してステップS1210に進む。   In step S1208, the image of FIG. 16A is stored in the memory 205 as the scanned image of the (N + 1) th page (third page). Since the back side document position is not yet stored in the memory 205, the process proceeds to step S1210 via step S1209.

ステップS1210では、図14(b)の領域1411の角部を通る直線を検出し、その間の領域から原稿領域の枠を推定し、これにより、図14(c)に示す領域1412の枠が原稿領域の枠として得られる。   In step S1210, a straight line passing through the corner of the area 1411 in FIG. 14B is detected, and the frame of the document area is estimated from the area in between, so that the frame of the area 1412 shown in FIG. Obtained as a frame of the region.

ステップS1216では、領域1412内の画像を抽出する。そして抽出した画像をNページ目(2ページ目)のスキャン画像としてメモリ205に格納する。   In step S1216, an image in the area 1412 is extracted. The extracted image is stored in the memory 205 as an Nth page (second page) scanned image.

図3に戻って、検出した原稿は2枚であるため、処理はステップS313を介してステップS314に進む。ステップS314では、領域1411の枠を示す情報を(N+1)ページ目(3ページ目)の基準原稿位置としてメモリ205に格納することで、メモリ205内の基準原稿位置を更新する。ステップS315では、メモリ205に、領域1412の枠を示す情報をNページ目(2ページ目)の裏面原稿位置としてメモリ205に格納する。そしてステップS316では変数Nの値を2つインクリメントするので、N=4となる。   Returning to FIG. 3, since the number of detected documents is two, the process proceeds to step S314 via step S313. In step S314, information indicating the frame of the area 1411 is stored in the memory 205 as the reference document position of the (N + 1) th page (third page), thereby updating the reference document position in the memory 205. In step S 315, information indicating the frame of the area 1412 is stored in the memory 205 as the N-th page (second page) back side document position in the memory 205. In step S316, since the value of the variable N is incremented by 2, N = 4.

ステップS317では、ステップS1216でメモリ205に格納した2ページ目のスキャン画像に対して逆透視変換を行うことにより、図16(b)に示す画像が得られる。3ページ目については既にステップS1204で補正されているため、ステップS317における処理対象外とする。ステップS318では、補正した2ページ目のスキャン画像に対して方向判別を行い、0度回転が正しい方向と判別された。3ページ目のスキャン画像に対しても同様に方向判別を行う。ステップS319では、方向判別結果に応じてそれぞれの画像を適宜回転させ、これにより3ページ目の最終的なスキャン画像として図16(a)の画像、2ページ目の最終的なスキャン画像として図16(b)の画像、がメモリ205に登録されることになる。   In step S317, the image shown in FIG. 16B is obtained by performing reverse perspective transformation on the scanned image of the second page stored in the memory 205 in step S1216. Since the third page has already been corrected in step S1204, it is excluded from the processing target in step S317. In step S318, the direction of the corrected scanned image of the second page is determined, and 0 degree rotation is determined as the correct direction. The direction determination is similarly performed on the scanned image of the third page. In step S319, the respective images are appropriately rotated in accordance with the direction discrimination result, whereby the image of FIG. 16A is obtained as the final scan image of the third page, and the final scan image of the second page is shown in FIG. The image (b) is registered in the memory 205.

N=4の時に、ステップS302で得られた撮影画像が図13(b)に示した画像である。その後、この画像に対してステップS304,S305の処理を行うと、図15(a)に示す如く、線分(エッジ線)1501〜1510が得られる。そしてN=4であるので、処理はステップS306を介してステップS312に進む。ステップS312では図12のフローチャートに従った処理を行う。   When N = 4, the captured image obtained in step S302 is the image shown in FIG. Thereafter, when the processing of steps S304 and S305 is performed on this image, line segments (edge lines) 1501 to 1510 are obtained as shown in FIG. Since N = 4, the process proceeds to step S312 via step S306. In step S312, processing according to the flowchart of FIG. 12 is performed.

ステップS1201,S1202により、基準原稿位置が示す領域1411の枠を用いて、図13(b)に示した撮影画像から原稿領域の枠を推定する。その結果、図15(b)に示す如く、領域1511の枠が原稿領域の枠として得られる。原稿領域の枠が得られたので、処理はステップS1203を介してステップS1204に進む。   In steps S1201 and S1202, the frame of the document area is estimated from the photographed image shown in FIG. 13B using the frame of the area 1411 indicated by the reference document position. As a result, as shown in FIG. 15B, the frame of the area 1511 is obtained as the frame of the document area. Since the frame of the document area is obtained, the process proceeds to step S1204 via step S1203.

ステップS1204ではこの原稿領域の枠内の画像を抽出し、抽出した画像に対して上記の逆透視変換を行うことで、図16(c)に示す画像を得る。   In step S1204, an image within the frame of the document area is extracted, and the reverse perspective transformation is performed on the extracted image to obtain the image shown in FIG.

ステップS1205では、図16(c)の画像と図16(a)の画像とで対応する画素位置間のRGB値の差を求める。そして、求めた差が閾値以上となる画素位置が占める領域(不一致領域)、求めた差が閾値未満となる画素位置が占める領域(一致領域)を特定する。ここでは図17(a)に示す如く、図16(a)の画像に対し、一致領域として領域1701、不一致領域として領域1702、が特定される。然るに処理はステップS1206を介してステップS1207に進む。   In step S1205, the RGB value difference between the corresponding pixel positions in the image of FIG. 16C and the image of FIG. Then, an area occupied by pixel positions where the obtained difference is equal to or greater than the threshold (mismatch area) and an area occupied by pixel positions where the obtained difference is less than the threshold (matching area) are specified. Here, as shown in FIG. 17A, a region 1701 as a matching region and a region 1702 as a non-matching region are specified for the image in FIG. However, the process proceeds to step S1207 via step S1206.

ステップS1207では、図16(a)の画像から一致領域を取り除いた残りの領域の画像(図16(e))を生成し、すでにメモリ205に3ページ目のスキャン画像として格納した画像を、この生成した画像に置き換える。   In step S1207, an image of the remaining area (FIG. 16 (e)) obtained by removing the matching area from the image of FIG. 16 (a) is generated, and the image already stored in the memory 205 as the scanned image of the third page is generated. Replace with the generated image.

ステップS1208では、図16(c)の画像を(N+1)ページ目(5ページ目)のスキャン画像としてメモリ205に格納する。そして、裏面原稿位置はすでにメモリ205に格納されているため、処理はステップS1209を介してステップS1211に進む。   In step S1208, the image of FIG. 16C is stored in the memory 205 as the scanned image of the (N + 1) th page (fifth page). Since the back side document position is already stored in the memory 205, the process proceeds to step S1211 via step S1209.

ステップS1211では、裏面原稿位置が示す領域1412の枠を用いて、図13(b)に示した撮影画像から原稿領域の枠を推定する。その結果、図15(c)に示す如く、領域1512の枠が原稿領域の枠として得られる。ステップS1212ではこの原稿領域の枠内の画像を抽出し、抽出した画像に対して上記の逆透視変換を行うことで、図16(d)に示す画像を得る。   In step S1211, the frame of the document area is estimated from the photographed image shown in FIG. 13B using the frame of the area 1412 indicated by the back side document position. As a result, as shown in FIG. 15C, the frame of the area 1512 is obtained as the frame of the document area. In step S1212, an image within the frame of the document area is extracted, and the reverse perspective transformation is performed on the extracted image to obtain the image shown in FIG.

ステップS1213では、図16(d)の画像と図16(b)の画像とで対応する画素位置間のRGB値の差を求める。そして、求めた差が閾値以上となる画素位置が占める領域(不一致領域)、求めた差が閾値未満となる画素位置が占める領域(一致領域)を特定する。ここでは図17(b)に示す如く、図16(d)の画像に対し、一致領域として領域1703、不一致領域として領域1704、が特定される。然るに処理はステップS1214を介してステップS1215に進む。   In step S1213, the RGB value difference between the corresponding pixel positions in the image of FIG. 16D and the image of FIG. Then, an area occupied by pixel positions where the obtained difference is equal to or greater than the threshold (mismatch area) and an area occupied by pixel positions where the obtained difference is less than the threshold (matching area) are specified. Here, as shown in FIG. 17B, a region 1703 as a matching region and a region 1704 as a non-matching region are specified for the image of FIG. 16D. However, the process proceeds to step S1215 via step S1214.

ステップS1215では、図16(d)の画像から一致領域を取り除いた残りの領域の枠(図16(f)の画像の枠、即ち不一致領域の枠)を特定する。そしてステップS1216では、ステップS1215で特定した枠内の画像(図16(f))を抽出し、抽出した画像をNページ目(4ページ目)のスキャン画像としてメモリ205に格納する。   In step S1215, the remaining area frame (the image frame in FIG. 16F, that is, the mismatch area frame) obtained by removing the matching area from the image in FIG. 16D is specified. In step S1216, the image within the frame specified in step S1215 (FIG. 16F) is extracted, and the extracted image is stored in the memory 205 as the scan image of the Nth page (fourth page).

図3に戻って、検出した原稿は2枚であるため、処理はステップS313を介してステップS314に進む。ステップS314では、領域1511の枠を示す情報を(N+1)ページ目(5ページ目)の基準原稿位置としてメモリ205に格納することで、メモリ205内の基準原稿位置を更新する。ステップS315では、領域1512の枠を示す情報をNページ目(4ページ目)の裏面原稿位置としてメモリ205に格納する。そしてステップS316では変数Nの値を2つインクリメントするので、N=6となる。   Returning to FIG. 3, since the number of detected documents is two, the process proceeds to step S314 via step S313. In step S314, information indicating the frame of the area 1511 is stored in the memory 205 as the reference document position of the (N + 1) th page (fifth page), thereby updating the reference document position in the memory 205. In step S315, information indicating the frame of the area 1512 is stored in the memory 205 as the back side document position of the Nth page (fourth page). In step S316, since the value of the variable N is incremented by two, N = 6.

4ページ分のスキャン画像、5ページ目のスキャン画像、は共に既に補正されているため、ステップS317における処理対象外とする。ステップS318では、それぞれのスキャン画像に対して方向判別を行う。ステップS319では、方向判別結果に応じてそれぞれの画像を適宜回転させる。これにより4ページ目の最終的なスキャン画像として図16(f)に示した画像が、5ページ目の最終的なスキャン画像として図16(c)に示した画像が、メモリ205に登録されることになる。   Since the scanned image for page 4 and the scanned image for page 5 are both corrected, they are excluded from the processing target in step S317. In step S318, direction discrimination is performed on each scanned image. In step S319, each image is appropriately rotated according to the direction discrimination result. As a result, the image shown in FIG. 16F is registered in the memory 205 as the final scan image of the fourth page, and the image shown in FIG. 16C is registered as the final scan image of the fifth page. It will be.

N=6の時に、ステップS302で得られた撮影画像が図5(c)に示した画像である。図12のフローチャートのステップS1212、S1213では、図10(d)の画像と図16(d)の画像とで上記の如く画素位置間でRGB値の差を求めて一致領域、不一致領域を特定し、その結果、一致領域はなかったと判断される。その他の処理は、第1の実施形態で説明したとおりであるので、これに係る説明は省略する。そして、6ページ目のスキャン画像として、図10(d)の画像を時計回りに270度回転した画像がメモリ205に登録されることになる。ステップS324では、図10(a)、図16(b)、図16(e)、図16(f)、図16(c)、図10(d)を順にページとして構成した電子文書が生成される。   When N = 6, the captured image obtained in step S302 is the image shown in FIG. In steps S1212 and S1213 of the flowchart of FIG. 12, the matching region and the mismatching region are specified by obtaining the RGB value difference between the pixel positions as described above in the image of FIG. 10D and the image of FIG. As a result, it is determined that there is no matching area. The other processes are as described in the first embodiment, and a description thereof will be omitted. Then, an image obtained by rotating the image of FIG. 10D clockwise by 270 degrees is registered in the memory 205 as the scan image of the sixth page. In step S324, an electronic document is generated in which FIG. 10A, FIG. 16B, FIG. 16E, FIG. 16F, FIG. 16C, and FIG. The

このように、本実施形態によれば、ページサイズの違う原稿も同様に簡単に電子文書化することが可能となる。なお、第1の実施形態と第2の実施形態は適宜切り替えて使用しても構わない。例えばユーザが不図示の操作部を用いて第1の実施形態で説明した電子文書生成処理、第2の実施形態で説明した電子文書生成処理、の何れかを選択して実行するようにしても構わない。   As described above, according to the present embodiment, it is possible to easily convert documents with different page sizes into electronic documents as well. Note that the first embodiment and the second embodiment may be used by switching appropriately. For example, the user may select and execute either the electronic document generation process described in the first embodiment or the electronic document generation process described in the second embodiment using an operation unit (not illustrated). I do not care.

(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
(Other examples)
The present invention can also be realized by executing the following processing. That is, software (program) that realizes the functions of the above-described embodiments is supplied to a system or apparatus via a network or various storage media, and a computer (or CPU, MPU, or the like) of the system or apparatus reads the program. It is a process to be executed.

Claims (19)

見開き2ページが撮像された撮像画像を取得する取得手段と、An acquisition means for acquiring a captured image obtained by capturing two spread pages;
前記撮像画像上の基準領域を取得する基準領域取得手段と、Reference area acquisition means for acquiring a reference area on the captured image;
前記撮像画像中の見開き2ページのうち前記基準領域に対応する第1のページ内の画像を、該見開き2ページにおいて後方側のページの画像として登録し、前記撮像画像中の見開き2ページのうち該第1のページとは異なる第2のページ内の画像を、該見開き2ページにおいて前方側のページの画像として登録する登録手段とAmong the two spread pages in the captured image, the image in the first page corresponding to the reference area is registered as an image of the rear page in the two spread pages, and among the two spread pages in the captured image Registration means for registering an image in a second page different from the first page as an image of a front page in the two spread pages;
を備えることを特徴とする画像処理装置。An image processing apparatus comprising:
前記基準領域取得手段は、前記取得手段が前記撮像画像に先行して取得した先行撮像画像中の見開き2ページにおいて後方側のページの領域を前記基準領域として取得することを特徴とする請求項1に記載の画像処理装置。The reference area acquisition unit acquires a region of a page on the rear side as the reference region in two spread pages in the preceding captured image acquired by the acquisition unit prior to the captured image. An image processing apparatus according to 1. 前記基準領域取得手段は、前記取得手段が前記撮像画像に先行して取得した1ページの先行撮像画像において該1ページの領域を前記基準領域として取得することを特徴とする請求項1に記載の画像処理装置。The said reference area acquisition means acquires the area | region of this 1 page as the said reference area in the preceding picked-up image of 1 page acquired before the said captured image by the said acquisition means. Image processing device. 前記登録手段は、前記撮像画像中の見開き2ページのうち前記第1のページ内の画像を奇数ページの画像として登録し、前記見開き2ページのうち前記第2のページ内の画像を偶数ページの画像として登録することを特徴とする請求項1乃至3の何れか1項に記載の画像処理装置。The registering unit registers an image in the first page of the two spread pages in the captured image as an odd page image, and sets the image in the second page of the two spread pages as an even page. The image processing apparatus according to claim 1, wherein the image processing apparatus is registered as an image. 前記登録手段は、登録対象となる画像の形状及び向きを補正してから登録することを特徴とする請求項1乃至4の何れか1項に記載の画像処理装置。The image processing apparatus according to claim 1, wherein the registration unit performs registration after correcting the shape and orientation of an image to be registered. 更に、Furthermore,
前記登録手段が登録した画像を保持する保持手段を備えることを特徴とする請求項1乃至5の何れか1項に記載の画像処理装置。The image processing apparatus according to claim 1, further comprising a holding unit that holds an image registered by the registration unit.
更に、Furthermore,
前記保持手段が保持する画像をページ順に並べた電子文書を生成する生成手段を備えることを特徴とする請求項6に記載の画像処理装置。The image processing apparatus according to claim 6, further comprising a generation unit that generates an electronic document in which images held by the holding unit are arranged in page order.
前記取得手段は、前記見開き2ページが原稿台上で静止した状態で撮像された撮像画像を取得することを特徴とする請求項1乃至7の何れか1項に記載の画像処理装置。The image processing apparatus according to claim 1, wherein the acquisition unit acquires a captured image captured in a state where the two facing pages are stationary on a document table. 画像処理装置が行う画像処理方法であって、An image processing method performed by an image processing apparatus,
前記画像処理装置の取得手段が、見開き2ページが撮像された撮像画像を取得する取得工程と、An acquisition step in which the acquisition unit of the image processing apparatus acquires a captured image obtained by capturing two spread pages;
前記画像処理装置の基準領域取得手段が、前記撮像画像上の基準領域を取得する基準領域取得工程と、A reference area acquisition step of acquiring a reference area on the captured image by a reference area acquisition unit of the image processing apparatus;
前記画像処理装置の登録手段が、前記撮像画像中の見開き2ページのうち前記基準領域に対応する第1のページ内の画像を、該見開き2ページにおいて後方側のページの画像として登録し、前記撮像画像中の見開き2ページのうち該第1のページとは異なる第2のページ内の画像を、該見開き2ページにおいて前方側のページの画像として登録する登録工程とThe registration means of the image processing device registers an image in the first page corresponding to the reference region among the two spread pages in the captured image as an image of a page on the rear side in the two spread pages, A registration step of registering an image in a second page different from the first page among the two spread pages in the captured image as an image of a front page in the two spread pages;
を備えることを特徴とする画像処理方法。An image processing method comprising:
原稿台上に載置された複数枚綴りの原稿を撮像するために設けられた撮像部が、1枚の原稿がめくられる度に撮像した該原稿の撮像画像を取得する手段と、
前記撮像部がp(pは2以上の自然数)回目に撮像した撮像画像を撮像画像pとし、撮像画像pに対し、撮像画像(p−1)から特定されている(2p−3)ページ目の原稿領域と同位置に領域を設定し、該設定した領域から(2p−1)ページ目の原稿領域を特定すると共に、該特定した原稿領域内の画像を(2p−1)ページ目の原稿画像として取得する第1の取得手段と、
撮像画像(p−1)から(2p−4)ページ目の原稿領域が特定されていない場合には、撮像画像p中の(2p−1)ページ目の原稿領域から撮像画像p中における(2p−2)ページ目の原稿領域を特定する第1の特定手段と、
撮像画像(p−1)から(2p−4)ページ目の原稿領域が特定されている場合には、撮像画像pに対し、(2p−4)ページ目の原稿領域と同位置に領域を設定し、該設定した領域から(2p−2)ページ目の原稿領域を特定する第2の特定手段と、
前記第1の特定手段若しくは前記第2の特定手段により特定された(2p−2)ページ目の原稿領域内の画像を(2p−2)ページ目の画像として取得する第2の取得手段と
を備えることを特徴とする画像処理装置。
Means for obtaining an image of the original image captured by an imaging unit provided for imaging a multi-page original placed on the original table each time one original is turned;
The captured image captured by the imaging unit p (p is a natural number equal to or greater than 2) is defined as a captured image p, and the (2p-3) th page specified from the captured image (p-1) with respect to the captured image p An area is set at the same position as the original area, and the (2p-1) th page original area is specified from the set area, and the image in the specified original area is the (2p-1) th page original. First acquisition means for acquiring an image;
If the document area of the (2p-4) th page from the captured image (p-1) is not specified, the (2p-1) th page of the document area in the captured image p is (2p) in the captured image p. -2) first specifying means for specifying the document area of the page;
When the document area of the (2p-4) th page from the captured image (p-1) is specified, an area is set at the same position as the document area of the (2p-4) page with respect to the captured image p. A second specifying unit for specifying the document area of the (2p-2) th page from the set area;
Second acquisition means for acquiring an image in the original area of the (2p-2) th page specified by the first specifying means or the second specifying means as an image of the (2p-2) page; An image processing apparatus comprising:
更に、
前記撮像部が最初に撮像した撮像画像中のエッジ線群から四角形領域を構成する4つのエッジ線を選択し、該選択したエッジ線で構成される領域を1ページ目の原稿領域として取得し、該取得した原稿領域内の画像を1ページ目の画像として抽出する手段を備えることを特徴とする請求項10に記載の画像処理装置。
Furthermore,
Selecting four edge lines constituting a quadrangular area from the edge line group in the captured image first captured by the imaging unit, and acquiring the area composed of the selected edge lines as a document area of the first page ; 11. The image processing apparatus according to claim 10 , further comprising means for extracting the acquired image in the document area as an image of the first page .
更に、
前記第1の取得手段及び前記第2の取得手段が取得した画像に対して台形補正を行う補正手段を備えることを特徴とする請求項10又は11に記載の画像処理装置。
Furthermore,
The image processing apparatus according to claim 10 or 11, characterized in that it comprises a correcting means for performing keystone correction for the first acquisition means and the second acquisition means acquired image.
更に、
前記補正手段が補正した画像における原稿方向を判別し、該判別した原稿方向に応じて該画像を回転させてからメモリに登録する手段を備えることを特徴とする請求項12に記載の画像処理装置。
Furthermore,
13. The image processing apparatus according to claim 12 , further comprising means for discriminating a document direction in the image corrected by the correcting unit and registering the image in the memory after rotating the image according to the determined document direction. .
更に、
前記メモリに登録された画像を投影して一覧表示する手段を備えることを特徴とする請求項13に記載の画像処理装置。
Furthermore,
14. The image processing apparatus according to claim 13 , further comprising means for projecting and displaying a list of images registered in the memory.
更に、
(2p−1)ページ目の画像と、(2p−3)ページ目の画像とで画素値の差が閾値よりも小さい領域を特定し、(2p−3)ページ目の画像から該特定した領域を取り除く手段を備えることを特徴とする請求項10乃至14の何れか1項に記載の画像処理装置。
Furthermore,
An area in which the pixel value difference between the (2p-1) page image and the (2p-3) page image is smaller than a threshold value is specified, and the specified area from the (2p-3) page image the image processing apparatus according to any one of claims 10 to 14, characterized in that it comprises a means for removing.
更に、
(2p−2)ページ目の画像と、(2p−4)ページ目の画像とで画素値の差が閾値よりも小さい領域を特定し、(2p−2)ページ目の画像から該特定した領域を取り除く手段を備えることを特徴とする請求項10乃至15の何れか1項に記載の画像処理装置。
Furthermore,
An area in which the difference in pixel value between the (2p-2) page image and the (2p-4) page image is smaller than a threshold value is specified, and the specified area from the (2p-2) page image the image processing apparatus according to any one of claims 10 to 15, characterized in that it comprises a means for removing.
画像処理装置が行う画像処理方法であって、
前記画像処理装置の撮像画像を取得する手段が、原稿台上に載置された複数枚綴りの原稿を撮像するために設けられた撮像部が、1枚の原稿がめくられる度に撮像した該原稿の撮像画像を取得する工程と、
前記画像処理装置の第1の取得手段が、前記撮像部がp(pは2以上の自然数)回目に撮像した撮像画像を撮像画像pとし、撮像画像pに対し、撮像画像(p−1)から特定されている(2p−3)ページ目の原稿領域と同位置に領域を設定し、該設定した領域から(2p−1)ページ目の原稿領域を特定すると共に、該特定した原稿領域内の画像を(2p−1)ページ目の原稿画像として取得する第1の取得工程と、
前記画像処理装置の第1の特定手段が、撮像画像(p−1)から(2p−4)ページ目の原稿領域が特定されていない場合には、撮像画像p中の(2p−1)ページ目の原稿領域から撮像画像p中における(2p−2)ページ目の原稿領域を特定する第1の特定工程と、
前記画像処理装置の第2の特定手段が、撮像画像(p−1)から(2p−4)ページ目の原稿領域が特定されている場合には、撮像画像pに対し、(2p−4)ページ目の原稿領域と同位置に領域を設定し、該設定した領域から(2p−2)ページ目の原稿領域を特定する第2の特定工程と、
前記画像処理装置の第2の取得手段が、前記第1の特定工程若しくは前記第2の特定工程で特定された(2p−2)ページ目の原稿領域内の画像を(2p−2)ページ目の画像として取得する第2の取得工程と
を備えることを特徴とする画像処理方法。
An image processing method performed by an image processing apparatus,
The means for acquiring a captured image of the image processing apparatus captures an image captured each time a document is turned by an imaging unit provided to capture a plurality of spelled documents placed on a document table. Obtaining a captured image of the document;
The first acquisition unit of the image processing apparatus uses the captured image captured by the imaging unit p (p is a natural number of 2 or more) as the captured image p, and the captured image (p−1) with respect to the captured image p. An area is set at the same position as the original area of the (2p-3) th page specified from (2p-3), and the original area of the (2p-1) th page is specified from the set area, and within the specified original area A first acquisition step of acquiring the image of (2p-1) as a document image of page (2p-1);
When the first specifying unit of the image processing apparatus has not specified the document area of the (2p-4) th page from the captured image (p-1), the (2p-1) page in the captured image p. A first specifying step of specifying an original area of the (2p-2) th page in the captured image p from the original area of the eye;
When the second specifying unit of the image processing apparatus specifies the document area of the (2p-4) th page from the captured image (p-1) to the captured image p, (2p-4) A second specifying step of setting an area at the same position as the original area of the page and specifying the original area of the (2p-2) page from the set area;
The second acquisition unit of the image processing apparatus selects the image in the document area of the (2p-2) th page specified in the first specifying step or the second specifying step as the (2p-2) th page. A second acquisition step of acquiring the first image as an image of the first image processing method.
コンピュータを、請求項1乃至8,10乃至16の何れか1項に記載の画像処理装置の各手段として機能させるためのコンピュータプログラム。 A computer program for causing a computer to function as each unit of the image processing apparatus according to any one of claims 1 to 8 and 10 to 16 . 請求項18に記載のコンピュータプログラムを格納した、コンピュータ読み取り可能な記憶媒体。A computer-readable storage medium storing the computer program according to claim 18.
JP2013023826A 2013-02-08 2013-02-08 Image processing apparatus and image processing method Active JP6077873B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013023826A JP6077873B2 (en) 2013-02-08 2013-02-08 Image processing apparatus and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013023826A JP6077873B2 (en) 2013-02-08 2013-02-08 Image processing apparatus and image processing method

Publications (3)

Publication Number Publication Date
JP2014155073A JP2014155073A (en) 2014-08-25
JP2014155073A5 JP2014155073A5 (en) 2016-03-24
JP6077873B2 true JP6077873B2 (en) 2017-02-08

Family

ID=51576534

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013023826A Active JP6077873B2 (en) 2013-02-08 2013-02-08 Image processing apparatus and image processing method

Country Status (1)

Country Link
JP (1) JP6077873B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7252501B2 (en) * 2020-11-11 2023-04-05 キヤノンマーケティングジャパン株式会社 Information processing device, information processing system, information processing method and program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3433624B2 (en) * 1996-11-18 2003-08-04 ミノルタ株式会社 Image reading device
JPH10304130A (en) * 1997-04-25 1998-11-13 Minolta Co Ltd Image reader

Also Published As

Publication number Publication date
JP2014155073A (en) 2014-08-25

Similar Documents

Publication Publication Date Title
JP4556813B2 (en) Image processing apparatus and program
RU2631765C1 (en) Method and system of correcting perspective distortions in images occupying double-page spread
JP2005122320A (en) Photographing apparatus, and its image processing method and program
JP2007074578A (en) Image processor, photography instrument, and program
JP6798752B2 (en) How to generate a corrected image, how to generate a selection image of writing or drawing drawn on one or two adjacent pages of a notebook or agenda, a computer program for a PC, or a mobile for a smartphone or tablet computer application
WO2014184372A1 (en) Image capture using client device
JP2017120503A (en) Information processing device, control method and program of information processing device
JP5541679B2 (en) Image processing apparatus and method, and program
KR101597915B1 (en) Image processing apparatus and image processing method
JP5504990B2 (en) Imaging apparatus, image processing apparatus, and program
US20150112853A1 (en) Online loan application using image capture at a client device
US10999513B2 (en) Information processing apparatus having camera function, display control method thereof, and storage medium
JP2017049686A (en) Image processing device
US8971636B2 (en) Image creating device, image creating method and recording medium
JP6077873B2 (en) Image processing apparatus and image processing method
JP6669390B2 (en) Information processing apparatus, information processing method, and program
JP4363154B2 (en) Imaging apparatus, image processing method thereof, and program
US20210281742A1 (en) Document detections from video images
CN116403226A (en) Unconstrained fold document image correction method, system, equipment and storage medium
JP2017199288A (en) Image processing device, image processing method and program
JP2012060452A (en) Image processor, method therefor and program
US20220012482A1 (en) Layout analysis
JP5563390B2 (en) Image processing apparatus, control method therefor, and program
JP4363153B2 (en) Imaging apparatus, image processing method thereof, and program
JP2005217721A (en) Apparatus and method for generating still picture

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160203

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161216

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170113

R151 Written notification of patent or utility model registration

Ref document number: 6077873

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151