JP2018106349A - Image processing system - Google Patents
Image processing system Download PDFInfo
- Publication number
- JP2018106349A JP2018106349A JP2016250800A JP2016250800A JP2018106349A JP 2018106349 A JP2018106349 A JP 2018106349A JP 2016250800 A JP2016250800 A JP 2016250800A JP 2016250800 A JP2016250800 A JP 2016250800A JP 2018106349 A JP2018106349 A JP 2018106349A
- Authority
- JP
- Japan
- Prior art keywords
- image data
- image
- unit
- document
- camera
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000000284 extract Substances 0.000 claims abstract description 4
- 238000003384 imaging method Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 description 16
- 238000000034 method Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 11
- 238000000605 extraction Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000010191 image analysis Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012015 optical character recognition Methods 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Landscapes
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
Description
本発明は、撮影された画像データの画像処理を行う画像処理装置に関する。 The present invention relates to an image processing apparatus that performs image processing of captured image data.
近年、会議等の資料をスマートフォンやカメラ等で撮影し、電子データとして保存することがある。そこで、撮影された画像を文書データとして読みやすくするために、画像に文字認識を行い、画像内の文字を文字認識により得られたテキストデータに置き換えたり、画像内の文字間隔や行間隔を変更したりして補正する技術が提案されている(例えば、特許文献1〜3を参照)。 In recent years, materials such as conferences are sometimes photographed with a smartphone or a camera and stored as electronic data. Therefore, in order to make it easy to read the captured image as document data, character recognition is performed on the image and characters in the image are replaced with text data obtained by character recognition, or character spacing and line spacing in the image are changed. For example, patent documents 1 to 3 have been proposed.
しかしながら、従来技術では、ユーザーが資料を写真として保存するために撮影した場合も、文書として保存するために撮影した場合と同様に、撮影した画像が文書データとして画像補正されてしまい、ユーザーの撮影目的に沿った画像処理ができなかったという問題があった。 However, in the prior art, when a user takes a picture to save the document as a picture, the shot picture is corrected as document data in the same manner as when the picture is taken to save as a document. There was a problem that image processing according to the purpose could not be performed.
本発明は上記課題に鑑みてなされたものであり、撮影した画像をユーザーの撮影目的に沿って文書又は写真として自動的に画像処理することができる技術を提供することを目的とする。 The present invention has been made in view of the above-described problems, and an object of the present invention is to provide a technique capable of automatically processing a photographed image as a document or a photograph in accordance with a photographing purpose of a user.
本発明の画像処理装置は、カメラによって同一の原稿を複数回異なる方向から撮影した複数枚の画像データを取得する画像データ取得部と、前記画像データ取得部により取得された前記複数枚の画像データに基づいて、前記複数枚の画像データの中で対象とする1枚の対象画像データの撮影角度を推定する撮影角度推定部と、前記撮影角度推定部によって推定された前記撮影角度が特定角度内である場合に限って、前記対象画像データから原稿領域画像を抽出し、前記原稿領域画像の台形補正を行う補正処理部と、前記補正処理部によって補正された前記対象画像データを出力すると共に、前記撮影角度推定部によって推定された前記撮影角度が特定角度外である場合に、前記補正処理部による補正を実行することなく前記対象画像データを出力する画像出力部とを備えたことを特徴とする。
また、前記撮影角度推定部は、前記複数枚の画像データに基づいて前記カメラのキャリブレーションを行うことで、前記対象画像データの撮影位置を推定し、推定した前記撮影位置に基づいて前記対象画像データの前記撮影角度を推定してもよい。
また、前記補正処理部は、前記撮影角度推定部による前記キャリブレーションを行うことで取得される、前記カメラの歪み係数を用いて、前記対象画像データの歪みを除去する歪み除去処理部を有してもよい。
また、前記対象画像データは、前記カメラによる前記複数回の撮影のうち、1回目に撮影した画像データであってもよい。
また、前記特定角度は、30°〜85°又は−30°〜−85°であってもよい。
The image processing apparatus according to the present invention includes an image data acquisition unit that acquires a plurality of image data obtained by photographing the same document from a plurality of different directions by a camera, and the plurality of image data acquired by the image data acquisition unit. A shooting angle estimation unit that estimates a shooting angle of one target image data to be processed among the plurality of pieces of image data, and the shooting angle estimated by the shooting angle estimation unit is within a specific angle. Only when the document area image is extracted from the target image data, the keystone correction of the document area image is corrected, and the target image data corrected by the correction processing section is output. When the shooting angle estimated by the shooting angle estimation unit is outside a specific angle, the target image data is stored without performing correction by the correction processing unit. Characterized by comprising an image output section for force.
The shooting angle estimation unit estimates the shooting position of the target image data by performing calibration of the camera based on the plurality of pieces of image data, and the target image based on the estimated shooting position. The shooting angle of the data may be estimated.
The correction processing unit includes a distortion removal processing unit that removes distortion of the target image data using a distortion coefficient of the camera acquired by performing the calibration by the imaging angle estimation unit. May be.
Further, the target image data may be image data captured for the first time among the plurality of times of imaging by the camera.
The specific angle may be 30 ° to 85 ° or −30 ° to −85 °.
本発明によれば、撮影した画像をユーザーの撮影目的に沿って文書又は写真として自動的に画像処理することができる。 According to the present invention, a photographed image can be automatically processed as a document or a photograph in accordance with the photographing purpose of the user.
以下、図を参照して本発明の実施形態を詳細に説明する。なお、以下の実施形態において、同様の機能を示す構成には、同一の符号を付してある。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. Note that, in the following embodiments, the same reference numerals are given to configurations showing similar functions.
本実施の形態の画像処理システム500は、資料等の原稿MSを撮影することで原稿MSの画像データを生成するカメラ200と、カメラ200により生成された画像データの画像処理を行う画像処理装置100とを備えている。カメラ200と画像処理装置100とは、ネットワーク300を介して接続されている。
An
カメラ200は、CCDカメラやCMOSカメラ等の固体撮像素子で構成されたカメラであり、カメラ機能を備えたスマートフォンやタブレット端末等であってもよい。カメラ200は、Wi-Fi(登録商標)やBluetooth(登録商標)による無線通信を行い、ネットワーク300を介して画像処理装置100と各種データを送受信する機能を有する。
The
ユーザーは、会議等で配布された資料等を原稿MSとして、カメラ200で複数回それぞれ異なる方向から撮影する。カメラ200は、原稿MSを撮影すると、撮影によって生成した画像データを撮影順にネットワーク300経由で画像処理装置100に送信する。
The user uses the
画像処理装置100は、パーソナルコンピューター、プリンター、複合機等の電子機器であり、図1を参照すると、画像処理制御部1と、通信部2と、記憶部3と、操作表示部4と、印刷部5とを備えている。画像処理制御部1と、通信部2と、記憶部3と、操作表示部4と、印刷部5とは、システムバス6によって接続されている。なお、この他にも、画像処理装置100に原稿を読み取るスキャナーや、ファクシミリデータを送受信するファクシミリ送受信部が設けられてもよい。
The
通信部2は、Wi-Fi(登録商標)やBluetooth(登録商標)による無線通信を行って、カメラ200と各種データを送受信する機能を有する。
The
記憶部3は、半導体メモリーやHDD(Hard Disk Drive)等の記憶手段である。記憶部3には、光学文字認識に用いるための文字認識用データ31が記憶されている。文字認識用データ31は、文字画像パターンとテキストデータとが対応付けられて登録されている。また、記憶部3には、通信部2がカメラ200から受信した画像データが記憶される。
The
操作表示部4は、各種情報を表示する液晶ディスプレイ等の表示部と、ユーザーからの指示入力を受け付ける操作キー等の入力部とを備えたユーザーインターフェイスである。表示部は、タッチパネルであってもよく、表示手段及び入力手段として機能してもよい。
The
印刷部5は、画像データを印刷する印刷手段である。印刷部5は、例えば、画像出力部14により出力された画像データに基づき感光体ドラムの表面に潜像を形成し、トナーによってその潜像をトナー像とする画像形成を行い、その感光体ドラムから記録紙にトナー像を転写させ、そのトナー像を記録紙に定着させて排紙する。
The
画像処理制御部1は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)を備えたマイクロコンピューター等の情報処理部である。画像処理制御部1のROMには、画像処理装置100の動作制御を行うための制御プログラムが記憶されている。画像処理制御部1は、ROMに記憶されている制御プログラムを読み出し、制御プログラムをRAMに展開させることで、装置全体の制御を行う。
The image processing control unit 1 is an information processing unit such as a microcomputer including a CPU (Central Processing Unit), a ROM (Read Only Memory), and a RAM (Random Access Memory). A control program for controlling the operation of the
また、画像処理制御部1は、画像データ取得部11、撮影角度推定部12、撮影目的判断部13、画像出力部14、補正処理部15として機能する。
In addition, the image processing control unit 1 functions as an image data acquisition unit 11, a shooting
画像データ取得部11は、通信部2を介して、カメラ200により撮影された複数枚の画像データを取得する機能を有する。通信部2がカメラ200から受信した画像データの枚数が予め決められた特定枚数(複数枚)になるまで、画像データ取得部11によって画像データは記憶部3に記憶される。画像データ取得部11は、通信部2によって受信された画像データの枚数が複数枚になると、記憶部3から複数枚の画像データを取得する。なお、予めカメラ200によって原稿MSを複数回異なる方向から撮影した写真をそれぞれ印刷したものを、撮影順に原稿読取部にスキャンさせ、画像データ取得部11は、スキャンによってそれぞれ生成された画像データを上記の複数枚の画像データとして取得してもよい。
The image data acquisition unit 11 has a function of acquiring a plurality of image data captured by the
撮影角度推定部12は、画像データ取得部11によって取得された複数枚の画像データに基づいて、複数枚の画像データの中で対象とする1枚の対象画像データの撮影角度を推定する機能を有する。具体的には、撮影角度推定部12は、画像データ取得部11によって取得された複数枚の画像データに基づいて、公知のカメラキャリブレーションを行って、1回目に撮影した画像データのカメラ200の撮影位置とカメラ200の歪み係数等とを取得する。
The shooting
例えば、撮影角度推定部12は、画像データから原稿MSにおける用紙の輪郭線を検出し、検出した輪郭線を既知のキャリブレーション用パターンとして取得して、カメラキャリブレーションを行ってもよい。なお、この場合、撮影角度推定部12は、撮影される原稿MSの用紙サイズ(例えばA4等)を予め取得しているものとする。また、原稿MSに予め既知のキャリブレーション用パターンが印刷されていてもよい。また、原稿MSの載置面に予め既知のキャリブレーション用パターンを印刷等により表示しておき、載置面のキャリブレーション用パターンと共に原稿MSが撮影されるようにしてもよい。撮影角度推定部12は、カメラキャリブレーションを行うことで、原稿MSを撮影したときのカメラ200の3次元空間上の位置を知ることができる。そのため、撮影角度推定部12は、カメラ200の1回目の撮影位置に基づいて、原稿MSの撮影対象面(載置面)に対するカメラ200の1回目の撮影角度を推定することができる。撮影角度推定部12は、1回目の撮影角度を推定すると、推定した撮影角度を1回目に撮影された画像データ(対象画像データ)と共に撮影目的判断部13に渡す。
For example, the photographing
撮影目的判断部13は、撮影角度推定部12によって推定された対象画像データの撮影角度に基づいて、原稿MSに対する撮影目的が文書であるか写真であるかを判断する機能を有する。具体的には、図2に示すように、撮影目的判断部13は、撮影角度が原稿MSの撮影対象面に対して特定角度A内(30°〜85°又は−30°〜−85°)である場合に、原稿MSの撮影目的を文書と判断し、特定角度A外(0°〜30°、−0°〜−30°、85°〜90°及び−85°〜−90°のいずれか)である場合に、原稿MSの撮影目的を写真と判断する。
The shooting
例えば、2回目撮影位置のカメラ200−2のように、原稿MSに対してカメラ200−2の撮影角度が垂直(90°)である場合は、撮影目的を写真と判断される。1回目撮影位置のカメラ200−1のように、原稿MSに対してカメラ200−1の撮影角度が30°〜85°の場合は、撮影目的を文書と判断される。図示していないが、原稿MSに対してカメラ200−1の撮影角度が水平(0°、−0°)に近い場合は、文字を判読できない可能性があるため、この場合も撮影目的を写真と判断される。 For example, when the shooting angle of the camera 200-2 is perpendicular (90 °) to the document MS, like the camera 200-2 at the second shooting position, the shooting purpose is determined to be a photograph. When the shooting angle of the camera 200-1 is 30 ° to 85 ° with respect to the document MS, like the camera 200-1 at the first shooting position, the shooting purpose is determined to be a document. Although not shown in the drawing, when the shooting angle of the camera 200-1 with respect to the original MS is close to the horizontal (0 °, −0 °), there is a possibility that the characters cannot be read. It is judged.
なお、ここでは、原稿MSに対する1回目の撮影にユーザーの撮影目的が最も反映されるものとして、カメラ200による1回目の撮影角度を撮影目的の判断基準としている。そのため、原稿MSに対する複数回の撮影のうち、1回目の撮影位置のカメラ200−1における撮影角度が特定角度A内の場合、2回目の撮影位置のカメラ200−2における撮影角度が特定角度A外となっても、撮影目的判断部13は、撮影目的を文書と判断する。反対に、1回目の撮影位置がカメラ200−2の位置である場合には、1回目の撮影角度が特定角度A外となるので、カメラ200の2回目以降の撮影角度に関係なく、撮影目的判断部13は、撮影目的を写真と判断する。なお、2回目以降の撮影を行っているのは、上記の撮影角度推定部12におけるカメラキャリブレーションに複数枚の画像データが必要だからである。そのため、画像データ取得部11に取得させる画像データの枚数も、撮影角度推定部12によるカメラキャリブレーションの精度に応じて決定すればよい。
Here, assuming that the user's shooting purpose is most reflected in the first shooting of the document MS, the first shooting angle by the
撮影目的判断部13は、1回目に撮影された画像データを画像出力部14に渡すと共に、撮影目的を文書と判断した場合には、1回目に撮影された画像データを文書データとして補正させるため補正処理部15にも渡す。撮影目的判断部13は撮影目的を写真と判断した場合には、1回目に撮影された画像データを補正処理部15には渡さず、画像出力部14のみに出力する。
The shooting
補正処理部15は、1回目に撮影された画像データを補正前の画像データ400(図6を参照)として取得し、文書データとして補正する機能を有する。具体的には、補正処理部15は、歪み除去処理部151と、文書領域抽出部152と、台形補正部153と、領域判別部154と、マスク画像生成部155と、編集可能領域算出部156と、配置部157とを有している。
The
歪み除去処理部151は、撮影角度推定部12によるカメラキャリブレーションで取得されたカメラ200の歪み係数を用いて、1回目に撮影された画像データ(図6に示す補正前の画像データ400)に対して歪み除去処理を行う機能を有する。カメラキャリブレーションによって取得される歪み係数は、カメラ200のレンズ特性の歪み係数である。そのため、歪み除去処理部151は、カメラキャリブレーションで取得された歪み係数を用いて、1回目に撮影された画像データにおける湾曲等の歪みを精度良く除去することができる。
The distortion
文書領域抽出部152は、歪み除去処理部151によって歪み除去された画像データ401から文書領域として原稿MSを示す原稿領域画像402を抽出する機能を有する。
The document
台形補正部153は、文書領域抽出部152によって抽出された原稿領域画像402の台形歪み等を補正する機能を有する。カメラ200によって撮影されることで、原稿領域画像402は台形になる等少なからず歪んでいる場合が多い。台形補正部153は、公知の台形歪み補正技術等により、台形の原稿領域画像402を矩形に補正する。
The
領域判別部154は、台形補正された原稿領域画像403に文字認識を行って、原稿領域画像403内の各文字の文字領域Taを判別すると共に、画像解析によって原稿領域画像403内の図領域Zaを判別する機能を有する。例えば、領域判別部154は、文字認識用データ31を参照することで、文字認識を行うことができる。また、領域判別部154は、原稿領域画像403を解析し、図と文字の大きさの違いや、輝度分布、輪郭線検出等の公知技術を用いることで、原稿領域画像403内に含まれる図領域Zaを判別することができる。なお、領域判別部154は、判別した図領域Zaに文字領域Taが含まれる場合には、その文字領域Taを図領域Zaに含めてもよい。領域判別部154は、歪み除去処理部151及び台形補正部153により補正された原稿領域画像403に対して文字認識を行うので、精度良く文字認識を行うことができる。
The
マスク画像生成部155は、領域判別部154により判別が行われた原稿領域画像403をコピーして、図領域Zaと、各文字領域Taとのそれぞれをマスク領域Maによってマスクしたマスク画像404を生成する。また、マスク画像生成部155は、生成したマスク画像404のサイズを予め設定されている出力画像サイズSzに一致するように調整する。出力画像サイズSzは、画像出力部14によって出力される画像データのサイズである。
The mask
編集可能領域算出部156は、出力画像サイズSzにサイズ調整されたマスク画像405内の編集可能領域を算出する機能を有する。
The editable
配置部157は、編集可能領域内のマスク領域Maの識別番号に基づいて、コピー元の原稿領域画像403内の対応する図領域Za及び文字領域Taを特定する。そして、配置部157は、コピー元の原稿領域画像403から対応する図領域Zaを抽出して、マスク領域Maのサイズに合わせて大きさを変形した上で、マスク画像405内の対応するマスク領域Maに配置する。また、配置部157は、コピー元の原稿領域画像403の文字領域に対する文字認識で取得されたテキストデータを、対応するマスク領域Maのサイズに合わせて変形した上でマスク領域Maに配置する。配置部157は、マスク画像405に図領域Zaと文字領域Taに対応するテキストデータとを配置し終えると、補正後の画像データ407として画像出力部14に出力する。
The
画像出力部14は、補正前の画像データ400又は/及び補正後の画像データ407のプレビュー画面を操作表示部4に表示させると共に、画像データの出力方法をユーザーに選択させ、ユーザーによって選択された出力方法で画像データを出力する機能を有する。
The
次に、図3を参照して、画像処理制御部1の画像処理動作について詳細に説明する。 Next, the image processing operation of the image processing control unit 1 will be described in detail with reference to FIG.
ユーザーがカメラ200により原稿MSを複数回異なる方向から撮影すると、カメラ200により生成された画像データがネットワーク300を介して情報処理装置に送信される。情報処理装置の画像データ取得部11が通信部2を介してカメラ200から複数枚の画像データを取得すると(ステップs11)、撮影角度推定部12は、複数枚の画像データに基づいてカメラキャリブレーションを実行する(ステップs12)。カメラキャリブレーションによって、撮影角度推定部12は、複数回異なる位置から撮影された原稿MSに対するカメラ200のそれぞれの撮影位置とカメラ200の歪み係数等とを取得することができる。
When the user photographs the original MS a plurality of times from different directions with the
つづいて、撮影角度推定部12は、カメラキャリブレーションによって判明したカメラ200の1回目の撮影位置に基づいて、原稿MSに対する1回目の撮影角度を推定する(ステップs13)。
Subsequently, the shooting
つづいて、撮影目的判断部13は、推定された撮影角度が図2に示す特定角度A内であるか否かを判断する(ステップs14)。撮影角度が特定角度A内である場合には(ステップs14でYes)、撮影目的判断部13は、撮影目的を文書と判断し(ステップs15)、1回目に撮影された画像データを補正処理部15と画像出力部14にそれぞれ渡す。
Subsequently, the shooting
つづいて、補正処理部15は、撮影目的判断部13から取得した画像データ(補正前の画像データ400)を文書データとして補正する(ステップs16)。なお、補正処理部15の詳細な補正処理の流れについては後述する。
Subsequently, the
一方、撮影角度が特定角度A外である場合(ステップs14でNo)、撮影目的判断部13は、撮影目的を写真と判断し(ステップs17)、1回目に撮影された画像データ(補正前の画像データ400)を補正処理部15には渡さずに画像出力部14のみに渡す。文書データとして補正不要だからである。
On the other hand, when the shooting angle is outside the specific angle A (No in step s14), the shooting
つづいて、画像出力部14は、出力する画像データを操作表示部4にプレビュー表示させる(ステップs18)。撮影目的判断部13が撮影目的を文書と判断した場合、図5に示すように、プレビュー画面G40には、補正前の画像データ400と補正処理部15による補正後の画像データ407とが並んで表示される。ユーザーに補正結果を確認しやすく提示するためである。なお、撮影目的判断部13が撮影目的を写真と判断した場合、プレビュー画面G40には、補正前の画像データ400のみが表示される。
Subsequently, the
プレビュー画面G40には、画像データの出力方法を指定するボタンとして、印刷を指示する印刷ボタンB41、メール送信を指示するメール送信ボタンB42、及び記憶部3内に設けられた特定の記憶領域への保存を指示するBOX保存ボタンB43が設けられている。ユーザーは、操作表示部4を介していずれかのボタンB41、B42、B43を操作することで、印刷、メール送信、BOX保存から出力方法を指定することができる。また、プレビュー画面G40に表示された補正前の画像データ400と補正後の画像データ407のいずれを出力対象とするかユーザーが選択できるようにしてもよい。
On the preview screen G40, as buttons for designating an image data output method, a print button B41 for instructing printing, a mail transmission button B42 for instructing mail transmission, and a specific storage area provided in the
つづいて、画像出力部14は、ユーザーによって指定された出力方法で画像データを出力し(ステップs19)、本処理を終了する。これにより、ユーザーの撮影目的に沿って画像データを文書又は写真として自動的に画像処理して、印刷、メール送信又はボックス保存することができる。
Subsequently, the
次に、図5及び図6を参照して、補正処理部15が1回目に撮影された画像データ(補正前の画像データ400)を文書データとして補正する処理の流れを詳細に説明する。
Next, with reference to FIG. 5 and FIG. 6, the flow of processing in which the
まず、補正処理部15の歪み除去処理部151は、1回目に撮影された画像データを補正前の画像データ400として取得し、撮影角度推定部12におけるカメラキャリブレーションで取得されたカメラ200の歪み係数を用いて、補正前の画像データ400の歪み除去を行う(ステップs161)。これにより、画像データ400からカメラ200のレンズ特性による歪みが除去される。なお、歪み除去処理部151は、撮影目的を文書と判断された場合に限らず、撮影目的を写真と判断された場合に、1回目に撮影された画像データに対する歪み除去処理を行ってもよい。歪み除去処理は、文書データとしての補正だけでなく、写真データとしての補正としても効果的だからである。
First, the distortion
つづいて、文書領域抽出部152は、歪み除去された画像データ401から原稿MSを示す原稿領域画像402を抽出する(ステップs162)。原稿領域画像402は、原稿MSの用紙の輪郭線で囲まれた、原稿MS内の文字、図及び背景を内包した領域の画像である。文書領域抽出部152は、歪み除去された画像データ401から輪郭線(エッジ)を検出して、輪郭線上の1つの点Pを始点として輪郭線上を探索する。そして、文書領域抽出部152は、探索の結果、探索の始点と終点が同一であり、外周が一定の距離以上ある矩形の輪郭線を検出した場合に、この輪郭線により囲まれる閉塞した領域を画像データ401から切り出して、原稿領域画像402として抽出する。これにより、歪み除去された画像データ401から背景領域を除いて、原稿領域画像402のみが抽出される。
Subsequently, the document
つづいて、台形補正部153が、抽出された原稿領域画像402の台形補正を行う(ステップs163)。つづいて、領域判別部154は、台形補正された原稿領域画像403に文字認識を行い(ステップs164)、原稿領域画像403の各文字の文字領域Taを判別すると共に画像解析により図領域Zaを判別する(ステップs165)。
Subsequently, the
つづいて、マスク画像生成部155は、領域判別部154によって判別した図領域Zaと各文字領域Taのそれぞれをマスク領域Maでマスクしたマスク画像404を生成する(ステップs166)。
Subsequently, the mask
マスク領域Maは、例えば黒のベタ塗りで矩形状をしており、原稿領域画像403内の図領域Zaと各文字領域Taのそれぞれの大きさに合わせて生成される。また、マスク領域Maのそれぞれには、マスク画像生成部155により識別番号(例えば、001、002、003、・・・等)の付与等によるラベリングが行われ、コピー元の原稿領域画像403内の図領域Za及び各文字領域Taと対応付けられている。
The mask area Ma has a rectangular shape with, for example, black solid painting, and is generated in accordance with the size of each of the figure area Za and each character area Ta in the
つづいて、マスク画像生成部155は、マスク画像404のサイズ(縦横比)を予め設定されている出力画像サイズSzに一致するように変形させる(ステップs167)。例えば、マスク画像生成部155は、マスク画像404のサイズと出力画像サイズSzを比較し、サイズが異なっている場合には、比率に基づいてマスク画像404のサイズを出力画像サイズSzに一致させるように変更する。
Subsequently, the mask
つづいて、編集可能領域算出部156は、マスク画像405内の編集可能領域を算出する(ステップs168)。これにより、編集可能領域算出部156によって、マスク画像405に含まれる全てのマスク領域Maを内包する最小の矩形状の枠406が生成され、枠406内が編集可能領域として決定される。
Subsequently, the editable
つづいて、配置部157は、マスク画像405内のマスク領域Maに付与された識別番号に基づいて、元の原稿領域画像403内の図領域Zaを配置する(ステップs169)。つづいて、配置部157は、マスク画像405内のマスク領域Maに付与された識別番号に基づいて、領域判別部154による文字認識で取得された、元の原稿領域画像403内の文字領域Taに対応するテキストデータを配置して(ステップs170)、本処理を終了する。なお、配置される図領域Za及びテキストデータは、マスク領域Maのサイズに合わせて大きさが変形される。これにより、1回目に撮影された画像データ(補正前の画像データ400)が文書データとして補正され、補正後の画像データ407が生成される。
Subsequently, the
このように、本実施形態の画像処理装置100は、カメラ200によって同一の原稿MSを複数回異なる方向から撮影した複数枚の画像データを取得する画像データ取得部11と、画像データ取得部11により取得された複数枚の画像データに基づいて、複数枚の画像データの中で対象とする1枚の対象画像データの撮影角度を推定する撮影角度推定部12と、撮影角度推定部12によって推定された撮影角度が特定角度A内である場合に限って、対象画像データから原稿領域画像を抽出し、原稿領域画像の台形補正を行う補正処理部15と、補正処理部15によって補正された対象画像データを出力すると共に、撮影角度推定部12によって推定された撮影角度が特定角度外である場合に、補正処理部15による補正を実行することなく対象画像データを出力する画像出力部14とを備えたことを特徴とする。これにより、画像処理装置100は、ユーザーが撮影した原稿の撮影角度が特定角度A内であった場合に、ユーザーの撮影目的を文書とみなし、特定角度A外であった場合に、ユーザーの撮影目的を写真とみなすことができる。そして、画像処理装置100は、撮影目的が文書の場合に限って対象画像データを補正処理部15により補正し、撮影目的が写真の場合には、補正処理部15による補正を実行しないので、ユーザーの撮影目的に沿って文書又は写真として自動的に画像処理することができる。
As described above, the
本発明は上述した実施の形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々様々に変更が可能であることは言うまでもない。 The present invention is not limited to the above-described embodiment, and it goes without saying that various changes can be made without departing from the spirit of the present invention.
1 画像処理制御部
2 通信部
3 記憶部
4 操作表示部
5 印刷部
6 システムバス
11 画像データ取得部
12 撮影角度推定部
13 撮影目的判断部
14 画像出力部
15 補正処理部
31 文字認識用データ
100 画像処理装置
151 歪み除去処理部
152 文書領域抽出部
153 台形補正部
154 領域判別部
155 マスク画像生成部
156 編集可能領域算出部
157 配置部
200、200−1、200−2 カメラ
300 ネットワーク
400、401 画像データ
402、403 原稿領域画像
404、405 マスク画像
406 枠
407 補正後の画像データ
500 画像処理システム
A 特定角度
B41、B42、B43 ボタン
G40 プレビュー画面
P 点
MS 原稿
Ma マスク領域
Ta 文字領域
Za 図領域
Sz 出力画像サイズ
DESCRIPTION OF SYMBOLS 1 Image
Claims (5)
前記画像データ取得部により取得された前記複数枚の画像データに基づいて、前記複数枚の画像データの中で対象とする1枚の対象画像データの撮影角度を推定する撮影角度推定部と、
前記撮影角度推定部によって推定された前記撮影角度が特定角度内である場合に限って、前記対象画像データから原稿領域画像を抽出し、前記原稿領域画像の台形補正を行う補正処理部と、
前記補正処理部によって補正された前記対象画像データを出力すると共に、前記撮影角度推定部によって推定された前記撮影角度が特定角度外である場合に、前記補正処理部による補正を実行することなく前記対象画像データを出力する画像出力部と
を備えたことを特徴とする画像処理装置。 An image data acquisition unit for acquiring a plurality of image data obtained by photographing the same document from a plurality of different directions by a camera;
A shooting angle estimation unit that estimates a shooting angle of one piece of target image data among the plurality of pieces of image data based on the plurality of pieces of image data acquired by the image data acquisition unit;
A correction processing unit that extracts a document area image from the target image data and corrects the keystone of the document area image only when the shooting angle estimated by the shooting angle estimation unit is within a specific angle;
The target image data corrected by the correction processing unit is output, and when the shooting angle estimated by the shooting angle estimation unit is outside a specific angle, the correction processing unit performs the correction without executing the correction. An image processing apparatus comprising: an image output unit that outputs target image data.
前記複数枚の画像データに基づいて前記カメラのキャリブレーションを行うことで、前記対象画像データの撮影位置を推定し、推定した前記撮影位置に基づいて前記対象画像データの前記撮影角度を推定する
ことを特徴とする請求項1に記載の画像処理装置。 The photographing angle estimation unit
Calibrating the camera based on the plurality of pieces of image data to estimate a shooting position of the target image data, and estimating the shooting angle of the target image data based on the estimated shooting position. The image processing apparatus according to claim 1.
前記撮影角度推定部による前記キャリブレーションを行うことで取得される、前記カメラの歪み係数を用いて、前記対象画像データの歪みを除去する歪み除去処理部を有する
ことを特徴とする請求項2に記載の画像処理装置。 The correction processing unit
The image processing apparatus according to claim 2, further comprising: a distortion removal processing unit that removes distortion of the target image data using a distortion coefficient of the camera acquired by performing the calibration by the imaging angle estimation unit. The image processing apparatus described.
ことを特徴とする請求項1から3までのいずれか1項に記載の画像処理装置。 The image processing apparatus according to any one of claims 1 to 3, wherein the target image data is image data captured for the first time among the plurality of times of imaging by the camera.
ことを特徴とする請求項1から4までのいずれか1項に記載の画像処理装置。 The image processing apparatus according to any one of claims 1 to 4, wherein the specific angle is 30 ° to 85 ° or -30 ° to -85 °.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016250800A JP6708118B2 (en) | 2016-12-26 | 2016-12-26 | Image processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016250800A JP6708118B2 (en) | 2016-12-26 | 2016-12-26 | Image processing device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018106349A true JP2018106349A (en) | 2018-07-05 |
JP6708118B2 JP6708118B2 (en) | 2020-06-10 |
Family
ID=62784687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016250800A Active JP6708118B2 (en) | 2016-12-26 | 2016-12-26 | Image processing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6708118B2 (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09289611A (en) * | 1996-04-23 | 1997-11-04 | Minolta Co Ltd | Digital camera |
JP2000013605A (en) * | 1998-06-18 | 2000-01-14 | Minolta Co Ltd | Image processor, method and record medium recording image processing program |
JP2004288148A (en) * | 2003-03-05 | 2004-10-14 | 3D Media Co Ltd | Image processing method, system and device, and computer program |
JP2006287504A (en) * | 2005-03-31 | 2006-10-19 | Casio Comput Co Ltd | Photography device, method for processing photographed picture, and program |
JP2008288630A (en) * | 2007-05-15 | 2008-11-27 | Funai Electric Co Ltd | Image projector |
-
2016
- 2016-12-26 JP JP2016250800A patent/JP6708118B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09289611A (en) * | 1996-04-23 | 1997-11-04 | Minolta Co Ltd | Digital camera |
JP2000013605A (en) * | 1998-06-18 | 2000-01-14 | Minolta Co Ltd | Image processor, method and record medium recording image processing program |
JP2004288148A (en) * | 2003-03-05 | 2004-10-14 | 3D Media Co Ltd | Image processing method, system and device, and computer program |
JP2006287504A (en) * | 2005-03-31 | 2006-10-19 | Casio Comput Co Ltd | Photography device, method for processing photographed picture, and program |
JP2008288630A (en) * | 2007-05-15 | 2008-11-27 | Funai Electric Co Ltd | Image projector |
Also Published As
Publication number | Publication date |
---|---|
JP6708118B2 (en) | 2020-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9208550B2 (en) | Smart document capture based on estimated scanned-image quality | |
CN110557515B (en) | Image processing apparatus, image processing method, and storage medium | |
US9578195B1 (en) | Automatic scanning of document stack with a camera | |
JP2018107593A (en) | Image processing apparatus, image processing method, and program | |
JP2016167311A (en) | Image processing apparatus and image processing method | |
JP4618153B2 (en) | Image processing apparatus, digital camera, image data structure, printing apparatus with automatic color correction function, method for generating captured image with face object information, and color correction method | |
JP6953178B2 (en) | Image processing device, image processing method, program | |
JP2005208847A (en) | Image defect detecting apparatus and image forming apparatus | |
JP2014123881A (en) | Information processing device, information processing method, and computer program | |
JP6540597B2 (en) | INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, AND PROGRAM | |
JP6708118B2 (en) | Image processing device | |
JP2011145766A (en) | Image processing apparatus, image display system, and image processing method | |
JP2012205089A (en) | Information processing device, information processing method, and information processing program | |
JP6677209B2 (en) | Image processing apparatus, processing method, and program | |
JP6639257B2 (en) | Information processing apparatus and control method therefor | |
EP3240278B1 (en) | Image processing system, image processing apparatus, and image processing method that is configured to output document obtained by portable terminal in page sequence | |
US20160224854A1 (en) | Information processing apparatus, information processing method, and storage medium | |
KR101629418B1 (en) | System and method to get corrected scan image using mobile device camera and scan paper | |
US20170180642A1 (en) | Mobile communication device with document imaging facility and method | |
JP6267520B2 (en) | Image processing apparatus, control method therefor, and image processing system | |
EP3125049A1 (en) | Image processing apparatus and image processing method | |
JP2018026729A (en) | Imaging apparatus, imaging method and imaging program | |
JP2017123561A (en) | Image processing device, image processing method for image processing device, control method for image processing device, and program | |
JP2015099979A (en) | Portable terminal, image processing method, and program | |
TWI578785B (en) | Photographic device and photographic method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181029 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190909 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191029 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191202 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200421 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200504 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6708118 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |