JP2018060392A - Image synthesis device, image synthesis method, and image synthesis system - Google Patents

Image synthesis device, image synthesis method, and image synthesis system Download PDF

Info

Publication number
JP2018060392A
JP2018060392A JP2016197994A JP2016197994A JP2018060392A JP 2018060392 A JP2018060392 A JP 2018060392A JP 2016197994 A JP2016197994 A JP 2016197994A JP 2016197994 A JP2016197994 A JP 2016197994A JP 2018060392 A JP2018060392 A JP 2018060392A
Authority
JP
Japan
Prior art keywords
shooting
character
image
character area
range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016197994A
Other languages
Japanese (ja)
Inventor
歩 橋本
Ayumi Hashimoto
歩 橋本
石井 博
Hiroshi Ishii
石井  博
吉田 淳
Atsushi Yoshida
淳 吉田
雅征 薮内
Masayuki Yabuuchi
雅征 薮内
長瀬 将城
Masashiro Nagase
将城 長瀬
直喜 麻場
Naoki Asaba
直喜 麻場
橋本 英樹
Hideki Hashimoto
英樹 橋本
直輝 郷
Naoteru Go
直輝 郷
木崎 修
Osamu Kizaki
修 木崎
雅文 岸
Masafumi Kishi
雅文 岸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2016197994A priority Critical patent/JP2018060392A/en
Publication of JP2018060392A publication Critical patent/JP2018060392A/en
Pending legal-status Critical Current

Links

Images

Abstract

PROBLEM TO BE SOLVED: To create an image allowing precise recognition of characters by enlargement radiography of a necessary region.SOLUTION: A character area size calculation unit 305 calculates a character area size for each character area included in a photographic image acquired by photographing a prescribed imaging range. An enlargement radiography determination unit 307 determines necessity of enlargement radiography in the prescribed imaging range based on the character area size for each calculated character area. An imaging range determination unit 308 determines an enlargement radiography range based on a character area size for each calculated character area and a position of each character area when the enlargement radiography determination unit 307 determines that enlargement radiography is necessary. An image synthesis unit 309 creates a synthesis image by synthesizing an enlargement radiography image acquired by enlargement radiography of the enlargement radiography area with a photographing image.SELECTED DRAWING: Figure 3

Description

本発明は、画像合成装置、画像合成方法、及び画像合成システムに関する。   The present invention relates to an image composition device, an image composition method, and an image composition system.

原稿台105に載置された原稿や書籍や立体物等の対象物を、原稿台105上方に位置するカメラで撮影し、pdfファイルやjpegファイルなどの画像データとして出力するドキュメントカメラ装置が知られている。   2. Description of the Related Art Document camera devices are known in which a document placed on a document table 105, an object such as a book or a three-dimensional object is photographed by a camera located above the document table 105 and output as image data such as a pdf file or a jpeg file. ing.

ドキュメントカメラ装置は、カメラを用いて広範囲に対象物を撮影しており、一定範囲内に存在する対象物を一括で画像データとして取得することが可能である。そのため、ドキュメントカメラ装置の別の利用形態としてドキュメントカメラ装置を投影装置と接続し、撮影して得られた画像データを連続的に順次スクリーンに投影することでリアルタイムな映像を投影することが可能になる。   The document camera apparatus captures a wide range of objects using a camera, and can acquire objects existing within a certain range as image data in a lump. Therefore, it is possible to project a real-time image by connecting the document camera device to a projection device as another form of use of the document camera device and projecting image data obtained by photographing on the screen sequentially and sequentially. Become.

上述したようにドキュメントカメラ装置は、広範囲に対象物を撮影するため、カメラの位置と対象物の位置とはある程度離れていることが前提となる。そのため、例えば原稿上の小さな文字がはっきりと読める程度に撮影するには解像度が高い高価なカメラを備えている必要があり、全体の高コスト化の問題があった。   As described above, since the document camera apparatus captures an object in a wide range, it is assumed that the position of the camera and the position of the object are separated to some extent. For this reason, for example, in order to capture a small character on a manuscript so that it can be clearly read, it is necessary to provide an expensive camera with high resolution, and there is a problem of increasing the overall cost.

さらに、近年では撮影して得られた画像データに対して文字認識を行ってテキストデータに変換するOCRが利用されるケースが増加している。文字認識をする際は撮影される文字の大きさによって認識率が変化するため、低い解像度のカメラで小さな文字を撮影すると文字認識の精度が低下してしまう問題があった。そのため、ユーザはカメラの倍率を手動で調整する必要があった。   Furthermore, in recent years, there has been an increasing use of OCR that performs character recognition on image data obtained by photographing and converts it to text data. When character recognition is performed, the recognition rate changes depending on the size of the character to be photographed. Therefore, when a small character is photographed with a low-resolution camera, there is a problem in that character recognition accuracy decreases. Therefore, the user has to adjust the magnification of the camera manually.

そこで、特開2006−094082号公報(特許文献1)には、撮影対象の文字の大きさと認識可能な文字サイズを比較して、拡大倍率や解像度を自動調整して複数回撮影し、撮影した結果を合成して十分な精度で文字認識できる画像を出力する技術が開示されている。   Therefore, Japanese Patent Laid-Open No. 2006-094082 (Patent Document 1) compares the size of the character to be photographed with the recognizable character size, automatically adjusts the magnification and resolution, and shoots a plurality of times. A technique for synthesizing the results and outputting an image capable of character recognition with sufficient accuracy is disclosed.

しかし、特許文献1は撮影対象領域全体を同じ拡大倍率で撮影するため、ズームを使用しないで撮影したときに一部の領域の文字だけが認識可能なサイズより小さくなるような場合であっても、その文字が認識可能となるように撮影対象領域全体を拡大撮影する必要があった。
そのため、ズームを使用せずに文字を認識可能な領域であっても、拡大撮影することで撮影回数の無駄が生じてしまうという問題があった。
本発明は、上記に鑑みてなされたもので、その目的は、必要な領域を拡大撮影することで精度の良い文字認識を可能にすることにある。
However, since Patent Document 1 captures the entire area to be photographed at the same magnification, even if characters in only a part of the area are smaller than a recognizable size when photographed without using the zoom. Therefore, it was necessary to magnify the entire area to be photographed so that the characters can be recognized.
For this reason, there is a problem in that the number of times of photographing is wasted by enlarging photographing even in an area where characters can be recognized without using zoom.
The present invention has been made in view of the above, and an object thereof is to enable accurate character recognition by enlarging a necessary area.

請求項1記載の発明は、上記課題を解決するため、所定の撮影範囲を撮影することにより取得した撮影画像に含まれる文字領域毎に文字領域サイズを算出する文字領域サイズ算出部と、前記算出された前記文字領域毎の文字領域サイズに基づいて、前記所定の撮影範囲内の拡大撮影の要否を判定する拡大撮影要否判定部と、前記拡大撮影要否判定部によって拡大撮影が必要である判定された場合に、前記算出された前記文字領域毎の文字領域サイズと前記文字領域毎の位置に基づいて、拡大撮影範囲を決定する撮影範囲決定部と、前記拡大撮影範囲を拡大撮影することにより取得した拡大撮影画像と、前記撮影画像とを合成して合成画像を作成する画像合成部と、を備える。   In order to solve the above problem, the invention according to claim 1 is a character area size calculation unit that calculates a character area size for each character area included in a captured image acquired by capturing a predetermined capturing range, and the calculation Based on the character area size for each of the character areas thus obtained, enlargement shooting is required by the enlargement shooting necessity determination unit that determines the necessity of enlargement shooting within the predetermined shooting range and the enlargement shooting necessity determination unit. When determined, an imaging range determination unit that determines an enlarged imaging range based on the calculated character area size for each of the character areas and a position for each of the character areas, and enlarges the imaging of the enlarged imaging range. And an image composition unit that composes an enlarged photographed image acquired in this manner and the photographed image to create a composite image.

本発明によれば、必要な領域を拡大撮影することで精度の良い文字認識が可能になる。   According to the present invention, it is possible to recognize characters with high accuracy by enlarging a necessary area.

本発明の第1の実施形態に係るに係るドキュメントカメラ装置の全体構成の一例を示す図である。It is a figure which shows an example of the whole structure of the document camera apparatus which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係るドキュメントカメラ装置のハードウェア構成の一例を示す図である。It is a figure which shows an example of the hardware constitutions of the document camera apparatus which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係るドキュメントカメラ装置の機能構成の一例を示す図である。It is a figure which shows an example of a function structure of the document camera apparatus which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る撮影条件テーブルの一例を示す図である。It is a figure which shows an example of the imaging | photography condition table which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る領域分割の一例を示す図である。It is a figure which shows an example of the area | region division which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る画素数情報の算出方法の一例を示す図である。It is a figure which shows an example of the calculation method of the pixel number information which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る倍率テーブルの一例を示す図である。It is a figure which shows an example of the magnification table which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る拡大撮影要否判定部の機能構成の一例を示す図である。It is a figure which shows an example of a function structure of the expansion photographing necessity determination part which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る撮影条件決定部の機能構成の一例を示す図である。It is a figure which shows an example of a function structure of the imaging condition determination part which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る撮影範囲の決定方法を示す図である。It is a figure which shows the determination method of the imaging | photography range which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る撮影条件テーブルの一例を示す図である。It is a figure which shows an example of the imaging | photography condition table which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る文字認識のフローの一例を示す図である。It is a figure which shows an example of the flow of the character recognition which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る拡大撮影の要否判定のフローの一例を示す図である。It is a figure which shows an example of the flow of the necessity determination of the expansion photography which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る撮影条件テーブルの作成フローの一例を示す図である。It is a figure which shows an example of the preparation flow of the imaging condition table which concerns on the 1st Embodiment of this invention. 本発明の第2の実施形態に係る撮影条件決定部の機能構成の一例を示す図である。It is a figure which shows an example of a function structure of the imaging condition determination part which concerns on the 2nd Embodiment of this invention. 本発明の第2の実施形態に係る撮影範囲の決定方法を示す図である。It is a figure which shows the determination method of the imaging | photography range which concerns on the 2nd Embodiment of this invention. 本発明の第2の実施形態に係る撮影条件テーブルの一例を示す図である。It is a figure which shows an example of the imaging | photography condition table which concerns on the 2nd Embodiment of this invention. 本発明の第2の実施形態に係る撮影条件テーブルの作成フローの一例を示す図である。It is a figure which shows an example of the preparation flow of the imaging condition table which concerns on the 2nd Embodiment of this invention. 本発明の第3の実施形態に係るドキュメントカメラ装置の全体構成の一例を示す図である。It is a figure which shows an example of the whole structure of the document camera apparatus which concerns on the 3rd Embodiment of this invention.

以下、図面を参照して、本発明の実施形態に係るドキュメントカメラ装置における撮影手法の具体的な実施形態について説明する。   Hereinafter, with reference to the drawings, a specific embodiment of a photographing technique in the document camera apparatus according to the embodiment of the present invention will be described.

<第一の実施形態>
本実施形態は、撮影して得られた画像データ内の小さい文字列が含まれる一部領域を、拡大撮影して得られた拡大画像データに置き換えることで、後段における文字認識の精度を高めることを可能にする。
<First embodiment>
This embodiment improves the accuracy of character recognition in the subsequent stage by replacing a partial area including a small character string in image data obtained by photographing with enlarged image data obtained by enlarged photographing. Enable.

<ドキュメントカメラ装置>
図1は、第一の本実施形態に係るドキュメントカメラ装置100の全体構成について説明する図である。図1に示すように、本実施形態に係るドキュメントカメラ装置100は、撮影装置101、照明102、撮影対象物を載置するための台である原稿台105、撮影装置101及び照明102を支持する支持部材103、入力I/F104を備えている。
<Document camera device>
FIG. 1 is a diagram illustrating the overall configuration of a document camera device 100 according to the first embodiment. As shown in FIG. 1, a document camera apparatus 100 according to the present embodiment supports a photographing apparatus 101, an illumination 102, a document table 105 that is a table for placing a photographing object, the photographing apparatus 101, and the illumination 102. A support member 103 and an input I / F 104 are provided.

撮影装置101は、原稿台105に載置された対象物を撮影するための装置である。撮影装置101は撮像機構であるCCDセンサやCMOSセンサ等の撮像素子、レンズ機構であるズームレンズやミラー、対象物を撮影して得られた画像を一時記憶するメモリを有している。撮影装置101は、半球面状に自在に回転可能である。   The photographing apparatus 101 is an apparatus for photographing an object placed on the document table 105. The imaging device 101 has an imaging device such as a CCD sensor or a CMOS sensor as an imaging mechanism, a zoom lens or mirror as a lens mechanism, and a memory for temporarily storing an image obtained by imaging an object. The photographing apparatus 101 can freely rotate in a hemispherical shape.

照明102は、LEDランプであり、支持部材に複数個備えられている。入力I/F104は、キーボードやタッチパネルなどによりユーザからの入力を受け付けるインターフェースである。   The illumination 102 is an LED lamp, and a plurality of illumination members 102 are provided on the support member. The input I / F 104 is an interface that accepts input from the user through a keyboard, a touch panel, or the like.

図2は、第一の実施形態に係るドキュメントカメラ装置100のハードウェア構成について説明する図である。本実施形態に係るドキュメントカメラ装置100は、撮影装置101、照明102、入力I/F104、CPU201、RAM202、ROM203、記憶装置204、外部I/F205がそれぞれバスを介して接続されている。   FIG. 2 is a diagram illustrating a hardware configuration of the document camera apparatus 100 according to the first embodiment. In the document camera apparatus 100 according to the present embodiment, a photographing apparatus 101, an illumination 102, an input I / F 104, a CPU 201, a RAM 202, a ROM 203, a storage device 204, and an external I / F 205 are connected via a bus.

CPU201は、ドキュメントカメラ装置100における演算処理装置であり、制御プログラムに従ってドキュメントカメラ装置100全体の動作を制御するとともに、撮影装置101から受け取った画像データに対しての文字認識、画像データに対する画像処理、画像データのフォーマット変換などの処理を行う。本実施形態ではCPU201にて文字認識、画像処理を行うが、その内の一部の処理をASICのようにハードウェアを利用して行うものであっても良いし、外部I/F205を介して外部装置で行うものであっても良い。   The CPU 201 is an arithmetic processing unit in the document camera apparatus 100, controls the overall operation of the document camera apparatus 100 according to a control program, recognizes characters for image data received from the photographing apparatus 101, performs image processing for image data, Performs processing such as image data format conversion. In the present embodiment, the CPU 201 performs character recognition and image processing, but some of the processing may be performed using hardware such as an ASIC, or via the external I / F 205. It may be performed by an external device.

RAM202は、情報を高速で読み書きするための揮発性の記憶媒体であり、CPU201が制御プログラムを実行する際のワークエリアとして機能する。ROM203は制御プログラムが記憶されている読み出し専用の不揮発性の記憶媒体である。   A RAM 202 is a volatile storage medium for reading and writing information at high speed, and functions as a work area when the CPU 201 executes a control program. The ROM 203 is a read-only nonvolatile storage medium in which a control program is stored.

記憶装置204は、例えばHDD(Hard Disk Drive)であって、情報の読み書きが可能な大容量の不揮発性の記憶媒体であり、制御プログラムやアプリケーション等が記憶されている他、各種デバイスから出力される画像データを記憶する。記憶装置204は、SSD(Solid State Drive)などの他の形式の記憶媒体であっても良い。   The storage device 204 is an HDD (Hard Disk Drive), for example, and is a large-capacity nonvolatile storage medium that can read and write information. The storage device 204 stores control programs, applications, and the like, and is output from various devices. Image data to be stored. The storage device 204 may be another type of storage medium such as an SSD (Solid State Drive).

外部I/F205は、LANなどのネットワークに接続するための通信インターフェースであり、PCやスマートフォンなどの外部端末に接続される。外部I/F205は受信機能、送信機能を有しており、外部端末から送られてくる情報を受信する他、記憶装置204に記憶された画像データを送信する。   The external I / F 205 is a communication interface for connecting to a network such as a LAN, and is connected to an external terminal such as a PC or a smartphone. The external I / F 205 has a reception function and a transmission function. In addition to receiving information sent from an external terminal, the external I / F 205 transmits image data stored in the storage device 204.

CPU201は、入力I/F104を介してユーザによって入力された情報を基に、対応する制御プログラムをROM203から読み出して対象となるデバイスを制御する。CPU201は、PCやスマートフォンのような外部端末からの情報を外部I/F205を通して受け取り、対応する制御プログラムをROM203から読み出して対象となるデバイスを制御することも可能である。   Based on information input by the user via the input I / F 104, the CPU 201 reads a corresponding control program from the ROM 203 and controls a target device. The CPU 201 can also receive information from an external terminal such as a PC or a smartphone through the external I / F 205 and read a corresponding control program from the ROM 203 to control a target device.

撮影装置101は、回転可能に装着されており、CPU201からの指示に沿った条件で対象物を撮影する。CPU201から撮影装置101に送られる情報については後に詳しく説明する。撮影された画像データは撮影装置101内のメモリに一時的に記憶され、その後バスを通してRAM202に出力される。照明102はCPU201からの指示に従って点灯・消灯の切り替えが行われる。   The imaging device 101 is rotatably mounted and images an object under conditions in accordance with instructions from the CPU 201. Information sent from the CPU 201 to the photographing apparatus 101 will be described in detail later. The photographed image data is temporarily stored in a memory in the photographing apparatus 101 and then output to the RAM 202 through a bus. The illumination 102 is switched on / off in accordance with an instruction from the CPU 201.

図3は、第一の実施形態に係るドキュメントカメラ装置100の機能構成について説明する図である。図に示す破線で囲まれている処理部はハードウェアであり、図に示す実線で囲まれているそれぞれの処理部はCPU201とROM203とRAM202により実行される処理を機能的に示している。   FIG. 3 is a diagram illustrating a functional configuration of the document camera apparatus 100 according to the first embodiment. The processing units surrounded by broken lines in the figure are hardware, and the respective processing units surrounded by solid lines in the figure functionally indicate processing executed by the CPU 201, ROM 203, and RAM 202.

仲介部301は、入力I/F104や外部I/F205を介して入力される開始指示に沿って撮影条件テーブルを作成し、撮影装置101に出力する。この開始指示は撮影の開始や終了の指示である。その他、仲介部301は入力I/F104や外部I/F205からの終了指示に沿って撮影を終了する終了フラグを撮影装置101に出力する。   The mediation unit 301 creates an imaging condition table according to a start instruction input via the input I / F 104 or the external I / F 205 and outputs the imaging condition table to the imaging apparatus 101. This start instruction is an instruction to start or end shooting. In addition, the mediation unit 301 outputs an end flag for ending the shooting to the image capturing apparatus 101 in accordance with an end instruction from the input I / F 104 or the external I / F 205.

撮影装置101は、仲介部301又は後段で説明する撮影条件決定部308から受け取った撮影条件テーブルを参照して原稿台105に載置された印刷物を撮影し、撮影して得られたデータを所定のデバイスに出力する。   The imaging device 101 refers to an imaging condition table received from the mediation unit 301 or the imaging condition determination unit 308 described later, and images a printed material placed on the document table 105, and sets the data obtained by imaging to a predetermined value. Output to the device.

<撮影条件テーブル>
図4は撮影条件テーブルについて説明する図である。
動作モードは一連の処理内容を示している。「文字認識モード」とは、文字が含まれる対象物を撮影して得られた画像データの一部或いは全部をテキストファイルに再構成する一連の処理を示しており、本実施形態において説明する処理である。動作モードには「文字認識モード」の他、撮影して得られた画像データをそのまま記憶装置204に保存する「通常モード」、撮影した動画を外部I/F205を介して投影装置に接続し、リアルタイムで投影する「投影モード」などがある。撮影装置101は該当のモードで撮影を行う。拡大倍率は拡大撮影するときの拡大倍率を示しており、撮影範囲は撮影する領域を示している。
<Shooting condition table>
FIG. 4 is a diagram for explaining the photographing condition table.
The operation mode indicates a series of processing contents. “Character recognition mode” refers to a series of processes for reconstructing part or all of image data obtained by photographing an object including characters into a text file. The process described in this embodiment It is. In addition to the “character recognition mode” as the operation mode, the “normal mode” in which the image data obtained by shooting is stored in the storage device 204 as it is, the shot video is connected to the projection device via the external I / F 205, There is a “projection mode” that projects in real time. The photographing apparatus 101 performs photographing in a corresponding mode. The enlargement magnification indicates the enlargement magnification when enlarging shooting, and the shooting range indicates the area to be shot.

撮影条件テーブルに入力されている動作モードが「通常モード」である場合、撮影された画像データは記憶装置204に出力される。撮影条件テーブルに入力されている動作モードが「投影モード」である場合、撮影された動画データは順次外部I/F205を介して外部の投影装置に送信される。   When the operation mode input to the shooting condition table is “normal mode”, the shot image data is output to the storage device 204. When the operation mode input to the imaging condition table is “projection mode”, the captured moving image data is sequentially transmitted to an external projection device via the external I / F 205.

撮影条件テーブルに入力されている動作モードが「文字認識モード」であり、入力されている拡大倍率が1倍(ズームを使用しない)である場合、撮影して得られた画像データはプレ画像データとして一時記憶部302に出力される。撮影条件テーブルに入力されている動作モードが「文字認識モード」であり、入力されている拡大倍率が1倍より大きいとき、拡大撮影された画像データは拡大画像データとして一時記憶部302に出力される。   When the operation mode input in the shooting condition table is “character recognition mode” and the input magnification is 1 × (no zoom is used), the image data obtained by shooting is pre-image data. Is output to the temporary storage unit 302. When the operation mode input to the shooting condition table is “character recognition mode” and the input enlargement magnification is greater than 1, the enlarged image data is output to the temporary storage unit 302 as enlarged image data. The

<撮影領域>
図5は、撮影領域について詳しく説明するための図である。
図中の実線枠はズーム無しで撮影したときの撮影領域を示している。図中の点線は拡大倍率2倍で撮影するときに撮影領域の縦横を2分割した状態を示している。このとき、(x1,y1)、(x2,y1)、(x1,y2)、(x2,y2)は拡大撮影するときの撮影範囲を示す領域情報に該当する。領域情報は左から右に位置するにつれて、xn(nは1以上の自然数)のnの値が増加し、上から下に位置するにつれて、yn(nは1以上の自然数)のnの値が増加する。領域情報におけるnの最大数=拡大倍率となる。
<Shooting area>
FIG. 5 is a diagram for explaining the photographing region in detail.
A solid line frame in the figure indicates a shooting area when shooting without zooming. The dotted line in the figure shows a state in which the vertical and horizontal directions of the shooting area are divided into two when shooting at a magnification of 2 times. At this time, (x1, y1), (x2, y1), (x1, y2), and (x2, y2) correspond to region information indicating a photographing range when performing magnified photographing. As the region information is located from left to right, the value of n of xn (n is a natural number of 1 or more) increases, and as it is located from top to bottom, the value of n of yn (n is a natural number of 1 or more) is increased. To increase. The maximum number of n in the area information = enlargement magnification.

撮影装置101には拡大倍率と領域情報に応じた撮影箇所が予め記憶されており、撮影装置101は自身の方向を回転させて領域情報に示された箇所を撮影し、撮影したデータを所定のデバイスに出力する。   The photographing device 101 stores in advance a photographing location corresponding to the enlargement magnification and the region information. The photographing device 101 rotates the direction of itself to photograph the portion indicated by the region information, and the photographed data is stored in a predetermined data. Output to the device.

一時記憶部302は、撮影装置101から送られてくるデータを一時的に記憶する。一時記憶部302は書き換えを高速で行うことが可能な記憶媒体であり、本実施形態ではRAM202に相当する。   The temporary storage unit 302 temporarily stores data sent from the photographing apparatus 101. The temporary storage unit 302 is a storage medium that can be rewritten at high speed, and corresponds to the RAM 202 in the present embodiment.

文字領域判定部304は、一時記憶部302に記憶されているプレ画像データを参照し、例えば特許文献2に記載されている方法を用いて文字領域を抽出する。文字領域とは文字列の外側を囲う領域であり、例えば図6に示すように文字列ABCの外側を囲う四角形に囲まれた領域である。
文字領域サイズ算出部305は、検出された文字領域の大きさを対象となる文字領域毎に画素数情報として算出する。
The character region determination unit 304 refers to the pre-image data stored in the temporary storage unit 302 and extracts a character region using a method described in Patent Document 2, for example. The character area is an area surrounding the outside of the character string, and is an area surrounded by a rectangle surrounding the outside of the character string ABC as shown in FIG. 6, for example.
The character area size calculation unit 305 calculates the size of the detected character area as pixel number information for each target character area.

<画素数情報の算出方法>
図6は、文字領域サイズ算出部305による画素数情報の算出方法について説明する図である。図中の四角形で囲まれている領域Xは、文字領域判定部304によって判定された文字領域である。文字領域サイズ算出部305は、文字領域を形成する四角形の辺に用いられている画素数を比較し、画素数が少ない方の辺の画素数を領域Xの文字領域サイズとして算出する。図では文字領域サイズ算出部305は、a辺(12dot)とb辺(36dot)に用いられている画素数を比較し、a辺に用いられている画素数の方が少ないため、a辺に用いられている画素数12dotを領域Xの文字領域サイズとして算出し、算出した文字領域サイズを領域Xに付与する。プレ画像データに含まれるすべての文字領域に対して文字領域サイズを付与し終えたら、文字領域サイズ算出部305は文字領域サイズが付与されたプレ画像データを拡大撮影要否判定部307へ出力する。
<Calculation method of pixel number information>
FIG. 6 is a diagram for explaining a method for calculating pixel number information by the character area size calculation unit 305. A region X surrounded by a rectangle in the drawing is a character region determined by the character region determination unit 304. The character area size calculation unit 305 compares the number of pixels used for the sides of the rectangle forming the character area, and calculates the number of pixels on the side having the smaller number of pixels as the character area size of the area X. In the figure, the character area size calculation unit 305 compares the number of pixels used for the a side (12 dots) and the b side (36 dots), and the number of pixels used for the a side is smaller. The number of used pixels of 12 dots is calculated as the character area size of the area X, and the calculated character area size is assigned to the area X. When the character area size has been assigned to all the character areas included in the pre-image data, the character area size calculation unit 305 outputs the pre-image data to which the character area size has been assigned to the enlarged shooting necessity determination unit 307. .

サイズ情報記憶部306には画素数毎に適した拡大倍率が倍率テーブルとして記憶されている。画素数毎に適した拡大倍率とは、プレ画像データ上の文字領域に含まれている文字を後段で認識処理する際に、十分な精度を得るのに必要な撮影時の拡大倍率である。文字認識の精度は認識対象となる文字を構成する縦横の画素数に依存しており、拡大倍率を上げるほど撮影領域は狭くなるが、認識対象となる文字を構成する縦横の画素数は多くなる。プレ画像データを撮影するときはズームを使用しておらず、小さな文字を撮影するときは十分な画素数を得られないため、後段で認識処理する際に十分な精度を得られない。そのような小さな文字によって構成される文字領域は、拡大倍率を上げて撮影することで1つの文字に対して十分な画素数を確保することが可能になる。   The size information storage unit 306 stores an enlargement ratio suitable for each number of pixels as a magnification table. The enlargement magnification suitable for each number of pixels is an enlargement magnification at the time of photographing necessary for obtaining sufficient accuracy when a character included in the character area on the pre-image data is recognized later. The accuracy of character recognition depends on the number of vertical and horizontal pixels that make up the character that is to be recognized. The higher the magnification, the narrower the shooting area, but the larger the number of vertical and horizontal pixels that make up the character that is to be recognized. . When photographing pre-image data, zoom is not used, and when photographing a small character, a sufficient number of pixels cannot be obtained, so that sufficient accuracy cannot be obtained at the subsequent recognition processing. A character region composed of such small characters can be secured with a sufficient number of pixels for one character by shooting at a higher magnification.

<倍率テーブル>
図7は倍率テーブルの一例を示す図である。本実施形態では解像度が200dpiに相当する撮影装置101を想定する。図の横の行は撮影時の拡大倍率と、その拡大倍率で撮影したときに後の工程で十分な精度で文字認識可能な最小の文字領域サイズを示している。ここでの最小の文字領域サイズは、ズームを使用しないで撮影した場合の文字領域サイズである。
本実施形態においては後段の処理において十分な精度で認識可能な最小の文字領域サイズは30dot以上と仮定し、29dot以下の文字領域サイズに含まれる文字を認識するときは十分な精度が得られないものと仮定する。拡大倍率が高くなるほど、最小の文字領域サイズが小さくなっているのは、倍率を上げて撮影することで撮影領域が狭くなり、認識対象となる文字の縦横の画素数が多くなるためである。
例えば、ズームを使用しないで撮影したときの文字領域サイズが6dotであった文字領域を、拡大倍率5倍で撮影したときには文字領域サイズは30dotとなり、十分な精度で認識可能な最小の文字領域サイズの下限値を上回っていることがわかる。
<Magnification table>
FIG. 7 shows an example of the magnification table. In the present embodiment, it is assumed that the photographing apparatus 101 has a resolution equivalent to 200 dpi. The horizontal row in the figure shows the enlargement magnification at the time of shooting, and the minimum character area size that can be recognized with sufficient accuracy in a later process when shooting at that magnification. The minimum character area size here is the character area size when the image is taken without using the zoom.
In this embodiment, it is assumed that the minimum character area size that can be recognized with sufficient accuracy in subsequent processing is 30 dots or more, and sufficient accuracy cannot be obtained when characters included in a character area size of 29 dots or less are recognized. Assume that The reason why the minimum character area size is smaller as the enlargement magnification is higher is that shooting with a higher magnification reduces the shooting area and increases the number of vertical and horizontal pixels of the character to be recognized.
For example, when a character area that was 6 dots when photographed without using the zoom was photographed at a magnification of 5 times, the character area size was 30 dots, and the minimum character area size that can be recognized with sufficient accuracy It can be seen that the value exceeds the lower limit of.

拡大撮影要否判定部307は、倍率テーブルを参照して、プレ画像データの対象となる文字領域に対し拡大撮影が必要かどうかの判定を行う。
<拡大撮影要否判定部の動作>
図8は、拡大撮影要否判定部307の機能を示すブロック図である。
比較部307aは、倍率テーブルを参照して、プレ画像データ内の全ての文字領域に対し必要に応じて拡大倍率を示す倍率情報を付与する。倍率情報を付与するか否かの判断方法と、付与する倍率情報の決定方法について具体的に説明する。
比較部307aは、対象となる文字領域の文字領域サイズと十分な精度で認識可能な最小の文字領域サイズ(30dot)とを比較し、対象となる文字領域の文字領域サイズの方が小さい場合は、対象となる文字領域に倍率情報を付与する。比較部307aは、対象となる文字領域の文字領域サイズ以下であり、且つ拡大倍率が最小となる拡大倍率を倍率情報として付与する。
例えば、対象となる文字領域の文字領域サイズが8dotであった場合、比較部307aは十分な精度で認識可能な最小の文字領域サイズが8dot以下であり、且つ拡大倍率が最小となる4倍を倍率情報として付与する。
The enlargement shooting necessity determination unit 307 refers to the magnification table and determines whether or not enlargement shooting is necessary for the character area that is the target of the pre-image data.
<Operation of Enlarged Shooting Necessity Determination Unit>
FIG. 8 is a block diagram illustrating the function of the enlarged shooting necessity determination unit 307.
The comparison unit 307a refers to the magnification table and assigns magnification information indicating an enlargement magnification as necessary to all the character regions in the pre-image data. A method for determining whether or not to apply magnification information and a method for determining the magnification information to be applied will be specifically described.
The comparison unit 307a compares the character area size of the target character area with the minimum character area size (30 dots) that can be recognized with sufficient accuracy, and if the character area size of the target character area is smaller , Magnification information is given to the target character area. The comparison unit 307a assigns, as magnification information, an enlargement magnification that is equal to or smaller than the character area size of the target character area and has the smallest enlargement magnification.
For example, when the character area size of the target character area is 8 dots, the comparison unit 307a reduces the minimum character area size that can be recognized with sufficient accuracy to 8 dots or less and reduces the enlargement magnification to 4 times. It is given as magnification information.

判定部307bは、プレ画像データ内の倍率情報の有無に基づいて、拡大撮影の要否を判定する。具体的には、拡大撮影要否判定部307は、プレ画像データ内の文字領域に倍率情報を有する領域が存在しない場合、拡大撮影が不要と判定し、一方、プレ画像データ内の文字領域に倍率情報を有する領域が存在する場合、拡大撮影が必要と判定する。   The determination unit 307b determines whether enlargement shooting is necessary based on the presence / absence of magnification information in the pre-image data. Specifically, the enlargement shooting necessity determination unit 307 determines that the enlargement shooting is not necessary when there is no area having magnification information in the character area in the pre-image data, and the character area in the pre-image data. If there is an area having magnification information, it is determined that enlarged shooting is necessary.

図3に戻り、撮影条件決定部308は、拡大撮影要否判定部307において拡大撮影が必要と判定された場合、倍率情報に基づいて拡大倍率と拡大撮影する撮影領域が入力された撮影条件テーブルを作成し、撮影装置101に出力する。   Returning to FIG. 3, when the enlargement shooting necessity determination unit 307 determines that the enlargement shooting is necessary, the shooting condition determination unit 308 receives the enlargement magnification and the shooting region to be enlarged based on the magnification information. Is output to the photographing apparatus 101.

<撮影条件決定部>
図9は撮影条件決定部308の機能を示すブロック図である。
領域分割部308aは、プレ画像データに付与された倍率情報の内、最も高い拡大倍率に基づく分割数で、ズームを使用しないで撮影したときの撮影領域を分割する。次に撮影範囲決定部308bは、分割した領域の中に倍率情報が付与された文字領域を含む画素が存在する場合、該当の領域を拡大撮影が必要な領域と判定する。次に作成部308cは、撮影範囲決定部308bによって拡大撮影が必要な領域と判定された領域に対して拡大撮影が実行されるように、撮影条件テーブルを作成する。
<Shooting condition determination unit>
FIG. 9 is a block diagram illustrating functions of the imaging condition determination unit 308.
The area dividing unit 308a divides the shooting area when shooting is performed without using the zoom, with the number of divisions based on the highest magnification among the magnification information given to the pre-image data. Next, when there is a pixel including a character area to which magnification information is added in the divided area, the shooting range determination unit 308b determines that the corresponding area is an area that requires enlarged shooting. Next, the creation unit 308c creates an imaging condition table so that enlarged imaging is performed on an area that is determined to be an area requiring enlarged imaging by the imaging range determination unit 308b.

<撮影範囲の決定方法>
図10は撮影範囲の決定方法について説明する図である。
網点領域は文字領域を示す。倍率情報が付与された文字領域には付与された倍率情報が記載されているが、倍率情報が付与されていない文字領域については何も記載されていない。図の倍率情報で最も高い拡大倍率を示している文字領域の拡大倍率は3倍であり、3倍の拡大倍率で撮影した場合に撮影領域はズームを使用しない場合に比べて縦が1/3、横が1/3になるため、分割数を9とし、領域分割部308aはズームを使用しないで撮影した撮影領域を、点線で区切られた9つの領域に分割する。
図では(x3,y1)、(x3,y2)、(x1,y3)、(x2,y3)、(x3,y3)が領域中に文字領域を有しており、撮影範囲決定部308bはそれらの領域を拡大撮影が必要な領域と判定する。作成部308cは倍率情報と撮影範囲を示す(x3,y1)、(x3,y2)、(x1,y3)、(x2,y3)、(x3,y3)を撮影条件テーブルに入力し、動作モードには「文字認識モード」を入力する。図11はこのとき撮影装置101に出力される情報を示す撮影条件テーブルを示している。
<How to determine the shooting range>
FIG. 10 is a diagram for explaining a method of determining a shooting range.
A halftone dot region indicates a character region. Although the assigned magnification information is described in the character area to which the magnification information is assigned, nothing is described about the character area to which the magnification information is not given. The enlargement magnification of the character area indicating the highest enlargement magnification in the magnification information in the figure is 3 times, and when shooting at a magnification of 3 times, the shooting area is 1/3 as long as when the zoom is not used. Since the width is 1/3, the number of divisions is set to 9, and the area dividing unit 308a divides a shooting area shot without using zoom into nine areas divided by dotted lines.
In the figure, (x3, y1), (x3, y2), (x1, y3), (x2, y3), (x3, y3) have character areas in the area, and the shooting range determination unit 308b This area is determined to be an area that requires enlarged shooting. The creation unit 308c inputs (x3, y1), (x3, y2), (x1, y3), (x2, y3), (x3, y3) indicating the magnification information and the shooting range to the shooting condition table, and operates the operation mode. Enter "Character recognition mode". FIG. 11 shows a photographing condition table showing information output to the photographing apparatus 101 at this time.

図3に戻り、画像合成部309は、拡大撮影要否判定部307によって拡大撮影が必要と判定された場合、一時記憶部302に記憶されたプレ画像データを拡大する。次に、拡大されたプレ画像データの一部の領域を、撮影装置101から一時記憶部302に記憶される拡大画像データ又は拡大画像データの一部の領域に置き換え、プレ画像データと拡大画像データとを合成した合成画像データを作成する。したがって、拡大画像データの領域は元のプレ画像データの領域と比較して高解像度な画像が得られる。   Returning to FIG. 3, the image composition unit 309 enlarges the pre-image data stored in the temporary storage unit 302 when the enlarged shooting necessity determination unit 307 determines that the enlarged shooting is necessary. Next, the partial area of the enlarged pre-image data is replaced with the enlarged image data or the partial area of the enlarged image data stored in the temporary storage unit 302 from the photographing apparatus 101, and the pre-image data and the enlarged image data To create composite image data. Therefore, a higher-resolution image can be obtained in the enlarged image data area than in the original pre-image data area.

文字認識部310は、拡大撮影要否判定部307によって拡大撮影が必要と判定された場合、合成画像データに対して文字認識処理を行い、テキストデータを作成する。拡大撮影要否判定部307によって拡大撮影が不要と判定された場合、文字認識部310はプレ画像データに対して文字認識処理を行い、テキストデータを作成する。文字認識処理は例えばOCR(Optical Character Reader)によって行われる。文字認識部310は合成画像データ又はプレ画像データのすべての画素に対して文字認識処理を行っても良いが、文字領域判定部304によって判定された文字領域に対してのみ文字認識処理を行うことで処理速度を向上させることが可能である。   When the enlargement photographing necessity determination unit 307 determines that enlargement photographing is necessary, the character recognition unit 310 performs character recognition processing on the composite image data to create text data. When the enlargement shooting necessity determination unit 307 determines that enlargement shooting is not necessary, the character recognition unit 310 performs character recognition processing on the pre-image data to create text data. Character recognition processing is performed by, for example, OCR (Optical Character Reader). The character recognition unit 310 may perform character recognition processing on all pixels of the composite image data or the pre-image data, but performs character recognition processing only on the character region determined by the character region determination unit 304. It is possible to improve the processing speed.

画像変換部311は、文字認識部310で文字認識が行われた合成画像データ又はプレ画像データの一方と、文字認識部310により作成されたテキストデータとを合成した後に、所定のファイルフォーマットに変換して記憶装置204に記憶する。データの合成は合成画像データ又はプレ画像データの一部を、テキストデータを参照して置き換えることにより行われる。変換先のファイルフォーマットはユーザによって指定可能であり、pdfファイルやjpegファイル等である。   The image conversion unit 311 combines one of the composite image data or the pre-image data that has been subjected to character recognition by the character recognition unit 310 and the text data created by the character recognition unit 310, and then converts the data into a predetermined file format. And stored in the storage device 204. Data synthesis is performed by replacing a part of synthesized image data or pre-image data with reference to text data. The file format of the conversion destination can be specified by the user, such as a pdf file or a jpeg file.

<ドキュメントカメラ装置の動作>
図12は、本実施形態に係るドキュメントカメラ装置100の処理のフローチャートである。
S101で入力I/F104または外部I/F205を介して撮影開始の指示が入力されると、S102で、仲介部301は指示に基づいて撮影条件テーブルを作成して撮影装置101に出力する。撮影装置101は、S102で作成された撮影条件テーブルを参照して原稿台105に置かれた対象物を撮影する。
次に、仲介部301は、撮影開始時の動作モードを判定する(S103)。
S103で撮影が開始されると、撮影されて得られた画像データ又は映像データは撮影条件テーブル内の動作モードによって異なる場所に送信される。
受け取った撮影条件テーブル内の動作モードが「通常モード」のとき(S103、通常モード)はS113へ進み、S113では撮影された画像データを記憶装置204に記憶して処理を終了する。受け取った撮影条件テーブル内の動作モードが「投影モード」のとき(S103、投影モード)はS114へ進み、S114では撮影している動画データを外部I/F205を介してリアルタイムで送信する。S115で撮影装置101が仲介部301から終了フラグを受け取ると、投影装置は撮影を終了し、処理を終了する。S115で撮影装置101が仲介部301から終了フラグを受け取っていない場合、映像データの送信を続行する。
<Operation of document camera device>
FIG. 12 is a flowchart of processing of the document camera apparatus 100 according to the present embodiment.
When an instruction to start photographing is input via the input I / F 104 or the external I / F 205 in S101, the mediation unit 301 creates a photographing condition table based on the instruction and outputs the photographing condition table to the photographing apparatus 101 in S102. The photographing apparatus 101 photographs the object placed on the document table 105 with reference to the photographing condition table created in S102.
Next, the mediation unit 301 determines an operation mode at the start of shooting (S103).
When shooting is started in S103, image data or video data obtained by shooting is transmitted to a different place depending on the operation mode in the shooting condition table.
When the received operation mode in the imaging condition table is “normal mode” (S103, normal mode), the process proceeds to S113, and in S113, the captured image data is stored in the storage device 204, and the process ends. When the operation mode in the received shooting condition table is “projection mode” (S103, projection mode), the process proceeds to S114, and in S114, moving image data being shot is transmitted in real time via the external I / F 205. When the imaging apparatus 101 receives an end flag from the mediation unit 301 in S115, the projection apparatus ends imaging and ends the process. If the photographing apparatus 101 has not received an end flag from the mediation unit 301 in S115, transmission of video data is continued.

動作モードが「文字認識モード」である場合(S103、文字認識モード)は、撮影された画像データをプレ画像データとして一時記憶部302に出力してS105へ進む。S105では文字領域判定部304が一時記憶部302に記憶されているプレ画像データを参照し、プレ画像データ内の文字領域を判定する。   When the operation mode is “character recognition mode” (S103, character recognition mode), the captured image data is output to the temporary storage unit 302 as pre-image data, and the process proceeds to S105. In S105, the character area determination unit 304 refers to the pre-image data stored in the temporary storage unit 302, and determines a character area in the pre-image data.

S106で、文字領域サイズ算出部305は、S105で判定されたプレ画像データ内の全ての文字領域に対して画素数情報を付与し、S107に進む。S107で、拡大撮影要否判定部307は、倍率テーブルとプレ画像データに付与された全ての画素数情報を比較し、後段で精度良く文字認識をするための拡大撮影が必要か否かを判定する。S107で拡大撮影が必要でないと判定された場合(S107、No)はS111へ進む。S107で拡大撮影が必要であると判定された場合(S107、Yes)はS108へ進む。
S108で、撮影条件決定部308は、拡大撮影する際の撮影条件テーブルを作成し、撮影装置101に出力する。S109で、撮影装置101は、S108で受け取った撮影条件テーブルを参照して拡大撮影を行い、得られた拡大画像データを一時記憶部302に出力する。
S110で、画像合成部309は、プレ画像データと拡大画像データとを合成して合成画像データを作成する。S111で、文字認識部310は、合成画像データ又はプレ画像データに対して文字認識を行い、テキストデータを作成する。S112で、画像変換部311は、S111で文字認識処理の対象となった合成画像データ又はプレ画像データとS111で作成されたテキストデータとを合成し、指定されたファイルフォーマットに変換して変換データを作成する。
In S106, the character area size calculation unit 305 assigns pixel number information to all the character areas in the pre-image data determined in S105, and the process proceeds to S107. In step S107, the enlargement shooting necessity determination unit 307 compares the magnification table and all the pixel number information added to the pre-image data, and determines whether enlargement shooting for accurate character recognition in the subsequent stage is necessary. To do. If it is determined in S107 that enlargement shooting is not required (S107, No), the process proceeds to S111. If it is determined in S107 that enlarged shooting is necessary (S107, Yes), the process proceeds to S108.
In step S <b> 108, the shooting condition determination unit 308 creates a shooting condition table for enlarged shooting and outputs the table to the shooting apparatus 101. In step S <b> 109, the photographing apparatus 101 performs enlarged photographing with reference to the photographing condition table received in step S <b> 108, and outputs the obtained enlarged image data to the temporary storage unit 302.
In S110, the image composition unit 309 composes pre-image data and enlarged image data to create composite image data. In S111, the character recognition unit 310 performs character recognition on the composite image data or the pre-image data, and creates text data. In S112, the image conversion unit 311 synthesizes the composite image data or pre-image data that has been subjected to character recognition processing in S111 and the text data created in S111, converts the data into a designated file format, and converts the converted data. Create

<拡大撮影要否判定部の動作>
図13は、拡大撮影要否判定部307によるS107のフローをより具体的に説明するフローチャートである。
S201で、比較部307aは倍率テーブルを参照する。S202で、比較部307aは対象となる文字領域の文字領域サイズと十分な精度で認識可能な最小の文字領域サイズとを比較し、最小の文字領域サイズ以上であった場合(S202、Yes)はS205へ進み、最小の文字領域サイズ未満であった場合(S202、No)はS203へ進む。
S203で、比較部307aは対象となる文字領域の文字領域サイズ以下且つ拡大倍率が最小となる拡大倍率を対象となる文字領域の倍率情報として付与し、S204へ進む。
S204で、プレ画像データ内のすべての文字領域に対してS202の処理を終えたか判断し、すべての文字領域に対して処理を終えている場合(S204、Yes)はS205へ進み、まだ処理を終えていない文字領域が存在する場合(S204、No)はS202に戻る。
S205で、判定部307bは倍率情報が付与された文字領域が存在するかどうかを判定する。プレ画像データ内の文字領域に倍率情報を有する領域が存在しない場合(S205、No)はS206へ進み、判定部307bは拡大撮影が不要と判定し処理を終了する。プレ画像データ内の文字領域に倍率情報を有する領域が存在する場合(S205、Yes)はS207へ進み、判定部307bは拡大撮影が必要と判定し処理を終了する。
<Operation of Enlarged Shooting Necessity Determination Unit>
FIG. 13 is a flowchart for more specifically explaining the flow of S107 by the enlargement photographing necessity determination unit 307.
In S201, the comparison unit 307a refers to the magnification table. In S202, the comparison unit 307a compares the character area size of the target character area with the minimum character area size that can be recognized with sufficient accuracy, and if it is equal to or larger than the minimum character area size (S202, Yes). The process proceeds to S205, and if it is less than the minimum character area size (S202, No), the process proceeds to S203.
In step S203, the comparison unit 307a assigns an enlargement magnification that is equal to or smaller than the character area size of the target character area and has the smallest enlargement magnification as magnification information of the target character area, and proceeds to step S204.
In S204, it is determined whether or not the process of S202 has been completed for all character areas in the pre-image data. If the process has been completed for all character areas (Yes in S204), the process proceeds to S205 and the process is still performed. If there is an unfinished character area (S204, No), the process returns to S202.
In S205, the determination unit 307b determines whether there is a character area to which the magnification information is added. If there is no area having the magnification information in the character area in the pre-image data (S205, No), the process proceeds to S206, and the determination unit 307b determines that the enlarged shooting is unnecessary and ends the process. If there is an area having magnification information in the character area in the pre-image data (S205, Yes), the process proceeds to S207, and the determination unit 307b determines that enlargement shooting is necessary and ends the process.

<撮影条件決定部の動作>
図14は撮影条件決定部308によるS108のフローをより具体的に説明するフローチャートである。
S301では、領域分割部308aはプレ画像データに付与された倍率情報の内、最大の拡大倍率に基づく分割数で撮影領域を分割する。
S302では、撮影範囲決定部308bは分割した領域の中に倍率情報が付与された文字領域を含む画素が存在する場合、該当の領域を拡大撮影が必要な領域と決定する。
S303では、作成部308cは撮影条件テーブルの動作モードには「文字認識モード」、拡大倍率にはS301で判定された最大の拡大倍率、撮影範囲にはS302で決定された拡大撮影が必要な領域情報を入力し、撮影装置101に撮影条件テーブルを出力して処理を終了する。
<Operation of shooting condition determination unit>
FIG. 14 is a flowchart for more specifically explaining the flow of S108 by the imaging condition determination unit 308.
In S301, the area dividing unit 308a divides the shooting area by the number of divisions based on the maximum magnification among the magnification information given to the pre-image data.
In S302, when there is a pixel including a character area to which magnification information is added in the divided area, the imaging range determination unit 308b determines that the area is an area that needs to be enlarged.
In S303, the creation unit 308c sets the “character recognition mode” as the operation mode of the shooting condition table, the maximum magnification determined in S301 as the magnification, and the area that requires the magnification determined in S302 as the shooting range. The information is input, the photographing condition table is output to the photographing apparatus 101, and the process ends.

以上のように、本実施形態に係るドキュメントカメラ装置100によれば、ズームを使用しないで撮影したプレ画像データから拡大撮影が必要な領域を判断し、該当の領域を拡大撮影した拡大画像データを画像データと合成することで、精度良く文字認識することができる合成画像を作成することが可能になる。   As described above, according to the document camera device 100 according to the present embodiment, the area that needs to be enlarged is determined from the pre-image data that is taken without using the zoom, and the enlarged image data obtained by enlarging the corresponding area is obtained. By combining with image data, it is possible to create a composite image that can accurately recognize characters.

<第2の実施形態>
第1の実施形態に係るドキュメントカメラ装置100では動作モードが「文字認識モード」である場合、必要に応じて一定の拡大倍率で予め定められた領域の内、指定された領域を拡大撮影して得られた拡大画像データを後段の文字認識処理に用いることで精度良く文字認識を行っていた。
これに対して、本実施形態に係るドキュメントカメラ装置100では1種類以上の拡大倍率で指定された領域を拡大撮影して得られた拡大画像データを後段の文字認識処理に用いる形態について説明する。尚、以下には第1の実施形態と異なる事項について説明を行う。
<Second Embodiment>
In the document camera apparatus 100 according to the first embodiment, when the operation mode is the “character recognition mode”, the designated area is magnified and photographed in a predetermined area at a constant magnification as necessary. The obtained enlarged image data is used for character recognition processing in the subsequent stage, thereby performing character recognition with high accuracy.
On the other hand, in the document camera device 100 according to the present embodiment, a mode in which enlarged image data obtained by enlarging an area designated at one or more types of enlargement magnifications is used in the subsequent character recognition processing will be described. Note that items different from the first embodiment will be described below.

<撮影条件決定部>
図15は、本実施形態に係る撮影条件決定部308の機能構成を示す図である。
領域抽出部308dは、プレ画像データに付与された倍率情報の内、最も高い拡大倍率を示す倍率情報が付与された文字領域を抽出する。ここで抽出される文字領域は1つであり、最も高い拡大倍率が付与された文字領域が複数ある場合は原点座標に近い方の文字領域を抽出する。
撮影範囲決定部308eは、抽出された文字領域の構成画素が最も多く含まれ、且つ可能であれば撮影領域内に倍率情報が付与された他の文字領域の構成画素が多く含まれる撮影範囲の中心の位置座標を決定する。このときの撮影範囲は抽出された文字領域に付与された拡大倍率で撮影した場合の範囲である。抽出された文字領域が撮影範囲に全て収まらない場合、撮影範囲が連続するように複数の位置座標を決定する。
<Shooting condition determination unit>
FIG. 15 is a diagram illustrating a functional configuration of the imaging condition determination unit 308 according to the present embodiment.
The area extracting unit 308d extracts a character area to which magnification information indicating the highest magnification is given from the magnification information given to the pre-image data. The number of character areas extracted here is one, and when there are a plurality of character areas to which the highest magnification is given, the character area closer to the origin coordinate is extracted.
The shooting range determination unit 308e includes a shooting range that includes the largest number of constituent pixels of the extracted character area and, if possible, includes a large number of constituent pixels of other character areas to which magnification information is added. Determine the center position coordinates. The shooting range at this time is a range when shooting is performed at an enlargement magnification assigned to the extracted character area. When all the extracted character areas do not fit within the shooting range, a plurality of position coordinates are determined so that the shooting range is continuous.

さらに領域抽出部308dは、プレ画像データから既に撮影範囲と判定された領域を除いた領域に構成画素を有する文字領域の内、最も高い拡大倍率を示す倍率情報が付与された文字領域を識別する。
以後、領域識別部308dと撮影範囲決定部308eは倍率情報が付与された文字領域の構成画素が全て撮影範囲に収まるまで同様の処理フローを繰り返し行う。
Further, the region extraction unit 308d identifies a character region to which magnification information indicating the highest magnification is given from among character regions having constituent pixels in the region excluding the region already determined as the shooting range from the pre-image data. .
Thereafter, the area identification unit 308d and the shooting range determination unit 308e repeatedly perform the same processing flow until all the constituent pixels of the character area to which the magnification information is added fall within the shooting range.

<撮影範囲決定部>
図16は、撮影範囲決定部308eによる撮影範囲の中心の位置座標の決定方法について説明する図である。
図16では、プレ画像データに付与された倍率情報の内、最も高い拡大倍率を示す倍率情報が付与された文字領域は文字領域2と文字領域3の2箇所あり、領域抽出部308dはその内の1つである文字領域2を抽出する。文字領域2の周囲には倍率情報が付与され且つ撮影範囲に含まれていない文字領域が存在しないため、撮影範囲決定部308eは文字領域2のみを含む拡大倍率3倍の撮影範囲であるA領域の中心座標を撮影範囲の中心の位置座標として決定する。
ここで、文字領域2の周囲とは文字領域2を含む領域の集合であり、例えば文字領域2の左上の座標にA領域の左上の座標を合わせたときのA領域と、文字領域2の右上の座標にA領域の右上の座標を合わせたときのA領域と、文字領域2の左下の座標にA領域の左下の座標を合わせたときのA領域と、文字領域2の右下の座標にA領域の右下の座標を合わせたときのA領域との集合によって表される領域などである。
<Shooting range determination unit>
FIG. 16 is a diagram illustrating a method for determining the position coordinates of the center of the shooting range by the shooting range determination unit 308e.
In FIG. 16, among the magnification information given to the pre-image data, there are two character areas to which the magnification information indicating the highest magnification is given, the character area 2 and the character area 3, and the area extraction unit 308d 1 is extracted. Since there is no character area that is provided with magnification information and is not included in the shooting range around the character area 2, the shooting range determination unit 308 e has an A area that is a shooting range with a magnification of 3 × that includes only the character area 2. Is determined as the position coordinate of the center of the imaging range.
Here, the periphery of the character area 2 is a set of areas including the character area 2. For example, the A area when the upper left coordinates of the A area are aligned with the upper left coordinates of the character area 2, and the upper right of the character area 2. The A area when the upper right coordinates of the A area are aligned with the coordinates of the A area, the A area when the lower left coordinates of the A area are aligned with the lower left coordinates of the character area 2, and the lower right coordinates of the character area 2 An area represented by a set with the A area when the lower right coordinates of the A area are combined.

次に、領域抽出部308dはA領域を除いた領域の中で最も高い拡大倍率を示す文字領域3を抽出する。文字領域3の周囲には倍率情報が付与されており、且つ既に決定された撮影範囲に含まれていない文字領域である文字領域4が存在するため、領域抽出部308dは文字領域3と文字領域4を含む拡大倍率3倍の撮影範囲であるB領域の中心座標を撮影範囲の中心の位置座標として決定する。文字領域2と文字領域3に付与されている倍率情報は同倍率であるため、抽出の順番はどちらが先であっても構わない。このように、撮影範囲決定部308eは複数の文字領域同士の位置関係に基づいて撮影範囲を決定する。   Next, the area extracting unit 308d extracts the character area 3 that shows the highest magnification among the areas excluding the A area. Since the magnification information is given around the character area 3 and there is a character area 4 which is a character area that is not included in the already determined shooting range, the area extraction unit 308d determines that the character area 3 and the character area 4 is determined as the position coordinates of the center of the shooting range. Since the magnification information given to the character area 2 and the character area 3 is the same magnification, whichever comes first in the extraction order. As described above, the shooting range determination unit 308e determines the shooting range based on the positional relationship between the plurality of character areas.

次に、A領域とB領域を除いた領域の中で最も高い拡大倍率を示す文字領域5を抽出する。文字領域5の周囲には倍率情報が付与され且つ既に決定された撮影範囲に含まれていない文字領域が存在しないため、撮影範囲決定部308eは文字領域5のみを含む拡大倍率2倍の撮影範囲であるC領域の中心座標を撮影範囲の中心の位置座標として決定する。   Next, the character area 5 showing the highest magnification is extracted from the areas excluding the A area and the B area. Since there is no character area around the character area 5 to which magnification information is assigned and which is not included in the already determined shooting range, the shooting range determination unit 308e has a shooting range with a magnification ratio of 2 including only the character area 5. Is determined as the position coordinate of the center of the imaging range.

このように、領域抽出部308dは既に撮影範囲として決定された領域を除いた領域の中で最大の倍率情報が付与されている文字領域を抽出し、次に抽出された文字領域を含む周囲に倍率情報が付与され且つ既に決定された撮影範囲に含まれていない文字領域が存在するかどうかを判断し、存在する場合はその文字領域を含むように撮影範囲を決定する。領域抽出部308dは、倍率情報が付与された全ての文字領域が撮影範囲に含まれるまで、一連の処理を繰り返し行う。尚、本実施形態において対象となる文字領域の一部のみが撮影範囲に含まれている場合、対象となる文字領域の残りの部分は撮影範囲に含まれていないものとみなす。   As described above, the area extracting unit 308d extracts the character area to which the maximum magnification information is assigned from the areas excluding the area that has already been determined as the shooting range, and then around the area including the extracted character area. It is determined whether or not there is a character area to which magnification information is assigned and which is not included in the already determined shooting range, and if it exists, the shooting range is determined so as to include the character area. The area extraction unit 308d repeats a series of processes until all the character areas to which the magnification information is added are included in the shooting range. In the present embodiment, when only a part of the target character area is included in the shooting range, it is assumed that the remaining part of the target character area is not included in the shooting range.

その他、領域抽出部308dにおける撮影範囲の決定方法として、最大の倍率情報が付与されている文字領域を中心として周辺探索を行い、既に決定された撮影範囲に含まれていない倍率情報を含む文字領域の含有率が最大となる状態を撮影範囲として決定しても良い。   In addition, as a method of determining the shooting range in the area extraction unit 308d, a character area including magnification information that is not included in the already determined shooting range is searched around the character area to which the maximum magnification information is assigned. The state in which the content ratio of the maximum value may be determined as the imaging range.

作成部308fは、A領域の中心座標である(200,100)と、B領域の中心座標である(500,100)と、C領域の中心座標である(550,300)と、それぞれの領域の撮影倍率を示す倍率情報を撮影条件テーブルに入力し、動作モードには「文字認識モード」を入力する。
<撮影条件テーブル>
図17は、このとき撮影装置101に出力される情報を示す撮影条件テーブルである。
撮影装置101は、撮影条件テーブルを参照し、入力されている座標が中心点となるようレンズを回転させ、入力されている倍率で撮影範囲を拡大撮影する。
The creation unit 308f displays the center coordinates of the A area (200, 100), the center coordinates of the B area (500, 100), and the center coordinates of the C area (550, 300). The magnification information indicating the shooting magnification is input to the shooting condition table, and “character recognition mode” is input as the operation mode.
<Shooting condition table>
FIG. 17 is a photographing condition table showing information output to the photographing apparatus 101 at this time.
The imaging apparatus 101 refers to the imaging condition table, rotates the lens so that the input coordinates become the center point, and enlarges the imaging range with the input magnification.

<撮影条件決定部の処理>
図18は、本実施形態に係る撮影条件決定部308の処理フローを説明するフローチャートである。図18は、図13に示すS108における処理に該当する。
S401で、領域抽出部308dは最大の拡大倍率が付与されている文字領域を抽出する。S402で、撮影範囲決定部308eは抽出された文字領域を含み、且つ可能であれば撮影範囲内に倍率情報が付与された他の文字領域の構成画素が多く含まれる撮影範囲の中心の位置座標を決定する。
S403で、領域抽出部308dは倍率情報が付与されている全ての文字領域を構成する画素が撮影範囲に含まれているか確認する。S403で撮影範囲外に倍率情報が付与されている文字領域の構成画素が存在する場合(S403、No)、S404へ進む。
S404で、領域抽出部308dは撮影範囲として決定した領域以外で最大の拡大倍率が付与されている文字領域を抽出する。S404で抽出を終えたらS402に戻る。
S403で、撮影範囲外に倍率情報が付与されている文字領域の構成画素が存在しない場合(S403、Yes)、S405へ進み、作成部308fは撮影条件テーブルを作成し、撮影装置101に撮影条件テーブルを出力して処理を終了する。
<Processing of shooting condition determination unit>
FIG. 18 is a flowchart for explaining the processing flow of the imaging condition determination unit 308 according to this embodiment. FIG. 18 corresponds to the processing in S108 shown in FIG.
In S401, the region extraction unit 308d extracts a character region to which the maximum enlargement factor is assigned. In S402, the shooting range determination unit 308e includes the extracted character area, and if possible, the position coordinates of the center of the shooting range in which many constituent pixels of other character areas to which magnification information is added are included in the shooting range. To decide.
In step S403, the area extraction unit 308d confirms whether the pixels included in all the character areas to which the magnification information is added are included in the shooting range. If there is a constituent pixel of the character area to which the magnification information is added outside the shooting range in S403 (S403, No), the process proceeds to S404.
In step S404, the area extraction unit 308d extracts a character area to which the maximum enlargement magnification is given, other than the area determined as the shooting range. When the extraction is completed in S404, the process returns to S402.
In S403, when there is no constituent pixel of the character area to which the magnification information is added outside the shooting range (S403, Yes), the process proceeds to S405, and the creation unit 308f creates a shooting condition table, and the shooting apparatus 101 stores the shooting condition. Output the table and finish the process.

以上のように、本実施形態に係るドキュメントカメラ装置100によれば、ズームを使用しないで撮影したプレ画像データから拡大撮影が必要な領域を判断し、該当の領域を拡大撮影した拡大画像データを画像データと合成することで、精度良く文字認識することができる合成画像を作成することが可能になる。   As described above, according to the document camera device 100 according to the present embodiment, the area that needs to be enlarged is determined from the pre-image data that is taken without using the zoom, and the enlarged image data obtained by enlarging the corresponding area is obtained. By combining with image data, it is possible to create a composite image that can accurately recognize characters.

また、第1の実施形態と比較して、条件に応じた複数の拡大倍率で撮影することで、より効率良く少ない撮影回数でプレ画像データよりも精度良く文字認識することができる合成画像を作成することが可能になる。   Compared to the first embodiment, by shooting at a plurality of magnifications according to the conditions, a composite image can be created that can recognize characters more accurately than pre-image data with a lower number of shootings more efficiently. It becomes possible to do.

また、第1の実施形態と比較して、倍率情報が付与された文字領域が複数含まれるように撮影範囲を決定するため、より効率良く少ない撮影回数でプレ画像データよりも精度良く文字認識することができる合成画像を得ることが可能になる。   Compared with the first embodiment, since the shooting range is determined so as to include a plurality of character areas to which magnification information is added, the character recognition is performed more efficiently than the pre-image data with a smaller number of shooting times. A composite image that can be obtained can be obtained.

<第3の実施形態>
第1の実施形態及び第2の実施形態に係るドキュメントカメラ装置100では、撮影装置101を回転させることで指定の箇所を拡大撮影していた。
これに対して、本実施形態に係るドキュメントカメラ装置900では平面方向に自由に移動可能な可動式原稿台106を用いることで、指定の箇所を拡大撮影する形態について説明する。尚、以下には第1の実施形態及び第2の実施形態と異なる事項について説明を行う。
<Third Embodiment>
In the document camera device 100 according to the first embodiment and the second embodiment, the designated portion is magnified by rotating the photographing device 101.
On the other hand, the document camera apparatus 900 according to the present embodiment will be described with respect to a mode in which a designated portion is magnified by using the movable document table 106 that is freely movable in the plane direction. In the following, items different from those in the first embodiment and the second embodiment will be described.

図19は、図1における固定式の原稿台105の代わりに、平面方向に自由に移動可能な可動式原稿台106を用いて指定の箇所を拡大撮影する第3の実施形態の全体構成について説明する図である。
本実施形態では、CPU201が撮影条件テーブルに入力されている撮影範囲を参照し、入力されている撮影範囲の中心が撮影装置101の真下に位置するように可動式原稿台106を可動制御し、撮影装置101は撮影条件テーブルに入力されている拡大倍率で撮影する。
FIG. 19 illustrates the overall configuration of the third embodiment in which a specified portion is enlarged and photographed using a movable document table 106 that is freely movable in the plane direction instead of the fixed document table 105 in FIG. It is a figure to do.
In the present embodiment, the CPU 201 refers to the shooting range input in the shooting condition table, and controls the movable document table 106 so that the center of the input shooting range is located directly below the shooting apparatus 101. The image capturing apparatus 101 captures an image with an enlargement magnification input in the image capturing condition table.

以上のように、本実施形態に係るドキュメントカメラ装置900によれば、ズームを使用しないで撮影したプレ画像データから拡大撮影が必要な領域を判断し、該当の領域を拡大撮影した拡大画像データを画像データと合成することで、精度良く文字認識することができる合成画像を作成することが可能になる。   As described above, according to the document camera apparatus 900 according to the present embodiment, the area that needs to be enlarged is determined from the pre-image data that is taken without using the zoom, and the enlarged image data obtained by enlarging the corresponding area is obtained. By combining with image data, it is possible to create a composite image that can accurately recognize characters.

また、第1の実施形態及び第2の実施形態と比較して、指定の箇所が撮影装置101の真下に位置するように可動式原稿台106を可動制御することで、より歪みの少ない拡大画像を取得することができ、文字認識の精度が向上する。   Compared with the first embodiment and the second embodiment, the movable original table 106 is movably controlled so that the designated portion is located directly below the photographing apparatus 101, so that an enlarged image with less distortion is obtained. And the accuracy of character recognition is improved.

以上、本発明の具体的な実施形態について説明したが、上述した実施形態は本発明の一例を示したものである。本発明は、上述した実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で様々な変形や変更を加えて具体化することができる。   While specific embodiments of the present invention have been described above, the above-described embodiments are examples of the present invention. The present invention is not limited to the above-described embodiments, and can be embodied with various modifications and changes without departing from the scope of the invention in the implementation stage.

<本発明の実施態様例の構成、作用、効果>
<第1態様>
本態様のドキュメントカメラ装置100(画像合成装置)は、所定の撮影範囲を撮影することにより取得した撮影画像に含まれる文字領域毎に文字領域サイズを算出する文字領域サイズ算出部305と、算出された文字領域毎の文字領域サイズに基づいて、所定の撮影範囲内の拡大撮影の要否を判定する拡大撮影要否判定部307と、拡大撮影要否判定部307によって拡大撮影が必要である判定された場合に、算出された文字領域毎の文字領域サイズと文字領域毎の位置に基づいて、拡大撮影範囲を決定する撮影範囲決定部308bと、拡大撮影範囲を拡大撮影することにより取得した拡大撮影画像と、撮影画像とを合成して合成画像を作成する画像合成部309と、を備える。
本態様によれば、文字領域サイズ算出部305が、所定の撮影範囲を撮影することにより取得した撮影画像に含まれる文字領域毎に文字領域サイズを算出する。拡大撮影要否判定部307が、算出された文字領域毎の文字領域サイズに基づいて、所定の撮影範囲内の拡大撮影の要否を判定する。撮影範囲決定部308bが、拡大撮影要否判定部307によって拡大撮影が必要である判定された場合に、算出された文字領域毎の文字領域サイズと文字領域毎の位置に基づいて、拡大撮影範囲を決定する。画像合成部309が、拡大撮影範囲を拡大撮影することにより取得した拡大撮影画像と、撮影画像とを合成して合成画像を作成する。
これにより、必要な領域を拡大撮影することで精度の良い文字認識が可能になる。
<Configuration, operation and effect of exemplary embodiment of the present invention>
<First aspect>
The document camera device 100 (image composition device) of this aspect is calculated with a character region size calculation unit 305 that calculates a character region size for each character region included in a captured image acquired by capturing a predetermined capturing range. Based on the character area size for each character area, an enlarged shooting necessity determination unit 307 that determines whether or not enlargement shooting is necessary within a predetermined shooting range, and an enlargement shooting necessity determination unit 307 determine that enlargement shooting is necessary. In this case, based on the calculated character area size for each character area and the position for each character area, the image capturing range determination unit 308b that determines the enlargement image capturing range, and the enlargement acquired by enlarging the image capturing area. An image composition unit 309 that composes the photographed image and the photographed image to create a composite image;
According to this aspect, the character region size calculation unit 305 calculates the character region size for each character region included in the captured image acquired by capturing a predetermined capturing range. Based on the calculated character area size for each character area, the magnified shooting necessity determination unit 307 determines whether or not expansion shooting within a predetermined shooting range is necessary. When the shooting range determining unit 308b determines that the enlarged shooting is necessary by the enlarged shooting necessity determination unit 307, the enlarged shooting range is determined based on the calculated character region size for each character region and the position for each character region. To decide. The image composition unit 309 synthesizes an enlarged photographed image acquired by enlarging the enlarged photographing range and the photographed image to create a composite image.
This makes it possible to recognize characters with high accuracy by enlarging a necessary area.

<第2態様>
本態様の拡大撮影要否判定部307は、算出された最小の文字領域サイズが所定値より小さい場合に、拡大撮影が必要であると判定する。
本態様によれば、拡大撮影要否判定部307が、算出された最小の文字領域サイズが所定値より小さい場合に、拡大撮影が必要であると判定するので、必要な領域を拡大撮影することができ、精度の良い文字認識が可能になる。
<Second aspect>
The magnified shooting necessity determination unit 307 according to this aspect determines that the magnified shooting is necessary when the calculated minimum character area size is smaller than a predetermined value.
According to this aspect, since the magnified shooting necessity determination unit 307 determines that the magnified shooting is necessary when the calculated minimum character area size is smaller than the predetermined value, the necessary area is magnified. This enables accurate character recognition.

<第3態様>
本態様の撮影範囲決定部308bは、所定の撮影範囲を分割した領域に所定値より小さい文字領域サイズの文字領域が含まれる場合に、分割した領域を拡大撮影範囲として決定する。
本態様によれば、撮影範囲決定部308bが、所定の撮影範囲を分割した領域に所定値より小さい文字領域サイズの文字領域が含まれる場合に、分割した領域を拡大撮影範囲として決定するので、必要な領域を拡大撮影することができ、精度の良い文字認識が可能になる。
<Third aspect>
The shooting range determination unit 308b according to this aspect determines the divided area as the enlarged shooting range when a character area having a character area size smaller than a predetermined value is included in the area obtained by dividing the predetermined shooting range.
According to this aspect, the shooting range determination unit 308b determines the divided area as the enlarged shooting range when a character area having a character area size smaller than a predetermined value is included in the area obtained by dividing the predetermined shooting range. The necessary area can be enlarged and the character recognition can be performed with high accuracy.

<第4態様>
本態様の撮影条件決定部308は、文字領域サイズ算出部305により算出された最小の文字領域サイズに基づいて、所定の撮影範囲の分割数を決定する。
本態様によれば、撮影条件決定部308が、文字領域サイズ算出部305により算出された最小の文字領域サイズに基づいて、所定の撮影範囲の分割数を決定するので、決定された分割数に応じて分割した領域を拡大撮影範囲として決定するので、必要な領域を拡大撮影することができ、精度の良い文字認識が可能になる。
<4th aspect>
The shooting condition determination unit 308 of this aspect determines the number of divisions of a predetermined shooting range based on the minimum character region size calculated by the character region size calculation unit 305.
According to this aspect, the shooting condition determination unit 308 determines the number of divisions of the predetermined shooting range based on the minimum character region size calculated by the character region size calculation unit 305. Accordingly, the divided area is determined as the enlarged photographing range, so that the necessary area can be enlarged and the character recognition can be performed with high accuracy.

<第5態様>
本態様の撮影範囲決定部308eは、複数の文字領域同士の位置関係に基づいて拡大撮影範囲を決定することを特徴とする。
本態様によれば、撮影範囲決定部308eは、複数の文字領域同士の位置関係に基づいて拡大撮影範囲を決定するので、決定された拡大撮影範囲に応じて必要な領域を拡大撮影することができ、精度の良い文字認識が可能になる。
<5th aspect>
The shooting range determination unit 308e of this aspect determines an enlarged shooting range based on the positional relationship between a plurality of character areas.
According to this aspect, since the imaging range determination unit 308e determines the enlarged imaging range based on the positional relationship between the plurality of character areas, it is possible to enlarge the necessary area according to the determined enlarged imaging range. This enables accurate character recognition.

<第6態様>
本態様の画像合成部309は、撮影画像の一部の領域を、該撮影画像の一部の領域に対応する拡大撮影画像又は該拡大撮影画像の一部の領域の解像度を保持したまま置き換えて合成画像を作成する。
本態様によれば、画像合成部309が、撮影画像の一部の領域を、該撮影画像の一部の領域に対応する拡大撮影画像又は該拡大撮影画像の一部の領域の解像度を保持したまま置き換えて合成画像を作成するので、拡大画像データの領域は元のプレ画像データの領域と比較して高解像度な画像が得られる。
<Sixth aspect>
The image composition unit 309 of this aspect replaces a partial area of the captured image while maintaining the resolution of the enlarged captured image corresponding to the partial area of the captured image or the partial area of the enlarged captured image. Create a composite image.
According to this aspect, the image composition unit 309 holds a partial area of the captured image as an enlarged captured image corresponding to the partial area of the captured image or the resolution of the partial area of the enlarged captured image. Since the composite image is created by replacing the image as it is, an enlarged image data area can be obtained with a higher resolution than the original pre-image data area.

<第7態様>
本態様のドキュメントカメラ装置100(画像合成装置)は、合成画像に対して文字認識処理を施す文字認識部310をさらに備える。
本態様によれば、文字認識部310が、合成画像に対して文字認識処理を施すので、文字認識の精度が向上する。
<Seventh aspect>
The document camera apparatus 100 (image composition apparatus) of this aspect further includes a character recognition unit 310 that performs character recognition processing on the composite image.
According to this aspect, since the character recognition unit 310 performs character recognition processing on the composite image, the accuracy of character recognition is improved.

<第8態様>
本態様の画像合成方法は、所定の撮影範囲を撮影することにより取得した撮影画像に含まれる文字領域毎に文字領域サイズを算出する文字領域サイズ算出ステップ(S106)と、算出された文字領域毎の文字領域サイズに基づいて、所定の撮影範囲内の拡大撮影の要否を判定する拡大撮影要否判定ステップ(S107)と、拡大撮影要否判定ステップ(S107)によって拡大撮影が必要である判定された場合に、算出された文字領域毎の文字領域サイズと文字領域毎の位置に基づいて、拡大撮影範囲を決定する撮影範囲決定ステップ(S302)と、拡大撮影範囲を拡大撮影することにより取得した拡大撮影画像と、撮影画像とを合成して合成画像を作成する画像合成ステップ(S110)と、を実行する。
本態様によれば、文字領域サイズ算出ステップ(S106)にて、所定の撮影範囲を撮影することにより取得した撮影画像に含まれる文字領域毎に文字領域サイズを算出する。拡大撮影要否判定ステップ(S107)にて、算出された文字領域毎の文字領域サイズに基づいて、所定の撮影範囲内の拡大撮影の要否を判定する。撮影範囲決定ステップ(S302)にて、拡大撮影要否判定ステップ(S107)によって拡大撮影が必要である判定された場合に、算出された文字領域毎の文字領域サイズと文字領域毎の位置に基づいて、拡大撮影範囲を決定する。画像合成ステップ(S110)にて、拡大撮影範囲を拡大撮影することにより取得した拡大撮影画像と、撮影画像とを合成して合成画像を作成する。
これにより、必要な領域を拡大撮影することで精度の良い文字認識が可能になる。
<Eighth aspect>
The image composition method of this aspect includes a character area size calculating step (S106) for calculating a character area size for each character area included in a captured image acquired by capturing a predetermined capturing range, and for each calculated character area. Based on the character area size, an enlarged shooting necessity determination step (S107) for determining whether or not enlargement shooting is required within a predetermined shooting range and an enlargement shooting necessity determination step (S107) determine that enlargement shooting is necessary. In this case, an imaging range determination step (S302) for determining an enlarged imaging range based on the calculated character area size for each character area and a position for each character area, and acquisition by enlarging the enlarged imaging range. An image composition step (S110) is performed in which the enlarged photographed image and the photographed image are synthesized to create a composite image.
According to this aspect, in the character area size calculating step (S106), the character area size is calculated for each character area included in the photographed image acquired by photographing the predetermined photographing range. In the enlargement shooting necessity determination step (S107), the necessity of enlargement shooting within a predetermined shooting range is determined based on the calculated character area size for each character area. When it is determined in the shooting range determination step (S302) that enlargement shooting is necessary in the enlargement shooting necessity determination step (S107), based on the calculated character area size for each character area and the position for each character area. To determine the magnified shooting range. In the image composition step (S110), a magnified image obtained by enlarging the magnified photographing range is combined with the photographed image to create a composite image.
This makes it possible to recognize characters with high accuracy by enlarging a necessary area.

<第9態様>
本態様のドキュメントカメラ装置100(画像合成システム)は、所定の撮影範囲を撮影した撮影画像又は所定の撮影範囲を拡大撮影した拡大撮影画像を取得する撮影装置101(撮影部)と、
撮影画像に含まれる文字領域毎に文字領域サイズを算出する文字領域サイズ算出部305と、
算出された文字領域毎の文字領域サイズに基づいて、所定の撮影範囲内の拡大撮影の要否を判定する拡大撮影要否判定部307と、拡大撮影要否判定部307によって拡大撮影が必要である判定された場合に、算出された文字領域毎の文字領域サイズと文字領域毎の位置に基づいて、拡大撮影範囲を決定する撮影範囲決定部308bと、拡大撮影範囲を拡大撮影することにより取得した拡大撮影画像と、撮影画像とを合成して合成画像を作成する画像合成部309と、を備える。
本態様によれば、撮影装置101(撮影部)が、所定の撮影範囲を撮影した撮影画像又は所定の撮影範囲を拡大撮影した拡大撮影画像を取得する。文字領域サイズ算出部305が、撮影画像に含まれる文字領域毎に文字領域サイズを算出する。拡大撮影要否判定部307が、算出された文字領域毎の文字領域サイズに基づいて、所定の撮影範囲内の拡大撮影の要否を判定する。撮影範囲決定部308bが、拡大撮影要否判定部307によって拡大撮影が必要である判定された場合に、算出された文字領域毎の文字領域サイズと文字領域毎の位置に基づいて、拡大撮影範囲を決定する。画像合成部309が、拡大撮影範囲を拡大撮影することにより取得した拡大撮影画像と、撮影画像とを合成して合成画像を作成する。
これにより、必要な領域を拡大撮影することで精度の良い文字認識が可能になる。
<Ninth aspect>
The document camera device 100 (image composition system) of this aspect includes a photographing device 101 (photographing unit) that acquires a photographed image obtained by photographing a predetermined photographing range or an enlarged photographed image obtained by enlarging a predetermined photographing range
A character area size calculation unit 305 that calculates a character area size for each character area included in the captured image;
Based on the calculated character area size for each character area, the enlarged shooting necessity determination unit 307 for determining whether or not the enlarged shooting is necessary within the predetermined shooting range and the enlarged shooting necessity determination unit 307 require the enlarged shooting. If a certain determination is made, an image capturing range determination unit 308b that determines an enlarged image capturing range based on the calculated character region size for each character region and a position for each character region, and an enlarged image capturing range are acquired by performing an image capturing operation. And an image composition unit 309 that synthesizes the enlarged image and the photographed image to create a composite image.
According to this aspect, the imaging device 101 (imaging unit) acquires a captured image obtained by photographing a predetermined photographing range or an enlarged photographed image obtained by enlarging a predetermined photographing range. A character area size calculation unit 305 calculates a character area size for each character area included in the captured image. Based on the calculated character area size for each character area, the magnified shooting necessity determination unit 307 determines whether or not expansion shooting within a predetermined shooting range is necessary. When the shooting range determining unit 308b determines that the enlarged shooting is necessary by the enlarged shooting necessity determination unit 307, the enlarged shooting range is determined based on the calculated character region size for each character region and the position for each character region. To decide. The image composition unit 309 synthesizes an enlarged photographed image acquired by enlarging the enlarged photographing range and the photographed image to create a composite image.
This makes it possible to recognize characters with high accuracy by enlarging a necessary area.

100、900…ドキュメントカメラ装置、101…撮影装置、102…照明、103…支持部材、104…入力I/F、105…原稿台、106…可動式原稿台、201…CPU、202…RAM、203…ROM、204…記憶装置、205…外部I/F、301…仲介部、302…一時記憶部、304…文字領域判定部、305…文字領域サイズ算出部、306…サイズ情報記憶部、307…拡大撮影要否判定部、308…撮影条件決定部、309…画像合成部、310…文字認識部、311…画像変換部 DESCRIPTION OF SYMBOLS 100, 900 ... Document camera apparatus, 101 ... Shooting apparatus, 102 ... Illumination, 103 ... Supporting member, 104 ... Input I / F, 105 ... Original plate, 106 ... Movable original plate, 201 ... CPU, 202 ... RAM, 203 ... ROM, 204 ... storage device, 205 ... external I / F, 301 ... mediation section, 302 ... temporary storage section, 304 ... character area determination section, 305 ... character area size calculation section, 306 ... size information storage section, 307 ... Enlarged shooting necessity determination unit, 308... Shooting condition determination unit, 309... Image composition unit, 310... Character recognition unit, 311.

特開2006−094082公報JP 2006-094082 A 特開2005−301672公報JP 2005-301672 A

Claims (9)

所定の撮影範囲を撮影することにより取得した撮影画像に含まれる文字領域毎に文字領域サイズを算出する文字領域サイズ算出部と、
前記算出された前記文字領域毎の文字領域サイズに基づいて、前記所定の撮影範囲内の拡大撮影の要否を判定する拡大撮影要否判定部と、
前記拡大撮影要否判定部によって拡大撮影が必要である判定された場合に、前記算出された前記文字領域毎の文字領域サイズと前記文字領域毎の位置に基づいて、拡大撮影範囲を決定する撮影範囲決定部と、
前記拡大撮影範囲を拡大撮影することにより取得した拡大撮影画像と、前記撮影画像とを合成して合成画像を作成する画像合成部と、
を備える画像合成装置。
A character area size calculating unit that calculates a character area size for each character area included in a captured image acquired by photographing a predetermined photographing range;
Based on the calculated character area size for each of the character areas, an enlarged shooting necessity determination unit that determines whether enlargement shooting is required within the predetermined shooting range;
Shooting that determines an enlarged shooting range based on the calculated character area size for each character area and the position for each character area when the enlarged shooting necessity determination unit determines that enlargement shooting is necessary. A range determination unit;
An image composition unit that composes an enlarged photographed image obtained by enlarging the magnified photographing range and the photographed image to create a composite image;
An image synthesizing apparatus.
前記拡大撮影要否判定部は、前記算出された最小の文字領域サイズが所定値より小さい場合に、拡大撮影が必要であると判定する請求項1に記載の画像合成装置。   The image synthesizing apparatus according to claim 1, wherein the enlargement photographing necessity determination unit determines that enlargement photographing is necessary when the calculated minimum character area size is smaller than a predetermined value. 前記撮影範囲決定部は、前記所定の撮影範囲を分割した領域に所定値より小さい文字領域サイズの文字領域が含まれる場合に、前記分割した領域を前記拡大撮影範囲として決定する請求項1に記載の画像合成装置。   The said imaging | photography range determination part determines the said divided | segmented area | region as said enlarged imaging | photography range, when the area | region which divided | segmented the said predetermined | prescribed imaging | photography range contains the character area of a character area size smaller than predetermined value. Image synthesizer. 前記文字領域サイズ算出部により算出された最小の文字領域サイズに基づいて、前記所定の撮影範囲の分割数を決定する撮影条件決定部を備える請求項3に記載の画像合成装置。   The image synthesizing apparatus according to claim 3, further comprising a shooting condition determining unit that determines the number of divisions of the predetermined shooting range based on a minimum character region size calculated by the character region size calculating unit. 前記撮影範囲決定部は、複数の文字領域同士の位置関係に基づいて前記拡大撮影範囲を決定することを特徴とする請求項1又は2に記載の画像合成装置。   The image synthesizing apparatus according to claim 1, wherein the shooting range determination unit determines the enlarged shooting range based on a positional relationship between a plurality of character areas. 前記画像合成部は、前記撮影画像の一部の領域を、該撮影画像の一部の領域に対応する前記拡大撮影画像又は該拡大撮影画像の一部の領域の解像度を保持したまま置き換えて合成画像を作成する請求項1乃至5の何れか一項に記載の画像合成装置。   The image composition unit replaces a part of the photographed image with the resolution of the enlarged photographed image corresponding to the part of the photographed image or the part of the magnified photographed image being retained, and composes it. The image composition device according to any one of claims 1 to 5, which creates an image. 前記合成画像に対して文字認識処理を施す文字認識部をさらに備える請求項1乃至6の何れか一項に記載の画像合成装置。   The image synthesizing apparatus according to claim 1, further comprising a character recognition unit that performs character recognition processing on the synthesized image. 所定の撮影範囲を撮影することにより取得した撮影画像に含まれる文字領域毎に文字領域サイズを算出する文字領域サイズ算出ステップと、
前記算出された前記文字領域毎の文字領域サイズに基づいて、前記所定の撮影範囲内の拡大撮影の要否を判定する拡大撮影要否判定ステップと、
前記拡大撮影要否判定ステップによって拡大撮影が必要である判定された場合に、前記算出された前記文字領域毎の文字領域サイズと前記文字領域毎の位置に基づいて、拡大撮影範囲を決定する撮影範囲決定ステップと、
前記拡大撮影範囲を拡大撮影することにより取得した拡大撮影画像と、前記撮影画像とを合成して合成画像を作成する画像合成ステップと、
を実行する画像合成方法。
A character region size calculating step for calculating a character region size for each character region included in a captured image acquired by capturing a predetermined capturing range;
An enlarged shooting necessity determination step for determining whether or not enlargement photographing within the predetermined photographing range is necessary based on the calculated character region size for each character region;
Shooting for determining an enlarged shooting range based on the calculated character area size for each character area and the position for each character area when it is determined in the enlargement shooting necessity determination step that enlargement shooting is necessary. A range determination step;
An image synthesis step of creating a synthesized image by synthesizing the enlarged photographed image acquired by enlarging the magnified photographing range and the photographed image;
The image composition method to execute.
所定の撮影範囲を撮影した撮影画像又は前記所定の撮影範囲を拡大撮影した拡大撮影画像を取得する撮影部と、
前記撮影画像に含まれる文字領域毎に文字領域サイズを算出する文字領域サイズ算出部と、
前記算出された前記文字領域毎の文字領域サイズに基づいて、前記所定の撮影範囲内の拡大撮影の要否を判定する拡大撮影要否判定部と、
前記拡大撮影要否判定部によって拡大撮影が必要である判定された場合に、前記算出された前記文字領域毎の文字領域サイズと前記文字領域毎の位置に基づいて、拡大撮影範囲を決定する撮影範囲決定部と、
前記拡大撮影範囲を拡大撮影することにより取得した拡大撮影画像と、前記撮影画像とを合成して合成画像を作成する画像合成部と、
を備える画像合成システム。
A photographing unit that obtains a photographed image obtained by photographing a predetermined photographing range or an enlarged photographed image obtained by enlarging the predetermined photographing range;
A character area size calculation unit for calculating a character area size for each character area included in the captured image;
Based on the calculated character area size for each of the character areas, an enlarged shooting necessity determination unit that determines whether enlargement shooting is required within the predetermined shooting range;
Shooting that determines an enlarged shooting range based on the calculated character area size for each character area and the position for each character area when the enlarged shooting necessity determination unit determines that enlargement shooting is necessary. A range determination unit;
An image composition unit that composes an enlarged photographed image obtained by enlarging the magnified photographing range and the photographed image to create a composite image;
An image composition system comprising:
JP2016197994A 2016-10-06 2016-10-06 Image synthesis device, image synthesis method, and image synthesis system Pending JP2018060392A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016197994A JP2018060392A (en) 2016-10-06 2016-10-06 Image synthesis device, image synthesis method, and image synthesis system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016197994A JP2018060392A (en) 2016-10-06 2016-10-06 Image synthesis device, image synthesis method, and image synthesis system

Publications (1)

Publication Number Publication Date
JP2018060392A true JP2018060392A (en) 2018-04-12

Family

ID=61910031

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016197994A Pending JP2018060392A (en) 2016-10-06 2016-10-06 Image synthesis device, image synthesis method, and image synthesis system

Country Status (1)

Country Link
JP (1) JP2018060392A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11012585B2 (en) 2018-08-10 2021-05-18 Ricoh Company, Ltd. Image processing apparatus, image processing system, image processing method, and non-transitory computer-readable storage medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11012585B2 (en) 2018-08-10 2021-05-18 Ricoh Company, Ltd. Image processing apparatus, image processing system, image processing method, and non-transitory computer-readable storage medium

Similar Documents

Publication Publication Date Title
US20230094025A1 (en) Image processing method and mobile terminal
JP4341629B2 (en) Imaging apparatus, image processing method, and program
JP4363151B2 (en) Imaging apparatus, image processing method thereof, and program
JP4556813B2 (en) Image processing apparatus and program
US20100225785A1 (en) Image processor and recording medium
JP5378135B2 (en) Image layout determining method, program thereof, and information processing apparatus
JP2011147109A (en) Image capturing apparatus and image processing apparatus
CN112367459B (en) Image processing method, electronic device, and non-volatile computer-readable storage medium
JP2012249070A (en) Imaging apparatus and imaging method
JP2007266667A (en) Camera-equipped mobile apparatus, control method thereof, and photographing support method thereof
WO2022161260A1 (en) Focusing method and apparatus, electronic device, and medium
JP6584237B2 (en) Control device, control method, and program
JP2017143354A (en) Image processing apparatus and image processing method
CN108810326B (en) Photographing method and device and mobile terminal
JP2005275447A (en) Image processing device, image processing method and program
JP2018060392A (en) Image synthesis device, image synthesis method, and image synthesis system
JP4934992B2 (en) Image processing apparatus, electronic camera, and image processing program
JP2010200360A (en) Imaging apparatus, stroboscopic image generation method, and program
JP6213470B2 (en) Image processing apparatus, imaging apparatus, and program
JP2006287365A (en) Digital camera
JP4363153B2 (en) Imaging apparatus, image processing method thereof, and program
JP6545229B2 (en) IMAGE PROCESSING APPARATUS, IMAGING APPARATUS, CONTROL METHOD OF IMAGE PROCESSING APPARATUS, AND PROGRAM
JP5098917B2 (en) Composition determination apparatus, composition determination method, and program
RU2792413C1 (en) Image processing method and mobile terminal
JP4591343B2 (en) Image processing apparatus, imaging apparatus, image processing method, and program