JPWO2017126072A1 - Image recognition system, camera state estimation device, and storage medium - Google Patents

Image recognition system, camera state estimation device, and storage medium Download PDF

Info

Publication number
JPWO2017126072A1
JPWO2017126072A1 JP2017511354A JP2017511354A JPWO2017126072A1 JP WO2017126072 A1 JPWO2017126072 A1 JP WO2017126072A1 JP 2017511354 A JP2017511354 A JP 2017511354A JP 2017511354 A JP2017511354 A JP 2017511354A JP WO2017126072 A1 JPWO2017126072 A1 JP WO2017126072A1
Authority
JP
Japan
Prior art keywords
camera
image
target
detection target
camera state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017511354A
Other languages
Japanese (ja)
Other versions
JP6393409B2 (en
Inventor
健一 米司
健一 米司
英克 高田
英克 高田
森田 健一
健一 森田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPWO2017126072A1 publication Critical patent/JPWO2017126072A1/en
Application granted granted Critical
Publication of JP6393409B2 publication Critical patent/JP6393409B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/633Control of cameras or camera modules by using electronic viewfinders for displaying additional information relating to control or operation of the camera
    • H04N23/635Region indicators; Field of view indicators
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • H04N23/661Transmitting camera control signals through networks, e.g. control via the Internet

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Studio Devices (AREA)
  • Image Analysis (AREA)

Abstract

カメラと、カメラ状態推定装置と、を有する画像認識システムであって、カメラ状態推定装置は、検知対象の画像の特徴量と、検知対象の実空間における大きさと、カメラの状態を示すパラメータの推定値と、を保持し、カメラによって撮影された画像から、特徴量に基づいて、検知対象と類似する対象を抽出し、検知対象の実空間における大きさと、パラメータの推定値と、類似する対象の画像内の位置及び大きさと、に基づいて、パラメータの推定値の誤差の大きさを示す指標を計算し、計算された誤差の大きさを示す指標が所定の条件を満たさない場合に、パラメータの推定値を変更する。An image recognition system having a camera and a camera state estimation device, wherein the camera state estimation device estimates a feature amount of an image to be detected, a size of the detection target in real space, and a parameter indicating a camera state And a target similar to the detection target is extracted from the image captured by the camera based on the feature amount, the size of the detection target in the real space, the estimated value of the parameter, and the similar target Based on the position and size in the image, an index indicating the magnitude of the error of the parameter estimation value is calculated, and when the calculated index indicating the magnitude of error does not satisfy the predetermined condition, Change the estimate.

Description

本発明は、カメラによって撮影された画像からカメラの状態を推定する技術に関する。   The present invention relates to a technique for estimating the state of a camera from an image taken by the camera.

本発明の背景技術として、特開2008−275391号公報(特許文献1)に開示された技術がある。この公報には、「一つ以上の計測対象物体を撮像する撮像装置と計測対象物体との間の相対的な位置姿勢を、計測対象物体の3次元モデルを利用して計測する位置姿勢計測装置は、撮像装置により撮像画像を取得する。また、撮像装置の位置姿勢に基づいて、3次元モデルにおける幾何特徴の夫々を撮像画像上に投影し、投影幾何特徴を得る。そして、得られた投影幾何特徴から、投影幾何特徴間の撮像画像上の距離に基づいて、位置姿勢の算出に利用すべき投影幾何特徴を選択する。選択された投影幾何特徴と、撮像画像上から検出される選択された投影幾何特徴に対応する画像幾何特徴とを用いて、撮像装置と計測対象物体との間の相対的な位置姿勢を算出する。」と記載されている(要約参照)。   As a background art of the present invention, there is a technique disclosed in Japanese Patent Laid-Open No. 2008-275391 (Patent Document 1). This publication describes “a position / orientation measurement apparatus that measures a relative position / orientation between an imaging apparatus that images one or more measurement target objects and the measurement target object using a three-dimensional model of the measurement target object”. Acquires a captured image by the imaging device, and projects each geometric feature in the three-dimensional model on the captured image based on the position and orientation of the imaging device to obtain a projected geometric feature. A projected geometric feature to be used for position / orientation calculation is selected from the geometric features based on the distance between the projected geometric features on the captured image, and the selected projected geometric feature is selected from the captured image. The relative position and orientation between the imaging device and the measurement target object are calculated using the image geometric feature corresponding to the projected geometric feature ”(see the summary).

特開2008−275391号公報JP 2008-275391 A

カメラ画像から画像中に映る対象の検出及び対象の状態の認識をする処理において、画像撮影時のカメラ状態(カメラの姿勢、画角)などが必要となる場合がある。例えば、カメラに映る人物の速度を計測したい場合には、人物の一定時間における画面内の移動距離を、実空間における移動距離に変換する際に、前述のカメラ状態が必要となる。   In the process of detecting an object shown in an image from a camera image and recognizing the state of the object, the camera state (camera posture, angle of view) at the time of image capture may be required. For example, when it is desired to measure the speed of a person appearing on the camera, the above-described camera state is required when converting the movement distance of the person in the screen at a certain time into the movement distance in the real space.

カメラ状態を推定する技術は、カメラキャリブレーション技術として一般的に広く知られている。従来、カメラキャリブレーションは、チェッカーボードの様な、大きさ及びパターンが既知の特定の検知対象を撮影し、検知対象の映り方からカメラ状態を推定する方法が一般的であった。しかし、この方法は、カメラの状態が変化する状況においては逐一特定の検知対象を撮影し直す必要があり、現実的ではない。   A technique for estimating a camera state is generally widely known as a camera calibration technique. Conventionally, camera calibration is generally performed by photographing a specific detection target having a known size and pattern, such as a checkerboard, and estimating the camera state from how the detection target is reflected. However, this method is not practical because it is necessary to recapture a specific detection target one by one in a situation where the state of the camera changes.

上記の特許文献1には、データベースに保存されたデータと撮影対象を比較することで、カメラ状態を逐一推定する方法が記載されている。この方法によれば、ある特定の検知対象の3次元状態を保持したデータベースを用意し、そのデータベースとカメラ映像とを比較して検知対象の現在の状態を得ることで、ある検知対象が映っている場合におけるカメラ状態が逐一推定される。しかし、この方法では、検知対象の3次元情報をCADから取得し、データベースに保存する必要がある。CADデータは対象の設計図データ又は対象を正確に測定した測定データから作成されるため、データベースに検知対象の情報を入力する際に対象の正確な測定が必要であったり、対象の設計図が存在する必要があったりするため、情報入力に手間がかかり、また対象を自由に選択できないといった課題がある。   Patent Document 1 described above describes a method for estimating the camera state one by one by comparing data stored in a database with a subject to be photographed. According to this method, a database that holds a three-dimensional state of a specific detection target is prepared, and the current state of the detection target is obtained by comparing the database with the camera image, thereby displaying a detection target. The camera state is estimated one by one. However, in this method, it is necessary to acquire the three-dimensional information to be detected from CAD and save it in a database. Since CAD data is created from the target design drawing data or measurement data obtained by accurately measuring the target, it is necessary to accurately measure the target when inputting the detection target information into the database. Since there is a need to exist, there is a problem that it takes time to input information and a target cannot be freely selected.

本発明は、上記の様な課題を解決するためになされたものであり、より簡素な情報を保持したデータベースを用いて、カメラ状態を逐一推定することを目的とする。   The present invention has been made to solve the above-described problems, and an object of the present invention is to estimate the camera state one by one using a database holding simpler information.

上記の課題を解決するために、本発明の一態様は、カメラと、ネットワークを介して前記カメラに接続されるカメラ状態推定装置と、を有する画像認識システムであって、前記カメラ状態推定装置は、前記ネットワークに接続される第1インターフェースと、前記第1インターフェースに接続される第1プロセッサと、前記第1プロセッサに接続される第1記憶装置と、を有し、前記第1記憶装置は、検知対象の画像の特徴量と、前記検知対象の実空間における大きさと、前記カメラの状態を示す一つ以上のパラメータの推定値と、を保持し、前記カメラは、画像を撮影して前記カメラ状態推定装置に送信し、前記第1プロセッサは、前記カメラによって撮影された画像から、前記第1記憶装置に保持された特徴量に基づいて、前記検知対象と類似する対象を抽出し、前記検知対象の実空間における大きさと、前記一つ以上のパラメータの推定値と、前記類似する対象の前記画像内の位置及び大きさと、に基づいて、前記一つ以上のパラメータの推定値の誤差の大きさを示す指標を計算し、前記計算された誤差の大きさを示す指標が所定の条件を満たさない場合に、前記一つ以上のパラメータの推定値を変更することを特徴とする。   In order to solve the above-described problem, one aspect of the present invention is an image recognition system including a camera and a camera state estimation device connected to the camera via a network. The camera state estimation device includes: A first interface connected to the network, a first processor connected to the first interface, and a first storage device connected to the first processor, the first storage device comprising: A feature amount of a detection target image, a size of the detection target in real space, and an estimated value of one or more parameters indicating a state of the camera are stored, and the camera captures an image and captures the camera. The first processor transmits the image to the state estimation device based on the feature quantity stored in the first storage device from the image captured by the camera; Extracting similar objects, based on the size of the detection object in real space, the estimated value of the one or more parameters, and the position and size of the similar object in the image Calculating an index indicating the magnitude of the error of the estimated value of the parameter, and changing the estimated value of the one or more parameters when the calculated index indicating the magnitude of the error does not satisfy a predetermined condition It is characterized by that.

本発明の一形態によれば、より簡素な情報を保持したデータベースを用いて、カメラ状態を推定することができる。   According to one embodiment of the present invention, a camera state can be estimated using a database holding simpler information.

本発明の実施例1のカメラ状態推定装置の概略の説明図である。It is explanatory drawing of the outline of the camera state estimation apparatus of Example 1 of this invention. 本発明の実施例1における撮影環境の説明図である。It is explanatory drawing of the imaging environment in Example 1 of this invention. 本発明の実施例1の画像認識システムのハードウェア構成を示すブロック図である。It is a block diagram which shows the hardware constitutions of the image recognition system of Example 1 of this invention. 本発明の実施例1におけるカメラ状態推定用データベースの一例の説明図である。It is explanatory drawing of an example of the database for camera state estimation in Example 1 of this invention. 本発明の実施例1の画像マッチング処理部の構成例を示したブロック図である。It is the block diagram which showed the structural example of the image matching process part of Example 1 of this invention. 本発明の実施例1のカメラ状態推定部の構成例を示したブロック図である。It is the block diagram which showed the structural example of the camera state estimation part of Example 1 of this invention. 本発明の実施例1の画像マッチング処理のフローチャートである。It is a flowchart of the image matching process of Example 1 of this invention. 本発明の実施例1のカメラ状態推定処理のフローチャートである。It is a flowchart of the camera state estimation process of Example 1 of this invention. 本発明の実施例1の状態推定用データベース更新処理のフローチャートである。It is a flowchart of the database update process for state estimation of Example 1 of this invention. 本発明の実施例1のデータベース更新装置における表示の一例の説明図である。It is explanatory drawing of an example of the display in the database update apparatus of Example 1 of this invention. 本発明の実施例2の画像認識システムのハードウェア構成を示すブロック図である。It is a block diagram which shows the hardware constitutions of the image recognition system of Example 2 of this invention. 本発明の実施例3におけるカメラ状態推定用データベースの一例の説明図である。It is explanatory drawing of an example of the database for camera state estimation in Example 3 of this invention.

以下、図面を参照しつつ、本発明を実施するための形態を説明する。説明の明確化のため、以下の記載及び図面は、適宜、省略及び簡略化がなされている。また、各図面において、同一要素には同一の符号が付されており、説明の明確化のため、必要に応じて重複説明は省略されている。   Hereinafter, embodiments for carrying out the present invention will be described with reference to the drawings. For clarity of explanation, the following description and drawings are omitted and simplified as appropriate. Moreover, in each drawing, the same code | symbol is attached | subjected to the same element and the duplication description is abbreviate | omitted as needed for clarification of description.

図1は、本発明の実施例1のカメラ状態推定装置の概略の説明図である。   FIG. 1 is a schematic explanatory diagram of a camera state estimation apparatus according to a first embodiment of the present invention.

図1では、カメラ状態推定装置100には、カメラ101が接続される。カメラ101は画像を撮影し、撮影された画像を画像取得部102が取得する。画像103は、画像取得部102が取得した画像の一例である。画像103内には地面106上に幾つかの対象(この例では対象107、108、109)が存在する。カメラ状態推定装置100には記憶装置104が付随し、記憶装置104内にカメラ状態推定用データベース105が保持される。カメラ状態推定装置100は前述の画像取得部102、記憶装置104に加え、画像マッチング処理部110及びカメラ状態推定部111を備える。画像マッチング処理部110にはカメラ101によって撮影された画像103とカメラ状態推定用データベース105が入力される。画像マッチング処理部110では入力された画像103に、データベース内の検知対象画像が含まれているかを調べ、含まれていた場合にはその画像上位置と対象の大きさに関する情報を抽出し出力する。カメラ状態推定部111は、画像マッチング処理部110の処理結果が入力されると、入力された情報からカメラ状態112を推定して出力する。   In FIG. 1, a camera 101 is connected to the camera state estimation apparatus 100. The camera 101 captures an image, and the image acquisition unit 102 acquires the captured image. An image 103 is an example of an image acquired by the image acquisition unit 102. In the image 103, there are several objects (objects 107, 108, and 109 in this example) on the ground 106. The camera state estimation apparatus 100 is accompanied by a storage device 104, and a camera state estimation database 105 is held in the storage device 104. The camera state estimation device 100 includes an image matching processing unit 110 and a camera state estimation unit 111 in addition to the image acquisition unit 102 and the storage device 104 described above. An image 103 captured by the camera 101 and a camera state estimation database 105 are input to the image matching processing unit 110. The image matching processing unit 110 checks whether or not the input image 103 includes a detection target image in the database. If it is included, information on the position on the image and the size of the target is extracted and output. . When the processing result of the image matching processing unit 110 is input, the camera state estimation unit 111 estimates and outputs the camera state 112 from the input information.

図2は、本発明の実施例1における撮影環境の説明図である。   FIG. 2 is an explanatory diagram of a shooting environment according to the first embodiment of the present invention.

カメラ101は、一定の設置高さ202の位置に、地面106に対して角度201の方向を向くように設置される。また、カメラ101は、視野角203の範囲を撮影している。実施例1は、地面106が水平に映る角度でカメラ101が設置されている場合(言い換えると、カメラ101が撮影した矩形の画像103の上下端の辺と、カメラ101が撮影した風景の水平線とが平行になるように、カメラ101が設置されている場合)を想定して説明する。撮影される対象206は地面106に接していることを前提とする。また対象の基準点204までの高さ205の様な、対象の大きさに関する情報が状態推定用データベースに保持される。   The camera 101 is installed at a fixed installation height 202 so as to face an angle 201 with respect to the ground 106. In addition, the camera 101 captures a range of the viewing angle 203. In the first embodiment, when the camera 101 is installed at an angle at which the ground 106 is reflected horizontally (in other words, the upper and lower sides of the rectangular image 103 captured by the camera 101 and the horizontal line of the landscape captured by the camera 101) (When the camera 101 is installed so that the two are parallel to each other). It is assumed that the object 206 to be photographed is in contact with the ground 106. Information about the size of the object, such as the height 205 to the object reference point 204, is held in the state estimation database.

図2の様な状況のカメラ101の一例は、天井又は柱などに設置した可動式の監視カメラなどである。可動式の監視カメラはカメラの方向(方位角)及び地面に対する傾き(俯角又は仰角)を変更することができ、ズーム機能によって画角(視野角203)が変化する。実施例1は監視カメラのようなカメラを想定して説明する。   An example of the camera 101 in the situation shown in FIG. 2 is a movable surveillance camera or the like installed on a ceiling or a pillar. The movable surveillance camera can change the direction (azimuth angle) of the camera and the tilt (decoration angle or elevation angle) with respect to the ground, and the angle of view (viewing angle 203) is changed by the zoom function. The first embodiment will be described assuming a camera such as a surveillance camera.

なお、本実施例におけるカメラ状態は、カメラの向き(方位角、俯角、仰角)、画角及び設置位置といった、カメラ101の状態を示す一つ以上のパラメータを含む。例えばズーム機能を有するカメラ101の画角、首振り機能を有するカメラ101の向きのように、少なくともいずれかのパラメータが可変であってもよい。また、可変であるか固定であるかを問わず、少なくとも一つのパラメータの値が未知であり、その値がカメラ状態推定装置100によって推定される。これらのパラメータは、後述する画像認識処理装置603が任意の画像認識処理(例えば撮影された対象物の追跡等)を行うために使用される。   Note that the camera state in the present embodiment includes one or more parameters indicating the state of the camera 101, such as the camera direction (azimuth angle, depression angle, elevation angle), field angle, and installation position. For example, at least one of the parameters may be variable, such as the angle of view of the camera 101 having a zoom function and the direction of the camera 101 having a swing function. Regardless of whether it is variable or fixed, the value of at least one parameter is unknown, and the value is estimated by the camera state estimation apparatus 100. These parameters are used for an image recognition processing device 603 (to be described later) to perform arbitrary image recognition processing (for example, tracking of a photographed object).

図2のX軸207、Y軸208及びZ軸209は、本実施例の説明に用いる実空間座標の座標軸にそれぞれ対応し、カメラの真下の地面上の点210(すなわちカメラ101を通る垂直線と地面との交点)をその座標系の原点とする。また、足元座標211は、対象206の基準点204の真下の地面上の点の実空間座標であり、対象206が人間である場合は、通常、その人間の接地点(すなわち足元)の座標である。   An X axis 207, a Y axis 208, and a Z axis 209 in FIG. 2 respectively correspond to coordinate axes of real space coordinates used in the description of the present embodiment, and are points 210 on the ground just below the camera (that is, a vertical line passing through the camera 101). And the ground) is the origin of the coordinate system. Further, the foot coordinates 211 are real space coordinates of a point on the ground just below the reference point 204 of the object 206. When the object 206 is a human, the coordinates of the human grounding point (that is, the foot) are usually used. is there.

なお、本実施例では、実空間の座標値と、画像上の座標値とが扱われる。実空間の座標値は、図2に示すように、カメラ101によって撮影される実空間のいずれかの点を原点とする3次元座標系の座標値である。一方、画像上の座標値は、撮影された画像上のいずれかの点を原点とする2次元座標系の座標値であり、その単位は例えば画素である。   In this embodiment, real space coordinate values and image coordinate values are handled. As shown in FIG. 2, the coordinate value of the real space is a coordinate value of a three-dimensional coordinate system having any point in the real space photographed by the camera 101 as the origin. On the other hand, the coordinate value on the image is a coordinate value of a two-dimensional coordinate system with any point on the photographed image as the origin, and the unit is, for example, a pixel.

図3は、本発明の実施例1の画像認識システムのハードウェア構成を示すブロック図である。   FIG. 3 is a block diagram illustrating a hardware configuration of the image recognition system according to the first embodiment of this invention.

画像認識システムは、データベース更新装置601と、カメラ状態推定装置100と、画像認識処理装置603と、カメラ101と、を備え、それぞれネットワーク604を介して相互に接続されている。   The image recognition system includes a database update device 601, a camera state estimation device 100, an image recognition processing device 603, and a camera 101, which are connected to each other via a network 604.

データベース更新装置601は、プロセッサ621、メモリ622、ネットワークインターフェース(I/F)623、入力用端末607及び表示用装置608を備える。   The database update device 601 includes a processor 621, a memory 622, a network interface (I / F) 623, an input terminal 607 and a display device 608.

プロセッサ621は、メモリ622に格納されたプログラムを実行することによって、以下に説明するデータベース更新装置601の種々の機能を実現する。   The processor 621 implements various functions of the database update device 601 described below by executing a program stored in the memory 622.

メモリ622には、プロセッサ621によって実行されるプログラムモジュールであるデータベース情報設定部609、カメラ状態推定信号出力部610、データベース情報取得部611及び画像取得部617が格納される。以下の説明では、これらの各部を機能ブロックとして扱い、各部が実行する処理を説明するが、実際にはそれらの処理は、プロセッサ621が、各プログラムモジュールに記述された命令に従って実行する。このとき、プロセッサ621は、必要に応じてネットワークI/F623、入力用端末607及び表示用装置608等を制御することで、各機能ブロックによるデータの通信及び入出力を行う。   The memory 622 stores a database information setting unit 609, a camera state estimation signal output unit 610, a database information acquisition unit 611, and an image acquisition unit 617, which are program modules executed by the processor 621. In the following description, each of these units is treated as a functional block and processing executed by each unit will be described. Actually, these processings are executed by the processor 621 according to instructions described in each program module. At this time, the processor 621 controls the network I / F 623, the input terminal 607, the display device 608, and the like as necessary to perform data communication and input / output by each functional block.

図3には、汎用のプロセッサ621がメモリ622に格納されたプログラムを実行することによって各機能ブロックを実現する例を示すが、これらの機能ブロックの任意の一部又は全部がASIC(Application Specific Integrated Circuit)のような専用のハードウェアによって実現されてもよい。   FIG. 3 shows an example in which each general-purpose processor 621 implements each functional block by executing a program stored in the memory 622. However, any part or all of these functional blocks may be ASIC (Application Specific Integrated). It may be realized by dedicated hardware such as Circuit).

ネットワークI/F623は、ネットワーク604に接続され、ネットワーク604を介して他の装置との通信を行うインターフェースである。   The network I / F 623 is an interface that is connected to the network 604 and performs communication with other devices via the network 604.

表示用装置608は、例えば液晶表示装置のような文字及び画像等の表示装置である。入力用端末607は、例えばキーボード、マウス又はタッチパネルのような、ユーザからのデータの入力が可能な入力装置を含む。例えば液晶タッチパネルのように、表示用装置608と入力用端末607とが一体化されていてもよい。   The display device 608 is a display device for characters and images, such as a liquid crystal display device. The input terminal 607 includes an input device that can input data from the user, such as a keyboard, a mouse, or a touch panel. For example, like the liquid crystal touch panel, the display device 608 and the input terminal 607 may be integrated.

データベース情報取得部611は、カメラ状態推定装置100内のカメラ状態推定用データベース105から情報を取得し、表示用装置608に表示できる形式に変換して表示する。画像取得部617は、カメラ101から画像を取得し、表示用装置608に出力する。データベース情報設定部609は、入力用端末607から入力される操作情報に従ってカメラ状態推定用データベース105の更新情報を生成し、カメラ状態推定装置100に送信する。カメラ状態推定信号出力部610は、入力用端末607から入力される操作情報に従って、カメラ状態推定装置100におけるカメラ状態推定処理を開始する信号を生成し、カメラ状態推定装置100に送信する。   The database information acquisition unit 611 acquires information from the camera state estimation database 105 in the camera state estimation device 100, converts the information into a format that can be displayed on the display device 608, and displays it. The image acquisition unit 617 acquires an image from the camera 101 and outputs it to the display device 608. The database information setting unit 609 generates update information of the camera state estimation database 105 according to the operation information input from the input terminal 607 and transmits the update information to the camera state estimation apparatus 100. The camera state estimation signal output unit 610 generates a signal for starting camera state estimation processing in the camera state estimation apparatus 100 according to the operation information input from the input terminal 607 and transmits the signal to the camera state estimation apparatus 100.

カメラ状態推定装置100は、プロセッサ624、メモリ625、ネットワークI/F626及び記憶装置104を備える。プロセッサ624は、メモリ625に格納されたプログラムを実行することによって、以下に説明するカメラ状態推定装置100の種々の機能を実現する。メモリ622には、プロセッサ621によって実行されるプログラムモジュールである画像取得部102、画像マッチング処理部110、カメラ状態推定部111及びデータベース更新部612が格納される。プロセッサ624とメモリ625に格納されたプログラムモジュールとそれらによって実現される機能ブロックとの関係、及び、機能ブロックの実現方法のバリエーションについては、データベース更新装置601について説明したものと同様であるため、詳細な説明を省略する。   The camera state estimation device 100 includes a processor 624, a memory 625, a network I / F 626, and a storage device 104. The processor 624 implements various functions of the camera state estimation apparatus 100 described below by executing a program stored in the memory 625. The memory 622 stores an image acquisition unit 102, an image matching processing unit 110, a camera state estimation unit 111, and a database update unit 612 that are program modules executed by the processor 621. Since the relationship between the program modules stored in the processor 624 and the memory 625 and the functional blocks realized by them, and the variation of the method for realizing the functional blocks are the same as those described for the database update device 601, details The detailed explanation is omitted.

ネットワークI/F626は、ネットワーク604に接続され、ネットワーク604を介して他の装置との通信を行うインターフェースである。   A network I / F 626 is an interface that is connected to the network 604 and communicates with other devices via the network 604.

記憶装置104は、例えばハードディスクドライブ又はフラッシュメモリのようないわゆる補助記憶装置であり、カメラ状態推定用データベース105を格納する。カメラ状態推定用データベース105に含まれる情報の少なくとも一部が必要に応じてメモリ625にコピーされてもよい。   The storage device 104 is a so-called auxiliary storage device such as a hard disk drive or a flash memory, and stores a camera state estimation database 105. At least a part of the information included in the camera state estimation database 105 may be copied to the memory 625 as necessary.

記憶装置104又はメモリ625には、さらに、カメラ状態を示す一つ以上のパラメータの値が格納される。これらの値の少なくとも一つは未知の値の推定値であり、後述する処理によって更新され、所定の条件が満たされる場合に画像認識処理装置603に送信される。   The storage device 104 or the memory 625 further stores one or more parameter values indicating the camera state. At least one of these values is an estimated value of an unknown value, which is updated by processing to be described later, and is transmitted to the image recognition processing device 603 when a predetermined condition is satisfied.

データベース更新部612は、データベース更新装置601から出力されたデータベース更新情報を受信し、カメラ状態推定用データベース105の更新処理を行う。画像取得部102は、データベース更新装置601から出力されたカメラ状態推定処理開始信号を受信し、カメラ101から画像を取得する。画像マッチング処理部110及びカメラ状態推定部111は、カメラ101から受信した画像及びカメラ状態推定用データベース105の情報を基にカメラ状態を推定し、画像認識処理装置603に送信する。   The database update unit 612 receives the database update information output from the database update device 601 and updates the camera state estimation database 105. The image acquisition unit 102 receives the camera state estimation process start signal output from the database update device 601 and acquires an image from the camera 101. The image matching processing unit 110 and the camera state estimation unit 111 estimate the camera state based on the image received from the camera 101 and the information in the camera state estimation database 105, and transmit the camera state to the image recognition processing device 603.

画像認識処理装置603は、プロセッサ627、メモリ628、ネットワークI/F629及び表示用装置614を備える。プロセッサ627は、メモリ628に格納されたプログラムを実行することによって、以下に説明する画像認識処理装置603の種々の機能を実現する。メモリ622には、プロセッサ621によって実行されるプログラムモジュールである画像取得部616、カメラ状態設定部613及び画像認識処理部615を備える。プロセッサ627とメモリ628に格納されたプログラムモジュールとそれらによって実現される機能ブロックとの関係、及び、機能ブロックの実現方法のバリエーションについては、データベース更新装置601について説明したものと同様であるため、詳細な説明を省略する。   The image recognition processing device 603 includes a processor 627, a memory 628, a network I / F 629, and a display device 614. The processor 627 implements various functions of the image recognition processing device 603 described below by executing a program stored in the memory 628. The memory 622 includes an image acquisition unit 616, a camera state setting unit 613, and an image recognition processing unit 615 that are program modules executed by the processor 621. Since the relationship between the program modules stored in the processor 627 and the memory 628 and the functional blocks realized by them, and variations of the method for realizing the functional blocks are the same as those described for the database update device 601, the details are as follows. The detailed explanation is omitted.

ネットワークI/F629は、ネットワーク604に接続され、ネットワーク604を介して他の装置との通信を行うインターフェースである。表示用装置614は、例えば液晶表示装置のような文字及び画像等の表示装置である。   A network I / F 629 is an interface that is connected to the network 604 and communicates with other devices via the network 604. The display device 614 is a display device for characters and images such as a liquid crystal display device.

画像認識処理部615は、画像取得部616が取得したカメラからの映像に対し、所定の画像認識処理を適用する。画像認識処理部615が行う画像認識処理は、どのようなものであってもよいが、具体例としては、速度が一定以上の車を検出する処理などが挙げられる。画像認識処理部615は、処理結果を表示用装置614に表示する。カメラ状態設定部613は、カメラ状態推定装置100から出力されるカメラ状態を受信し、画像認識処理部615で用いるカメラ状態のパラメータ値を更新する。   The image recognition processing unit 615 applies a predetermined image recognition process to the video from the camera acquired by the image acquisition unit 616. The image recognition processing performed by the image recognition processing unit 615 may be any type, and specific examples include a process for detecting a vehicle having a certain speed or more. The image recognition processing unit 615 displays the processing result on the display device 614. The camera state setting unit 613 receives the camera state output from the camera state estimation device 100 and updates the parameter value of the camera state used in the image recognition processing unit 615.

以上のように構成することで、データベース更新装置601に表示される映像を見ながら必要な対象情報をカメラ状態推定用データベース105に追加することができる。これによって、実際にカメラが映している環境に適したデータベースを構築することができる。そして、追加された情報を基にカメラ状態を推定することで、より正確なカメラ状態推定が可能となる。この様にして推定されたカメラ状態を用いることで、カメラ状態が変わった際にも、画像認識処理部615では推定されたカメラ状態を使用して画像認識処理を行うことが可能となる。   With the configuration described above, necessary target information can be added to the camera state estimation database 105 while viewing the video displayed on the database update device 601. As a result, a database suitable for the environment in which the camera is actually displayed can be constructed. Then, by estimating the camera state based on the added information, it is possible to estimate the camera state more accurately. By using the camera state estimated in this way, even when the camera state changes, the image recognition processing unit 615 can perform image recognition processing using the estimated camera state.

図3の例では、データベース更新装置601とカメラ状態推定装置100と画像認識処理装置603を別々の装置としたが、データベース更新装置601とカメラ状態推定装置100が同一の装置であっても良く、また画像認識処理装置603内にデータベース更新装置601と同様の機能を持たせることでデータベース更新装置601を省略しても良い。また各装置は一つのネットワーク604を介して接続されてもよいが、複数のネットワーク又は一般的なケーブルを介して接続されても良い。   In the example of FIG. 3, the database update device 601, the camera state estimation device 100, and the image recognition processing device 603 are separate devices, but the database update device 601 and the camera state estimation device 100 may be the same device. Further, the database update apparatus 601 may be omitted by providing the image recognition processing apparatus 603 with the same function as the database update apparatus 601. Each device may be connected via one network 604, but may be connected via a plurality of networks or general cables.

図4は、本発明の実施例1におけるカメラ状態推定用データベース105の一例の説明図である。   FIG. 4 is an explanatory diagram of an example of the camera state estimation database 105 according to the first embodiment of the present invention.

カメラ状態推定用データベース105では情報がID(識別子)302ごとに管理され、各IDごとに、検知対象の画像である対象画像303と、その画像の特徴量304と、検知対象の大きさを計測した基準位置の座標を示す基準位置座標305と、検知対象の大きさを示す高さ306とが対応付けられて保存される。   In the camera state estimation database 105, information is managed for each ID (identifier) 302. For each ID, a target image 303 that is an image to be detected, a feature amount 304 of the image, and a size of the detection target are measured. The reference position coordinates 305 indicating the coordinates of the reference position and the height 306 indicating the size of the detection target are stored in association with each other.

対象画像303にはカメラ状態推定に用いる特定の検知対象の画像が格納される。本実施例ではカメラ状態推定に用いる特定の検知対象を、検知対象又は対象と記載する。例えば、カメラ101が撮影した画像から、人もしくは自動車等の移動物体の画像、又は、郵便ポスト(郵便差出箱)等の移動しない物体の画像を切り出し、それらを検知対象の対象画像303として格納することができる。   The target image 303 stores an image of a specific detection target used for camera state estimation. In this embodiment, a specific detection target used for camera state estimation is described as a detection target or a target. For example, an image of a moving object such as a person or a car or an image of a non-moving object such as a post box (post box) is cut out from an image captured by the camera 101 and stored as a target image 303 to be detected. be able to.

特徴量304には画像の色及び形状から導出される数値列である特徴量が格納される。この特徴量は、検知対象が撮影された画像に存在するかどうかを判定する画像マッチング処理において、撮影された画像中の特徴量と、データベース内の特徴量304とを比較するために用いられる。   The feature quantity 304 stores a feature quantity that is a numerical sequence derived from the color and shape of the image. This feature amount is used to compare the feature amount in the photographed image with the feature amount 304 in the database in the image matching process for determining whether or not the detection target exists in the photographed image.

基準位置座標305には検知対象の大きさを計測した位置の情報が格納される。図4は、検知対象の大きさ(図4の例では高さ)を計測した点の画素座標値(すなわち画面上の座標値)を格納した例である。高さ306には、検知対象の実空間における大きさに関する情報が格納される。本実施例では、検知対象の大きさに関する情報として検知対象の実空間における高さの情報を用いる例を示すが、例えば検知対象の幅など、高さ以外の大きさに関する情報を用いてもよい。   The reference position coordinate 305 stores information on the position where the size of the detection target is measured. FIG. 4 is an example in which pixel coordinate values (that is, coordinate values on the screen) of points at which the size of the detection target (height in the example of FIG. 4) is measured are stored. The height 306 stores information related to the size of the real space to be detected. In this embodiment, an example in which height information in the real space of the detection target is used as information on the size of the detection target is shown, but information on a size other than the height, such as the width of the detection target, may be used. .

詳細には、図9及び図10等を参照して後述するように、カメラ101が撮影した画像から、検知対象を含む領域が切り出され、それが対象画像303に格納されている場合、その切り出された画像に含まれる検知対象の大きさを計測した点の当該画像上の座標値が基準位置座標305に格納される。例えば、検知対象が人であり、検知対象の大きさがその人の下端(足元)から頭頂部までの高さ、すなわち身長である場合、切り出された画像に含まれる人の頭頂部の当該切り出された画像上の座標値(例えば、矩形に切り出された画像の左上の角を原点とする2次元座標系の座標値)が基準位置座標305に格納される。   Specifically, as will be described later with reference to FIGS. 9 and 10, when an area including a detection target is cut out from an image captured by the camera 101 and stored in the target image 303, the cut-out is performed. The coordinate value on the image at the point where the size of the detection target included in the image is measured is stored in the reference position coordinate 305. For example, when the detection target is a person and the size of the detection target is the height from the lower end (foot) of the person to the top of the head, that is, the height, the cut out of the top of the person included in the cut out image Coordinate values on the image (for example, coordinate values in a two-dimensional coordinate system with the upper left corner of the image cut into a rectangle as the origin) are stored in the reference position coordinates 305.

例えば、本実施例の画像認識システムの初期状態においては、カメラ状態推定用データベース105にデータが格納されていなくてもよい。その場合、画像認識システム内のデータベース更新装置601及びカメラ状態推定装置100は、カメラ101によって撮影された画像から検知対象を抽出してそれに関するデータをカメラ状態推定用データベース105に格納する。このデータベース更新処理(図9、図10等参照)によって、カメラ状態推定用データベース105に十分な量の検知対象に関するデータが格納されると、カメラ状態推定装置100は、格納されたデータを利用して、後述する画像マッチング処理及びカメラ状態推定処理を行うことが可能になる。   For example, in the initial state of the image recognition system of the present embodiment, data may not be stored in the camera state estimation database 105. In that case, the database update device 601 and the camera state estimation device 100 in the image recognition system extract the detection target from the image captured by the camera 101 and store the data related thereto in the camera state estimation database 105. When a sufficient amount of data relating to the detection target is stored in the camera state estimation database 105 by this database update process (see FIG. 9, FIG. 10, etc.), the camera state estimation device 100 uses the stored data. Thus, image matching processing and camera state estimation processing described later can be performed.

あるいは、画像認識システムの初期状態において、既にカメラ状態推定用データベース105に代表的な検知対象に関するデータが格納されていてもよい。その場合、カメラ状態推定装置100は、それらのデータを継続的に利用して画像マッチング処理及びカメラ状態推定処理を行ってもよい。   Alternatively, in the initial state of the image recognition system, data relating to a typical detection target may already be stored in the camera state estimation database 105. In that case, the camera state estimation apparatus 100 may perform image matching processing and camera state estimation processing by continuously using those data.

いずれの場合であっても、必要に応じて(例えばカメラ101の設置環境の変化によって新しいデータが必要となった場合等に)上記のデータベース更新処理を行うことによって新たなデータを追加し、それを以後の処理に利用することができる。   In any case, new data is added by performing the above database update process as necessary (for example, when new data is required due to a change in the installation environment of the camera 101). Can be used for subsequent processing.

図5は、本発明の実施例1の画像マッチング処理部110の構成例を示したブロック図である。   FIG. 5 is a block diagram illustrating a configuration example of the image matching processing unit 110 according to the first embodiment of this invention.

画像マッチング処理部110は、特徴量一致度算出処理部403と閾値判定処理部404と一致対象矩形抽出部405とを備える。これらは、例えば、画像マッチング処理部110に含まれるプログラムモジュールである。   The image matching processing unit 110 includes a feature amount matching degree calculation processing unit 403, a threshold determination processing unit 404, and a matching target rectangle extraction unit 405. These are program modules included in the image matching processing unit 110, for example.

カメラからの画像401は、カメラ101によって撮影され、送信されたものであり、画像取得部102によって取得される。画像取得実行のタイミングは外部から入力される画像取得実行信号406によって決定される。画像取得実行信号406は、例えばネットワーク604に接続された操作用端末(図示省略)などから手動で入力されても良いし、一定タイミングごとに自動的に発行されても良い。また、カメラ101の位置又は向きを操作できる場合、操作信号を画像取得実行信号406として入力することで、操作が行われるたびにカメラ状態を推定することもできる。また、画像取得部102は、画像取得実行信号406を受け取った際に、信号受信から一定期間複数フレームの画像を取得し続けてそれらを処理に用いても良い。   An image 401 from the camera is captured and transmitted by the camera 101 and is acquired by the image acquisition unit 102. The timing of image acquisition execution is determined by an image acquisition execution signal 406 input from the outside. The image acquisition execution signal 406 may be manually input from, for example, an operation terminal (not shown) connected to the network 604, or may be automatically issued at regular intervals. In addition, when the position or orientation of the camera 101 can be operated, the camera state can be estimated every time the operation is performed by inputting an operation signal as the image acquisition execution signal 406. Further, when receiving the image acquisition execution signal 406, the image acquisition unit 102 may continue to acquire images of a plurality of frames for a certain period from the signal reception and use them for processing.

画像取得部102が取得した画像は特徴量一致度算出処理部403に入力される。さらに、特徴量一致度算出処理部403には、記憶装置104の記憶媒体402(例えばハードディスク)に記憶されているカメラ状態推定用データベース105からカメラ状態推定用データが入力される。特徴量一致度算出処理部403では、カメラ状態推定用データベース105に記録されている各検知対象データの画像特徴量を用いて、画像取得部102が取得した画像内に、カメラ状態推定用データベース105に記録されている各検知対象データと類似する部分があるか調べる。類似部分の有無は、例えば一般的なテンプレートマッチング処理と同様の処理によって判定することができる。   The image acquired by the image acquisition unit 102 is input to the feature amount matching degree calculation processing unit 403. Further, the camera state estimation data from the camera state estimation database 105 stored in the storage medium 402 (for example, hard disk) of the storage device 104 is input to the feature amount matching degree calculation processing unit 403. In the feature amount matching degree calculation processing unit 403, the camera state estimation database 105 is included in the image acquired by the image acquisition unit 102 using the image feature amount of each detection target data recorded in the camera state estimation database 105. It is checked whether there is a part similar to each detection target data recorded in the. The presence or absence of a similar part can be determined by, for example, a process similar to a general template matching process.

テンプレートマッチング処理は、入力画像の一部領域を選択し、選択された領域から特徴量を抽出し、その特徴量とデータベースに格納された特徴量との比較を行う処理を、画面内の選択領域をずらしながら繰り返し実行することによって、画面内をスキャンする処理であり、画面内の部分領域毎の一致度が算出される。特徴量一致度算出処理部403は、前述のテンプレートマッチング処理をデータベース内の各検知対象に対して行い、各検知対象の特徴量に対する画像の部分領域毎の一致度を算出する。   The template matching process selects a part of the input image, extracts a feature quantity from the selected area, and compares the feature quantity with the feature quantity stored in the database. This is a process of scanning the screen by repeatedly executing while shifting, and the degree of coincidence for each partial region in the screen is calculated. The feature amount matching degree calculation processing unit 403 performs the above-described template matching processing for each detection target in the database, and calculates the matching degree for each partial region of the image with respect to the feature amount of each detection target.

閾値判定処理部404は、特徴量一致度算出処理部403によって算出された一致度がある一定値(閾値)より高い検知対象を選択する処理を行う。この際、例えば撮影された画像の同一領域に対してカメラ状態推定用データベース105に格納されている複数の検知対象の一致度が高かった場合には、その中で最も一致度の高い検知対象のデータを選択しても良い。以下の説明において、一致度が高い検知対象(複数の一致度が高い検知対象の一つが選択された場合にはその選択された検知対象)を「一致した検知対象」とも記載する。一方、その検知対象との一致度が高い画像上の領域を「一致対象」とも記載する。   The threshold determination processing unit 404 performs a process of selecting a detection target whose matching degree calculated by the feature amount matching degree calculation processing unit 403 is higher than a certain value (threshold value). At this time, for example, when the degree of coincidence of a plurality of detection targets stored in the camera state estimation database 105 is high for the same region of the photographed image, the detection target with the highest degree of coincidence among them is detected. Data may be selected. In the following description, a detection target having a high matching degree (or a selected detection target when one of a plurality of detection targets having a high matching degree is selected) is also referred to as a “matching detection target”. On the other hand, a region on the image having a high degree of matching with the detection target is also referred to as “matching target”.

なお、撮影された画像の領域の特徴量とデータベースに格納された検知対象の特徴量とが完全に一致することは実際にはほとんどないため、上記の一致度は類似度と言い換えることができ、「一致した検知対象」は、例えば「類似する検知対象」又は「類似度が(所定の閾値より)高い検知対象」のように言い換えることができる。   In addition, since the feature quantity of the area of the captured image and the feature quantity of the detection target stored in the database are almost completely inconsistent, the above-mentioned degree of coincidence can be rephrased as similarity, The “matched detection target” can be paraphrased as “similar detection target” or “detection target with a high similarity (above a predetermined threshold)”, for example.

一致対象矩形抽出部405には、閾値判定処理部404で選択された検知対象(すなわち一致した検知対象)の情報と、その検知対象が映っている画面上の領域の位置情報とが入力される。一致対象矩形抽出部405は、一致した検知対象が、入力された画像内のどの範囲に一致したかを判定し、その範囲を特定する情報を一致対象矩形の情報として出力する。例えば、一致対象矩形抽出部405は、一致度が高いと判定された矩形領域のサイズを、一致した検知対象のデータベースに格納された画像のサイズと合わせるようにスケーリングして得られる矩形領域の位置を特定する情報と、前述のスケーリング時の拡大率とを出力する。ここで、矩形領域の位置を特定する情報は、例えば、当該矩形領域を含む画像上の座標系における、当該矩形領域の左上の角の座標値(以下、左上座標とも記載する)を含んでもよい。   The matching target rectangle extraction unit 405 receives the information on the detection target selected by the threshold determination processing unit 404 (that is, the matching detection target) and the position information of the area on the screen in which the detection target is shown. . The matching target rectangle extraction unit 405 determines which range in the input image the matched detection target matches, and outputs information for specifying the range as matching target rectangle information. For example, the matching target rectangle extraction unit 405 determines the position of the rectangular area obtained by scaling the size of the rectangular area determined to have a high degree of matching with the size of the image stored in the matching detection target database. And information for identifying the above and the enlargement ratio at the time of scaling described above are output. Here, the information specifying the position of the rectangular area may include, for example, the coordinate value of the upper left corner of the rectangular area (hereinafter also referred to as the upper left coordinate) in the coordinate system on the image including the rectangular area. .

以上の様にして画像マッチング処理部110は、記憶媒体402に保存されているデータベースの情報を基に、撮影された画像に検知対象が映っているか(すなわちデータベースに格納されている検知対象と特徴量が類似する対象を含む領域があるか)を調べ、映っている場合にはその領域を抽出し、抽出された領域情報とデータベースに保存されている検知対象情報とを対応付けて出力する。   As described above, the image matching processing unit 110 is based on the information in the database stored in the storage medium 402, and whether the detection target is reflected in the photographed image (that is, the detection target and characteristics stored in the database). Whether there is a region including a target having a similar amount) is extracted, and if it is reflected, the region is extracted, and the extracted region information and the detection target information stored in the database are output in association with each other.

なお、撮影された画像内のある領域の特徴量とカメラ状態推定用データベース105に格納された検知対象の特徴量との一致度が高いことは、当該検知対象が当該領域に映っている(少なくともその可能性が高い)ことを意味する。ただし、このことは、当該検知対象と当該領域に映っている検知対象とが同一の物体である(例えば同一人物である)ことを必ずしも意味せず、同種の物体である(例えば別人ではあるがいずれも人間である)ことを意味する場合がある。特徴量の算出方法及び一致度の判定の閾値を調整することで、同一の物体以外を検知しにくくすることも、同種の物体を検知しやすくすることもできる。   Note that the high degree of coincidence between the feature quantity of a certain area in the photographed image and the feature quantity of the detection target stored in the camera state estimation database 105 indicates that the detection target is reflected in the area (at least It is likely). However, this does not necessarily mean that the detection target and the detection target reflected in the area are the same object (for example, the same person), and are the same type of object (for example, different persons). It means that both are humans). By adjusting the feature value calculation method and the threshold for determining the degree of coincidence, it is possible to make it difficult to detect other than the same object, or to easily detect the same kind of object.

同一ではないが同種の物体が検知された場合、その実際の大きさは、カメラ状態推定用データベース105に格納されている大きさとは異なる場合があるが、特徴量の一致度が高い同種の物体の大きさの個体差(人間であれば身長差)はそれほど大きくないと考えられることから、カメラ状態推定用データベース105に格納されている大きさ情報(例えば高さ306)を後述するカメラ状態推定処理において使用しても、十分な精度でカメラ状態を推定できると考えられる。   When the same kind of object is detected, but not the same, the actual size may be different from the size stored in the camera state estimation database 105, but the same kind of object having a high degree of matching of the feature amount. Since the individual difference in height (height difference for humans) is not so large, the size information (for example, height 306) stored in the camera state estimation database 105 is used for camera state estimation described later. Even if it is used in processing, the camera state can be estimated with sufficient accuracy.

同種の物体を検知したい場合であっても、その種類の中にさらに外見上の特徴及び大きさが異なる複数のカテゴリ(例えば大人と子供、小型乗用車と大型トラックなど)が含まれる場合には、それぞれのカテゴリの物体の特徴量及び大きさをカメラ状態推定用データベース105に格納してもよい。一方、後述する実施例3に例示する建物又は看板のように、一つしかない物体を検知したい場合には、同一の物体を検知するのに適した特徴量及び閾値が使用される。   Even if you want to detect the same kind of objects, if the type includes multiple categories with different appearance characteristics and sizes (for example, adults and children, small passenger cars and large trucks, etc.) The feature amount and size of each category of object may be stored in the camera state estimation database 105. On the other hand, when it is desired to detect only one object, such as a building or a signboard exemplified in Example 3 described later, feature amounts and threshold values suitable for detecting the same object are used.

図6は、本発明の実施例1のカメラ状態推定部111の構成例を示したブロック図である。   FIG. 6 is a block diagram illustrating a configuration example of the camera state estimation unit 111 according to the first embodiment of the present invention.

カメラ状態推定部111は、対象基準点画素算出部505と対象下端画素算出部506と対象足元座標算出部508と対象下端高さ算出部509と対象下端誤差算出部510とカメラ状態更新処理部511とカメラ状態出力判定部512とを有する。これらは、例えば、カメラ状態推定部111に含まれるプログラムモジュールである。   The camera state estimation unit 111 includes a target reference point pixel calculation unit 505, a target lower end pixel calculation unit 506, a target foot coordinate calculation unit 508, a target lower end height calculation unit 509, a target lower end error calculation unit 510, and a camera state update processing unit 511. And a camera state output determination unit 512. These are, for example, program modules included in the camera state estimation unit 111.

カメラ状態推定部111には画像マッチング処理部110の処理結果501が入力される。画像マッチング処理部の処理結果501は、抽出された一致対象と同数の、対象高さ502、基準位置座標503及び一致対象矩形情報504の組を含む。各検知対象に関する処理結果501のうち、対象高さ502は、一致した検知対象の対象画像303に対応する高さ306であり、基準位置座標503は、その対象画像303に対応する基準位置座標305であり、一致対象矩形情報504は、一致対象矩形抽出部405から出力された一致対象の矩形領域の位置を特定する情報及びスケーリング時の拡大率を含む。   A processing result 501 of the image matching processing unit 110 is input to the camera state estimation unit 111. The processing result 501 of the image matching processing unit includes the same number of sets of target height 502, reference position coordinates 503, and matching target rectangle information 504 as the number of matching targets extracted. Among the processing results 501 regarding each detection target, the target height 502 is the height 306 corresponding to the target image 303 of the matching detection target, and the reference position coordinate 503 is the reference position coordinate 305 corresponding to the target image 303. The matching target rectangle information 504 includes information for specifying the position of the matching target rectangular area output from the matching target rectangle extraction unit 405 and the enlargement ratio at the time of scaling.

なお、本実施例では、2つ以上の一致対象が抽出された(すなわち対象高さ502〜一致対象矩形情報504の組が2つ以上入力された)場合には、カメラ状態推定部111が図6に示すカメラ状態推定処理を実施するが、一致対象が2つに満たない場合には正しくカメラ状態が推定できないため処理を実施せず、2つ以上の一致対象に関する情報が入力されるまで処理を待機する。この際、複数フレームにわたりカメラ状態が変化しない場合には、それらの複数フレーム(すなわちカメラ状態が変化していない期間中の異なる時刻に撮影された複数の画像)に対する画像マッチング処理結果に含まれる一致対象情報を全て用いてカメラ状態推定処理を行っても良い。   In this embodiment, when two or more matching targets are extracted (that is, when two or more sets of the target height 502 to the matching target rectangle information 504 are input), the camera state estimation unit 111 displays the figure. 6. The camera state estimation process shown in FIG. 6 is performed, but if the number of matching targets is less than two, the camera state cannot be estimated correctly, so the process is not performed and processing is performed until information on two or more matching targets is input. Wait. At this time, if the camera state does not change over a plurality of frames, the matching included in the image matching processing result for the plurality of frames (that is, a plurality of images taken at different times during a period in which the camera state does not change) Camera state estimation processing may be performed using all target information.

各入力情報のうち基準位置座標503及び一致対象矩形情報504は対象基準点画素算出部505に入力される。対象基準点画素算出部505は、入力された基準位置座標503及び一致対象矩形情報504から、画面内における検知対象の基準点画素の座標を算出する。この処理では、対象基準点画素算出部505は、一致対象矩形情報504から矩形の左上座標及び拡大率を取り出し、基準位置座標の値に拡大率をかけたものを、矩形の左上座標に加算することで、対象の基準点画素の座標を算出することができる。算出された基準点画素(すなわち対象基準点画素)の座標は対象足元座標算出部508に入力される。   Among the pieces of input information, the reference position coordinates 503 and the matching target rectangle information 504 are input to the target reference point pixel calculation unit 505. The target reference point pixel calculation unit 505 calculates the coordinates of the reference point pixel to be detected in the screen from the input reference position coordinates 503 and the matching target rectangle information 504. In this process, the target reference point pixel calculation unit 505 extracts the upper left coordinates and enlargement ratio of the rectangle from the matching target rectangle information 504, and adds the value of the reference position coordinates multiplied by the enlargement ratio to the upper left coordinates of the rectangle. Thus, the coordinates of the target reference point pixel can be calculated. The calculated coordinates of the reference point pixel (that is, the target reference point pixel) are input to the target foot coordinate calculation unit 508.

対象足元座標算出部508には、カメラ状態507と、対象基準点画素算出部505で算出された座標と、対象高さ502とが入力される。ここで、カメラ状態507はカメラの高さ、地面に対する角度及び画角を意味する。カメラ状態507は、例えば、予め設定しておいたパラメータ値が初期状態として設定され、その後、後述する処理によって更新される。通常、カメラ状態507は、初期状態においては画像取得部102から入力された画像が撮影された時点のカメラ101の実際の状態と一致しておらず、その後、後述する処理によって更新されることで実際の状態に近づく。   The target foot coordinate calculation unit 508 receives the camera state 507, the coordinates calculated by the target reference point pixel calculation unit 505, and the target height 502. Here, the camera state 507 means the height of the camera, the angle with respect to the ground, and the angle of view. In the camera state 507, for example, a parameter value set in advance is set as an initial state, and then updated by processing to be described later. Normally, the camera state 507 does not match the actual state of the camera 101 at the time when the image input from the image acquisition unit 102 is captured in the initial state, and is updated by a process described later. Close to the actual state.

対象足元座標算出部508は、対象基準点画素の座標と対象高さ502とを用いて、検知対象の足元座標211を算出する。足元座標は、一般的に知られている透視投影モデルに基づいたカメラ座標(すなわちカメラ101が撮影した画像上の座標)と実空間座標とを変換する変換行列を用いて計算される。   The target foot coordinate calculation unit 508 calculates the foot coordinates 211 of the detection target using the coordinates of the target reference point pixel and the target height 502. The foot coordinates are calculated using a transformation matrix that transforms camera coordinates (that is, coordinates on an image captured by the camera 101) based on a generally known perspective projection model and real space coordinates.

ここで、カメラの真下にある地面の位置を原点210とし、地面平面に実空間座標のX軸207とY軸208とを設定し、地面と直行する方向に実空間座標のZ軸209を設定した場合、カメラ101の画素数、画角、地面とカメラの距離及び地面に対するカメラの角度がカメラ状態507等に基づいて特定されれば、実空間座標上の点の座標を画像上の画素の座標に容易に変換できることは自明である。この関係を利用し、実空間座標上のZ座標の値を対象高さ502に設定することで、基準位置座標503を実空間座標上に変換することができる。カメラ状態307と、入力された画像に含まれる対象の当該画像中に占める位置と、に基づいて、実空間におけるカメラ101の設置位置から対象までの方向を計算でき、さらに、カメラ状態307と、入力された画像に含まれる対象の当該画像中の基準位置座標と、対象の実空間における大きさを示す対象高さ502と、に基づいて、カメラ101から対象までの実空間における距離を計算できるためである。   Here, the position of the ground directly below the camera is set as the origin 210, the X axis 207 and Y axis 208 of real space coordinates are set on the ground plane, and the Z axis 209 of real space coordinates is set in a direction perpendicular to the ground. In this case, if the number of pixels of the camera 101, the angle of view, the distance between the ground and the camera, and the angle of the camera with respect to the ground are specified based on the camera state 507 or the like, the coordinates of the points on the real space coordinates are changed to Obviously, it can be easily converted to coordinates. By using this relationship and setting the value of the Z coordinate on the real space coordinate to the target height 502, the reference position coordinate 503 can be converted to the real space coordinate. Based on the camera state 307 and the position of the target included in the input image in the image, the direction from the installation position of the camera 101 to the target in real space can be calculated. Further, the camera state 307 The distance in the real space from the camera 101 to the object can be calculated based on the reference position coordinates in the image of the object included in the input image and the object height 502 indicating the size of the object in the actual space. Because.

対象足元座標算出部508は、この様にして変換された基準位置座標503の実空間座標点の真下にある地面上の点(例えば対象として人が抽出された場合、その対象である人の下端、すなわち足元)の座標値を対象の足元座標211として出力する。ここでは計算方法の一例を示したが、その他の計算方法を使って対象の足元座標211を計算しても良い。計算された対象の足元座標211は、対象下端高さ算出部509に入力される。   The target foot coordinate calculation unit 508 is a point on the ground just below the real space coordinate point of the reference position coordinate 503 converted in this way (for example, when a person is extracted as the target, the lower end of the target person) That is, the coordinate value of the foot) is output as the target foot coordinate 211. Although an example of the calculation method is shown here, the target foot coordinates 211 may be calculated using other calculation methods. The calculated foot coordinates 211 of the target are input to the target bottom height calculation unit 509.

対象下端画素算出部506には、一致対象矩形情報504が入力される。対象下端画素算出部506は、入力された一致対象矩形情報504から一致対象の下端画素を算出する。ここでは、一致対象矩形情報504の矩形の左上座標のうち、X座標に、矩形の幅の半分の値を加算し、Y座標に、矩形の高さの値を加算した座標値を、対象下端画素として算出する。ここで、矩形の幅及び高さは、一致対象矩形情報504に含まれていてもよいし、入力された画像内の検知対象に一致する対象画像303の大きさと、一致対象矩形情報504に含まれる拡大率とに基づいて算出されてもよい。算出された対象下端画素は対象下端高さ算出部509に入力される。   The matching target rectangle information 504 is input to the target bottom pixel calculation unit 506. The target lower end pixel calculation unit 506 calculates the lower end pixel to be matched from the input match target rectangle information 504. Here, out of the upper left coordinates of the rectangle of the matching target rectangle information 504, a coordinate value obtained by adding a value that is half the width of the rectangle to the X coordinate and adding a value of the height of the rectangle to the Y coordinate is used as the lower end of the target. Calculate as a pixel. Here, the width and height of the rectangle may be included in the matching target rectangle information 504, or the size of the target image 303 that matches the detection target in the input image and the matching target rectangle information 504. May be calculated based on the enlargement ratio. The calculated target lower end pixel is input to the target lower end height calculation unit 509.

対象下端高さ算出部509には、対象下端画素、対象足元座標及びカメラ状態507が入力される。ここでは対象足元座標算出部508と同様に、カメラの透視投影モデルに基づいたカメラ座標と実空間座標とを変換する変換行列を用いた計算が行われる。まず、対象下端高さ算出部509は、対象下端画素を実空間座標上の座標値(これを対象下端座標とも記載する)に変換した場合に、変換された対象下端座標のX座標及びY座標(すなわち水平面内の座標)が、対象足元座標のX座標及びY座標に一致すると仮定する。この仮定を用いることで、対象下端座標の実空間座標のZ座標を透視投影モデルを用いて計算することができる。対象下端高さ算出部509は、計算された対象下端座標の実空間座標のZ座標の値と、対象足元座標の実空間座標のZ座標の値との相違を、対象下端高さとして出力する。出力された対象下端高さは対象下端誤差算出部510に入力される。   The target bottom edge height calculation unit 509 receives the target bottom pixel, the target foot coordinates, and the camera state 507. Here, similarly to the target foot coordinate calculation unit 508, calculation using a transformation matrix for converting camera coordinates and real space coordinates based on the perspective projection model of the camera is performed. First, when the target lower end height calculation unit 509 converts the target lower end pixel into a coordinate value on real space coordinates (this is also referred to as target lower end coordinate), the converted X coordinate and Y coordinate of the target lower end coordinate are converted. Assume that (that is, coordinates in the horizontal plane) match the X and Y coordinates of the target foot coordinates. By using this assumption, the Z coordinate of the real space coordinates of the target lower end coordinates can be calculated using a perspective projection model. The target lower end height calculation unit 509 outputs, as the target lower end height, the difference between the calculated value of the Z coordinate of the real space coordinate of the target lower end coordinate and the value of the Z coordinate of the real space coordinate of the target foot coordinate. . The output target lower end height is input to the target lower end error calculation unit 510.

対象下端誤差算出部510は、全ての検知対象に対して計算された対象下端高さから、対象下端高さの誤差を算出する。カメラ状態507が正しい値である場合、理想的には、対象足元座標算出部508の処理と対象下端高さ算出部509の処理を通じて得られる対象下端高さは0になる。つまり、全ての検知対象に対して、対象下端高さが0になる場合に、カメラ状態507は正しい値となっているといえる。   The target lower end error calculation unit 510 calculates an error of the target lower end height from the target lower end height calculated for all the detection targets. When the camera state 507 is a correct value, the target bottom height obtained through the processing of the target foot coordinate calculation unit 508 and the processing of the target bottom height calculation unit 509 is ideally zero. That is, it can be said that the camera state 507 has a correct value when the target lower end height is 0 for all detection targets.

これに対して、カメラ状態507が正しい値でない場合には、全ての検知対象に対して対象下端高さが0になることはない。例えば、計算に用いたカメラ状態507に含まれる画角が、カメラ101の実際の画角より狭い場合、対象足元座標算出部508は、撮影された画像上の検知対象の大きさに基づいて、カメラ101からその検知対象までの距離を実際の距離より小さく誤認する。その結果、対象足元座標のX座標及びY座標は、実際よりカメラ101に近い(すなわち原点210に近い)値となるため、対象下端高さ算出部509によって算出される対象下端画素の実空間座標上の位置もカメラ101に近くなる。すなわち、図2に示すようにカメラ101が検知対象を俯瞰するように撮影している場合には、対象下端高さ算出部509によって算出される対象下端高さは0より大きく(すなわち地面106より高く)なる。   On the other hand, when the camera state 507 is not a correct value, the target lower end height does not become 0 for all detection targets. For example, when the angle of view included in the camera state 507 used for the calculation is narrower than the actual angle of view of the camera 101, the target foot coordinate calculation unit 508 is based on the size of the detection target on the captured image. The distance from the camera 101 to the detection target is mistakenly smaller than the actual distance. As a result, since the X and Y coordinates of the target foot coordinates are closer to the camera 101 than actual (that is, closer to the origin 210), the real space coordinates of the target bottom pixel calculated by the target bottom height calculation unit 509 are obtained. The upper position is also close to the camera 101. That is, as shown in FIG. 2, when the camera 101 captures an image of the detection target, the target bottom height calculated by the target bottom height calculation unit 509 is larger than 0 (that is, from the ground 106). Higher).

例えばカメラ101の俯角と画角のように、カメラ状態507に含まれる複数のパラメータが未知である場合には、それらのいずれも正しくないにもかかわらず、いずれかの検知対象については対象下端高さが0になることがあり得る。しかし、その場合には別の(カメラ101からの距離が異なる)検知対象については対象下端高さが0にならないため、全ての検知対象に対して対象下端高さが0になることはない。これによって、カメラ状態が誤差を含んでいることを検出できる。   For example, when a plurality of parameters included in the camera state 507 are unknown, such as the depression angle and the angle of view of the camera 101, the target lower end height is set for any detection target even though none of them is correct. Can be zero. However, in this case, since the target lower end height does not become 0 for another detection target (with a different distance from the camera 101), the target lower end height does not become 0 for all detection targets. Thus, it can be detected that the camera state includes an error.

対象下端誤差算出部510は、全ての検知対象に対して計算された対象下端高さを合計し、その合計値を対象下端高さの誤差値としてカメラ状態出力判定部512に出力する。具体的には、例えば、対象下端座標の実空間座標のZ座標の値と、対象足元座標の実空間座標のZ座標の値との差の絶対値の合計値又は二乗和が計算されてもよい。この合計値は、カメラ状態507の誤差の大きさを示す指標に相当する。   The target lower end error calculation unit 510 sums the target lower end heights calculated for all the detection targets, and outputs the total value to the camera state output determination unit 512 as an error value of the target lower end height. Specifically, for example, the sum or the sum of squares of the absolute values of the difference between the Z coordinate value of the real space coordinate of the target bottom coordinate and the Z coordinate value of the real space coordinate of the target foot coordinate is calculated. Good. This total value corresponds to an index indicating the magnitude of the error in the camera state 507.

カメラ状態出力判定部512は、対象下端誤差算出部510から入力された誤差値に基づいて、カメラ状態を出力するかどうか判定する。カメラ状態507を出力する条件としては、例えば、誤差値が一定値以下になったこと、又は、前回判定時の誤差値からの変化が小さいこと、などがある。このような条件が満たされる場合には、その時点で設定されているカメラ状態507が、カメラ101の実際の状態に十分に近いか、又は、実際の状態にそれ以上近づけることが困難であると考えられるため、カメラ状態507を出力すると判定される。カメラ状態出力判定部512は、カメラ状態を出力しないと判定した場合、入力された誤差値をカメラ状態更新処理部511に出力する。   The camera state output determination unit 512 determines whether to output the camera state based on the error value input from the target lower end error calculation unit 510. The conditions for outputting the camera state 507 include, for example, that the error value has become a certain value or less, or that the change from the error value at the previous determination is small. If such a condition is satisfied, the camera state 507 set at that time is sufficiently close to the actual state of the camera 101, or it is difficult to make it closer to the actual state. Since it is considered, it is determined that the camera state 507 is output. When it is determined that the camera state is not output, the camera state output determination unit 512 outputs the input error value to the camera state update processing unit 511.

カメラ状態更新処理部511は、現在のカメラ状態507を更新する。更新方法としては、例えば、今回入力された誤差値を観測し、誤差値が前回入力された誤差値より小さい場合には、前回のカメラ状態更新時のパラメータ変化分と同じ量の変化分を現在のパラメータに加算したものを新しいカメラ状態507とし、逆に、今回入力された誤差値が前回入力された誤差値より大きい場合には、前回のカメラ状態更新時のパラメータ変化分の正負を逆転し値を半減した値を現在のパラメータに加算したものを新しいカメラ状態507として出力する、などの方法がある。   The camera state update processing unit 511 updates the current camera state 507. As an update method, for example, when the error value input this time is observed and the error value is smaller than the error value input last time, the change amount of the same amount as the parameter change value at the previous camera state update is displayed. When the error value input this time is larger than the error value input last time, the sign of the parameter change at the previous camera state update is reversed. There is a method of outputting a value obtained by adding a half value to the current parameter as a new camera state 507.

以上の様に、本実施例では、対象下端高さ算出部509からカメラ状態更新処理部511までの一連の処理部での処理を繰り返し実行することで、最終的に誤差値が小さくなるカメラ状態507を算出し、出力する。この一連の処理によって、推定されたカメラ状態507から得られる地面座標上に、全ての検知対象が接地している状態となり、正しいカメラ状態507を推定することが可能となる。本実施例では、繰り返し処理の際に、誤差量に基づいてカメラ状態を更新する例を示したが、ランダムに用意したカメラ状態のパターン全てに対して対象下端誤差を算出し、最も誤差が小さいカメラ状態を選択するなどの方法を用いることもできる。   As described above, in the present embodiment, the camera state that finally reduces the error value by repeatedly executing the processing in the series of processing units from the target lower end height calculation unit 509 to the camera state update processing unit 511. 507 is calculated and output. By this series of processing, all the detection targets are grounded on the ground coordinates obtained from the estimated camera state 507, and the correct camera state 507 can be estimated. In this embodiment, an example is shown in which the camera state is updated based on the error amount during the iterative processing. However, the target bottom end error is calculated for all the randomly prepared camera state patterns, and the error is the smallest. A method such as selecting a camera state can also be used.

図7は、本発明の実施例1の画像マッチング処理のフローチャートである。   FIG. 7 is a flowchart of image matching processing according to the first embodiment of the present invention.

画像マッチング処理は、画像マッチング処理部110が、カメラ101で撮影された画像とカメラ状態推定用データベース105内の検知対象情報とをマッチングし、画像内に含まれる検知対象を検出して対象の情報を取得する処理である。図7の各ステップにおいて画像マッチング処理部110内の各部が実行する処理の詳細は、図5を参照して説明した通りである。   In the image matching processing, the image matching processing unit 110 matches an image captured by the camera 101 with detection target information in the camera state estimation database 105, detects a detection target included in the image, and detects target information. It is a process to acquire. Details of processing executed by each unit in the image matching processing unit 110 in each step of FIG. 7 are as described with reference to FIG.

まず、特徴量一致度算出処理部403が、カメラ状態推定用データベース105から検知対象情報を取得する(S801)。   First, the feature amount matching degree calculation processing unit 403 acquires detection target information from the camera state estimation database 105 (S801).

次に、特徴量一致度算出処理部403は、取得した全ての検知対象情報に対してS803、S804、S805の処理を実行する(S802)。画像部分領域指定処理ステップ(S803)において、特徴量一致度算出処理部403は、カメラ101で撮影された画像から特徴量の一致度を算出するための部分領域を指定する。次に、特徴量一致度算出処理部403は、指定した全ての部分領域に対して特徴量一致度算出処理(S805)を実行する(S804)。特徴量一致度算出処理部403は、各部分領域の画像とカメラ状態推定用データベース105の検知対象情報とを比較し、一致度を算出する(S805)。   Next, the feature amount coincidence calculation processing unit 403 performs the processes of S803, S804, and S805 on all the acquired detection target information (S802). In the image partial area designation processing step (S803), the feature amount coincidence calculation processing unit 403 designates a partial area for calculating the feature amount coincidence from the image captured by the camera 101. Next, the feature amount coincidence calculation processing unit 403 executes a feature amount coincidence degree calculation process (S805) for all the specified partial areas (S804). The feature amount matching degree calculation processing unit 403 compares the image of each partial region with the detection target information in the camera state estimation database 105, and calculates the degree of matching (S805).

閾値判定処理部404は、算出された全ての一致度に対して閾値判定処理を実行する(S806)。次に、閾値判定処理部404は、一致した検知対象が存在するかを判定し(S807)、一致した検知対象が存在する場合(S807:Yes)には一致対象矩形抽出部405がS808、S809、S810の処理を実施し、一致した検知対象が存在しない場合(S807:No)には処理を終了する。   The threshold determination processing unit 404 executes threshold determination processing for all the calculated degrees of coincidence (S806). Next, the threshold determination processing unit 404 determines whether there is a matching detection target (S807). If there is a matching detection target (S807: Yes), the matching target rectangle extraction unit 405 performs S808, S809. Then, the process of S810 is performed, and if there is no coincident detection target (S807: No), the process ends.

S808では、一致対象矩形抽出部405が、全ての一致した検知対象に対して、一致対象の矩形を抽出する処理(S809)を実行する。一致対象矩形抽出部405は、全ての一致対象の矩形を抽出したら、一致対象情報を出力し(S810)、画像マッチング処理を完了する。   In S808, the matching target rectangle extraction unit 405 executes a process of extracting matching target rectangles (S809) for all the matching detection targets. When all the matching target rectangles are extracted, the matching target rectangle extraction unit 405 outputs matching target information (S810), and completes the image matching process.

図8は、本発明の実施例1のカメラ状態推定処理のフローチャートである。   FIG. 8 is a flowchart of the camera state estimation process according to the first embodiment of the present invention.

図8の各ステップにおいてカメラ状態推定部111内の各部が実行する処理の詳細は、図6を参照して説明した通りである。   Details of processing executed by each unit in the camera state estimation unit 111 in each step of FIG. 8 are as described with reference to FIG.

まず、カメラ状態推定部111は、2つ以上の一致対象が入力されたかどうかを判定し(S901)、2つ以上の一致対象が入力されていない場合(S901:No)には次の入力まで待機し(S902)、2つ以上の一致対象が入力された場合(S901:Yes)にはS903以降の処理を実行する。ここで、2つ以上の一致対象とは、それぞれがカメラ状態推定用データベース105に格納された別の検知対象と類似する一致対象であってもよいし、同一の検知対象と類似する2つ以上の一致対象であってもよい。   First, the camera state estimation unit 111 determines whether or not two or more matching targets are input (S901). If two or more matching targets are not input (S901: No), the next input is performed. The system waits (S902), and when two or more matching targets are input (S901: Yes), the processing from S903 is executed. Here, the two or more matching targets may be matching targets similar to other detection targets stored in the camera state estimation database 105, or may be two or more similar to the same detection target. May be a matching target.

次に、カメラ状態推定部111は、カメラ状態の初期値を設定する(S903)。   Next, the camera state estimation unit 111 sets an initial value of the camera state (S903).

次に、カメラ状態推定部111は、入力される全ての一致対象情報に対してS905からS908の処理を実行する(S904)。対象基準点画素算出部505は、入力された検知対象情報を用いて検知対象の基準点画素算出処理を実行する(S905)。対象下端画素算出部506は、入力された検知対象情報を用いて検知対象の下端画素の算出処理を実行する(S906)。対象足元座標算出部508は、設定したカメラ状態と入力された対象基準点画素と対象高さとを用いて、検知対象の足元座標を算出する(S907)。対象下端高さ算出部509は、入力された検知対象の足元座標と対象下端画素とを用いて対象の下端高さを算出する(S908)。   Next, the camera state estimation unit 111 performs the processing from S905 to S908 on all input matching target information (S904). The target reference point pixel calculation unit 505 executes a detection target reference point pixel calculation process using the input detection target information (S905). The target lower pixel calculation unit 506 executes the calculation process of the lower pixel of the detection target using the input detection target information (S906). The target foot coordinate calculation unit 508 calculates the foot coordinates of the detection target using the set camera state, the input target reference point pixel, and the target height (S907). The target lower end height calculation unit 509 calculates the lower end height of the target using the input foot coordinates of the detection target and the target lower end pixel (S908).

全ての一致対象情報に対してS905からS908の処理が完了したら、次に、対象下端誤差算出部510が、全ての一致対象情報から得られた対象下端高さを用いて対象下端誤差を算出する(S909)。次に、カメラ状態出力判定部512が、計算された対象下端誤差を基に、現在のカメラ状態を出力するかどうかを判定する(S910)。カメラ状態を出力しないと判定された場合(S910:No)には、カメラ状態更新処理部511が、カメラ状態を更新(S911)したのち、カメラ状態推定部111がS904からS909の処理を繰り返す。S910においてカメラ状態を出力すると判定された場合(S910:Yes)には、カメラ状態推定部111がカメラ状態を出力(S912)してカメラ状態推定処理を完了する。   When the processing from S905 to S908 is completed for all the matching target information, the target lower end error calculation unit 510 next calculates the target lower end error using the target lower end height obtained from all the matching target information. (S909). Next, the camera state output determination unit 512 determines whether to output the current camera state based on the calculated target bottom end error (S910). When it is determined that the camera state is not output (S910: No), the camera state update processing unit 511 updates the camera state (S911), and then the camera state estimation unit 111 repeats the processing from S904 to S909. When it is determined in S910 that the camera state is output (S910: Yes), the camera state estimation unit 111 outputs the camera state (S912), and the camera state estimation process is completed.

図8に示すように、カメラ状態推定部111は、複数の一致対象が入力された場合にS904以降の処理を実行する。これは、例えばカメラ101の俯角と画角のように、カメラ状態507に含まれる二つ以上の独立したパラメータが未知である場合には、二つ以上の一致対象について対象下端高さが十分に小さくなるパラメータの組合せを探す必要があるためである。このため、未知のパラメータが一つのみの場合(例えば、カメラ101の設置位置及び方向が固定されてその角度が既に得られており、ズーム機能によって画角のみが可変である場合など)には、一つの一致対象についてS905〜S911を繰り返し実行することで、そのパラメータの値を特定することができる。この場合は、一つの一致対象について計算された対象下端高さが、カメラ状態の誤差の大きさを示す指標として用いられる。   As illustrated in FIG. 8, the camera state estimation unit 111 executes the processing after S904 when a plurality of matching targets are input. This is because when the two or more independent parameters included in the camera state 507 are unknown, such as the depression angle and the angle of view of the camera 101, the target bottom height is sufficiently high for two or more matching targets. This is because it is necessary to search for a combination of parameters to be reduced. Therefore, when there is only one unknown parameter (for example, when the installation position and direction of the camera 101 are fixed and the angle is already obtained, and only the angle of view is variable by the zoom function). By repeatedly executing S905 to S911 for one matching target, the value of the parameter can be specified. In this case, the target lower end height calculated for one matching target is used as an index indicating the magnitude of the error in the camera state.

図9は、本発明の実施例1の状態推定用データベース更新処理のフローチャートである。   FIG. 9 is a flowchart of the state estimation database update process according to the first embodiment of the present invention.

まず、データベース情報設定部609は、カメラ状態推定用データベース105に追加する検知対象の画像を選択する処理を実行する(S1001)。次に、データベース情報設定部609は、カメラ状態推定用データベース105に追加する検知対象の大きさ(例えば高さ)の情報を入力する処理を実行する(S1002)。次に、データベース情報設定部609は、検知対象の大きさ(例えば高さ)を測定した基準点の情報を指定する処理を実行する(S1003)。S1001からS1003の処理の具体例については図10を参照して後述する。   First, the database information setting unit 609 executes processing for selecting an image to be detected to be added to the camera state estimation database 105 (S1001). Next, the database information setting unit 609 executes processing for inputting information on the size (for example, height) of the detection target to be added to the camera state estimation database 105 (S1002). Next, the database information setting unit 609 executes processing for designating information on a reference point obtained by measuring the size (for example, height) of the detection target (S1003). A specific example of the processing from S1001 to S1003 will be described later with reference to FIG.

次に、データベース情報設定部609は、S1001からS1003で入力された情報をカメラ状態推定用データベース105に追加する処理を実行する(S1004)。具体的には、例えば、データベース情報設定部609が、S1001からS1003で入力された情報を、ネットワークI/F623及びネットワーク604を介してカメラ状態推定装置100に送信し、カメラ状態推定装置100のデータベース更新部612がその情報を記憶装置104のカメラ状態推定用データベース105に追加する。   Next, the database information setting unit 609 executes processing for adding the information input in S1001 to S1003 to the camera state estimation database 105 (S1004). Specifically, for example, the database information setting unit 609 transmits the information input in S1001 to S1003 to the camera state estimation apparatus 100 via the network I / F 623 and the network 604, and the database of the camera state estimation apparatus 100 The update unit 612 adds the information to the camera state estimation database 105 in the storage device 104.

次に、データベース更新部612は、カメラ状態推定用データベース105に十分な量のデータを追加したかどうかを判定する(S1005)。追加データの量に不足がある場合(S1005:No)にはデータベース更新部612は再度S1001からS1004の処理を繰り返す。追加データの量が十分である場合(S1005:Yes)には状態推定用データベース更新処理を完了する。   Next, the database update unit 612 determines whether or not a sufficient amount of data has been added to the camera state estimation database 105 (S1005). When the amount of additional data is insufficient (S1005: No), the database update unit 612 repeats the processing from S1001 to S1004 again. If the amount of additional data is sufficient (S1005: Yes), the state estimation database update process is completed.

追加データの量が十分か否かの判定は、カメラ101の設置環境等に応じた基準に基づいて行うことができる。例えば、データベース更新部612は、追加された検知対象の数又は検知対象の種類(例えば人、自動車等)の数が所定の閾値を超えた場合に、十分な量のデータが追加されたと判定してもよい。   The determination of whether or not the amount of additional data is sufficient can be made based on a criterion according to the installation environment of the camera 101 or the like. For example, the database update unit 612 determines that a sufficient amount of data has been added when the number of added detection targets or the number of detection target types (for example, people, cars, etc.) exceeds a predetermined threshold. May be.

具体的には、例えば、人通りは多いが自動車が走行しない道路等にカメラ101が設置されている場合、所定の数の人物に関するデータが追加されたときに、追加データの量が十分であると判定されてもよい。常に多くの人が撮影される環境では、一人の人物のデータがデータベースに格納されていれば、カメラ状態の推定が可能となる場合もある。人と車両の両方が撮影され得る環境では、所定の数の人物と車両のデータが追加されたときに、追加データの量が十分であると判定されてもよい。   Specifically, for example, when the camera 101 is installed on a road where there are many people but a car does not travel, the amount of additional data is sufficient when data on a predetermined number of people is added. May be determined. In an environment where many people are always photographed, if the data of one person is stored in the database, the camera state may be estimated. In an environment where both a person and a vehicle can be photographed, it may be determined that the amount of additional data is sufficient when data for a predetermined number of persons and vehicles are added.

あるいは、例えばカメラ101が高所に設置され、広い範囲を監視する場合、看板又は建物のように固定された検知対象が主に追加されることが想定される。このような場合には、データを追加したことによって、カメラ101の画角及び方向が可動範囲内のいかなる値であったとしても必ず所定の数の検知対象が画像内に含まれるようになったときに、十分な量のデータが追加されたと判定してもよい。   Alternatively, for example, when the camera 101 is installed at a high place and a wide range is monitored, it is assumed that a detection target fixed like a signboard or a building is mainly added. In such a case, by adding data, a predetermined number of detection targets are always included in the image regardless of the angle of view and direction of the camera 101 within the movable range. Sometimes it may be determined that a sufficient amount of data has been added.

あるいは、十分な量のデータが追加されたか否かをユーザが判定し、その結果をデータベース更新装置601に入力してもよい。その場合は、入力された判定結果がデータベース更新装置601からカメラ状態推定装置100に送信され、それに基づいてデータベース更新部612がS1005の判定を行ってもよい。   Alternatively, the user may determine whether a sufficient amount of data has been added and input the result to the database update device 601. In this case, the input determination result may be transmitted from the database update device 601 to the camera state estimation device 100, and the database update unit 612 may make the determination in S1005 based on the result.

図10は、本発明の実施例1のデータベース更新装置601における表示の一例の説明図である。   FIG. 10 is an explanatory diagram illustrating an example of display in the database update device 601 according to the first embodiment of this invention.

図10の表示用装置701は図3の表示用装置608に、図10の文字入力用端末702(例えばキーボード)及びカーソル操作用端末703(例えばマウス)は図3の入力用端末607に相当する。表示用装置701には文字入力用端末702及びカーソル操作用端末703が接続される。表示用装置701の画面上にはカメラ画像704とカメラ状態推定用データベースのデータ情報表示フィールド705と高さ入力用フィールド706とデータベース追加処理実行用ボタン707とカメラ状態推定開始用ボタン708とカーソル709とカーソル操作結果として得られた領域710とが表示される。カメラ画像704は、カメラ101が撮影した画像であり、画像取得部617によって取得される。   The display device 701 in FIG. 10 corresponds to the display device 608 in FIG. 3, and the character input terminal 702 (for example, keyboard) and the cursor operation terminal 703 (for example, mouse) in FIG. 10 correspond to the input terminal 607 in FIG. . A character input terminal 702 and a cursor operation terminal 703 are connected to the display device 701. On the screen of the display device 701, a camera image 704, a data information display field 705 for a camera state estimation database, a height input field 706, a database addition process execution button 707, a camera state estimation start button 708, and a cursor 709 are displayed. And an area 710 obtained as a result of the cursor operation are displayed. A camera image 704 is an image captured by the camera 101 and is acquired by the image acquisition unit 617.

高さ入力用フィールド706には文字入力用端末702から入力される高さ情報が表示される。カーソル709はカーソル操作用端末703によって操作される。ユーザは、追加対象画像選択処理S1001において、カーソル操作によって、これからデータを追加しようとする検知対象(図10の例では郵便差出箱)を含む画像上の一部の領域710を選択する事ができる。さらに、ユーザは、追加対象高さ入力処理S1002において、選択した領域の検知対象の高さ情報を高さ入力用フィールド706に入力する。さらに、ユーザは、対象基準点情報指定処理S1003において、カーソル操作によって、選択した領域の検知対象の基準点711を指定する。例えば、検知対象が郵便差出箱である場合はその上面の画素、検知対象が人である場合には頭頂部の画素等が基準点711として指定される。   Height information input from the character input terminal 702 is displayed in the height input field 706. The cursor 709 is operated by the cursor operation terminal 703. In the addition target image selection process S1001, the user can select a part of the area 710 on the image including the detection target (post box in the example of FIG. 10) to which data is to be added by a cursor operation. . Further, the user inputs the height information of the detection target of the selected area in the height input field 706 in the additional target height input process S1002. Further, in the target reference point information specifying process S1003, the user specifies the reference point 711 to be detected in the selected area by operating the cursor. For example, when the detection target is a mail box, a pixel on the upper surface thereof is designated as the reference point 711, and when the detection target is a person, a pixel at the top of the head is designated as the reference point 711.

データベース追加処理S1004において、ユーザがカーソル操作用端末703を用いてデータベース追加処理実行用ボタン707を操作すると、データベース情報設定部609は、カーソル709を用いて選択された領域710の画像データと、高さ入力用フィールド706に入力された高さ情報と、指定された基準点711の画像上の座標値と、をカメラ状態推定装置100に送信する。   In the database addition process S1004, when the user operates the database addition process execution button 707 using the cursor operation terminal 703, the database information setting unit 609 causes the image data of the area 710 selected using the cursor 709, The height information input in the input field 706 and the coordinate value on the image of the designated reference point 711 are transmitted to the camera state estimation apparatus 100.

これらの情報を受信したカメラ状態推定装置100のデータベース更新部612は、受信した情報に基づいて、カメラ状態推定用データベース105の新しいレコードの対象画像303に受信した領域710の画像データを、特徴量304にその画像データから計算された特徴量を、基準位置座標305に受信した基準点711の座標を、高さ306に高さ情報を、それぞれ追加することによって、カメラ状態推定用データベース105を更新する。   The database update unit 612 of the camera state estimation apparatus 100 that has received these pieces of information uses the image data of the area 710 received in the target image 303 of the new record in the camera state estimation database 105 as a feature amount based on the received information. The camera state estimation database 105 is updated by adding the feature amount calculated from the image data to 304, the coordinates of the reference point 711 received to the reference position coordinates 305, and the height information to the height 306, respectively. To do.

カメラ状態推定用データベース105が更新された後、データベース情報取得部611は、更新された結果をデータ情報表示フィールド705に表示する。ユーザがカメラ状態推定開始用ボタン708を操作すると、カメラ状態推定信号出力部610がカメラ状態推定処理を開始する信号を生成し、カメラ状態推定装置100に送信する。その信号を受信したカメラ状態推定装置100によってカメラ状態推定処理が実行される。   After the camera state estimation database 105 is updated, the database information acquisition unit 611 displays the updated result in the data information display field 705. When the user operates the camera state estimation start button 708, the camera state estimation signal output unit 610 generates a signal for starting the camera state estimation process and transmits the signal to the camera state estimation apparatus 100. A camera state estimation process is executed by the camera state estimation apparatus 100 that has received the signal.

図10の例では入力用端末607としてマウス及びキーボードなどを想定しているが、タッチパネルなどを用いても良い。また図10の表示用装置701はカメラ画像を1枚表示しているが、複数のカメラの画像を同時に表示しても良い。また、表示用装置701は、カメラ状態推定用データベース105から削除するレコードを指定するためのフィールドなどを表示しても良い。   In the example of FIG. 10, a mouse and a keyboard are assumed as the input terminal 607, but a touch panel or the like may be used. In addition, although the display device 701 in FIG. 10 displays one camera image, images from a plurality of cameras may be displayed simultaneously. The display device 701 may display a field for designating a record to be deleted from the camera state estimation database 105.

以上の実施例1によれば、地面に接地している検知対象の大きさにかかわる情報と画像とを対応付けたデータベースを用意し、カメラ画像中に存在する検知対象を検出することで、検出された検知対象の大きさ情報からカメラの状態を推定することができる。またデータベースを検知対象の画像及び大きさ情報といった簡易な情報で構成することで、データベースの更新作業が容易にできる。これによって、データベースに登録された検知対象が画像に映っていれば、逐一カメラ状態を推定することが可能となる。またデータベースは必要に応じて適宜更新ができるため、カメラが映している環境に合わせてデータベースを更新することで、より精度良くカメラ状態を推定することが可能となる。   According to the first embodiment described above, a database in which information related to the size of a detection target touching the ground is associated with an image is prepared, and detection is performed by detecting the detection target existing in the camera image. The state of the camera can be estimated from the detected size information of the detection target. In addition, the database can be easily updated by configuring the database with simple information such as the image to be detected and the size information. As a result, if the detection target registered in the database is reflected in the image, the camera state can be estimated one by one. In addition, since the database can be updated as necessary, the camera state can be estimated more accurately by updating the database according to the environment in which the camera is projected.

次に、本発明の実施例2を、図11を用いて説明する。以下に説明する相違点を除き、実施例2の画像認識システムの各部は、図1〜図10に示された実施例1の同一の符号を付された各部と同一の機能を有するため、それらの説明は省略する。   Next, Embodiment 2 of the present invention will be described with reference to FIG. Except for differences described below, each part of the image recognition system according to the second embodiment has the same function as each part denoted by the same reference numeral in the first embodiment shown in FIGS. Description of is omitted.

本実施例では、カメラ101がカメラ状態推定用データベース105、画像マッチング処理部110及びカメラ状態推定部111を備える。   In this embodiment, the camera 101 includes a camera state estimation database 105, an image matching processing unit 110, and a camera state estimation unit 111.

図11は、本発明の実施例2の画像認識システムのハードウェア構成を示すブロック図である。   FIG. 11 is a block diagram illustrating a hardware configuration of the image recognition system according to the second embodiment of the present invention.

図11に示す構成のうち実施例1の図1に示すカメラ状態推定用データベース105、画像マッチング処理部110、カメラ状態推定部111、図3に示す入力用端末607、表示用装置608、データベース情報設定部609、カメラ状態推定信号出力部610、データベース情報取得部611、データベース更新部612、カメラ状態設定部613、画像認識処理部615、及び画像取得部617と同じ構成は、同じ符号を付与し、説明を省略する。   11, the camera state estimation database 105, the image matching processing unit 110, the camera state estimation unit 111, the input terminal 607, the display device 608, and the database information illustrated in FIG. 3 in the configuration illustrated in FIG. The same components as the setting unit 609, the camera state estimation signal output unit 610, the database information acquisition unit 611, the database update unit 612, the camera state setting unit 613, the image recognition processing unit 615, and the image acquisition unit 617 are assigned the same reference numerals. The description is omitted.

すなわち、本実施例のカメラ101は、図3に示す実施例1のカメラ101に、カメラ状態推定装置100と同等の機能と、画像認識処理装置603の表示用装置614以外の部分の機能とを追加したものであるとも言え、図3に示す実施例1のカメラ状態推定装置100に、実施例1のカメラ101と同等の機能と、画像認識処理装置603の表示用装置614以外の部分の機能とを追加したものであるとも言える。   That is, the camera 101 of the present embodiment has functions equivalent to those of the camera state estimation device 100 and functions of portions other than the display device 614 of the image recognition processing device 603 in addition to the camera 101 of the first embodiment shown in FIG. It can be said that the camera state estimation apparatus 100 according to the first embodiment illustrated in FIG. 3 has functions equivalent to those of the camera 101 according to the first embodiment and functions other than the display apparatus 614 of the image recognition processing apparatus 603. It can also be said that these are added.

本実施例のカメラ101は、プロセッサ1102、メモリ1103、ネットワークI/F1104、画像撮影部1101及び記憶装置1105を備える。   The camera 101 according to the present exemplary embodiment includes a processor 1102, a memory 1103, a network I / F 1104, an image photographing unit 1101, and a storage device 1105.

プロセッサ1102は、メモリ1103に格納されたプログラムを実行することによって、本実施例のカメラ101の種々の機能を実現する。   The processor 1102 implements various functions of the camera 101 according to the present exemplary embodiment by executing a program stored in the memory 1103.

メモリ1103には、プロセッサ1102によって実行されるプログラムモジュールである画像マッチング処理部110、カメラ状態推定部111、カメラ状態推定信号出力部610、データベース更新部612、カメラ状態設定部613及び画像認識処理部615が格納される。実施例1と同様、これらの各部は機能ブロックとして扱われるが、実際には各部の処理はプロセッサ1102が各プログラムモジュールに記述された命令に従って実行する。また、実施例1と同様、上記の機能ブロックの任意の一部又は全部が専用のハードウェアによって実現されてもよい。   The memory 1103 includes an image matching processing unit 110, a camera state estimation unit 111, a camera state estimation signal output unit 610, a database update unit 612, a camera state setting unit 613, and an image recognition processing unit, which are program modules executed by the processor 1102. 615 is stored. As in the first embodiment, each of these units is handled as a functional block, but in actuality, the processing of each unit is executed by the processor 1102 according to instructions described in each program module. As in the first embodiment, any part or all of the functional blocks may be realized by dedicated hardware.

ネットワークI/F1104は、ネットワーク604に接続され、ネットワーク604を介してデータベース更新装置601等との通信を行うインターフェースである。   A network I / F 1104 is an interface that is connected to the network 604 and communicates with the database update device 601 and the like via the network 604.

画像撮影部1101は、レンズ及び撮像素子等からなる光学系を有し、それらを用いて画像撮影を行う。本実施例のカメラ101は、画像撮影部1101が撮影した画像と、カメラ状態推定用データベース105に保存された情報とを用いて、画像認識処理部615の処理に必要なカメラ状態を推定することができる。   The image capturing unit 1101 has an optical system including a lens and an image sensor, and performs image capturing using them. The camera 101 according to the present embodiment estimates the camera state necessary for the processing of the image recognition processing unit 615 using the image captured by the image capturing unit 1101 and the information stored in the camera state estimation database 105. Can do.

記憶装置1105は、例えばハードディスクドライブ又はフラッシュメモリのようないわゆる補助記憶装置であり、カメラ状態推定用データベース105を格納する。データベース更新部612は、外部から(例えばデータベース更新装置からネットワーク604を介して)入力される情報を用いてカメラ状態推定用データベース105を更新する。   The storage device 1105 is a so-called auxiliary storage device such as a hard disk drive or a flash memory, and stores the camera state estimation database 105. The database update unit 612 updates the camera state estimation database 105 using information input from the outside (for example, from the database update device via the network 604).

本実施例のデータベース更新装置601は、実施例1のデータベース更新装置601(図3)と同様に、プロセッサ621、メモリ622、ネットワークI/F623、入力用端末607及び表示用装置608を備える。メモリ622には、プロセッサ621によって実行されるプログラムモジュールであるデータベース情報設定部609、データベース情報取得部611、画像取得部617及び画像認識結果取得部1106が格納される。画像認識結果取得部1106は、カメラ101で処理された画像認識結果を取得し、表示用装置608に表示する。本実施例のデータベース更新装置601は、データベース更新機能と、カメラ映像の画像認識結果表示機能とを備えるが、それらの機能を別々の装置に分けても良い。   Similar to the database update device 601 (FIG. 3) of the first embodiment, the database update device 601 of the present embodiment includes a processor 621, a memory 622, a network I / F 623, an input terminal 607, and a display device 608. The memory 622 stores a database information setting unit 609, a database information acquisition unit 611, an image acquisition unit 617, and an image recognition result acquisition unit 1106, which are program modules executed by the processor 621. The image recognition result acquisition unit 1106 acquires the image recognition result processed by the camera 101 and displays it on the display device 608. The database update device 601 of this embodiment includes a database update function and a camera video image recognition result display function. However, these functions may be divided into separate devices.

以上のように、本実施例においては、カメラ101内部にカメラ状態推定用データベース105と画像マッチング処理部110とカメラ状態推定部111を備えることで、実施例1のカメラ状態推定装置100が行うものと同様の処理をカメラ101内部で実行することができる。これによって、カメラ101が複数台に増えたときも、カメラ状態推定処理を各カメラ101で実施することができるため、システム全体にかかる負荷を各カメラ101に分散することで演算負荷を低減することが可能となる。   As described above, in the present embodiment, the camera state estimation apparatus 100 according to the first embodiment performs by providing the camera state estimation database 105, the image matching processing unit 110, and the camera state estimation unit 111 in the camera 101. The same processing as that described above can be executed inside the camera 101. As a result, even when the number of cameras 101 is increased, the camera state estimation process can be performed by each camera 101. Therefore, the calculation load can be reduced by distributing the load on the entire system to each camera 101. Is possible.

次に、本発明の実施例3を、図12を用いて説明する。以下に説明する相違点を除き、実施例2の画像認識システムの各部は、図1〜図10に示された実施例1又は図11に示された実施例2の各部と同一の機能を有するため、それらの図示及び説明は省略する。   Next, Embodiment 3 of the present invention will be described with reference to FIG. Except for the differences described below, each part of the image recognition system according to the second embodiment has the same function as each part according to the first embodiment shown in FIGS. 1 to 10 or the second embodiment shown in FIG. Therefore, illustration and description thereof are omitted.

具体的には、実施例3の画像認識システムは、カメラ状態推定用データベース105の代わりに(又はそれに加えて)カメラ状態推定用データベース1201を有し、それを利用した処理を行うという点を除き、実施例1又は実施例2の画像認識システムと同様である。   Specifically, the image recognition system according to the third embodiment has a camera state estimation database 1201 instead of (or in addition to) the camera state estimation database 105, and performs processing using the same. This is the same as the image recognition system of the first or second embodiment.

図12は、本発明の実施例3におけるカメラ状態推定用データベース1201の一例の説明図である。   FIG. 12 is an explanatory diagram of an example of the camera state estimation database 1201 according to the third embodiment of the present invention.

図12に示すカメラ状態推定用データベース1201は、実施例1の図4に示すカメラ状態推定用データベース105が保持する対象のID302、対象画像303、特徴量304、基準位置305及び高さ306に加え、対象の幅1202及び対象の位置情報(例えば緯度経度)1203を保持する。   The camera state estimation database 1201 shown in FIG. 12 is in addition to the target ID 302, target image 303, feature amount 304, reference position 305, and height 306 held in the camera state estimation database 105 shown in FIG. The object width 1202 and the object position information (for example, latitude and longitude) 1203 are held.

対象足元座標算出部508は、図12に示すカメラ状態推定用データベース1201を参照して、検知対象が画像内から検知された場合に、高さ306だけでなく幅1202も用いて、より高精度に検知対象の足元座標を算出することが可能となる(S907)。また、カメラ状態推定部111は、検知対象の位置情報1203を参照することで、カメラ101の向いている方向を推定することが可能となる。例えば、画像中にID302が「1」の検知対象が存在したことが検知できた場合には、カメラの視野内に、位置情報1203として登録された緯度経度(35、139)によって特定される地点の方角が含まれることが分かる。この方角を特定するために、カメラ状態推定部111は、緯度経度の値を、図2に示す実空間の座標系における座標値に変換してもよいし、はじめから図2に示す実空間の座標値を位置情報1203としてカメラ状態推定用データベース1201に格納してもよい。   The target foot coordinate calculation unit 508 refers to the camera state estimation database 1201 shown in FIG. 12 and uses not only the height 306 but also the width 1202 when the detection target is detected from within the image. It is possible to calculate the foot coordinates of the detection target (S907). The camera state estimation unit 111 can estimate the direction in which the camera 101 is facing by referring to the position information 1203 of the detection target. For example, when it can be detected that a detection target with ID 302 of “1” exists in the image, a point specified by latitude and longitude (35, 139) registered as position information 1203 in the field of view of the camera It can be seen that the direction is included. In order to specify this direction, the camera state estimation unit 111 may convert the latitude and longitude values into coordinate values in the coordinate system of the real space shown in FIG. 2, or from the beginning of the real space shown in FIG. The coordinate value may be stored in the camera state estimation database 1201 as the position information 1203.

以上のように、本実施例においては、カメラ状態推定用データベース1201に複数種類の大きさに関する情報が含まれ、さらに位置に関する情報が含まれる。これによって、より高精度にカメラ状態を推定でき、さらにカメラの向いている方向も推定可能となる。   As described above, in this embodiment, the camera state estimation database 1201 includes information on a plurality of types of sizes, and further includes information on the position. As a result, the camera state can be estimated with higher accuracy, and the direction in which the camera is facing can also be estimated.

なお、本発明は上述した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることも可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。   In addition, this invention is not limited to the Example mentioned above, Various modifications are included. For example, the above-described embodiments have been described in detail for easy understanding of the present invention, and are not necessarily limited to those having all the configurations described. Further, a part of the configuration of a certain embodiment can be replaced with the configuration of another embodiment, and the configuration of another embodiment can be added to the configuration of a certain embodiment. Further, it is possible to add, delete, and replace other configurations for a part of the configuration of each embodiment.

上記の各構成、機能、処理部、処理手段等は、それらの一部または全部を、例えば集積回路で設計する等によってハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによってソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスクドライブ、SSD(Solid State Drive)等の記憶装置、または、ICカード、SDカード、DVD等の計算機読み取り可能な非一時的データ記憶媒体に格納することができる。   Each of the above-described configurations, functions, processing units, processing means, and the like may be realized by hardware by designing a part or all of them with, for example, an integrated circuit. Further, each of the above-described configurations, functions, and the like may be realized by software by interpreting and executing a program that realizes each function by the processor. Information such as programs, tables, and files for realizing each function is a memory, a hard disk drive, a storage device such as an SSD (Solid State Drive), or a computer-readable non-transitory data such as an IC card, an SD card, or a DVD. It can be stored in a storage medium.

また、図面には、実施例を説明するために必要と考えられる制御線及び情報線を示しており、必ずしも、本発明が適用された実際の製品に含まれる全ての制御線及び情報線を示しているとは限らない。実際にはほとんど全ての構成が相互に接続されていると考えてもよい。   Further, the drawings show control lines and information lines that are considered necessary for explaining the embodiments, and not necessarily all control lines and information lines included in an actual product to which the present invention is applied. Not necessarily. Actually, it may be considered that almost all the components are connected to each other.

Claims (15)

カメラと、ネットワークを介して前記カメラに接続されるカメラ状態推定装置と、を有する画像認識システムであって、
前記カメラ状態推定装置は、前記ネットワークに接続される第1インターフェースと、前記第1インターフェースに接続される第1プロセッサと、前記第1プロセッサに接続される第1記憶装置と、を有し、
前記第1記憶装置は、検知対象の画像の特徴量と、前記検知対象の実空間における大きさと、前記カメラの状態を示す一つ以上のパラメータの推定値と、を保持し、
前記カメラは、画像を撮影して前記カメラ状態推定装置に送信し、
前記第1プロセッサは、
前記カメラによって撮影された画像から、前記第1記憶装置に保持された特徴量に基づいて、前記検知対象と類似する対象を抽出し、
前記検知対象の実空間における大きさと、前記一つ以上のパラメータの推定値と、前記類似する対象の前記画像内の位置及び大きさと、に基づいて、前記一つ以上のパラメータの推定値の誤差の大きさを示す指標を計算し、
前記計算された誤差の大きさを示す指標が所定の条件を満たさない場合に、前記一つ以上のパラメータの推定値を変更することを特徴とする画像認識システム。
An image recognition system comprising a camera and a camera state estimation device connected to the camera via a network,
The camera state estimation device includes a first interface connected to the network, a first processor connected to the first interface, and a first storage device connected to the first processor,
The first storage device holds a feature amount of an image to be detected, a size of the detection target in real space, and an estimated value of one or more parameters indicating a state of the camera,
The camera captures an image and transmits it to the camera state estimation device,
The first processor is
Extracting a target similar to the detection target based on the feature amount held in the first storage device from the image captured by the camera,
An error in the estimated value of the one or more parameters based on the size of the detection target in real space, the estimated value of the one or more parameters, and the position and size of the similar target in the image. Calculate an indicator of the size of
An image recognition system, wherein an estimated value of the one or more parameters is changed when an index indicating the calculated error size does not satisfy a predetermined condition.
請求項1に記載の画像認識システムであって、
前記検知対象の実空間における大きさは、前記検知対象の下端から前記検知対象の所定の基準点までの高さを含み、
前記第1プロセッサは、
前記検知対象の実空間における大きさと、前記一つ以上のパラメータの推定値と、前記類似する対象の前記基準点の前記画像内の位置と、前記類似する対象の前記画像内の大きさと、に基づいて、前記類似する対象の下端の実空間における第1座標値を計算し、
前記計算された第1座標値のうち水平面内の座標値と、前記一つ以上のパラメータの推定値と、前記類似する対象の下端の前記画像内の位置と、に基づいて、前記類似する対象の下端の実空間における第2座標値を計算し、
前記第1座標値と前記第2座標値との相違を前記誤差の大きさを示す指標として計算し、
前記計算された相違が所定の値より小さい場合に、前記誤差の大きさを示す指標が所定の条件を満たすと判定することを特徴とする画像認識システム。
The image recognition system according to claim 1,
The size of the detection target in real space includes a height from a lower end of the detection target to a predetermined reference point of the detection target;
The first processor is
The size of the detection target in real space, the estimated value of the one or more parameters, the position of the reference point of the similar target in the image, and the size of the similar target in the image. Based on the first coordinate value in the real space at the lower end of the similar object,
The similar target based on the calculated coordinate value in the horizontal plane among the first coordinate values, the estimated value of the one or more parameters, and the position of the lower end of the similar target in the image. Calculate the second coordinate value in real space at the bottom of
The difference between the first coordinate value and the second coordinate value is calculated as an index indicating the magnitude of the error,
An image recognition system, wherein, when the calculated difference is smaller than a predetermined value, it is determined that the index indicating the magnitude of the error satisfies a predetermined condition.
請求項2に記載の画像認識システムであって、
前記第1記憶装置は、前記カメラの状態を示す複数のパラメータの推定値を保持し、
前記第1プロセッサは、
前記カメラによって撮影された画像から、前記検知対象と類似する複数の対象を抽出し、
前記類似する複数の対象の各々の実空間における前記第1座標値を計算し、
前記類似する複数の対象の各々の下端の実空間における前記第2座標値を計算し、
前記類似する複数の対象の各々について、前記第1座標値と前記第2座標値との相違の合計を前記誤差の大きさを示す指標として計算し、
前記計算された相違の合計が所定の値より小さい場合に、前記誤差の大きさを示す指標が所定の条件を満たすと判定することを特徴とする画像認識システム。
The image recognition system according to claim 2,
The first storage device holds estimated values of a plurality of parameters indicating the state of the camera,
The first processor is
Extracting a plurality of objects similar to the detection object from the image taken by the camera,
Calculating the first coordinate value in the real space of each of the plurality of similar objects;
Calculating the second coordinate value in real space at the lower end of each of the plurality of similar objects;
For each of the plurality of similar objects, the sum of differences between the first coordinate value and the second coordinate value is calculated as an index indicating the magnitude of the error,
An image recognition system according to claim 1, wherein when the calculated difference sum is smaller than a predetermined value, the index indicating the magnitude of the error is determined to satisfy a predetermined condition.
請求項1に記載の画像認識システムであって、
前記一つ以上のパラメータの推定値は、前記カメラの画角の推定値と、前記カメラの撮影方向を示す角度の推定値と、の少なくとも一方を含むことを特徴とする画像認識システム。
The image recognition system according to claim 1,
The estimated value of the one or more parameters includes at least one of an estimated value of an angle of view of the camera and an estimated value of an angle indicating a shooting direction of the camera.
請求項1に記載の画像認識システムであって、
前記検知対象の実空間における大きさは、前記検知対象の実空間における高さ及び幅の少なくとも一方を含むことを特徴とする画像認識システム。
The image recognition system according to claim 1,
The size in the real space of the detection target includes at least one of a height and a width in the real space of the detection target.
請求項1に記載の画像認識システムであって、
前記第1記憶装置は、前記検知対象の実空間における座標値をさらに保持し、
前記一つ以上のパラメータの推定値は、前記カメラの撮影方向を示す角度の推定値を含み、
前記第1プロセッサは、
前記保持された座標値と、前記類似する対象の前記画像内の位置と、に基づいて、前記カメラの撮影方向を示す角度を計算することを特徴とする画像認識システム。
The image recognition system according to claim 1,
The first storage device further holds coordinate values in the real space to be detected,
The estimated value of the one or more parameters includes an estimated value of an angle indicating a shooting direction of the camera,
The first processor is
An image recognition system, wherein an angle indicating a shooting direction of the camera is calculated based on the held coordinate value and the position of the similar target in the image.
請求項1に記載の画像認識システムであって、
前記ネットワークに接続されるデータベース更新装置をさらに有し、
前記データベース更新装置は、前記ネットワークに接続される第2インターフェースと、前記第2インターフェースに接続される第2プロセッサと、前記第2プロセッサに接続される第2記憶装置と、前記第2プロセッサに接続される表示装置と、前記第2プロセッサに接続される入力装置と、を有し、
前記表示装置は、前記カメラによって撮影された画像を表示し、
前記入力装置は、前記表示された画像のうち、検知対象を含む領域及び当該検知対象の大きさを指定する情報の入力を受け付け、
前記第2プロセッサは、前記第2インターフェースを介して、前記入力された情報を前記カメラ状態推定装置に送信し、
前記第1プロセッサは、前記データベース更新装置から受信した情報に基づいて、前記指定された検知対象の画像の特徴量と、前記検知対象の大きさと、を前記第1記憶装置に追加することを特徴とする画像認識システム。
The image recognition system according to claim 1,
A database update device connected to the network;
The database update device is connected to a second interface connected to the network, a second processor connected to the second interface, a second storage device connected to the second processor, and the second processor. A display device, and an input device connected to the second processor,
The display device displays an image captured by the camera;
The input device receives an input of information specifying a region including a detection target and a size of the detection target in the displayed image,
The second processor transmits the input information to the camera state estimation device via the second interface,
The first processor adds the feature amount of the designated detection target image and the size of the detection target to the first storage device based on information received from the database update device. Image recognition system.
プロセッサと、前記プロセッサに接続される記憶装置と、を有するカメラ状態推定装置であって、
前記記憶装置は、検知対象の画像の特徴量と、前記検知対象の実空間における大きさと、カメラの状態を示す一つ以上のパラメータの推定値と、を保持し、
前記プロセッサは、
前記カメラによって撮影された画像から、前記記憶装置に保持された特徴量に基づいて、前記検知対象と類似する対象を抽出し、
前記検知対象の実空間における大きさと、前記一つ以上のパラメータの推定値と、前記類似する対象の前記画像内の位置及び大きさと、に基づいて、前記一つ以上のパラメータの推定値の誤差の大きさを示す指標を計算し、
前記誤差の大きさを示す指標が所定の条件を満たさない場合に、前記一つ以上のパラメータの推定値を変更し、
前記誤差の大きさを示す指標が所定の条件を満たす場合に、前記一つ以上のパラメータの推定値を出力することを特徴とするカメラ状態推定装置。
A camera state estimation device having a processor and a storage device connected to the processor,
The storage device holds a feature amount of an image to be detected, a size of the detection target in real space, and an estimated value of one or more parameters indicating a camera state,
The processor is
From the image taken by the camera, based on the feature amount held in the storage device, extract a target similar to the detection target,
An error in the estimated value of the one or more parameters based on the size of the detection target in real space, the estimated value of the one or more parameters, and the position and size of the similar target in the image. Calculate an indicator of the size of
If the index indicating the magnitude of the error does not satisfy a predetermined condition, change the estimated value of the one or more parameters,
An apparatus for estimating a camera state, wherein an estimated value of the one or more parameters is output when an index indicating the magnitude of the error satisfies a predetermined condition.
請求項8に記載のカメラ状態推定装置であって、
前記検知対象の実空間における大きさは、前記検知対象の下端から前記検知対象の所定の基準点までの高さを含み、
前記プロセッサは、
前記検知対象の実空間における大きさと、前記一つ以上のパラメータの推定値と、前記類似する対象の前記基準点の前記画像内の位置と、前記類似する対象の前記画像内の大きさと、に基づいて、前記類似する対象の下端の実空間における第1座標値を計算し、
前記計算された第1座標値のうち水平面内の座標値と、前記一つ以上のパラメータの推定値と、前記類似する対象の下端の前記画像内の位置と、に基づいて、前記類似する対象の下端の実空間における第2座標値を計算し、
前記第1座標値と前記第2座標値との相違を前記誤差の大きさを示す指標として計算し、
前記計算された相違が所定の値より小さい場合に、前記誤差の大きさを示す指標が所定の条件を満たすと判定することを特徴とするカメラ状態推定装置。
The camera state estimation device according to claim 8,
The size of the detection target in real space includes a height from a lower end of the detection target to a predetermined reference point of the detection target;
The processor is
The size of the detection target in real space, the estimated value of the one or more parameters, the position of the reference point of the similar target in the image, and the size of the similar target in the image. Based on the first coordinate value in the real space at the lower end of the similar object,
The similar target based on the calculated coordinate value in the horizontal plane among the first coordinate values, the estimated value of the one or more parameters, and the position of the lower end of the similar target in the image. Calculate the second coordinate value in real space at the bottom of
The difference between the first coordinate value and the second coordinate value is calculated as an index indicating the magnitude of the error,
An apparatus for estimating a camera state, wherein, when the calculated difference is smaller than a predetermined value, it is determined that an index indicating the magnitude of the error satisfies a predetermined condition.
請求項9に記載のカメラ状態推定装置であって、
前記記憶装置は、前記カメラの状態を示す複数のパラメータの推定値を保持し、
前記プロセッサは、
前記カメラによって撮影された画像から、前記検知対象と類似する複数の対象を抽出し、
前記類似する複数の対象の各々の実空間における前記第1座標値を計算し、
前記類似する複数の対象の各々の下端の実空間における前記第2座標値を計算し、
前記類似する複数の対象の各々について、前記第1座標値と前記第2座標値との相違の合計を前記誤差の大きさを示す指標として計算し、
前記計算された相違の合計が所定の値より小さい場合に、前記誤差の大きさを示す指標が所定の条件を満たすと判定することを特徴とするカメラ状態推定装置。
The camera state estimation apparatus according to claim 9,
The storage device holds estimated values of a plurality of parameters indicating the state of the camera,
The processor is
Extracting a plurality of objects similar to the detection object from the image taken by the camera,
Calculating the first coordinate value in the real space of each of the plurality of similar objects;
Calculating the second coordinate value in real space at the lower end of each of the plurality of similar objects;
For each of the plurality of similar objects, the sum of differences between the first coordinate value and the second coordinate value is calculated as an index indicating the magnitude of the error,
An apparatus for estimating a camera state, wherein an index indicating the magnitude of an error is determined to satisfy a predetermined condition when the calculated total difference is smaller than a predetermined value.
請求項8に記載のカメラ状態推定装置であって、
前記一つ以上のパラメータの推定値は、前記カメラの画角の推定値と、前記カメラの撮影方向を示す角度の推定値と、の少なくとも一方を含むことを特徴とするカメラ状態推定装置。
The camera state estimation device according to claim 8,
The estimated value of the one or more parameters includes at least one of an estimated value of an angle of view of the camera and an estimated value of an angle indicating a shooting direction of the camera.
請求項8に記載のカメラ状態推定装置であって、
前記検知対象の実空間における大きさは、前記検知対象の実空間における高さ及び幅の少なくとも一方を含むことを特徴とするカメラ状態推定装置。
The camera state estimation device according to claim 8,
The size of the detection target in the real space includes at least one of a height and a width in the real space of the detection target.
請求項8に記載のカメラ状態推定装置であって、
前記記憶装置は、前記検知対象の実空間における座標値をさらに保持し、
前記一つ以上のパラメータの推定値は、前記カメラの撮影方向を示す角度の推定値を含み、
前記プロセッサは、
前記保持された座標値と、前記類似する対象の前記画像内の位置と、に基づいて、前記カメラの撮影方向を示す角度を計算することを特徴とするカメラ状態推定装置。
The camera state estimation device according to claim 8,
The storage device further holds coordinate values in the real space of the detection target,
The estimated value of the one or more parameters includes an estimated value of an angle indicating a shooting direction of the camera,
The processor is
An apparatus for estimating a camera state, wherein an angle indicating a shooting direction of the camera is calculated based on the held coordinate value and a position of the similar target in the image.
請求項8に記載のカメラ状態推定装置であって、
前記カメラをさらに有することを特徴とするカメラ状態推定装置。
The camera state estimation device according to claim 8,
A camera state estimation apparatus further comprising the camera.
計算機を制御するプログラムを格納する非一時的な計算機読み取り可能な記憶媒体であって、
前記計算機は、プロセッサと、前記プロセッサに接続される記憶装置と、を有し、
前記記憶装置は、検知対象の画像の特徴量と、前記検知対象の実空間における大きさと、カメラの状態を示す一つ以上のパラメータの推定値と、を保持し、
前記プログラムは、
前記カメラによって撮影された画像から、前記記憶装置に保持された特徴量に基づいて、前記検知対象と類似する対象を抽出する手順と、
前記検知対象の実空間における大きさと、前記一つ以上のパラメータの推定値と、前記類似する対象の前記画像内の位置及び大きさと、に基づいて、前記一つ以上のパラメータの推定値の誤差の大きさを示す指標を計算する手順と、
前記誤差の大きさを示す指標が所定の条件を満たさない場合に、前記一つ以上のパラメータの推定値を変更する手順と、
前記誤差の大きさを示す指標が所定の条件を満たす場合に、前記一つ以上のパラメータの推定値を出力する手順と、を前記プロセッサに実行させることを特徴とする非一時的な計算機読み取り可能な記憶媒体。
A non-transitory computer-readable storage medium storing a program for controlling a computer,
The computer includes a processor and a storage device connected to the processor,
The storage device holds a feature amount of an image to be detected, a size of the detection target in real space, and an estimated value of one or more parameters indicating a camera state,
The program is
A procedure for extracting an object similar to the detection object from an image photographed by the camera based on a feature amount held in the storage device;
An error in the estimated value of the one or more parameters based on the size of the detection target in real space, the estimated value of the one or more parameters, and the position and size of the similar target in the image. A procedure for calculating an indicator of the size of
A procedure for changing an estimated value of the one or more parameters when an index indicating the magnitude of the error does not satisfy a predetermined condition;
A non-transitory computer-readable program that causes the processor to execute a procedure for outputting an estimated value of the one or more parameters when the index indicating the magnitude of the error satisfies a predetermined condition Storage medium.
JP2017511354A 2016-01-21 2016-01-21 Image recognition system, camera state estimation device, and program Active JP6393409B2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/051653 WO2017126072A1 (en) 2016-01-21 2016-01-21 Image recognition system, camera state estimation device and storage medium

Publications (2)

Publication Number Publication Date
JPWO2017126072A1 true JPWO2017126072A1 (en) 2018-01-25
JP6393409B2 JP6393409B2 (en) 2018-09-19

Family

ID=59362290

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017511354A Active JP6393409B2 (en) 2016-01-21 2016-01-21 Image recognition system, camera state estimation device, and program

Country Status (2)

Country Link
JP (1) JP6393409B2 (en)
WO (1) WO2017126072A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020056644A (en) * 2018-10-01 2020-04-09 キヤノン株式会社 Information processing device, information processing method, and program

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6940223B2 (en) * 2016-08-18 2021-09-22 ソニーグループ株式会社 Information processing equipment, information processing system and information processing method
KR102332179B1 (en) * 2019-12-03 2021-11-30 한국과학기술정보연구원 Mapping device between image and space, and computer trogram that performs each step of the device

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010231254A (en) * 2009-03-25 2010-10-14 Fujifilm Corp Image analyzing device, method of analyzing image, and program
JP2011215082A (en) * 2010-04-01 2011-10-27 Nippon Telegr & Teleph Corp <Ntt> Method, apparatus and program for determination of imaging parameter
JP2011239349A (en) * 2010-05-13 2011-11-24 Fujitsu Ltd Image processing apparatus and image processing program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010231254A (en) * 2009-03-25 2010-10-14 Fujifilm Corp Image analyzing device, method of analyzing image, and program
JP2011215082A (en) * 2010-04-01 2011-10-27 Nippon Telegr & Teleph Corp <Ntt> Method, apparatus and program for determination of imaging parameter
JP2011239349A (en) * 2010-05-13 2011-11-24 Fujitsu Ltd Image processing apparatus and image processing program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020056644A (en) * 2018-10-01 2020-04-09 キヤノン株式会社 Information processing device, information processing method, and program

Also Published As

Publication number Publication date
WO2017126072A1 (en) 2017-07-27
JP6393409B2 (en) 2018-09-19

Similar Documents

Publication Publication Date Title
JP7282851B2 (en) Apparatus, method and program
US10762386B2 (en) Method of determining a similarity transformation between first and second coordinates of 3D features
JP6723061B2 (en) Information processing apparatus, information processing apparatus control method, and program
US11842514B1 (en) Determining a pose of an object from rgb-d images
KR102130316B1 (en) Apparatus and method for image recognition
JP6566768B2 (en) Information processing apparatus, information processing method, and program
JP5951043B2 (en) Image measuring device
US11037014B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP2012048393A (en) Information processing device and operation method of the same
JP6393409B2 (en) Image recognition system, camera state estimation device, and program
CN107330974B (en) Commodity display method and device and mobile equipment
US20210335010A1 (en) Calibration method and calibration apparatus
JP6132996B1 (en) Image processing apparatus, image processing method, and image processing program
JP2016176816A (en) Image processor, image processing method, and program
KR20220015056A (en) Cctv control system for being enable to measure real size of subject using 3d environment model
JP5217917B2 (en) Object detection and tracking device, object detection and tracking method, and object detection and tracking program
CN113228117B (en) Authoring apparatus, authoring method, and recording medium having an authoring program recorded thereon
JP2015206654A (en) Information processing apparatus, information processing method, and program
CN107515844B (en) Font setting method and device and mobile device
JP6452658B2 (en) Information processing apparatus, control method thereof, and program
JP2016206909A (en) Information processor, and information processing method
CN107589834B (en) Terminal device operation method and device and terminal device
JP2020027328A (en) Traffic light estimation device, traffic light estimation method, and program
US20230125410A1 (en) Information processing apparatus, image capturing system, method, and non-transitory computer-readable storage medium
US20230168103A1 (en) Information processing apparatus, information processing method, and medium

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180410

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180509

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180821

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180824

R150 Certificate of patent or registration of utility model

Ref document number: 6393409

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150