WO2022195790A1 - 画像処理装置及び画像処理方法 - Google Patents
画像処理装置及び画像処理方法 Download PDFInfo
- Publication number
- WO2022195790A1 WO2022195790A1 PCT/JP2021/010965 JP2021010965W WO2022195790A1 WO 2022195790 A1 WO2022195790 A1 WO 2022195790A1 JP 2021010965 W JP2021010965 W JP 2021010965W WO 2022195790 A1 WO2022195790 A1 WO 2022195790A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- tracking
- feature amount
- feature
- image
- tracking history
- Prior art date
Links
- 238000012545 processing Methods 0.000 title claims abstract description 73
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000001514 detection method Methods 0.000 claims abstract description 90
- 238000003384 imaging method Methods 0.000 claims abstract description 88
- 238000000605 extraction Methods 0.000 claims abstract description 52
- 239000000284 extract Substances 0.000 claims abstract description 23
- 230000002123 temporal effect Effects 0.000 claims description 4
- 238000000034 method Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 238000013500 data storage Methods 0.000 description 9
- 230000007423 decrease Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
- G06T7/248—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/292—Multi-camera tracking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
Definitions
- This disclosure relates to image processing technology.
- Patent Document 1 discloses a technique for analyzing whether or not objects captured by a plurality of cameras that capture images of different areas are the same object.
- an object is tracked in the time direction, and the feature amount of the object and the tracking result of the object are recorded.
- image data is clustered based on the tracking results of each retrieved object, a cluster having the largest number of images is selected from the clustered clusters, and image data within the selected cluster is selected.
- One feature amount is extracted for each cluster, and identity determination between objects is performed using the extracted feature amount.
- the present disclosure has been made to solve such problems, and one aspect of the embodiments is to determine identity between objects without using data of an image in which occlusion has occurred.
- the purpose is to provide technology to perform
- the image processing apparatus analyzes a first image sequence comprising a plurality of images captured of a first region to determine any one of the first image sequences. detecting a first object appearing in one image and analyzing a second image sequence comprising a plurality of images capturing a second area different from the first area to determine any of the second image sequences; or a detection unit for detecting a second object appearing in one image, a first object feature quantity for tracking the first object, and a second object feature for tracking the second object a feature generator for generating a plurality of first object features by tracking the first object in the first image sequence in the time direction using the first object features; A tracking result including values is output as a first object tracking history, and the second object is tracked in the second image sequence in the temporal direction using the second object feature quantity, and a plurality of a tracking unit for outputting, as a second object tracking history, a result of tracking including the value of the second object feature value of and detecting whether or not the first
- the image processing apparatus when occlusion occurs, it is possible to determine the identity between objects without using the data of the image in which the occlusion has occurred.
- FIG. 10 is a diagram showing an example of image data of a person tracked as an object in object tracking processing
- FIG. 10 is a diagram showing an example of a tracking result of a person tracked as an object in feature amount change detection processing
- FIG. 4 is a diagram illustrating an example of modeling of an imaging plane of an object
- FIG. 10 is a diagram showing an example of a tracking result of a person tracked as an object in imaging plane estimation processing; 4 is a flowchart of image recognition processing; 4 is a flowchart of image search processing; It is a figure which shows an example of an image recognition process.
- FIG. 10 is a diagram showing an example of image data of a person tracked as an object in area W1 of FIG. 9;
- FIG. 10 is a diagram showing an example of image data of a person tracked as an object in area W2 of FIG. 9;
- Embodiment 1 An image processing apparatus 100 according to the first embodiment will be described below with reference to FIGS. 1 to 10.
- FIG. First, the configuration of an image processing system including an image processing apparatus 100 and the configuration of the image processing apparatus 100 will be described with reference to FIG.
- the image processing system Sys includes multiple cameras 1 and 2, an external device 3, and an image processing apparatus 100 connected to the multiple cameras 1 and 2 and the external device 3. .
- the image processing apparatus 100 performs image processing on image data captured by a plurality of cameras 1 and 2 connected via a communication network.
- a plurality of cameras 1 and 2 are installed to image different areas.
- the term "different” means not identical. Therefore, the expression “different regions” includes not only cases where one region and another region do not overlap at all, but also cases where one region and another region partially overlap.
- the number of cameras is not limited to two, and may be three or more.
- time data at which the image was captured is associated with the captured image data.
- the image processing apparatus 100 is connected to the external device 3 via an interface unit 104 . Examples of the external device 3 include an input/output device for setting search conditions and an external storage.
- the image processing apparatus 100 includes a communication section 101, an image recognition section 110, an image search section 120, a recording control section 102, a data storage section 103, and an interface section 104.
- the data storage unit 103 may be provided outside the image processing apparatus 100 .
- the communication unit 101 receives a first image sequence including a plurality of images transmitted from the camera 1 connected via a network, and outputs the received first image sequence to the image recognition unit 110 and the recording control unit 102. do.
- the communication unit 101 also receives a second image sequence including a plurality of images transmitted from the camera 2 connected via the network, and transmits the received second image sequence to the image recognition unit 110 and the recording control unit 102 . Output to
- the image recognition unit 110 performs image recognition processing on the input image sequence. As shown in FIG. 1 , the image recognition unit 110 includes a detection unit 111 , a feature amount generation unit 112 , a tracking unit 113 , a feature amount change detection unit 114 and an imaging plane estimation unit 115 .
- the detection unit 111 analyzes the image sequence input from the communication unit 101 . That is, the detection unit 111 analyzes the first image sequence transmitted from camera 1 and the second image sequence transmitted from camera 2 . The detection unit 111 detects one or more objects appearing in images included in each image sequence by analyzing each image sequence, and outputs the object detection result to the feature amount generation unit 112 .
- the object detection result includes, for example, the number of detected objects, the time when the image was captured, the position of the object, the object detection range, the object identification result, and the object detection reliability. When multiple objects are detected, the object detection result includes the position of each object, the detection range of each object, the identification result of each object, and the detection reliability of each object.
- the position of the object means the position of the object within the angle of view, or the position of the object in the real space coordinate system obtained by combining the camera calibration information and the position of the object within the angle of view.
- a detection range means a range in which an object exists, and specific examples of the detection range include the outline of the object and a rectangle (bounding box) that includes the object.
- the feature amount generation unit 112 generates an object feature amount to be used for object tracking from the object detection result input from the detection unit 111 . Based on the position of each object input from the detection unit 111, the feature amount generation unit 112 extracts one or more appearance feature amounts for each object from each image. Examples of appearance feature amounts include feature amounts such as hue, saturation, and brightness in the detection range. Examples of appearance feature quantities are not limited to these examples, and may be other feature quantities such as pixel values in the RGB color space. The feature amount generation unit 112 outputs the extracted appearance feature amount to the tracking unit 113 as an object feature amount together with the position of the object, the detection range, the imaging time, and the detection reliability.
- the tracking unit 113 tracks each object in the time direction using the object feature amount input from the feature amount generation unit 112, and outputs a tracking history, which is the tracking result, to the feature amount change detection unit 114 as a tracking result.
- the tracking unit 113 tracks the object using a plurality of frames input from the feature amount generation unit 112 .
- a frame is a set of object feature amounts output from the feature amount generation unit 112 at one imaging time.
- a known multi-target tracking technique for example, Multiple Hypothesis Multitarget Tracking
- the tracking history includes the observed and predicted values of the position, velocity, and range of each object at each imaging time, as well as a unique number (tracking ID) for identifying the tracking history.
- tracking ID a unique number for identifying the tracking history.
- Estimates of position, velocity, and range are generated from past frames using known multi-target tracking techniques described above.
- a set of object feature amounts to which the same tracking ID is assigned as a result of tracking each object in the time direction is defined as an object tracking history.
- FIG. 3 shows a specific example when the object to be tracked is a person.
- the tracking unit 113 tracks the objects L1 to L4 detected by the detection unit 111 during times t1 to t4. At this time, occlusion may occur such that the object L3 is partly hidden by the obstacle U.
- FIG. 4 shows a specific example of the tracking result for FIG.
- S1-S4 indicate the observed values of the range in which the object was detected between times t1-t
- P1-P4 indicate the predicted values of the range between times t1-t4.
- the tracking unit 113 generates a prediction value at a time after the time associated with the past frame from the past frame. For example, the tracking unit 113 generates a predicted value P2 at time t2 from the observed value S1 at time t1, and generates a predicted value P3 at time t3 from the observed value S2 at time t2.
- predicted values at past times may be considered.
- the tracking unit 113 may consider the predicted value P1 at time t1 when generating the predicted value P2. In this way, the tracking unit 113 generates a predicted value at a certain time of interest from the frame at the time just before the time of interest. As a modification, the tracking unit 113 may generate a predicted value at a certain time of interest from a frame at a time before the time immediately before the time of interest.
- the feature amount change detection unit 114 performs feature amount change detection processing for detecting a change in the object feature amount of each object from the object tracking history input from the tracking unit 113 .
- the feature amount change detection unit 114 outputs the detection result including the presence or absence of change in the object feature amount and the object tracking history described above to the imaging plane estimation unit 115 as the feature amount change detection result.
- the feature amount change detection unit 114 detects a difference between an observed value and a predicted value at a certain time in the object tracking history input from the tracking unit 113 .
- the difference between the magnitude of the range observed value S2 and the range predicted value P2 is small.
- the object L3 is partly hidden by the obstacle U in FIG. It is small compared to the size of S2, which is the observed value of the extent of object L2 not obscured by U.
- the size of the range indicates the area, width, or height of the detection range.
- the predicted value P2 of the range is generated from the observed value S1 of the range at t1, so it indicates the same range as the observed value S1 at time t1. Therefore, when comparing the magnitude of the observed value S2 of the range at time t2 and the magnitude of the predicted value P2 of the range at time t2, the difference is small. If this difference is equal to or less than a predetermined threshold value, the detection result is output as "no change in object feature amount".
- the range prediction value P3 is generated from the range observation value S2 at time t2 when the object is not hidden by the obstacle.
- the size of the range is shown to be comparable to the observed value S2. Therefore, when comparing the magnitude of the observed value S3 of the range at time t3 and the magnitude of the predicted value P3 of the range at time t3, the difference becomes large. When this difference exceeds the predetermined threshold value, the detection result is output as "there is an object feature amount change".
- the presence or absence of feature change is detected using the latest observed value determined to have no change in feature, instead of the observed value S3 at time t3 when the feature was changed.
- a predicted value P4 of the range at time t4 is generated from the observed value S2 of the range at time t2. Since the range prediction value P4 is generated from the range observation value S2 at t2 when the object is not hidden by the obstacle U, it indicates a range size approximately equal to the range observation value S2 at time t2. Therefore, when comparing the magnitude of the observed value S4 of the range at time t4 and the magnitude of the predicted value P4 of the range at time t4, the difference is small. In this case, the detection result is output as "no change in object feature amount".
- the size of the range of the feature amount has been described here, other parameters, such as the appearance feature amount, may be used when detecting changes in the object feature amount. For example, when hue is used, it is possible to determine the presence or absence of occlusion by detecting the temporal increase or decrease in the number of pixels of a certain color.
- the imaging plane estimation unit 115 performs imaging plane estimation processing for estimating the imaging plane from the feature amount change detection result input from the feature amount change detection unit 114 .
- the imaging plane estimation unit 115 estimates the imaging plane of each object from the velocity of each object included in the object tracking history.
- the imaging plane estimating unit 115 outputs to the recording control unit 102 an imaging plane estimation result including the estimation result of the imaging plane and the feature amount change detection result described above.
- FIG. 5 is a diagram for explaining an example of modeling the imaging surface of an object. Although the description is based on an example in which the target object is modeled as a cylinder, a specific example of modeling is not limited to a cylinder, and may be a polygon or a sphere.
- a reference plane Y11 relating to the imaging plane is set for the model Y10. As shown in FIG. 5, the reference plane Y11 is one side of the model Y10 indicated by the end of the arrow Y1.
- arrows Y2 to Y4 are set at every 90 degrees clockwise from the arrow Y1 centering on the model cross section center Y0, and reference planes Y22 to Y44 indicated by the ends of the arrows Y2 to Y4 are set.
- each of the reference planes Y22 to Y44 is one side of the model Y10 indicated by the ends of the arrows Y2 to Y4.
- the imaging plane estimation unit 115 assigns one of the reference planes Y11 to Y44 at each time as the imaging plane of each object. Note that the allocation between the speed and the imaging plane is determined in advance.
- FIG. 6 shows an example of the tracking result of a person tracked as an object.
- A1 to A9 indicate temporal changes in positions of the same object in the image area F1.
- V2 to V9 indicate the velocity of each object generated by the tracking unit 113.
- velocity is the amount of change in position per unit time, and is a two-dimensional or three-dimensional vector.
- the front of the object is assumed to be a reference plane Y11.
- the velocities V2-V4 of the objects A2-A4 are from left to right in the image area F1.
- the target object is the model Y10 and the imaging plane is the reference plane Y22 based on the assignment set in advance.
- the velocity V5 of the object A5 is from top to bottom in the image area F1.
- the target object is the model Y10 and the imaging plane is the reference plane Y11.
- the velocities V6-V9 in the objects A6-A9 are from right to left in the image area F1. In this case, it is determined that the target object is the model Y10 and the imaging plane is the reference plane Y44 based on the assignment set in advance.
- the imaging plane is the reference plane Y33.
- the recording control unit 102 associates the imaging plane estimation result input from the imaging plane estimation unit 115 with the image data of the image sequence input from the communication unit 101 and stores them in the data storage unit 103 .
- the image search unit 120 receives search conditions set by the external device 3 via the interface unit 104 and searches for object tracking histories that match the set search conditions. As shown in FIG. 1, the image searching unit 120 includes a searching unit 121, a tracking history extracting unit 122, a feature amount extracting unit 123, and a determining unit .
- the search unit 121 accesses the data storage unit 103 via the recording control unit 102 and searches for object tracking histories that match the search conditions.
- the search unit 121 extracts a plurality of object tracking history candidates that match the set search conditions. This extraction is performed by designating one or more conditions such as the range of imaging time, the camera with which the object was imaged, and the like.
- the search unit 121 outputs object tracking history candidates that match the search conditions to the tracking history extraction unit 122 .
- the tracking history extracting unit 122 extracts object feature values from a plurality of object feature values included in the object tracking history candidates input from the searching unit 121, excluding data judged to have changed in object feature values. Extract values. That is, the tracking history extracting unit 122 extracts the value of the object feature amount from the object tracking history candidates for the image determined to have no change in the object feature amount. Further, the tracking history extracting unit 122 creates a set of objects having the same imaging plane for the data determined as “no change in object feature amount”, and extracts the tracking history by extracting the created set and the object tracking history. As a result, it is output to the feature quantity extraction unit 123 .
- the feature amount extraction unit 123 Based on the tracking history extraction result input from the tracking history extraction unit 122, the feature amount extraction unit 123 extracts image data including an object corresponding to the tracking history extraction result from the data storage unit 103 via the recording control unit 102. Extract.
- the feature amount extraction unit 123 generates one matching feature amount for the set based on the image feature amount obtained from the data of a plurality of images corresponding to the set of objects having the same imaging surface, and sends it to the determination unit 124. Output. Therefore, for each object tracking history, a maximum of four matching features, which is the same number as the imaging planes of the model, is output to the determination unit 124 .
- the image feature amount a feature amount used in a known identity determination technique between objects can be used. Examples include histograms related to color information and shape information. Further, when generating the matching feature amount, the matching feature amount may be generated by performing processing such as averaging on the image feature amounts included in the set.
- the determination unit 124 compares the object tracking histories of the same imaging surface between different imaging areas among the matching feature amounts input from the feature amount extraction unit 123, and determines whether the object tracking histories are the same. make a judgment.
- identity determination between objects a known identity determination technique between objects, such as histogram intersection, can be used.
- machine learning for example, deep learning or support vector machine
- the determination unit 124 outputs determination results to the external device 3 via the interface unit 104 .
- FIGS. 2A and 2B are diagrams showing hardware configuration examples of the image processing apparatus 100.
- FIG. As an example, the functions of the communication unit 101, the image recognition unit 110, the recording control unit 102, the image search unit 120, and the interface unit 104 in the image processing apparatus 100 are implemented by a processing circuit 100a as shown in FIG. 2A. be done. That is, the image processing apparatus 100 includes a processing circuit 100a for realizing each function described above.
- the functions of the communication unit 101, the image recognition unit 110, the recording control unit 102, the image search unit 120, and the interface unit 104 in the image processing apparatus 100 are implemented by a processor 100b as shown in FIG. 2B. may be implemented by reading and executing a program stored in the memory 100c.
- FIG. 7 is a flowchart showing the operation of image recognition processing.
- the communication unit 101 receives image sequences captured by a plurality of cameras 1 and 2 connected via a communication network (step ST1), and outputs the received image sequences to the detection unit 111 of the image recognition unit 110.
- the detection unit 111 attempts to detect objects that appear in the input image sequence (step ST2).
- the detection unit 111 determines whether or not an object is detected (step ST3). If no object is detected (step ST3: No), the process returns to step ST1. On the other hand, if an object is detected (step ST4: Yes), the process proceeds to step ST4, and the feature amount generation unit 112 generates object information such as the imaging time, appearance feature amount, position, detection range, etc. of the detected object.
- a feature amount is generated (step ST4), and the object feature amount is output to the tracking unit 113.
- the tracking unit 113 generates an object feature amount predicted at a time later than the time associated with the past frame from the object feature amount of the past frame (step ST5). For example, from the range of objects observed at a past time, the range of objects predicted at the time immediately following the past time is generated. The tracking unit 113 determines whether the generated predicted value of the object and the object feature amount observed at the time of the predicted value are the same (step ST6). If it is determined that they are the same in step ST6, the tracking unit 113 gives the observed object feature amount a tracking ID that has been assigned to the past frame determined to be the same (step ST7).
- the tracking unit 113 assigns a unique tracking ID that does not overlap with past tracking IDs to the observed object feature amount (step ST7). After assigning the tracking ID, the tracking unit 113 outputs the tracking result including the object tracking history to the feature amount change detection unit 114 .
- the feature amount change detection unit 114 detects whether or not there is a change in the object feature amount from the object tracking history input from the tracking unit 113 (step ST8), and sends the detection result to the imaging plane estimation unit 115 as a feature amount change detection result. Output.
- the imaging plane estimation unit 115 estimates the imaging plane from the feature amount change detection result input from the feature amount change detection unit 114 (step ST9).
- the feature amount generation unit 112, the tracking unit 113, the feature amount change detection unit 114, and the imaging plane estimation unit 115 determine whether or not all the objects input from the detection unit 111 have been processed (step ST10). ). If all objects have not been processed (step ST10: No), the process returns to step ST4. On the other hand, when all objects have been processed (step ST10: Yes), the imaging plane estimation unit 115 outputs the imaging plane estimation result including the object tracking history to the recording control unit 102 (step ST11).
- the recording control unit 102 associates the imaging plane estimation result input from the imaging plane estimation unit 115 with the image data of the image sequence input from the communication unit 101, and stores them in the data storage unit 103 (step ST12). End the process.
- FIG. 8 is a flow chart showing the operation of image search processing.
- the search unit 121 selects a plurality of object tracking history candidates that match the set search conditions via the recording control unit 102. It extracts from the data storage unit 103 (step ST22) and outputs the extracted object tracking history candidates to the tracking history extraction unit 122.
- FIG. 1 When search conditions are set from the external device 3 via the interface unit 104 (step ST21), the search unit 121 selects a plurality of object tracking history candidates that match the set search conditions via the recording control unit 102. It extracts from the data storage unit 103 (step ST22) and outputs the extracted object tracking history candidates to the tracking history extraction unit 122.
- the tracking history extracting unit 122 extracts a plurality of object feature values from the values of the plurality of object feature values included in the object tracking history input from the search unit 121, excluding the data determined as “having a feature value change”. A value is extracted (step ST23). That is, the tracking history extracting unit 122 extracts the value of the object feature amount from the object tracking history for the image determined to have no change in the object feature amount. Further, the tracking history extracting unit 122 creates a set of objects having the same imaging surface for the data determined as "no change in feature amount" (step ST24), and compares the created set and the object tracking history. is output to the feature amount extraction unit 123 as a tracking history extraction result.
- the feature amount extraction unit 123 Based on the tracking history extraction result input from the tracking history extraction unit 122, the feature amount extraction unit 123 extracts image data including an object corresponding to the tracking history extraction result from the data storage unit 103 via the recording control unit 102. Extract (step ST25). The feature amount extraction unit 123 generates one matching feature amount for the set based on image feature amounts obtained from data of a plurality of images corresponding to a set of objects having the same imaging surface (step ST26).
- the determination unit 124 compares the object tracking histories of the same imaging surface between different imaging areas by comparing the matching feature amounts extracted in step ST26. Accordingly, the determination unit 124 determines whether or not the objects captured in different imaging areas are the same (step ST27). The determination unit 124 determines whether or not all matching feature values input from the feature value extraction unit 123 have been processed (step ST28). If the process has not been performed for all matching feature amounts (step ST28: No), the flowchart returns to the process of step ST27. On the other hand, if the processing has been performed for all matching feature amounts (step ST28: Yes), the determination unit 124 outputs the determination result to the external device 3 via the interface unit 104 (step ST29), and the processing is performed. finish.
- FIG. 9 is a diagram showing an example of image recognition processing of the image processing apparatus 100 according to the first embodiment.
- the tracking unit 113 tracks objects B1 to B4 having the same features in the image sequence obtained by imaging the area W1, and generates an object tracking history R1.
- the tracking unit 113 tracks the objects C1 to C3 in the image sequence capturing the area W2 to generate an object tracking history R2.
- the numbers attached after B or C in FIG. 9 indicate that the object was imaged at different times.
- the tracking history includes object positions, object velocities, observed values and predicted values regarding object ranges, tracking IDs, feature amount change detection results, and imaging plane estimation results at each imaging time.
- FIG. 10A and 10B are diagrams showing an example of image data including a person tracked as an object in the image recognition result tracking process of the image processing apparatus 100 corresponding to FIG. 10A shows an example of image data of object B in image area G1 captured by camera 1, and FIG. 10B shows an example of image data of object C in image area G2 captured by camera 2.
- FIG. 10A in the image area G1 of the camera 1, B1 indicates that the back surface of the object B is imaged, and B2 to B3 indicate that the left side surface of the object B is imaged.
- C1 and C2 indicate that the front of the object C is captured, and C3 indicates that the left side of the object C is captured.
- an obstacle U may partially hide the object B3.
- the imaging surface may change depending on the relative relationship between the camera installation position and the moving direction of the person, and the captured content may differ. Therefore, when comparing using the data of each one image (for example, B2 and C2) among the objects in FIGS. 10A and 10B, the accuracy of identity determination in step ST27 is lowered. Further, when the feature amount is extracted from the cluster having the largest number of images included in the cluster from the cluster composed of a plurality of images associated with the object tracking history and the identity determination is performed, B2, B3 and B4 will extract the feature amount from C1 and C2 for the camera 2 .
- the accuracy of determining the identity between the object tracking history R1 in camera 1 and the object tracking history R2 in camera 2 decreases.
- the accuracy of identity determination also decreases.
- the image search unit 120 defines, for example, four imaging planes (reference planes) for each object included in G1 in FIG. to extract Specifically, one feature amount is extracted from B4 and B2 having the same imaging surface, and one feature amount is extracted from B1. Similarly, for each object included in G2 in FIG. 10, one feature amount is extracted from C1 and C2 having the same imaging plane, and one feature amount is extracted from C3.
- the determination unit 124 determines identity by comparing the feature amount extracted from B4 and B2 and the feature amount extracted from C3, which have the same imaging surface in different imaging regions. As a result, it is possible to suppress a decrease in identity determination accuracy.
- the image processing device (100) of appendix 1 analyzes a first image sequence comprising a plurality of images captured of a first region (W1) to obtain a first image appearing in any one image of the first image sequence. Detecting one object (B1) and analyzing a second image sequence comprising a plurality of images capturing a second area (W2) different from the first area to determine which of the second image sequences a detection unit (111) for detecting a second object (C1) appearing in one image; a feature generation unit (112) for generating an object feature of , and tracking the first object in the first image sequence using the first object feature in the time direction to obtain a plurality of first objects
- the tracking result including the value of the feature amount (for example, the observed value of the size of the first object) is output as the first object tracking history (R1), and the second object is output as the second object feature amount.
- a feature amount change detection unit (114) for outputting and detecting presence/absence of a change in the second object feature amount from the second object tracking history and outputting the detection result as a second feature amount change detection result;
- the value of the first object feature is extracted from the first object tracking history for the images (images B1, B2, and B4) determined to have no change in the first object feature, and extracted
- the value of the first object feature amount and the first object tracking history are output as the first tracking history extraction result
- the images determined to have no change in the second object feature amount (images C1 to C3 ) is extracted from the second object tracking history, and the extracted second object feature value and the second object tracking history are used as a second tracking history extraction result
- a tracking history extraction unit (122) to output, the first tracking history extraction result and the second tracking history extraction result, the first object and a determination unit (124) for determining whether the object and the second object are the same.
- the image processing device of appendix 2 is the image processing device of appendix 1, which estimates the imaging plane of the first object from the first object tracking history, and converts the estimated imaging plane to the first imaging plane (B2 and B4 image plane), estimates the image plane of the second object from the second object tracking history, and outputs the estimated image plane as the second image plane (C3 image plane).
- An imaging plane estimating unit (115) extracts a first matching feature amount for a first imaging plane of a first object, and extracts a second matching feature amount for a second imaging plane of a second object. and a feature quantity extraction unit (123) for extracting the first feature quantity and the second Determining whether the first object and the second object are the same using the matching feature amount of 2,
- the image processing apparatus according to claim 1.
- the image processing device of Supplementary Note 3 is the image processing device of Supplementary Note 1 or 2, wherein the first object tracking history is an observed value ( For example, S3), and the first object at the time of interest predicted based on the observed value (for example, S2) of the first object feature observed at a past time (for example, t2) before the time of interest including the predicted value (for example, P3) of the feature amount, and the feature amount change detection unit detects the first object feature amount based on the observed value (S3) and the predicted value (P3) of the first object feature amount at the time of interest Detects whether or not there is a change in
- S3 observed value
- P3 predicted value
- the image processing device is the image processing device according to any one of appendices 1 to 3, wherein the first object tracking history includes the velocity of the first object, and the imaging plane estimator detects the velocity of the first object. A first imaging plane is estimated from the velocity.
- the image processing apparatus according to appendix 5 is the image processing apparatus according to any one of appendices 1 to 4, wherein the feature amount extraction unit extracts data of a plurality of images corresponding to a set of first objects having the same imaging surface. generates a first matching feature for the set based on the image feature obtained from .
- the image processing method of appendix 6 is an image processing method performed by an image processing device, in which a detection unit (111) analyzes a first image sequence including a plurality of images obtained by imaging a first region, detecting a first object appearing in any one image of the one image sequence and analyzing a second image sequence comprising a plurality of images capturing a second region different from the first region; a step (ST2) of detecting a second object appearing in any one of the image sequences of 2, and a feature generation unit (112) generating a first object feature for tracking the first object; and a step of generating a second object feature quantity for tracking the second object (ST4); tracking in the sequence in the time direction, outputting the tracking result including the values of the plurality of first object feature values as the first object tracking history, and tracking the second object using the second object feature value; (ST5 to ST7) of tracking in the second image sequence in the time direction and outputting the tracking result including the values of the plurality of second object feature quantities as a second object
- a value of a first object feature amount is extracted from a first object tracking history for an image in which it is determined that there is no change in one object feature amount, and the extracted first object feature amount value and the first outputting an object tracking history as a first tracking history extraction result, and extracting, from the second object tracking history, the value of the second object feature amount for an image determined to have no change in the second object feature amount;
- the image processing device can be used in an image processing system that monitors objects.
- 1 camera, 2 camera, 3 external device 100 image processing device, 100a processing circuit, 100b processor, 100c memory, 101 communication unit, 102 recording control unit, 103 data storage unit, 104 interface unit, 110 image recognition unit, 111 detection section, 112 feature amount generation section, 113 tracking section, 114 feature amount change detection section, 115 imaging plane estimation section, 120 image search section, 121 search section, 122 tracking history extraction section, 123 feature amount extraction section, 124 determination section, Sys image processing system.
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
Description
以下、図1から図10を参照して、実施の形態1に係る画像処理装置100について説明する。まず、図1を参照して、画像処理装置100を含む画像処理システムの構成、及び画像処理装置100の構成について説明する。
通信部101は、ネットワーク経由で接続されるカメラ1から送信される複数の画像を備える第1の画像シーケンスを受信し、受信した第1の画像シーケンスを画像認識部110及び記録制御部102へ出力する。また、通信部101は、ネットワーク経由で接続されるカメラ2から送信される複数の画像を備える第2の画像シーケンスを受信し、受信した第2の画像シーケンスを画像認識部110及び記録制御部102へ出力する。
画像認識部110は、入力された画像シーケンスに対して画像認識処理を行う。図1に示されているように、画像認識部110は、検出部111、特徴量生成部112、追跡部113、特徴量変化検出部114、及び撮像面推定部115を備える。
検出部111は、通信部101から入力された画像シーケンスを解析する。すなわち、検出部111は、カメラ1から送信される第1の画像シーケンス、及びカメラ2から送信される第2の画像シーケンスを解析する。検出部111は、各画像シーケンスの解析により各画像シーケンスに含まれる画像に現れる1つ以上のオブジェクトを検出して、オブジェクト検出結果を特徴量生成部112へ出力する。オブジェクト検出結果には、例えば、検出されたオブジェクトの数、画像が撮像された時刻、オブジェクトの位置、オブジェクトの検出範囲、オブジェクトの識別結果、及びオブジェクトの検出信頼度が含まれる。複数のオブジェクトが検出された場合、オブジェクト検出結果には、各オブジェクトの位置、各オブジェクトの検出範囲、各オブジェクトの識別結果、及び各オブジェクトの検出信頼度が含まれる。ここで、オブジェクトの位置とは、オブジェクトの画角内における位置、又はカメラキャリブレーション情報とオブジェクトの画角内位置とを組み合わせて得られるオブジェクトの実空間座標系における位置を意味する。また、検出範囲とはオブジェクトが存在する範囲を意味し、検出範囲の具体例には、オブジェクトの輪郭、及びオブジェクトを内包する長方形(バウンディングボックス)が含まれる。
特徴量生成部112は、検出部111から入力されたオブジェクト検出結果から、オブジェクトの追跡に用いるためのオブジェクト特徴量を生成する。検出部111から入力された各オブジェクトの位置に基づき、特徴量生成部112は、各オブジェクトについて1つ以上の外見特徴量を各画像から抽出する。外見特徴量の例には、検出範囲における色相、彩度、明度等の特徴量が含まれる。外見特徴量の例は、これらの例に限定されず、RGB色空間における画素値等の他の特徴量であってもよい。特徴量生成部112は、抽出した外見特徴量を、オブジェクトの位置、検出範囲、撮像時刻及び検出信頼度とともに、オブジェクト特徴量として追跡部113に出力する。
追跡部113は、特徴量生成部112から入力されるオブジェクト特徴量を用いて各オブジェクトを時間方向に追跡し、追跡の結果である追跡履歴を追跡結果として特徴量変化検出部114へ出力する。追跡部113は、オブジェクトの時間方向への追跡を行うため、特徴量生成部112から入力される複数のフレームを用いてオブジェクトの追跡を行う。ここで、フレームとは、1撮像時刻における特徴量生成部112から出力されるオブジェクト特徴量の集合である。なお、この追跡には、公知の多目標追跡技術(例えば、Multiple Hypothesis Multitarget Tracking)を用いることができる。
特徴量変化検出部114は、追跡部113から入力されるオブジェクト追跡履歴から各オブジェクトのオブジェクト特徴量の変化を検出する特徴量変化検出処理を行う。特徴量変化検出部114は、オブジェクト特徴量の変化の有無を含む検出結果と前述のオブジェクト追跡履歴とを特徴量変化検出結果として撮像面推定部115へ出力する。特徴量変化検出部114は、追跡部113から入力されるオブジェクト追跡履歴のうち、ある時刻における観測値と予測値の差異を検出する。
撮像面推定部115は、特徴量変化検出部114から入力される特徴量変化検出結果から撮像面を推定する撮像面推定処理を行う。撮像面推定部115は、オブジェクト追跡履歴に含まれる各オブジェクトの速度から各オブジェクトの撮像面を推定する。撮像面推定部115は、撮像面の推定結果と前述の特徴量変化検出結果とを含む撮像面推定結果を記録制御部102へ出力する。
記録制御部102は、撮像面推定部115から入力される撮像面推定結果と、通信部101から入力される画像シーケンスの画像のデータとを関連付けて、データ記憶部103へ格納する。
画像探索部120は、外部機器3が設定した検索条件をインタフェース部104を介して受け付けて、設定された検索条件に合致するオブジェクト追跡履歴を検索する。図1に示されているように、画像探索部120は、検索部121、追跡履歴抽出部122、特徴量抽出部123、及び判定部124を備える。
検索部121は、記録制御部102を介して、データ記憶部103へアクセスし、検索条件に合致するオブジェクト追跡履歴を検索する。検索部121は、設定された検索条件に合致する複数のオブジェクト追跡履歴の候補を抽出する。この抽出は、撮像時間の範囲、オブジェクトが撮像されたカメラ等の1つ以上の条件を指定して行われる。検索部121は検索条件に合致するオブジェクト追跡履歴候補を、追跡履歴抽出部122に出力する。
追跡履歴抽出部122は、検索部121から入力されるオブジェクト追跡履歴候補に含まれる複数のオブジェクト特徴量の値から、「オブジェクト特徴量変化有り」と判定されているデータを除いたオブジェクト特徴量の値を抽出する。すなわち、追跡履歴抽出部122は、オブジェクト特徴量の変化がないと判定された画像について、オブジェクト特徴量の値をオブジェクト追跡履歴候補から抽出する。また、追跡履歴抽出部122は、「オブジェクト特徴量変化無し」と判定されているデータに対して撮像面が同じであるオブジェクトの集合を作成し、作成した集合とオブジェクト追跡履歴とを追跡履歴抽出結果として特徴量抽出部123へ出力する。このように、オブジェクト特徴量の変化があると判定されたデータを除くことにより、オクルージョンが発生した画像のデータを用いないで、異なる領域を撮像するカメラにより撮像されたオブジェクト間の同一性の判定を行うことが可能となる。これにより、オブジェクト間の同一性の判定の精度が高められる。
特徴量抽出部123は、追跡履歴抽出部122から入力される追跡履歴抽出結果を基に、記録制御部102を介してデータ記憶部103から追跡履歴抽出結果に該当するオブジェクトを含む画像のデータを抽出する。特徴量抽出部123は、撮像面が同じであるオブジェクトの集合に対応する複数の画像のデータから得られる画像特徴量を基に、その集合に対する1つの照合特徴量を生成し、判定部124へ出力する。したがって、各オブジェクト追跡履歴に対して、最大でモデルの撮像面と同じ数である4つの照合特徴量が判定部124へ出力される。ここで、画像特徴量には、公知のオブジェクト間の同一性判定技術に用いられる特徴量を用いることができる。例えば、色情報に関するヒストグラム、及び形状情報が挙げられる。また、照合特徴量を生成する際に、当該集合に含まれる画像特徴量に対して平均化等の処理を行って照合特徴量を生成してもよい。
判定部124は、特徴量抽出部123から入力される照合特徴量のうち、異なる撮像領域間において撮像面が同じであるオブジェクト追跡履歴同士を比較し、オブジェクト追跡履歴同士が互いに同一であるか否か判定を行う。オブジェクト間の同一性判定には、公知のオブジェクト間の同一性判定技術、例えばヒストグラムインターセクションを用いることができる。これ以外にも、例えば、機械学習(例えば、ディープラーニング、又はサポートベクターマシン)を用いて、同一オブジェクトか否かを判定してもよい。判定部124は、インタフェース部104を介して、外部機器3へ判定結果を出力する。
次に、画像処理装置100の動作について説明する。まず、図7を参照して、画像処理装置100により行われる画像認識処理について説明する。図7は、画像認識処理の動作を示すフローチャートである。
次に、図8を参照して、画像処理装置100により行われる画像探索処理について説明する。図8は画像探索処理の動作を示すフローチャートである。
図9は、実施の形態1に係る画像処理装置100の画像認識処理の一例を示す図である。図9の場合、追跡部113は、領域W1を撮像した画像シーケンス内で、同一の特徴を有するオブジェクトB1~B4を追跡し、オブジェクト追跡履歴R1を生成する。同様に、追跡部113は領域W2を撮像した画像シーケンス内で、オブジェクトC1~C3を追跡し、オブジェクト追跡履歴R2を生成する。図9においてB又はCの後に付された数字は、当該オブジェクトが異なる時刻で撮像されたことを示す。追跡履歴には、各撮像時刻におけるオブジェクト位置、オブジェクト速度、オブジェクト範囲に関する観測値及び予測値、追跡ID、特徴量変化検出結果、並びに撮像面推定結果が含まれる。
以上で説明した実施形態の種々の側面の一部を、以下にてまとめる。
付記1の画像処理装置(100)は、第1の領域(W1)を撮像した複数の画像を備える第1の画像シーケンスを解析して、第1の画像シーケンスの何れか1つの画像に現れる第1のオブジェクト(B1)を検出するとともに、第1の領域と異なる第2の領域(W2)を撮像した複数の画像を備える第2の画像シーケンスを解析して、第2の画像シーケンスの何れか1つの画像に現れる第2のオブジェクト(C1)を検出する検出部(111)と、第1のオブジェクトを追跡するための第1のオブジェクト特徴量、及び第2のオブジェクトを追跡するための第2のオブジェクト特徴量を生成する特徴量生成部(112)と、第1のオブジェクトを第1のオブジェクト特徴量を用いて第1の画像シーケンス内で時間方向に追跡して、複数の第1のオブジェクト特徴量の値(例えば、第1のオブジェクトの大きさの観測値)を含む追跡の結果を第1のオブジェクト追跡履歴(R1)として出力するとともに、第2のオブジェクトを第2のオブジェクト特徴量を用いて第2の画像シーケンス内で時間方向に追跡して、複数の第2のオブジェクト特徴量の値(例えば、第2のオブジェクトの大きさの観測値)を含む追跡の結果を第2のオブジェクト追跡履歴(R2)として出力する追跡部(113)と、第1のオブジェクト追跡履歴から第1のオブジェクト特徴量の変化の有無を検出して、検出の結果を第1の特徴量変化検出結果として出力するとともに、第2のオブジェクト追跡履歴から第2のオブジェクト特徴量の変化の有無を検出して、検出の結果を第2の特徴量変化検出結果として出力する特徴量変化検出部(114)と、第1のオブジェクト特徴量の変化がないと判定された画像(B1、B2、及びB4の画像)について第1のオブジェクト特徴量の値を第1のオブジェクト追跡履歴から抽出して、抽出された第1のオブジェクト特徴量の値と第1のオブジェクト追跡履歴とを第1の追跡履歴抽出結果として出力するとともに、第2のオブジェクト特徴量の変化がないと判定された画像(C1~C3の画像)について第2のオブジェクト特徴量の値を第2のオブジェクト追跡履歴から抽出して、抽出された第2のオブジェクト特徴量の値と第2のオブジェクト追跡履歴とを第2の追跡履歴抽出結果として出力する追跡履歴抽出部(122)と、第1の追跡履歴抽出結果及び第2の追跡履歴抽出結果を用いて、第1のオブジェクト及び第2のオブジェクトが同一か否かを判定する判定部(124)と、を備える。
付記2の画像処理装置は、付記1の画像処理装置であって、第1のオブジェクト追跡履歴から第1のオブジェクトの撮像面を推定して、推定された撮像面を第1の撮像面(B2及びB4の撮像面)として出力するとともに、第2のオブジェクト追跡履歴から第2のオブジェクトの撮像面を推定して、推定された撮像面を第2の撮像面(C3の撮像面)として出力する撮像面推定部(115)と、第1のオブジェクトの第1の撮像面について第1の照合用特徴量を抽出するとともに、第2のオブジェクトの第2の撮像面について第2の照合用特徴量を抽出する特徴量抽出部(123)と、を更に備え、判定部は、第1の撮像面及び第2の撮像面が同一の撮像面である場合に、第1の照合用特徴量及び第2の照合用特徴量を用いて、第1のオブジェクト及び第2のオブジェクトが同一か否かを判定する、
請求項1に記載の画像処理装置。
付記3の画像処理装置は、付記1又は2の画像処理装置であって、第1のオブジェクト追跡履歴は、ある関心時刻(例えば、t3)で観測された第1のオブジェクト特徴量の観測値(例えば、S3)、及び関心時刻より前の過去の時刻(例えば、t2)で観測された第1のオブジェクト特徴量の観測値(例えば、S2)に基づいて予測された関心時刻における第1のオブジェクト特徴量の予測値(例えば、P3)を含み、特徴量変化検出部は、関心時刻における第1のオブジェクト特徴量の観測値(S3)及び予測値(P3)に基づいて第1のオブジェクト特徴量の変化の有無を検出する。
付記4の画像処理装置は、付記1から3の何れか1つの画像処理装置であって、第1のオブジェクト追跡履歴は第1のオブジェクトの速度を含み、撮像面推定部は第1のオブジェクトの速度から第1の撮像面を推定する。
付記5の画像処理装置は、付記1から4の何れか1つの画像処理装置であって、特徴量抽出部は、同一の撮像面を有する第1のオブジェクトの集合に対応する複数の画像のデータから得られる画像特徴量に基づいて、その集合に対する第1の照合用特徴量を生成する。
付記6の画像処理方法は、画像処理装置が行う画像処理方法であって、検出部(111)が、第1の領域を撮像した複数の画像を備える第1の画像シーケンスを解析して、第1の画像シーケンスの何れか1つの画像に現れる第1のオブジェクトを検出するとともに、第1の領域と異なる第2の領域を撮像した複数の画像を備える第2の画像シーケンスを解析して、第2の画像シーケンスの何れか1つの画像に現れる第2のオブジェクトを検出するステップ(ST2)と、特徴量生成部(112)が、第1のオブジェクトを追跡するための第1のオブジェクト特徴量、及び第2のオブジェクトを追跡するための第2のオブジェクト特徴量を生成するステップ(ST4)と、追跡部(113)が、第1のオブジェクトを第1のオブジェクト特徴量を用いて第1の画像シーケンス内で時間方向に追跡して、複数の第1のオブジェクト特徴量の値を含む追跡の結果を第1のオブジェクト追跡履歴として出力するとともに、第2のオブジェクトを第2のオブジェクト特徴量を用いて第2の画像シーケンス内で時間方向に追跡して、複数の第2のオブジェクト特徴量の値を含む追跡の結果を第2のオブジェクト追跡履歴として出力するステップ(ST5~ST7)と、特徴量変化検出部(114)が、第1のオブジェクト追跡履歴から第1のオブジェクト特徴量の変化の有無を検出して、検出の結果を第1の特徴量変化検出結果として出力するとともに、第2のオブジェクト追跡履歴から第2のオブジェクト特徴量の変化の有無を検出して、検出の結果を第2の特徴量変化検出結果として出力するステップ(ST8)と、追跡履歴抽出部(122)が、第1のオブジェクト特徴量の変化がないと判定された画像について第1のオブジェクト特徴量の値を第1のオブジェクト追跡履歴から抽出して、抽出された第1のオブジェクト特徴量の値と第1のオブジェクト追跡履歴とを第1の追跡履歴抽出結果として出力するとともに、第2のオブジェクト特徴量の変化がないと判定された画像について第2のオブジェクト特徴量の値を第2のオブジェクト追跡履歴から抽出して、抽出された第2のオブジェクト特徴量の値と第2のオブジェクト追跡履歴とを第2の追跡履歴抽出結果として出力するステップ(ST23)と、判定部(124)が、第1の追跡履歴抽出結果及び第2の追跡履歴抽出結果を用いて、第1のオブジェクト及び第2のオブジェクトが同一か否かを判定するステップ(ST27)と、を備える。
Claims (6)
- 第1の領域を撮像した複数の画像を備える第1の画像シーケンスを解析して、前記第1の画像シーケンスの何れか1つの画像に現れる第1のオブジェクトを検出するとともに、前記第1の領域と異なる第2の領域を撮像した複数の画像を備える第2の画像シーケンスを解析して、前記第2の画像シーケンスの何れか1つの画像に現れる第2のオブジェクトを検出する検出部と、
前記第1のオブジェクトを追跡するための第1のオブジェクト特徴量、及び前記第2のオブジェクトを追跡するための第2のオブジェクト特徴量を生成する特徴量生成部と、
前記第1のオブジェクトを前記第1のオブジェクト特徴量を用いて前記第1の画像シーケンス内で時間方向に追跡して、複数の第1のオブジェクト特徴量の値を含む追跡の結果を第1のオブジェクト追跡履歴として出力するとともに、前記第2のオブジェクトを前記第2のオブジェクト特徴量を用いて前記第2の画像シーケンス内で時間方向に追跡して、複数の第2のオブジェクト特徴量の値を含む追跡の結果を第2のオブジェクト追跡履歴として出力する追跡部と、
前記第1のオブジェクト追跡履歴から前記第1のオブジェクト特徴量の変化の有無を検出して、検出の結果を第1の特徴量変化検出結果として出力するとともに、前記第2のオブジェクト追跡履歴から前記第2のオブジェクト特徴量の変化の有無を検出して、検出の結果を第2の特徴量変化検出結果として出力する特徴量変化検出部と、
前記第1のオブジェクト特徴量の変化がないと判定された画像について前記第1のオブジェクト特徴量の値を前記第1のオブジェクト追跡履歴から抽出して、抽出された第1のオブジェクト特徴量の値と前記第1のオブジェクト追跡履歴とを第1の追跡履歴抽出結果として出力するとともに、前記第2のオブジェクト特徴量の変化がないと判定された画像について前記第2のオブジェクト特徴量の値を前記第2のオブジェクト追跡履歴から抽出して、抽出された第2のオブジェクト特徴量の値と前記第2のオブジェクト追跡履歴とを第2の追跡履歴抽出結果として出力する追跡履歴抽出部と、
前記第1の追跡履歴抽出結果及び前記第2の追跡履歴抽出結果を用いて、前記第1のオブジェクト及び前記第2のオブジェクトが同一か否かを判定する判定部と、
を備えた、画像処理装置。 - 前記第1のオブジェクト追跡履歴から前記第1のオブジェクトの撮像面を推定して、推定された撮像面を第1の撮像面として出力するとともに、前記第2のオブジェクト追跡履歴から前記第2のオブジェクトの撮像面を推定して、推定された撮像面を第2の撮像面として出力する撮像面推定部と、
前記第1のオブジェクトの前記第1の撮像面について第1の照合用特徴量を抽出するとともに、前記第2のオブジェクトの前記第2の撮像面について第2の照合用特徴量を抽出する特徴量抽出部と、
を更に備え、
前記判定部は、前記第1の撮像面及び前記第2の撮像面が同一の撮像面である場合に、前記第1の照合用特徴量及び前記第2の照合用特徴量を用いて、前記第1のオブジェクト及び前記第2のオブジェクトが同一か否かを判定する、
請求項1に記載の画像処理装置。 - 前記第1のオブジェクト追跡履歴は、ある関心時刻で観測された前記第1のオブジェクト特徴量の観測値、及び前記関心時刻より前の過去の時刻で観測された前記第1のオブジェクト特徴量の観測値に基づいて予測された前記関心時刻における前記第1のオブジェクト特徴量の予測値を含み、
前記特徴量変化検出部は、前記関心時刻における前記第1のオブジェクト特徴量の前記観測値及び前記予測値に基づいて前記第1のオブジェクト特徴量の変化の有無を検出する、
請求項2に記載の画像処理装置。 - 前記第1のオブジェクト追跡履歴は前記第1のオブジェクトの速度を含み、
前記撮像面推定部は前記第1のオブジェクトの速度から前記第1の撮像面を推定する、
請求項3に記載の画像処理装置。 - 前記特徴量抽出部は、同一の撮像面を有する前記第1のオブジェクトの集合に対応する複数の画像のデータから得られる画像特徴量に基づいて、その集合に対する前記第1の照合用特徴量を生成する、
請求項2から4の何れか1項に記載の画像処理装置。 - 画像処理装置が行う画像処理方法であって、
検出部が、第1の領域を撮像した複数の画像を備える第1の画像シーケンスを解析して、前記第1の画像シーケンスの何れか1つの画像に現れる第1のオブジェクトを検出するとともに、前記第1の領域と異なる第2の領域を撮像した複数の画像を備える第2の画像シーケンスを解析して、前記第2の画像シーケンスの何れか1つの画像に現れる第2のオブジェクトを検出するステップと、
特徴量生成部が、前記第1のオブジェクトを追跡するための第1のオブジェクト特徴量、及び前記第2のオブジェクトを追跡するための第2のオブジェクト特徴量を生成するステップと、
追跡部が、前記第1のオブジェクトを前記第1のオブジェクト特徴量を用いて前記第1の画像シーケンス内で時間方向に追跡して、複数の第1のオブジェクト特徴量の値を含む追跡の結果を第1のオブジェクト追跡履歴として出力するとともに、前記第2のオブジェクトを前記第2のオブジェクト特徴量を用いて前記第2の画像シーケンス内で時間方向に追跡して、複数の第2のオブジェクト特徴量の値を含む追跡の結果を第2のオブジェクト追跡履歴として出力するステップと、
特徴量変化検出部が、前記第1のオブジェクト追跡履歴から前記第1のオブジェクト特徴量の変化の有無を検出して、検出の結果を第1の特徴量変化検出結果として出力するとともに、前記第2のオブジェクト追跡履歴から前記第2のオブジェクト特徴量の変化の有無を検出して、検出の結果を第2の特徴量変化検出結果として出力するステップと、
追跡履歴抽出部が、前記第1のオブジェクト特徴量の変化がないと判定された画像について前記第1のオブジェクト特徴量の値を前記第1のオブジェクト追跡履歴から抽出して、抽出された第1のオブジェクト特徴量の値と前記第1のオブジェクト追跡履歴とを第1の追跡履歴抽出結果として出力するとともに、前記第2のオブジェクト特徴量の変化がないと判定された画像について前記第2のオブジェクト特徴量の値を前記第2のオブジェクト追跡履歴から抽出して、抽出された第2のオブジェクト特徴量の値と前記第2のオブジェクト追跡履歴とを第2の追跡履歴抽出結果として出力するステップと、
判定部が、前記第1の追跡履歴抽出結果及び前記第2の追跡履歴抽出結果を用いて、前記第1のオブジェクト及び前記第2のオブジェクトが同一か否かを判定するステップと、
を備えた画像処理方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB2313898.5A GB2618757B (en) | 2021-03-18 | 2021-03-18 | Image processing device and image processing method |
PCT/JP2021/010965 WO2022195790A1 (ja) | 2021-03-18 | 2021-03-18 | 画像処理装置及び画像処理方法 |
JP2023506615A JP7274068B2 (ja) | 2021-03-18 | 2021-03-18 | 画像処理装置及び画像処理方法 |
US18/227,119 US20230410467A1 (en) | 2021-03-18 | 2023-07-27 | Image processing device and image processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2021/010965 WO2022195790A1 (ja) | 2021-03-18 | 2021-03-18 | 画像処理装置及び画像処理方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US18/227,119 Continuation US20230410467A1 (en) | 2021-03-18 | 2023-07-27 | Image processing device and image processing method |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2022195790A1 true WO2022195790A1 (ja) | 2022-09-22 |
Family
ID=83322068
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2021/010965 WO2022195790A1 (ja) | 2021-03-18 | 2021-03-18 | 画像処理装置及び画像処理方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230410467A1 (ja) |
JP (1) | JP7274068B2 (ja) |
GB (1) | GB2618757B (ja) |
WO (1) | WO2022195790A1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015064778A (ja) * | 2013-09-25 | 2015-04-09 | 住友電気工業株式会社 | 検出対象識別装置、変換装置、監視システム、及びコンピュータプログラム |
JP2015184810A (ja) * | 2014-03-20 | 2015-10-22 | 株式会社東芝 | 画像処理装置、画像処理方法および画像処理プログラム |
JP2018093423A (ja) * | 2016-12-06 | 2018-06-14 | 富士通株式会社 | 画像処理プログラム、画像処理装置および画像処理方法 |
WO2018173848A1 (ja) * | 2017-03-22 | 2018-09-27 | 日本電気株式会社 | オブジェクト追跡システム、インテリジェント撮像装置、オブジェクト特徴量抽出装置、オブジェクト特徴量抽出方法及び記憶媒体 |
WO2019038821A1 (ja) * | 2017-08-22 | 2019-02-28 | 三菱電機株式会社 | 画像処理装置および画像処理方法 |
-
2021
- 2021-03-18 JP JP2023506615A patent/JP7274068B2/ja active Active
- 2021-03-18 GB GB2313898.5A patent/GB2618757B/en active Active
- 2021-03-18 WO PCT/JP2021/010965 patent/WO2022195790A1/ja active Application Filing
-
2023
- 2023-07-27 US US18/227,119 patent/US20230410467A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015064778A (ja) * | 2013-09-25 | 2015-04-09 | 住友電気工業株式会社 | 検出対象識別装置、変換装置、監視システム、及びコンピュータプログラム |
JP2015184810A (ja) * | 2014-03-20 | 2015-10-22 | 株式会社東芝 | 画像処理装置、画像処理方法および画像処理プログラム |
JP2018093423A (ja) * | 2016-12-06 | 2018-06-14 | 富士通株式会社 | 画像処理プログラム、画像処理装置および画像処理方法 |
WO2018173848A1 (ja) * | 2017-03-22 | 2018-09-27 | 日本電気株式会社 | オブジェクト追跡システム、インテリジェント撮像装置、オブジェクト特徴量抽出装置、オブジェクト特徴量抽出方法及び記憶媒体 |
WO2019038821A1 (ja) * | 2017-08-22 | 2019-02-28 | 三菱電機株式会社 | 画像処理装置および画像処理方法 |
Also Published As
Publication number | Publication date |
---|---|
GB2618757B (en) | 2024-05-29 |
GB202313898D0 (en) | 2023-10-25 |
GB2618757A (en) | 2023-11-15 |
US20230410467A1 (en) | 2023-12-21 |
JPWO2022195790A1 (ja) | 2022-09-22 |
JP7274068B2 (ja) | 2023-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11360571B2 (en) | Information processing device and method, program and recording medium for identifying a gesture of a person from captured image data | |
JP4741650B2 (ja) | ビデオシーケンスにおけるオブジェクト追跡の方法 | |
JP6655878B2 (ja) | 画像認識方法及び装置、プログラム | |
Haritaoglu et al. | w 4 s: a real-time system for detecting and tracking people in 2 1/2 d | |
JP5213486B2 (ja) | 対象物追跡装置および対象物追跡方法 | |
US6658136B1 (en) | System and process for locating and tracking a person or object in a scene using a series of range images | |
JP6030617B2 (ja) | 画像処理装置および画像処理方法 | |
US9165211B2 (en) | Image processing apparatus and method | |
KR20160144149A (ko) | 다중 이동 물체의 겹침 제거 및 추적을 위한 영상 감시 장치 및 방법 | |
KR101062225B1 (ko) | 감시 카메라를 이용한 지능형 영상 검색 방법 및 시스템 | |
KR101737430B1 (ko) | 동적 배경을 가진 영상의 대상 객체 검출 방법 | |
CN109086725B (zh) | 手部跟踪方法及机器可读存储介质 | |
JP2010057105A (ja) | オブジェクトの3次元追跡方法およびシステム | |
Xiao et al. | Vehicle and person tracking in aerial videos | |
Su et al. | Adaptive colour feature identification in image for object tracking | |
Radzi et al. | Extraction of moving objects using frame differencing, ghost and shadow removal | |
Grove et al. | Colour based object tracking | |
Wang et al. | Face tracking using motion-guided dynamic template matching | |
JP7274068B2 (ja) | 画像処理装置及び画像処理方法 | |
JP2016081252A (ja) | 画像処理装置および画像処理方法 | |
Benedek et al. | Lidar-based gait analysis in people tracking and 4D visualization | |
Colombari et al. | Background initialization in cluttered sequences | |
Corvee et al. | Occlusion tolerent tracking using hybrid prediction schemes | |
JP3763279B2 (ja) | 物体抽出システム、物体抽出方法および物体抽出プログラム | |
Sharma et al. | Efficient object detection with its enhancement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 21931541 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2023506615 Country of ref document: JP Kind code of ref document: A |
|
ENP | Entry into the national phase |
Ref document number: 202313898 Country of ref document: GB Kind code of ref document: A Free format text: PCT FILING DATE = 20210318 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 21931541 Country of ref document: EP Kind code of ref document: A1 |