WO2019124634A1 - Syntax-based method for object tracking in compressed video - Google Patents

Syntax-based method for object tracking in compressed video Download PDF

Info

Publication number
WO2019124634A1
WO2019124634A1 PCT/KR2018/002556 KR2018002556W WO2019124634A1 WO 2019124634 A1 WO2019124634 A1 WO 2019124634A1 KR 2018002556 W KR2018002556 W KR 2018002556W WO 2019124634 A1 WO2019124634 A1 WO 2019124634A1
Authority
WO
WIPO (PCT)
Prior art keywords
moving object
image
tracking
object region
region
Prior art date
Application number
PCT/KR2018/002556
Other languages
French (fr)
Korean (ko)
Inventor
이성진
정승훈
배현성
이현우
Original Assignee
이노뎁 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이노뎁 주식회사 filed Critical 이노뎁 주식회사
Publication of WO2019124634A1 publication Critical patent/WO2019124634A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Definitions

  • the present invention relates generally to techniques for effectively performing object tracking from compressed images such as H.264 AVC and H.265 HEVC.
  • the present invention relates to a method and an apparatus for detecting a moving image of a compressed image generated by a CCTV camera, that is, an area in which there is a significant motion, Based on a syntax such as a motion vector and a coding type, and tracking motion of the moving object region to provide normalization to a video control apparatus.
  • the image sensing system adopts compressed image for efficiency of storage space.
  • complicated image compression techniques of high compression ratio such as H.264 AVC and H.265 HEVC are adopted.
  • a compressed image is generated according to one of these technical specifications, and the apparatus for reproducing the moving image receives the compressed image, and if the compressed image is received, As shown in FIG.
  • a process of decoding a compressed image to obtain a reproduced image, that is, an original image in which a decompressed image has been obtained, is then processed.
  • a moving picture decoding apparatus includes a syntax analyzer 11, an entropy decoder 12, an inverse transformer 13, a motion vector calculator 14, a predictor 15, a deblocking filter 16).
  • Such hardware modules process compressed images sequentially, decompress them, and restore the original image data.
  • the parser 11 parses the motion vector and the coding type for the coding unit of the compressed image.
  • Such a coding unit is generally an image block such as a macroblock or a sub-block, but may be implemented not exactly in accordance with a technical standard.
  • FIG. 2 is a flowchart showing a process of performing object tracking from a compressed image in a conventional image analysis solution.
  • a compressed image is decoded according to H.264 AVC and H.265 HEVC (S10), and the frame images of the reproduced image are downscaled to a small image, for example, 320x240 (S20).
  • S10 H.264 AVC and H.265 HEVC
  • S20 320x240
  • downscaling is performed to reduce the processing burden in the subsequent process.
  • differential images are obtained for the resized frame images, and the moving object is extracted through the image analysis (S30).
  • a moving path of the moving object is identified through an image analysis on a series of frame images (S40).
  • a method of tracking a syntax-based object for a compressed image comprising: a first step of obtaining a motion vector and a coding type for a coding unit by parsing a bitstream of the compressed image; A second step of acquiring a motion vector accumulation value for a first time preset for each of a plurality of image blocks constituting a compressed image; A third step of comparing the accumulated value of the motion vector with a preset first threshold value for a plurality of image blocks; A fourth step of marking an image block having a motion vector accumulation value exceeding a first threshold value as a moving object region; A series of coordinates of the tracking object moving object region is acquired over a series of image frames of the compressed image in relation to the moving object region (hereinafter referred to as the 'tracking object moving object region') specified by the user operation as a tracking object, And a fifth step of providing the coordinate sequence to the video control device.
  • an image block constituting a compressed image may include a macro block and a sub-block.
  • the fifth step is a step 5a for newly issuing and allocating a unique ID when the moving object area is in an ID unassigned state;
  • the rectangular coordinates include upper left coordinates (x, y), horizontal axis length (dx), and vertical axis length (dy) of a rectangle formed to virtually include the moving object region
  • the upper left x coordinate and the horizontal axis dx are divided by the horizontal resolution x_res of the compressed image to reflect the horizontal resolution x_res and the vertical resolution y_res, It is preferable to perform division processing with the resolution (y_res).
  • an object tracking method includes: a) a step of identifying a plurality of adjacent image blocks (hereinafter, referred to as 'neighboring blocks') around a moving object region; Comparing a motion vector value with a predetermined second threshold value for a plurality of neighboring blocks; Further comprising: marking a neighboring block having a motion vector value exceeding a second threshold as a moving object region; D) marking a neighboring block having a coding type of an intra picture among a plurality of neighboring blocks as a moving object region; Marking a predetermined number or less of unmarked image blocks surrounded by the moving object area as a moving object area by performing interpolation on the plurality of moving object areas.
  • a computer-readable nonvolatile recording medium records a program for executing a syntax-based object tracking method on a compressed image, such as the above, in a computer.
  • the moving object region is extracted from the CCTV image without performing the complicated processing such as decoding, downscaling resizing, differential image acquisition, and image analysis on the CCTV compressed image, There is an advantage that performance improvement can be obtained.
  • the present invention it is possible to quickly track a moving object area in a CCTV shot image without performing complex processing such as decoding, downscaling, differential image acquisition, and image analysis on a compressed image, And the effect of securing the prevention and follow-up evidence.
  • the moving object tracking result is mathematically normalized and then provided to the video control device, thereby ensuring compatibility with various equipment.
  • FIG. 1 is a block diagram showing a general configuration of a moving picture decoding apparatus
  • FIG. 2 is a flowchart showing a process of performing object tracking from a compressed image in the prior art
  • FIG. 3 is a flowchart showing an overall process of performing object tracking from a compressed image in accordance with the present invention
  • FIG. 4 is a flowchart showing an embodiment of a process of detecting valid motion from a compressed image in the present invention.
  • FIG. 5 is a diagram illustrating an example of a result of applying a valid motion region detection process according to the present invention to a CCTV monitoring screen.
  • Figures 6 and 7 are partially enlarged views of the main part of Figure 5;
  • FIG. 8 is a flowchart illustrating an example of a process of detecting a boundary region for a moving object region in the present invention.
  • FIG. 9 is a view showing an example of a result of applying a boundary region detection process according to the present invention to a compressed image.
  • Figs. 10 and 11 are partially enlarged views of the main part of Fig. 9; Fig.
  • FIG. 12 is a diagram illustrating an example of a result of summarizing a moving object region through interpolation in the present invention.
  • Figs. 13 and 14 are partially enlarged views of the main part of Fig. 12; Fig.
  • 15 is a flowchart showing an embodiment of a process of tracking and identifying a tracking object moving object region specified by a user from a compressed image in the present invention.
  • 16 is a diagram illustrating an example in which a unique ID is assigned to a moving object area in the present invention.
  • 17 is a diagram illustrating an example in which rectangular coordinates are set in a moving object area in the present invention.
  • FIG. 3 is a flow chart illustrating the overall process of performing object tracking from a compressed image in accordance with the present invention.
  • the object tracking process according to the present invention may well perform an image analysis server in a system for handling a series of compressed images, such as a CCTV image control system.
  • a bitstream of a compressed image is parsed without decoding a compressed image, and syntax information such as a macroblock and a sub-block, preferably a motion vector, And the coding type (Coding Type) information.
  • the obtained moving object area does not accurately reflect the boundary line of the moving object as shown in the image attached to this specification, but has a high processing speed and high reliability. Then, in the present invention, an operation of tracking a specific moving object area designated by the controller based on the obtained moving object area is performed.
  • the moving object region can be extracted and the object tracking can be performed without decoding the compressed image.
  • the apparatus or software to which the present invention is applied should not perform the operation of decoding the compressed image, and the scope of the present invention is not limited thereto.
  • Step S100 First, an effective motion that is substantially meaningful from the compressed image is detected based on the motion vector of the compressed image, and the image area in which the valid motion is detected is set as the moving object area.
  • the motion vector and coding type of the coding unit of the compressed image are parsed according to a moving picture compression standard such as H.264 AVC and H.265 HEVC.
  • the size of the coding unit is generally 64 x 64 pixels to 4 x 4 pixels and can be set to be flexible.
  • a predetermined time period e.g., 500 msec
  • Step S200 Next, the boundary region is detected based on the motion vector and the coding type for the moving object region detected in the previous step (S100). For this purpose, when a plurality of image blocks neighboring the image block marked as the moving object region are examined and the motion vector is generated over a second threshold value (for example, 0) or the coding type is an intra picture, Mark the block as a moving object area. In this process, the image block is substantially a block of the moving object area detected in step S100.
  • a second threshold value for example, 0
  • the coding type is an intra picture
  • the image block If an effective motion is found and the image block has some motion in the vicinity of the moving object area, it is marked as a moving object area because it is likely to be a lump with the previous moving object area.
  • the intra picture adjacent to the image block already detected as the moving object region is estimated as a lump together with the previously extracted moving object region.
  • Step S300 Interpolation is applied to the moving object area detected in the previous steps S100 and S200 to arrange the fragmentation of the moving object area.
  • the moving object region is determined in units of image blocks, in reality, there is an image block which is not marked as the moving object region in the middle even though it is one moving object (for example, As shown in FIG.
  • Step S400 The moving object region is quickly extracted based on the syntax (motion vector, coding type) of the coding unit for the compressed image through the above process.
  • the control agent requests the tracking of the object while specifying the moving object area through a mouse operation or the like on the monitor screen using the extracted result of the moving object area, the moving path of the moving object area in the compressed image Track it. Since this process is important for real time, the present invention can be preferably applied. In the video control system, if there is something that looks suspicious in the judgment of the control personnel, it is aimed to increase the crime prevention effect by tracking and marking it. In addition, object tracking information can be useful in securing evidence.
  • a series of image frames for example, a sequence of 30 frames per second
  • a 'tracking object moving object region' To acquire a series of coordinates for the tracked moving object region over the tracked moving object region. Then, a series of coordinates thus obtained, that is, a coordinate sequence, is provided to the video control device as a tracking result for the moving object area.
  • the moving object region corresponding to the corresponding coordinates in each image frame is displayed and displayed on the controller in a prominent manner.
  • FIG. 4 is a flowchart illustrating an embodiment of a process for detecting valid motion from a compressed image in the present invention
  • FIG. 5 is a view illustrating an example of a result of applying the effective moving area detection process according to the present invention to a CCTV monitoring screen.
  • Step S110 First, the coding unit of the compressed image is parsed to obtain a motion vector and a coding type.
  • the moving picture decoding apparatus performs a syntax analysis (header parsing) and a motion vector operation on a stream of a compressed image according to a moving picture compression standard such as H.264 AVC and H.265 HEVC.
  • a moving picture compression standard such as H.264 AVC and H.265 HEVC.
  • Step S120 The motion vector accumulation value for a preset time (for example, 500 ms) is obtained for each of the plurality of image blocks constituting the compressed image.
  • This step is presented with the intent to detect any valid motion that is substantially meaningful from the compressed image, such as a running car, a runner, or a crowd fighting with each other.
  • the shaking leaves, the ghost appearing for a while, and the shadows that change slightly due to the reflection of light are prevented from being detected because they are moving objects, but they are meaningless objects.
  • the motion vector accumulation value is obtained by accumulating the motion vectors in units of one or more image blocks for a preset predetermined time (for example, 500 msec).
  • the image block is used as a concept including a macro block and a sub-block.
  • Steps S130 and S140 The motion vector accumulation value is compared with a preset first threshold value (e.g., 20) for a plurality of image blocks, and an image block having a motion vector accumulation value exceeding the first threshold value, Lt; / RTI >
  • a preset first threshold value e.g. 20
  • a significant motion that is, a valid motion is detected in the corresponding image block, and is marked as a moving object region.
  • the degree of movement is such that the control personnel are worthy of interest.
  • the cumulative value for a predetermined time period is small enough to not exceed the first threshold value even if a motion vector occurs, the change in the image is estimated to be insignificant and insignificant, and ignored in the detection step.
  • Step S150 The moving object region is displayed on the reproduction screen of the compressed image so as to be distinguished from the general image.
  • FIG. 5 is a diagram illustrating an example of a result of applying a valid motion region detection process to a CCTV monitoring screen.
  • a plurality of image blocks indicating a cumulative motion vector value exceeding a first threshold value are marked as a moving object region, Line box.
  • Figs. 6 and 7 are enlarged views of main parts in Fig. 5.
  • Fig. 5 is a diagram illustrating an example of a result of applying a valid motion region detection process to a CCTV monitoring screen.
  • a plurality of image blocks indicating a cumulative motion vector value exceeding a first threshold value are marked as a moving object region, Line box.
  • Figs. 6 and 7 are enlarged views of main parts in Fig. 5.
  • the sidewalk block, the road, and the shadowed portion are not displayed as the moving object area, while the walking people and the traveling car are displayed as the moving object area.
  • the moving object region is represented by a thick line block, but it is more preferable that the CCTV monitor screen expresses the moving object region in a color that the controller can identify immediately.
  • FIG. 8 is a flowchart illustrating an embodiment of a process of detecting a boundary region for a moving object region in the present invention.
  • the moving object is not properly marked and only a part of the moving object is marked.
  • you look at a person walking or a car in motion you can find that not all of the objects are marked, but only some of the blocks are marked.
  • a plurality of moving object areas are marked for one moving object. This means that the judgment criterion of the moving object region adopted in the previous (S100) is very useful for filtering out the general region, but it is very strict.
  • Step S210 First, a plurality of adjacent image blocks are identified centering on the image block marked as the moving object region by the previous step (S100). These are referred to herein as " neighboring blocks ". These neighboring blocks are portions that are not marked as a moving object region according to S100. In the process of FIG. 8, a more detailed look at the neighboring blocks will be made to see if there are any neighboring blocks that can be included in the boundary of the moving object region.
  • Step S220 S230: The motion vector value is compared with a preset second threshold value (e.g., 0) for a plurality of neighboring blocks, and a neighboring block having a motion vector value exceeding the second threshold value is marked as a moving object region do. If there is a motion that is located adjacent to the recognized moving object region, which is substantially effective, the moving image block is likely to be a lump of the moving object region ahead of the moving object region. Therefore, this neighboring block is also marked as a moving object area.
  • a preset second threshold value e.g., 0
  • Step S240 Also, among the plurality of neighboring blocks, marking that the coding type is intra picture is marked as the moving object area.
  • marking that the coding type is intra picture is marked as the moving object area.
  • the intra picture adjacent to the image block already detected as the moving object region is safer to maintain the setting of the extracted moving object region.
  • Step S250 The moving object region is displayed on the reproduction screen of the compressed image so as to be distinguished from the general image.
  • FIG. 9 is a diagram showing an example of a result applied to the boundary region detection process according to the present invention.
  • a plurality of image blocks marked as a moving object region are displayed as thick line boxes on a monitor screen.
  • the moving object area is further expanded in FIGS. 10 and 11 to cover the entire moving object Can be found.
  • FIG. 12 is a diagram illustrating an example of a result of summarizing a moving object region through interpolation in the present invention
  • FIGS. 13 and 14 are enlarged views of main parts in FIG.
  • Step S300 is a process of organizing the division of the moving object region by applying interpolation to the moving object region detected in the previous steps S100 and S200.
  • a non-marking image block is found between moving object areas indicated by blocks. If there are non-marking image blocks in the middle, it is difficult to judge whether they are objects to be considered as individual moving objects or as a mass. In particular, since it is displayed mottled on the monitor screen of the CCTV video control system, it is difficult for the control personnel to grasp it immediately. Furthermore, if the moving object area is fragmented, the result of step S400 may become inaccurate, and in particular, the process of step S400 becomes complicated because the number of moving object areas becomes large.
  • the present invention if one or a small number of non-marking image blocks surrounded by a plurality of image blocks marked as a moving object region exist, they are marked as a moving object region, which is called interpolation. 9 and 12, all non-marking image blocks existing between the moving object areas are marked as moving object areas. This makes it possible to derive a more intuitive and accurate moving object detection result for reference by the control personnel.
  • 15 is a flowchart illustrating an embodiment of a process of tracking and identifying a tracking object moving object region specified by a user from a compressed image in the present invention.
  • the present invention extracts a moving object region based on syntax information that can be directly obtained from a coding unit of a compressed image. It is not necessary to decode a compressed image of the conventional technique to acquire and analyze a difference image with respect to the original image, thereby achieving a processing speed improvement of up to 20 times according to the inventor's test.
  • this approach has the drawback of being less accurate.
  • the present invention adopts a different approach from the conventional technique in the process of tracking a specific object designated by the controller in the CCTV shot image over time.
  • Step S410 First, if a moving object region that is not assigned an ID is found to handle the moving object region as one object, an Unique ID is newly issued and assigned. That is, in the previous process, the chunks of connected image blocks marked as moving object area are treated as one object (object). In order to implement this in the software processing process, a unique ID is assigned to a moving object area (a block of image blocks) and managed.
  • FIG. 16 shows an example in which a unique ID is assigned to a moving object area.
  • step S410 it is necessary to determine whether or not the chunks of the image blocks marked as the moving object region are the same before and after the series of image frames. This is because it is possible to judge whether or not the Unique ID has been previously assigned to the moving object area being handled.
  • the present invention does not deal with the contents of the original video image but checks whether or not the video block is the moving object area, so that it is impossible to precisely check whether or not the mass of the moving object area in the preceding and subsequent video frames is identical. That is, since the contents of the image included in the image are not grasped, the change can not be identified, for example, when the cat is replaced by a dog between the front and back frames at the same point. However, it is very unlikely that the time interval between frames is very short and that the observation object of the video control system moves at normal speed.
  • Steps S420 and S430 Next, a specific moving object area is set as a tracking object in response to a user, for example, an operation of a CCTV control agent. Assuming the control officer is looking at the CCTV footage and found that the criminal is running on the screen, you can specify to track the offender on the CCTV monitor screen. In the present invention, the criminal is not tracked but the moving object area to which the criminal belongs is identified as being tracked and set as a tracking target. In this specification, this area is referred to as a " tracking object moving object area ".
  • the present invention identifies a unique ID assigned to a moving object region to be tracked, and in this specification, the unique ID is referred to as a 'tracking object unique ID'.
  • Step S440 Next, one or more moving object regions found in each of the series of image frames constituting the compressed image are examined. Unique IDs are allocated to these moving object areas, and the moving object areas to which the unique IDs equal to the tracking target unique ID values are allocated are identified.
  • the identified moving object area corresponds to the tracking object moving object area, and the rectangular coordinates of the identified moving object area are sequentially calculated in each image frame. The set of rectangular coordinates thus obtained is set as a coordinate sequence for the tracking object moving object area.
  • the rectangular coordinates are calculated for the tracking object moving object area.
  • Steps S450 and S460 Then, a series of rectangular coordinates included in the coordinate sequence of the moving object object to be traced is normalized corresponding to the resolution of the compressed image.
  • the processing is performed by mapping a specific range of values, for example, a real value between 0 and 1.
  • the present invention is employed in order to overcome the difference according to the resolution of the video monitoring monitor and to maintain compatibility.
  • One example of such a normalization process is to divide the rectangular coordinates by the horizontal and vertical resolutions (x_res, y_res) of the compressed image. That is, the left upper-end x coordinate and the abscissa axis length dx of the rectangular coordinate are divided by the horizontal resolution (x_res) of the compressed image, and the upper left y coordinate and the vertical axis length dy of the rectangular coordinate are converted into the vertical resolution (y_res) Division processing. This ensures that all values are normalized to a real value between 0 and 1.
  • the coordinate values become (0.0, 0.0, 0.5, 0.5) after normalization processing.
  • This normalization process is applied uniformly to a series of rectangular coordinates included in the coordinate sequence.
  • the coordinate sequence of the normalized tracking target moving object region is provided to the video control apparatus so that the state of the tracking target moving object region can be revealed on the monitor handled by the CCTV control agent.
  • the normalized rectangular coordinates are advantageous in that the video control apparatus always provides a constant view irrespective of the display resolution of the monitor.
  • Step S470 The moving object region corresponding to the coordinate sequence of the tracking object moving object region is displayed on the reproduction screen of the compressed image so as to be distinguished from the general image. Since the coordinate sequence includes the rectangular coordinates, the corresponding rectangular area can be displayed entirely in a special manner, or the moving object area optimally disposed in the corresponding rectangular area can be specifically displayed.
  • Step S480 If the moving object region disappears in a series of image frames, the moving object region is destroyed by recycling the unique ID allocated in Step S410 for the moving object region.
  • the present invention can be embodied in the form of computer readable code on a computer-readable non-volatile recording medium.
  • a non-volatile recording medium includes all kinds of storage devices for storing computer-readable data such as a hard disk, an SSD, a CD-ROM, a NAS, a magnetic tape, a web disk, a cloud disk, And the code may be distributed and stored in the storage device of the computer.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Closed-Circuit Television Systems (AREA)

Abstract

The present invention relates to a technology which extracts from a compressed video, generated by a CCTV camera for example, a region having meaningful movement, that is, a moving object region, in image block units of the compressed video on the basis of syntax, such as motion vectors and coding types, without having to resort to complex image processing as in the conventional technology, and tracks and provides, normalized, movement of the moving object region to a video surveillance system. According to the present invention, a moving object region in a CCTV-filmed video can be rapidly tracked without having to resort to complex processing such as decoding, down-scale resizing, differential image acquisition, image analysis, and the like of a compressed video, and thus anti-crime effect and post-crime evidence gathering by means of a video surveillance system can be improved. The result of moving object tracking is provided to the video surveillance system after mathematical normalization, and thus compatibility with a variety of equipment can be assured.

Description

압축영상에 대한 신택스 기반의 객체 추적 방법A syntax-based object tracking method for compressed images
본 발명은 일반적으로 H.264 AVC 및 H.265 HEVC 등의 압축영상으로부터 객체 추적을 효과적으로 수행하는 기술에 관한 것이다.The present invention relates generally to techniques for effectively performing object tracking from compressed images such as H.264 AVC and H.265 HEVC.
더욱 상세하게는, 본 발명은 예컨대 CCTV 카메라가 생성하는 압축영상에 대해 무언가 유의미한 움직임이 존재하는 영역, 즉 이동객체 영역을 종래기술처럼 복잡한 이미지 프로세싱을 수행할 필요없이 압축영상을 구성하는 영상 블록 단위로 모션벡터와 코딩유형과 같은 신택스(syntax)에 기초하여 추출하고 그 이동객체 영역의 움직임을 추적하여 영상관제 장치에 정규화 제공하는 기술에 관한 것이다.More specifically, the present invention relates to a method and an apparatus for detecting a moving image of a compressed image generated by a CCTV camera, that is, an area in which there is a significant motion, Based on a syntax such as a motion vector and a coding type, and tracking motion of the moving object region to provide normalization to a video control apparatus.
최근에는 범죄예방이나 사후증거 확보 등을 위해 CCTV를 이용하는 영상관제 시스템을 구축하는 것이 일반적이다. 지역별로 다수의 CCTV 카메라를 설치해둔 상태에서 이들 CCTV 카메라가 생성하는 영상을 모니터에 표시하고 스토리지 장치에 저장해두는 것이다. 범죄나 사고가 발생하는 장면을 관제 요원이 발견하게 되면 그 즉시 적절하게 대처하는 한편, 필요에 따라서는 사후증거 확보를 위해 스토리지에 저장되어 있는 영상을 검색하는 것이다.In recent years, it is common to construct a video surveillance system that uses CCTV for crime prevention and post-evacuation. With many CCTV cameras installed in each region, the images generated by these CCTV cameras are displayed on the monitor and stored in the storage device. When the controller finds a scene where a crime or accident occurs, it immediately responds appropriately and, if necessary, retrieves the images stored in the storage for subsequent evidence.
그런데. CCTV 카메라의 설치 현황에 비해 관제 요원의 수는 매우 부족한 것이 현실이다. 이처럼 제한된 인원으로 영상 감시를 효과적으로 수행하려면 CCTV 영상을 모니터 화면에 단순 표시하는 것만으로는 충분하지 않다. 각각의 CCTV 영상에 존재하는 객체의 움직임을 감지하여 실시간으로 해당 영역에 무언가 추가 표시함으로써 효과적으로 발견되도록 처리하는 것이 바람직하다. 이러한 경우에 관제 요원은 CCTV 영상 전체를 균일한 관심도를 가지고 지켜보는 것이 아니라 객체 움직임이 있는 부분을 중심으로 CCTV 영상을 감시하면 된다.By the way. It is a reality that the number of control personnel is very short compared with the installation status of CCTV cameras. To effectively perform video surveillance with such a limited number of people, it is not sufficient to simply display the CCTV image on the monitor screen. It is preferable to detect the movement of an object existing in each CCTV image and to process the CCTV image so as to be effectively detected by adding something to the corresponding area in real time. In this case, the controller does not monitor the entire CCTV image with a uniform attention, but can monitor the CCTV image centered on the object motion.
한편, 영상감지 시스템에서는 스토리지 공간의 효율을 위해 압축영상을 채택하고 있다. 특히 최근에는 CCTV 카메라의 설치 대수가 급속하게 증가하고 고화질 카메라가 주로 설치됨에 따라 H.264 AVC 및 H.265 HEVC 등과 같은 고압축율의 복잡한 영상압축 기술이 채택되고 있다.On the other hand, the image sensing system adopts compressed image for efficiency of storage space. In recent years, as the number of CCTV cameras is rapidly increasing and high-definition cameras are installed, complicated image compression techniques of high compression ratio such as H.264 AVC and H.265 HEVC are adopted.
동영상 데이터를 생성하는 카메라 장치에서는 이들 기술규격 중 어느 하나에 따라 압축영상을 생성하여 제공하며, 동영상을 재생하는 장치에서는 이러한 압축영상을 전달받으면 그 압축영상을 인코딩할 때 적용했던 기술규격에 따라 역으로 디코딩을 수행한다. 영상압축 기술이 적용된 CCTV 영상에서 움직임 유무를 판단하려면 종래에는 압축영상을 디코딩하여 재생영상, 즉 압축이 풀려있는 원래 영상을 얻은 후에 이미지 처리하는 과정이 필요하였다.In a camera apparatus for generating moving image data, a compressed image is generated according to one of these technical specifications, and the apparatus for reproducing the moving image receives the compressed image, and if the compressed image is received, As shown in FIG. Conventionally, in order to determine the presence or absence of movement in a CCTV image to which an image compression technique is applied, a process of decoding a compressed image to obtain a reproduced image, that is, an original image in which a decompressed image has been obtained, is then processed.
도 1은 H.264 AVC 기술규격에 따른 동영상 디코딩 장치의 일반적인 구성을 나타내는 블록도이다. 도 1을 참조하면, H.264 AVC에 따른 동영상 디코딩 장치는 구문분석기(11), 엔트로피 디코더(12), 역 변환기(13), 모션벡터 연산기(14), 예측기(15), 디블로킹 필터(16)를 포함하여 구성된다. 1 is a block diagram showing a general configuration of a moving picture decoding apparatus according to the H.264 AVC technical standard. Referring to FIG. 1, a moving picture decoding apparatus according to H.264 AVC includes a syntax analyzer 11, an entropy decoder 12, an inverse transformer 13, a motion vector calculator 14, a predictor 15, a deblocking filter 16).
이들 하드웨어 모듈이 압축영상을 순차적으로 처리함으로써 압축을 풀고 원래의 영상 데이터를 복원해낸다. 이때, 구문분석기(11)는 압축영상의 코딩 유닛에 대해 모션벡터 및 코딩유형을 파싱해낸다. 이러한 코딩 유닛(coding unit)은 일반적으로는 매크로블록이나 서브 블록과 같은 영상 블록인데, 기술규격에 따라서는 정확히 일치하지 않게 구현될 수도 있다.These hardware modules process compressed images sequentially, decompress them, and restore the original image data. At this time, the parser 11 parses the motion vector and the coding type for the coding unit of the compressed image. Such a coding unit is generally an image block such as a macroblock or a sub-block, but may be implemented not exactly in accordance with a technical standard.
도 2는 기존의 영상분석 솔루션에서 압축영상으로부터 객체 추적을 수행하는 과정을 나타내는 순서도이다.2 is a flowchart showing a process of performing object tracking from a compressed image in a conventional image analysis solution.
도 2를 참조하면, 종래기술에서는 압축영상을 H.264 AVC 및 H.265 HEVC 등에 따라 디코딩하고(S10), 재생영상의 프레임 이미지들을 작은 이미지, 예컨대 320x240 정도로 다운스케일 리사이징을 한다(S20). 이때, 다운스케일 리사이징을 하는 이유는 이후 과정에서의 프로세싱 부담을 그나마 줄이기 위한 것이다. 그리고 나서, 리사이징된 프레임 이미지들에 대해 차영상(differentials)을 구한 후에 영상 분석을 통해 이동객체를 추출해낸다(S30). 그리고 나서, 일련의 프레임 이미지에 대한 영상 분석을 통해 그 이동객체의 이동 경로를 식별해낸다(S40).Referring to FIG. 2, in the conventional art, a compressed image is decoded according to H.264 AVC and H.265 HEVC (S10), and the frame images of the reproduced image are downscaled to a small image, for example, 320x240 (S20). At this time, downscaling is performed to reduce the processing burden in the subsequent process. Then, differential images are obtained for the resized frame images, and the moving object is extracted through the image analysis (S30). Then, a moving path of the moving object is identified through an image analysis on a series of frame images (S40).
종래기술에서 이동객체를 추출하려면 압축영상 디코딩, 다운스케일 리사이징, 영상 분석을 수행한다. 이들은 복잡도가 매우 높은 프로세스이고, 그로 인해 종래의 영상관제 시스템에서는 한 대의 영상분석 서버가 동시 처리할 수 있는 용량이 상당히 제한되어 있다. 현재 고성능의 영상분석 서버가 커버할 수 있는 최대 CCTV 채널은 통상 최대 16 채널이다. 다수의 CCTV 카메라가 설치되므로 영상관제 시스템에는 다수의 영상분석 서버가 필요하였고, 이는 비용 증가와 물리적 공간 확보의 어려움이라는 문제점을 유발하였다.To extract moving objects in the prior art, compressed image decoding, downscaled resizing, and image analysis are performed. These are very high complexity processes, and therefore, the capacity of simultaneous processing of one image analysis server is considerably limited in the conventional video control system. Currently, the maximum CCTV channel that can be covered by a high performance image analysis server is typically a maximum of 16 channels. Since a large number of CCTV cameras are installed, a number of image analysis servers are required in the video monitoring system, which causes problems such as increase in cost and difficulty in securing physical space.
대규모의 영상관제 시스템을 구축 및 유지하는 데에는 상당한 예산이 소요되는 바, 그에 상당하는 효용가치가 요구되고 있다. 그러한 요구의 기본 방향은 범죄 예방 및 범죄증거 확보이다. 그에 따라, 주변 모습을 단순히 촬영하여 저장하거나 이로부터 이동객체의 존재를 알려주는 것에서 더 나아가 실생활에서 경험상 그 자체가 문제되는 특수한 상황을 영상관제 시스템이 소프트웨어로 검출해주는 높은 수준의 감지 기능을 제공할 필요가 있다. 이때, 시스템 구축 비용과 물리적 공간 확보라는 현실적인 문제를 고려하여 효율적인 구현 기술도 요망된다.It takes a considerable amount of budget to construct and maintain a large-scale video control system, and a corresponding utility value is required. The basic direction of such a demand is to prevent crime and secure evidence of crime. Accordingly, it provides a high-level detection function that allows the video control system to detect a specific situation in which the experience is itself a problem, in addition to simply recording the surrounding scene or informing the existence of the moving object from the scene. There is a need. At this time, efficient implementation techniques are also required in view of the realistic problems of system construction cost and physical space.
본 발명의 목적은 일반적으로 H.264 AVC 및 H.265 HEVC 등의 압축영상으로부터 객체 추적을 효과적으로 수행하는 기술을 제공하는 것이다.It is an object of the present invention to provide a technique for effectively performing object tracking from compressed images such as H.264 AVC and H.265 HEVC.
특히, 본 발명의 목적은 예컨대 CCTV 카메라가 생성하는 압축영상에 대해 무언가 유의미한 움직임이 존재하는 영역, 즉 이동객체 영역을 종래기술처럼 복잡한 이미지 프로세싱을 수행할 필요없이 압축영상을 구성하는 영상 블록 단위로 모션벡터와 코딩유형과 같은 신택스(syntax)에 기초하여 추출하고 그 이동객체 영역의 움직임을 추적하여 영상관제 장치에 정규화 제공하는 기술을 제공하는 것이다.Particularly, it is an object of the present invention to provide an image processing apparatus and a method for processing a moving image in a region where there is a significant motion for a compressed image generated by, for example, a CCTV camera, Extracting the motion vector based on a syntax such as a motion vector and a coding type, and tracking motion of the moving object region to provide normalization to the video control device.
상기의 목적을 달성하기 위하여 본 발명에 따른 압축영상에 대한 신택스 기반의 객체 추적 방법은, 압축영상의 비트스트림을 파싱하여 코딩 유닛에 대한 모션벡터 및 코딩유형을 획득하는 제 1 단계; 압축영상을 구성하는 복수의 영상 블록 별로 미리 설정된 제 1 시간동안의 모션벡터 누적값을 획득하는 제 2 단계; 복수의 영상 블록에 대하여 모션벡터 누적값을 미리 설정된 제 1 임계치와 비교하는 제 3 단계; 제 1 임계치를 초과하는 모션벡터 누적값을 갖는 영상 블록을 이동객체 영역으로 마킹하는 제 4 단계; 사용자 조작에 의해 추적 대상으로 특정된 이동객체 영역(이하, '추적대상 이동객체 영역'이라 함)과 관련하여 압축영상의 일련의 영상 프레임에 걸쳐 추적대상 이동객체 영역의 일련의 좌표를 획득하여 그에 따른 좌표 시퀀스를 영상관제 장치로 제공하는 제 5 단계;를 포함하여 구성된다.According to an aspect of the present invention, there is provided a method of tracking a syntax-based object for a compressed image, the method comprising: a first step of obtaining a motion vector and a coding type for a coding unit by parsing a bitstream of the compressed image; A second step of acquiring a motion vector accumulation value for a first time preset for each of a plurality of image blocks constituting a compressed image; A third step of comparing the accumulated value of the motion vector with a preset first threshold value for a plurality of image blocks; A fourth step of marking an image block having a motion vector accumulation value exceeding a first threshold value as a moving object region; A series of coordinates of the tracking object moving object region is acquired over a series of image frames of the compressed image in relation to the moving object region (hereinafter referred to as the 'tracking object moving object region') specified by the user operation as a tracking object, And a fifth step of providing the coordinate sequence to the video control device.
본 발명에서 압축영상을 구성하는 영상 블록은 매크로블록과 서브블록을 포함할 수 있다.In the present invention, an image block constituting a compressed image may include a macro block and a sub-block.
이때, 제 5 단계는, 이동객체 영역이 ID 미할당 상태인 경우에 Unique ID를 신규 발행하여 할당하는 제 5a 단계; 사용자 조작에 따라 특정의 이동객체 영역(이하, '추적대상 이동객체 영역'이라 함)을 추적 대상으로 설정하는 제 5b 단계; 추적대상 이동객체 영역에 할당된 Unique ID(이하, '추적대상 Unique ID'라 함)를 식별하는 제 5c 단계; 압축영상을 구성하는 일련의 영상 프레임에 대해 추적대상 Unique ID 값이 할당된 이동객체 영역의 사각형 좌표를 순차적으로 산출하여 추적대상 이동객체 영역의 좌표 시퀀스로 설정하는 제 5d 단계; 추적대상 이동객체 영역의 좌표 시퀀스에 포함되는 일련의 사각형 좌표를 압축영상의 해상도에 대응하여 정규화 처리하는 제 5e 단계; 위 정규화 처리된 추적대상 이동객체 영역의 좌표 시퀀스를 영상관제 장치로 제공하는 제 5f 단계; 이동객체 영역이 일련의 영상 프레임에서 사라지는 경우에 그 할당된 Unique ID를 리보크(revoke)하는 제 5g 단계;를 포함하여 구성될 수 있다.In this case, the fifth step is a step 5a for newly issuing and allocating a unique ID when the moving object area is in an ID unassigned state; A step 5b of setting a specific moving object area (hereinafter, referred to as 'tracking object moving object area') as a tracking object according to a user operation; A fifth step c) of identifying a unique ID (hereinafter, referred to as 'tracking object unique ID') allocated to the tracking object moving object area; A fifth step of sequentially calculating square coordinates of a moving object area to which a tracking object unique ID value is assigned for a series of image frames constituting a compressed image and setting the coordinates as a coordinate sequence of the tracking object moving object area; A fifth step of normalizing the series of rectangular coordinates included in the coordinate sequence of the tracking object moving object region according to the resolution of the compressed image; A fifth step of providing a coordinate sequence of the moving object region to be traced, which has been normalized, to a video control apparatus; And a fifth step (g) of revoking the assigned unique ID when the moving object area disappears in the series of image frames.
이때, 사각형 좌표는 이동객체 영역을 최적으로 포함하도록 가상으로 형성된 사각형에 대한 좌상단 좌표(x, y), 가로축 길이(dx), 세로축 길이(dy)를 포함하여 구성되고, 정규화 처리는 압축영상의 가로해상도(x_res) 및 세로해상도(y_res)를 반영하여 좌상단 x 좌표와 가로축 길이(dx)를 압축영상의 가로해상도(x_res)로 나눗셈 처리하고 좌상단 y 좌표와 세로축 길이(dy)를 압축영상의 세로해상도(y_res)로 나눗셈 처리하는 것이 바람직하다.In this case, the rectangular coordinates include upper left coordinates (x, y), horizontal axis length (dx), and vertical axis length (dy) of a rectangle formed to virtually include the moving object region, The upper left x coordinate and the horizontal axis dx are divided by the horizontal resolution x_res of the compressed image to reflect the horizontal resolution x_res and the vertical resolution y_res, It is preferable to perform division processing with the resolution (y_res).
또한, 본 발명에 따른 객체 추적 방법은, 이동객체 영역을 중심으로 그 인접하는 복수의 영상 블록(이하, '이웃 블록'이라 함)을 식별하는 제 a 단계; 복수의 이웃 블록에 대해 모션벡터 값을 미리 설정된 제 2 임계치와 비교하는 제 b 단계; 제 2 임계치를 초과하는 모션벡터 값을 갖는 이웃 블록을 이동객체 영역으로 추가 마킹하는 제 c 단계; 복수의 이웃 블록 중에서 코딩유형이 인트라 픽쳐(Intra Picture)인 이웃 블록을 이동객체 영역으로 추가 마킹하는 제 d 단계; 복수의 이동객체 영역에 대하여 인터폴레이션을 수행하여 이동객체 영역으로 둘러싸인 미리 설정된 갯수 이하의 비마킹 영상 블록을 이동객체 영역으로 추가 마킹하는 제 e 단계;를 더 포함하여 구성될 수 있다.Also, an object tracking method according to the present invention includes: a) a step of identifying a plurality of adjacent image blocks (hereinafter, referred to as 'neighboring blocks') around a moving object region; Comparing a motion vector value with a predetermined second threshold value for a plurality of neighboring blocks; Further comprising: marking a neighboring block having a motion vector value exceeding a second threshold as a moving object region; D) marking a neighboring block having a coding type of an intra picture among a plurality of neighboring blocks as a moving object region; Marking a predetermined number or less of unmarked image blocks surrounded by the moving object area as a moving object area by performing interpolation on the plurality of moving object areas.
한편, 본 발명에 따른 컴퓨터로 판독가능한 비휘발성 기록매체는 컴퓨터에 이상과 같은 압축영상에 대한 신택스 기반의 객체 추적 방법을 실행시키기 위한 프로그램을 기록한 것이다.Meanwhile, a computer-readable nonvolatile recording medium according to the present invention records a program for executing a syntax-based object tracking method on a compressed image, such as the above, in a computer.
본 발명에 따르면 CCTV 압축영상에 대해 디코딩, 다운스케일 리사이징, 차영상 획득, 영상 분석 등과 같은 복잡한 프로세싱을 거치지 않고서도 CCTV 영상에서 이동객체 영역을 추출하므로 기존의 영상분석 서버에 비해 약 20배 정도의 성능 향상을 얻을 수 있는 장점이 있다.According to the present invention, since the moving object region is extracted from the CCTV image without performing the complicated processing such as decoding, downscaling resizing, differential image acquisition, and image analysis on the CCTV compressed image, There is an advantage that performance improvement can be obtained.
또한, 본 발명에 따르면 압축영상에 대해 디코딩, 다운스케일 리사이징, 차영상 획득, 영상 분석 등과 같은 복잡한 프로세싱을 거치지 않고서도 CCTV 촬영 영상에서 이동객체 영역을 신속하게 추적할 수 있어 영상관제 시스템을 통한 범죄예방 및 사후증거 확보 효과를 높일 수 있는 장점이 있다. 이때, 이동객체 추적 결과를 수학적으로 정규화한 후에 영상관제 장치로 제공함으로써 다양한 장비에 대한 호환성을 보장할 수 있는 장점이 있다.Also, according to the present invention, it is possible to quickly track a moving object area in a CCTV shot image without performing complex processing such as decoding, downscaling, differential image acquisition, and image analysis on a compressed image, And the effect of securing the prevention and follow-up evidence. At this time, the moving object tracking result is mathematically normalized and then provided to the video control device, thereby ensuring compatibility with various equipment.
도 1은 동영상 디코딩 장치의 일반적인 구성을 나타내는 블록도.1 is a block diagram showing a general configuration of a moving picture decoding apparatus;
도 2는 종래기술에서 압축영상으로부터 객체 추적을 수행하는 과정을 나타내는 순서도.2 is a flowchart showing a process of performing object tracking from a compressed image in the prior art;
도 3은 본 발명에 따라 압축영상으로부터 객체 추적을 수행하는 전체 프로세스를 나타내는 순서도.3 is a flowchart showing an overall process of performing object tracking from a compressed image in accordance with the present invention;
도 4는 본 발명에서 압축영상으로부터 유효 움직임을 검출하는 과정의 구현 예를 나타내는 순서도.4 is a flowchart showing an embodiment of a process of detecting valid motion from a compressed image in the present invention.
도 5는 CCTV 모니터링 화면에 본 발명에 따른 유효 움직임 영역 검출 과정이 적용된 결과의 일 예를 나타내는 도면.5 is a diagram illustrating an example of a result of applying a valid motion region detection process according to the present invention to a CCTV monitoring screen.
도 6 및 도 7은 도 5의 주요 부분에 대한 부분 확대 도면.Figures 6 and 7 are partially enlarged views of the main part of Figure 5;
도 8은 본 발명에서 이동객체 영역에 대한 바운더리 영역을 검출하는 과정의 구현 예를 나타내는 순서도. FIG. 8 is a flowchart illustrating an example of a process of detecting a boundary region for a moving object region in the present invention. FIG.
도 9는 압축영상에 대해 본 발명에 따른 바운더리 영역 검출 과정이 적용된 결과의 일 예를 나타내는 도면.9 is a view showing an example of a result of applying a boundary region detection process according to the present invention to a compressed image.
도 10 및 도 11은 도 9의 주요 부분에 대한 부분 확대 도면.Figs. 10 and 11 are partially enlarged views of the main part of Fig. 9; Fig.
도 12는 본 발명에서 인터폴레이션을 통해 이동객체 영역을 정리한 결과의 일 예를 나타내는 도면.FIG. 12 is a diagram illustrating an example of a result of summarizing a moving object region through interpolation in the present invention; FIG.
도 13 및 도 14는 도 12의 주요 부분에 대한 부분 확대 도면.Figs. 13 and 14 are partially enlarged views of the main part of Fig. 12; Fig.
도 15는 본 발명에서 압축영상으로부터 사용자가 지정한 추적대상 이동객체 영역을 추적 식별하는 과정의 구현 예를 나타내는 순서도.15 is a flowchart showing an embodiment of a process of tracking and identifying a tracking object moving object region specified by a user from a compressed image in the present invention.
도 16은 본 발명에서 이동객체 영역에 Unique ID가 할당된 일 예를 나타내는 도면.16 is a diagram illustrating an example in which a unique ID is assigned to a moving object area in the present invention.
도 17은 본 발명에서 이동객체 영역에 사각형 좌표가 설정된 일 예를 나타내는 도면.17 is a diagram illustrating an example in which rectangular coordinates are set in a moving object area in the present invention.
이하에서는 도면을 참조하여 본 발명을 상세하게 설명한다.Hereinafter, the present invention will be described in detail with reference to the drawings.
도 3은 본 발명에 따라 압축영상으로부터 객체 추적을 수행하는 전체 프로세스를 나타내는 순서도이다. 본 발명에 따른 객체 추적 프로세스는 일련의 압축영상을 다루는 시스템, 예컨대 CCTV 영상관제 시스템에서 영상분석 서버가 양호하게 수행할 수 있다.3 is a flow chart illustrating the overall process of performing object tracking from a compressed image in accordance with the present invention. The object tracking process according to the present invention may well perform an image analysis server in a system for handling a series of compressed images, such as a CCTV image control system.
본 발명에서는 압축영상을 디코딩할 필요없이 압축영상의 비트스트림을 파싱하여 각 영상 블록, 즉 매크로블록(Macro Block) 및 서브블록(Sub Block) 등의 신택스 정보, 바람직하게는 모션벡터(Motion Vector)와 코딩유형(Coding Type) 정보를 통해 이동객체 영역을 빠르게 추출한다. 이렇게 얻어진 이동객체 영역은 본 명세서에 첨부된 이미지에서 보여지는 바와 같이 이동객체의 경계선을 정확하게 반영하지는 못하지만 처리속도가 빠르면서도 신뢰도가 높은 장점이 있다. 그리고 나서, 본 발명에서는 이렇게 얻어진 이동객체 영역에 기초하여 관제요원이 지정한 특정의 이동객체 영역을 추적해나가는 동작을 수행한다.In the present invention, a bitstream of a compressed image is parsed without decoding a compressed image, and syntax information such as a macroblock and a sub-block, preferably a motion vector, And the coding type (Coding Type) information. The obtained moving object area does not accurately reflect the boundary line of the moving object as shown in the image attached to this specification, but has a high processing speed and high reliability. Then, in the present invention, an operation of tracking a specific moving object area designated by the controller based on the obtained moving object area is performed.
한편, 본 발명에 따르면 압축영상을 디코딩하지 않고도 이동객체 영역을 추출해내고 객체 추적을 수행할 수 있다. 하지만, 본 발명이 적용된 장치 또는 소프트웨어라면 압축영상을 디코딩하는 동작을 수행하지 않아야 하는 것으로 본 발명의 범위가 한정되는 것은 아니다.According to the present invention, the moving object region can be extracted and the object tracking can be performed without decoding the compressed image. However, the apparatus or software to which the present invention is applied should not perform the operation of decoding the compressed image, and the scope of the present invention is not limited thereto.
이하, 도 3을 참조하여 본 발명에 따라 압축영상으로부터 객체 추적을 수행하는 과정의 개념을 살펴본다.Hereinafter, the concept of a process of tracking an object from a compressed image according to the present invention will be described with reference to FIG.
단계 (S100) : 먼저, 압축영상의 모션벡터에 기초하여 압축영상으로부터 실질적으로 의미를 인정할만한 유효 움직임을 검출하며, 이처럼 유효 움직임이 검출된 영상 영역을 이동객체 영역으로 설정한다.Step S100: First, an effective motion that is substantially meaningful from the compressed image is detected based on the motion vector of the compressed image, and the image area in which the valid motion is detected is set as the moving object area.
이를 위해, H.264 AVC 및 H.265 HEVC 등의 동영상압축 표준에 따라서 압축영상의 코딩 유닛(coding unit)의 모션벡터와 코딩유형을 파싱한다. 이때, 코딩 유닛의 사이즈는 일반적으로 64x64 픽셀 내지 4x4 픽셀 정도이며 플렉서블(flexible)하게 설정될 수 있다.To do this, the motion vector and coding type of the coding unit of the compressed image are parsed according to a moving picture compression standard such as H.264 AVC and H.265 HEVC. At this time, the size of the coding unit is generally 64 x 64 pixels to 4 x 4 pixels and can be set to be flexible.
각 영상 블록에 대해 미리 설정된 일정 시간(예: 500 msec) 동안 모션벡터를 누적시키고, 그에 따른 모션벡터 누적값이 미리 설정된 제 1 임계치(예: 20)을 초과하는지 검사한다. 만일 그러한 영상 블록이 발견되면 해당 영상 블록에서 유효 움직임이 발견된 것으로 보고 이동객체 영역으로 마킹한다. 그에 따라, 모션벡터가 발생하였더라도 일정 시간동안의 누적값이 제 1 임계치를 넘지 못하는 경우에는 영상 변화가 미미한 것으로 추정하고 무시한다.Accumulates the motion vectors for a predetermined time period (e.g., 500 msec) for each image block, and checks whether the accumulated motion vector accumulated value exceeds a preset first threshold value (e.g., 20). If such an image block is found, the valid motion is found in the corresponding image block and marked as a moving object area. Accordingly, even if a motion vector occurs, if the cumulative value for a predetermined time does not exceed the first threshold value, it is assumed that the image change is negligible and ignored.
단계 (S200) : 다음으로, 앞의 (S100)에서 검출된 이동객체 영역에 대하여 모션벡터와 코딩유형에 기초하여 바운더리 영역이 어디까지인지 검출한다. 이를 위해, 이동객체 영역으로 마킹된 영상 블록을 중심으로 인접한 복수의 영상 블록을 검사하여 모션벡터가 제 2 임계치(예: 0) 이상 발생하였거나 코딩유형이 인트라 픽쳐(Intra Picture)일 경우에는 해당 영상 블록도 이동객체 영역으로 마킹한다. 이러한 과정을 통해서는 실질적으로는 해당 영상 블록이 앞서 (S100)에서 검출된 이동객체 영역과 한 덩어리를 이루는 형태로 되는 결과가 된다.Step S200: Next, the boundary region is detected based on the motion vector and the coding type for the moving object region detected in the previous step (S100). For this purpose, when a plurality of image blocks neighboring the image block marked as the moving object region are examined and the motion vector is generated over a second threshold value (for example, 0) or the coding type is an intra picture, Mark the block as a moving object area. In this process, the image block is substantially a block of the moving object area detected in step S100.
유효 움직임이 발견되어 이동객체 영역의 근방에서 어느 정도의 움직임이 있는 영상 블록이라면 이는 앞의 이동객체 영역과 한 덩어리일 가능성이 높기 때문에 이동객체 영역이라고 마킹한다. 또한, 인트라 픽쳐의 경우에는모션벡터가 존재하지 않기 때문에 모션벡터에 기초한 판정이 불가능하다. 이에, 이동객체 영역으로 이미 검출된 영상 블록에 인접하여 위치하는 인트라 픽쳐는 일단 기 추출된 이동객체 영역과 함께 한 덩어리로 추정한다.If an effective motion is found and the image block has some motion in the vicinity of the moving object area, it is marked as a moving object area because it is likely to be a lump with the previous moving object area. In addition, in the case of intra-picture, since there is no motion vector, determination based on motion vectors is impossible. Accordingly, the intra picture adjacent to the image block already detected as the moving object region is estimated as a lump together with the previously extracted moving object region.
단계 (S300) : 앞의 (S100)과 (S200)에서 검출된 이동객체 영역에 인터폴레이션(interpolation)을 적용하여 이동객체 영역의 분할(fragmentation)을 정리한다. 앞의 과정에서는 영상 블록 단위로 이동객체 영역 여부를 판단하였기 때문에 실제로는 하나의 이동객체(예: 사람)임에도 불구하고 중간중간에 이동객체 영역으로 마킹되지 않은 영상 블록이 존재하여 여러 개의 이동객체 영역으로 분할되는 현상이 발생할 수 있다. Step S300: Interpolation is applied to the moving object area detected in the previous steps S100 and S200 to arrange the fragmentation of the moving object area. In the previous process, since it is judged whether or not the moving object region is determined in units of image blocks, in reality, there is an image block which is not marked as the moving object region in the middle even though it is one moving object (for example, As shown in FIG.
그에 따라, 이동객체 영역으로 마킹된 복수의 영상 블록으로 둘러싸여 하나 혹은 소수의 비마킹 영상 블록이 존재한다면 이들은 이동객체 영역으로 추가로 마킹한다. 이를 통해, 여러 개로 분할되어 있는 이동객체 영역을 하나로 뭉쳐지도록 만들 수 있는데, 이와 같은 인터폴레이션의 영향은 도 9와 도 12를 비교하면 명확하게 드러난다.Accordingly, if one or a small number of non-marking image blocks are surrounded by a plurality of image blocks marked with the moving object area, they are further marked as a moving object area. In this way, it is possible to make a plurality of divided moving object areas to be united. The effect of such interpolation can be clearly shown by comparing FIG. 9 and FIG.
단계 (S400) : 이상의 과정을 통하여 압축영상에 대해 코딩 유닛의 신택스(모션벡터, 코딩유형)에 기초하여 이동객체 영역을 신속하게 추출하였다. 단계 (S400)에서는 이러한 이동객체 영역의 추출 결과를 이용하여 예컨대 관제요원이 모니터 화면에서 마우스 조작 등을 통해 이동객체 영역을 특정하면서 객체 추적을 요구하였을 때에 압축영상에서 해당 이동객체 영역의 이동 경로를 추적해낸다. 이 과정은 실시간성이 중요하기 때문에 본 발명이 양호하게 적용될 수 있다. 영상관제 시스템에서 관제요원 판단에 수상해보이는 무언가가 있다면 이를 추적하여 표시해줌으로써 범죄 예방 효과를 높이려는 것이다. 또한, 사후증거 확보라는 면에서도 객체 추적 정보는 유용하게 활용될 수 있다.Step S400: The moving object region is quickly extracted based on the syntax (motion vector, coding type) of the coding unit for the compressed image through the above process. In step S400, when the control agent requests the tracking of the object while specifying the moving object area through a mouse operation or the like on the monitor screen using the extracted result of the moving object area, the moving path of the moving object area in the compressed image Track it. Since this process is important for real time, the present invention can be preferably applied. In the video control system, if there is something that looks suspicious in the judgment of the control personnel, it is aimed to increase the crime prevention effect by tracking and marking it. In addition, object tracking information can be useful in securing evidence.
이를 위해, 본 발명에서는 사용자 조작에 의해 추적 대상으로 특정된 이동객체 영역(이하, '추적대상 이동객체 영역'이라 함)과 관련하여 압축영상의 일련의 영상 프레임(예: 초당 30 프레임의 시퀀스)에 걸쳐 추적대상 이동객체 영역에 대한 일련의 좌표를 획득한다. 그리고 나서, 이렇게 획득된 일련의 좌표, 즉 좌표 시퀀스를 이동객체 영역에 대한 추적 결과로서 영상관제 장치로 제공한다. 영상관제 장치에서는 각각의 영상 프레임에서 해당 좌표에 대응하는 이동객체 영역을 관제요원에게 두드러진 모습으로 디스플레이 표시한다.To this end, in the present invention, a series of image frames (for example, a sequence of 30 frames per second) of a compressed image in association with a moving object region (hereinafter referred to as a 'tracking object moving object region' To acquire a series of coordinates for the tracked moving object region over the tracked moving object region. Then, a series of coordinates thus obtained, that is, a coordinate sequence, is provided to the video control device as a tracking result for the moving object area. In the video control apparatus, the moving object region corresponding to the corresponding coordinates in each image frame is displayed and displayed on the controller in a prominent manner.
압축영상으로부터 객체 추적을 수행하는 구체적인 과정에 대해서는 도 15를 참조하여 상세하게 후술한다.A specific process of performing object tracking from the compressed image will be described later in detail with reference to FIG.
도 4는 본 발명에서 압축영상으로부터 유효 움직임을 검출하는 과정의 구현 예를 나타내는 순서도이고, 도 5는 CCTV 모니터링 화면에 본 발명에 따른 유효 움직임 영역 검출 과정이 적용된 결과의 일 예를 나타내는 도면이다.FIG. 4 is a flowchart illustrating an embodiment of a process for detecting valid motion from a compressed image in the present invention, and FIG. 5 is a view illustrating an example of a result of applying the effective moving area detection process according to the present invention to a CCTV monitoring screen.
단계 (S110) : 먼저, 압축영상의 코딩 유닛을 파싱하여 모션벡터 및 코딩유형을 획득한다. 도 1을 참조하면, 동영상 디코딩 장치는 압축영상의 스트림에 대해 H.264 AVC 및 H.265 HEVC 등과 같은 동영상압축 표준에 따라 구문분석(헤더 파싱) 및 모션벡터 연산을 수행한다. 이러한 과정을 통하여 압축영상의 코딩 유닛에 대하여 모션벡터와 코딩유형을 파싱해낸다.Step S110: First, the coding unit of the compressed image is parsed to obtain a motion vector and a coding type. Referring to FIG. 1, the moving picture decoding apparatus performs a syntax analysis (header parsing) and a motion vector operation on a stream of a compressed image according to a moving picture compression standard such as H.264 AVC and H.265 HEVC. Through this process, the motion vector and the coding type are parsed for the coding unit of the compressed image.
단계 (S120) : 압축영상을 구성하는 복수의 영상 블록 별로 미리 설정된 시간(예: 500 ms) 동안의 모션벡터 누적값을 획득한다. Step S120: The motion vector accumulation value for a preset time (for example, 500 ms) is obtained for each of the plurality of image blocks constituting the compressed image.
이 단계는 압축영상으로부터 실질적으로 의미를 인정할만한 유효 움직임, 예컨대 주행중인 자동차, 달려가는 사람, 서로 싸우는 군중들이 있다면 이를 검출하려는 의도를 가지고 제시되었다. 흔들리는 나뭇잎, 잠시 나타나는 고스트, 빛의 반사에 의해 약간씩 변하는 그림자 등은 비록 움직임은 있지만 실질적으로는 무의미한 객체이므로 검출되지 않도록 한다.This step is presented with the intent to detect any valid motion that is substantially meaningful from the compressed image, such as a running car, a runner, or a crowd fighting with each other. The shaking leaves, the ghost appearing for a while, and the shadows that change slightly due to the reflection of light are prevented from being detected because they are moving objects, but they are meaningless objects.
이를 위해, 미리 설정된 일정 시간(예: 500 msec) 동안 하나이상의 영상 블록 단위로 모션벡터를 누적시켜 모션벡터 누적값을 획득한다. 이때, 영상 블록은 매크로블록과 서브블록을 포함하는 개념으로 사용된 것이다.To this end, the motion vector accumulation value is obtained by accumulating the motion vectors in units of one or more image blocks for a preset predetermined time (for example, 500 msec). At this time, the image block is used as a concept including a macro block and a sub-block.
단계 (S130, S140) : 복수의 영상 블록에 대하여 모션벡터 누적값을 미리 설정된 제 1 임계치(예: 20)와 비교하며, 제 1 임계치를 초과하는 모션벡터 누적값을 갖는 영상 블록을 이동객체 영역으로 마킹한다.Steps S130 and S140: The motion vector accumulation value is compared with a preset first threshold value (e.g., 20) for a plurality of image blocks, and an image block having a motion vector accumulation value exceeding the first threshold value, Lt; / RTI >
만일 이처럼 일정 이상의 모션벡터 누적값을 갖는 영상 블록이 발견되면 해당 영상 블록에서 무언가 유의미한 움직임, 즉 유효 움직임이 발견된 것으로 보고 이동객체 영역으로 마킹한다. 예컨대 영상관제 시스템에서 사람이 뛰어가는 정도로 관제 요원이 관심을 가질만한 가치가 있을 정도의 움직임을 선별하여 검출하려는 것이다. 반대로, 모션벡터가 발생하였더라도 일정 시간동안의 누적값이 제 1 임계치를 넘지 못할 정도로 작을 경우에는 영상에서의 변화가 그다지 크지않고 미미한 것으로 추정하고 검출 단계에서 무시한다.If an image block having a cumulative motion vector value of more than a predetermined value is found, a significant motion, that is, a valid motion is detected in the corresponding image block, and is marked as a moving object region. For example, in a video control system, the degree of movement is such that the control personnel are worthy of interest. On the contrary, if the cumulative value for a predetermined time period is small enough to not exceed the first threshold value even if a motion vector occurs, the change in the image is estimated to be insignificant and insignificant, and ignored in the detection step.
단계 (S150) : 압축영상의 재생 화면에 이동객체 영역을 일반 영상과 구별되도록 디스플레이 제공한다. 도 5는 CCTV 모니터링 화면에 유효 움직임 영역 검출 과정이 적용된 결과의 일 예를 나타내는 도면으로서, 제 1 임계치를 초과하는 모션벡터 누적값을 나타낸 다수의 영상 블록이 이동객체 영역으로 마킹되어 모니터 화면에 두꺼운 라인의 박스로 표시되었다. 도 6 및 도 7은 도 5에서 주요 부분을 확대하여 표시한 도면이다. Step S150: The moving object region is displayed on the reproduction screen of the compressed image so as to be distinguished from the general image. FIG. 5 is a diagram illustrating an example of a result of applying a valid motion region detection process to a CCTV monitoring screen. In FIG. 5, a plurality of image blocks indicating a cumulative motion vector value exceeding a first threshold value are marked as a moving object region, Line box. Figs. 6 and 7 are enlarged views of main parts in Fig. 5. Fig.
도 5 내지 도 7을 살펴보면 보도블럭이나 도로, 그리고 그림자가 있는 부분 등은 이동객체 영역으로 표시되지 않은 반면, 걷고있는 사람들이나 주행중인 자동차 등이 이동객체 영역으로 표시되었다. 한편, 본 명세서에서는 두꺼운 라인의 블록으로 이동객체 영역을 표현하였으나, CCTV 모니터 화면에서는 관제요원이 즉각 식별할 수 있는 색상으로 표현하는 것이 더 바람직하다.5 to 7, the sidewalk block, the road, and the shadowed portion are not displayed as the moving object area, while the walking people and the traveling car are displayed as the moving object area. In this specification, the moving object region is represented by a thick line block, but it is more preferable that the CCTV monitor screen expresses the moving object region in a color that the controller can identify immediately.
도 8은 본 발명에서 이동객체 영역에 대한 바운더리 영역을 검출하는 과정의 구현 예를 나타내는 순서도이고, 도 9는 압축영상에 대해 바운더리 영역 검출 과정이 적용된 결과의 일 예를 나타내는 도면이다. 이때, 도 10 및 도 11은 도 9에서 주요 부분을 확대하여 표시한 도면이다.FIG. 8 is a flowchart illustrating an embodiment of a process of detecting a boundary region for a moving object region in the present invention. FIG. 9 is a diagram illustrating an example of a result of applying a boundary region detection process to a compressed image. 10 and 11 are enlarged views of main parts in FIG.
도 5 내지 도 7을 살펴보면 이동객체가 제대로 마킹되지 않았으며 일부에 대해서만 마킹이 이루어진 것을 발견할 수 있다. 즉, 걷고있는 사람이나 주행중인 자동차를 살펴보면 객체의 전부가 마킹된 것이 아니라 일부 블록만 마킹되었다는 것을 발견할 수 있다. 더욱이 하나의 이동객체에 대해 복수의 이동객체 영역이 마킹된 것도 많이 발견된다. 이는 앞의 (S100)에서 채택한 이동객체 영역의 판단 기준이 일반 영역을 필터링 아웃하는 데에는 매우 유용하지만 상당히 엄격한 것이었다는 것을 의미한다. Referring to FIGS. 5 to 7, it can be seen that the moving object is not properly marked and only a part of the moving object is marked. In other words, if you look at a person walking or a car in motion, you can find that not all of the objects are marked, but only some of the blocks are marked. Furthermore, it is also found that a plurality of moving object areas are marked for one moving object. This means that the judgment criterion of the moving object region adopted in the previous (S100) is very useful for filtering out the general region, but it is very strict.
따라서, 이동객체 영역을 중심으로 그 주변을 살펴봄으로써 이동객체의 바운더리를 검출하는 과정이 필요하다.Therefore, it is necessary to detect the boundary of the moving object by looking around the moving object area.
단계 (S210) : 먼저, 앞의 (S100)에 의해 이동객체 영역으로 마킹된 영상 블록을 중심으로 하여 인접하는 복수의 영상 블록을 식별한다. 이들은 본 명세서에서는 편이상 '이웃 블록'이라고 부른다. 이들 이웃 블록은 (S100)에 의해서는 이동객체 영역으로 마킹되지 않은 부분인데, 도 8의 프로세스에서는 이들에 대해 좀더 살펴봄으로써 이들 이웃 블록 중에서 이동객체 영역의 바운더리에 포함될만한 것이 있는지 확인하려는 것이다.Step S210: First, a plurality of adjacent image blocks are identified centering on the image block marked as the moving object region by the previous step (S100). These are referred to herein as " neighboring blocks ". These neighboring blocks are portions that are not marked as a moving object region according to S100. In the process of FIG. 8, a more detailed look at the neighboring blocks will be made to see if there are any neighboring blocks that can be included in the boundary of the moving object region.
단계 (S220, S230) : 복수의 이웃 블록에 대하여 모션벡터 값을 미리 설정된 제 2 임계치(예: 0)와 비교하고, 제 2 임계치를 초과하는 모션벡터 값을 갖는 이웃 블록을 이동객체 영역으로 마킹한다. 실질적으로 의미를 부여할만한 유효 움직임이 인정된 이동객체 영역에 인접하여 위치하고 어느 정도의 움직임도 발견되고 있다면 그 영상 블록은 촬영 영상의 특성상 앞의 이동객체 영역과 한 덩어리일 가능성이 높다. 따라서, 이러한 이웃 블록도 이동객체 영역이라고 마킹한다. Step S220: S230: The motion vector value is compared with a preset second threshold value (e.g., 0) for a plurality of neighboring blocks, and a neighboring block having a motion vector value exceeding the second threshold value is marked as a moving object region do. If there is a motion that is located adjacent to the recognized moving object region, which is substantially effective, the moving image block is likely to be a lump of the moving object region ahead of the moving object region. Therefore, this neighboring block is also marked as a moving object area.
단계 (S240) : 또한, 복수의 이웃 블록 중에서 코딩유형이 인트라 픽쳐인 것을 이동객체 영역으로 마킹한다. 인트라 픽쳐의 경우에는 모션벡터가 존재하지 않기 때문에 해당 이웃 블록에 움직임이 존재하는지 여부를 모션벡터에 기초하여 판단하는 것이 원천적으로 불가능하다. 이 경우에 이동객체 영역으로 이미 검출된 영상 블록에 인접 위치하는 인트라 픽쳐는 일단 기 추출된 이동객체 영역의 설정을 그대로 유지해주는 편이 안전하다.Step S240: Also, among the plurality of neighboring blocks, marking that the coding type is intra picture is marked as the moving object area. In the case of an intra picture, since there is no motion vector, it is basically impossible to judge whether motion exists in the neighboring block based on the motion vector. In this case, the intra picture adjacent to the image block already detected as the moving object region is safer to maintain the setting of the extracted moving object region.
단계 (S250) : 압축영상의 재생 화면에 이동객체 영역을 일반 영상과 구별되도록 디스플레이 제공한다. 도 9는 본 발명에서 바운더리 영역 검출 과정까지 적용된 결과의 일 예를 나타내는 도면인데, 이상의 과정을 통해 이동객체 영역으로 마킹된 다수의 영상 블록이 모니터 화면에 두꺼운 라인의 박스로 표시되었다. 도 10 및 도 11을 살펴보면, 앞서 도 6 및 도 7에서 박스 표시되었던 이동객체 영역의 근방으로 도 10 및 도 11에서는 이동객체 영역이 좀더 확장되었으며 이를 통해 이동객체를 전부 커버할 정도가 되었다는 사실을 발견할 수 있다.Step S250: The moving object region is displayed on the reproduction screen of the compressed image so as to be distinguished from the general image. FIG. 9 is a diagram showing an example of a result applied to the boundary region detection process according to the present invention. In the above process, a plurality of image blocks marked as a moving object region are displayed as thick line boxes on a monitor screen. Referring to FIGS. 10 and 11, in the vicinity of the moving object area shown in FIG. 6 and FIG. 7, the moving object area is further expanded in FIGS. 10 and 11 to cover the entire moving object Can be found.
도 12는 본 발명에서 인터폴레이션을 통해 이동객체 영역을 정리한 결과의 일 예를 나타내는 도면이고, 도 13 및 도 14는 도 12에서 주요 부분을 확대하여 표시한 도면이다.FIG. 12 is a diagram illustrating an example of a result of summarizing a moving object region through interpolation in the present invention, and FIGS. 13 and 14 are enlarged views of main parts in FIG.
단계 (S300)은 앞의 (S100)과 (S200)에서 검출된 이동객체 영역에 인터폴레이션을 적용하여 이동객체 영역의 분할을 정리하는 과정이다. 도 9 내지 도 11을 살펴보면 블록으로 표시된 이동객체 영역 사이사이에 비마킹 영상 블록이 발견된다. 이렇게 중간중간에 비마킹 영상 블록이 존재하게 되면 이들이 여러 개의 개별적인 이동객체인지 아니면 한 덩어리로 간주해야 할 대상인지 판단하기 어렵다. 특히, CCTV 영상관제 시스템의 모니터 화면 상에 얼룩덜룩하게 표시되므로 관제 요원이 즉각적으로 파악하기가 곤란하다는 단점도 있다. 더욱이, 이동객체 영역이 파편화되면 단계 (S400)의 결과가 부정확해질 수 있고, 특히 이동객체 영역의 갯수가 많아지기 때문에 단계 (S400)의 프로세스가 복잡해지는 문제도 있다.Step S300 is a process of organizing the division of the moving object region by applying interpolation to the moving object region detected in the previous steps S100 and S200. Referring to FIGS. 9 to 11, a non-marking image block is found between moving object areas indicated by blocks. If there are non-marking image blocks in the middle, it is difficult to judge whether they are objects to be considered as individual moving objects or as a mass. In particular, since it is displayed mottled on the monitor screen of the CCTV video control system, it is difficult for the control personnel to grasp it immediately. Furthermore, if the moving object area is fragmented, the result of step S400 may become inaccurate, and in particular, the process of step S400 becomes complicated because the number of moving object areas becomes large.
그에 따라, 본 발명에서는 이동객체 영역으로 마킹된 복수의 영상 블록으로 둘러싸여 하나 혹은 소수의 비마킹 영상 블록이 존재한다면 이는 이동객체 영역으로 마킹하는데, 이를 인터폴레이션이라고 부른다. 도 9와 도 12를 대비하여 살펴보면, 이동객체 영역 사이사이에 존재하던 비마킹 영상 블록이 모두 이동객체 영역이라고 마킹되었다. 이를 통해, 관제 요원이 참고하기에 좀더 직관적이고 정확한 이동객체 검출 결과를 도출할 수 있게 되었다.Accordingly, in the present invention, if one or a small number of non-marking image blocks surrounded by a plurality of image blocks marked as a moving object region exist, they are marked as a moving object region, which is called interpolation. 9 and 12, all non-marking image blocks existing between the moving object areas are marked as moving object areas. This makes it possible to derive a more intuitive and accurate moving object detection result for reference by the control personnel.
도 15는 본 발명에서 압축영상으로부터 사용자가 지정한 추적대상 이동객체 영역을 추적 식별하는 과정의 구현 예를 나타내는 순서도이다.15 is a flowchart illustrating an embodiment of a process of tracking and identifying a tracking object moving object region specified by a user from a compressed image in the present invention.
전술한 바와 같이 본 발명은 압축영상의 코딩 유닛에서 바로 얻을 수 있는 신택스 정보에 기초하여 이동객체 영역을 추출한다. 종래기술의 압축영상을 디코딩하여 원본 영상에 대해 차영상을 획득하여 분석하는 과정이 불필요하게 되었으며, 이를 통해 발명자의 테스트에 따르면 최대 20배의 처리속도 개선을 이루었다. 그러나, 이러한 접근방식은 정밀도가 떨어진다는 약점이 있다. 이동객체 자체를 추출하는 것이 아니라 이동객체가 포함되어 있을 것으로 추정되는 영상 블록의 덩어리를 추출한다는 점에서 개념상 차이가 있다. 이러한 차이점을 반영하여 본 발명은 CCTV 촬영 영상에서 관제요원이 지정한 특정 객체를 시간경과에 따라 추적해나가는 과정에서도 종래기술과는 상이한 접근법을 채택하였다.As described above, the present invention extracts a moving object region based on syntax information that can be directly obtained from a coding unit of a compressed image. It is not necessary to decode a compressed image of the conventional technique to acquire and analyze a difference image with respect to the original image, thereby achieving a processing speed improvement of up to 20 times according to the inventor's test. However, this approach has the drawback of being less accurate. There is a conceptual difference in that it does not extract the moving object itself but extracts a block of the image block which is assumed to contain the moving object. Reflecting these differences, the present invention adopts a different approach from the conventional technique in the process of tracking a specific object designated by the controller in the CCTV shot image over time.
이하에서, 본 발명에서 채택하고 있는 객체 추적 과정의 일 실시예를 구체적으로 기술한다.Hereinafter, an embodiment of the object tracking process adopted in the present invention will be described in detail.
단계 (S410) : 먼저, 이동객체 영역을 하나의 객체(오브젝트)처럼 다루기 위하여 식별정보(ID) 미할당 상태인 이동객체 영역을 발견하면 Unique ID를 신규 발행하여 할당해준다. 즉, 이전의 과정에서 이동객체 영역이라고 마킹되어진 서로 연결되어 있는 영상블록의 덩어리를 하나의 객체(오브젝트)처럼 다루는 것이다. 이를 소프트웨어 처리 과정에서 구현하기 위해 이동객체 영역(영상블록의 덩어리)에 대해 Unique ID를 할당하여 관리한다.Step S410: First, if a moving object region that is not assigned an ID is found to handle the moving object region as one object, an Unique ID is newly issued and assigned. That is, in the previous process, the chunks of connected image blocks marked as moving object area are treated as one object (object). In order to implement this in the software processing process, a unique ID is assigned to a moving object area (a block of image blocks) and managed.
그에 따라, 도 15에서 이후의 과정은 이동객체 영역에 할당된 Unique ID를 기준으로 수행되는 것이 바람직한다. 도 16은 이동객체 영역에 Unique ID가 할당되어 있는 일 예를 나타낸다.Accordingly, it is preferable that the following process is performed based on the Unique ID assigned to the moving object area in FIG. 16 shows an example in which a unique ID is assigned to a moving object area.
한편, 단계 (S410)에서는 이동객체 영역이라고 마킹되어진 서로 연결되어 있는 영상블록의 덩어리가 일련의 영상 프레임 앞뒤 간에 동일한 것인지 아닌지를 판단할 수 있어야 한다. 그래야, 현재 다루고 있는 이동객체 영역에 대해 이전에 Unique ID가 할당되어 있었는지 여부를 판단할 수 있기 때문이다.On the other hand, in step S410, it is necessary to determine whether or not the chunks of the image blocks marked as the moving object region are the same before and after the series of image frames. This is because it is possible to judge whether or not the Unique ID has been previously assigned to the moving object area being handled.
본 발명에서는 원본 영상 이미지의 내용을 다루는 것이 아니라 영상블록이 이동객체 영역인지 여부만 체크하였기 때문에 앞 뒤의 영상 프레임에서 이동객체 영역의 덩어리의 동일성 여부를 정밀하게 확인할 수 없다. 즉, 영상에 포함된 이미지 내용을 파악하지 않기 때문에 예컨대 동일 지점에서 앞 뒤 프레임 간에 고양이가 개로 치환되었을 때에 그러한 변화를 식별하지 못한다. 하지만, 프레임 간의 시간간격이 매우 짧다는 점과 영상관제 시스템의 관찰 대상은 통상의 속도로 움직인다는 점을 감안하면 이러한 일이 벌어질 가능성은 매우 낮다.The present invention does not deal with the contents of the original video image but checks whether or not the video block is the moving object area, so that it is impossible to precisely check whether or not the mass of the moving object area in the preceding and subsequent video frames is identical. That is, since the contents of the image included in the image are not grasped, the change can not be identified, for example, when the cat is replaced by a dog between the front and back frames at the same point. However, it is very unlikely that the time interval between frames is very short and that the observation object of the video control system moves at normal speed.
이에, 본 발명에서는 앞 뒤 프레임에서 이동객체 영역의 덩어리 간에 중첩되는 영상블록의 비율 혹은 갯수가 일정 임계치 이상인 것들을 동일한 이동객체 영역이라고 추정한다. 이러한 접근방식에 의하면 원본 영상의 내용을 모르더라도 특정의 이동객체 영역이 움직이고 있는 것인지 아니면 새로운 이동객체 영역이 신규로 나타난 것인지 아니면 기존의 이동객체 영역이 사라진 것인지 판단할 수 있다. 이러한 판단은 정확도는 종래기술에 비해 낮지만 데이터 처리 속도를 획기적으로 높일 수 있어 실제 적용에서는 오히려 장점을 나타낸다.Accordingly, in the present invention, it is assumed that those having a ratio or number of image blocks superimposed between chunks of the moving object region in the preceding and following frames are equal to or larger than a predetermined threshold value. According to this approach, even if the contents of the original image are unknown, it can be determined whether a specific moving object area is moving, a new moving object area is newly displayed, or an existing moving object area is disappearing. This determination is less accurate than the prior art, but it can increase the data processing speed dramatically, which is rather advantageous in practical applications.
단계 (S420, S430) : 이어서, 사용자, 예컨대 CCTV 관제요원의 조작에 대응하여 특정의 이동객체 영역을 추적 대상으로 설정한다. 관제요원이 CCTV 촬영 영상을 살펴보던 중에 화면 상에서 범죄자가 뛰어가고 있는 것을 발견하였다고 가정하면, CCTV 모니터 화면에서 그 범죄자를 추적하라고 지정할 수 있다. 본 발명에서는 범죄자를 추적하는 것이 아니라 그 범죄자가 속해있는 이동객체 영역을 추적하는 것으로 식별하며, 이를 추적 대상으로 설정한다. 본 명세서에서는 편이상 이 영역을 '추적대상 이동객체 영역'이라고 부른다.Steps S420 and S430: Next, a specific moving object area is set as a tracking object in response to a user, for example, an operation of a CCTV control agent. Assuming the control officer is looking at the CCTV footage and found that the criminal is running on the screen, you can specify to track the offender on the CCTV monitor screen. In the present invention, the criminal is not tracked but the moving object area to which the criminal belongs is identified as being tracked and set as a tracking target. In this specification, this area is referred to as a " tracking object moving object area ".
전술한 바와 같이 압축영상을 구성하는 일련의 영상 프레임에서 시간 경과에 따른 이동객체 영역의 아이덴티티(identity)를 관리하기 위해 Unique ID를 기준으로 이동객체 영역을 다루는 것이 바람직하다. 그에 따라, 본 발명은 추적대상 이동객체 영역에 할당된 Unique ID를 식별하며, 본 명세서에서는 편이상 이 Unique ID를 '추적대상 Unique ID'라고 부른다.As described above, in order to manage the identity of the moving object area over time in a series of image frames constituting the compressed image, it is desirable to treat the moving object area based on the Unique ID. Accordingly, the present invention identifies a unique ID assigned to a moving object region to be tracked, and in this specification, the unique ID is referred to as a 'tracking object unique ID'.
단계 (S440) : 이어서, 압축영상을 구성하는 일련의 영상 프레임의 각각에서 발견된 하나이상의 이동객체 영역을 살펴본다. 이들 이동객체 영역에 대해 Unique ID가 할당되어 있는데, 이들 중에서 추적대상 Unique ID 값과 동일한 Unique ID가 할당되어 있는 이동객체 영역을 식별한다. 이 식별된 이동객체 영역이 추적대상 이동객체 영역에 해당하며, 각 영상 프레임에서 그 식별된 이동객체 영역의 사각형 좌표를 순차적으로 산출해낸다. 이렇게 얻어진 일련의 사각형 좌표를 추적대상 이동객체 영역에 대한 좌표 시퀀스로 설정한다.Step S440: Next, one or more moving object regions found in each of the series of image frames constituting the compressed image are examined. Unique IDs are allocated to these moving object areas, and the moving object areas to which the unique IDs equal to the tracking target unique ID values are allocated are identified. The identified moving object area corresponds to the tracking object moving object area, and the rectangular coordinates of the identified moving object area are sequentially calculated in each image frame. The set of rectangular coordinates thus obtained is set as a coordinate sequence for the tracking object moving object area.
바람직하게는 추적대상 이동객체 영역에 대해 사각형 좌표를 산출한다. 이동객체 영역에 대한 사각형 좌표의 일 예로서 해당 이동객체 영역을 최적으로 포함하도록 가상으로 형성된 사각형에 대한 좌상단 좌표(x, y), 가로축 길이(dx), 세로축 길이(dy)를 통해 구성할 수 있다. 즉, 이동객체 영역의 사각형 좌표는 (x, y, dx, dy)의 형태로 이루어지는 것이다. 도 17은 세 개의 이동객체 영역(Unique ID = 001, 002, 003)에 각각 사각형 좌표가 설정된 예를 나타낸다.Preferably, the rectangular coordinates are calculated for the tracking object moving object area. As an example of the rectangular coordinates for the moving object area, it is possible to configure the upper left coordinates (x, y), the abscissa axis length (dx), and the ordinate axis length (dy) of a quadrangle formed to optimally include the moving object area have. That is, the rectangular coordinates of the moving object area are in the form of (x, y, dx, dy). 17 shows an example in which square coordinates are set for each of three moving object areas (Unique ID = 001, 002, 003).
단계 (S450, S460) : 그리고 나서, 추적대상 이동객체 영역의 좌표 시퀀스에 포함되는 일련의 사각형 좌표를 압축영상의 해상도에 대응하여 정규화 처리한다. ㅁ焞 처리는 특정 범위의 값, 예컨대 0 내지 1 사이의 실수 값으로 매핑하는 것인데, 본 발명에서는 영상관제 모니터의 해상도에 따른 차이를 극복하고 호환성을 유지하기 위해 채용되는 것이 바람직하다.Steps S450 and S460: Then, a series of rectangular coordinates included in the coordinate sequence of the moving object object to be traced is normalized corresponding to the resolution of the compressed image. The processing is performed by mapping a specific range of values, for example, a real value between 0 and 1. In the present invention, it is preferable that the present invention is employed in order to overcome the difference according to the resolution of the video monitoring monitor and to maintain compatibility.
이와 같은 정규화 처리의 일 예로서 사각형 좌표를 압축영상의 가로 및 세로 해상도(x_res, y_res)로 나눗셈 처리하는 것을 들 수 있다. 즉, 사각형 좌표의 좌상단 x 좌표와 가로축 길이(dx)를 압축영상의 가로해상도(x_res)로 나눗셈 처리하고, 사각형 좌표의 좌상단 y 좌표와 세로축 길이(dy)를 압축영상의 세로해상도(y_res)로 나눗셈 처리하는 것이다. 이렇게 하면 모든 값이 0 내지 1 사이의 실수 값으로 정규화 매핑된다. 예를 들어 압축영상의 해상도가 가로 100, 세로 100이고 사각형 좌표가 (0, 0, 50, 50)이라면 정규화 처리를 수행한 후에는 좌표 값이 (0.0, 0.0, 0.5, 0.5)가 된다. 이러한 정규화 처리를 좌표 시퀀스에 포함된 일련의 사각형 좌표에 대해 일일히 적용한다.One example of such a normalization process is to divide the rectangular coordinates by the horizontal and vertical resolutions (x_res, y_res) of the compressed image. That is, the left upper-end x coordinate and the abscissa axis length dx of the rectangular coordinate are divided by the horizontal resolution (x_res) of the compressed image, and the upper left y coordinate and the vertical axis length dy of the rectangular coordinate are converted into the vertical resolution (y_res) Division processing. This ensures that all values are normalized to a real value between 0 and 1. For example, if the resolution of the compressed image is 100, 100, and the rectangular coordinates are (0, 0, 50, 50), then the coordinate values become (0.0, 0.0, 0.5, 0.5) after normalization processing. This normalization process is applied uniformly to a series of rectangular coordinates included in the coordinate sequence.
이어서, 그 정규화 처리된 추적대상 이동객체 영역의 좌표 시퀀스를 영상관제 장치로 제공하여 CCTV 관제요원이 다루고 있는 모니터에 추적대상 이동객체 영역의 모습이 드러날 수 있도록 한다. 전술한 바와 같이, 정규화 처리된 사각형 좌표는 영상관제 장치에서 모니터의 디스플레이 해상도에 무관하게 항상 일정한 모습을 제공하게 되는 장점이 있다.Then, the coordinate sequence of the normalized tracking target moving object region is provided to the video control apparatus so that the state of the tracking target moving object region can be revealed on the monitor handled by the CCTV control agent. As described above, the normalized rectangular coordinates are advantageous in that the video control apparatus always provides a constant view irrespective of the display resolution of the monitor.
단계 (S470) : 압축영상의 재생 화면에 영상 프레임 별로 추적대상 이동객체 영역의 좌표 시퀀스에 대응하는 이동객체 영역을 일반 영상과 구별되도록 디스플레이 제공한다. 좌표 시퀀스에는 사각형 좌표가 포함되어 있으므로 해당 사각형 영역을 전체적으로 특별하게 표시할 수도 있고, 해당 사각형 영역에 최적으로 배치되어 있는 이동객체 영역을 특별하게 표시할 수도 있다.Step S470: The moving object region corresponding to the coordinate sequence of the tracking object moving object region is displayed on the reproduction screen of the compressed image so as to be distinguished from the general image. Since the coordinate sequence includes the rectangular coordinates, the corresponding rectangular area can be displayed entirely in a special manner, or the moving object area optimally disposed in the corresponding rectangular area can be specifically displayed.
예를 들어, 현재 추적 중인 이동객체 영역을 특수한 색상으로 디스플레이 표시하는 것이 바람직하다. 이때, 그 추적 대상 객체 간에 서로 구분되게 상이한 색상을 할당하는 것이 바람직하다. 이를 통해, 영상관제 시스템의 관제요원은 객체 추적을 수행하고 있는 영상 지점을 즉시 인식할 수 있게 되고, 이를 통해 좀더 높은 주의력을 가지고 관찰하게 된다. 이는 사후증거 확보의 과정에서도 마찬가지로 도움을 줄 수 있다.For example, it is desirable to display the moving object area currently being tracked in a special color. At this time, it is preferable to assign different colors to the objects to be traced. This allows the control personnel of the video control system to immediately recognize the point of the video that is performing the object tracking, thereby observing with higher attention. This can be equally helpful in the process of securing evidence.
단계 (S480) : 한편, 이동객체 영역이 일련의 영상 프레임에서 사라지는 경우에 그 이동객체 영역에 대해 앞서 단계 (S410)에서 할당하였던 Unique ID를 리보크 처리함으로써 이동객체 영역을 소멸시킨다.Step S480: If the moving object region disappears in a series of image frames, the moving object region is destroyed by recycling the unique ID allocated in Step S410 for the moving object region.
한편, 본 발명은 컴퓨터가 읽을 수 있는 비휘발성 기록매체에 컴퓨터가 읽을 수 있는 코드의 형태로 구현되는 것이 가능하다. 이러한 비휘발성 기록매체는 컴퓨터가 읽을 수 있는 데이터를 저장하는 모든 종류의 스토리지 장치를 포함하는데 예컨대 하드디스크, SSD, CD-ROM, NAS, 자기테이프, 웹디스크, 클라우드 디스크 등이 있고 네트워크로 연결된 다수의 스토리지 장치에 코드가 분산 저장되고 실행되는 형태로 구현될 수도 있다.Meanwhile, the present invention can be embodied in the form of computer readable code on a computer-readable non-volatile recording medium. Such a non-volatile recording medium includes all kinds of storage devices for storing computer-readable data such as a hard disk, an SSD, a CD-ROM, a NAS, a magnetic tape, a web disk, a cloud disk, And the code may be distributed and stored in the storage device of the computer.

Claims (8)

  1. 압축영상의 비트스트림을 파싱하여 코딩 유닛에 대한 모션벡터 및 코딩유형을 획득하는 제 1 단계;A first step of parsing a bit stream of the compressed image to obtain a motion vector and a coding type for the coding unit;
    압축영상을 구성하는 복수의 영상 블록 별로 미리 설정된 제 1 시간동안의 모션벡터 누적값을 획득하는 제 2 단계;A second step of acquiring a motion vector accumulation value for a first time preset for each of a plurality of image blocks constituting a compressed image;
    상기 복수의 영상 블록에 대하여 상기 모션벡터 누적값을 미리 설정된 제 1 임계치와 비교하는 제 3 단계;A third step of comparing the motion vector accumulated value with a predetermined first threshold for the plurality of image blocks;
    상기 제 1 임계치를 초과하는 모션벡터 누적값을 갖는 영상 블록을 이동객체 영역으로 마킹하는 제 4 단계;A fourth step of marking an image block having a motion vector accumulation value exceeding the first threshold as a moving object region;
    사용자 조작에 의해 추적 대상으로 특정된 이동객체 영역(이하, '추적대상 이동객체 영역'이라 함)과 관련하여 압축영상의 일련의 영상 프레임에 걸쳐 상기 추적대상 이동객체 영역의 일련의 좌표를 획득하여 그에 따른 좌표 시퀀스를 영상관제 장치로 제공하는 제 5 단계;A series of coordinates of the tracking object moving object region is acquired over a series of image frames of the compressed image with respect to a moving object region (hereinafter referred to as 'tracking object moving object region') specified by the user operation as a tracking object A fifth step of providing the coordinate sequence to the video control device;
    를 포함하여 구성되는 압축영상에 대한 신택스 기반의 객체 추적 방법.Based object tracking method for compressed images.
  2. 청구항 1에 있어서,The method according to claim 1,
    상기 제 5 단계는,In the fifth step,
    상기 이동객체 영역이 ID 미할당 상태인 경우에 Unique ID를 신규 발행하여 할당하는 제 5a 단계;A fifth step of newly assigning and allocating a unique ID when the moving object area is in an ID unassigned state;
    사용자 조작에 따라 특정의 이동객체 영역(이하, '추적대상 이동객체 영역'이라 함)을 추적 대상으로 설정하는 제 5b 단계;A step 5b of setting a specific moving object area (hereinafter, referred to as 'tracking object moving object area') as a tracking object according to a user operation;
    상기 추적대상 이동객체 영역에 할당된 Unique ID(이하, '추적대상 Unique ID'라 함)를 식별하는 제 5c 단계;A fifth step c) of identifying a unique ID (hereinafter, referred to as 'tracking object unique ID') allocated to the tracking object moving object region;
    압축영상을 구성하는 일련의 영상 프레임에 대해 상기 추적대상 Unique ID 값이 할당된 이동객체 영역의 사각형 좌표를 순차적으로 산출하여 상기 추적대상 이동객체 영역에 대한 좌표 시퀀스로 설정하는 제 5d 단계;A fifth step of sequentially calculating the rectangular coordinates of the moving object area to which the tracking target unique ID value is assigned for a series of image frames constituting the compressed image and setting the rectangular coordinate as a coordinate sequence for the tracking object moving object area;
    상기 추적대상 이동객체 영역의 좌표 시퀀스에 포함되는 일련의 사각형 좌표를 압축영상의 해상도에 대응하여 정규화 처리하는 제 5e 단계;A fifth step of normalizing the series of rectangular coordinates included in the coordinate sequence of the tracking object moving object region in correspondence with the resolution of the compressed image;
    상기 정규화 처리된 상기 추적대상 이동객체 영역의 좌표 시퀀스를 영상관제 장치로 제공하는 제 5f 단계;(F) providing a coordinate sequence of the normalized tracking target moving object region to a video control device;
    상기 이동객체 영역이 상기 일련의 영상 프레임에서 사라지는 경우에 상기 할당된 Unique ID를 리보크(revoke)하는 제 5g 단계;A fifth step of revoking the allocated Unique ID when the moving object area disappears in the series of image frames;
    를 포함하여 구성되는 것을 특징으로 하는 압축영상에 대한 신택스 기반의 객체 추적 방법.Wherein the object-based object tracking method comprises:
  3. 청구항 2에 있어서,The method of claim 2,
    상기 사각형 좌표는 이동객체 영역을 최적으로 포함하도록 가상으로 형성된 사각형에 대한 좌상단 좌표(x, y), 가로축 길이(dx), 세로축 길이(dy)를 포함하여 구성되고,The rectangular coordinates include left top coordinates (x, y), abscissa axis length (dx), and ordinate axis length (dy) of a rectangle formed to virtually include a moving object area,
    상기 정규화 처리는 상기 좌상단 x 좌표와 가로축 길이(dx)를 압축영상의 가로해상도(x_res)로 나눗셈 처리하고 상기 좌상단 y 좌표와 세로축 길이(dy)를 압축영상의 세로해상도(y_res)로 나눗셈 처리하는 것을 특징으로 하는 압축영상에 대한 신택스 기반의 객체 추적 방법.The normalization process divides the upper left x coordinate and the horizontal axis length dx by the horizontal resolution x_res of the compressed image and divides the upper left y coordinate and the vertical axis dy by the vertical resolution y_res of the compressed image The object tracking method comprising the steps of:
  4. 청구항 1에 있어서,The method according to claim 1,
    상기 제 4 단계와 상기 제 5 단계 사이에 수행되는,And a fourth step of performing, between the fourth step and the fifth step,
    상기 이동객체 영역을 중심으로 그 인접하는 복수의 영상 블록(이하, '이웃 블록'이라 함)을 식별하는 제 a 단계;(A) identifying a plurality of adjacent image blocks (hereinafter, referred to as 'neighboring blocks') around the moving object region;
    상기 복수의 이웃 블록에 대해 모션벡터 값을 미리 설정된 제 2 임계치와 비교하는 제 b 단계;Comparing a motion vector value with a predetermined second threshold value for the plurality of neighboring blocks;
    상기 제 2 임계치를 초과하는 모션벡터 값을 갖는 이웃 블록을 이동객체 영역으로 추가 마킹하는 제 c 단계;Further comprising: marking a neighboring block having a motion vector value exceeding the second threshold as a moving object region;
    를 더 포함하여 구성되는 것을 특징으로 하는 압축영상에 대한 신택스 기반의 객체 추적 방법.The method of claim 1, further comprising the steps of:
  5. 청구항 4에 있어서,The method of claim 4,
    상기 제 c 단계 이후에 수행되는,Wherein the step (c)
    상기 복수의 이웃 블록 중에서 코딩유형이 인트라 픽쳐(Intra Picture)인 이웃 블록을 이동객체 영역으로 추가 마킹하는 제 d 단계;D) marking a neighboring block having a coding type of an intra picture among the plurality of neighboring blocks as a moving object region;
    를 더 포함하여 구성되는 것을 특징으로 하는 압축영상에 대한 신택스 기반의 객체 추적 방법.The method of claim 1, further comprising the steps of:
  6. 청구항 5에 있어서,The method of claim 5,
    상기 제 d 단계 이후에 수행되는,Wherein the step (d)
    상기 복수의 이동객체 영역에 대하여 인터폴레이션을 수행하여 이동객체 영역으로 둘러싸인 미리 설정된 갯수 이하의 비마킹 영상 블록을 이동객체 영역으로 추가 마킹하는 제 e 단계;Marking a predetermined number of unmarked image blocks surrounded by a moving object area as a moving object area by performing interpolation on the plurality of moving object areas;
    를 더 포함하여 구성되는 것을 특징으로 하는 압축영상에 대한 신택스 기반의 객체 추적 방법.The method of claim 1, further comprising the steps of:
  7. 청구항 1에 있어서,The method according to claim 1,
    상기 영상 블록은 매크로블록과 서브블록을 포함하여 구성되는 것을 특징으로 하는 압축영상에 대한 신택스 기반의 객체 추적 방법.Wherein the image block comprises a macro block and a sub-block.
  8. 컴퓨터에 청구항 1 내지 7 중 어느 하나의 항에 따른 압축영상에 대한 신택스 기반의 객체 추적 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 판독가능한 비휘발성 기록매체.A computer-readable nonvolatile recording medium on which a program for executing a syntax-based object tracking method for a compressed image according to any one of claims 1 to 7 is recorded on a computer.
PCT/KR2018/002556 2017-12-20 2018-03-04 Syntax-based method for object tracking in compressed video WO2019124634A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020170176597A KR102015082B1 (en) 2017-12-20 2017-12-20 syntax-based method of providing object tracking in compressed video
KR10-2017-0176597 2017-12-20

Publications (1)

Publication Number Publication Date
WO2019124634A1 true WO2019124634A1 (en) 2019-06-27

Family

ID=66993373

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2018/002556 WO2019124634A1 (en) 2017-12-20 2018-03-04 Syntax-based method for object tracking in compressed video

Country Status (2)

Country Link
KR (1) KR102015082B1 (en)
WO (1) WO2019124634A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112312205A (en) * 2020-10-21 2021-02-02 腾讯科技(深圳)有限公司 Video processing method and device, electronic equipment and computer storage medium
US20210287051A1 (en) * 2020-03-11 2021-09-16 Research & Business Foundation Sungkyunkwan University Methods and systems for recognizing object using machine learning model

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000295600A (en) * 1999-04-08 2000-10-20 Toshiba Corp Monitor system
JP2002262296A (en) * 2001-02-28 2002-09-13 Mitsubishi Electric Corp Mobile object detector, and image supervisory system
JP2006079594A (en) * 2004-08-13 2006-03-23 Sony Corp Mobile object detection device and method
KR101585022B1 (en) * 2014-10-02 2016-01-14 주식회사 에스원 Streaming Data Analysis System for Motion Detection in Image Monitering System and Streaming Data Analysis Method for Motion detection
KR101808587B1 (en) * 2017-08-03 2017-12-13 주식회사 두원전자통신 Intelligent integration visual surveillance control system by object detection and tracking and detecting abnormal behaviors

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006211166A (en) * 2005-01-27 2006-08-10 Victor Co Of Japan Ltd Monitoring system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000295600A (en) * 1999-04-08 2000-10-20 Toshiba Corp Monitor system
JP2002262296A (en) * 2001-02-28 2002-09-13 Mitsubishi Electric Corp Mobile object detector, and image supervisory system
JP2006079594A (en) * 2004-08-13 2006-03-23 Sony Corp Mobile object detection device and method
KR101585022B1 (en) * 2014-10-02 2016-01-14 주식회사 에스원 Streaming Data Analysis System for Motion Detection in Image Monitering System and Streaming Data Analysis Method for Motion detection
KR101808587B1 (en) * 2017-08-03 2017-12-13 주식회사 두원전자통신 Intelligent integration visual surveillance control system by object detection and tracking and detecting abnormal behaviors

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210287051A1 (en) * 2020-03-11 2021-09-16 Research & Business Foundation Sungkyunkwan University Methods and systems for recognizing object using machine learning model
US11620360B2 (en) * 2020-03-11 2023-04-04 Research & Business Foundation Sungkyunkwan University Methods and systems for recognizing object using machine learning model
CN112312205A (en) * 2020-10-21 2021-02-02 腾讯科技(深圳)有限公司 Video processing method and device, electronic equipment and computer storage medium
CN112312205B (en) * 2020-10-21 2024-03-22 腾讯科技(深圳)有限公司 Video processing method and device, electronic equipment and computer storage medium

Also Published As

Publication number Publication date
KR20190074900A (en) 2019-06-28
KR102015082B1 (en) 2019-08-27

Similar Documents

Publication Publication Date Title
WO2019124635A1 (en) Syntax-based method for sensing object intrusion in compressed video
KR101942808B1 (en) Apparatus for CCTV Video Analytics Based on Object-Image Recognition DCNN
WO2020027513A1 (en) Syntax-based image analysis system for compressed image, and interworking processing method
US20120275524A1 (en) Systems and methods for processing shadows in compressed video images
KR102187376B1 (en) syntax-based method of providing selective video surveillance by use of deep-learning image analysis
WO2018135922A1 (en) Method and system for tracking object of interest in real-time in multi-camera environment
WO2021020866A1 (en) Image analysis system and method for remote monitoring
WO2018030658A1 (en) Method for detecting, through reconstruction image processing, moving object from stored cctv image
US10410059B2 (en) Cloud platform with multi camera synchronization
WO2012137994A1 (en) Image recognition device and image-monitoring method therefor
WO2019124634A1 (en) Syntax-based method for object tracking in compressed video
WO2019039661A1 (en) Method for syntax-based extraction of moving object region of compressed video
WO2016064107A1 (en) Pan/tilt/zoom camera based video playing method and apparatus
WO2020171388A2 (en) Method of identifying abnormal motion object in compressed image using motion vector trajectory and pattern
WO2020027511A1 (en) Method for generating syntax-based heat-map for compressed image
WO2019124636A1 (en) Syntax-based method for sensing wrong-way driving on road in compressed video
WO2020027512A1 (en) Method for syntax-based object tracking control for compressed image by ptz camera
KR101547255B1 (en) Object-based Searching Method for Intelligent Surveillance System
KR102061915B1 (en) syntax-based method of providing object classification for compressed video
WO2013162095A1 (en) Dvr and video monitoring method therefor
WO2019124633A1 (en) Syntax-based method for sensing wall-climbing object in compressed video
KR102179077B1 (en) syntax-based method of providing object classification in compressed video by use of neural network which is learned by cooperation with an external commercial classifier
WO2019124632A1 (en) Syntax-based method for sensing loitering object in compressed video
WO2022231053A1 (en) Multi-resolution image processing apparatus and method capable of recognizing plurality of dynamic objects
KR102178952B1 (en) method of providing object classification for compressed video by use of syntax-based MRPN-CNN

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18890758

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18890758

Country of ref document: EP

Kind code of ref document: A1