KR100443677B1 - Camera motion detecting method using motion vector quantization for moving picture - Google Patents

Camera motion detecting method using motion vector quantization for moving picture Download PDF

Info

Publication number
KR100443677B1
KR100443677B1 KR10-2001-0060927A KR20010060927A KR100443677B1 KR 100443677 B1 KR100443677 B1 KR 100443677B1 KR 20010060927 A KR20010060927 A KR 20010060927A KR 100443677 B1 KR100443677 B1 KR 100443677B1
Authority
KR
South Korea
Prior art keywords
motion vector
motion
camera
histogram
quantization
Prior art date
Application number
KR10-2001-0060927A
Other languages
Korean (ko)
Other versions
KR20030027574A (en
Inventor
이지은
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR10-2001-0060927A priority Critical patent/KR100443677B1/en
Publication of KR20030027574A publication Critical patent/KR20030027574A/en
Application granted granted Critical
Publication of KR100443677B1 publication Critical patent/KR100443677B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명에 따른 동영상의 모션벡터 양자화 방법은, 움직임 보상 방법이 적용된 압축 방법을 이용한 압축 동영상에서 각 픽쳐(프레임)에 대해, 모션벡터를 수평/수직 2 차원 격자형으로 양자화 구간을 분할하고, 각 양자화 구간에 맵핑되는 모션벡터의 개수를 검출하여 모션벡터의 히스토그램을 생성한다.In the motion vector quantization method of a video according to the present invention, a quantization section is divided into horizontal / vertical two-dimensional grids for each picture (frame) in a compressed video using a compression method to which a motion compensation method is applied. A histogram of the motion vectors is generated by detecting the number of motion vectors mapped to the quantization interval.

여기서, 상기 모션벡터를 수평/수직 2 차원 격자형으로 양자화 구간을 분할함에 있어, 모션벡터 (0, 0)을 양자화 영역의 중심에 두고, 지정된 모션벡터의 최대범위로 상, 하, 좌, 우의 사각영역으로 양자화 구간을 설정한다.Here, in dividing the quantization section into a horizontal / vertical two-dimensional grid, the motion vector (0, 0) is positioned at the center of the quantization region, and the upper, lower, left, and right sides of the motion vector are positioned in the maximum range of the designated motion vector. Set the quantization section to the rectangular area.

또한, 본 발명에 따른 카메라 모션 검출방법은, 움직임 보상 방법이 적용된 압축 방법을 이용한 압축 동영상에서 각 픽쳐(프레임)에 대해, 모션벡터를 수평/수직 2 차원 격자형으로 양자화 구간을 분할하는 단계와; 상기 모션벡터에 대한 히스토그램을 생성하는 단계; 및 상기 모션벡터 히스토그램의 빈 값의 분포로부터 카메라 모션을 검출하는 단계; 를 포함한다.In addition, the camera motion detection method according to the present invention comprises the steps of dividing a quantization interval into a horizontal / vertical two-dimensional lattice for each picture (frame) in the compressed video using the compression method to which the motion compensation method is applied; ; Generating a histogram for the motion vector; Detecting camera motion from a distribution of bin values of the motion vector histogram; It includes.

여기서, 상기 모션벡터 히스토그램의 빈 값의 분포로부터 카메라 모션을 검출함에 있어, 모션벡터 히스토그램의 총빈도가 전체 매크로블록 수에 대해 소정의 임계치 이상이면 카메라 모션이 발생된 것으로 판단된다.In detecting the camera motion from the distribution of the bin values of the motion vector histogram, it is determined that the camera motion is generated when the total frequency of the motion vector histogram is equal to or greater than a predetermined threshold for the total number of macroblocks.

Description

동영상의 모션벡터 양자화를 이용한 카메라 모션 검출방법{Camera motion detecting method using motion vector quantization for moving picture}Camera motion detecting method using motion vector quantization for moving picture}

본 발명은 MPEG-1/2, H.261, H.263 등의 움직임 보상 방법이 적용된 압축 방법을 이용한 압축 동영상에서 모션정보를 효율적으로 추출하기 위해 모션벡터를 양자화하는 방법과, 이를 통하여 카메라 모션을 효과적으로 검출할 수 있는 동영상의 모션벡터 양자화 방법 및 이를 이용한 카메라 모션 검출방법에 관한 것이다.The present invention provides a method of quantizing a motion vector in order to efficiently extract motion information from a compressed video using a compression method using a motion compensation method such as MPEG-1 / 2, H.261, H.263, and the like. The present invention relates to a motion vector quantization method of a video capable of effectively detecting a motion picture and a camera motion detection method using the same.

종래 동영상의 변속모드에서는 그 변속 속도가 변속진행중인 전구간에 걸쳐서 일정하게 같은 속도로 고정되어 있다. 그러나, 이러한 가변속 기술로는 빠르게 (fast) 또는 느리게(slow) 재생을 수행할 경우에 시청자의 시각적 특성을 만족시키지 못하는 경우가 발생된다.In the shift mode of the conventional moving picture, the shift speed is fixed at the same speed constantly throughout the entire shift. However, such variable speed technology may not satisfy the viewer's visual characteristics when performing fast or slow playback.

예를 들어, 등속의 빠르게(fast) 재생의 경우 시간에 따른 화면의 변화가 심한 장면에서는 사용자가 그 장면을 인식하기 어려울 정도로 화면이 빠르게 전환되어 진행되고, 화면의 변화가 느린 장면에서는 오히려 지루하게 진행됨으로써, 빠르게(fast) 재생이 수행되는 느낌을 갖지 못하게 된다.For example, in the case of fast playback at constant speed, the scene changes rapidly so that the user cannot recognize the scene, and the scene changes slowly. By proceeding, there is no feeling that fast reproduction is performed.

또한, 느리게(slow) 재생의 경우에는 시간에 따른 화면의 변화가 심한 장면에서는 사용자가 그 장면을 느리게 인식하기를 원하였음에도 불구하고 빠르게 지나가는 경우가 많고, 반대로 화면의 변화가 느린 장면에서는 더욱 느리게 화면이 전환되므로 지루한 느낌을 갖게된다.In addition, in the case of slow playback, a scene that changes the screen over time is often passed quickly even though the user wants to recognize the scene slowly. On the contrary, in a slow scene, the screen is slower. This transition will make you feel boring.

그런데, 통상 빠르게 보기가 고속탐색을 목적으로 수행된다면 느리게 보기는 특정 장면을 보다 세밀하게 살펴보기 위한 목적으로 수행되므로, 실제로 사용자의 시각적인 관점에서 고려해볼 때, 장면의 변화가 심한 곳에서는 다소 느리게 장면이 전환되기를 기대할 것이고, 장면의 변화가 느린 곳에서는 다소 빠르게 장면이 전환되기를 기대할 것이다.However, if the fast view is usually performed for the purpose of high speed search, the slow view is performed for the purpose of looking at a specific scene more closely, and in view of the user's visual point of view, the slow view is somewhat slow in the place where the scene change is severe. You will expect the scene to change, and you will expect the scene to change somewhat faster where the change in the scene is slow.

그러나, 고정 불변적인 변속재생(fast/slow)에서는 이러한 사용자의 요구에 부응할 수 없는 한계가 있다.However, there is a limit in the fixed constant fast / slow that can not meet the needs of the user.

따라서, 가변속 구간내에서의 영상 변화율에 따라 가변속 정도를 적응적으로 달리하는 동영상의 적응적 속도 자동조절이 이루어진다면 위와 같은 문제를 해결할 수 있게 된다.Therefore, the above problem can be solved if the adaptive speed automatic adjustment of the moving image adaptively varying the degree of variable speed according to the image change rate in the variable speed section is performed.

이러한 기술로서는, 컷을 검출하고 컷과 컷 사이의 프레임수와 인접 프레임 간의 영상차를 이용해서 영상의 움직임 변화율에 따라서 재생속도를 그 빠르게 혹은 느리게 실행구간 내에서 달리함으로써, 영상의 동적 특성에 따라서 변속재생구간 내에서의 속도가 인간의 시각적인 특성에 적합하게 적응적으로 변하도록 한 동영상의 적응적 속도 자동조절 기술이 제안되고 있다(대한민국 공개특허공보, 공개번호 특1999-0081317, 1999.11.15).In such a technique, by detecting a cut and using a video difference between the cut and the cut and an image difference between adjacent frames, the playback speed is varied within the execution section at a faster or slower rate depending on the rate of change of the image, depending on the dynamic characteristics of the image. A technique for adaptive speed automatic adjustment of a moving picture in which a speed in a shift playback section is adaptively changed to be suitable for human visual characteristics has been proposed (Korean Patent Laid-Open Publication No. 1999-0081317, November 15, 1999). ).

이와 같이, 화면의 복잡도에 따라 재생속도를 자동적으로 제어하는 시스템에관한 개념은 장면의 변화율 등에 의해 자동적으로 재생속도를 조절하는 디스플레이 시스템으로서 소개된 바 있다. 그러나, 이 기술에서는 장면변화를 차영상으로 정의 하였으며, 인접 프레임간의 영상차를 기반으로 하는 '화면 복잡도'를 근거로 한다.As described above, the concept of a system for automatically controlling the playback speed according to the complexity of the screen has been introduced as a display system for automatically controlling the playback speed based on the scene change rate. However, in this technology, the scene change is defined as a difference image, and is based on the 'screen complexity' based on the image difference between adjacent frames.

따라서, 차영상으로 모션을 정의할 경우 모든 픽셀을 비교해야 하므로 처리 시간이 길어지는 제약이 있다. 또한, 차영상으로 화면 복잡도를 정의하는 경우 오브젝트의 모션(움직임)이 동일하더라도 배경과 색차가 큰 오브젝트의 경우는 비록 그 움직임이 적은 것임에도 불구하고, 오히려 큰 것으로 계산되어 이 부분을 천천히 재생하게 될 것이므로 실제로 희망하는 재생속도에 이르지 못한다. 즉, 비디오의 전개에 있어서 실제적으로 비디오를 이해하기 위하여 의미 있는 내용전개 중심의 재생속도 조절이라기 보다는 단지 화면 그 자체의 복잡도를 내용 복잡도를 반영한 것으로 보고 화면 복잡도를 차분 영상으로 구하고 있기 때문이다.Therefore, when defining motion with a difference image, all pixels need to be compared, thereby limiting the processing time. Also, when the screen complexity is defined by the difference image, even though the motion (movement) of the object is the same, the object having a large color difference with the background is calculated as a large one even though the movement is small, so that the part is played slowly. Will not actually reach the desired playback speed. In other words, it is because the complexity of the screen itself is regarded as a reflection of the content complexity, and the screen complexity is calculated as a differential image, rather than the playback speed control centered on meaningful content development in order to actually understand the video.

더구나, 비디오의 실질적인 내용 전개에서는 단지 전후 영상의 차이가 그 내용 전개의 의미를 충실하게 반영한다고 보기 어렵고, 단순한 영상차 이외에도 이야기 전개에 따라 실제로 그 내용 자체의 복잡도가 다르게 느껴질 수 있다는 점을 간과하고 있다. 즉, 예를 들어 드라마의 경우 등장인물들이 대화하는 장면은 지루하게 계속될 수 있지만, 그 때에 카메라의 위치가 빈번하게 바뀐다면 전후 영상차가 커지기 때문에 이 부분은 화면이 복잡한 것으로 판단될 수 있고, 따라서 느리게 재생될 소지가 있다. 그러나, 실제로 등장인물들이 대화하는 장면이 상당시간 지루하게 계속된다고 해도 이 부분은 오히려 빠르게 재생되는 것이 더 좋을 수도 있다.In addition, in the actual content development of video, it is hard to see that the difference between front and rear image faithfully reflects the meaning of the content development, and overlook that the complexity of the content itself may actually be felt differently depending on the story development in addition to the simple image difference. have. In other words, for example, in the case of drama, the scenes in which characters are talking may continue tediously, but if the position of the camera changes frequently at this time, this part may be judged to be complicated because the difference in front and rear image is increased. There is a possibility of slow playback. However, even if the scene where the characters actually talk continues for a long time tediously, it may be better to play this part rather quickly.

이러한 문제는 차영상만 가지고는 동영상의 장르와 용도, 내용에 따라 실제로 그 내용을 의미적으로 반영하는 '내용 복잡도'를 자동적으로 계산하여 판단하기가 어렵기 때문이다. 비디오의 실제 내용전개의 관점에서 볼 때 비디오의 '내용 복잡도'는 차영상뿐만 아니라 모션정보나 샷정보, 등장인물의 얼굴정보(내용 전개의중심이 되는 특정 오브젝트 검출정보), 텍스트 정보, 오디오 정보 등이 종합적으로 고려될 때, 실제 사람이 느끼는 '내용 복잡도'를 반영한다고 볼 수 있기 때문이다.This is because it is difficult to automatically calculate and judge the 'content complexity' that actually reflects the content according to the genre, use, and content of the video using only the difference image. From the point of view of the actual content development of the video, the 'content complexity' of the video is not only the difference image, but also motion information, shot information, face information of the character (specific object detection information that is the center of content development), text information, and audio information This is because it reflects the 'complexity of content' felt by real people when the back is considered comprehensively.

또한, 디지털 비디오의 인덱싱 분야에서 카메라나 오브젝트 모션 정보는 의미 있는 인덱싱 정보가 된다. 이와 같은 인덱싱 정보를 이용하는 비디오의 지능형 빨리보기 시스템(대한민국 특허출원번호 2000-0057722, 2000.09.30)에서는 특정 구간의 모션이 얼마나 복잡한가의 인덱스 정보를 이용하여 빨리보기 속도를 자동으로 조절할 수 있으며, 용도에 따라 카메라가 줌인(zoom-in)되거나 줌아웃(zoom-out), 트랙킹(tracking)된 샷(shot)들을 따로 인덱싱할 수도 있다.In addition, in the field of digital video indexing, camera or object motion information becomes meaningful indexing information. In the video quick view system using the indexing information (Korean Patent Application No. 2000-0057722, 2000.09.30), the fast view speed can be automatically adjusted by using the index information of how complex the motion of a specific section is. The camera may separately index zoomed-in, zoomed-out or tracked shots.

그리고, 카메라 모션을 검출하면 샷 변화 검출(shot change detection)에서 카메라 모션으로 인한 과다한 모션 복잡성을 제거하거나 줌인(zoom-in) 장면에서는 (중요한 장면이라 줌인 되었다는 전제하에) 빨리보기(fast forward) 속도를 낮추어 더 천천히 볼 수 있도록 할 수도 있다.And, when camera motion is detected, fast forward speeds can be eliminated in shot change detection or in zoom-in scenes (assuming they are zoomed in as important scenes) in zoom-in scenes. You can also lower it so you can see more slowly.

그러나, 이러한 방식을 통하여 카메라 모션을 검출하는 경우에는 연산 상의 시간이 많이 소용되는 단점이 있다. 특히, 이러한 비디오 인덱싱 방법이 PVR( Personal Video Recorder)로서 가정용 TV나 TV 셋탑 박스(set-top box) 상에 구현될 경우에는, 처리성능이나 메모리 사용량, 데이터 대역폭 등에서 구현상의 제약이 발생된다. 이에 따라, PVR 등 시스템 성능이 제한적인 시스템에서는 지능형 비디오 인덱싱 방법이 적용됨에 있어 한계가 있다.However, when the camera motion is detected through this method, a large amount of computational time is used. In particular, when such a video indexing method is implemented on a home TV or a TV set-top box as a personal video recorder (PVR), implementation constraints occur in processing performance, memory usage, data bandwidth, and the like. Accordingly, there is a limitation in that the intelligent video indexing method is applied to a system having limited system performance such as a PVR.

본 발명은 상기와 같은 여건을 감안하여 창출된 것으로서, 움직임 보상 방법이 적용된 압축 방법을 이용한 압축 동영상에서 각 픽쳐(프레임)에 대해, 모션벡터를 수평/수직 2 차원 격자형으로 양자화 구간을 분할하고, 그 모션벡터 히스토그램을 생성함으로써, 모션벡터에 대한 데이터 양을 줄이고, 모션벡터에 대한 방향과 크기 정보가 담긴 모션벡터 히스토그램을 생성할 수 있는 동영상의 모션벡터 양자화 방법을 제공함에 그 목적이 있다.The present invention has been made in consideration of the above-described conditions, and a quantization section is divided into horizontal / vertical two-dimensional lattice for each picture (frame) in a compressed video using a compression method to which a motion compensation method is applied. It is an object of the present invention to provide a motion vector quantization method of a video capable of generating a motion vector histogram containing direction and magnitude information of a motion vector by reducing the amount of data for the motion vector by generating the motion vector histogram.

또한, 본 발명은 상기와 같은 동영상의 모션벡터 양자화 방법을 이용하여 생성된 모션벡터 히스토그램에 대한 분석을 통하여, 모션벡터 히스토그램의 빈의 분포로부터 카메라 모션을 빠르게 검출할 수 있는 카메라 모션 검출방법을 제공함에 그 다른 목적이 있다.In addition, the present invention provides a camera motion detection method that can quickly detect the camera motion from the distribution of the bin of the motion vector histogram through the analysis of the motion vector histogram generated using the motion vector quantization method of the video as described above. There is another purpose for that.

도 1은 본 발명에 따른 동영상의 모션벡터 양자화와 히스토그램을 설명하기 위한 도면.1 is a view for explaining a motion vector quantization and histogram of a video according to the present invention.

도 2는 본 발명에 따른 동영상의 모션벡터 양자화에 있어, 모션벡터 양자화 구간 분할의 예를 나타낸 도면.2 is a view showing an example of motion vector quantization interval division in motion vector quantization of a video according to the present invention;

도 3은 본 발명에 따른 동영상의 모션벡터 양자화의 예를 나타낸 도면.3 is a diagram illustrating an example of motion vector quantization of a video according to the present invention;

도 4는 일반적인 카메라 모션의 종류를 나타낸 도면.4 is a diagram illustrating types of general camera motion.

도 5는 본 발명에 따른 동영상의 모션벡터 양자화 방법에 의하여, 카메라 모션 중에서 'track' 또는 'pan'이 발생된 경우의 각 매크로블록 모션벡터와 모션벡터 히스토그램을 나타낸 도면.5 is a diagram illustrating each macroblock motion vector and a motion vector histogram when 'track' or 'pan' is generated in a camera motion by a motion vector quantization method of a video according to the present invention.

도 6은 본 발명에 따른 동영상의 모션벡터 양자화 방법에 의하여, 카메라 모션 중에서 'boom' 또는 'tilt'가 발생된 경우의 각 매크로블록 모션벡터와 모션벡터 히스토그램을 나타낸 도면.6 is a diagram illustrating each macroblock motion vector and a motion vector histogram when 'boom' or 'tilt' is generated in a camera motion by a motion vector quantization method of a video according to the present invention.

도 7은 본 발명에 따른 동영상의 모션벡터 양자화 방법에 의하여, 카메라 모션 중에서 'dolly' 또는 'zoom'이 발생된 경우의 각 매크로블록 모션벡터와 모션벡터 히스토그램을 나타낸 도면.7 is a diagram illustrating each macroblock motion vector and a motion vector histogram when 'dolly' or 'zoom' occurs in camera motion by a motion vector quantization method of a video according to the present invention.

상기의 목적을 달성하기 위하여 본 발명에 따른 동영상의 모션벡터 양자화 방법은, 움직임 보상 방법이 적용된 압축 방법을 이용한 압축 동영상에서 각 픽쳐(프레임)에 대해, 모션벡터를 수평/수직 2 차원 격자형으로 양자화 구간을 분할하고, 각 양자화 구간에 맵핑되는 모션벡터의 개수를 검출하여 모션벡터의 히스토그램을 생성하는 점에 그 특징이 있다.In order to achieve the above object, the motion vector quantization method of a video according to the present invention comprises a horizontal / vertical two-dimensional lattice for each picture (frame) in a compressed video using a compression method to which a motion compensation method is applied. The characteristic is that the quantization interval is divided and a histogram of the motion vectors is generated by detecting the number of motion vectors mapped to each quantization interval.

여기서, 상기 모션벡터를 수평/수직 2 차원 격자형으로 양자화 구간을 분할함에 있어, 모션벡터 (0, 0)을 양자화 영역의 중심에 두고, 지정된 모션벡터의 최대범위로 상, 하, 좌, 우의 사각영역으로 양자화 구간을 설정하는 점에 그 특징이 있다.Here, in dividing the quantization section into a horizontal / vertical two-dimensional grid, the motion vector (0, 0) is positioned at the center of the quantization region, and the upper, lower, left, and right sides of the motion vector are positioned in the maximum range of the designated motion vector. The characteristic is that the quantization section is set to the rectangular area.

또한, 상기 지정된 모션벡터의 최대범위를 설정함에 있어, 일반적인 동영상에서 나타날 수 있는 모션벡터들을 포함할 수 있도록 소정값 이상의 값을 모션벡터의 최대범위로 설정하거나, 또는 MPEG-1/2의 f_code에 의해 제한된 모션벡터의 범위를 그대로 사용하거나, 선형적으로 변환하여 모션벡터의 최대범위를 설정하는 점에 그 특징이 있다.Also, in setting the maximum range of the specified motion vector, a value above a predetermined value is set to the maximum range of the motion vector so as to include motion vectors that can appear in a general video, or in f_code of MPEG-1 / 2. The feature is that the maximum range of the motion vector is set by using the range of the motion vector limited as it is or by converting it linearly.

또한, 상기 모션벡터를 수평/수직 2 차원 격자형으로 양자화 구간을 분할함에 있어, 모션벡터 공간을 균등하게 분할하거나, 모션벡터 공간을 선형적으로 불균등하게 분할하거나, 또는 각 구간 분할지점을 지정하여 모션벡터 공간을 비선형적으로 분할하는 점에 그 특징이 있다.Further, in dividing the motion vector into horizontal / vertical two-dimensional grids, the motion vector space is equally divided, the motion vector space is linearly and unevenly divided, or each division point is designated. This feature is characterized by non-linear partitioning of motion vector space.

또한, 상기의 다른 목적을 달성하기 위하여 본 발명에 따른 카메라 모션 검출방법은,In addition, the camera motion detection method according to the present invention in order to achieve the above object,

움직임 보상 방법이 적용된 압축 방법을 이용한 압축 동영상에서 각 픽쳐(프레임)에 대해, 모션벡터를 수평/수직 2 차원 격자형으로 양자화 구간을 분할하는 단계와;Dividing a quantization section into a horizontal / vertical two-dimensional grid for each picture (frame) in a compressed video using a compression method to which a motion compensation method is applied;

상기 모션벡터에 대한 히스토그램을 생성하는 단계; 및Generating a histogram for the motion vector; And

상기 모션벡터 히스토그램의 빈 값의 분포로부터 카메라 모션을 검출하는 단계; 를 포함하는 점에 그 특징이 있다.Detecting camera motion from a distribution of bin values in the motion vector histogram; Its features are to include.

여기서, 상기 모션벡터 히스토그램의 빈 값의 분포로부터 카메라 모션을 검출함에 있어, 모션벡터 히스토그램의 총빈도가 전체 매크로블록 수에 대해 소정의 임계치 이상이면 카메라 모션이 발생된 것으로 판단되는 점에 그 특징이 있다.Here, in detecting the camera motion from the distribution of the bin values of the motion vector histogram, it is determined that the camera motion is generated when the total frequency of the motion vector histogram is greater than or equal to a predetermined threshold with respect to the total number of macroblocks. have.

또한, 상기 카메라 모션을 검출함에 있어, 상기 모션벡터 히스토그램의 총빈도가 전체 매크로블록 수에 대해 소정의 임계치 이상이고, 모션벡터 히스토그램이 소수의 인접한 빈들에 집중되어 있고, 해당 빈의 대표 크기가 0이 아닌 경우에는 트랙, 팬, 붐, 틸트 중의 어느 한 카메라 모션이 발생된 것으로 판단되는 점에 그 특징이 있다.Further, in detecting the camera motion, the total frequency of the motion vector histogram is greater than or equal to a predetermined threshold for the total number of macroblocks, the motion vector histogram is concentrated in a few adjacent bins, and the representative size of the bin is zero. If not, it is characterized in that it is determined that any one of the camera motion of the track, pan, boom, and tilt has occurred.

또한, 상기 모션벡터 히스토그램이 소수의 인접한 빈들에 집중됨에 있어, 모션벡터 (0, 0)이 맵핑되는 빈의 수평방향으로, 그 소수의 빈들이 맵핑되는 경우에는 트랙 또는 팬의 카메라 모션이 발생된 것으로 판단되며, 모션벡터 (0, 0)이 맵핑되는 빈의 수직방향으로, 그 소수의 빈들이 맵핑되는 경우에는 붐 또는 틸트의 카메라 모션이 발생된 것으로 판단되는 점에 그 특징이 있다.In addition, since the motion vector histogram is concentrated on a few adjacent bins, in the horizontal direction of the bin to which the motion vector (0, 0) is mapped, when the few bins are mapped, a camera motion of a track or a pan is generated. If the number of bins are mapped in the vertical direction of the bin to which the motion vectors (0, 0) are mapped, the camera motion of the boom or tilt is determined to be generated.

또한, 상기 카메라 모션을 검출함에 있어, 상기 모션벡터 히스토그램의 총빈도가 전체 매크로블록 수에 대해 소정의 임계치 이상이고, 모션벡터 (0, 0)이 맵핑되는 빈을 중심으로, 주위 빈의 대표 크기 값이 방사형으로 대칭되도록 맵핑되는 경우에는 돌리 또는 줌의 카메라 모션이 발생된 것으로 판단되는 점에 그 특징이 있다.In addition, in detecting the camera motion, the total frequency of the motion vector histogram is greater than or equal to a predetermined threshold with respect to the total number of macroblocks, and the representative size of the surrounding bins is centered around the bin to which the motion vectors (0, 0) are mapped. When the values are mapped so as to be radially symmetrical, there is a feature in that it is determined that camera motion of dolly or zoom has occurred.

이와 같은 본 발명에 의하면, 움직임 보상 방법이 적용된 압축 방법을 이용한 압축 동영상에서 각 픽쳐(프레임)에 대해, 모션벡터를 수평/수직 2 차원 격자형으로 양자화 구간을 분할하고, 그 모션벡터 히스토그램을 생성함으로써, 모션벡터에 대한 데이터 양을 줄이고, 모션벡터에 대한 방향과 크기 정보가 담긴 모션벡터 히스토그램을 생성할 수 있는 장점이 있다.According to the present invention, a motion vector is divided into horizontal / vertical two-dimensional grids for each picture (frame) in a compressed video using a compression method to which a motion compensation method is applied, and a motion vector histogram is generated. As a result, the amount of data for the motion vector can be reduced, and a motion vector histogram containing direction and size information for the motion vector can be generated.

또한, 본 발명은 상기와 같은 동영상의 모션벡터 양자화 방법을 이용하여 생성된 모션벡터 히스토그램에 대한 분석을 통하여, 모션벡터 히스토그램의 빈의 분포로부터 카메라 모션을 빠르게 검출할 수 있는 장점이 있다.In addition, the present invention has the advantage that it is possible to quickly detect the camera motion from the distribution of the bin of the motion vector histogram through the analysis of the motion vector histogram generated using the motion vector quantization method of the video as described above.

일반적으로, MPEG-1/2, H.261, H.263 등 움직임 보상 방법이 적용된 압축 방법을 이용한 압축 동영상의 모션벡터는 프레임을 16x16 크기의 매크로블록으로 나누었을 때, 각 매크로블록이 참조 영상의 어느 위치를 참조하는 지를 나타내는 수평/수직의 2 차원 벡터로 오브젝트 모션이나 카메라 모션을 잘 반영하고 있는 정보이다.In general, a motion vector of a compressed video using a motion compensation method such as MPEG-1 / 2, H.261, or H.263 is divided into 16x16 macroblocks. A horizontal / vertical two-dimensional vector that indicates where to refer to, reflecting object or camera motion.

따라서, 모션벡터의 방향은 오브젝트/카메라 모션의 방향을 반영하며, 모션벡터의 크기는 오브젝트/카메라 모션의 크기를 반영한다. 그러므로, 한 프레임 내에 나타난 모션벡터 값을 분석하면 모션의 양이나 방향을 수치화할 수 있다. 본 발명에서는 이러한 모션벡터 값을 양자화하고, 그 모션벡터 히스토그램에 대한 분석을 통하여 카메라 모션을 검출할 수 있는 방법에 대하여 논의하고자 한다.Accordingly, the direction of the motion vector reflects the direction of the object / camera motion, and the size of the motion vector reflects the magnitude of the object / camera motion. Therefore, analyzing the motion vector value shown in one frame can quantify the amount or direction of motion. In the present invention, a method of quantizing the motion vector values and analyzing the motion vector histogram will be discussed.

이하, 첨부된 도면을 참조하여 본 발명에 따른 실시 예를 상세히 설명한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

모션벡터 히스토그램은 움직임 보상 방법이 적용된 P 영상(P picture)이나 B 영상(B picture)에 대한 모션벡터의 히스토그램으로서 임의의 레벨이며, 이는 수평/수직 방향으로 각각 임의의 레벨인 2 차원 히스토그램으로 생각할 수 있다(예컨대, 도 1에 나타낸 바와 같이, 모션벡터의 히스토그램은 64 레벨이며, 이는 수평/수직 방향으로 각각 8 레벨인 8 x 8 레벨의 2 차원 히스토그램으로 생각할 수 있다).A motion vector histogram is an arbitrary level as a histogram of a motion vector for a P picture or a B picture to which a motion compensation method is applied, which is a two-dimensional histogram that is an arbitrary level in the horizontal and vertical directions. (E.g., as shown in FIG. 1, the histogram of the motion vector is 64 levels, which can be thought of as a two-dimensional histogram of 8 x 8 levels, 8 levels each in the horizontal / vertical direction).

이때, 모션벡터 히스토그램의 인덱스를 구하기 위해서는, 도 1에 나타낸 바와 같이, 모션벡터를 수평/수직 2 차원 격자형으로 양자화하여 각 격자에 맵핑되는 모션벡터의 개수를 얻는다. 이와 같이 모션벡터를 양자화하기 위해서는 모션벡터의 최대 범위를 미리 정해야 하는데, 이는 다음과 같은 방법으로 결정할 수 있다.At this time, in order to obtain the index of the motion vector histogram, as shown in FIG. 1, the motion vectors are quantized into a horizontal / vertical two-dimensional grid to obtain the number of motion vectors mapped to each grid. As described above, in order to quantize the motion vector, a maximum range of the motion vector must be determined in advance, which can be determined by the following method.

첫 번째 방법으로, 최대범위를 지정하여 결정하는 방법이다.The first method is to determine the maximum range.

일반적인 동영상에 나타나는 모션벡터들을 포함할 수 있는 임의의 충분한 값으로 모션벡터의 최대 범위 수평/수직 값을 지정한다. 이를 위해서는 많은 수의 테스트 데이터 영상을 이용하여 모션벡터들을 포함할 수 있을 만큼 충분한 임의의 범위 값을 알아내는 것이 가능해야 하는데, MPEG-1의 다양한 동영상으로 실험한 결과 352 x 240 크기의 동영상에서는 수평/수직으로 (-128)~(+128)의 정방형 영역을 모션벡터의 범위로 보았을 때 적절하였다.Specify the maximum range horizontal / vertical value of the motion vector to any sufficient value that can include the motion vectors that appear in a typical video. To do this, it is necessary to use a large number of test data images to find out an arbitrary range value sufficient to include motion vectors. It was appropriate when looking at the square region of (-128) ~ (+128) vertically.

두 번째 방법으로, f_code를 이용하여 최대범위를 결정하는 방법이다.The second method is to determine the maximum range using f_code.

모션벡터 양자화에 필요한 모션벡터의 최대 범위는 MPEG-1/2로 압축된 동영상의 경우 MPEG-1/2 부호화 데이터의 하나인 f_code에 의해 정해질 수도 있다.The maximum range of motion vectors required for motion vector quantization may be determined by f_code, which is one of MPEG-1 / 2 encoded data in the case of a video compressed with MPEG-1 / 2.

MPEG-1에서의 f_code의 의미Meaning of f_code in MPEG-1 F_codeF_code Maximum motion vector rangeMaximum motion vector range 00 1One 88 22 1616 33 3232 44 6464 55 128128 66 256256 77 512512 88 10241024

MPEG-2에서의 f_code의 의미Meaning of f_code in MPEG-2 F_codeF_code Maximum motion vector rangeMaximum motion vector range 1One 88 22 1616 33 3232 44 6464 55 128128 66 256256 77 512512 88 10241024 99 20482048

이때, f_code는 각 픽처에 대해 모션벡터의 범위를 제한하기 위한 값으로 f_code 값에 따른 모션벡터의 범위는 [표 1] 및 [표 2]에 나타낸 바와 같다. 여기서, [표 1]은 MPEG-1에서의 f_code의 의미를 나타낸 것이며, [표 2]는 MPEG-2에서의 f_code의 의미를 나타낸 것이다.In this case, f_code is a value for limiting the range of the motion vector for each picture, and the range of the motion vector according to the f_code value is as shown in [Table 1] and [Table 2]. Here, [Table 1] shows the meaning of f_code in MPEG-1, and [Table 2] shows the meaning of f_code in MPEG-2.

즉, MPEG-1 동영상의 어떤 픽쳐의 f_code 값이 4이면 모션벡터의 최대범위를 (-64)~(+64)로 볼 수 있다는 것이다. 또한, MPEG-2 동영상의 어떤 픽쳐의 f_code 값이 4이면 모션벡터의 최대범위를 (-64)~(+64)로 볼 수 있다는 것이다.That is, if the f_code value of any picture of the MPEG-1 video is 4, the maximum range of the motion vector can be viewed as (-64) to (+64). In addition, if the f_code value of any picture of the MPEG-2 video is 4, the maximum range of the motion vector can be viewed as (-64) to (+64).

다음으로 모션벡터의 수평/수직 레벨이 결정되는 구간 분할 방법은 모션벡터의 최대범위를 균등하게 나누는 방법이나, 선형적으로 나누는 방법, 또는 각 구간 분할지점을 지정하여 비선형적으로 나누는 방법이 있다. 이와 같이 모션벡터의 구간을 분할하였을 경우, 모션벡터의 양자화 모양을 2 차원으로 그리면 도 2와 같이 나타낼 수 있다.Next, the interval segmentation method in which the horizontal / vertical level of the motion vector is determined may be divided into a method of dividing the maximum range of the motion vector evenly, linearly, or nonlinearly by designating each division point. When the interval of the motion vector is divided in this way, the quantized shape of the motion vector can be expressed as shown in FIG. 2.

한편, 구체적인 모션벡터 양자화 방법은 도 3에 나타낸 바와 같이 수행될 수있다. 도 3에 나타낸 예에서는, 모션벡터의 최대 범위는 수평/수직 방향 모두 (-256)~(+256)으로 하였으며, 양자화 구간 분할은 수평/수직으로 각각 8 레벨씩 균등하게 분할하여 전체 64 레벨이며, 결과로 0에서 63까지의 양자화 인덱스를 생성한다.Meanwhile, the specific motion vector quantization method may be performed as shown in FIG. 3. In the example shown in FIG. 3, the maximum range of the motion vector is (-256) to (+256) in both the horizontal and vertical directions, and the quantization interval division is divided into eight equally divided horizontally and vertically, which is a total of 64 levels. The result is a quantization index from 0 to 63.

이때, 각 양자의 인덱스 지정은 도 3에 나타낸 바와 같이 할 수 있으며, 특히 이 양자화 방법에서는 카메라 모션의 검출을 위해 모션벡터 (0, 0)을 모션벡터 범위의 중심으로 하며, 더 나아가 양자(격자, 여기서는 36번 빈)의 중심에 오도록 구간을 나누었다(이에 대한 설명은 카메라 모션 검출 설명시에 보충하도록 한다).At this time, the index designation of each quantum can be as shown in Fig. 3, and in particular, in this quantization method, the motion vector (0, 0) is the center of the motion vector range for detecting the camera motion, and further, the quantum (lattice) In this case, the section is divided to be located at the center of the bin 36 (the description will be supplemented in the description of the camera motion detection).

예로서, 모션벡터 mv1=(-128, 128), mv2=(288, 160), mv3=(-96, -320)이 있을 때, mv1은 양자 인덱스 50에 맵핑되며, 모션벡터 최대범위를 넘는 mv2와 mv3는 가장 가까운 양자에 근사하여 각각 양자 인덱스 55와 3에 맵핑된다.For example, when there are motion vectors mv1 = (-128, 128), mv2 = (288, 160), and mv3 = (-96, -320), mv1 is mapped to quantum index 50 and exceeds the motion vector maximum range. mv2 and mv3 are mapped to quantum indices 55 and 3, approximating the nearest quantum.

한편 카메라 모션은, 도 4에 나타낸 바와 같이, 트랙(track), 붐(boom), 돌리(dolly), 팬(pan), 틸트(tilt) 및 롤(roll) 등의 다양한 모션이 있는데, MPEG-1/2, H.261, H.263 등의 움직임 보상 방법이 적용된 압축 방법을 이용한 압축 동영상의 모션벡터는 카메라 모션에 대한 정보를 제공할 수 있다. 즉, 카메라 모션이 발생되는 경우에는 (오브젝트 모션의 발생과는 달리) 한 픽쳐 내의 거의 모든 모션벡터가 영향을 받는 점을 이용함으로써, 카메라 모션이 발생되는 것을 검출할 수 있게 된다.On the other hand, the camera motion, as shown in Figure 4, there are a variety of motion, such as track (track), boom (dolly), dolly (pan), tilt (tilt) and roll (roll), MPEG- A motion vector of a compressed video using a compression method to which motion compensation methods such as 1/2, H.261, and H.263 are applied may provide information about camera motion. That is, when camera motion is generated, it is possible to detect that camera motion is generated by using the point that almost all motion vectors in a picture are affected (unlike the generation of object motion).

이때, 다양한 카메라 모션 중에서, 'tracking', 'booming', 'panning', 'tilting' 의 카메라 모션이 발생되는 경우에는, 픽쳐 내의 거의 모든 모션벡터들은 비슷한 방향과 크기를 갖게 된다.At this time, when camera motions of 'tracking', 'booming', 'panning' and 'tilting' occur among various camera motions, almost all motion vectors in the picture have a similar direction and size.

예컨대, 한 픽쳐 내의 모션벡터가 도 5(a)와 같을 때, 이 픽쳐에 대한 모션벡터 히스토그램을 2 차원으로 표현하면, 도 5(b)와 같게 된다. 이 히스토그램을 분석하면 하나의 빈(bin)이 매우 높은 빈 값을 가지고 있고, 이 빈을 2 차원 양자화 모양에 맵핑하였을 때, 방향이 수평 오른쪽이고(d라고 하자) 크기가 미리 지정된 어떤 값인(s라고 하자) 모션벡터들의 빈임을 알 수 있으므로, 이 픽쳐에 방향이 'd'이고 크기가 's'인 카메라 'tracking'이나 'panning'이 발생되었음을 알 수 있다.For example, when the motion vector in a picture is as shown in Fig. 5 (a), the motion vector histogram for this picture is expressed in two dimensions, as shown in Fig. 5 (b). Analyzing this histogram shows that when one bin has a very high bin value, when the bin is mapped to a two-dimensional quantized shape, the direction is horizontal right (say d) and is some predefined value (s) Since it is known that the motion vectors are empty, it can be seen that a camera 'tracking' or 'panning' having a direction 'd' and a size 's' has occurred in this picture.

또한, 한 픽쳐 내의 모션벡터가 도 6(a)와 같을 때, 이 픽쳐에 대한 모션벡터 히스토그램을 2 차원으로 표현하면 도 6(b)와 같다. 이 히스토그램을 분석하면 하나의 빈(bin)이 매우 높은 빈 값을 가지고 있고, 이 빈을 2 차원 양자화 모양에 맵핑하였을 때 방향이 수직 위쪽이고(d라고 하자) 크기가 미리 지정된 어떤 값인(s라고 하자) 모션벡터들의 빈임을 알 수 있으므로, 이 픽쳐에 방향이 'd'이고 크기가 's'인 카메라 'booming'이나 'tilting'이 발생되었음을 알 수 있다.When the motion vector in a picture is the same as that in FIG. 6 (a), the motion vector histogram for the picture is expressed in two dimensions as in FIG. 6 (b). Analyzing this histogram, one bin has a very high bin value, and when we map this bin to a two-dimensional quantization shape, the direction is vertically up (let d) and is some predefined value (s). Since the motion vectors are empty, it can be seen that a camera 'booming' or 'tilting' having a direction 'd' and a size 's' has been generated.

그러나, 도 5 및 도 6에 나타낸 바와 같이, 'tracking', 'panning', 'booming' 이나 'tilting' 등과 같이 카메라가 직선으로 움직일 때, 단 하나의 빈에 모든 모션벡터가 맵핑되는 것은 이상적인 예이며, 일반적으로 인접한 몇 개의 빈들에 대부분의 모션벡터가 맵핑된다. 이 경우, 인접한 빈들에 대한 대표적인 방향과 크기를 계산함으로써, 카메라 모션에 대한 트랙/팬/붐/틸트 정보를 검출할 수 있게 된다.However, as shown in FIGS. 5 and 6, when the camera moves in a straight line such as 'tracking', 'panning', 'booming' or 'tilting', it is an ideal example that all motion vectors are mapped to only one bin. In general, most motion vectors are mapped to several adjacent bins. In this case, track / pan / boom / tilt information for camera motion can be detected by calculating a representative direction and size of adjacent bins.

한편, 카메라 모션이 돌리(dolly)나 줌(zoom)일 경우에, 카메라 모션을 검출하기 위해서는 좀더 복잡한 분석이 요구된다.On the other hand, when the camera motion is dolly or zoom, more complicated analysis is required to detect the camera motion.

즉, 'dolly forward'나 'zoom in'의 경우 픽쳐의 모션벡터는 도7(a)와 같고, 'dolly backward'나 'zoom out'의 경우 픽쳐의 모션벡터는 도 7(b)와 같으며, 두 경우 모두 모션벡터 히스토그램을 2 차원으로 표현하면 도 7(c)와 같게 된다.That is, in the case of 'dolly forward' or 'zoom in', the motion vector of the picture is shown in FIG. 7 (a), and in case of 'dolly backward' or 'zoom out', the motion vector of the picture is shown in FIG. In both cases, the motion vector histogram is expressed in two dimensions as shown in FIG.

이 모션벡터 히스토그램을 분석하면, 모션벡터 (0, 0)에 맵핑되는 빈을 중심으로(편의상 '중심빈'이라고 하자) 같은 거리에 있는 빈들은 비슷한 빈 값을 가지게 된다. 즉, 도 7(c)에서 같은 무늬로 표시된 빈들은 비슷한 빈 값을 가지게 된다. 그 이유는, 도 7의 (a) 및 (b)에 나타낸 바와 같이, 카메라 모션 중에서 'dolly'나 'zoom'이 발생될 때는 같은 크기의 모션벡터들이 'dolly center'나 'zoom center'를 중심으로 방사형으로 나타나게 된다.Analyzing this motion vector histogram, bins at the same distance from the bins mapped to the motion vectors (0, 0) (conventionally called 'center bins') will have similar bin values. That is, the bins indicated by the same pattern in FIG. 7C have similar bin values. This is because, as shown in FIGS. 7A and 7B, when 'dolly' or 'zoom' occurs in the camera motion, motion vectors of the same size are centered on the 'dolly center' or 'zoom center'. It appears to be radial.

그런데, 본 발명의 양자화 방법에서는 모션벡터 (0, 0)이 중심빈의 중심에 맵핑되도록 하였기 때문에, 픽쳐에서 방사형으로 나타나는 모션벡터들을 양자화한 결과 역시, 중심빈을 중심으로 방사형으로 빈들에 맵핑된다. 그러므로, 중심빈을 중심으로 상, 하, 좌, 우 빈들(도면에서 세로무늬 빈들끼리, 가로무늬 빈들끼리)의 값을 비교하고, 사선방향의 빈들(도면에서 동북-남서 사선무늬 빈들끼리, 서북-남동 사선무늬 빈들끼리)의 값을 비교한다.However, in the quantization method of the present invention, since the motion vector (0, 0) is mapped to the center of the center bin, the result of quantizing the motion vectors appearing radially in the picture is also mapped to the bins radially around the center bin. . Therefore, compare the values of the upper, lower, left, and right bins (vertical pattern bins and horizontal pattern bins in the drawing) centering on the center bin, and check the bins in the diagonal direction (north-southwestern diagonal bins in the drawing, northwest -Compare the values of the southeast diagonal pattern bindles).

이와 같이, 중심빈에서 같은 거리에 있는 빈들의 값을 비교하여, 그 값이 비슷하고, 픽쳐 내의 대부분의 매크로블록들이 이러한 모션벡터를 가지고 있으면(오브젝트 모션과의 차이점), 현재의 픽쳐에 'dolly'나 'zoom'의 카메라 모션이 발생된 것으로 판단할 수 있게 된다.Thus, if you compare the values of the bins that are at the same distance from the center bins and the values are similar, and most of the macroblocks in the picture have these motion vectors (differences from object motion), then the current picture is 'dolly'. It can be determined that the camera motion of 'or' zoom 'has occurred.

따라서, PVR등 제한된 시스템 상의 구현이 아니더라고, 본 발명에 기술된 모션벡터 히스토그램과 카메라 모션 검출 방법을 이용하면, 'affine transform' 등의 방법에 비해 카메라 모션을 간단히 검출할 수 있다. 이렇게 생성된 모션벡터 히스토그램은 비디오의 모션정보에 대한 인덱스를 생성하는 단서가 되며, 다음과 같은 응용이 가능하다.Therefore, even if not implemented on a limited system such as a PVR, using the motion vector histogram and the camera motion detection method described in the present invention, it is possible to easily detect the camera motion compared to the method such as 'affine transform'. The generated motion vector histogram is a clue for generating an index of motion information of a video, and the following applications are possible.

먼저, 비디오의 지능형 빨리보기 시스템(Intelligent fast forward system)에서는 특정 구간의 모션이 얼마나 복잡한가의 인덱스 정보를 이용하여 빨리보기 속도를 자동으로 조절할 수 있으며, 용도에 따라 카메라가 줌인(zoom in)되거나, 줌아웃(zoom out) 또는 트랙킹(tracking)된 샷(shot) 들을 따로 인덱싱할 수도 있다.First, the intelligent fast forward system of the video can automatically adjust the fast view speed by using the index information of how complex the motion of a specific section is, and the camera is zoomed in depending on the purpose. Zoom out or tracked shots may be indexed separately.

그리고 카메라 모션을 검출하면, 샷 변화 검출(shot change detection)에서 카메라 모션으로 인한 샷 변화 알람(shot change alarm)의 오류를 제거할 수 있으며, 지능형 빨리보기(intelligent fast forward)에서 카메라 모션으로 인한 과다한 모션 복잡성을 제거하거나, 줌인 장면에서는 (중요하므로 줌인되었다는 전제하에) 빨리보기 속도를 낮추어 더 천천히 볼 수 있도록 할 수도 있다.When the camera motion is detected, the error of the shot change alarm due to the camera motion can be eliminated in the shot change detection, and the excessive due to the camera motion in the intelligent fast forward. You can also remove the motion complexity, or slow down the view speed in a zoomed-in scene (assuming it's important, so it's zoomed in) so you can see more slowly.

이상의 설명에서와 같이 본 발명에 따른 동영상의 모션벡터 양자화 방법에 의하면, 움직임 보상 방법이 적용된 압축 방법을 이용한 압축 동영상에서 각 픽쳐(프레임)에 대해, 모션벡터를 수평/수직 2 차원 격자형으로 양자화 구간을 분할하고, 그 모션벡터 히스토그램을 생성함으로써, 모션벡터에 대한 데이터 양을 줄이고, 모션벡터에 대한 방향과 크기 정보가 담긴 모션벡터 히스토그램을 생성할 수 있는 장점이 있다.As described above, according to the motion vector quantization method of a video according to the present invention, a motion vector is quantized into a horizontal / vertical two-dimensional lattice for each picture (frame) in a compressed video using a compression method to which a motion compensation method is applied. By dividing the interval and generating the motion vector histogram, it is possible to reduce the amount of data for the motion vector and generate a motion vector histogram containing the direction and the size information for the motion vector.

또한, 본 발명에 따른 카메라 모션 검출 방법에 의하면, 상기와 같은 동영상의 모션벡터 양자화 방법에 의하여 생성된 모션벡터 히스토그램에 대한 분석을 통하여, 모션벡터 히스토그램의 빈의 분포로부터 카메라 모션을 빠르게 검출할 수 있는 장점이 있다.In addition, according to the camera motion detection method according to the present invention, through the analysis of the motion vector histogram generated by the motion vector quantization method of the video as described above, it is possible to quickly detect the camera motion from the distribution of the bin of the motion vector histogram There is an advantage.

Claims (13)

삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 움직임 보상 방법이 적용된 압축 방법을 이용한 압축 동영상에서 각 픽쳐(프레임)에 대해, 모션벡터 (0, 0)을 양자화 영역의 중심에 두고, 지정된 모션벡터의 최대범위로 상, 하, 좌, 우의 사각영역으로 양자화 구간을 설정하여, 모션벡터를 수평/수직 2 차원 격자형으로 양자화 구간을 분할하는 단계와;For each picture (frame) in the compressed video using the motion compensation method, the motion vector (0, 0) is centered in the quantization region, and the upper, lower, left, and right rectangles are applied to the maximum range of the specified motion vector. Dividing the quantization section into horizontal / vertical two-dimensional grids by setting a quantization section in the region; 상기 각 양자화 구간에 맵핑되는 모션벡터의 개수를 검출하여 상기 모션벡터에 대한 히스토그램을 생성하는 단계; 및Generating a histogram for the motion vector by detecting the number of motion vectors mapped to the quantization intervals; And 상기 모션벡터 히스토그램의 빈 값의 분포로부터, 상기 모션벡터 히스토그램의 총빈도가 전체 매크로블록 수에 대해 소정의 임계치 이상이면 카메라 모션이 발생된 것으로 판단하는 단계; 를 포함하는 것을 특징으로 하는 동영상의 모션벡터 양자화를 이용한 카메라 모션 검출방법.Determining from the distribution of the bin values of the motion vector histogram that the camera motion is generated if the total frequency of the motion vector histogram is equal to or greater than a predetermined threshold for the total number of macroblocks; Camera motion detection method using a motion vector quantization of a video comprising a. 삭제delete 제 8항에 있어서,The method of claim 8, 상기 카메라 모션이 발생된 것으로 판단함에 있어, 상기 모션벡터 히스토그램의 총빈도가 전체 매크로블록 수에 대해 소정의 임계치 이상이고, 모션벡터 히스토그램이 소수의 인접한 빈들에 집중되어 있고, 해당 빈의 대표 크기가 0이 아닌 경우에는 트랙, 팬, 붐, 틸트 중의 어느 한 카메라 모션이 발생된 것으로 판단되는 것을 특징으로 하는동영상의 모션벡터 양자화를 이용한 카메라 모션 검출방법. In determining that the camera motion has occurred , the total frequency of the motion vector histogram is greater than or equal to a predetermined threshold for the total number of macroblocks, the motion vector histogram is concentrated in a few adjacent bins, and the representative size of the bin is If not 0, the camera motion detection method using the motion vector quantization of the video, characterized in that it is determined that any one of the camera motion of the track, pan, boom, tilt . 제 10항에 있어서,The method of claim 10, 상기 모션벡터 히스토그램이 소수의 인접한 빈들에집중되어 있고, 모션벡터 (0, 0)이 맵핑되는 빈의 수평방향으로, 그 소수의 빈들이 맵핑되는 경우에는 트랙 또는 팬의 카메라 모션이 발생된 것으로 판단되는 것을 특징으로 하는동영상의 모션벡터 양자화를 이용한 카메라 모션 검출방법. If the motion vector histogram is concentrated on a few adjacent bins and in the horizontal direction of the bin to which the motion vector (0, 0) is mapped, it is determined that the camera motion of the track or the pan has occurred. Camera motion detection method using a motion vector quantization of a video, characterized in that the . 제 10항에 있어서,The method of claim 10, 상기 모션벡터 히스토그램이 소수의 인접한 빈들에집중되어 있고, 모션벡터 (0, 0)이 맵핑되는 빈의 수직방향으로, 그 소수의 빈들이 맵핑되는 경우에는 붐 또는 틸트의 카메라 모션이 발생된 것으로 판단되는 것을 특징으로 하는동영상의 모션벡터 양자화를 이용한 카메라 모션 검출방법. If the motion vector histogram is concentrated in a few adjacent bins and the bins are mapped in the vertical direction of the bin to which the motion vector (0, 0) is mapped, it is determined that a boom or tilt camera motion has occurred. Camera motion detection method using a motion vector quantization of a video, characterized in that the . 제 8항에 있어서,The method of claim 8, 상기 카메라 모션이 발생된 것으로 판단함에 있어, 상기 모션벡터 히스토그램의 총빈도가 전체 매크로블록 수에 대해 소정의 임계치 이상이고, 모션벡터 (0, 0)이 맵핑되는 빈을 중심으로, 주위 빈의 대표 크기 값이 방사형으로 대칭되도록 맵핑되는 경우에는 돌리 또는 줌의 카메라 모션이 발생된 것으로 판단되는 것을 특징으로 하는동영상의 모션벡터 양자화를 이용한 카메라 모션 검출방법. In determining that the camera motion has occurred , the representative of neighboring bins is based on a bin whose total frequency of the motion vector histogram is equal to or greater than a predetermined threshold for the total number of macroblocks, and to which a motion vector (0, 0) is mapped. When the magnitude value is mapped to be radially symmetric , camera motion detection method using motion vector quantization of a video, characterized in that it is determined that camera motion of dolly or zoom has occurred .
KR10-2001-0060927A 2001-09-29 2001-09-29 Camera motion detecting method using motion vector quantization for moving picture KR100443677B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2001-0060927A KR100443677B1 (en) 2001-09-29 2001-09-29 Camera motion detecting method using motion vector quantization for moving picture

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2001-0060927A KR100443677B1 (en) 2001-09-29 2001-09-29 Camera motion detecting method using motion vector quantization for moving picture

Publications (2)

Publication Number Publication Date
KR20030027574A KR20030027574A (en) 2003-04-07
KR100443677B1 true KR100443677B1 (en) 2004-08-09

Family

ID=29563081

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2001-0060927A KR100443677B1 (en) 2001-09-29 2001-09-29 Camera motion detecting method using motion vector quantization for moving picture

Country Status (1)

Country Link
KR (1) KR100443677B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102091473B1 (en) * 2014-01-07 2020-04-14 삼성전자주식회사 Method for analyzing motion of subject using event based sensor

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04281679A (en) * 1991-03-11 1992-10-07 Personal Joho Kankyo Kyokai Camera work detecting method
JPH06292203A (en) * 1993-04-02 1994-10-18 Mitsubishi Electric Corp Motion picture analyzer
JPH11205799A (en) * 1998-01-20 1999-07-30 Nec Corp Motion vector detector and its method
KR20010045573A (en) * 1999-11-05 2001-06-05 구자홍 Motion vector quantization method and quantized motion vector histogram for video analysis

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04281679A (en) * 1991-03-11 1992-10-07 Personal Joho Kankyo Kyokai Camera work detecting method
JPH06292203A (en) * 1993-04-02 1994-10-18 Mitsubishi Electric Corp Motion picture analyzer
JPH11205799A (en) * 1998-01-20 1999-07-30 Nec Corp Motion vector detector and its method
KR20010045573A (en) * 1999-11-05 2001-06-05 구자홍 Motion vector quantization method and quantized motion vector histogram for video analysis

Also Published As

Publication number Publication date
KR20030027574A (en) 2003-04-07

Similar Documents

Publication Publication Date Title
US8462989B2 (en) Scaling an image based on a motion vector
US5872604A (en) Methods and apparatus for detection of motion vectors
CA2216077C (en) Scene change detector for digital video
JP3939551B2 (en) Moving image processing apparatus, method thereof, and recording medium
US6834080B1 (en) Video encoding method and video encoding apparatus
US8442318B2 (en) Method and apparatus for modifying a moving image sequence
US6507615B1 (en) Video signal processing apparatus and video signal processing method
US5710829A (en) System and method for focused-based image segmentation for video signals
EP0648360A1 (en) Tracking objects in video sequences
JP2011120270A (en) Image processing device and image processing method
US7406123B2 (en) Visual complexity measure for playing videos adaptively
US7003154B1 (en) Adaptively processing a video based on content characteristics of frames in a video
KR20040069210A (en) Sharpness enhancement in post-processing of digital video signals using coding information and local spatial features
JP3152765B2 (en) Image coding device
US8363726B2 (en) Electronic apparatus, motion vector detecting method, and program therefor
US20110187924A1 (en) Frame rate conversion device, corresponding point estimation device, corresponding point estimation method and corresponding point estimation program
KR100443677B1 (en) Camera motion detecting method using motion vector quantization for moving picture
CA2173888C (en) System and method for focused-based image segmentation for video signals
KR100390167B1 (en) Video encoding method and video encoding apparatus
Fan et al. Adaptive motion-compensated video coding scheme towards content-based bit rate allocation
JPH10112864A (en) Method and device for camera work
JP2883592B2 (en) Moving picture decoding apparatus and moving picture decoding method
van der Schaar-Mitrea Compression of mixed video and graphics images for TV systems
KR20040107869A (en) Film source detection method by grouping, and apparatus thereof
KR100217751B1 (en) Moving picture compression/decompression apparatus and method

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20070629

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee