KR20200113477A - Method and Apparatus for Processing Image in Compressed Domain - Google Patents
Method and Apparatus for Processing Image in Compressed Domain Download PDFInfo
- Publication number
- KR20200113477A KR20200113477A KR1020190033708A KR20190033708A KR20200113477A KR 20200113477 A KR20200113477 A KR 20200113477A KR 1020190033708 A KR1020190033708 A KR 1020190033708A KR 20190033708 A KR20190033708 A KR 20190033708A KR 20200113477 A KR20200113477 A KR 20200113477A
- Authority
- KR
- South Korea
- Prior art keywords
- image
- motion vector
- motion
- vector information
- video stream
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/625—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/8549—Creating video summaries, e.g. movie trailer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/144—Movement detection
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
본 실시예는 압축 영역에서의 영상 처리방법 및 장치에 관한 것이다. 더욱 상세하게는, CCTV 영상과 같이 매우 긴 영상에 대한 영상 요약정보을 보다 효율적으로 생성하기 위한 영상 처리방법 및 장치에 관한 것이다.The present embodiment relates to an image processing method and apparatus in a compressed region. More specifically, it relates to an image processing method and apparatus for more efficiently generating image summary information for a very long image such as a CCTV image.
이 부분에 기술된 내용은 단순히 본 실시예에 대한 배경 정보를 제공할 뿐 종래기술을 구성하는 것은 아니다.The content described in this section merely provides background information on the present embodiment and does not constitute the prior art.
도 1은 일반적인 비디오 스트림의 구성을 예시한 예시도이다. 도 1을 참조하면, 비디오 스트림은 일정 주기의 IDR 픽처를 가지고 있으며, IDR 픽처로부터 다음 IDR 픽처가 나오기까지의 픽처에 대한 단위를 GOP(Group of Picture)라고 한다. IDR 픽처는 b/p 픽처에 비해 크기가 크지만 한개의 픽처로 한개의 완전환 화면을 구성할 수 있어서 저장하기에 용이하는 장점이 존재한다. 반면, 그 크기가 크므로 네트워크 전송 시에 많은 대역폭을 사용하게 되며, 저장 시에 공간도 많이 차지하게 된다는 단점이 존재한다.1 is an exemplary diagram illustrating a configuration of a general video stream. Referring to FIG. 1, a video stream has an IDR picture of a predetermined period, and a unit of a picture from an IDR picture to a next IDR picture is called a GOP (Group of Picture). Although the IDR picture is larger in size than the b/p picture, there is an advantage in that it is easy to store because one complete picture can be composed of one picture. On the other hand, since the size is large, there is a disadvantage that a large amount of bandwidth is used during network transmission and a large amount of space is occupied during storage.
도 2는 종래의 비디오 스트림으로부터 영상 요약을 위한 썸네일(Thumnail)을 생성하는 절차를 설명하기 위한 도면이다. 종래의 경우 비디오 스트림으로부터 영상 요약을 위한 썸네일을 생성할 때 비디오 스트림에 주기적으로 포함되어 있는 IDR 픽처를 저장하는 방법에 사용되었다. 하지만, 이런 방법은 CCTV 영상과 같이 매우 긴 비디오 스트림의 저장에 있어서서는 적합하지 않다. 특히, 클라우드 기반의 다량의 세션을 저장하는 경우에는 매우 큰 공간의 낭비로 나타난다. 즉, CCTV 영상의 비디오 스트림은 IDR 픽처의 간격이 넓기때문에, 종래의 방법에 의하는 경우 사람이 인지하기에 긴 시간 간격으로 썸네일이 생성된다. 또한, 주기적으로 생성된 픽처는 의미가 없는 픽처도 다량 생성이 되므로, CCTV와 같이 매우 긴 시간을 저장할 시에는 저장 공간의 낭비가 크다는 한계가 존재한다.FIG. 2 is a diagram illustrating a procedure of generating a thumbnail for summarizing an image from a conventional video stream. In the conventional case, when a thumbnail for summarizing an image is generated from a video stream, it has been used in a method of storing an IDR picture periodically included in a video stream. However, this method is not suitable for storing very long video streams such as CCTV images. In particular, storing a large number of sessions based on the cloud appears to be a very large waste of space. That is, since a video stream of a CCTV image has a wide interval between IDR pictures, thumbnails are generated at long intervals for human perception in the case of a conventional method. In addition, since a large number of pictures that are periodically generated are also meaningless pictures, there is a limitation in that a large amount of storage space is wasted when storing a very long time such as a CCTV.
이에, CCTV 카메라로부터 전송되는 비디오 스트림에 대해 비디오 스트림을 저장하면서 영상 요약을 위한 썸네일을 동시에 저장할 때 의미가 있는 썸네일 이미지를 빈번하게 저장하여 영상 요약의 질을 향상시키면서도 저장 공간의 사용량을 감소시킬 수 있도록 하는 새로운 기술을 필요로 한다.Therefore, when storing the video stream for the video stream transmitted from the CCTV camera and simultaneously storing the thumbnail for video summary, meaningful thumbnail images are frequently stored to improve the quality of video summary and reduce the use of storage space. It requires new skills to enable.
본 실시예는 CCTV 카메라로부터 전송되는 비디오 스트림을 압축 영역에서 분석하여 객체의 움직임을 탐지하고, 이를 기반으로 영상 요약을 위한 썸네일 이미지를 생성함으로써 의미가 있는 픽처를 사람이 인지하기에 적당한 간격으로 저장하여 영상 요약의 질을 향상시키면서도 저장 공간의 사용량을 감소시킬 수 있도록 하는 압축 영역에서의 영상 처리방법 및 장치를 제공하는 데 그 목적이 있다.In this embodiment, a video stream transmitted from a CCTV camera is analyzed in a compression area to detect the motion of an object, and based on this, a thumbnail image for image summary is generated, so that a meaningful picture is stored at an appropriate interval for human perception. Accordingly, an object of the present invention is to provide a method and apparatus for processing an image in a compressed region capable of reducing the amount of storage space while improving the quality of an image summary.
본 실시예는, 영상의 부호화된 비디오 스트림을 입력받는 입력 버퍼부; 상기 부호화된 비디오 스트림을 압축 영역(Compressed Domain)에서 분석하여 상기 부호화 비디오 스트림 내 모션 벡터 정보 및 DCT 계수를 추출하는 추출부; 상기 모션 벡터 정보 및 상기 DCT 계수를 분석한 분석결과를 제공하는 분석부; 및 상기 모션 벡터 정보 및 상기 DCT 계수 중 적어도 하나의 분석결과에 기초하여 상기 영상 내 객체의 움직임을 탐지하는 움직임 탐지부를 포함하는 것을 특징으로 하는 영상 처리장치를 제공한다.The present embodiment includes: an input buffer unit receiving an encoded video stream of an image; An extractor configured to analyze the encoded video stream in a compressed domain to extract motion vector information and DCT coefficients in the encoded video stream; An analysis unit that provides an analysis result obtained by analyzing the motion vector information and the DCT coefficient; And a motion detector configured to detect a motion of the object in the image based on an analysis result of at least one of the motion vector information and the DCT coefficient.
또한, 본 실시예의 다른 측면에 의하면, 영상의 부호화된 비디오 스트림을 입력받는 과정; 상기 부호화된 비디오 스트림을 압축 영역에서 분석하여 상기 부호화 비디오 스트림 내 모션 벡터 정보 및 DCT 계수를 추출하는 과정; 상기 모션 벡터 정보 및 상기 DCT 계수를 분석한 분석결과를 제공하는 과정; 및 상기 모션 벡터 정보 및 상기 DCT 계수 중 적어도 하나의 분석결과에 기초하여 상기 영상 내 객체의 움직임을 탐지하는 과정을 포함하는 것을 특징으로 하는 영상 처리방법을 제공한다.In addition, according to another aspect of the present embodiment, there is provided a process of receiving an encoded video stream of an image; Analyzing the encoded video stream in a compression region and extracting motion vector information and DCT coefficients in the encoded video stream; Providing an analysis result obtained by analyzing the motion vector information and the DCT coefficient; And detecting a motion of the object in the image based on an analysis result of at least one of the motion vector information and the DCT coefficient.
또한, 본 실시예의 다른 측면에 의하면, 제 12항에 의한 영상 처리방법의 각 단계를 실행시키기 위하여 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터프로그램을 제공한다.Further, according to another aspect of the present embodiment, there is provided a computer program stored in a computer-readable recording medium in order to execute each step of the image processing method according to
본 실시예에 의하면, CCTV 카메라로부터 전송되는 비디오 스트림을 압축 영역에서 분석하여 객체의 움직임을 탐지하고, 이를 기반으로 영상 요약을 위한 썸네일 이미지를 생성함으로써 의미가 있는 픽처를 사람이 인지하기에 적당한 간격으로 저장하여 영상 요약의 질을 향상시키면서도 저장 공간의 사용량을 감소시킬 수 있는 효과가 있다.According to the present embodiment, a video stream transmitted from a CCTV camera is analyzed in a compression region to detect the motion of an object, and based on this, a thumbnail image for image summary is generated, so that an appropriate interval for a person to recognize a meaningful picture. By storing it as an image, it is possible to reduce the amount of storage space while improving the quality of the video summary.
도 1은 일반적인 비디오 스트림의 구성을 예시한 예시도이다.
도 2는 종래의 비디오 스트림으로부터 영상 요약을 위한 썸네일을 생성하는 절차를 설명하기 위한 도면이다.
도 3은 본 실시예에 따른 영상 처리장치를 개략적으로 나타낸 블록 구성도이다.
도 4는 본 실시예에 따른 영상 처리장치의 수행부를 개략적으로 나타낸 블록 구성도이다.
도 5는 본 실시예에 따른 영상 처리방법을 설명하기 위한 순서도이다.1 is an exemplary diagram illustrating a configuration of a general video stream.
2 is a diagram for describing a procedure of generating a thumbnail for summarizing an image from a conventional video stream.
3 is a block diagram schematically illustrating an image processing apparatus according to the present embodiment.
4 is a block diagram schematically illustrating an execution unit of the image processing apparatus according to the present embodiment.
5 is a flowchart illustrating an image processing method according to the present embodiment.
이하, 본 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, this embodiment will be described in detail with reference to the accompanying drawings.
최근, 썸네일 형태로 영상을 요약하여 보여주는 애플리케이션이 늘어가고 있다. 요약하려는 영상의 길이는 다양하며, CCTV 영상과 같이 매우 긴 영상은 저장 방법에 따라서 사용성 및 저장 공간에 큰 영향을 받는다. CCTV 영상의 비디오 스트림은 일반적인 동영상 스트림과는 다른 특징을 갖는다. 즉, 네트워크 대역폭과 저장 공간을 줄이기 위해 GOP 단위를 넓게 사용하고, 프레임 레이를 낮춤으로써 IDR 픽처의 간격이 크게 형성된다. 예를 들어, 60 GOP, 15 fps의 경우 IDR 픽처는 4초마다 한번씩 포함되어 있다. 한편, CCTV 영상의 비디오 스트림과 같이 fps가 낮고, GOP가 높으면 IDR이 수초에 한번씩 포함되어 있어서 썸네일이 중요한 장면을 놓칠 가능성이 높다.Recently, the number of applications that summarize and display images in the form of thumbnails are increasing. The length of the image to be summarized varies, and very long images such as CCTV images are greatly affected by usability and storage space depending on the storage method. The video stream of CCTV video has different characteristics from the general video stream. That is, in order to reduce network bandwidth and storage space, the GOP unit is widely used, and the frame ray is decreased, thereby forming a large interval between IDR pictures. For example, in the case of 60 GOP and 15 fps, IDR pictures are included once every 4 seconds. On the other hand, if the fps is low and the GOP is high, like a video stream of a CCTV video, IDR is included once every few seconds, so there is a high possibility that a scene where a thumbnail is important will be missed.
또한, 비디오 스트림과 영상 요약을 위한 썸네일 이미지를 동시에 저장할 때, 주기적으로 비디오 스트림으로부터 이미지를 추출하는 경우, 비디오로부터 모든 픽처를 디코딩해야 하므로, CPU 자원을 헐씬 많이 사용하게 되고, 장시간 저장할 경우 의미 없는 이미지도 계속 저장함에 따라 저장 공간을 매우 많이 소모하게 된다.In addition, when storing a video stream and a thumbnail image for video summary at the same time, when periodically extracting an image from the video stream, all pictures from the video must be decoded, which consumes a lot of CPU resources. As images continue to be stored, storage space is consumed very much.
한편, CCTV 영상의 비디오 스트림의 모션 벡터 정보는 배경이 정지되어 있고, 이동체에 대한 움직임 정보를 가지고 있으므로, 모션 벡터가 감지가 된다면, 이는 의미 있는 정보일 가능성이 크다. 이 점에 기인하여, 본 실시예의 경우, CCTV 카메라로부터 전송되는 비디오 스트림을 압축 영역에서 분석하여 모션 벡터를 통한 객체의 움직임을 탐지하고, 이를 기반으로 영상 요약을 위한 썸네일 이미지를 생성함으로써 의미가 있는 픽처가 사람이 인지하기에 적당한 간격으로 저장되어 영상 요약의 질이 향상될 수 있도록 하면서도, 저장 공간의 사용량을 감소시킬 수 있도록 하는 방안을 제시한다.On the other hand, since the motion vector information of the video stream of the CCTV video has the background still and the motion information of the moving object, if the motion vector is detected, this is likely to be meaningful information. Due to this, in the case of this embodiment, it is meaningful by analyzing the video stream transmitted from the CCTV camera in the compression region to detect the motion of the object through the motion vector, and creating a thumbnail image for the image summary based on this. A method is proposed that allows pictures to be stored at appropriate intervals for human perception to improve the quality of video summary while reducing the amount of storage space used.
도 3은 본 실시예에 따른 영상 처리장치를 개략적으로 나타낸 블록 구성도이다.3 is a block diagram schematically illustrating an image processing apparatus according to the present embodiment.
도 3에 도시하듯이, 본 실시예에 따른 영상 처리장치(300)는 입력 버퍼부(310), 수행부(320) 및 영상 처리부(330)를 포함한다. 여기서, 본 실시예에 따른 영상 처리장치(300)에 포함되는 구성 요소는 반드시 이에 한정되는 것은 아니다. 즉, 도 3의 경우는 압축 영역에서 모션 벡터 추출을 통한 객체의 움직임 탐지 및 이를 기반으로 영상 요약을 위한 썸네일 이미지를 생성하기 위한 필수 구성요소만을 예시적으로 도시한 것으로서, 이러한, 영상 처리장치(300)는 다른 기능의 구현을 위해 도시한 것보다 많거나 적은 구성요소 또는 상이한 구성요소의 구성을 가질 수 있음을 인식하여야 한다.As shown in FIG. 3, the
입력 버퍼부(310)는 영상촬영 장치로부터 발생한 영상의 비디오 스트림을 버퍼링하는 기능을 수행한다. 한편, 본 실시예에 있어서, 영상촬영 장치는 바람직하게는 CCTV 장치 등과 같은 지능형 감시 장치일 수 있다, 이로 인해, 본 실시예에 따른 입력 버퍼부(310)가 버퍼링받는 비디오 스트림은 GOP 단위를 넓게 사용하고, 낮은 프레임 레이트를 가지며, 그로 인해 IDR 픽처의 간격이 크게 형성될 수 있다.The
본 실시예에 따른 입력 버퍼부(310)는 영상촬영 장치로부터 기 설정된 압축 규격에 따라 부호화된 비디오 스트림을 입력받을 수 있다. 예컨대, 입력 버퍼부(310)는 블록 단위의 움직임 보상에 기반하는 H.264/H.265와 같은 압축 규격에 따라 부호화된 비디오 스트림을 입력받을 수 있다.The
한편, 본 실시예에 있어서, 부호화된 비디오 스트림 내 IDR 픽처가 아닌 b/p 픽처는 가장 선두의 IDR 픽처로부터 디코딩을 해야 로우 이미지(Raw Image)를 얻고 그 후에 jpeg/png 이미지로 압축할 수 있다. 이에, 입력 버퍼부(310)는 영상촬영 장치로부터 IDR(Instantaneous Decoder Refresh) 픽처에 의해 정의되는 GOP(Group of Pictures) 단위로 버퍼링되는 상기의 부호화된 비디오 스트림을 입력받을 수 있다.Meanwhile, in this embodiment, a b/p picture that is not an IDR picture in an encoded video stream must be decoded from the leading IDR picture to obtain a raw image, and then can be compressed into a jpeg/png image. . Accordingly, the
수행부(320)는 부호화된 비디오 스트림으로부터 의미 있는 장면을 탐지하는 기능을 수행한다. 한편, 본 실시예에 있어서, 영상촬영 장치로부터 발생한 영상의 경우 특정 구역을 지정하여 감시함에 따라 배경이 정지되어 있고 이로 인해 영상의 변동성이 적다는 특징을 갖는다. 그로 인해, 영상 내 객체의 움직임이 발생한 경우 이는 의미 있는 장면으로서 분류될 수 있다.The
이 점에 기인하여, 본 실시예에 따른 수행부(320)는 부호화된 비디오 스트림을 분석하여 객체의 움직임을 탐지하고, 이에 대한 결과를 제공함으로써 이후, 영상 처리부(330)의 영상 처리 과정에서, 중요한 사건들에 대하여 영상 요약이 이루어질 수 있도록 한다.Due to this, the
수행부(320)는 부호화된 비디오 스트림 내 모션 벡터 정보를 검출하고, 이를 기반으로 객체의 움직임을 탐지할 수 있다. 즉, 본 실시예에 있어서, 부호화된 비디오 스트림 내 모션 벡터 정보는 배경이 정지되어 있고, 이동체에 대한 움직임 정보를 가지고 있으므로, 모션 벡터가 감지가 된다면, 이는 의미 있는 정보일 가능성이 크다.The
본 실시예에 따는 수행부(320)는 부호화된 비디오 스트림을 압축 영역(Compressed Domain)에서 분석한다. 즉, 수행부(320)는 부호화된 비디오 스트림에 대해 압축을 풀지 않고 부호화 상태에서 모션 벡터의 영역을 분석하여 움직임의 발생 여부를 탐지한다. 일반적으로 미디어 스트림의 경우 압축을 푸는 과정에 있어서 CPU 소모가 많이 발생하나, 본 실시예의 경우 압축된 상태에서 분석함으로써 이를 줄일 수 있는 효과가 있다.The
또한, 본 실시예에 있어서, 수행부(320)는 모션 벡터 정보를 통한 객체의 움직임 탐지의 정확도 향상을 위해 부호화된 비디오 스트림 내 DCT(Discrete Cosine Transform) 계수를 추가로 검출하여 활용할 수 있다. 한편, DCT 계수란 Discrete Cosine Transform의 약자로서 n개의 데이터를 n개의 코사인 함수의 합으로 표현하여 데이터의 양을 줄이는 방식을 말한다. 이 방식은 근본적으로 푸리에(Fourier)의 가설 즉, 시간 영역(time domain)에서 n개의 값은 주파수 영역(frequency domain)에서의 n개의 삼각함수로 표현될 수 있다는 푸리에 변환에서 출발한 것이다. 국제 표준 규격의 화상 압축 방식인 MPEG에서는 영상을 8x8 즉, 64개의 블럭 단위로 인코딩하는데, 이 64개의 데이터를 64개의 코사인 함수로 표기하는 것을 DCT 라 하고, 이렇게 변환된 코사인 함수들의 계수를 DCT 계수라 한다. 이러한 DCT 계수를 이용하면 동영상의 앞뒤 프레임간의 차이를 추출해 낼 수 있다.In addition, in the present embodiment, the
본 실시예에 있어서, 수행부(320)는 DCT 계수를 검출된 모션 벡터 정보에 대한 유효성을 검증하는 데 있어서 검증 파라미터로서 활용한다.In this embodiment, the
이하, 도 4를 함께 참조하여, 본 실시예에 따른 수행부(320)의 구체적인 동작에 대하여 설명하도록 한다. 한편, 도 4의 (a)는 픽셀 영역에서 객체의 움직임 탐지 절차를 도시한 도면이다. 도 4의 (b)는 본 실시예에 따른 수행부(320)를 개략적으로 나타낸 블록 구성도로서, 압축 영역에서 모션 벡터 정보를 통한 객체의 움직임 탐지 절차를 도시한 도면이다.Hereinafter, a detailed operation of the
먼저, 도 4의 (a)를 참조하면, 픽셀 영역에서 객체의 움직임 탐지를 수행하게 되면, reorder, IDCT, motion compensation과 같이 많은 자원을 소모하는 작업이 수행되어야 한다. 그리고, 픽셀 영역에서의 객체의 움직임 탐지의 경우 모든 픽셀에 대해 연산을 해야 하므로 이에 대해서도 많은 자원이 소모된다.First, referring to FIG. 4A, when motion detection of an object in a pixel area is performed, a task that consumes a lot of resources such as reorder, IDCT, and motion compensation must be performed. In addition, in the case of motion detection of an object in a pixel area, a lot of resources are consumed because calculations are required for all pixels.
반면, 도 4의 (b)를 참조하면, 본 실시예의 경우 압축 영역에서 객체의 움직임 탐지를 수행함에 따라 많은 연산량을 필요로 하는 부분(도 4의 (a)의 점선 표기 부분)들을 건너뛰면서 움직임 탐지를 할 수 있으므로 자원의 낭비를 줄일 수 있는 효과가 있다.On the other hand, referring to (b) of FIG. 4, in the case of this embodiment, as the motion of the object is detected in the compressed region, the movement while skipping the part that requires a large amount of computation (the dotted line mark in FIG. 4(a)) Since it can be detected, there is an effect of reducing the waste of resources.
도 4의 (b)에 도시하듯이, 본 실시예에 따른 수행부(320)는 추출부(400), 분석부(410) 및 움직임 탐지부(420)를 포함한다. 여기서, 수행부(320)에 포함되는 구성요소는 반드시 이에 한정되는 것은 아니다.As shown in (b) of FIG. 4, the
추출부(400)는 부호화된 비디오 스트림을 압축 영역에서 분석하여 부호화된 비디오 스트림 내 모션 벡터 정보 및 DCT 계수를 추출하는 기능을 수행한다. 이러한, 추출부(400)의 동작은 부호화된 비디오 스트림의 전부가 아닌 일부 영역을 디코딩하여 움직임 탐지를 위한 필요 정보만을 추출하는 과정에 해당한다.The
이를 위해, 본 실시예에 따른, 추출부(400)는 부호화된 비디오 스트림에 대해서 엔트로피 디코딩하도록 구성되는 엔트로피 디코더(Entropy Decoder)로 구현될 수 있다. 즉, 추출부(400)는 부호화된 비디오 스트림이 CAVLC(Context-adaptive variable-length coding) 기반으로 인코딩된 경우와 CABAC(Context-adaptive binary arithmetic coding) 기반으로 인코딩된 경우를 구분하고, 이를 기반으로 각각 상이한 디코딩 방식을 수행하여 모션 벡터 정보와 DCT 계수를 추출할 수 있다.To this end, the
분석부(410)는 추출부(400)를 통해 추출된 모션 벡터 정보 및 DCT 계수를 제공받아 분석하고, 각각에 대한 분석결과를 제공하는 기능을 수행한다. 즉, 본 실시예에 있어서, 분석부(410)는 제1 분석부(Motion vector analysis, 412) 및 제2 분석부(DCT coefficient analysis)를 포함하여 구현될 수 있다.The
제1 분석부(412)는 모션 벡터 정보에 대한 분석을 수행하고, 이에 대한 분석결과를 제공한다. 본 실시예에 있어서, 제1 분석부(412)는 모션 벡터 정보에 대한 분석결과를 기반으로 모션 벡터 정보에 대한 보정을 수행할 수 있다. 한편, 모션 벡터 정보는 메크로 블록 단위로 이전 영상과 비교해서 가장 유사한 메크로 블록을 찾아낸 벡터 정보를 가지고 있다. 이는 16×16, 8×8, 4×4 등이 될 수 있다. 이와 같이 모션 벡터 정보가 발생하면 움직임이 탐지되었을 수 있지만, 다양한 이유로 인해서 보정이 되어야 한다. 즉, 움직임 예측(Motion Estimation) 과정을 통해서 모션 벡터 정보를 찾는데 이때 압축에 유리한 블록을 찾으므로 모션 벡터 정보는 실제 움직임과 일치하지 않을 수 있다. 또한, 모션 벡터 정보를 발생시키기보다 자체 블록에서 인트라 예측을 하여 처리하는 블록의 경우 모션 벡터 정보가 발생하지 않는다. 또한, 보통 패턴 균일하거나 특징이 거의 없는 영역에서 모션 벡터 정보를 잘못 찾는 경우가 발생할 수 있다. The
이 점에 기인하여, 제1 분석부(412)는 모션 벡터 정보에 대한 분석을 통해 모션 벡터 정보에 매칭되는 블록의 주변 블록 중 인트라 예측에 기반한 처리를 수행하는 특정 블록에 대해서도 적응적으로 모션 벡터 정보를 부여할 수 있다. 이는, 객체 내 움직임 탐지에 대한 정확도를 향상시키기 위한 보정 과정에 해당되며, 예컨대, 제1 분석부(412)는 주변 블록의 모션 벡터 정보를 기반으로 특정 블록에 대한 모션 벡터 정보를 부여할 수 있다.Due to this, the
제1 분석부(412)는 보정된 모션 벡터 정보 및 상기의 분석결과를 움직임 탐지부(420)로 전송하고, 이를 통해 움직임 탐지부(420)로 하여금 움직임 탐지 절차를 수행하도록 한다.The
제2 분석부(414)는 DCT 계수에 대한 분석을 수행하고, 이에 대한 분석결과를 제공한다. DCT 계수는 메크로 블록에 대해 이전 화면과의 차분치에 대한 픽셀 값을 이산 코사인 변환을 한 후에 발생하는 계수로서 2가지 용도로 사용될 수 있다.The
먼저, DCT 계수는 모션 벡터 정보와 별개로 객체의 움직임을 탐지하기 위한 변수 값으로서 활용될 수 있다. 즉, 움직임이 탐지가 되었다면, DCT 계수에 변화가 있을 것이며, 이 변화량이 특정 임계치를 초과하는 경우 움직임이 탐지되었다고 할 수 있다. 이를 위해, 제2 분석부(414)는 DCT 계수의 변화량을 상기의 분석결과로서 제공할 수 있다.First, the DCT coefficient may be used as a variable value for detecting motion of an object separately from motion vector information. That is, if motion is detected, there will be a change in the DCT coefficient, and if this change amount exceeds a specific threshold, it can be said that the motion is detected. To this end, the
또한, DTC 계수는 제1 분석부(212)를 통해 분석 및 보정된 모션 벡터 정보에 대한 유효성 여부를 검증하는 용도로 사용될 수 있다. 즉, DCT 계수를 통해 영상의 대략적인 실제 패턴을 알 수 있으므로, 이를 통해, 모션 벡터 정보가 유효한지를 판단할 수 있다. 제2 분석부(214)는 DCT 계수에 대한 분석결과를 움직임 탐지부(420)로 전송하고, 이를 통해, 움직임 탐지부(420)로 하여금 DCT 계수에 대한 분석결과를 통해 모션 벡터 정보에 대한 유효성을 판별하도록 한다.In addition, the DTC coefficient may be used to verify the validity of motion vector information analyzed and corrected by the first analysis unit 212. That is, since the approximate actual pattern of the image can be known through the DCT coefficient, it is possible to determine whether motion vector information is valid through this. The second analysis unit 214 transmits the analysis result of the DCT coefficient to the
움직임 탐지부(420)는 분석부(210)를 통해 제공받은 모션 벡터 정보 및 DCT 계수 중 적어도 하나의 분석결과에 기초하여 영상 내 객체의 움직임을 탐지하는 기능을 수행한다.The
본 실시예에 있어서, 움직임 탐지부(420)는 모션 벡터 정보 및 DCT 계수에 대한 분석결과를 통합하여 객체의 움직임이 탐지되었는지 여부를 결정할 수 있다. 즉, 움직임 탐지부(420)는 모션 벡터 정보에 대한 분석결과에 DCT 계수에 대한 분석결과를 반영하여 보정을 수행한다.In this embodiment, the
이 경우, 움직임 탐지부(420)는 DCT 계수에 대한 분석결과를 활용하여 모션 벡터 정보에 대한 유효성을 판별하고, 판별결과에 따라 객체의 움직임을 탐지할 수 있다. 예컨대, 움직임 탐지부(420)는 모션 벡터 정보에 대한 분석결과 및 해당 모션 벡터 정보에 상응하는 DCT 계수에 대한 분석결과에 대하여 기 정의된 가중치를 반영한 가중치 반영값이 기 설정된 임계치를 초과하는 경우 모션 벡터 정보가 유효한 것으로 판별하고, 객체의 움직임이 탐지된 것으로 결정한다. 반대로, 움직임 탐지부(420)는 상기의 가중치 반영값이 기 설정된 임계치 미만인 경우 모션 벡터 정보가 유효하지 않은 것으로 판별하고, 객체의 움직임이 탐지되지 않은 것으로 결정한다.In this case, the
다른 실시예에 있어서, 움직임 탐지부(420)는 DCT 계수에 대한 분석결과에 기초하여 DCT 계수의 변화량을 산출하고, 산출된 변화량에 기반하여 객체의 움직임을 탐지할 수 있다. 예컨대, 움직임 탐지부(420)는 산출된 변화량이 기 설정된 임계치를 초과하는 경우 객체의 움직임이 탐지된 것으로 결정한다.In another embodiment, the
다른 실시예에 있어서, 움직임 탐지부(420)는 영상촬영 장치로부터 얼굴이나 사람을 인식한 결과를 전달받고, 이를 기반으로 객체의 움직임을 탐지할 수 있다.In another embodiment, the
영상 처리부(330)는 움직임 탐지부(420)의 객체 움직임 탐지결과를 기반으로 영상 요약정보를 생성한다. 본 실시예에 있어서, 영상 요약정보는 썸네일 이미지인 것이 바람직하나 반드시 이에 한정되는 것은 아니다. 이러한, 영상 처리부(330)는 비디오 디코더(Video Decoder), 조절부(Image Resize), 이미지 디코더(Image Decoder) 및 제1 내지 제2 처리부(Black Hole) 등을 포함하여 구성될 수 있다. 여기서, 영상 처리부(330)에 포함되는 각 구성요소의 동작은 종래와 동일한 바 자세한 설명은 생략하도록 한다.The
영상 처리부(330)는 객체 움직임 탐지결과를 기반으로 영상 내 객체의 움직임이 탐지된 장면에 대한 타임스템프를 테이블에 저장한다.The
영상 처리부(330)는 저장된 타임스템프를 기준으로 특정 시점에 상응하는 이미지를 저장하여 영상 요약정보를 생성한다. 예컨대, 영상 처리부(330)는 부화호된 비디오 스트림을 복호화하고, 복고화된 비디오 스트림 내 상기의 타임스템프에 상응하는 시간을 포함한 시간에 대해 재부호화를 수행한 후 이를 이미지로 저장한다.The
한편, 영상 처리부(330)는 영상 내 객체의 움직임이 탐지된 장면이 IDR 픽처가 아닌 b/p 픽처인 경우 복호화된 비디오 스트림 내의 참조 영상(ex: IDR 픽처)에 대한 정보를 추가로 조합하여 상기의 재부호화를 수행한다. 이는, 이후 영상 요약정보를 조회 시에 참조 영상의 디코딩 없이도 영상 요약 정보의 디코딩이 가능하게 하는 효과가 있다.On the other hand, the
영상 처리부(330)는 필요에 따라 영상 요약 정보의 생성 주기를 변경할 수 있다. 예컨대, 영상 처리부(330)가 이미지를 너무 자주 생성하게 되면 CPU 및 저장 공간을 많이 소모하게 되므로 가장 적정한 간격으로 저장하도록 한다. 예컨대, 비디오 스트림이 15fps일 경우 픽처의 간격이 67ms인데, 이미지로 저장을 할 때는 초당 1장 정도를 저장하면 정성적으로 보기에 인간이 인지하기에 어색하지 않으면서도 저장 공간을 절약할 수 있다. The
도 5는 본 실시예에 따른 영상 처리방법을 설명하기 위한 순서도이다.5 is a flowchart illustrating an image processing method according to the present embodiment.
영상 처리장치(300)는 영상촬영 장치로부터 발생한 영상의 부호화된 비디오 스트림을 수신한다(S502). 단계 S502에서 영상 처리장치(300)는 영상촬영 장치로부터 IDR 픽처에 의해 정의되는 GOP 단위로 버퍼링되는 상기의 부호화된 비디오 스트림을 입력받을 수 있다.The
영상 처리장치(300)는 단계 S502의 부호화된 비디오 스트림을 분석하여 부호화 비디오 스트림 내 모션 벡터 정보 및 DCT 계수를 추출한다(S504). 단계 S504에서 영상 처리장치(300)는 부호화된 비디오 스트림에 대해 압축을 풀지 않고 부호화 상태에서 모션 벡터의 영역 및 DCT 계수를 추출한다. 즉, 영상 처리장치(300)는 부호화된 비디오 스트림에 대해서 엔트로피 디코딩을 수행하고, 이를 통해, 부호화된 비디오 스트림의 전부가 아닌 일부 영역을 디코딩하여 모션 벡터 정보 및 DCT 계수를 추출할 수 있다.The
영상 처리장치(300)는 단계 S504에서 추출한 모션 벡터 정보 및 DCT 계수를 분석하여 분석결과를 생성한다(S506). 단계 S506에서 영상 처리장치(300)는 모션 벡터 정보에 대한 분석결과를 기반으로 모션 벡터 정보에 대한 보정을 수행할 수 있다. 예컨대, 영상 처리장치(300)는 모션 벡터 정보에 대한 분석을 통해 모션 벡터 정보에 매칭되는 블록의 주변 블록 중 인트라 예측에 기반한 처리를 수행하는 특정 블록에 대해서도 적응적으로 모션 벡터 정보를 부여할 수 있다.The
영상 처리장치(300)는 단계 S506에서 생성한 모션 벡터 정보의 분석결과 및 DCT 계수의 분석결과 중 적어도 하나의 분석결과에 기초하여 영상 내 객체의 움직임을 탐지한다(S508). 단계 S508에서 영상 처리장치(300)는 DCT 계수에 대한 분석결과를 활용하여 모션 벡터 정보에 대한 유효성을 판별하고, 판별결과에 따라 객체의 움직임을 탐지할 수 있다.The
또한, 영상 처리장치(300)는 DCT 계수에 대한 분석결과에 기초하여 DCT 계수의 변화량을 산출하고, 산출된 변화량에 기반하여 객체의 움직임을 탐지할 수 있다.In addition, the
영상 처리장치(300)는 단계 S508의 움직임 탐지결과를 기반으로 영상 요약 정보를 생성한다(S510). 영상 처리장치(300)는 단계 S508의 움직임 탐지결과를 기반으로 영상 내 객체의 움직임이 탐지된 장면에 대한 타임스템프를 테이블에 저장하고, 저장된 타임스템프의 시각을 포함하는 특정 시점에 상응하는 이미지를 저장하여 영상 요약정보를 생성한다.The
여기서, 단계 S502 내지 S510는 앞서 설명된 영상 처리장치(300)의 각 구성요소의 동작에 대응되므로 더 이상의 상세한 설명은 생략한다.Here, since steps S502 to S510 correspond to the operation of each component of the
도 5에서는 각각의 과정을 순차적으로 실행하는 것으로 기재하고 있으나, 반드시 이에 한정되는 것은 아니다. 다시 말해, 도 5에 기재된 과정을 변경하여 실행하거나 하나 이상의 과정을 병렬적으로 실행하는 것으로 적용 가능할 것이므로, 도 5는 시계열적인 순서로 한정되는 것은 아니다.In FIG. 5, it is described that each process is sequentially executed, but is not limited thereto. In other words, since the process described in FIG. 5 may be changed and executed or one or more processes may be executed in parallel, FIG. 5 is not limited to a time series order.
전술한 바와 같이 도 5에 기재된 영상 처리방법은 프로그램으로 구현되고 컴퓨터의 소프트웨어를 이용하여 읽을 수 있는 기록매체(CD-ROM, RAM, ROM, 메모리 카드, 하드 디스크, 광자기 디스크, 스토리지 디바이스 등)에 기록될 수 있다.As described above, the image processing method illustrated in FIG. 5 is a recording medium (CD-ROM, RAM, ROM, memory card, hard disk, magneto-optical disk, storage device, etc.) that is implemented as a program and can be read using software of a computer. Can be written on.
이상의 설명은 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The above description is merely illustrative of the technical idea of the present embodiment, and those of ordinary skill in the technical field to which the present embodiment belongs will be able to make various modifications and variations without departing from the essential characteristics of the present embodiment. Accordingly, the present exemplary embodiments are not intended to limit the technical idea of the present exemplary embodiment, but are illustrative, and the scope of the technical idea of the present exemplary embodiment is not limited by these exemplary embodiments. The scope of protection of this embodiment should be interpreted by the following claims, and all technical ideas within the scope equivalent thereto should be construed as being included in the scope of the present embodiment.
300: 영상 처리장치
310: 입력 버퍼부
320: 수행부
330: 영상 처리부
400: 추출부
410: 분석부
420: 움직임 탐지부300: image processing device 310: input buffer unit
320: execution unit 330: image processing unit
400: extraction unit 410: analysis unit
420: motion detection unit
Claims (13)
상기 부호화된 비디오 스트림을 압축 영역(Compressed Domain)에서 분석하여 상기 부호화 비디오 스트림 내 모션 벡터 정보 및 DCT 계수를 추출하는 추출부;
상기 모션 벡터 정보 및 상기 DCT 계수를 분석한 분석결과를 제공하는 분석부; 및
상기 모션 벡터 정보 및 상기 DCT 계수 중 적어도 하나의 분석결과에 기초하여 상기 영상 내 객체의 움직임을 탐지하는 움직임 탐지부
를 포함하는 것을 특징으로 하는 영상 처리장치.An input buffer unit receiving an encoded video stream of an image;
An extractor configured to analyze the encoded video stream in a compressed domain to extract motion vector information and DCT coefficients in the encoded video stream;
An analysis unit that provides an analysis result obtained by analyzing the motion vector information and the DCT coefficient; And
A motion detection unit that detects motion of an object in the image based on the analysis result of at least one of the motion vector information and the DCT coefficient
Image processing apparatus comprising a.
상기 입력 버퍼부는,
블록 단위의 움직임 보상에 기반하는 압축 규격에 기반하여 부호화된 비디오 스트림을 입력받는 것을 특징으로 하는 영상 처리장치.The method of claim 1,
The input buffer unit,
An image processing apparatus, characterized in that receiving an encoded video stream based on a compression standard based on motion compensation in units of blocks.
상기 입력 버퍼부는,
IDR(Instantaneous Decoder Refresh) 픽처에 의해 정의되는 GOP(Group of Pictures) 단위로 버퍼링되는 상기 부호화된 비디오 스트림을 입력받는 것을 특징으로 하는 영상 처리장치.The method of claim 1,
The input buffer unit,
An image processing apparatus comprising: receiving the encoded video stream buffered in GOP (Group of Pictures) units defined by an Instantaneous Decoder Refresh (IDR) picture.
상기 분석부는, 상기 모션 벡터 정보에 대한 분석을 수행하는 제1 분석부 및 상기 DCT 계수에 대한 분석을 수행하는 제2 분석부를 포함하며,
상기 제1 분석부는, 상기 모션 벡터 정보에 대한 분석을 통해 상기 모션 벡터 정보에 매칭되는 블록의 주변 블록 중 인트라 예측에 기반한 처리를 수행하는 특정 블록에 대해서도 적응적으로 모션 벡터 정보를 부여하는 것을 특징으로 하는 영상 처리장치.The method of claim 1,
The analysis unit includes a first analysis unit for analyzing the motion vector information and a second analysis unit for analyzing the DCT coefficient,
The first analysis unit adaptively assigns motion vector information to a specific block that performs processing based on intra prediction among neighboring blocks of the block matching the motion vector information through analysis of the motion vector information. An image processing device made into.
상기 움직임 탐지부는,
상기 DCT 계수에 대한 분석결과를 활용하여 상기 모션 벡터 정보에 대한 유효성을 판별하고, 판별결과에 따라 상기 객체의 움직임을 탐지하는 것을 특징으로 하는 영상 처리장치.The method of claim 1,
The motion detection unit,
And determining the validity of the motion vector information by using the analysis result of the DCT coefficient, and detecting the motion of the object according to the determination result.
상기 움직임 탐지부는,
상기 모션 벡터 정보 및 상기 모션 벡터 정보에 상응하는 DCT 계수에 대한 분석결과에 대하여 기 정의된 가중치를 반영한 가중치 반영값이 기 설정된 임계치를 초과하는 경우 상기 모션 벡터 정보가 유효한 것으로 판별하는 것을 특징으로 하는 영상 처리장치.The method of claim 5,
The motion detection unit,
When the motion vector information and the weight reflection value reflecting the predefined weight for the analysis result of the DCT coefficient corresponding to the motion vector information exceeds a preset threshold, it is determined that the motion vector information is valid. Image processing device.
상기 움직임 탐지부는,
상기 DCT 계수에 대한 분석결과에 기초하여 상기 DCT 계수의 변화량을 산출하고, 상기 변화량에 기반하여 상기 객체의 움직임을 탐지하는 것을 특징으로 하는 영상 처리장치.The method of claim 1,
The motion detection unit,
And calculating a change amount of the DCT coefficient based on an analysis result of the DCT coefficient, and detecting a motion of the object based on the change amount.
상기 움직임 탐지부의 탐지결과를 기반으로 영상 요약정보를 생성하는 영상 처리부를 더 포함하는 것을 특징으로 하는 영상 처리장치.The method of claim 1,
And an image processing unit that generates image summary information based on the detection result of the motion detection unit.
상기 영상 처리부는,
상기 영상 내 상기 객체의 움직임이 탐지된 장면에 대한 타임스템프를 저장하고, 상기 타임스템프를 기준으로 특정 시점에 상응하는 이미지를 저장하여 상기 영상 요약정보를 생성하는 것을 특징으로 하는 영상 처리장치.The method of claim 8,
The image processing unit,
And generating the image summary information by storing a timestamp for a scene in which the motion of the object in the image is detected, and storing an image corresponding to a specific point in time based on the timestamp.
상기 영상 처리부는,
상기 부호화된 비디오 스트림을 복호화하고 복호화된 비디오 스트림 내 상기 타임스템프에 상응하는 시각을 포함한 시간에 대해 재부호화를 수행한 후 상기 이미지로 저장하는 것을 특징으로 하는 영상 처리장치.The method of claim 9,
The image processing unit,
And storing the image as the image after decoding the encoded video stream, re-encoding a time including a time corresponding to the time stamp in the decoded video stream.
상기 영상 처리부는,
상기 복호화된 비디오 스트림 내 참조 영상에 대한 정보를 추가로 조합하여 상기 재부호화를 수행하는 것을 특징으로 하는 영상 처리장치.The method of claim 10,
The image processing unit,
And performing the re-encoding by additionally combining information on a reference image in the decoded video stream.
상기 부호화된 비디오 스트림을 압축 영역에서 분석하여 상기 부호화 비디오 스트림 내 모션 벡터 정보 및 DCT 계수를 추출하는 과정;
상기 모션 벡터 정보 및 상기 DCT 계수를 분석한 분석결과를 제공하는 과정; 및
상기 모션 벡터 정보 및 상기 DCT 계수 중 적어도 하나의 분석결과에 기초하여 상기 영상 내 객체의 움직임을 탐지하는 과정
을 포함하는 것을 특징으로 하는 영상 처리방법.Receiving an encoded video stream of an image;
Analyzing the encoded video stream in a compression region and extracting motion vector information and DCT coefficients in the encoded video stream;
Providing an analysis result obtained by analyzing the motion vector information and the DCT coefficient; And
The process of detecting the motion of the object in the image based on the analysis result of at least one of the motion vector information and the DCT coefficient
Image processing method comprising a.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190033708A KR20200113477A (en) | 2019-03-25 | 2019-03-25 | Method and Apparatus for Processing Image in Compressed Domain |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190033708A KR20200113477A (en) | 2019-03-25 | 2019-03-25 | Method and Apparatus for Processing Image in Compressed Domain |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20200113477A true KR20200113477A (en) | 2020-10-07 |
Family
ID=72884261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190033708A KR20200113477A (en) | 2019-03-25 | 2019-03-25 | Method and Apparatus for Processing Image in Compressed Domain |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20200113477A (en) |
-
2019
- 2019-03-25 KR KR1020190033708A patent/KR20200113477A/en active Search and Examination
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11423942B2 (en) | Reference and non-reference video quality evaluation | |
US7933333B2 (en) | Method and apparatus for detecting motion in MPEG video streams | |
US20100061443A1 (en) | Method and system for video streaming of a graphical display of an application | |
EP3175621B1 (en) | Video-segment identification systems and methods | |
US20150249829A1 (en) | Method, Apparatus and Computer Program Product for Video Compression | |
KR20040060980A (en) | Method and system for detecting intra-coded pictures and for extracting intra DCT precision and macroblock-level coding parameters from uncompressed digital video | |
JP2006527518A (en) | Video compression | |
CN111182310A (en) | Video processing method and device, computer readable medium and electronic equipment | |
KR101606931B1 (en) | Apparatus for recording/playing key frame still image and method for orerating the same | |
KR20200113477A (en) | Method and Apparatus for Processing Image in Compressed Domain | |
US11538169B2 (en) | Method, computer program and system for detecting changes and moving objects in a video view | |
CN112218087B (en) | Image encoding and decoding method, encoding and decoding device, encoder and decoder | |
CN112272297B (en) | Image quality still frame detection method embedded in decoder | |
CN112672164A (en) | Video compression system and method, and video decompression system and method | |
US20230209064A1 (en) | Identifying long term reference frame using scene detection and perceptual hashing | |
Guo et al. | Quick extracting keyframes from compressed video | |
JP3407872B2 (en) | Method and apparatus for detecting additional information | |
JP2008072608A (en) | Apparatus and method for encoding image | |
KR20170050120A (en) | Method for reducing noise of video signal | |
JP2005150808A (en) | Monitoring video recording system | |
CA2885198A1 (en) | Method, apparatus and computer program product for video compression | |
JP2001285878A (en) | Method and device for analyzing dynamic image | |
JP2015035785A (en) | Dynamic image encoding device, imaging device, dynamic image encoding method, program, and recording medium | |
JP2006295705A (en) | Animation encoder, animation decoder, animation encoding method, animation decoding method, animation encoding program, and animation decoding program | |
KR19990086000A (en) | Detection method of reference macro block of MPEG decoder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |