KR101490521B1 - Method for real-time scene-change detection for rate control of video encoder, method for enhancing qulity of video telecommunication using the same, and system for the video telecommunication - Google Patents

Method for real-time scene-change detection for rate control of video encoder, method for enhancing qulity of video telecommunication using the same, and system for the video telecommunication Download PDF

Info

Publication number
KR101490521B1
KR101490521B1 KR20080075307A KR20080075307A KR101490521B1 KR 101490521 B1 KR101490521 B1 KR 101490521B1 KR 20080075307 A KR20080075307 A KR 20080075307A KR 20080075307 A KR20080075307 A KR 20080075307A KR 101490521 B1 KR101490521 B1 KR 101490521B1
Authority
KR
South Korea
Prior art keywords
frame
scene change
quot
regions
equation
Prior art date
Application number
KR20080075307A
Other languages
Korean (ko)
Other versions
KR20090037288A (en
Inventor
이창현
송관웅
박영오
김용석
주영훈
박태성
권재훈
정도영
박재성
김성기
김용규
오윤제
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to US12/249,018 priority Critical patent/US20090097546A1/en
Publication of KR20090037288A publication Critical patent/KR20090037288A/en
Application granted granted Critical
Publication of KR101490521B1 publication Critical patent/KR101490521B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone

Abstract

본 발명에 따른 실시간 장면 전환 검출 방법은 동영상 부호화 데이터율 제어를 위한 실시간 장면 전환 검출 방법에 있어서, 현재 프레임을 복수의 영역으로 분할하고, 각각의 분할된 영역의 비 유사성 척도(DM; dissimilarity metric)를 연산하는 과정과, 상기 각 영역의 비 유사성 척도가 미리 설정된 기준치를 벗어나는지 판단하는 과정과, 현재 프레임 내에서, 비 유사성 척도가 상기 미리 설정된 기준치를 벗어나는 영역의 개수를 확인하는 과정과, 상기 과정에서 미리 설정된 기준치를 벗어나는 영역의 개수를 확인한 결과, 기준치를 벗어나는 영역의 개수가 미리 설정된 개수 이상일 경우에 현재 프레임에서 장면 전환이 이루어진 것으로 간주하는 과정을 포함한다.A real-time scene change detection method according to the present invention is a real-time scene change detection method for controlling a motion-encoded data rate, the method comprising: dividing a current frame into a plurality of regions, and determining a dissimilarity metric (DM) Determining whether the non-similarity measure of each of the regions is out of a preset reference value, confirming the number of regions in the current frame where the non-similarity measure deviates from the preset reference value, It is determined that the scene change has been performed in the current frame when the number of regions out of the reference value is greater than or equal to a predetermined number.

동영상, 장면 전환, 부호화, 실시간, PSNR, 예측 Video, transitions, encoding, real-time, PSNR, prediction

Description

동영상 부호화 데이터율 제어를 위한 실시간 장면 전환 검출 방법, 이를 이용한 영상통화 품질 향상 방법, 및 영상통화 시스템{METHOD FOR REAL-TIME SCENE-CHANGE DETECTION FOR RATE CONTROL OF VIDEO ENCODER, METHOD FOR ENHANCING QULITY OF VIDEO TELECOMMUNICATION USING THE SAME, AND SYSTEM FOR THE VIDEO TELECOMMUNICATION}TECHNICAL FIELD [0001] The present invention relates to a real-time scene change detection method, a video call quality improvement method, and a video call system for controlling a video encoded data rate, THE SAME, AND SYSTEM FOR THE VIDEO TELECOMMUNICATION}

본 발명은 동영상 부호화(encoding)에 관한 기술로서, 동영상 부호화시에 동영상 부호화 데이터율 제어를 위해 선행되는 실시간 장면 전환 검출 방법에 관한 것이다.BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a moving image encoding method and, more particularly, to a real-time scene change detection method for controlling a moving image encoding data rate in moving image encoding.

동영상 신호의 전송이나 저장시에 높은 영상 화질을 유지하면서 낮은 데이터 레이트나 적은 저장 영역을 얻기 위한 다양한 디지털 동영상 압축 기술이 제안되어 왔다. 이러한 동영상 압축 기술은 H.261, H.263, H.264, MPEG-2, MPEG-4 등과 같은 국제 표준 규격들이다. 이러한 압축 기술은 이산 코사인 변환(DCT: Discrete Cosine Transform) 기법이나 모션 보상(MC: Motion Compensation) 기법 등에 의해, 비교적 높은 압축률을 달성하고 있다. 이러한 동영상 압축 기술은 동영상 데이터의 스트림이 다양한 디지털 네트워크, 예를 들면, 휴대전화 네트워크, 컴퓨터 네트워 크, 케이블 네트워크, 위성 네트워크 등에 효율적으로 전달되도록 적용되고 있다. 또한 하드디스크, 광디스크, 디지털 동영상 디스크(DVD) 등의 기억 매체에도 효율적으로 저장되도록 적용되고 있다.Various digital moving picture compression techniques have been proposed for obtaining a low data rate or a small storage area while maintaining a high image quality at the time of transmitting or storing moving picture signals. These video compression techniques are international standard standards such as H.261, H.263, H.264, MPEG-2, and MPEG-4. This compression technique achieves a relatively high compression ratio by a discrete cosine transform (DCT) technique or a motion compensation (MC) technique. Such moving picture compression techniques are being applied so that a stream of moving picture data is efficiently transmitted to various digital networks, such as a cellular telephone network, a computer network, a cable network, and a satellite network. And is also efficiently applied to a storage medium such as a hard disk, an optical disk, and a digital moving picture disk (DVD).

고화질을 위해서는, 동영상 부호화시 많은 양의 데이터를 요구하게 된다. 그러나, 동영상 데이터를 전달하는 통신 네트워크는 부호화에 적용할 수 있는 데이터 레이트를 제한할 수 있다. 예를 들어, 위성방송 시스템의 데이터 채널이나 디지털 케이블 텔레비전 네트워크의 데이터 채널은 일반적으로 고정 비트 레이트(CBR: Constant Bit Rate)로 데이터를 보내고 있다. 또한 디스크와 같은 저장 매체의 저장 용량도 한정되어 있다.For high picture quality, a large amount of data is required in coding a moving picture. However, a communication network carrying moving picture data may limit the data rate that can be applied to coding. For example, a data channel of a satellite broadcasting system or a data channel of a digital cable television network generally transmits data at a constant bit rate (CBR). The storage capacity of storage media such as disks is also limited.

따라서, 동영상 부호화 프로세스는 화질과 이미지 압축에 필요한 비트 수를 적절히 트레이드 오프하게 된다. 또한 동영상 부호화는 비교적 복잡한 처리를 요구하므로, 예를 들어 소프트웨어로 이를 구현하려고 할 경우에는, 동영상 부호화 프로세스는 비교적 많은 CPU 사이클을 필요로 하게 된다. 더욱이 이를 실시간 처리로 재생하려고 하면, 시간적인 제약이 부호화 수행시의 정밀함을 제한하게 되며, 이에 따라 달성할 수 있는 화질이 제한된다.Therefore, the moving image encoding process properly trades off the image quality and the number of bits required for image compression. Also, since moving picture coding requires a relatively complicated process, for example, when the software implements it, the moving picture coding process requires a relatively large number of CPU cycles. Moreover, if it is tried to reproduce it in real time processing, time constraints limit the accuracy in encoding, and thus the achievable image quality is limited.

이와 같이, 동영상 부호화 데이터율 제어는 실제 사용환경에서 중요한 사안이며, 되도록이면 처리 방식의 복잡도와 전송 데이터율을 줄이면서도 고화질을 얻도록 하기 위한 동영상 부호화 데이터율 제어 방식이 제안되고 있다.As described above, the video coding data rate control is an important issue in an actual use environment, and a video coding data rate control scheme for obtaining a high picture quality while reducing the complexity and the transmission data rate of the processing method is proposed.

JVT(Joint Video Team: ITU-T Video Coding Experts Group and ISO/IEC 14496-10 AVC Moving Picture Experts Group, Z. G. Li, F. Pan, K. P. Lim, G. Feng, X. Lin, and S. Rahardja, "Adaptive basic unit layer rate control for JVT", JVT-G012-r1, 7th Meeting Pattaya Ⅱ, Thailand, Mar. 2003.)에서는 MPEG 동영상 압축 알고리즘에 따른 동영상 프레임 부호화시 양자화 파라미터(QP: Quantization Parameter)를 조절하여 데이터율을 제어하는 기본적인 기술이 개시되고 있다.JVT (Joint Video Team: ITU-T Video Coding Experts Group and ISO / IEC 14496-10 AVC Moving Picture Experts Group, ZG Li, F. Pan, KP Lim, G. Feng, X. Lin, and S. Rahardja, Adaptive basic unit layer rate control for JVT ", JVT-G012-r1, 7th Meeting Pattaya Ⅱ, Thailand, Mar. 2003.) adjusted the quantization parameter (QP) A basic technique for controlling the data rate is disclosed.

한편, 주어진 자원(전송율 등)이 제한된 상태에서 동영상 부호화시 GOP(group of picture) 내(內)의 인터(Inter) 프레임에서 장면 전환이 일어나면 부호화 데이터율 제어의 흐름이 깨진다. 왜냐하면 부호화 데이터율 제어는 앞선 프레임과의 유사성이 있다는 가정 하에 만들어졌기 때문이다. 이러한 경우를 사전에 막기 위해 실시간 장면 전환 검출이 필요하게 된다.On the other hand, when a scene change occurs in an inter frame in a GOP (group of picture) in a video encoding state in a state where a given resource (rate, etc.) is limited, the flow of the control of the encoded data rate is broken. This is because the coding data rate control is made on the assumption that there is similarity with the preceding frame. Real-time scene change detection is required to prevent this situation in advance.

장면 전환 검출을 위해, 이웃하는 프레임간의 유사성을 찾기 위한 기법으로는 상관(Correlation), 통계적 순차 분석(Statistical sequential analysis), 히스토그램(Histogram) 등의 방식을 사용한다. 또한 H.264/AVC로 압축된 동영상에서는 RDO(Rate Distortion Optimization) 과정에서 인터(Inter) 프레임내에 인트라(Intra) 코딩된 매크로블록(macroblock)이 존재할 수 있으며, 인터(Inter) 프레임내에 인트라 코딩된 매크로블록의 수가 일정수준 이상이 되면 그 프레임은 장면 전환되었다고 간주할 수 있다.For scene change detection, correlation, statistical sequential analysis, and histogram are used to find similarities between neighboring frames. In the video compressed by H.264 / AVC, an intra-coded macroblock may exist in the inter frame during the Rate Distortion Optimization (RDO) process, and intra-coded intra- If the number of macroblocks exceeds a certain level, the frame can be regarded as a scene change.

그러나, H.264/AVC로 압축된 동영상에서 인터 프레임 내에 인트라 코딩된 매크로블록의 수로 장면 전환을 판단하는 방식은 간단하지만 실시간 처리를 할 수 없다. 즉, H.264/AVC RDO 과정에서 발생하는 "Chicken&Egg dilemma"에 의해 양자화 파라미터(QP)없이 인터 프레임내에 인트라 코딩된 매크로블록의 수를 알 수 없다.However, the method of determining the scene change by the number of intra-coded macroblocks in an interframe in a video compressed with H.264 / AVC is simple, but can not perform real-time processing. That is, the number of intra-coded macroblocks in the interframe can not be known without the quantization parameter (QP) due to the "Chicken & Egg dilemma" occurring in the H.264 / AVC RDO process.

이를 해결하기 위하여, 프레임간의 비 유사성을 측정하여 장면전환을 판단하는 방법이 연구되어 왔다. 프레임간의 비 유사성의 측정은 압축된 영상의 비유사성척도(DM; dissimilarity metric)를 이용하는 방법과 압축되지 않은 영상에서의 비유사성 척도(DM)를 이용하는 방법이 있다.To solve this problem, a method of judging scene change by measuring non-similarity between frames has been studied. The measurement of non-similarity between frames is performed by using a dissimilarity metric (DM) of a compressed image and by using a non-similarity measure (DM) in an uncompressed image.

장면 전환 검출은 동영상 비트율 제어를 위해 수행되므로, 동영상 비트율 제어를 수행하기 이전에 완료되어야 한다. 또한, 동영상 비트율 제어를 통해 영상 압축과정 이전에 양자화 파라미터가 계산되어야 한다. 결국, 장면 전환 검출은 영상 압축을 수행하기 이전에 진행되어야하므로, 압축된 영상에서 비유사성척도(DM)를 연산하는 것은 적합하지 않다.Since scene change detection is performed for video bit rate control, it must be completed before performing video bit rate control. In addition, the quantization parameter must be calculated before the image compression process through the video bit rate control. As a result, it is not appropriate to calculate the non-similarity measure (DM) in the compressed image since the scene change detection must be performed before performing the image compression.

한편, 압축되지 않은 영상에서는 프레임의 평균제곱오차(MSE; Mean Square Error)를 이용하여 비유사성 척도(DM)를 측정할 수 있다. 평균제곱오차를 이용하여 비유사성 척도(DM)를 연산하면 프레임의 픽셀을 기반으로 연산을 수행하기 때문에 연산량이 많지는 않지만, 움직임이 많은 영상에서 장면전환을 검출하는 성능이 우수하지 않은 단점이 있다. 이러한 단점을 해소하기 위하여, 프레임의 픽셀 및 히스토그램을 모두 고려하여 비유사성 척도(DM)를 연산하는 방법이 사용된다. 상기한 기존의 방법으로서, mean absolute frame difference(MAFD), MAFD after histogram equalization with normalization(HEN), signed difference MAFD(SDMAFD) after HEN, absolute difference frame variance(ADFV) after HEN의 4가지 비유사성 척도(4DMs)를 모두 사용하는 방법이 시도되었다. 이와 같은 4DMs를 이용한 방법은 장 면전환의 검출 성능은 우수하지만 연산량이 많다. 따라서, 4DMs를 이용한 방법을 통해 실시간으로 프레임의 장면전환을 검출하기는 용이하지 않다.On the other hand, the non-similarity measure (DM) can be measured using the mean square error (MSE) of the frame in the uncompressed image. Since the computation of the non-similarity measure (DM) using the mean squared error is performed based on the pixels of the frame, there is a disadvantage in that the performance for detecting the scene change is not excellent in a motion image having a large amount of computation . In order to solve this disadvantage, a method of calculating the non-similarity measure (DM) is used in consideration of both the pixels of the frame and the histogram. The four methods of dissimilarity measure (MAFD), MAFD after normalization (HEN), signed difference MAFD (HMA), and HEN (absolute difference frame variance) 4DMs) have been tried. Such a method using 4DMs has excellent detection performance of scene change but a large amount of computation. Therefore, it is not easy to detect the scene change of the frame in real time through the method using 4DMs.

본 발명은 전술한 점을 고려하여 안출된 것으로서, 하드웨어 복잡성이 적으며 보다 효율적으로 실시간으로 장면 전환을 검출하기 위한 동영상 부호화 데이터율 제어를 위한 실시간 장면 전환 검출 방법을 제공하는 것에 그 목적이 있다.SUMMARY OF THE INVENTION It is an object of the present invention to provide a real-time scene change detection method for controlling a motion-encoded data rate for detecting scene change more efficiently and in real time with less hardware complexity.

또한, 본 발명은 오류로 인해 생성된 영상을 검출하고, 이를 이용하여 영상의 품질을 향상시킬 수 있는 방법을 제공하는데 또 다른 목적이 있다.It is another object of the present invention to provide a method for detecting an image generated due to an error and improving the quality of the image using the detected image.

상기한 목적을 달성하기 위하여 본 발명에 따른 실시간 장면 전환 검출 방법은 동영상 부호화 데이터율 제어를 위한 실시간 장면 전환 검출 방법에 있어서, 현재 프레임을 복수의 영역으로 분할하고, 각각의 분할된 영역의 비 유사성 척도(DM; dissimilarity metric)를 연산하는 과정과, 상기 각 영역의 비 유사성 척도가 미리 설정된 기준치를 벗어나는지 판단하는 과정과, 현재 프레임 내에서, 비 유사성 척도가 상기 미리 설정된 기준치를 벗어나는 영역의 개수를 확인하는 과정과, 상기 과정에서 미리 설정된 기준치를 벗어나는 영역의 개수를 확인한 결과, 기준치를 벗어나는 영역의 개수가 미리 설정된 개수 이상일 때 현재 프레임에서 장면 전환이 이루어진 것으로 간주하는 과정을 포함한다.According to an aspect of the present invention, there is provided a real-time scene change detection method for real-time scene change detection for controlling a moving picture encoding data rate, the method comprising: dividing a current frame into a plurality of areas, Calculating a dissimilarity metric (DM), determining whether the non-similarity measure of each region is out of a preset reference value, determining whether the non-similarity measure is within a predetermined range, And determining that the scene change has occurred in the current frame when the number of regions out of the reference value is greater than a predetermined number as a result of checking the number of regions that deviate from a preset reference value in the process.

상기 각각의 분할된 영역의 비 유사성 척도(DM)를 연산하는 과정은, 현재 프레임과 재구성된 이전 프레임(기준 프레임)간의 샘플간 오차 정보를 이용하여, 현재 프레임의 PSNR(Peak Signal to Noise Ratio)을 예측하는 과정을 포함할 수 있 다.The process of calculating the dissimilarity measure DM of each of the divided regions may be performed by using the error information between samples of the current frame and the reconstructed previous frame (reference frame) to calculate a Peak Signal to Noise Ratio (PSNR) And a process for predicting the probability of occurrence.

상기 각각의 분할된 영역의 비 유사성 척도(DM)를 연산하는 과정은, 현재 프레임에서 예측된 PSNR(Predicted Peak Signal to Noise Ratio; 이하, PPSNR이라 함)과 장면전환이 발생된 이후 프레임들의 평균 PPSNR과의 비율을 이용하여 각각의 분할된 영역의 비 유사성 척도를 연산하는 것일 수 있다.The process of calculating the dissimilarity measure DM of each of the divided areas may include calculating a Prediction Peak Signal to Noise Ratio (PSNR) (PPSNR) predicted in the current frame and an average PPSNR To calculate the non-similarity measure of each divided area.

나아가, 본 발명의 일 측면에 따른 장면 전환 검출 방법은, 상기 장면 전환이 이루어진 프레임 이후에 입력되는 프레임의 예측 PSNR의 미분 값을 연산하는 과정과, 연산된 결과값을 확인하여, 상기 결과값이 음수값을 지시하는 경우, 장면전환이 종료된 프레임으로 설정하는 과정을 더 포함할 수 있다.Further, a scene change detection method according to an aspect of the present invention includes the steps of: calculating a differential value of a predicted PSNR of a frame input after a scene change frame; And setting a frame to which a scene change has been completed if the value indicates a negative value.

본 발명의 다른 측면에 따른 영상통화 품질 향상 방법은 무선 단말의 영상통화 방법에 있어서, 단말의 입력 동영상 신호의 급격한 변화구간의 시작 프레임과 종료 프레임을 검출하는 과정과, 상기 검출된 영상들에 대해 송신부에서는 부호화를 스킵하는 과정과, 상기 스킵된 프레임들에 대해 수신부에서는 미리 수신된 전 프레임을 복사하여 상기 스킵된 프레임을 대신하여 재생하는 과정을 포함하며, 상기 종료 프레임 검출은 입력 영상과 재구성된 이전 영상 간에 구해지는 예측 PSNR의 미분을 통해 연산한다.According to another aspect of the present invention, there is provided a method for video call quality improvement in a wireless terminal, the method comprising: detecting a start frame and an end frame of an abrupt change period of an input video signal of the terminal; The method comprising the steps of: skipping encoding in a transmitter; and copying all frames received in advance in the receiver for the skipped frames and reproducing the skipped frames in place of the skipped frames, And calculates the differential value of the predicted PSNR obtained between the previous images.

본 발명의 또 다른 측면에 따른 영상통화 시스템은 무선 단말을 이용한 영상통화 시스템에 있어서, 단말의 입력 동영상 신호의 급격한 변화구간의 시작 프레임과 종료 프레임을 검출하는 검출기를 구비하며, 검출된 모든 영상들에 대해 프레임 부호화를 스킵하는 송신부, 및 상기 스킵된 프레임들에 대해 미리 수신된 전 프레 임을 복사하여 대체 재생하는 수신부를 포함하며, 상기 검출기는 입력 영상과 재구성된 이전 영상 간에 구해지는 예측 PSNR의 미분을 통해 연산한다.A video call system according to another aspect of the present invention is a video call system using a wireless terminal. The video call system includes a detector for detecting a start frame and an end frame of an abrupt change period of an input moving picture signal of the terminal, And a receiver for copying and reproducing the entire frames previously received for the skipped frames, wherein the detector calculates a differential of the predicted PSNR obtained between the input video and the reconstructed previous video Lt; / RTI >

상기한 바와 같이, 본 발명에 따른 동영상 부호화 데이터율 제어를 위한 실시간 장면 전환 검출 방식은 하드웨어 복잡성이 적으며 보다 효율적으로 실시간으로 장면 전환을 검출할 수 있다.As described above, the real-time scene change detection method for controlling the motion-encoded data rate according to the present invention has less hardware complexity and can detect scene change more efficiently in real time.

또한, 본 발명에 따른 동영상 코딩 방법 및 시스템에 따르면, 초점 맞지 않는 영상의 비트 자원을 축적하여 이후 입력되는 영상에 할당함으로써 영상품질을 향상시킬 수 있다.In addition, according to the moving picture coding method and system of the present invention, the bit quality of the unfocused image is accumulated and then allocated to the input image, thereby improving the image quality.

이하 본 발명에 따른 바람직한 실시예를 첨부한 도면을 참조하여 상세히 설명한다. 하기 설명에서는 구체적인 구성 소자 등과 같은 특정 사항들이 나타나고 있는데 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐 이러한 특정 사항들이 본 발명의 범위 내에서 소정의 변형이나 혹은 변경이 이루어질 수 있음은 이 기술분야에서 통상의 지식을 가진 자에게는 자명하다 할 것이다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. It will be appreciated that those skilled in the art will readily observe that certain changes in form and detail may be made therein without departing from the spirit and scope of the present invention as defined by the appended claims. To those of ordinary skill in the art.

도 1은 본 발명의 일 실시예에 따른 장면 전환 검출 방법이 적용되는 비디오 인코더 장치의 블록 구성도이다. 도 1을 참조하면, 본 발명의 일 실시예에 따른 장면 전환 검출 방법이 적용되는 비디오 인코더 장치는 비디오 프레임 시퀀스를 입력받으며 출력으로서는 압축된 비디오 데이터를 출력하는 일반적인 H.264/AVC(Advanced Video Coding) 인코더(10)를 구비할 수 있다. 또한 프레임들을 저장하는 프레임 저장 메모리(20)와, 인코더(10)의 데이터 레이트 제어를 위한 양자화 파라미터(QP: Quantization Parameter) 제어 동작을 수행하는 인코더 QP 제어기(30)를 구비한다.1 is a block diagram of a video encoder apparatus to which a scene change detection method according to an embodiment of the present invention is applied. Referring to FIG. 1, a video encoder apparatus to which a scene change detection method according to an exemplary embodiment of the present invention is applied includes a general H.264 / AVC (Advanced Video Coding ) Encoder 10 as shown in FIG. A frame storage memory 20 for storing frames and an encoder QP controller 30 for performing a quantization parameter (QP) control operation for controlling the data rate of the encoder 10.

먼저, 인코더(10)의 구성 및 동작을 보다 상세히 설명하면, 인코더(10)는 주파수 변환기(104), 양자화기(106), 엔트로피 코더(108), 인코더 버퍼(110), 역양자화기(116), 역주파수 변환기(114), 모션추정/보상기(120) 및 필터(112)를 포함한다.The encoder 10 includes a frequency converter 104, a quantizer 106, an entropy coder 108, an encoder buffer 110, an inverse quantizer 116 An inverse frequency transformer 114, a motion estimator / compensator 120, and a filter 112. [

현재 프레임이 인터 프레임(예를 들어 P프레임일 경우)이라면, 모션추정/보상기(120)는 프레임 저장 메모리(20)에 버퍼링되어 있는 이전 프레임의 재구성된 프레임인 기준 프레임에 대한, 현재 프레임내(內) 매크로블록의 모션을 추정하고 보상한다. 프레임은 원 영상의 예를 들어 16x16 픽셀에 대응하는 매크로블록의 단위로 처리된다. 각 매크로블록은 인트라(intra) 또는 인터(inter) 모드로 부호화된다. 모션추정시에는 부가 정보로서 모션 벡터와 같은 모션 정보를 출력하고, 모션보상시에는 모션정보를 재구성된 이전 프레임에 적용하여 모션보상된 현재 프레임을 생성한다. 이와 같이 모션보상된 현재 프레임의 매크로블록(예측 매크로블록)과 원래의 현재 프레임의 매크로블록간의 차이분이 주파수 변환기(104)로 제공된다.If the current frame is an interframe (e. G., A P frame), the motion estimator / compensator 120 determines whether the current frame is a current frame The motion of the macroblock is estimated and compensated. The frame is processed in units of macroblocks corresponding to, for example, 16x16 pixels of the original image. Each macroblock is coded in an intra or inter mode. When motion estimation is performed, motion information such as a motion vector is output as additional information, and motion compensation is applied to the reconstructed previous frame to generate a motion compensated current frame. The difference between the motion compensated current frame's macroblock (predictive macroblock) and the original current frame's macroblock is provided to the frequency converter 104.

주파수 변환기(104)는 공간 도메인의 동영상 정보를 주파수 도메인(예를 들어 스펙트럼) 데이터로 변환한다. 이때 주파수변환기(104)는 통상 이산 코사인 변환(DCT: Discrete Cosine Transform)을 수행하여 매크로블록단위로 DCT 계수 블록을 생성한다.The frequency converter 104 converts the spatial information of the spatial domain into frequency domain (e.g., spectral) data. At this time, the frequency converter 104 typically performs a discrete cosine transform (DCT) to generate a DCT coefficient block on a macroblock-by-macroblock basis.

양자화기(106)는 상기 주파수 변환기(104)에서 출력되는 스펙트럼 데이터 계수의 블록을 양자화한다. 이때 양자화기(106)는 통상 프레임별 기반으로 가변되는 스텝-크기로 스펙트럼 데이터에 일정한 스칼라 양자화를 적용한다. 이러한 양자화기(106)는 데이터 레이트 컨트롤을 위해 프레임별로 양자화 파라미터(QP)의 가변 정보를 인코더 QP 제어기(30)의 QP조정부(34)로부터 제공받게 된다.The quantizer 106 quantizes a block of spectral data coefficients output from the frequency converter 104. At this time, the quantizer 106 applies a constant scalar quantization to the spectral data in a step-size variable on a frame-by-frame basis. The quantizer 106 receives variable quantization parameter (QP) information for each frame from the QP adjuster 34 of the encoder QP controller 30 for data rate control.

엔트로피 코더(108)는 해당 매크로블록의 특정 부가 정보(예를 들어, 모션 정보, 공간 보외법 모드, 양자화 파라미터)를 비롯하여, 양자화기(106)로부터의 출력을 압축한다. 통상적으로 적용되는 엔트로피 코딩 기술은, 산술 코딩, 허프만 코딩, 런 랭스(run-length) 코딩, LZ(Lempel Ziv) 코딩 등이 있다. 엔트로피 코더(108)는 통상 다른 종류의 정보에 다른 코딩 기술을 적용한다.The entropy coder 108 compresses the output from the quantizer 106, including specific additional information (e.g., motion information, spatial extrapolation mode, and quantization parameters) of the macroblock. Typical entropy coding techniques include arithmetic coding, Huffman coding, run-length coding, Lempel Ziv coding, and the like. Entropy coder 108 typically applies different coding techniques to different kinds of information.

엔트로피 코더(108)에서 압축된 동영상 정보는 인코더 버퍼(110)에 버퍼링된다. 인코더 버퍼(110)의 버퍼 레벨 지시자는 데이터 레이트 조절을 위해 인코더 QP 제어기(30)로 제공된다. 인코더 버퍼(110)에 저장된 동영상 정보는 예를 들어 고정된 전송율로 인코더 버퍼(110)로부터 출력 및 삭제된다.The moving picture information compressed by the entropy coder 108 is buffered in the encoder buffer 110. The buffer level indicator of the encoder buffer 110 is provided to the encoder QP controller 30 for data rate adjustment. The moving picture information stored in the encoder buffer 110 is output and erased from the encoder buffer 110 at a fixed transmission rate, for example.

한편, 상기에서 재구성된 현재 프레임이 후속 모션추정/보상에 필요한 경우, 역양자화기(116)는 양자화된 스펙트럼 계수에 대해 역양자화를 수행한다. 역주파수 변환기(114)는 주파수 변환기(104)의 동작을 역으로 수행하여, 역양자화기(116)의 출력으로부터 예를 들어 역DCT 변환을 통해 역차이 매크로블록이 생성된다. 이는 신호 손실 등의 영향으로 원래의 차이 매크로블록과 동일하지 않다.On the other hand, when the reconstructed current frame is required for subsequent motion estimation / compensation, the dequantizer 116 performs inverse quantization on the quantized spectral coefficients. The inverse frequency transformer 114 inversely performs the operation of the frequency transformer 104 to generate inverse difference macroblocks from the output of the inverse quantizer 116 through, for example, inverse DCT transform. This is not the same as the original difference macroblock due to the influence of signal loss and the like.

현재 프레임이 인터 프레임일 경우에는, 재구성된 상기 역차이 매크로블록은 상기 모션추정/보상기(120)의 예측 매크로블록과 합쳐져서 재구성된 매크로블록을 생성하게 된다. 재구성된 매크로블록들은 프레임 저장 메모리(20)에 다음 프레임을 예측하는데 이용하기 위해 기준 프레임으로 저장된다. 이때 상기 재구성된 매크로블록은 원래의 매크로블록의 왜곡된 버전이므로 일부 실시예에서는 디블록킹(deblocking) 필터(112)를 재구성된 프레임에 적용하여, 매크로블록간 불연속성을 원활하게 한다.If the current frame is an interframe, the reconstructed inverse difference macroblock is combined with the predictive macroblock of the motion estimator / compensator 120 to generate a reconstructed macroblock. The reconstructed macroblocks are stored in the frame store memory 20 as a reference frame for use in predicting the next frame. In this case, since the reconstructed macroblock is a distorted version of the original macroblock, in some embodiments, the deblocking filter 112 is applied to the reconstructed frame to smooth discontinuity between macroblocks.

한편, 인코더(10)의 QP를 제어하는 인코더 QP 제어기(30)에는 본 발명의 특징에 따라 프레임 저장 메모리(20)에 저장된 현재 프레임 및 기준 프레임 등을 통해 실시간으로 장면전환을 검출하는 장면전환 검출부(32)를 구비한다. 장면전환 검출부(32)에서 장면 전환을 검출하게 되면, 이에 대한 정보는 QP조정부(34)로 제공되며, QP조정부(34)는 이에 따라 장면 전환 검출시에 양자화기(106)의 양자화 파라미터를 적절히 조정하여 현재 프레임의 장면 전환에 적절히 대응할 수 있도록 한다.The encoder QP controller 30 for controlling the QP of the encoder 10 is provided with a scene change detector 30 for detecting a scene change in real time through a current frame and a reference frame stored in the frame store memory 20 according to a feature of the present invention, (32). When the scene change detection unit 32 detects the scene change, information on the scene change is provided to the QP adjustment unit 34. The QP adjustment unit 34 accordingly adjusts the quantization parameter of the quantizer 106 appropriately So that it can appropriately respond to the scene change of the current frame.

이를 위해, 본 발명에서 상기 장면전환 검출부(32)는 장면 전환을 판단하는 과정에서 연산의 부하가 증가하는 것을 방지하기 위하여, 현재 프레임의 PSNR(Peak Signal to Noise Ratio)을 예측한 값(PPSNR; Predicted PSNR)만을 이용한다. 구체적으로, 장면전환 검출부(32)는 현재 프레임을 도 2와 같이 복수의 영역으로 분할하고, 분할된 각 영역의 PSNR을 예측한다. 그리고, 각 영역의 비 유사성 척도(DM; dissimilarity metric)를 연산하여, 상기 비 유사성 척도(DM)가 미리 정해진 기준값을 벗어나는 지를 각각 확인하고, 프레임 내에서 몇 개의 영역이 미리 정해진 기 준값을 벗어나는 지를 확인한다. 확인된 개수가 미리 정해진 값 이상일 경우에는 현재 프레임에서 장면 전환이 일어난 것으로 간주하게 된다.For this, in order to prevent an increase in the calculation load in the process of determining the scene change, the scene change detector 32 determines a value (PPSNR) of the current frame, which is a predicted PSNR (Peak Signal to Noise Ratio). Predicted PSNR). Specifically, the scene change detection unit 32 divides the current frame into a plurality of areas as shown in FIG. 2, and predicts PSNRs of the divided areas. Then, a DM (dissimilarity metric) of each region is calculated, and it is confirmed whether or not the non-affinity measure DM deviates from a predetermined reference value, and whether several regions within the frame deviate from a predetermined reference value Check. If the determined number is greater than or equal to a predetermined value, it is regarded that a scene change has occurred in the current frame.

본 발명에서는 각 영역의 비 유사성 척도(DM)는 프레임 내의 국소적인 변화를 확인할 수 있도록 현재프레임의 PSNR과 이전 프레임들의 평균 PPSNR의 비를 확인하는 것으로 이루어진다. 이는 하기 수학식 1과 같이 계산되어 질 수 있다.In the present invention, the dissimilarity measure (DM) of each region is made by checking the ratio of the PSNR of the current frame to the average PPSNR of the previous frames so that local changes in the frame can be confirmed. This can be calculated as shown in Equation (1) below.

Figure 112008055511256-pat00001
Figure 112008055511256-pat00001

상기 수학식 1에서 DMx proposed , i에서 x는 분할된 영역의 식별번호를 표시하며, i는 현재 프레임의 프레임 번호를 의미하며, Sj는 j번째 발생한 급장면전환에 대한 해당 영상의 프레임 번호를 의미한다. DMx proposed , i는 현재 프레임 각 영역의 PPSNR과 프레임의 장면전환이 이루어진 시점부터 각 영역들의 평균 PPSNR과의 비율이다. 또한, PPSNRx k ,k-1과 PPSNRx i , i-1은 각각 하기 수학식 2 및 3에 의해 구해질 수 있다.In Equation (1), DM x proposed , where i denotes an identification number of the divided area, i denotes a frame number of the current frame, S j denotes a frame number of the corresponding image for the j- . DM x proposed , i is the ratio of the PPSNR of the current frame to the average PPSNR of each region from when the frame is changed. Also, PPSNR x k , k-1 and PPSNR x i , i-1 can be obtained by the following equations (2) and (3), respectively.

Figure 112008055511256-pat00002
Figure 112008055511256-pat00002

Figure 112008055511256-pat00003
Figure 112008055511256-pat00003

수학식 2 및 3에서 n은 샘플(즉, 픽셀)당 갖는 비트수를 나타내는 것으로서, 일반적으로 n은 8로 설정될 수 있다. 상기 PMSE는 현재 프레임의 예측된 MSE(Mean Square Error)로서, 하기 수학식 4 및 5의 연산에 의해 획득될 수 있다.In Equations (2) and (3), n represents the number of bits per sample (i.e., pixel), and generally n can be set to 8. The PMSE is a predicted MSE (Mean Square Error) of the current frame, and can be obtained by the following equations (4) and (5).

Figure 112008055511256-pat00004
Figure 112008055511256-pat00004

Figure 112008055511256-pat00005
Figure 112008055511256-pat00005

상기 수학식 4, 5에서 Ok mn 및 Oi mn는 각각 k번째와 i번째 프레임(즉 현재 프레임)의 m열 n행 번째 오리지널(original) 샘플을 나타낸다. 한 프레임은 M[m] x N[n] 픽셀로 구성된다. 상기 수학식 4, 5에서 Oi mn는 i번째 프레임(즉 현재 프레임)의 m열 n행 번째 오리지널(original) 샘플을 나타내고 Rj mn는 j번째 프레임(즉 이전 프레임)의 m열 n행 번째 재구성된(reconstructed) 기준 샘플을 나타낸다. 한 프레 임은 M[m] x N[n] 픽셀로 구성된다.In Equations (4) and (5), O k mn and O i mn represent original samples of the mth column and the nth row of the kth and ith frames (i.e., the current frame), respectively. One frame consists of M [m] x N [n] pixels. In Equations (4) and (5), O i mn denotes an original sample in the mth row and nth row of the i-th frame (i.e., the current frame) and R j mn denotes an m- Represents a reconstructed reference sample. A frame consists of M [m] x N [n] pixels.

본 발명에서 현재 프레임의 장면 전환 여부는 프레임을 이루는 복수의 영역 중, 미리 정해진 임계치 이내의 비 유사성 척도(DMx proposed , i)를 갖는 영역이 몇 개인지를 확인하여 결정된다.In the present invention, whether or not the current frame is switched is determined by checking how many areas having a non-similarity measure (DM x proposed , i ) within a predetermined threshold among a plurality of areas constituting a frame.

미리 정해진 임계치 이내의 비 유사성 척도(DMx proposed , i)를 갖는 영역은 하기의 수학식 6에 의해 연산되며, 장면 전환 여부는 수학식 7의 연산을 통해 결정될 수 있다.An area having a non-similarity measure (DM x proposed , i ) within a predetermined threshold value is calculated by the following Equation (6), and the scene change can be determined through an operation of Equation (7).

Figure 112008055511256-pat00006
Figure 112008055511256-pat00006

Figure 112008055511256-pat00007
Figure 112008055511256-pat00007

수학식 6에서 β는 각 영역의 비 유사성 척도(DMx proposed , i)를 정의하는 임계치이다. 그리고, 수학식 7에서 α는 프레임의 장면전환 여부를 결정하기 위한 비율을 정의한 임계치이고, Nf는 프레임 내에 분할된 영역의 수를 나타낸다.In Equation (6) ,? Is a threshold defining the non-similarity measure (DM x proposed , i ) of each region. Further, in Equation 7 α is defined by the ratio to determine whether the scene change threshold, the frame, N f is the number of the divided regions in the frame.

예컨대, Nf를 12개로 정의하고, α값을 0.75로 정의하고, β값을 0.7로 정의 한다. 이때, 비 유사성 척도(DMx proposed , i)가 0.7 미만인 분할 영역의 개수가 9이상이면, 현재 프레임을 급장면전환된 프레임으로 판단한다. 나아가, α 및 β는 실험치에 의해 결정된 값일 수 있다.For example, N f is defined as 12, an alpha value is defined as 0.75, and a beta value is defined as 0.7. At this time, if the number of divided regions having a non-similarity measure (DM x proposed , i ) of less than 0.7 is 9 or more, the current frame is judged as a class-switched frame. Further,? And? May be values determined by an experimental value.

도 3은 본 발명의 일 실시예에 따른 실시간 장면 검출 동작의 흐름도로서, 도 1에 도시된 바와 같은 장면전환 검출부(32)에서 수행될 수 있는 동작이다. 도 3을 참조하면, 먼저, 302단계를 통해 영상 프레임을 입력받는다. 다음으로 입력받은 영상프레임은 304단계를 통해 Nf개의 복수의 영역으로 분할된다. 그리고, 수학식 1 내지 수학식 5를 연산하여 분할된 각 영역의 비 유사성 척도(DMx proposed , i)를 연산하게 된다(306단계). 308단계는 수학식 6을 이용하여 연산된 비 유사성 척도(DMx proposed , i)와 미리 정해진 임계치인 β값을 비교하여 각 영역의 Cx를 연산한다. 예컨대, β값이 0.7로 설정되었을 경우, 연산된 비 유사성 척도(DMx proposed , i)가 상기 β값 0.7보다 상대적으로 작을 경우 상기 Cx를 1로 결정하고, 비 유사성 척도(DMx proposed , i)가 상기 β값 0.7보다 상대적으로 크거나 같으면 상기 Cx를 0으로 결정한다. 308단계를 진행한 후, 상기 x값과 Nf값을 확인하여 프레임에 포함된 전체 영역의 Cx가 모두 연산 되었는지를 확인한다(310단계). 예컨대, 도 2와 같이 프레임 이 12개의 영역으로 분할되었음을 가정하면(즉, Nf=12로 설정되면), 12개의 영역 중, 최초로 비 유사성 척도(DMx proposed , i) 등이 연산되는 영역의 x값은 0으로 설정될 수 있으며, 최종적으로 비 유사성 척도(DMx proposed , i) 등이 연산되는 영역의 x값은 Nf-1인 11로 설정될 수 있다. 따라서, 310단계는 x값이 Nf-1값과 동일한 값인지를 확인하는 것일 수 있다. 310단계의 확인결과, 프레임에 포함된 전체 영역의 Cx값의 연산이 완료되지 않았을 경우(310-아니오), 311단계를 수행하여 x값을 업데이트 한다. 그리고, 프레임에 포함된 전체 영역의 비 유사성 척도(DMx proposed , i) 및 Cx값이 모두 연산될 때까지 306, 308, 310, 및 311단계를 반복적으로 수행한다. 한편, 310단계의 확인결과, 프레임에 포함된 전체 영역의 Cx값의 연산이 완료되었으면(310-예), 312단계를 수행한다. 312단계는 수학식 7을 이용하여 308단계에서 연산된 각 영역의 Cx값을 모두 합산한다. 다음으로, 314단계는 합산된 값과 미리 정해진 임계치를 비교하여 현재 프레임이 급 장면전환이 이루어진 프레임인지를 판단한다. 예컨대, 304단계에서 프레임이 12개의 영역으로 분할되었고 α값이 0.75로 설정되었을 경우, 각 영역의 Cx값을 모두 합산한 결과값이 9이상이면 현재 프레임을 급 장면전환이 이루어진 것으로 간주한다. 314단계를 통해 현재 프레임이 급 장면전환이 이루어진 것으로 판단되면(314-예), 316단계를 통해 장면 전환 검출 신호 등을 발 생시키고, 318단계를 통해 비 유사성 척도(DMx proposed , i)의 연산에 사용되는 Sj값을 갱신한다. 이와 같이 발생된 장면 전환 검출 신호는 이후 QP조정부(34)로 제공될 수 있으며, QP조정부(34)는 이에 따라 장면 전환 검출시에 양자화기(106)의 양자화 파라미터를 적절히 조정하게 된다. 한편, 314단계를 통해 현재 프레임이 급 장면전환이 이루어지지 않은 것으로 판단되면(314-아니오), 320단계를 수행한다. 320단계는 입력된 프레임이 영상의 마지막 프레임인지를 확인하는 단계이다. 320단계의 확인결과, 입력된 프레임이 영상의 마지막 프레임일 경우(320-예) 프레임의 장면전환 여부의 확인을 종료하고, 프레임이 계속적으로 입력될 경우(320-아니오) 프레임의 입력이 종료될 때까지 전술한 302단계 내지 318단계를 반복하여 수행하게 된다.3 is a flowchart of a real-time scene detection operation according to an embodiment of the present invention, which is an operation that can be performed in the scene change detection unit 32 as shown in FIG. Referring to FIG. 3, first, an image frame is received through step 302. Next, the input image frame is divided into N f number of regions through step 304. Then, the non-similarity measure (DM x proposed , i ) of each divided region is calculated by calculating Equations (1) to (5) (Step 306). Step 308 compares the non-similarity measure (DM x proposed , i ) calculated using Equation (6) with a predetermined threshold value, and calculates C x of each region. For example, when the β value is set to 0.7, the calculated dissimilarity measure (DM x proposed, i) if relatively small than that of the β value of 0.7 and determining the C x 1, the dissimilarity measure (DM x proposed, i) β is the value greater than or equal to 0.7 relative to determine the C x to zero. And then proceed to step 308, determine the value of x and the value N f to see the C x that all operations of the whole area included in the frame (step 310). For example, assuming that a frame is divided into twelve regions as shown in FIG. 2 (that is, when N f = 12 is set), among the twelve regions, the region where the non-similarity measure (DM x proposed , i ) The x value can be set to 0, and finally the x value of the area where the non-similarity measure (DM x proposed , i ) is calculated can be set to 11, N f -1. Accordingly, step 310 may be to determine whether the x value is equal to the N f -1 value. As a result of checking in step 310, if the calculation of the C x value of the entire area included in the frame is not completed (No in step 310), step 311 is performed to update the x value. Then, 306, 308, 310, and 311 are repeatedly performed until all of the non-similarity measures (DM x proposed , i ) and C x values of the entire region included in the frame are calculated. On the other hand, if in step 310 a result of the check, the operation of the C x value of the whole region included in the frame is complete (310- Yes), it performs step 312. Step 312 sums all of the C x value of each region calculated in step 308 using equation (7). Next, in step 314, the summed value is compared with a predetermined threshold, and it is determined whether the current frame is a frame in which the scene change is performed. For example, in the case was 2-304 stage frame divided into 12 areas is the α value is set to 0.75, is considered for each region of the current frame if the result value obtained by summing all of the C x value is greater than or equal to level 9 transition is to be made. If it is determined in step 314 that the current frame is level shifted (step 314), a scene change detection signal or the like is generated in step 316, and a non-similarity measure (DM x proposed , i ) And updates the S j value used in the operation. The scene change detection signal generated as described above may be provided to the QP adjusting unit 34. The QP adjusting unit 34 accordingly adjusts the quantization parameter of the quantizer 106 at the time of scene change detection. On the other hand, if it is determined in step 314 that the current frame is not level shifted (No in step 314), step 320 is performed. Step 320 is a step of confirming whether the input frame is the last frame of the image. If it is determined that the inputted frame is the last frame of the image (320-YES), the confirmation of whether or not the frame is changed is terminated. If the input of the frame is continued (320-No) The above steps 302 to 318 are repeatedly performed.

이하, 실험을 통해 본 발명에 따른 장면 전환 검출 방식의 유효성을 알아본다. 우선, 실험을 위해 움직임이 빠르고 조명 빛등 급장면전환 검출을 어렵게 하는 임의의 테스트 영상 2개를 선택하였다. 선택된 영상은 하기의 표 1과 같다. 테스트 시퀀스 영상의 명칭은 각각 'Worldcup', 'FF-X2'으로 설정된다. 테스트 시퀀스 영상은 각각 6,843개와 7,138개의 프레임으로 이루어지며, 13개와 159개의 급장면전환 프레임으로 구성되었다.Hereinafter, the effectiveness of the scene change detection method according to the present invention will be examined through experiments. First, we selected two arbitrary test images that were fast for the experiment and made it difficult to detect light-shaded scene transitions. Selected images are shown in Table 1 below. The names of the test sequence images are set to 'Worldcup' and 'FF-X2', respectively. The test sequence images consist of 6,843 frames and 7,138 frames, respectively, and consist of 13 and 159 class transition frames.

SequenceSequence Sequence commentSequence comment 프레임 수Number of frames 급 장면전환 개수Number of grade transitions WorldcupWorldcup Sports highlightSports highlight 6,8436,843 1313 FF-X2FF-X2 Animation highlightAnimation highlight 7,1387,138 159159

전술한 2개의 테스트 시퀀스 영상을 이용하여 종래기술에 따른 MSE DM, 4DMs, 본 발명의 출원인에 의해 기 출원된 대한민국 특허출원 10-2006-0075856호에 기재된 방법(이하, '856 특허에 기재된 방법), 및 본 발명에서 제안하는 방법에 따라 각각 장면전환을 검출하도록 하고, 장면전환 검출과정에서 발생되는 오류를 확인하여 하기의 표 2에 기재하였다. 표 2에서 'FALSE의 수'는 실제 장면전환이 일어나지 않았음에도 불구하고 장면전환으로 검출한 개수를 나타내고, 'MISS의 수'는 실제 장면전환이 일어났음에도 불구하고 장면전환을 검출하지 못한 수를 나타낸다. 또한, 각 방법별로 DPFalseMiss(%)를 연산하여 기재하였다. DPFalseMiss(%)는 영상에 포함된 장면전환개수에 대한 FALSE 및 MISS를 합한 것의 비율을 나타내는 것으로써, 하기의 수학식 8을 연산한 결과이다.The method described in Korean Patent Application No. 10-2006-0075856 (hereinafter referred to as the '856 patent) filed by the applicant of the present invention uses MSE DM, 4DMs according to the prior art using the above two test sequence images, , And the method proposed in the present invention, and the errors generated in the scene change detection process are confirmed and described in Table 2 below. In Table 2, 'number of FALSE' indicates the number detected by scene change even though no actual scene change occurred, and 'number of MISS' indicates the number of times that scene change was not detected even though actual scene change occurred . In addition, DP FalseMiss (%) was calculated and reported for each method. DP FalseMiss (%) represents the ratio of FALSE and MISS to the number of scene transitions included in the image, and is a result of the following expression (8).

Figure 112008055511256-pat00008
Figure 112008055511256-pat00008

SequenceSequence ASC detect algorithsASC detect algorithms FALSE의 수Number of FALSE MISS의 수Number of MISS DPFalseMiss(%)DP FalseMiss (%) WorldcupWorldcup MSE DMMSE DM 22 22 30.830.8 4DMs4DMs 00 1One 7.77.7 '856특허에 기재된 방법The method described in the '856 patent 33 33 46.246.2 본 발명에 기재된 방법The method described in the present invention 00 1One 7.77.7 FF-X2FF-X2 MSE DMMSE DM 9797 6060 98.798.7 4DMs4DMs 1111 5050 38.438.4 '856특허에 기재된 방법The method described in the '856 patent 5252 5959 69.869.8 본 발명에 기재된 방법The method described in the present invention 3131 4848 49.749.7

표 2를 참조하면, 본 발명에 따른 방법을 이용하여 장면전환을 검출하면, MSD DM보다 상대적으로 약 36.1%정도 검출 성능이 우수하고, 4DMs보다 상대적으로 약 5.7%정도 검출 성능이 낮음을 알 수 있다.Referring to Table 2, when the scene change is detected using the method according to the present invention, the detection performance is relatively higher by about 36.1% than the MSD DM and about 5.7% by about 4% have.

또한, 전술한 방법들을 수행하는데 요구되는 연산부하를 개인용 컴퓨터를 통해 확인하였으며 그 결과를 도 4의 그래프를 통해 도시하였다.In addition, the computational load required to perform the above-described methods is confirmed through a personal computer, and the results are shown in the graph of FIG.

실험에 사용된 개인용 컴퓨터는 Microsoftⓡ Windowsⓡ XP를 운영체제(OS; Operating System)로 탑재하고, Intelⓡ VTune™ Performance Analyzer 8.0 프로그램을 수록한 저장매체를 포함한다. 실험은 상기 개인용 컴퓨터 내의 운영체제의 타이머(operating system timer)를 활용하는 시간기준모드(time-based mode)로 세팅하였으며 기준시간간격(sampling interval)은 1㎳로 설정하였다. 실험의 신뢰성을 높이기 위해 상기한 조건을 구비한 서로 다른 3대의 컴퓨터를 사용하여 측정하였고, 3대의 컴퓨터를 통해 측정된 값을 평균화하였다. 도 4는 3대의 컴퓨터에서 얻은 시간 샘플(timer samples)들을 모두 합치고, 알고리즘 간의 연산부하 측면에서의 측정된 결과를 도시한다. 본 발명에서 제안한 알고리즘은 연산부하 측면에서, 'MSE DM' 알고리즘보다는 34.8% 개선되었으며 '4 DMs' 알고리즘보다는 무려 93.1% 개선되었다. 이는 도 4에 나와 있듯이 H.264 frame layer rate control 의 computational load를 감안할 때 중요한 의미를 갖는다. 결국 본 발명은 H.264 동영상 부호화시 급장면전환에 대한 적절한 비트율 제어에 적용할 수 있는 급장면전환 검출 알고리즘일 수 있다. 또한, 본 발명은 기존 알고리즘 대비 검출 성능 및 연산부하를 고려한 가장 적합한 알고리즘일 수 있다.The personal computer used in the experiment includes Microsoft® Windows® XP as the operating system (OS) and storage media containing Intel VTune ™ Performance Analyzer 8.0 program. The experiment was set to a time-based mode using an operating system timer of the operating system in the personal computer, and the sampling interval was set to 1 ms. In order to increase the reliability of the experiment, three different computers having the above conditions were used and the measured values were averaged using three computers. Figure 4 shows the measured results in terms of the computational load between the algorithms, summing all the timer samples obtained from the three computers. The algorithm proposed by the present invention is improved by 34.8% in comparison with the 'MSE DM' algorithm in terms of the computational load, and is improved by 93.1% over the '4 DMs' algorithm. This is important when considering the computational load of H.264 frame layer rate control as shown in FIG. As a result, the present invention can be applied to an adaptive bit rate control algorithm suitable for class transition in H.264 video coding. In addition, the present invention may be the most suitable algorithm considering the detection performance and computation load as compared with the existing algorithm.

이러한, 본 발명의 일 실시예에 따른 장면 전환 검출 방법은 무선 단말의 영상 통화 방법에 적용될 수 있다. 즉, 영상 통화를 위해 생성되는 영상 중, 장면 전환이 발생된 프레임에 대해서는, 본 발명의 일 실시예에 따른 장면 전환 검출 방법을 적용하여 양자화 파라미터를 적절히 조절하고, 부호화하여 전송할 수 있다.The scene change detection method according to an embodiment of the present invention can be applied to a video call method of a wireless terminal. That is, among the images generated for the video call, the scene change detection method according to an embodiment of the present invention can be appropriately adjusted, encoded, and transmitted with respect to a frame in which scene change has occurred.

한편, 모바일 기기의 물리적인 렌즈 제한과 더불어, 모바일 기기의 급작스런 움직임은 초점 맞지 않는 영상을 생성하게 된다. 그리고, 이러한 초점이 맞지 않는 영상은, 시공간적인 상관성이 적으므로, 부호화시 많은 비트 자원을 소모하게 된다. 비트 자원의 일시적인 많은 소모는 급작스런 움직임 이후 제대로 생성된 영상에까지 영향을 미쳐 전체적으로 영상품질을 떨어뜨리는 원인이 된다. 즉, 초점 맞지 않아 보기 힘든 영상을 필요 이상의 비트를 할당하여 추후 제대로 된 영상마저 영향을 미치므로 이를 개선할 필요성이 있다.On the other hand, along with the physical lens limitation of the mobile device, sudden movement of the mobile device produces an unfocused image. Such an unfocused image consumes a lot of bit resources at the time of coding because there is little spatio temporal correlation. Temporarily consuming a large amount of bit resources can affect the quality of the generated image after a sudden move, which causes the overall image quality to deteriorate. That is, there is a need to improve the quality of images that are not in focus because they allocate more than necessary bits to images that are difficult to view, so that they can be used later.

따라서, 본 발명의 다른 실시예에 따른 영상 장면 전환 검출 방법은 초점 맞지 않는 영상에 포함된 프레임들을 검출할 수 있는 방법을 제안한다. 구체적으로, 본 발명의 다른 실시예에 따른 영상 장면 전환 검출 방법은 초점이 맞지 않는 영상으로 인해 장면 전환이 시작되는 프레임(이하, 시작 프레임이라 함.) 및 초점이 맞지 않는 영상이 종료되는 프레임(이하, 종료 프레임이라 함.)을 검출한다.Accordingly, a method of detecting a scene change according to another embodiment of the present invention proposes a method of detecting frames included in an unfocused image. Specifically, the method for detecting a scene change according to another embodiment of the present invention includes detecting a start frame (hereinafter referred to as a start frame) and a frame ending an unfocused image (Hereinafter referred to as the end frame).

도 5는 본 발명의 다른 실시예에 따른 장면 전환 검출 방법이 적용되는 동영상 인코더 장치의 블록 구성도이다. 도 5를 참조하면, 본 발명의 다른 실시예에 따른 장면 전환 검출 방법이 적용되는 동영상 인코더 장치는, 본 발명의 일 실시예에 따른 장면 전환 검출 방법이 적용되는 동영상 인코더 장치와 동일하다. 다만, 장면전환 검출부(32)의 세부 구성이 다르다. 따라서, 본 발명의 다른 실시예의 동영상 인코더 장치에서, 일 실시예의 동영상 인코더 장치와 동일한 구성요소에 대해서는, 동일한 도면 번호를 부여한다. 그리고, 일 실시예의 동영상 인코더 장치와 동일한 구성요소에 대한 상세한 설명은, 본 발명의 일 실시예에 상세히 개시되어 있으므로 생략한다.5 is a block diagram of a moving picture encoder apparatus to which a scene change detection method according to another embodiment of the present invention is applied. Referring to FIG. 5, the moving picture encoder apparatus to which the scene change detection method according to another embodiment of the present invention is applied is the same as the moving picture encoder apparatus to which the scene change detection method according to an embodiment of the present invention is applied. However, the detailed configuration of the scene change detection unit 32 is different. Therefore, in the moving picture encoder apparatus of another embodiment of the present invention, the same reference numerals are given to the same constituent elements as those of the moving picture encoder apparatus of one embodiment. A detailed description of the same components as those of the moving picture encoder apparatus of one embodiment will be omitted because it is disclosed in detail in one embodiment of the present invention.

한편, 본 발명의 다른 실시예가 적용되는 동영상 인코더 장치에서, 인코더(10)를 제어하는 인코더 제어기(40)에는 본 발명의 특징에 따라 프레임 저장 메모리(20)에 저장된 현재 프레임 및 기준 프레임 등을 통해 실시간으로 매우 빠른 장면을 검출하는 장면전환 검출부(42)를 구비한다. 장면전환 검출부(42)에는 유사 장면의 시작프레임을 검출하는 시작프레임 검출부(422)와 유사 장면의 종료 프레임을 검출하는 종료 프레임 검출부(424), 스킵할 프레임을 판단하는 프레임 스킵 판단부(426)를 구비한다.In the moving picture encoder apparatus according to another embodiment of the present invention, the encoder controller 40 for controlling the encoder 10 is provided with a current frame and a reference frame stored in the frame storage memory 20 according to a feature of the present invention And a scene change detector 42 for detecting a very fast scene in real time. The scene change detection unit 42 includes a start frame detection unit 422 for detecting a start frame of a similar scene, an end frame detection unit 424 for detecting an end frame of a similar scene, a frame skip determination unit 426 for determining a frame to be skipped, Respectively.

장면전환 검출부(42)에서 장면 전환을 검출하게 되면, 이에 대한 정보는 QP조정부(44)로 제공되며, QP조정부(44)는 이에 따라 장면 전환 검출시에 양자화기(106)의 양자화 파라미터를 적절히 조정하여 현재 프레임의 장면 전환에 적절히 대응할 수 있도록 한다.When the scene change detection unit 42 detects the scene change, information on the scene change is provided to the QP adjustment unit 44. The QP adjustment unit 44 accordingly adjusts the quantization parameters of the quantizer 106 appropriately So that it can appropriately respond to the scene change of the current frame.

상기 시작프레임 검출부(422)는 이전 저장된 기준 프레임(reference frame)과 입력되는 현재 프레임의 PSNR(Peak Signal to Noise Ratio)을 예측하여 장면 전환을 판단하게 된다. 즉 상기 예측된 PSNR이 미리 설정된 기준치를 벗어날 경우에는 현재 프레임에서 장면 전환이 일어난 것으로 간주하게 된다.The start frame detector 422 predicts a Peak Signal to Noise Ratio (PSNR) of a reference frame and an input current frame to determine a scene change. That is, when the predicted PSNR deviates from a preset reference value, it is considered that the scene change has occurred in the current frame.

나아가, 상기 시작프레임 검출부(422),는 본 발명의 일 실시예에서의 장면전환 검출부(32)와 동일한 동작을 통해 시작 프레임을 검출하는 것도 가능하다.Furthermore, the start frame detecting unit 422 may detect the start frame through the same operation as the scene change detecting unit 32 in the embodiment of the present invention.

상기 종료 프레임 검출부(322)는 이전 저장된 기준 프레임(reference frame)과 입력되는 현재 프레임의 PSNR(Peak Signal to Noise Ratio)을 예측한 파라미터의 미분값을 이용하여 종료프레임을 검출한다. 예컨대, 상기 종료 프레임 검출부(322)는 하기 수학식 9를 연산하여, 종료프레임을 검출한다.The end frame detector 322 detects the end frame using a differential value of a parameter that predicts a reference frame and a predicted PSNR (Peak Signal to Noise Ratio) of the current frame. For example, the end frame detector 322 calculates the following equation (9) to detect the end frame.

즉, 영상의 움직임 관점에서 볼 때 음수 Diff AvgPartialPPSNR 는 현재 프레임의 움직임이 이전 프레임의 움직임 대비 줄었음을 의미한다. 이이 기초하여, 상기 종료 프레임 검출부(424)는, 상기 시작프레임 검출부(422)에서 매우 빠른 영상(즉, 초점이 맞지 않는 영상)이 검출된 이후, 처음으로 Diff AvgPartialPPSNR 값이 음수로 되는 프레임을 종료 프레임으로 결정한다. That is, the negative Diff AvgPartialPPSNR from the viewpoint of the motion of the image means that the motion of the current frame is smaller than the motion of the previous frame. On the basis of this, the end frame detector 424 detects a very fast image (i.e., an out-of-focus image) in the start frame detector 422, and then ends the frame in which the Diff AvgPartialPPSNR value becomes negative for the first time Frame.

Figure 112008055511256-pat00009
Figure 112008055511256-pat00009

상기 수학식 9에서 PPSNR 은 저장된 기준 프레임(reference frame)과 입력되는 현재 프레임의 PSNR을 예측한 파라미터로서, 본 발명의 일 실시예에서의 수학식 3과 같이 연산될 수 있다. N f 는 프레임이 분할된 블록의 수를 지시한다.In Equation (9), PPSNR is a parameter that predicts a stored reference frame and a PSNR of an input current frame, and can be calculated as Equation (3) in an embodiment of the present invention. N f indicates the number of blocks into which the frame is divided.

한편, 스킵 판단부(426)는 상기 시작프레임 검출부(422)와 종료 프레임 검출부(424)의 정보로부터, 생략할 프레임을 결정한다. 생략할 프레임으로 결정되면, 해당 프레임의 압축된 데이터는 전송되지 않고, 해당 프레임이 생략되었음을 지시하는 정보만 엔트로피 코더(108)에 전달된다.On the other hand, the skip determiner 426 determines a frame to be skipped from the information of the start frame detector 422 and the end frame detector 424. If the frame to be omitted is determined, the compressed data of the frame is not transmitted, and only the information indicating that the frame is omitted is transmitted to the entropy coder 108.

상기 QP 조정부(34)는 종료 프레임 검출부(424)로부터 매우 빠른 영상(즉, 초점이 맞지 않는 영상)의 종료 프레임에 대한 정보를 수신한다. 그리고, 상기 QP 조정부(34)는, 매우 빠른 영상(즉, 초점이 맞지 않는 영상)이 종료된 후에 입력되는 프레임에 대해서는, 영상의 복잡도에 따라 양자화 파라미터(quantization parameter)를 적용하는 데이터율 제어를 수행한다.The QP adjuster 34 receives information on the end frame of the very fast video (i.e., out of focus) from the end frame detector 424. The QP adjusting unit 34 performs a data rate control for applying a quantization parameter according to the complexity of an image to a frame input after a very fast image (that is, an out of focus image) ends .

나아가, 본 발명의 다른 실시예에 따른 장면 전환 검출 방법은 무선 단말의 영상 통화 방법에 적용될 수 있다. 즉, 본 발명의 다른 실시예에 따른 장면 전환 검출 방법을 이용하여, 매우 빠른 영상(예컨대, 초점이 맞지 않는 영상)을 검출하고, 이에 해당되는 프레임을 스킵하여 전송하는 것이 가능하다. 또한,수신단에서는 스킵된 영상 대신 이전의 프레임으로 복원할 수 있다.Furthermore, the scene change detection method according to another embodiment of the present invention can be applied to a video call method of a wireless terminal. That is, it is possible to detect a very fast image (for example, an out-of-focus image) using the scene change detection method according to another embodiment of the present invention, skip the corresponding frame and transmit it. In addition, the receiving end can restore the previous frame instead of the skipped image.

구체적으로, 무선 단말의 영상 통화 방법은 영상 전송장치 및 영상 수신장치를 구비한 무선 단말에 의해 수행될 수 있다.Specifically, a video call method of a wireless terminal can be performed by a wireless terminal having a video transmission apparatus and a video receiving apparatus.

무선 단말에 구비된 영상 전송장치는 영상 통화가 진행되는 동안, 영상통화를 위해 마련된 카메라로부터 촬영되는 영상을 부호화하여 영상 수신장치로 전송한다. 이때, 영상 전송장치는 상기 카메라로부터 촬영되는 영상 중, 매우 빠른 영상(예컨대, 초점이 맞지 않는 영상)이 시작되는 프레임을 검출하고, 상기 매우 빠른 영상이 종료되는 프레임을 검출한다. 특히, 영상 전송장치는 매우 빠른 영상(예컨대, 초점이 맞지 않는 영상)이 시작되는 프레임을 본 발명의 일 실시예에 따른 장면 전환 검출 방법에 개시된 방법으로 검출할 수 있으며, 상기 매우 빠른 영상이 종료되는 프레임을 PPSNR의 미분 연산을 통해 검출할 수 있다. 나아가, 상기 영상 전송장치는 매우 빠른 영상(예컨대, 초점이 맞지 않는 영상)이 시작되는 프레임과 종료되는 프레임 사이에 존재하는 프레임에 대해서는, 프레임의 스킵을 지시하는 신호를 삽입하여 부호화를 수행하여 수신단으로 전송한다.An image transmission apparatus provided in a wireless terminal encodes an image photographed by a camera provided for a video call during a video call and transmits the encoded image to a video receiving apparatus. At this time, the image transmission apparatus detects a frame in which a very fast image (for example, an out of focus image) starts, and detects a frame in which the very fast image ends, out of images photographed by the camera. In particular, the image transmission device can detect a frame in which a very fast image (e.g., out of focus) starts, in a manner disclosed in a scene change detection method according to an embodiment of the present invention, Can be detected by differential calculation of PPSNR. Further, the image transmission apparatus performs coding by inserting a signal indicating skipping of a frame, which exists between a frame in which a very fast image (for example, a non-focused image) starts and a frame in which it ends, Lt; / RTI >

한편, 영상 수신장치는 부호화되어 영상 데이터를 복원하고, 복원된 상기 영상을 디스플레이 장치를 통해 재생한다. 영상 수신장치는 부호화 과정에서 삽입된 프레임 스킵을 지시하는 신호를 확인할 수 있으며, 이에 따라 상기 스킵된 프레임과 시각적(time)으로 바로 이전에 존재하는 프레임을 복사하여, 스킵된 프레임을 대체하여 영상을 복원하게 된다.On the other hand, the video receiving apparatus recovers video data and reproduces the restored video through a display device. The video receiving apparatus can confirm a signal indicating an inserted frame skip in the encoding process, thereby copying a frame that exists immediately before the skipped frame and a skipped frame, replacing the skipped frame, .

본 발명에 따른 방법은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 디스크 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것을 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드로 저장되고 실행될 수 있다.The method according to the present invention can be implemented as computer readable code on a computer readable recording medium. A computer-readable recording medium includes all kinds of recording apparatuses in which data that can be read by a computer system is stored. Examples of the computer-readable recording medium include a ROM, a RAM, a CD-ROM, a magnetic tape, a floppy disk, an optical disk and the like, and also a carrier wave (for example, transmission via the Internet) do. The computer-readable recording medium may also be distributed over a networked computer system and stored and executed in computer readable code in a distributed manner.

상기와 같이 본 발명의 일 실시예에 따른 동영상 부호화 데이터율 제어를 위한 실시간 장면 전환 검출 동작이 이루어질 수 있으며, 한편 상기한 본 발명의 설명에서는 구체적인 실시예에 관해 설명하였으나 여러 가지 변형이 본 발명의 범위를 벗어나지 않고 실시될 수 있다.As described above, the real-time scene change detection operation for controlling the coding rate of the moving image according to the embodiment of the present invention can be performed. While the present invention has been described with respect to the specific embodiments, Can be carried out without departing from the scope.

도 1은 본 발명의 일 실시예에 따른 장면 전환 검출 방법이 적용되는 동영상 인코더 장치의 블록 구성도,FIG. 1 is a block diagram of a moving picture encoder apparatus to which a scene change detection method according to an embodiment of the present invention is applied.

도 2는 본 발명의 일 실시예에 따라 복수의 영역으로 분할된 프레임의 일 예시도,Figure 2 is an example of a frame divided into a plurality of regions according to an embodiment of the present invention,

도 3은 본 발명의 일 실시예에 따른 실시간 장면 검출 동작의 흐름도,3 is a flowchart of a real-time scene detection operation according to an embodiment of the present invention,

도 4는 본 발명의 일 실시예에 따른 실시간 장면 검출 동작의 테스트 결과를 나타낸 그래프,4 is a graph showing test results of a real-time scene detection operation according to an embodiment of the present invention,

도 5는 본 발명의 다른 실시예에 따른 장면 전환 검출 방법이 적용되는 동영상 인코더 장치의 블록 구성도.5 is a block diagram of a moving picture encoder apparatus to which a scene change detection method according to another embodiment of the present invention is applied.

Claims (10)

동영상 부호화 데이터율 제어를 위한 실시간 장면 전환 검출 방법에 있어서,A real-time scene change detection method for controlling a coded video data rate, 현재 프레임을 복수의 영역으로 분할하고, 각각의 분할된 영역의 비 유사성 척도(DM; dissimilarity metric)를 연산하는 과정과,Dividing a current frame into a plurality of regions and computing a dissimilarity metric (DM) of each of the divided regions; 상기 각 영역의 비 유사성 척도가 미리 설정된 기준치를 벗어나는지 판단하는 과정과,Determining whether the non-similarity measure of each of the regions is out of a preset reference value; 현재 프레임 내에서, 비 유사성 척도가 상기 미리 설정된 기준치를 벗어나는 영역의 개수를 확인하는 과정과,Confirming the number of regions within the current frame where the non-similarity measure deviates from the preset reference value; 상기 과정에서 미리 설정된 기준치를 벗어나는 영역의 개수를 확인한 결과, 기준치를 벗어나는 영역의 개수가 미리 설정된 개수 이상일 경우에 현재 프레임에서 장면 전환이 이루어진 것으로 간주하는 과정을 포함함을 특징으로 하는 실시간 장면 전환 검출 방법.And determining that a scene change has occurred in the current frame when the number of regions out of the reference value is greater than a predetermined number as a result of checking the number of regions that deviate from a preset reference value in the process, Way. 제1항에 있어서, 상기 각각의 분할된 영역의 비 유사성 척도(DM)를 연산하는 과정은,2. The method of claim 1, wherein calculating the dissimilarity measure (DM) of each of the divided regions comprises: 현재 프레임과 재구성된 이전 프레임(기준 프레임)간의 샘플간 오차 정보를 이용하여, 부호화 이전에 현재 프레임의 PSNR(Peak Signal to Noise Ratio)을 예측하는 과정을 포함함을 특징으로 하는 실시간 장면 전환 검출 방법.Estimating a PSNR (Peak Signal to Noise Ratio) of a current frame before encoding using error information between samples of a current frame and a reconstructed previous frame (reference frame) . 제2항에 있어서, 상기 각각의 분할된 영역의 비 유사성 척도(DM를 연산하는 과정은,3. The method according to claim 2, wherein the step of calculating the dissimilarity measure (DM) 현재 프레임에서 예측된 PSNR(Predicted Peak Signal to Noise Ratio; 이하, PPSNR이라 함) 및 장면전환이 발생된 이후, 프레임들의 평균 PPSNR을 이용하여 각각의 분할된 영역의 비 유사성 척도를 연산하는 것을 특징으로 하는 실시간 장면 전환 검출 방법.Similarity measure of each divided region is calculated by using the predicted Peak Signal to Noise Ratio (PSNR) (hereinafter referred to as PPSNR) predicted in the current frame and the average PPSNR of the frames after the scene change has occurred Time scene transition detection method. 제2항에 있어서, 각각의 분할된 영역의 비 유사성 척도는 하기의 수학식1에 따라 연산되어 짐을 특징으로 하는 실시간 장면 전환 검출 방법.3. The real-time scene change detection method according to claim 2, wherein the non-similarity measure of each divided region is calculated according to Equation (1) below. <수학식1>&Quot; (1) &quot;
Figure 112008055511256-pat00010
Figure 112008055511256-pat00010
x는 분할된 영역의 식별번호를 표시하며, i는 현재 프레임의 프레임 번호를 의미하며, Sj는 j번째 발생한 급장면전환에 대한 해당 영상의 프레임 번호를 의미함.x denotes the identification number of the divided area, i denotes the frame number of the current frame, and S j denotes the frame number of the corresponding image for the j-th occurrence of class transition.
제4항에 있어서, 상기 PPSNR은 하기 수학식2 및 수학식3에 따라 연산되어짐을 특징으로 하는 실시간 장면 전환 검출 방법.5. The method of claim 4, wherein the PPSNR is calculated according to Equation (2) and Equation (3). <수학식2>&Quot; (2) &quot;
Figure 112014087765114-pat00011
Figure 112014087765114-pat00011
<수학식3>&Quot; (3) &quot;
Figure 112014087765114-pat00012
Figure 112014087765114-pat00012
상기 수학식2 및 수학식3에서 PMSE은 현재 프레임의 예측된 MSE(Mean Square Error)이고, n은 샘플당 비트수임. 상기 PMSEi, i-1와 PMSEk,k-1은 각각 하기 수학식4 및 수학식5에 따라 연산됨.In Equations (2) and (3), PMSE is a predicted MSE (Mean Square Error) of the current frame, and n is the number of bits per sample. The PMSE i, i-1 and PMSE k, k-1 are calculated according to the following equations (4) and (5), respectively. <수학식4>&Quot; (4) &quot;
Figure 112014087765114-pat00013
Figure 112014087765114-pat00013
<수학식5>Equation (5)
Figure 112014087765114-pat00014
Figure 112014087765114-pat00014
상기 수학식4 및 수학식5에서 Oi mn는 i번째 프레임의, m열 n행 번째 오리지널(original) 샘플을 나타내고 Rj mn는 j번째 프레임의 m열 n행 번째 재구성된(reconstructed) 샘플을 나타냄(한 프레임은 M[m] x N[n] 픽셀로 구성됨).In Equations (4) and (5), O i mn denotes an original sample in the mth column and nth row of the ith frame, and R j mn denotes a reconstructed sample in the mth row and nth row in the jth frame (One frame consists of M [m] x N [n] pixels).
제1항에 있어서, 기준치를 벗어나는 영역의 개수가 미리 설정된 개수 이상인지의 판단은,2. The method of claim 1, wherein the determination of whether or not the number of regions out of the reference value is equal to or greater than a predetermined number, 하기의 수학식6에 따른 연산에 의해 결정되는 것을 특징으로 하는 실시간 장면 전환 검출 방법.Is determined by an operation according to Equation (6) below. <수학식6>&Quot; (6) &quot;
Figure 112014087765114-pat00015
Figure 112014087765114-pat00015
수학식6에서 α는 프레임의 장면전환 여부를 결정하기 위한 비율을 정의한 임계치이고, Nf는 프레임 내에 분할된 영역의 수임. 상기 수학식 6에서 Cx는 하기의 수학식 7에 따른 연산에 의해 결정됨.In Equation (6),? Is a threshold value defining a ratio for determining whether or not the scene is switched, and N f is the number of regions divided in the frame. In Equation (6), C x is determined by an operation according to Equation (7) below. <수학식7>&Quot; (7) &quot;
Figure 112014087765114-pat00016
Figure 112014087765114-pat00016
수학식7에서 상기 β는 각 영역의 비 유사성 척도를 정의하는 임계치임.In Equation (7),? Is a threshold value defining the non-similarity measure of each region.
제1항 내지 제6항 중, 어느 한 항에 있어서,7. The method according to any one of claims 1 to 6, 상기 장면 전환이 이루어진 프레임 이후에 입력되는 프레임의 예측 PSNR의 미분 값을 연산하는 과정과,Calculating a differential value of a predictive PSNR of a frame input after the scene change frame; 연산된 결과값을 확인하여, 상기 결과값이 음수값을 지시하는 경우, 장면전환이 종료된 프레임으로 설정하는 과정을 더 포함함을 특징으로 하는 실시간 장면 전환 검출 방법.Further comprising the step of checking the calculated result value and setting the resultant value as a frame in which the scene change has been completed if the result value indicates a negative value. 제7항에 있어서, 상기 예측 PSNR의 미분 값은 하기의 수학식 8을 이용하여 연산함을 특징으로 하는 실시간 장면 전환 검출 방법.8. The method of claim 7, wherein the differential value of the prediction PSNR is calculated using Equation (8). <수학식 8>&Quot; (8) &quot;
Figure 112008055511256-pat00017
Figure 112008055511256-pat00017
상기 수학식 8에서 예측 PSNR은 저장된 기준 프레임(reference frame)과 입력되는 현재 프레임의 PSNR을 예측한 파라미터이고, Nf 는 프레임이 분할된 블록의 수를 지시함.In the equation (8) Prediction PSNR is a parameter which predicts the PSNR of a current frame being input and stored in the reference frame (reference frame), hereinafter N f denotes the frame number of the divided blocks.
무선 단말의 영상통화 방법에 있어서, A video call method of a wireless terminal, 단말의 입력 동영상 신호의 급격한 변화구간의 시작 프레임과 종료 프레임을 검출하는 과정과, Detecting a start frame and an end frame of an abrupt change period of an input moving picture signal of the terminal, 상기 검출된 영상들에 대해 송신부에서는 부호화를 스킵하는 과정과,Wherein the transmitting unit skips the encoding for the detected images, 상기 스킵된 프레임들에 대해 수신부에서는 미리 수신된 전 프레임을 복사하여 상기 스킵된 프레임을 대신하여 재생하는 과정을 포함하며, And a step of copying the previous frame received in advance in the receiver for the skipped frames and playing back the skipped frame in place of the skipped frame, 상기 시작 프레임은 복수 개로 분할된 프레임의 각 영역 사이의 비 유사성 척도를 사용하여 확인하고, 상기 종료 프레임은 입력 영상과 재구성된 이전 영상 간에 구해지는 예측 PSNR의 미분을 통해 확인하는 것을 특징으로 하는 영상통화 품질 향상 방법.Wherein the start frame is verified using a non-similarity measure between respective regions of a plurality of divided frames, and the end frame is confirmed through a differential of a predictive PSNR obtained between an input image and a reconstructed previous image How to improve call quality. 무선 단말을 이용한 영상통화 시스템에 있어서,A video call system using a wireless terminal, 단말의 입력 동영상 신호의 급격한 변화구간의 시작 프레임과 종료 프레임을 검출하는 검출기, A detector for detecting a start frame and an end frame of an abrupt change period of an input moving picture signal of the terminal, 검출된 모든 영상들에 대해 프레임 부호화를 스킵하는 송신부,A transmission unit for skipping frame encoding for all detected images, 상기 스킵된 프레임들에 대해 미리 수신된 전 프레임을 복사하여 대체 재생하는 수신부를 포함하며, And a reception unit for copying and playing back the previous frames previously received for the skipped frames, 상기 검출기는 복수 개로 분할된 프레임의 각 영역 사이의 비 유사성 척도를 사용하여 상기 시작 프레임을 확인하고, 입력 영상과 재구성된 이전 영상 간에 구해지는 예측 PSNR의 미분을 통해 상기 종료 프레임을 확인하는 것을 특징으로 하는 영상통화 시스템.The detector identifies the start frame using a non-similarity measure between regions of a plurality of divided frames, and identifies the end frame through a differential of a predictive PSNR obtained between an input image and a reconstructed previous image Video call system.
KR20080075307A 2007-10-10 2008-07-31 Method for real-time scene-change detection for rate control of video encoder, method for enhancing qulity of video telecommunication using the same, and system for the video telecommunication KR101490521B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US12/249,018 US20090097546A1 (en) 2007-10-10 2008-10-10 System and method for enhanced video communication using real-time scene-change detection for control of moving-picture encoding data rate

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20070102009 2007-10-10
KR1020070102009 2007-10-10

Publications (2)

Publication Number Publication Date
KR20090037288A KR20090037288A (en) 2009-04-15
KR101490521B1 true KR101490521B1 (en) 2015-02-06

Family

ID=40762060

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20080075307A KR101490521B1 (en) 2007-10-10 2008-07-31 Method for real-time scene-change detection for rate control of video encoder, method for enhancing qulity of video telecommunication using the same, and system for the video telecommunication

Country Status (1)

Country Link
KR (1) KR101490521B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101667011B1 (en) 2011-11-24 2016-10-18 에스케이플래닛 주식회사 Apparatus and Method for detecting scene change of stereo-scopic image
CN115278376B (en) * 2022-05-25 2024-03-22 西安万像电子科技有限公司 Audio and video data transmission method and device

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030082818A (en) * 2002-04-18 2003-10-23 삼성전자주식회사 Apparatus and method for performing variable bit rate control in real time
KR20050065104A (en) * 2003-12-24 2005-06-29 엘지전자 주식회사 Image error concealment apparatus and method
KR100834625B1 (en) 2006-07-27 2008-06-02 삼성전자주식회사 Real-time scene-change detection for rate control of video encoder

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030082818A (en) * 2002-04-18 2003-10-23 삼성전자주식회사 Apparatus and method for performing variable bit rate control in real time
KR20050065104A (en) * 2003-12-24 2005-06-29 엘지전자 주식회사 Image error concealment apparatus and method
KR100834625B1 (en) 2006-07-27 2008-06-02 삼성전자주식회사 Real-time scene-change detection for rate control of video encoder

Also Published As

Publication number Publication date
KR20090037288A (en) 2009-04-15

Similar Documents

Publication Publication Date Title
US11089311B2 (en) Parameterization for fading compensation
US20090097546A1 (en) System and method for enhanced video communication using real-time scene-change detection for control of moving-picture encoding data rate
KR100626994B1 (en) Variable bitrate video coding method and corresponding videocoder
US7532764B2 (en) Prediction method, apparatus, and medium for video encoder
US6037987A (en) Apparatus and method for selecting a rate and distortion based coding mode for a coding system
JP4127818B2 (en) Video coding method and apparatus
US7653129B2 (en) Method and apparatus for providing intra coding frame bit budget
KR101322498B1 (en) Encoding device, encoding method, and program
US8094716B1 (en) Method and apparatus of adaptive lambda estimation in Lagrangian rate-distortion optimization for video coding
US20100111180A1 (en) Scene change detection
KR19980018698A (en) Image data compression apparatus and method thereof
KR100790149B1 (en) Rate control of scene-changed video encoder
KR20050074286A (en) Image encoding device, image encoding method and image encoding program
JPWO2006101126A1 (en) Encoding device and moving image recording system provided with encoding device
JP2004215275A (en) Motion compensation based improved noise prediction method and apparatus, and moving image encoding method and apparatus using the same
US8442113B2 (en) Effective rate control for video encoding and transcoding
KR100834625B1 (en) Real-time scene-change detection for rate control of video encoder
KR100929607B1 (en) Procedure for transcoding MPEG-2 main profile into H.264/AVC baseline profile
KR100708182B1 (en) Rate control apparatus and method in video encoder
KR101490521B1 (en) Method for real-time scene-change detection for rate control of video encoder, method for enhancing qulity of video telecommunication using the same, and system for the video telecommunication
JP4130617B2 (en) Moving picture coding method and moving picture coding apparatus
KR100790148B1 (en) Real-time video content complexity measur for rate control of video encoder
KR101336445B1 (en) Method for rate control in video encoding
JP4572137B2 (en) Encoding device and encoding program
JP4281667B2 (en) Image encoding device

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee