KR100816013B1 - 압축영상의 장면전환 검출장치 및 방법 - Google Patents

압축영상의 장면전환 검출장치 및 방법 Download PDF

Info

Publication number
KR100816013B1
KR100816013B1 KR1020070007255A KR20070007255A KR100816013B1 KR 100816013 B1 KR100816013 B1 KR 100816013B1 KR 1020070007255 A KR1020070007255 A KR 1020070007255A KR 20070007255 A KR20070007255 A KR 20070007255A KR 100816013 B1 KR100816013 B1 KR 100816013B1
Authority
KR
South Korea
Prior art keywords
scene change
frame
edge
complexity
change candidate
Prior art date
Application number
KR1020070007255A
Other languages
English (en)
Inventor
최윤식
엄민영
홍보현
Original Assignee
(주)엑스퍼넷
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)엑스퍼넷 filed Critical (주)엑스퍼넷
Priority to KR1020070007255A priority Critical patent/KR100816013B1/ko
Application granted granted Critical
Publication of KR100816013B1 publication Critical patent/KR100816013B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/147Scene change detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

압축영상의 장면전환 검출장치 및 방법이 개시된다. 장면전환 후보프레임 검출부는 압축영상을 구성하는 각각의 프레임에 속하는 매크로 블록의 부호화모드 중에서 화면내 모드로 부호화되는 매크로 블록의 비율이 사전에 설정되어 있는 제1임계값보다 큰 프레임을 장면전환 후보프레임으로 검출한다. 복잡도/에지정보 추출부는 장면전환 후보프레임에 속하는 매크로 블록 중에서 화면내 모드로 부호화되는 매크로 블록의 부호화 모드를 기초로 화면내 모드로 부호화되는 매크로 블록 각각에 대한 복잡도 정보 및 에지방향 정보를 추출한다. 히스토그램 산출부는 장면전환 후보프레임 각각을 복수개의 하위 이미지로 분할하고, 분할된 각각의 하위 이미지에 대해 복잡도 히스토그램 빈과 에지 히스토그램 빈을 산출한다. 장면전환 판단부는 장면전환 후보프레임 중에서 시간적으로 연속하는 제1장면전환 후보프레임과 제2장면전환 후보프레임의 대응되는 하위 이미지에 대해 산출된 복잡도 히스토그램 빈과 에지 히스토그램 빈의 차이값이 사전에 설정된 제2임계값을 보다 크면 제1장면전환 후보프레임을 장면전환 프레임으로 판단한다. 본 발명에 따르면, 복호화 과정에 필요한  많은 계산량과 긴 처리 시간을 단축할 수 있으며, 복잡도와 에지 정보의 사용으로 조명변화가 심한 영상이나, 빠르게 움직이는 물체를 포함한 영상에 대해서도 정확하게 장면전환 프레임을 검출할 수 있다.

Description

압축영상의 장면전환 검출장치 및 방법{Apparatus and method for detecting scene change from compressed moving picture}
도 1은 본 발명에 따른 장면전환 검출장치의 바람직한 실시예의 상세한 구성을 도시한 블록도,
도 2 및 도 3은 각각 H.264/AVC 압축표준에서의 16×16 예측 모드 및 4×4 예측 모드의 예를 도시한 도면,
도 4는 프레임을 분할하여 생성한 16개의 하위 이미지에 대한 히스토그램 빈 추출 단위를 도시한 도면,
도 5는 본 발명에 따른 압축영상의 장면전환 검출 방법의 수행과정을 도시한 흐름도,
도 6은 복잡도/에지정보 추출부에 의한 에지정보의 추출과정을 도시한 흐름도,
도 7은 복잡도/에지정보 추출부에 의해 추출된 에지 정보를 이용하여
Figure 112007007030012-pat00001
을 산출하는 과정을 도시한 흐름도,
도 8은 8×8 픽셀 크기의 블록이 가지고 있는 에지성분이 위치하는 에지영역의 예를 도시한 도면, 그리고,
도 9는 도 8에 도시된 각각의 에지영역에 대응하는 에지성분의 예를 도시한 도면이다.
본 발명은 압축영상의 장면전환 검출 장치 및 방법에 관한 것으로, 보다 상세하게는, H.264/AVC 표준으로 압축된 영상에 대한 편집, 요약, 색인 및 검색 기술의 근간이 되는 장면전환을 검출하는 장치 및 방법에 관한 것이다.
최근 멀티미디어 데이터의 양과 수요가 급증하고 있고 그 적용 분야 또한 다양해지고 있다. 이러한 멀티미디어 데이터는 저장과 전송의 효율성을 위해 다양한 알고리즘을 통해 압축되는데, 이러한 알고리즘으로는 MPEG-2, MPEG-4, H.264/AVC 등이 있다. 압축된 멀티미디어 데이터는 대부분의 분야에 적용될 때 복호화 과정을 거쳐서 공간 영역으로 전환되어 사용된다. 그러나 복호화 과정은 많은 계산량과 긴 처리 시간을 요구하기 때문에 실시간 응용 분야에 있어서 많은 어려움이 따른다. 이러한 문제를 해결하기 위하여 지금까지 압축 영역에서의 장면전환 검출 기법에 대한 많은 연구가 진행되어 왔다.
MPEG-2의 경우 압축 영역에서의 장면전환 검출 기법은 크게 세 가지로 나눌 수 있다. MPEG-2의 장면전환 검출 기법 중 하나는 화면내 프레임에서 DCT 계수 중 DC 계수에 의한 DC 영상의 컬러 히스토그램을 이용하는 방법이고, 다른 하나는 움직임 벡터를 이용하는 방법이며, 또 다른 하나는 화면내 프레임의 비트율을 사용하 는 방법이다. 이와 같이 DC 계수를 이용하는 방법은 고속처리가 가능하다는 장점을 가지고 있지만, 컬러를 기반으로 하고 있기 때문에 조명 변화에 따른 성능 저하가 심하고 컬러 분포가 비슷한 영상들에 대해서 변별력이 없다는 단점이 있다. 한편 움직임 벡터를 이용하는 방법은 화면내 프레임만을 이용하는 방법보다는 화면간 프레임을 이용하기 때문에 정확한 장면전환 지점을 찾을 수 있는 장점이 있으나, 이 방법 또한 조명 변화가 있을 경우 움직임 벡터의 구조가 달라지기 때문에 성능 저하가 심하고 움직임이 급격하게 변하는 영상에 대해서는 움직임 벡터가 표현할 수 있는 정보의 한계 때문에 정확한 장면전환 검출이 어렵다는 문제가 있다. 따라서 최근 이러한 기존 방법의 문제점과 한계를 극복하기 위하여 두 개의 AC 계수만을 이용하여 로컬 영역에서의 에지 구조의 변화를 척도로 하는 방법이 제안되어 다양한 조건에서도 정확한 장면전환 검출이 가능함이 입증되었다.    
그러나 H.264/AVC 기반 동영상의 경우 화면내 프레임의 경우 화면내 예측을 통하여 부호화되기 때문에 더 이상 MPEG-2 에 적용되었던 DC 계수를 이용하는 방법이나 AC 계수를 이용한 에지 기반 방법이 직접적으로 사용되지 못한다. 또한 H.264/AVC 기반 동영상의 경우 화면간 프레임의 경우 하나의 매크로 블록 안에서 다양한 크기의 블록별로 부호화되고 다중 참조 프레임을 사용하기 때문에 움직임 벡터를 적용하여 장면전환을 검출하기에는 어려움이 따른다. 따라서 최근 H.264/AVC의 부호화 특징에 맞는 장면전환 검출 방법이 연구되고 있다. 이 중 인접한 화면내 프레임의 화면내 예측 모드의 분포 차이를 척도로 압축 영역에서 장면전환 검출하는 방법이 있다. 그러나 이 방법은 화면내 프레임만을 고려하기 때문에 정확한 장면전환 검출이 어렵고 장면전환이 빠르게 발생하는 영상이나 물체가 빠르게 움직이는 영상에서는 장면전환 검출 성능의 저하를 보인다.
본 발명이 이루고자 하는 기술적 과제는, 화면내 프레임뿐 아니라 화면간 프레임도 고려할 수 있는 H.264/AVC 표준에 의해 압축된 영상으로부터 고속으로 정확하게 장면전환을 검출하는 장치 및 방법을 제공하는 데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는, 화면내 프레임뿐 아니라 화면간 프레임도 고려할 수 있는 H.264/AVC 표준에 의해 압축된 영상으로부터 고속으로 정확하게 장면전환을 검출하는 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 데 있다.
상기의 기술적 과제를 달성하기 위한, 본 발명에 따른 압축영상의 장면전환 검출 장치는, H.264/AVC 표준에 의해 압축된 압축영상으로부터 장면전환을 검출하는 장치에 있어서, 상기 압축영상을 구성하는 각각의 프레임에 속하는 매크로 블록의 부호화모드 중에서 화면내 모드로 부호화되는 매크로 블록의 비율이 사전에 설정되어 있는 제1임계값보다 큰 프레임을 장면전환 후보프레임으로 검출하는 장면전환 후보프레임 검출부; 상기 장면전환 후보프레임에 속하는 매크로 블록 중에서 화면내 모드로 부호화되는 매크로 블록의 부호화 모드를 기초로 화면내 모드로 부호화되는 매크로 블록 각각에 대한 복잡도 정보 및 에지방향 정보를 추출하는 복잡도/에지정보 추출부; 상기 장면전환 후보프레임 각각을 복수개의 하위 이미지로 분할 하고, 분할된 각각의 하위 이미지에 대해 복잡도 히스토그램 빈과 에지 히스토그램 빈을 산출하는 히스토그램 산출부; 및 상기 장면전환 후보프레임 중에서 시간적으로 연속하는 제1장면전환 후보프레임과 제2장면전환 후보프레임의 대응되는 하위 이미지에 대해 산출된 복잡도 히스토그램 빈과 에지 히스토그램 빈의 차이값이 사전에 설정된 제2임계값을 보다 크면 상기 제1장면전환 후보프레임을 장면전환 프레임으로 판단하는 장면전환 판단부;를 구비한다.
상기의 다른 기술적 과제를 달성하기 위한, 본 발명에 따른 압축영상의 장면전환 검출 방법은, H.264/AVC 표준에 의해 압축된 압축영상으로부터 장면전환을 검출하는 방법에 있어서, (a) 상기 압축영상을 구성하는 각각의 프레임에 속하는 매크로 블록의 부호화모드 중에서 화면내 모드로 부호화되는 매크로 블록의 비율이 사전에 설정되어 있는 제1임계값보다 큰 프레임을 장면전환 후보프레임으로 검출하는 단계; (b) 상기 장면전환 후보프레임에 속하는 매크로 블록 중에서 화면내 모드로 부호화되는 매크로 블록의 부호화 모드를 기초로 화면내 모드로 부호화되는 매크로 블록 각각에 대한 복잡도 정보 및 에지방향 정보를 추출하는 단계; (c) 상기 장면전환 후보프레임 각각을 복수개의 하위 이미지로 분할하고, 분할된 각각의 하위 이미지에 대해 복잡도 히스토그램 빈과 에지 히스토그램 빈을 산출하는 단계; 및 (d) 상기 장면전환 후보프레임 중에서 시간적으로 연속하는 제1장면전환 후보프레임과 제2장면전환 후보프레임의 대응되는 하위 이미지에 대해 산출된 복잡도 히스토그램 빈과 에지 히스토그램 빈의 차이값이 사전에 설정된 제2임계값을 보다 크면 상기 제1장면전환 후보프레임을 장면전환 프레임으로 판단하는 단계;를 갖는다.
이에 의해, 프레임을 구성하는 매크로 블록의 모드정보에 의해 장면전환 프레임을 검출하므로, 복호화 과정에 필요한  많은 계산량과 긴 처리 시간을 단축할 수 있으며, 복잡도와 에지 정보의 사용으로 조명변화가 심한 영상이나, 빠르게 움직이는 물체를 포함한 영상에 대해서도 정확하게 장면전환 프레임을 검출할 수 있다.
이하에서 첨부된 도면들을 참조하여 본 발명에 따른 압축영상의 장면전화 검출 장치 및 방법의 바람직한 실시예에 대해 상세하게 설명한다.
도 1은 본 발명에 따른 압축영상의 장면전환 검출 장치에 대한 바람직한 일 실시예의 상세한 구성을 도시한 블록도이다.
도 1을 참조하면, 본 발명에 따른 압축영상의 장면전환 검출 장치는, 장면전환 후보프레임 검출부(110), 복잡도/에지정보 추출부(120), 히스토그램 산출부(130) 및 장면전환 판단부(140)를 구비한다.
장면전환 후보프레임 검출부(110)는 압축영상을 구성하는 각각의 프레임에 속하는 매크로 블록의 예측모드 중에서 화면내 모드로 부호화되는 매크로 블록의 비율이 사전에 설정되어 있는 제1임계값보다 큰 프레임을 장면전환 후보프레임으로 검출한다. 이를 위해 장면전환 후보프레임 검출부(110)는 예측모드 분석부(112), 모드비율 산출부(114) 및 후보프레임 검출부(116)를 갖는다.
예측모드 분석부(112)는 프레임을 구성하는 각각의 매크로 블록의 예측 모드를 분석한다. H.264/AVC 압축표준에서는 각각의 매크로 블록에 대해 최적의 예측 모드를 자유롭게 결정할 수 있다. 이러한 H.264/AVC 압축표준을 이용하여 영상을 압축할 경우에 동일한 프레임을 구성하는 매크로 블록에 대해 화면간 예측 모드(Intra Prediction Mode)와 화면내 예측 모드(Inter Prediction Mode)가 혼재되어 사용될 수 있다. 따라서 화면간 프레임일지라도 프레임간의 시간적 상관관계가 적은 경우는 움직임 보상을 이용해 부호화하지 않고, 매크로 블록의 대부분이 화면내 모드로 부호화된다.
모드비율 산출부(114)는 각각의 프레임을 구성하는 매크로 블록의 개수에 대한 화면내 모드로 부호화되는 매크로 블록의 백분율을 산출한다. 이러한 계산과정은 다음의 수학식으로 나타낼 수 있다.
Figure 112007007030012-pat00002
여기서, RInter는 화면내 모드로 부호화되는 매크로 블록의 백분율, NInter는 화면내 모드로 부호화되는 매크로 블록의 개수, 그리고, NTotal은 프레임을 구성하는 전체 매크로 블록의 개수이다.
후보프레임 검출부(116)는 프레임을 구성하는 매크로 블록 중에서 화면내 모드로 부호화되는 매크로 블록의 백분율이 사전에 설정된 임계값보다 큰 프레임을 장면전환 프레임의 후보프레임으로 검출한다. 영상에 있어서 장면전환이 발생하는 경우는 프레임간의 시간적 상관관계가 적기 때문에 다른 프레임을 참조하는 화면간 모드보다 화면내 모드로 부호화되는 매크로 블록의 수가 더 많다. 이러한 특성을 바탕으로 후보프레임 검출부(116)는 한 프레임의 모든 매크로 블록의 모드 분석이 끝나면 화면내 모드로 부호화되는 매크로 블록의 백분율을 구하여 사전에 설정되어 있는 임계값보다 큰 프레임을 장면전환 후보프레임으로 검출한다. 이때 임계값은 실험적으로 결정되며, 바람직하게는, 60~65%의 범위 내에서 설정된다.
복잡도/에지정보 추출부(120)는 화면내 예측 모드를 기반으로 2 종류의 복잡도와 8 종류의 에지정보를 추출한다. H.264/AVC 압축표준에서의 화면내 예측 모드는 4가지의 16×16 예측 모드와 9가지의 4×4 예측 모드로 나누어진다. 도 2 및 도 3에는 각각 H.264/AVC 압축표준에서의 16×16 예측 모드 및 4×4 예측 모드의 예가 도시되어 있다. 블록의 복잡도는 매크로 블록의 크기를 기초로 결정된다. 따라서 매크로 블록이 16×16 예측 모드일 경우에는 평탄한 블록으로 복잡도가 결정되고, 4×4 예측 모드일 경우에는 복잡한 블록으로 복잡도가 결정된다.
한편, 블록의 에지정보는 예측 모드 번호에 따라 정의할 수 있다. 4×4 예측모드번호 0, 1, 2, 3은 16×16 예측모드번호 0, 1, 2, 3과 동일한 예측방향을 나타내므로, 복잡도/에지정보 추출부(120)는 각각의 예측모드번호(Mode 0~8)에 따라 에지방향값을 지정한다. 이때 화면내 예측 모드가 16×16 예측 모드로 선택되면, 매크로 블록을 4×4 픽셀 크기의 블록단위로 에지 특성을 추출하기 위하여 복잡도/에지정보 추출부(120)는 매크로 블록을 16개의 4×4 픽셀 크기의 블록으로 나누어 선택된 16×16 예측모드번호에 해당하는 에지방향값을 지정한다. 에지방향값은 예측에 사용되는 참조 화소의 위치를 기반으로 tan-1을 적용하여 정의된다. 표 1에는 각각의 예측모드에 따른 에지방향값이 기재되어 있다.
예측모드번호 0 1 2 3 4 5 6 7 8
에지방향값 (각도 °) 90 0 또는 180 non- edge 45 135 116 153 63 26
표 1을 참조하면, 예측 모드 1의 경우 경우는 0° 또는 180°의 값으로 정의되는데, 이때 히스토그램 빈 추출에 사용되는 단위 블록인 8×8화소의 블록이 예각의 경향을 보이면 0°로, 둔각의 경향을 보이면 180°로 정의된다. 예측 모드 2의 경우 참조 화소의 평균값이 가장 적절한 예측으로 선택된 경우로서, 부호화될 대상블록이 에지 성분을 가지고 있지 않음(평탄영역(non-edge))을 의미한다.
히스토그램 검출부(130)는 복잡도/에지정보 추출부(120)에 의해 추출된 복잡도와 에지정보를 이용하여 각각의 프레임을 겹치지 않는 16개의 하위 이미지로 분할하고, 각각의 하위 이미지 당 1가지의 복잡도 히스토그램 빈과 5가지의 에지 히스토그램 빈을 추출하여 하나의 프레임당 총 96개의 복잡도와 에지 히스토그램 빈(Complexity and Edge Histogram Bin : CEHB)을 추출한다. 도 4에는 프레임을 분할하여 생성한 16개의 하위 이미지에 대한 히스토그램 빈 추출 단위가 도시되어 있다.
복잡도의 추출과 관련하여, 히스토그램 검출부(130)는 복잡도/에지정보 추출부(120)에 의해 추출된 복잡도 특성을 이용하여 4×4 예측 모드일 경우 복잡도 히스토그램 빈을 하나 증가시켜 복잡도 히스토그램 빈을 산출한다. 이때 8×8 블록을 기본 단위로 하여 복잡도 히스토그램 빈을 카운팅 한다. H.264/AVC에서의 화면내 예측 모드는 16×16 예측 모드와 4×4 예측 모드가 있다. 따라서 16×16 예측 모드로 부호화되었을 경우에, 해당 매크로 블록 내에 4개의 8×8 블록이 존재하고 각각의 복잡도 빈 카운팅은 일어나지 않게 된다. 또한 4×4 예측 모드로 부호화되었을 경우에 평균적인 복잡도를 반영하기 위하여 16×16 매크로 블록 내에 8×8 블록 4개에 대한 빈 카운팅은 각각 1씩 증가하게 된다.
에지정보의 추출과 관련하여, 히스토그램 검출부(130)는 복잡도/에지정보 추출부(120)에 의해 얻어진 4×4 픽셀 크기 단위의 에지 특성을 이용하여 8×8 픽셀 크기의 블록단위의 평균 에지 특성(
Figure 112007007030012-pat00003
)을 구하여 에지 히스토그램 빈을 산출한다. 이때
Figure 112007007030012-pat00004
은 4개의 4×4 픽셀 크기의 블록의 에지방향값의 평균값으로 정의된다. 또한 4개의 4×4 픽셀 크기의 블록이 모두 평탄영역(non-edge)의 특성을 가지는 경우에
Figure 112007007030012-pat00005
을 평탄영역(non-edge)으로 결정하고, 그 외의 경우는 평균을 취할 때 평탄영역(non-edge)의 개수는 고려하지 않는다.
Figure 112007007030012-pat00006
은 다음의 수학식에 의해 산출된다.
Figure 112007007030012-pat00007
여기서,
Figure 112007007030012-pat00008
는 8×8 블록에서 i번째 4×4 픽셀 크기의 블록의 에지방향이고,
Figure 112007007030012-pat00009
는 평탄영역(non-edge)이 아닌 4×4 픽셀 크기의 블록의 개수이다.
또한 히스토그램 검출부(130)는 수학식 2에 의해 구해진
Figure 112007007030012-pat00010
을 이용하여 8 ×8 픽셀 크기의 블록이 가지고 있는 에지성분이 어느 에지 영역에 포함되는 지를 결정한다. 이때 히스토그램 검출부(130)는 블록을 네 가지 에지 영역으로 분류하고,
Figure 112007007030012-pat00011
이 1번 영역에 포함되면 수직 에지, 2번 영역에 포함되면 수평 에지, 3번 영역에 포함되면 45° 대각선 에지, 그리고, 4번 영역에 포함되면 135° 대각선 에지라고 판단한다.
장면전환 판단부(140)는 시간적으로 인접한 장면전환 후보 프레임의 CEHB의 차이 정보를 이용하여 장면전환 검출을 수행한다. 이때 계산상의 편의를 위해 추출된 CEHB는 정규화되는 것이 바람직하며, 장면전환 판단부(140)는 정규화된 CEHB의 l 1 -norm을 계산하여 장면전환 프레임을 검출한다. 복잡도와 에지 히스토그램 빈 차이(Complexity and Edge Histogram Bin Difference : CEHBD)는 다음의 수학식에 의해 산출된다.
Figure 112007007030012-pat00012
여기서, CEHBi(K)는 K번째 프레임에서 i번째 히스토그램 빈을 나타낸다.
장면전환 판단부(140)는 수학식 3에 의해 산출된 CEHBD(K)값이 사전에 설정되어 있는 임계값보다 크면 K번째 프레임을 장면전환 프레임으로 판단한다. 이때 임계값은 실험적으로 결정되며, 바람직하게는, 1000~1100의 범위 내에서 설정된다.
도 5는 본 발명에 따른 압축영상의 장면전환 검출 방법의 수행과정을 도시한 흐름도이다.
도 5를 참조하면, 예측모드 분석부(112)는 프레임을 구성하는 각각의 매크로 블록의 예측 모드를 분석한다(S500). 다음으로, 모드비율 산출부(114)는 각각의 프레임을 구성하는 매크로 블록의 개수에 대한 화면내 모드로 부호화되는 매크로 블록의 백분율을 산출한다(S510). 다음으로, 후보프레임 검출부(116)는 프레임을 구성하는 매크로 블록 중에서 화면내 모드로 부호화되는 매크로 블록의 백분율이 사전에 설정된 임계값보다 큰 프레임을 장면전환 프레임의 후보프레임으로 검출한다(S520). 이때 임계값은 실험적으로 결정되며, 바람직하게는, 60~65%의 범위 내에서 설정된다.
복잡도/에지정보 추출부(120)는 화면내 예측 모드에 의해 파악된 매크로 블록의 크기를 기초로 2 종류의 복잡도 정보를 추출하고, 각각의 매크로 블록에 대해 4×4 픽셀 크기의 블록단위로 예측모드번호에 해당하는 에지방향값을 지정하여 에지정보를 추출한다(S530). 도 6은 복잡도/에지정보 추출부(120)에 의한 에지정보의 추출과정을 도시한 흐름도이다.
도 6을 참조하면, 먼저 복잡도/에지정보 추출부(120)는 매크로 블록의 예측모드를 확인한다(S600). 만약 매크로 블록의 예측 모드가 16×16 예측 모드이면, 복잡도/에지정보 추출부(120)는 해당 매크로 블록을 4×4 픽셀 크기의 하위블록으로 분할한 후 각각의 하위블록에 해당 매크로 블록의 예측모드번호를 부여한다(S610). 다음으로, 복잡도/에지정보 추출부(120)는 4×4 픽셀 크기의 블록(즉, 4×4 예측 모드에 해당하는 매크로 블록 또는 4×4 픽셀 크기의 하위블록)의 예측모 드번호가 0이면, 에지방향값을 90°로 설정한다(S620). 또한, 예측모드번호가 1이면, 에지방향값을 0° 또는 180°로 설정한다(S630). 이때 히스토그램 빈 추출에 사용되는 단위 블록인 8×8화소의 블록이 예각의 경향을 보이면 0°로, 둔각의 경향을 보이면 180°로 설정한다. 또한, 예측모드번호가 2이면, 에지방향값을 평탄영역(non-edge)으로 설정한다(S640). 또한, 예측모드번호가 3, 7, 8이면, 에지방향값을 예각으로 설정한다(S650). 또한, 예측모드번호가 4, 5, 6이면, 에지방향값을 둔각으로 설정한다(S660). 이상의 과정은 프레임을 구성하는 모든 매크로 블록에 대해 수행된다.
히스토그램 검출부(130)는 복잡도/에지정보 추출부(120)에 의해 추출된 복잡도와 에지정보를 이용하여 각각의 프레임을 겹치지 않는 16개의 하위 이미지로 분할하고, 각각의 하위 이미지 당 1가지의 복잡도 히스토그램 빈과 5가지의 에지 히스토그램 빈을 추출하여 하나의 프레임당 총 96개의 복잡도와 에지정보 히스토그램 빈(CEHB)을 추출한다(S540). 도 7은 복잡도/에지정보 추출부(120)에 의해 추출된 에지 정보를 이용하여
Figure 112007007030012-pat00013
을 산출하는 과정을 도시한 흐름도이다.
도 7을 참조하면, 히스토그램 검출부(130)는 하위 이미지를 구성하는 8×8 픽셀 크기의 블록에 포함된 4개의 4×4 픽셀 크기의 블록의 에지방향값이 모두 평탄영역(non-edge)인지 여부를 확인한다(S700). 만약 4개의 4×4 픽셀 크기의 블록의 에지방향값이 모두 평탄영역(non-edge)이면, 히스토그램 검출부(130)는 해당 8×8 픽셀 크기의 블록의 에지 특성을 평탄영역(non-edge)으로 결정한다(S710). 이 와 달리 4개의 4×4 픽셀 크기의 블록의 에지방향값 중 적어도 하나가 평탄영역(non-edge)이 아니면, 히스토그램 검출부(130)는 순차적으로 입력되는 4×4 픽셀 크기의 블록의 에지방향값이 0°인지 여부를 확인한다(S720). 만약 4×4 픽셀 크기의 블록의 에지방향값이 0°이면, 히스토그램 검출부(130)는 해당 8×8 픽셀 크기의 블록의 각특성을 파악한다(S730). 이때 해당 8×8 픽셀 크기의 블록의 각특성이 둔각 특성을 보이면, 히스토그램 검출부(130)는 4×4 픽셀 크기의 블록의 에지방향값을 180°으로 설정한다(S740). 다음으로, 히스토그램 검출부(130)는 해당 8×8 픽셀 크기의 블록에 대한 에지방향값에 4×4 픽셀 크기의 블록의 에지방향값을 가산한다(S750).
히스토그램 검출부(130)는 해당 8×8 픽셀 크기의 블록을 구성하는 4×4 픽셀 크기의 블록에 대해 순차적으로 S720단계 내지 S750단계를 수행하고(S760), 산출된 해당 8×8 픽셀 크기의 블록에 대한 에지방향값을 해당 8×8 픽셀 크기의 블록을 구성하는 4×4 픽셀 크기의 블록 중에서 평탄영역(non-edge)에 해당하는 블록을 제외한 블록의 개수로 나누어 해당 8×8 픽셀 크기의 블록에 대한 에지방향값의 평균을 산출한다(S770). 마지막으로, 히스토그램 검출부(130)는 8×8 픽셀 크기의 블록에 대한 에지방향값의 평균값을 기초로 8×8 픽셀 크기의 블록이 가지고 있는 에지성분이 위치하는 에지영역을 파악한다(S780). 이상의 과정은 프레임을 분할하여 생성된 16개의 하위 이미지를 구성하는 모든 8×8 픽셀 크기의 블록에 대해 순차적으로 수행된다. 도 8에는 8×8 픽셀 크기의 블록이 가지고 있는 에지성분이 위치하는 에지영역의 예가 도시되어 있다. 도 8에 도시된 영역 중에서 1번 영역은 수직 에지, 2번 영역은 수평 에지, 3번 영역은 45°대각선 에지, 그리고, 4번 영역은 135°대각선 에지를 나타낸다. 또한 도 9에는 도 8에 도시된 각각의 에지영역에 대응하는 에지성분의 예가 도시되어 있다. 또한 다음의 표 2에는 각각의 에지영역에서
Figure 112007007030012-pat00014
의 범위와 평탄영역(non-edge)의 예가 기재되어 있다.
Figure 112007007030012-pat00015
영역
에지
67.5≤
Figure 112007007030012-pat00016
≤112.5
1
0≤
Figure 112007007030012-pat00017
≤22.5 또는 157.5≤
Figure 112007007030012-pat00018
≤180
2
22.5≤
Figure 112007007030012-pat00019
≤67.5
3
112.5≤
Figure 112007007030012-pat00020
≤157.5
4
Figure 112007007030012-pat00021
=1000
평탄영역(non-edge)
장면전환 판단부(140)는 시간적으로 인접한 장면전환 후보프레임의 복잡도와 에지정보 히스토그램 빈(CEHB)의 차이값이 사전에 설정되어 있는 임계값보다 크면 현재 프레임을 장면전환 프레임으로 판단한다(S550).
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
이상에서 본 발명의 바람직한 실시예에 대해 도시하고 설명하였으나, 본 발명은 상술한 특정의 바람직한 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.
본 발명에 따른 장면전환 검출장치 및 방법에 의하면, 상술한 바와 같은 본 발명에 따른 장면전환 검출장치 및 방법에 의하면, H.264/AVC 압축표준에 의해 압축된 영상에 대해 복호화과정을 거치지 않고 매크로 블록의 모드 분석만을 통하여 장면전환 후보프레임을 검출하고, 각각의 후보프레임에서 화면내 예측 모드를 기반으로 추출한 CEHB를 기초로 산출한 CEHBD에 의해 장면전환여부를 검출함으로써, 복호화 과정에 필요한  많은 계산량과 긴 처리 시간을 단축할 수 있다. 또한, 화면내 프레임 및 화면간 프레임 모두를 고려하여 화면내 프레임의 삽입 주기와 상관없이 모든 H.264/AVC 압축표준에 의해 압축된 영상의 장면전환 검출이 가능하다. 나아가, 복잡도와 에지 정보의 사용으로 조명변화가 심한 영상이나, 빠르게 움직이는 물체를 포함한 영상으로부터 장면전환 프레임을 검출함에 있어서 우수한 성능을 얻을 수 있다.

Claims (19)

  1. 압축부호화된 압축영상의 복원 전에 상기 압축영상으로부터 추출한 데이터에 의해 장면전환 프레임을 검출하는 장치에 있어서,
    상기 압축영상을 구성하는 각각의 프레임에 속하는 블록의 부호화 모드 중에서 화면내 모드로 부호화된 매크로 블록의 비율이 사전에 설정되어 있는 제1임계값보다 큰 프레임을 장면전환 후보프레임으로 검출하는 장면전환 후보프레임 검출부;
    상기 장면전환 후보프레임에 속하는 블록 중에서 화면내 모드로 부호화된 매크로 블록의 예측 모드를 기초로 상기 화면내 부호화 모드로 부호화된 블록 각각에 대한 복잡도 정보 및 에지방향 정보를 추출하는 복잡도/에지정보 추출부;
    상기 장면전환 후보프레임 각각을 복수개의 하위 이미지로 분할하고, 상기 복잡도 정보 및 에지방향 정보를 기초로 분할된 각각의 하위 이미지에 대해 복잡도 히스토그램 빈과 에지 히스토그램 빈을 산출하는 히스토그램 산출부; 및
    상기 장면전환 후보프레임 중에서 시간적으로 연속하는 제1장면전환 후보프레임과 제2장면전환 후보프레임 각각에 대응되는 하위 이미지에 대해 산출된 복잡도 히스토그램 빈과 에지 히스토그램 빈의 차이값이 사전에 설정된 제2임계값 보다 크면 상기 제1장면전환 후보프레임을 장면전환 프레임으로 판단하는 장면전환 판단부;를 포함하는 것을 특징으로 하는 장면전환 검출장치.
  2. 제 1항에 있어서,
    상기 장면전환 후보프레임 검출부는,
    상기 프레임을 구성하는 각각의 매크로 블록의 부호화 모드를 분석하는 예측모드 분석부;
    상기 프레임을 구성하는 매크로 블록의 개수에 대한 화면내 모드로 부호화되는 매크로 블록의 개수의 백분율을 산출하는 모드비율 산출부; 및
    상기 산출된 프레임에 대한 화면내 모드로 부호화되는 매크로 블록의 백분율이 상기 제1임계값보다 큰 프레임을 장면전환 후보프레임으로 검출하는 후보프레임 검출부;를 포함하는 것을 특징으로 하는 장면전환 검출장치.
  3. 제 1항에 있어서,
    상기 복잡도/에지정보 추출부는 상기 장면전환 후보프레임을 구성하는 매크로 블록의 크기를 기초로 상기 복잡도 정보를 추출하고, 상기 장면전환 후보프레임을 구성하는 매크로 블록의 크기에 대응하여 설정된 예측모드번호에 해당하는 에지방향값에 의해 상기 에지방향 정보를 추출하는 것을 특징으로 하는 장면전환 검출장치.
  4. 제 3항에 있어서,
    상기 복잡도/에지정보 추출부는 상기 장면전환 후보프레임을 구성하는 매크 로 블록의 크기가 16×16 픽셀이면, 매크로 블록을 4×4 픽셀 크기의 블록으로 분할한 후 각각의 4×4 픽셀 크기의 블록에 대해 16×16 예측모드번호에 해당하는 에지방향 값을 할당하여 매크로 블록에 대한 상기 에지방향 정보를 추출하는 것을 특징으로 하는 장면전환 검출장치.
  5. 제 1항에 있어서,
    상기 히스토그램 산출부는 상기 장면전환 후보프레임 각각을 16개의 하위 이미지로 분할하고, 분할된 각각의 하위 이미지에 대해 1가지의 복잡도 히스토그램 빈과 5가지의 에지 히스토그램 빈을 산출하는 것을 특징으로 하는 장면전환 검출장치.
  6. 제 5항에 있어서,
    상기 히스토그램 산출부는 상기 하위 이미지 각각에 대해 8×8 픽셀 크기의 블록을 기본 단위로 하여 상기 복잡도 히스토그램 빈과 에지 히스토그램 빈을 산출하는 것을 특징으로 하는 장면전환 검출장치.
  7. 제 1항에 있어서,
    상기 히스토그램 산출부는 상기 복잡도/에지정보 추출부에 의해 얻어진 4×4 픽셀 단위의 복잡도 정보 및 에지방향 정보를 기초로 다음의 수학식에 의해 8×8 픽셀 크기의 블록단위로 평균 에지 특성을 산출하여 상기 에지 히스토그램 빈을 산 출하는 것을 특징으로 하는 장면전환 검출장치:
    Figure 112007007030012-pat00022
    여기서,
    Figure 112007007030012-pat00023
    는 8×8 블록에서 i번째 4×4 블록의 에지방향이고,
    Figure 112007007030012-pat00024
    는 평탄영역(non-edge)이 아닌 4×4 블록의 개수이다.
  8. 제 1항 내지 제 7항 중 어느 한 항에 있어서,
    상기 제1임계값은 60~65%의 범위에서 설정되는 것을 특징으로 하는 장면전환 검출장치.
  9. 제 1항 내지 제 7항 중 어느 한 항에 있어서,
    상기 제2임계값은 1000~1100의 범위 내에서 설정되는 것을 특징으로 하는 장면전환 검출장치.
  10. 압축부호화된 압축영상의 복원 전에 상기 압축영상으로부터 추출한 데이터에 의해 장면전환 프레임을 검출하는 방법에 있어서,
    (a) 상기 압축영상을 구성하는 각각의 프레임에 속하는 블록의 부호화 모드 중에서 화면내 모드로 부호화된 매크로 블록의 비율이 사전에 설정되어 있는 제1임계값보다 큰 프레임을 장면전환 후보프레임으로 검출하는 단계;
    (b) 상기 장면전환 후보프레임에 속하는 블록 중에서 화면내 모드로 부호화된 매크로 블록의 예측 모드를 기초로 상기 화면내 부호화 모드로 부호화된 블록 각각에 대한 복잡도 정보 및 에지방향 정보를 추출하는 단계;
    (c) 상기 장면전환 후보프레임 각각을 복수개의 하위 이미지로 분할하고, 상기 복잡도 정보 및 에지방향 정보를 기초로 분할된 각각의 하위 이미지에 대해 복잡도 히스토그램 빈과 에지 히스토그램 빈을 산출하는 단계; 및
    (d) 상기 장면전환 후보프레임 중에서 시간적으로 연속하는 제1장면전환 후보프레임과 제2장면전환 후보프레임 각각에 대응되는 하위 이미지에 대해 산출된 복잡도 히스토그램 빈과 에지 히스토그램 빈의 차이값이 사전에 설정된 제2임계값 보다 크면 상기 제1장면전환 후보프레임을 장면전환 프레임으로 판단하는 단계;를 포함하는 것을 특징으로 하는 장면전환 검출방법.
  11. 제 10항에 있어서,
    상기 (a)단계는,
    (a1) 상기 프레임을 구성하는 각각의 매크로 블록의 부호화 모드를 분석하는 단계;
    (a2) 상기 프레임을 구성하는 매크로 블록의 개수에 대한 화면내 모드로 부호화되는 매크로 블록의 개수의 백분율을 산출하는 단계; 및
    (a3) 상기 산출된 프레임에 대한 화면내 모드로 부호화되는 매크로 블록의 백분율이 상기 제1임계값보다 큰 프레임을 장면전환 후보프레임으로 검출하는 단 계;를 포함하는 것을 특징으로 하는 장면전환 검출방법.
  12. 제 10항에 있어서,
    상기 (b)단계는,
    (b1) 상기 장면전환 후보프레임을 구성하는 매크로 블록의 크기를 기초로 상기 복잡도 정보를 추출하는 단계; 및
    (b2) 상기 장면전환 후보프레임을 구성하는 매크로 블록의 크기에 대응하여 설정된 예측모드번호에 해당하는 에지방향값에 의해 상기 에지방향 정보를 추출하는 단계;를 포함하는 것을 특징으로 하는 장면전환 검출방법.
  13. 제 12항에 있어서,
    상기 (b)단계에서, 상기 장면전환 후보프레임을 구성하는 매크로 블록의 크기가 16×16 픽셀이면, 매크로 블록을 4×4 픽셀 크기의 블록으로 분할한 후 각각의 4×4 픽셀 크기의 블록에 대해 16×16 예측모드번호에 해당하는 에지방향 값을 할당하여 매크로 블록에 대한 상기 에지방향 정보를 추출하는 것을 특징으로 하는 장면전환 검출방법.
  14. 제 10항에 있어서,
    상기 (c)단계는,
    (c1) 상기 장면전환 후보프레임 각각을 16개의 하위 이미지로 분할하는 단 계; 및
    (c2) 상기 분할된 각각의 하위 이미지에 대해 1가지의 복잡도 히스토그램 빈과 5가지의 에지 히스토그램 빈을 산출하는 단계;를 포함하는 것을 특징으로 하는 장면전환 검출방법.
  15. 제 14항에 있어서,
    상기 (c)단계에서, 상기 하위 이미지 각각에 대해 8×8 픽셀 크기의 블록을 기본 단위로 하여 상기 복잡도 히스토그램 빈과 에지 히스토그램 빈을 산출하는 것을 특징으로 하는 장면전환 검출방법.
  16. 제 10항에 있어서,
    상기 (c)단계에서, 상기 (b)단계에서 얻어진 4×4 픽셀 크기의 블록에 대한 복잡도 정보 및 에지방향 정보를 기초로 다음의 수학식에 의해 8×8 픽셀 크기의 블록단위로 평균 에지 특성을 산출하여 상기 에지 히스토그램 빈을 산출하는 것을 특징으로 하는 장면전환 검출방법:
    Figure 112007007030012-pat00025
    여기서,
    Figure 112007007030012-pat00026
    는 8×8 블록에서 i번째 4×4 블록의 에지방향이고,
    Figure 112007007030012-pat00027
    는 평탄영역(non-edge)이 아닌 4×4 블록의 개수이다.
  17. 제 10항 내지 제 16항 중 어느 한 항에 있어서,
    상기 제1임계값은 60~65%의 범위에서 설정되는 것을 특징으로 하는 장면전환 검출방법.
  18. 제 10항 내지 제 16항 중 어느 한 항에 있어서,
    상기 제2임계값은 1000~1100의 범위 내에서 설정되는 것을 특징으로 하는 장면전환 검출방법.
  19. 제 10항 내지 제 16항 중 어느 한 항에 기재된 장면전환 검출방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020070007255A 2007-01-23 2007-01-23 압축영상의 장면전환 검출장치 및 방법 KR100816013B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070007255A KR100816013B1 (ko) 2007-01-23 2007-01-23 압축영상의 장면전환 검출장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070007255A KR100816013B1 (ko) 2007-01-23 2007-01-23 압축영상의 장면전환 검출장치 및 방법

Publications (1)

Publication Number Publication Date
KR100816013B1 true KR100816013B1 (ko) 2008-03-21

Family

ID=39411428

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070007255A KR100816013B1 (ko) 2007-01-23 2007-01-23 압축영상의 장면전환 검출장치 및 방법

Country Status (1)

Country Link
KR (1) KR100816013B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017166585A1 (zh) * 2016-03-31 2017-10-05 乐视控股(北京)有限公司 视频转场判断方法、装置和电子设备
KR20180121340A (ko) 2017-04-28 2018-11-07 연세대학교 산학협력단 압축 영역에서 야간 영상의 장면 전환 검출 방법 및 장치
KR20190005651A (ko) * 2017-07-07 2019-01-16 삼성에스디에스 주식회사 장면전환 검출 장치 및 방법
CN112203092A (zh) * 2020-09-27 2021-01-08 深圳市梦网视讯有限公司 一种全局运动场景的码流分析方法、系统及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020007915A (ko) * 2000-07-19 2002-01-29 구자홍 엠펙(MPEG) 압축 비디오 환경에서 매크로 블록의시공간상의 분포를 이용한 와이프(Wipe) 및 특수 편집효과 검출 알고리즘
KR20020075956A (ko) * 2001-03-26 2002-10-09 주식회사 코난테크놀로지 장면전환 검출방법
KR20040018506A (ko) * 2001-07-20 2004-03-03 코닌클리케 필립스 일렉트로닉스 엔.브이. 비디오 데이터 스트림에서 카툰을 검출하기 위한 방법 및시스템
JP2004282318A (ja) 2003-03-14 2004-10-07 Sony Corp シーンチェンジ検出方法および装置
KR20040099343A (ko) * 2002-03-29 2004-11-26 코닌클리케 필립스 일렉트로닉스 엔.브이. 프레임 차이들의 히스토그램을 이용하여 비디오내의 장면변경들을 검출하기 위한 방법 및 장치

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020007915A (ko) * 2000-07-19 2002-01-29 구자홍 엠펙(MPEG) 압축 비디오 환경에서 매크로 블록의시공간상의 분포를 이용한 와이프(Wipe) 및 특수 편집효과 검출 알고리즘
KR20020075956A (ko) * 2001-03-26 2002-10-09 주식회사 코난테크놀로지 장면전환 검출방법
KR20040018506A (ko) * 2001-07-20 2004-03-03 코닌클리케 필립스 일렉트로닉스 엔.브이. 비디오 데이터 스트림에서 카툰을 검출하기 위한 방법 및시스템
KR20040099343A (ko) * 2002-03-29 2004-11-26 코닌클리케 필립스 일렉트로닉스 엔.브이. 프레임 차이들의 히스토그램을 이용하여 비디오내의 장면변경들을 검출하기 위한 방법 및 장치
JP2004282318A (ja) 2003-03-14 2004-10-07 Sony Corp シーンチェンジ検出方法および装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017166585A1 (zh) * 2016-03-31 2017-10-05 乐视控股(北京)有限公司 视频转场判断方法、装置和电子设备
KR20180121340A (ko) 2017-04-28 2018-11-07 연세대학교 산학협력단 압축 영역에서 야간 영상의 장면 전환 검출 방법 및 장치
KR102163556B1 (ko) * 2017-04-28 2020-10-07 연세대학교 산학협력단 압축 영역에서 야간 영상의 장면 전환 검출 방법 및 장치
KR20190005651A (ko) * 2017-07-07 2019-01-16 삼성에스디에스 주식회사 장면전환 검출 장치 및 방법
KR102235386B1 (ko) * 2017-07-07 2021-04-01 삼성에스디에스 주식회사 장면전환 검출 장치 및 방법
CN112203092A (zh) * 2020-09-27 2021-01-08 深圳市梦网视讯有限公司 一种全局运动场景的码流分析方法、系统及设备
CN112203092B (zh) * 2020-09-27 2024-01-30 深圳市梦网视讯有限公司 一种全局运动场景的码流分析方法、系统及设备

Similar Documents

Publication Publication Date Title
US20220312021A1 (en) Analytics-modulated coding of surveillance video
JP5524063B2 (ja) ビデオ情報処理
US8139883B2 (en) System and method for image and video encoding artifacts reduction and quality improvement
KR100739790B1 (ko) 인트라 예측 모드 결정 방법 및 장치
EP3389276B1 (en) Hash-based encoder decisions for video coding
US6449392B1 (en) Methods of scene change detection and fade detection for indexing of video sequences
KR20070116717A (ko) 압축된 디지털 이미지의 mpeg 노이즈 강도 측정 방법및 장치
KR20040018506A (ko) 비디오 데이터 스트림에서 카툰을 검출하기 위한 방법 및시스템
US9667969B2 (en) Method and apparatus for encoding a video stream having a transparency information channel
Kong et al. Object-detection-based video compression for wireless surveillance systems
Zhang et al. Fast depth map mode decision based on depth–texture correlation and edge classification for 3D-HEVC
KR100816013B1 (ko) 압축영상의 장면전환 검출장치 및 방법
Ku et al. Bit allocation based on visual saliency in HEVC
CN111683248B (zh) 基于roi的视频编码方法以及视频编码系统
US8644388B2 (en) Method and device for approximating a DC coefficient of a block of pixels of a frame
Zhao et al. Fast CU partition decision strategy based on human visual system perceptual quality
Chen et al. Fast 3D-HEVC depth intra coding based on boundary continuity
Hu et al. In-loop perceptual model-based rate-distortion optimization for HEVC real-time encoder
US20180091808A1 (en) Apparatus and method for analyzing pictures for video compression with content-adaptive resolution
Ma et al. A fast background model based surveillance video coding in HEVC
De Bruyne et al. Temporal video segmentation on H. 264/AVC compressed bitstreams
JP2002064823A (ja) 圧縮動画像のシーンチェンジ検出装置、圧縮動画像のシーンチェンジ検出方法及びそのプログラムを記録した記録媒体
CN114554219A (zh) 一种基于运动检测的率失真优化方法及装置
CN104410863B (zh) 图像处理器以及图像处理方法
EP2187337A1 (en) Extracting a moving mean luminance variance from a sequence of video frames

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
G170 Publication of correction
FPAY Annual fee payment

Payment date: 20130128

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140218

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150227

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20160202

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20170310

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20180119

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20190115

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20200116

Year of fee payment: 13