KR101960006B1 - 비디오 인코딩 방법 및 비디오 인코더 시스템 - Google Patents

비디오 인코딩 방법 및 비디오 인코더 시스템 Download PDF

Info

Publication number
KR101960006B1
KR101960006B1 KR1020150144833A KR20150144833A KR101960006B1 KR 101960006 B1 KR101960006 B1 KR 101960006B1 KR 1020150144833 A KR1020150144833 A KR 1020150144833A KR 20150144833 A KR20150144833 A KR 20150144833A KR 101960006 B1 KR101960006 B1 KR 101960006B1
Authority
KR
South Korea
Prior art keywords
level
light
motion
input video
frames
Prior art date
Application number
KR1020150144833A
Other languages
English (en)
Other versions
KR20160047395A (ko
Inventor
비외른 외스트비
Original Assignee
엑시스 에이비
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엑시스 에이비 filed Critical 엑시스 에이비
Publication of KR20160047395A publication Critical patent/KR20160047395A/ko
Application granted granted Critical
Publication of KR101960006B1 publication Critical patent/KR101960006B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/183Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

디지털 비디오 데이터를 인코딩하는 방법이 개시된다. 입력 비디오 프레임들은 영상들의 그룹들로 정렬되는 출력 비디오 프레임들의 시퀀스로 인코딩된다. 각각의 입력 비디오 프레임은 각각의 압축 값을 사용하여 출력 비디오 프레임으로 인코딩되고, 출력 비디오 프레임들의 시퀀스 내의 영상들의 각각의 그룹은 영상들의 그룹 내에 포함된 프레임들의 수에 의해 정의되는 GOP 길이를 갖는다. 제 1 입력 비디오 프레임에 대해, 상기 입력 비디오 프레임에서의 광의 레벨 및 움직임의 레벨이 결정된다. 만약 상기 광의 레벨이, 미리결정된 임계 값보다 작으면, 미리결정된 일정한 GOP 길이와, 그리고 상기 광의 레벨의 감소 함수인 압축 값을 사용하여, 상기 제 1 입력 비디오 프레임이 인코딩된다. 만약 상기 광의 레벨이 상기 미리결정된 임계 값보다 크면, 상기 움직임의 레벨의 감소 함수인 GOP 길이와, 그리고 상기 광의 레벨의 감소 함수인 압축 값을 사용하여, 상기 제 1 입력 비디오 프레임이 인코딩된다.

Description

비디오 인코딩 방법 및 비디오 인코더 시스템{VIDEO ENCODING METHOD AND VIDEO ENCODER SYSTEM}
본 발명은 디지털 비디오 데이터(digital video data)를 인코딩(encoding)하는 방법에 관한 것이다. 더욱이, 본 발명은 비디오 데이터를 인코딩하기 위한 디지털 비디오 인코더 시스템(digital video encoder system)에 관한 것이다.
네트워크 카메라 모니터링 시스템들과 같은 디지털 비디오 시스템들에서, 비디오 시퀀스(video sequence)들은 다양한 비디오 인코딩 방법들을 사용하여 전송 전에 압축된다. 다수의 디지털 비디오 인코딩 시스템들에서, 비디오 프레임들의 시퀀스의 비디오 프레임들을 압축하기 위해 두 가지 주요 모드들(인트라 모드(intra mode) 및 인터 모드(inter mode))이 사용된다. 인트라 모드에서, 루미넌스(luminance) 및 크로미넌스(chrominance) 채널들은 예측(prediction), 변환(transform), 및 엔트로피(entropy) 코딩을 통해 단일 프레임의 소정의 채널 내의 픽셀들의 공간적 리던던시(spatial redundancy)를 이용함으로써 인코딩된다. 이러한 인코딩된 프레임들은 I-프레임들로서 지칭된다. 인터 모드는 대신, 개별 프레임들 간의 시간적 리던던시(temporal redundancy)를 이용하고, 그리고 픽셀들의 선택된 블록들에 대해 픽셀들에서의 움직임을 하나의 프레임으로부터 또 하나의 다른 프레임으로 인코딩함으로써 하나 이상의 이전에 디코딩(decoding)된 프레임들로부터 프레임의 일부분들을 예측하는 움직임-보상 예측 기법(motion-compensation prediction technique)에 의존하고 있다. 이러한 인코딩된 프레임들은 P-프레임들(순방향-예측 프레임들(forward-predicted frames))(이것은 디코딩 순서에 있어서 이전의 프레임들을 참조할 수 있음), 혹은 B-프레임들(쌍-방향 예측 프레임들(bi-directionally predicted frames))(이것은 둘 이상의 이전에 디코딩된 프레임들을 참조할 수 있으며, 예측을 위해 사용된 프레임들의 어떤 임의의 디스플레이-순서 관계를 가질 수 있음)로서 지칭될 수 있다.
인코딩된 프레임들은, 인코딩된 비디오 시퀀스를 수신하는 사이트(site)에서, 디코딩된다. 네트워크 카메라 모니터링 시스템들에서의 관심사는 인코딩된 비디오의 전송을 위한 이용가능한 대역폭이다. 이것은 다수의 카메라들을 이용하는 시스템들에 있어 특히 그러하다. 예를 들어, 카메라 내의 온-보드 SD 카드(on-board SD card) 상에 이미지들을 저장할 때, 이러한 이미지들을 저장함에 있어 유사한 문제가 일어난다. 고품질 이미지들을 얻고자 하는 것에 대비된 이용가능한 대역폭이 발란스(balance)를 이루도록 하는 타협이 행해져야만 한다. 카메라들로부터의 전송들의 비트 레이트(bit rate)를 감소시킬 목적으로 인코딩을 제어하기 위해 다수의 방법들 및 시스템들이 사용되어 왔다. 이러한 알려진 방법들 및 시스템들은 일반적으로 비트 레이트 한계치를 적용하고 있으며, 카메라로부터의 출력 비트 레이트가 언제나 이러한 비트 레이트 한계치보다 작도록 인코딩을 제어한다. 이런 방식으로, 이용가능한 대역폭이 충분하도록 보장될 수 있으며, 이에 따라 시스템 내의 모든 카메라들은 이들의 비디오 시퀀스들을 수신 사이트(예를 들어, 제어 센터)에 전송할 수 있으며, 이러한 수신 사이트에서 운용자는 해당 시스템의 카메라들로부터의 비디오를 모니터링할 수 있고, 수신 사이트에서 이러한 비디오는 차후의 사용을 위해 기록(record)될 수 있다. 그러나 모든 카메라들에 비트 레이트 한계치를 적용하는 것은 때때로 이미지 품질을 바람직하지않게 저하시킬 수 있는데, 왜냐하면 비트 레이트 한계치는, 모니터링되는 장면에서 무엇이 일어나고 있는지에 상관 없이, 많은 세부사항들을 포함하고 있는 이미지들의 극심한 압축을 요구할 수 있기 때문이다. 예를 들어, 장면 내에 움직임이 있을 때, 예컨대 침입자의 식별이 가능하도록 하기 위해서는 더 높은 이미지 품질을 확보하는 것이 이로울 것인바, 하지만 비트 레이트 한계치는 그 촬영된 장면 내에 움직임이 있을 때 대신에, 더 극심한 압축이 일어나게 할 것이고 그럼으로써 이미지 품질은 더 저하되게 된다.
본 발명의 목적은, 앞서-언급된 종래 기술보다 향상된 디지털 비디오 데이터 인코딩 방법 및 디지털 비디오 인코더 시스템을 제공하려는 것이다.
본 발명의 특정 목적은, 촬영된 장면에서의 일시적 움직임들(temporary movements)의 고품질 비디오 전달이 가능하도록 함과 동시에 출력 비트 레이트를 이용가능한 대역폭에 국한시키는 것을 가능하게 하는 디지털 비디오 데이터 인코딩 방법 및 디지털 비디오 인코더 시스템을 제공하려는 것이다.
제 1 실시형태에 따르면, 앞서언급된 목적들은 전체적으로 혹은 적어도 부분적으로, 입력 비디오 프레임들의 시퀀스에 대응하는 디지털 비디오 데이터를 인코딩하는 방법에 의해 달성되는바, 여기서, 상기 입력 비디오 프레임들은 영상(picture)들의 그룹(group)들로 정렬되는 출력 비디오 프레임들의 시퀀스로 인코딩되고, 영상들의 각각의 그룹은 인트라-프레임과, 그리고 0개 혹은 하나 이상의 후속 인터-프레임들을 포함하며,
각각의 입력 비디오 프레임은 각각의 압축 값(compression value)을 사용하여 출력 비디오 프레임으로 인코딩되고,
상기 출력 비디오 프레임들의 시퀀스 내의 영상들의 각각의 그룹은, 영상들의 그룹 내에 포함된 프레임들의 수에 의해 정의되는 GOP(Group Of Picture) 길이를 갖고,
본 방법은,
제 1 입력 비디오 프레임에 대해, 상기 입력 비디오 프레임에서의 광(light)의 레벨(level) 및 움직임(motion)의 레벨을 결정하는 것과;
만약 상기 광의 레벨이, 미리결정된 임계 값보다 작으면, 미리결정된 일정한 GOP 길이와, 그리고 상기 광의 레벨의 감소 함수(decreasing function)인 압축 값을 사용하여, 상기 제 1 입력 비디오 프레임을 인코딩하는 것과;
만약 상기 광의 레벨이 상기 미리결정된 임계 값보다 크면, 상기 움직임의 레벨의 감소 함수인 GOP 길이와, 그리고 상기 광의 레벨의 감소 함수인 압축 값을 사용하여, 상기 제 1 입력 비디오 프레임을 인코딩하는 것을 포함한다.
이러한 방식으로, 장면에 약간의 광이 존재하는 경우, GOP 길이를 고정시키고 높은 압축 값을 적용함으로써 출력 비트 레이트는 감소될 수 있다. 대부분의 경우 어두운 장면은 어쨌든 상세한 정보를 제공할 수 없기 때문에 그 결과적인 이미지 품질 감소는 일반적으로 허용될 수 있을 것이다. 움직임이 존재하고 장면이 밝은 경우, 예를 들어, 야외에서 낮시간 동안 혹은 조명이 좋은 실내에서는, 더 상세한 정보를 제공하기 위해 더 높은 비트 레이트가 허용될 수 있다. 이러한 접근법은 임의의 비트 레이트 목표치 혹은 한계치를 적용함이 없이 대역폭의 효과적인 사용을 가능하게 한다.
광의 레벨은 신호-대-노이즈 비(signal-to-noise ratio) 및 광 강도(light intensity) 중 적어도 하나로서 결정될 수 있다.
본 발명의 변형예에서, 만약 상기 광의 레벨이 상기 미리결정된 임계 값보다 작다면, 상기 움직임의 레벨이 움직임의 미리결정된 최소 레벨인 경우, 미리결정된 최대 압축 값이 상기 제 1 입력 비디오 프레임을 인코딩하기 위해 사용된다. 그럼으로써, 촬영된 장면이 어두울 때 그리고 움직임이 약간 있거나 혹은 아예 없을 때, 특히 낮은 비트 레이트를 달성하는 것이 가능하다.
만약 상기 광의 레벨이 상기 미리결정된 임계 값보다 크다면, 상기 광의 레벨이 광의 미리결정된 최대 레벨인 경우, 미리결정된 최소 압축 값이 상기 제 1 입력 비디오 프레임을 인코딩하기 위해 사용될 수 있다. 이러한 방식으로, 촬영된 장면이 밝은 경우 고품질 이미지들이 제공될 수 있는바, 이는 노이즈가 약간 존재함을 시사하고, 그리고 결과적으로 이미지들이 높은 수준의 세부사항을 제공할 가능성을 갖게 한다.
본 발명의 변형예에서, 만약 상기 광의 레벨이 상기 미리결정된 임계 값보다 크다면, 상기 움직임의 레벨이 움직임의 미리결정된 최대 레벨인 경우, 미리결정된 최소 GOP 길이가 상기 제 1 입력 프레임을 인코딩하기 위해 사용된다. 그럼으로써, 촬영된 장면에서 움직임의 레벨이 높을 때, 고품질 비디오 시퀀스가 제공될 수 있다.
만약 상기 광의 레벨이 상기 미리결정된 임계 값보다 크다면, 상기 움직임의 레벨이 움직임의 미리결정된 최소 레벨인 경우, 미리결정된 최대 GOP 길이가 사용될 수 있다. 이러한 방식으로, 촬영된 장면에서 움직임이 약간 있거나 혹은 아예 없을 때, 낮은 비트 레이트가 달성될 수 있다.
본 발명은 또한, 상기 움직임의 레벨의 증가 함수(increasing function)인 출력 프레임 레이트(output frame rate)에서 입력 비디오 프레임들의 시퀀스를 인코딩하는 것을 포함할 수 있다. 그럼으로써, 촬영된 장면에서 움직임이 약간 있거나 혹은 아예 없을 때 낮은 비트 레이트가 달성될 수 있고, 그리고 해당 장면에서 움직임의 레벨이 높을 때 더 많은 정보를 제공하는 더 평활화된 비디오 시퀀스가 제공될 수 있다.
만약 제 2 입력 비디오 프레임의 움직임의 레벨이 상기 제 1 입력 비디오 프레임의 움직임의 레벨과 제 1 임계 변화량(threshold change amount)만큼 다르다면, 본 방법은 또한, 출력 프레임 레이트를 미리결정된 프레임 레이트 양(frame rate amount)만큼 변경시키는 것을 포함할 수 있다. 이러한 방식으로, 입력 비디오 프레임들에서의 움직임의 레벨은 모니터링될 수 있고, 움직임의 레벨이 변할 때, 프레임 레이트가 조정될 수 있다. 예를 들어, 만약 카메라가 그 촬영된 장면에서 움직임이 없어 매우 낮은 프레임 레이트(예를 들어, 1 fps)에서 프레임들을 인코딩 및 전송하고 있다면, 입력 비디오 프레임들은 프레임들이 인코딩 및 전송되는 프레임 레이트보다 더 빈번하게 움직임에 대해 점검될 수 있고, 만약 움직임이 검출된다면, 1초보다 작은 시간이 경과했어도, 출력 프레임 레이트는 즉시 증가될 수 있다(왜냐하면 가장 최근의 프레임이 인코딩되기 때문). 따라서 장면에서 움직임을 놓칠 위험이 감소될 수 있다.
본 방법은 또한, 상기 제 1 입력 비디오 프레임에 후속하는 제 2 입력 비디오 프레임에 대해, 제 1 입력 비디오 프레임과 비교해 광의 레벨이 제 1 임계 변화량만큼 변경되었는지를 점검하는 것을 포함할 수 있다. 이러한 방식으로, 만약 해당 장면에서의 광의 레벨이 본질적으로 이전과 동일하다면, 압축 값을 다시 계산할 필요가 없으며, 그럼으로써 본 방법이 특히 계산에 있어 효율적인 방법이 되도록 하는 것이 가능하게 된다.
만약 제 1 입력 비디오 프레임과 비교해 광의 레벨이 상기 임계 변화량만큼 변경되지 않았다면, 상기 제 2 입력 비디오 프레임의 움직임의 제 2 레벨이 상기 제 1 입력 비디오 프레임의 움직임의 제 1 레벨과 제 2 임계 변화량만큼 다른 경우, 상기 움직임의 제 2 레벨에 근거하여 계산된 GOP 길이를 사용하여 상기 제 2 입력 비디오 프레임이 인코딩될 수 있다. 그럼으로써, GOP 길이는 영상들의 현재 그룹이 끝나기 전에도 움직임의 변하는 레벨들에 맞춰 조정될 수 있다.
제 2 실시형태에 따르면, 앞서언급된 목적들은 전체적으로 혹은 적어도 부분적으로, 입력 비디오 프레임들의 시퀀스에 대응하는 비디오 데이터를 인코딩하기 위한 디지털 비디오 인코더 시스템에 의해 달성되는바, 여기서 디지털 비디오 인코더 시스템은,
입력 비디오 프레임들을 영상들의 그룹들로 정렬되는 인트라-프레임들 혹은 인터-프레임들로 처리하도록 구성되는 인코더 모듈(encoder module)과, 여기서 영상들의 각각의 그룹은 인트라-프레임과, 그리고 0개 혹은 하나 이상의 후속 인터-프레임들을 포함하고,
입력 비디오 프레임들에서의 광의 레벨을 결정하도록 구성되는 광 결정 모듈(light determination module)과;
입력 비디오 프레임들에서의 움직임의 레벨을 결정하도록 구성되는 움직임 결정 모듈(motion determination module)과;
입력 비디오 프레임들을 인코딩하기 위해 사용될 압축 값을 설정하도록 구성되는 압축 값 설정 모듈(compression value setting module)과; 그리고
GOP 길이를 영상들의 그룹 내에 포함될 프레임들의 수로서 설정하도록 구성되는 GOP 길이 설정 모듈(GOP length setting module)을 포함하며,
상기 GOP 길이 설정 모듈은, 만약 상기 광의 레벨이, 미리결정된 임계 값보다 작으면, 미리결정된 일정한 GOP 길이를 설정하도록 구성되고,
상기 압축 값 설정 모듈은, 만약 상기 광의 레벨이, 미리결정된 임계 값보다 작으면, 상기 광의 레벨의 감소 함수인 압축 값을 설정하도록 구성되고,
상기 GOP 길이 설정 모듈은, 만약 상기 광의 레벨이 상기 미리결정된 임계 값보다 크다면, 상기 움직임의 레벨의 감소 함수인 GOP 길이를 설정하도록 구성되고, 그리고
상기 압축 값 설정 모듈은, 만약 상기 광의 레벨이 상기 미리결정된 임계 값보다 크다면, 상기 광의 레벨의 감소 함수인 압축 값을 설정하도록 구성된다.
이러한 인코더 시스템을 통해, 장면에 약간의 광이 존재하는 경우, GOP 길이를 고정시키고 높은 압축 값을 적용함으로써 출력 비트 레이트가 감소될 수 있다. 이미 언급된 바와 같이, 대부분의 경우 어두운 장면은 어쨌든 상세한 정보를 제공할 수 없기 때문에 그 결과적인 이미지 품질 감소는 일반적으로 허용될 수 있을 것이다. 움직임이 존재하고 장면이 밝은 경우, 예를 들어, 야외에서 낮시간 동안 혹은 조명이 좋은 실내에서는, 더 상세한 정보를 제공하기 위해 더 높은 비트 레이트가 허용될 수 있다. 본 발명인 인코더 시스템은 임의의 비트 레이트 목표치 혹은 한계치를 적용함이 없이 대역폭의 효과적인 사용을 가능하게 한다.
본 발명의 디지털 비디오 인코더 시스템은 또한, 입력 비디오 프레임들이 인코딩되는 프레임 레이트를 설정하도록 구성되는 프레임 레이트 설정 모듈(frame rate setting module)을 포함할 수 있다. 그럼으로써, 이러한 인코더 시스템은 또한, 출력 비트 레이트를 제어할 수 있다.
실시예에서, 상기 광 결정 모듈은 럭스 미터(lux meter)를 포함한다. 럭스 미터는 입력 비디오 프레임들에서의 광의 레벨을 결정하는 실제 수단을 제공할 수 있다.
광 결정 모듈은 입력 비디오 프레임들에서의 신호-대-노이즈 비를 결정하도록 구성될 수 있다. 이것은 또한, 입력 비디오 이미지들에서의 광의 레벨을 결정하는 실제적인 방법일 수 있다(왜냐하면, 어두운 장면의 이미지들은 밝은 장면 혹은 조명이 좋은 장면의 이미지들보다 일반적으로 더 많은 노이즈를 포함할 것이기 때문).
제 3 실시형태에 따르면, 앞서언급된 목적들은 전체적으로 혹은 적어도 부분적으로, 앞서의 제 2 실시형태에 따른 디지털 비디오 인코더 시스템을 포함하는 카메라에 의해 달성된다.
제 4 실시형태에 따르면, 앞서언급된 목적들은 전체적으로 혹은 적어도 부분적으로, 컴퓨터 판독-가능 저장 매체를 포함하는 컴퓨터 프로그램 제품에 의해 달성되며, 이러한 컴퓨터 판독-가능 저장 매체는 프로세서에 의해 실행될 때 앞서의 제 1 실시형태에 따른 방법을 수행하도록 되어 있는 명령들을 갖는다.
본 발명의 추가 적용가능 범위는 아래에서 제시되는 상세한 설명으로부터 명백하게 될 것이다. 그러나, 본 발명의 바람직한 실시예들을 기재하고 있는 이러한 상세한 설명 및 특정 예들은 오로지 예시적으로 제공되는 것임을 이해해야 한다(왜냐하면, 본 발명의 범위 내에서 다양한 변경 및 수정이 가능함이 이러한 상세한 설명으로부터 본 발명의 기술분야에서 숙련된 자들에게는 명백하게 될 것이기 때문).
따라서, 본 발명이 본 명세서에서 설명되는 디바이스의 특정 구성 요소들 혹은 그 설명되는 방법들의 단계들로만 한정되는 것이 아님을 이해해야 한다(왜냐하면 이러한 디바이스 및 방법은 여러 형태로 존재할 수 있기 때문). 본 명세서에서 사용되는 용어는 오로지 특정 실시예들을 설명할 목적만을 가지고 있는 것이며 본 발명을 한정할 의도를 갖고 있지 않음을 또한 이해해야 한다. 본 명세서 및 첨부되는 청구범위에서 사용되는 바와 같이, 단수적 표현들은 문맥이 분명하게 달리 지시하고 있지 않다면 해당 요소들 중 하나 이상의 요소가 존재함을 의미하도록 의도된 것임을 유의해야만 한다. 따라서, 예컨대, "임의의 대상" 혹은 "상기 대상" 등과 같은 기재는 수 개의 대상들을 포함할 수 있음을 나타낸다. 더욱이, "포함한다"라는 용어는 다른 요소들 혹은 단계들을 배제하지 않는다.
첨부되는 도식적 도면들을 참조하여 그리고 예시적으로 이제 본 발명이 상세히 설명될 것이다.
도 1은 장면을 촬영하는 카메라의 예시이다.
도 2는 본 발명의 변형예에 따른 디지털 비디오 데이터를 인코딩하는 방법의 단계들을 보여주는 흐름도이다.
도 3은 본 발명의 변형예에 따른 인코딩되는 비디오 시퀀스의 예시이다.
도 4는 본 발명의 변형예에 따른 인코딩되는 또 하나의 다른 비디오 시퀀스의 예시이다.
도 5a 내지 도 5c는 압축 값 및 GOP 길이가 광의 레벨 및 움직임의 레벨에 따라 어떻게 변할 수 있는지에 관한 예들을 보여주는 그래프들이다.
도 6은 본 발명의 또 하나의 다른 변형예에 따른 추가적인 단계들을 보여주는 흐름도이다.
도 7은 본 발명의 실시예에 따른 디지털 비디오 인코더 시스템을 나타낸 것이다.
본 발명은 본 발명의 발명자가 실현시킨 다수의 원리들에 기반을 두고 있으며, 이러한 원리들은 움직임이 존재하는 장면들의 고품질 이미지들을 가능하게 함과 동시에 전체 출력 비트 레이트를 감소시키는 이점을 갖는다.
이러한 원리들 중 하나는 인코딩시 사용되는 GOP 길이가 인코딩될 프레임에서의 움직임의 레벨에 따라 달라진다는 것이다. 따라서, 움직임이 약간 있거나 혹은 아예 없을 때는 긴 GOP 길이(long GOP length)가 사용되게 되고, 반면 움직임의 레벨이 높은 때는 짧은 GOP 길이(short GOP length)가 사용되게 된다.
제 2 원리는, 장면 내에 약간의 광이 존재할 때, 움직임의 레벨에 따라 GOP 길이는 더 이상 변하지 않는다는 것이다. 이것은 약간의 광이 존재할 때, 이미지에는 더 많은 노이즈가 존재할 것이기 때문(즉, 신호-대-노이즈 비는 더 낮아질 것이기 때문)이다. 따라서, 노이즈가 움직임으로 해석될 위험이 존재하며, 이것은 실제 어떠한 움직임도 없는 장면에 대해서도 비트 레이트를 높이게 한다. 이러한 것을 처리하기 위해, 광의 레벨이, 미리결정된 임계 값보다 작은 경우에는, 미리결정된 일정한 GOP 길이가 대신 사용되게 된다.
제 3 원리는, 인코딩시 사용되는 압축 값이 인코딩될 프레임에서의 광의 레벨에 따라 달라진다는 것이다. 따라서, 해당 장면에 광이 약간 있을 때는 높은 압축 값이 사용되게 되고, 반면 광이 많이 있을 때는, 낮은 압축 값이 사용되게 된다. 이러한 방식으로, 장면에 광이 많이 있을 때 고품질 이미지들이 제공될 수 있다. 촬영된 장면이 너무 어두워 유용한 정보를 나타내지 못할 때, 이미지 품질은 더 낮아질 것이고, 그럼으로써, 출력 비트 레이트를 감소시키게 된다.
디지털 비디오 데이터를 인코딩할 때 이러한 3개의 원리들을 적용함으로써, 출력 비트 레이트는 전체적으로 감소될 수 있고, 이와 동시에 그 촬영된 장면에 움직임이 존재할 때에는 고품질 이미지들을 또한 제공할 수 있다. 본 발명의 방법 및 시스템은 다수의 시스템들을 사용하는 디지털 비디오 시스템들에서 특히 유용할 수 있다(왜냐하면, 일반적으로, 모든 카메라들에 의해 촬영된 장면들에서 동시에 움직임이 존재하지는 않을 것이기 때문). 따라서, 이용가능한 대역폭은 더 효과적으로 사용될 수 있다(왜냐하면, 임의의 주어진 순간에 움직임이 없는 장면을 촬영하고 있는 카메라들로부터의 출력 비트 레이트는 감소될 수 있고, 동일한 시간에 움직임이 있는 장면을 촬영하고 있는 카메라들은 이용가능한 대역폭을 더 많이 사용할 수 있게 되기 때문).
앞서-언급된 3개의 원리들에 추가하여 적용될 수 있는 제 4 원리는, 이미지 프레임들이 인코딩되는 프레임 레이트가 움직임의 레벨에 따라 달라진다는 것이다. 따라서, 움직임이 약간 있거나 혹은 아예 없을 때, 프레임 레이트는 낮아지게 되고, 반면 움직임의 레벨이 높을 때, 프레임 레이트는 높아지게 된다. 이것은 3개의 먼저-언급된 원리들에 의해 제공되는 비트 레이트 유연성에 추가될 수 있다(왜냐하면, 움직임이 약간 있거나 혹은 아예 없는 장면들을 촬영하는 카메라들은 인코딩된 이미지 프레임들을 매우 낮은 프레임 레이트에서 전송할 수 있고, 그럼으로써, 이용가능한 대역폭 중 작은 부분만을 사용하게 되며, 반면 더 높은 레벨의 움직이 있는 장면들을 촬영하는 카메라들은 인코딩된 이미지들을 더 높은 프레임 레이트에서 전송할 수 있는바, 이것은 이용가능한 대역폭을 더 많이 사용할 수 있게 하기 때문).
본 발명이 이제 예시적으로 먼저 도 1을 참조하여 더 설명될 것이며, 도 1은 장면(2)을 촬영하는 카메라(1)를 보여주고 있다. 도 2를 참조하면, 제 1 입력 이미지 프레임이 인코딩돼야 할 때, 제 1 단계(S1)에서, 프레임에서의 광의 레벨(Vlight)이 결정된다. 이것은 신호-대-노이즈 비를 결정함으로써 행해질 수 있거나, 혹은 해당 장면에서의 광 강도를 결정함으로써 행해질 수 있거나, 혹은 이들을 모두 결정함으로써 행해질 수 있다. 광 강도의 결정은 또한, 예를 들어, 카메라의 하우징 내에 통합되거나 혹은 카메라의 하우징 외부에 있는 럭스 미터를 사용하여 수행될 수 있다. 대안적으로, 혹은 추가적으로, 광 강도는 장면을 촬영하는 센서로부터의 이미지 데이터로부터 정보를 추출함으로써 결정될 수 있다. 예를 들어, 센서 데이터는 YCbCr 컬러 공간으로 변환될 수 있고, Y 혹은 루미넌스 성분이 광 강도로서 사용될 수 있다.
다음으로, 단계(S2)에서, 압축 값(QP)이 광의 레벨(Vlight)의 함수로서 계산된다. 압축 값(QP)은 예를 들어, H.264 압축 포맷에서 사용되는 양자화 매개변수(quantisation parameter)일 수 있다. 압축 값(QP)은 광의 레벨(Vlight)의 감소 함수로서 계산된다. 따라서, 만약 광의 레벨(Vlight)이 높다면(이것은 촬영된 장면이 밝음을 의미함), 압축 값(QP)은 낮을 것이고, 이에 따라 제 1 이미지는 고밀도로 압축되지 않게 되며, 하지만 높은 레벨의 세부사항을 제공할 수 있게 된다. 반면, 만약 광의 레벨(Vlight)이 낮다면(이것은 촬영된 장면이 어두움을 의미함), 압축 값(QP)은 높을 것이고, 이에 따라 제 1 이미지는 더 고밀도로 압축되며, 그럼으로써, 출력 이미지의 품질은 낮아지게 되어 출력 비트 레이트를 감소시키게 된다. 이러한 상충관계(trade-off)는 일반적으로 허용될 수 있을 것이다(왜냐하면, 어두운 장면은 일반적으로 많은 정보를 제공하지 않을 것이기 때문).
만약 계산된 압축 값(QP)이, 미리결정된 값 이상이라면(이것은 광의 레벨이, 미리결정된 임계 값 이하임을 표시함), GOP 길이(즉, 인코딩될 영상들의 그룹의 길이)는 미리결정된 일정한 값으로 설정된다. 예로서, 압축 값(QP)의 미리결정된 값은, QP = 0이 최소 압축을 나타내고, QP = 50이 최대 압축을 나타내는 스케일에서, 35일 수 있고, GOP 길이의 미리결정된 일정한 값은 128(이것은 영상들의 그룹 내에 1개의 인트라-프레임 및 127개의 후속 인터-프레임들이 있음을 의미함)일 수 있다. 이러한 예에서, 가장 긴 허용가능한 GOP 길이는 255이고, 가장 짧은 허용가능한 GOP 길이는 1(이것은 오로지 인트라-프레임들만이 인코딩됨을 의미함)이다.
반면, 만약 계산된 압축 값(QP)이, 미리결정된 임계 값보다 작다면, 단계(S4)에서, 제 1 이미지 프레임에서의 움직임의 레벨(Vmotion)이 결정된다. 움직임의 레벨은, 현재의 이미지 프레임과 하나 이상의 이전의 이미지 프레임들 간의 픽셀 차이들을 결정함으로써, 그리고 변경된 픽셀들의 수를 움직임의 레벨의 척도로서 취함으로써, 결정될 수 있다. 대안적으로, 그 자체가 알려져 있는 더 복합적인 움직임 검출 알고리즘들이 사용될 수 있다.
단계(S5)에서, 인코딩시 사용될 GOP 길이(LGOP)가 움직임의 레벨(Vmotion)의 감소 함수로서 계산된다. 따라서, 만약 움직임의 레벨(Vmotion)이 낮다면, GOP 길이(LGOP)는 길 것이고(이것은 인트라-프레임들 사이에 많은 인터-프레임들이 존재함을 의미함), 만약 움직임의 레벨(Vmotion)이 높다면, GOP 길이(LGOP)는 짧을 것이다(이것은 인트라-프레임들 사이에 인터-프레임들이 몇 개 있거나 혹은 아예 없음을 의미함).
그 다음에, GOP 길이(LGOP)가 (촬영된 장면이 어둡기 때문에) 일정한 값으로서 설정될 때, 혹은 (장면이 밝다면) 움직임의 레벨의 함수로서 설정될 때, 단계(S6)에서, 제 1 이미지가 인트라-프레임으로서 인코딩된다.
다음 입력 이미지 프레임(즉, 제 2 입력 이미지 프레임)에 대해, 변경이 있는지에 대해 장면이 점검돼야하는지가 결정된다. 본 방법은, 각각의 입력 이미지 프레임에 대해 변경이 있는지에 대한 점검을 하도록 설정될 수 있고, 또는 더 낮은 빈도로 점검을 하도록 설정될 수 있다(예를 들어, 매 2개 혹은 4개의 입력 이미지 프레임들마다 점검을 하도록 설정될 수 있음). 이러한 빈도는 사용자에 의해 조정가능하고, 혹은 사전-설정(pre-set)될 수 있다.
만약 장면이 제 2 입력 이미지 프레임에 대해 점검돼야한다면, 단계(S8)에서, 광의 레벨(Vlight)이 임계 변화량보다 더 많은 양만큼 변경되었는지 여부가 결정된다. 만약 그 결과가 긍정이라면, 단계(S2)로 리턴함으로써 새로운 압축 값(QP)이 광의 레벨(Vlight)의 감소 함수로서 계산된다.
그러나, 만약 광의 레벨(Vlight)이 변경되지 않았다면, 새로운 압축 값(QP)을 계산할 필요가 없다. 그 다음에, 본 방법은 단계(S9)로 진행하고, 단계(S9)에서, 움직임의 레벨(Vmotion)이, 미리결정된 임계 변화량보다 더 많은 양만큼 변경되었는지 여부가 결정된다. 만약 그 결과가 긍정이라면, 단계(S5)로 리턴함으로써 새로운 GOP 길이(LGOP)가 움직임의 레벨(Vmotion)의 감소 함수로서 계산된다.
만약 움직임의 레벨(Vmotion)이 변경되지 않았다면, 단계(S10)에서, 제 2 입력 이미지 프레임은 인터-프레임으로서 인코딩된다.
단계(S11)에서, GOP 길이(LGOP)의 현재 값을 영상들의 현재 그룹 내에서 인코딩된 영상들의 수와 비교함으로써, 영상들의 현재 그룹이 완료되었는지가 점검된다. 만약 영상들의 그룹의 끝에 아직 도달하지 않았다면, 본 방법은 단계(S7)로 리턴하여 변경이 있는지에 대해 장면이 점검돼야하는지를 결정한다. 반면, 만약 영상들의 그룹이 완료되었다면, 본 방법은 단계(S6)로 리턴하여 제 3 입력 이미지 프레임을 압축 값(QP) 및 GOP 길이(LGOP)의 현재 값들을 사용하여 인트라-프레임으로서 인코팅하게 된다.
도 3은 입력 이미지 프레임들의 비디오 시퀀스의 예(도 3의 상부 가로열), 그리고 대응하는 인코딩된 출력 이미지 프레임들의 비디오 시퀀스(도 3의 하부 가로열)의 예를 보여준다. 본 발명의 방법을 더 예시하기 위해 다수의 예들이 이제 제시될 것이다. 이러한 예들에서, 광의 레벨(Vlight)은, 0이 매우 어두운 장면을 나타내고 10이 매우 밝은 장면을 나타내는 0 내지 10의 스케일로 측정된다. 움직임의 레벨은 또한, 0이 움직임 없음을 나타내고 10이 움직임 많음을 나타내는 0 내지 10의 스케일로 측정된다. 사용되는 최소 GOP 길이(LGOP , min)는 32일 수 있고, 최대 GOP 길이(LGOP, max)는 255일 수 있다. 일정한 GOP 길이(LGOP , const)는 이러한 예들에서 128로 설정된다. 이러한 일정한 GOP 길이는 광의 레벨이, 미리결정된 임계 값(Vlight , th)보다 작은 경우 사용될 것이다. 이러한 예들에서, 임계 값(Vlight , th)은 3일 수 있다. 압축 값(QP)은 H.264 압축 포맷에서 사용되는 양자화 매개변수일 수 있다. 사용되는 최소 압축 값(QPmin)은 20일 수 있고, 최대 압축 값(QPmax)은 43일 수 있다.
예 1(Example 1)
Vlight = Vlight, min = 0
Vmotion = Vmotion, min = 0
도 3에서 참조 번호 101로 표시된 이러한 입력 이미지 프레임에서, 광의 레벨은 최소치에 있는바, 이것은 촬영된 영상이 완전히 어두운 것으로 고려됨, 혹은 상세한 정보를 전달할 수 없을 만큼 충분히 어두운 것으로 고려됨을 의미한다. 더욱이, 해당 장면에서의 움직임은 없다. 도 2에서 예시된 원리들을 사용하면, 현재 입력 이미지 프레임(101)에 대해 다음과 같은 값들이 계산된다.
QP = QPmax = 43
LGOP = LGOP, const = 128
광의 레벨(Vlight)이 임계 값(Vlight , th)보다 작기 때문에, GOP 길이는 움직임의 레벨에 따라 변하지 않지만, 일정한 값(LGOP , const)으로 설정될 것이다. 도 2에서는, 압축 값(QP)이 35보다 작은지 아니면 35보다 큰지가 그 사용된 결정 인자라는 것에 주목할 수 있다. 그러나, 압축 값(QP)이 광의 레벨(Vlight)의 감소 함수로서 계산되기 때문에, 이것은 광의 레벨(Vlight)이 각각 3보다 큰지 아니면 3보다 작은지에 대응한다. 따라서, GOP 길이를 어떻게 확립할지를 결정하기 위해, 광의 레벨(Vlight)이 점검돼야 하는지 아니면 광의 레벨(Vlight)의 함수로서 계산된 압축 값(QP)이 점검돼야 하는지는 문제가 되지 않는다. 입력 이미지 프레임(101)은 이러한 값들을 사용하여 출력 이미지 프레임(201)으로 인코딩된다. 출력 프레임(201)은 영상들의 제 1 그룹(GOP1)에서 첫 번째 것이 되고 있는바, 따라서, 현재 입력 이미지 프레임(101)은 I-프레임으로서 인코딩된다. 그렇지 않다면, 이것은 P-프레임으로서 인코딩될 것이다.
예 2(Example 2)
Vlight = 5
Vmotion = Vmotion, min = 0
도 3에서 참조 번호 102를 갖는 이러한 입력 프레임에서는, 더 많은 광이 있지만 여전히 움직임은 없다. 이러한 결정에 근거하여, 다음과 같은 값들이 계산된다.
QP = 27
LGOP = LGOP, max = 255
여기서, 광의 레벨은 임계 값(Vlight , th)보다 크고, 따라서 GOP 길이는 움직임의 레벨(Vmotion)의 함수로서 계산된다. 그 다음에, 이러한 계산된 값들은 제 2 입력 이미지 프레임(102)을 제 2 출력 이미지 프레임(202)으로 인코딩하기 위해 사용된다. 이러한 출력 이미지 프레임(202)은 영상들의 제 1 그룹(GOP1) 내에서 마지막에 있는 것이 되고 있는바, 따라서, 제 2 입력 이미지 프레임(102)은 P-프레임으로서 인코딩된다.
예 3(Example 3)
Vlight = 5
Vmotion = 5
도 3에서 참조 번호 103을 갖는 이러한 입력 프레임에서는, 광의 레벨(Vlight)이 예 2에서와 동일 하지만 해당 장면에는 어떤 움직임이 존재한다. 현재 광의 레벨 및 움직임의 레벨에 근거하여, 다음과 같은 값들이 계산된다.
QP = 27
LGOP = 64
이러한 계산된 압축 값(QP) 및 GOP 길이(LGOP)는 제 3 입력 이미지 프레임(103)을 제 3 출력 이미지 프레임(203)으로 인코딩할 때 사용된다. 이러한 출력 이미지 프레임은 영상들의 제 2 그룹(GOP2)을 따라 어딘 가에 위치하게 되어 있는바, 따라서, 제 3 입력 이미지 프레임(103)은 P-프레임으로서 인코딩된다.
예 4(Example 4)
Vlight = Vlight, max = 10
Vmotion = Vmotion, max = 10
이러한 예에서, 참조 번호 104로 표시된 입력 이미지 프레임은 광의 최대 레벨 및 움직임의 최대 레벨을 갖는다. 이러한 결정에 근거하여, 다음과 같은 값들이 계산된다.
QP = QPmin = 20
LGOP = LGOP, min = 32
이러한 값들은 제 4 입력 이미지 프레임(104)을 제 4 출력 이미지 프레임(204)으로 인코딩하기 위해 사용된다. 이러한 출력 이미지 프레임(204)은 영상들의 제 2 그룹(GOP2)의 마지막에 있는 것이 되고 있는바, 따라서, 제 4 입력 이미지 프레임(104)은 인터 모드를 사용하여 P-프레임으로 인코딩된다.
이제 도 4를 참조하면, 변하는 프레임 레이트의 사용을 설명하기 위해 또 하나의 다른 예가 제시될 것이다. 도 4는 입력 이미지 프레임들의 비디오 시퀀스(도 4의 상부 가로열), 그리고 인코딩된 출력 이미지 프레임들의 비디오 시퀀스(도 4의 하부 가로열)를 도시한다.
예 5(Example 5)
이러한 예에서, 움직임의 레벨에 따라 출력 프레임 레이트를 제어하는 원리는 도 2 및 앞서의 예들과 연계되어 이미 논의된 원리들에 추가하여 사용된다. 제 1 이미지 프레임(1001)이 인코딩돼야 하는 경우, 움직임의 레벨 및 광의 레벨이 결정되고, 그리고 이에 근거하여 그 사용될 압축 값 및 GOP 길이가 확립된다. 그러나, 이미지 프레임들이 인코딩될 출력 프레임 레이트를 결정하기 위해 움직임의 레벨은 또한 사용된다. 이러한 이미지 프레임(1001)에서는, 움직임의 제 1 레벨이 존재하고 출력 프레임 레이트는 제 1 출력 프레임 레이트로 설정된다. 제 1 출력 프레임 레이트는 이미지들이 카메라 1의 센서에 의해 촬영되는 입력 프레임 레이트보다 더 낮다. 이러한 예에서, 입력 프레임 레이트는 30 fps이고, 제 1 출력 프레임 레이트는 15 fps이다. 제 1 입력 이미지 프레임(1001)은 I-프레임(2001)으로서 인코딩된다.
다음 입력 이미지 프레임(1002)이 촬영되는 경우, 이미지 프레임(1002)에서의 움직임의 레벨이 결정된다. 움직임의 이러한 제 2 레벨은 움직임의 제 1 레벨과 본질적으로 동일하다(즉, 제 1 입력 이미지 프레임(1001)으로부터 제 2 입력 이미지 프레임(1002)으로 임계 변화량보다 더 많은 양만큼 움직임의 레벨이 변경되지 않았음). 따라서, 이미지 프레임들이 인코딩되는 출력 프레임 레이트는 변경되지 않는다. 입력 프레임 레이트가 제 1 출력 프레임 레이트의 2배로 높기 때문에, 이러한 제 2 입력 이미지 프레임은 인코딩되지 않는다.
제 3 입력 이미지 프레임(1003)이 촬영되는 경우, 움직임의 레벨 및 광의 레벨이 결정되고, 인코딩을 위해 사용될 압축 값 및 GOP 길이가 확립된다. 움직임의 레벨은 움직임의 제 1 레벨과 전반적으로 동일한 채로 유지되고, 따라서 출력 프레임 레이트는 이전의 이미지 프레임들에 대해서와 동일하게 유지된다. 제 3 입력 이미지 프레임은 P-프레임(2003)으로서 인코딩된다.
제 4 입력 이미지 프레임(1004)에 대해서, 움직임의 레벨이 한번 더 결정되는바, 이전의 입력 이미지 프레임(1003)과 비교해서 임계 변화량보다 더 많은 양만큼 변경되지 않았다. 따라서, 출력 프레임 레이트는 유지되고, 제 4 입력 이미지 프레임(1004)은 인코딩되지 않는다.
제 5 입력 이미지 프레임(1005)이 촬영되었을 때, 움직임의 레벨 및 광의 레벨이 움직임의 제 5 레벨 및 광의 제 5 레벨로서 결정된다. 이러한 움직임의 제 5 레벨은 이전의 입력 이미지 프레임들에서의 움직임의 레벨보다 더 높고, 이전의 프레임들과 비교해서 임계 변화량보다 더 많은 양만큼 증가했다. 따라서, 이미지들이 인코딩되게 되는 제 5 출력 프레임 레이트가 확립된다. 이러한 예에서, 제 5 출력 프레임 레이트는 입력 프레임 레이트와 동일하다(즉, 30 fps). 더욱이, 움직임의 제 5 레벨은 제 5 GOP 길이가 이전의 이미지 프레임들에 대해 사용된 GOP 길이보다 더 짧아지게 하는 그러한 것이고, 이에 따라 영상들의 새로운 그룹이 개시되게 된다. 따라서, 제 5 입력 이미지 프레임(1005)은 I-프레임(2005)으로서 인코딩된다.
후속하는 입력 이미지 프레임들(1006, 1007, 및 1008)에 대해서, 동일한 절차가 사용된다. 여기서는, 움직임의 레벨이 감소하지 않고, 따라서 제 5 출력 프레임 레이트는 유지된다. 여기서 유의해야 할 점으로, 움직임의 레벨이 더 증가하게 되는 경우에도 출력 프레임 레이트는 증가될 수 없다는 것이다(왜냐하면 현재 출력 프레임 레이트는 입력 프레임 레이트와 이미 동일하기 때문). 영상들의 현재 그룹의 끝까지, 입력 이미지 프레임들(1006, 1007, 및 1008)은 P-프레임들(2006, 2007, 및 2008)로서 인코딩된다.
이제 도 5a, 도 5b, 및 도 5c를 참조할 것인데, 이들 도면들은 압축 값이 광의 레벨에 따라 어떻게 변할 수 있는지에 관한 그래프(도 5a), 그리고 GOP 길이가 움직임의 레벨에 따라 어떻게 변할 수 있는지에 관한 그래프(도 5b 및 도 5c)를 보여준다. 압축 값(QP)은 인코딩될 이미지 프레임에서의 광의 레벨의 감소 함수로서 결정된다. 이러한 종속성은 도 5a에서 점선으로 표시된 선형 함수를 따를 수 있다. 그러나, 앞서의 예들에서, 이러한 종속성은 도 5a에서 실선으로 표시된 약간 다른 함수를 따른다. 본 예에서 알 수 있는 바와 같이, 광의 최소 레벨(Vlight , min)에서 압축 값(QP)은 최대 값(QPmax)을 취하며, 광의 최대 레벨(Vlight , max)에서 압축 값(QP)은 최소 값(QPmin)을 취한다.
도 5b에서는, 미리결정된 임계 값보다 광의 레벨(Vlight)이 큰 그러한 입력 이미지 프레임에 대해서 GOP 길이(LGOP)가 움직임의 레벨(Vlight)의 함수로서 제시된다. 앞서 설명된 예들에서와 같이, 이러한 임계 값은 3이다. 도 5a와 연계되어 논의된 바와 유사하게, 광의 레벨(Vlight)과 GOP 길이(LGOP) 간의 관계는 선형(점선)일 수 있지만, 앞에서 제시된 예들에서는, 해당 함수가 선형으로부터 약간 벗어나 있다(실선). 어느 경우에서건 보여지는 바와 같이, 움직임의 최소 레벨(Vmotion , min)에 대해 GOP 길이(LGOP)는 최대 값(LGOP , max)을 취한다. 움직임의 최대 레벨(Vmotion , max)에 대해 GOP 길이(LGOP)는 최소 값(LGOP, min)을 취한다.
이제 도 5c를 참조하면, 이 그래프는 미리결정된 임계 값 3과 비교해 광의 레벨(Vlight)이 더 작거나 같은 그러한 입력 이미지 프레임에 대해서 광의 레벨(Vlight)과 GOP 길이 간의 관계를 보여준다. 이미지 프레임들이 어두운 그러한 경우에 대해서는, 움직임의 레벨이 무엇인지에 상관없이 일정한 GOP 길이(LGOP , const)가 사용된다.
도 6을 참조하여, 이제 앞서-설명된 방법의 변형예가 설명될 것이다. 본 발명의 이러한 변형예를 사용하는 경우, 약간의 움직임이 있지만 광의 상태가 양호한 이미지들에 대해 비트 레이트의 추가 절약이 달성될 수 있다. 도 6에서는 도 2에서 제시된 흐름도의 일부, 즉 단계들(S4, S5, 및 S6)이 제시되어 있다. 도 2의 이전 단계들 및 후속 단계들은 변경되지 않은 채 유지되는바, 따라서 여기서는 제시되지 않았고 논의되지 않는다. 도 6에서 제시되는 변형예에서, 만약 단계(S5)에서 설정된 GOP 길이(LGOP)가 64와 비교해 더 크거나 같다면 추가 단계(S5')가 부가된다. 이것은 해당 장면에 움직임이 약간 있음을 시사한다. 출력 비트 레이트를 감소시키기 위해, 압축 값에 대한 한계치가 사용된다. 따라서, 만약 이전에 계산된 압축 값(QP)이 26보다 크다면, 압축 값(QP)은 26으로 재설정된다. 장면에서의 움직임은 약간 있기 때문에, 이에 따른 이미지 품질 감소는 관측자에게 일반적으로 허용될 수 있을 것이다. 만약 이전에 계산된 압축 값이 26보다 작다면, 압축 값은 변경되지 않는다. 단계(S5')에서, 압축 값(QP)이 낮추어지게 되거나 혹은 유지되는 경우, 본 방법은 단계(S6)로 진행하여 이 단계에서 이미지 프레임을 인코딩하게 된다. 만약 단계(S5)에서 계산된 GOP 길이(LGOP)가 64보다 작다면, 본 방법은 어떠한 압축 값 한도를 적용함이 없이 단계(S6)로 진행하여 이 단계에서 이미지 프레임을 인코딩하게 된다.
도 7은 앞서 설명된 방법들에 따른, 디지털 비디오 데이터를 인코딩하기 위해 사용될 수 있는 디지털 비디오 인코더 시스템(3)을 나타낸 도식적 도면이다. 따라서, 이러한 인코더 시스템은 입력 이미지 프레임들에서의 광의 레벨(Vlight)을 결정하도록 구성되는 광 결정 모듈(4)과, 그리고 입력 이미지 프레임들에서의 움직임의 레벨(Vmotion)을 결정하도록 구성되는 움직임 결정 모듈(5)을 구비한다. 본 인코더 시스템(3)은 또한, 입력 이미지 프레임들을 인코딩하기 위해 사용될 압축 값(QP)을 설정하도록 구성되는 압축 값 설정 모듈(6)을 포함한다. 본 인코더 시스템(3)은 또한, 입력 이미지 프레임들을 인코딩할 때 GOP 길이(LGOP)를 영상들의 그룹 내에 포함될 프레임들의 수로서 설정하도록 구성되는 GOP 길이 설정 모듈(7)을 포함한다. GOP 길이 설정 모듈(7)은, 만약 광의 레벨(Vlight)이, 미리결정된 임계 값(Vlight , th)보다 작다면, 미리결정된 일정한 GOP 길이(LGOP , const)를 설정하도록 구성된다. 또한, GOP 길이 설정 모듈(7)은, 만약 광의 레벨(Vlight)이, 미리결정된 임계 값(Vlight , th)보다 크다면, 움직임의 레벨의 감소 함수인 GOP 길이(LGOP)를 설정하도록 구성된다. 압축 값 설정 모듈(6)은 광의 레벨의 감소 함수인 압축 값(QP)을 설정하도록 구성된다.
인코더 시스템(3)은 또한, 입력 이미지 프레임들이 인코딩될 프레임 레이트를 설정하도록 구성되는 프레임 레이트 설정 모듈(8)을 포함한다. 프레임 레이트 설정 모듈(8)은 프레임 레이트를 움직임의 레벨(Vmotion)의 증가 함수로서 설정하도록 구성된다.
인코더 시스템(3)은 카메라(1) 내에 통합될 수 있거나, 혹은 카메라(1)에 동작가능하게 결합되는 별개의 유닛으로서 구현될 수 있다.
광 결정 모듈(4)은 럭스 미터를 포함할 수 있고, 이것은 카메라(1)의 하우징 내에 구성될 수 있거나, 혹은 카메라(1)와는 별도로 존재할 수 있다. 대안적으로, 혹은 추가적으로, 광 결정 모듈(4)은 입력 이미지 프레임들에서의 광 강도를 결정하기 위해 카메라(1)의 센서로부터의 이미지 데이터를 사용할 수 있다.
인코더 시스템(3)의 동작은 일반적으로, 도 2 내지 도 5와 연계되어 설명된 인코딩 방법을 따르는 것일 수 있다.
인코더 시스템(3)은 하드웨어, 펌웨어, 혹은 소프트웨어, 또는 이들의 조합으로서 구현될 수 있다. 본 발명은 컴퓨터 판독-가능 저장 매체를 포함하는 컴퓨터 프로그램 제품의 형태로 구현될 수 있고, 이러한 컴퓨터 판독-가능 저장 매체는 프로세서에 의해 실행될 때 본 발명의 방법을 수행하도록 되어 있는 명령들을 갖는다.
본 발명의 기술분야에서 숙련된 사람은 앞서 설명된 실시예들을 다수의 방법으로 수정할 수 있고 앞서의 실시예들에서 보여지는 바와 같은 본 발명의 이점들을 여전히 이용할 수 있음이 이해될 것이다. 예로서, 본 발명은 MPEG 및 H.264와 같은 다양한 압축 포맷들에 적용가능하다. 본 발명은 일반적으로 인트라-프레임들 및 인터-프레임들을 사용하는 모든 압축 포맷들에 적용가능하다.
앞서 설명된 실시예들의 경우, 사용된 인터-프레임들은 단지 P-프레임들이다. 그러나 본 발명은 또한, B-프레임들과 함께 사용될 수 있다.
앞서의 예들에서 사용된 압축 값들은 H.264 포맷에서 사용되는 양자화 매개변수였다. 그러나, 압축 값은 다른 포맷들을 취할 수 있다. 예를 들어, 압축 값은 미리결정된 최대 압축의 퍼센티지로서 제공될 수 있다(따라서 0%로부터 100%에 이르는 범위를 갖도록 제공될 수 있음).
또한, 인코딩이 시작될 때 사용될 압축 값 및 GOP 길이에 대해 디폴트 값들(default values)이 사전-설정될 수 있다. 첫 번째 이미지 프레임이 인코딩된 이후에는, 앞서 설명된 방법에 따라 GOP 길이 및 압축 값이 설정된다. 대안적으로, GOP 길이 및 압축 값들은 광의 레벨 및 움직임의 레벨에 근거하여 인코딩의 시작시에 이미 설정될 수 있다.
앞서의 설명에서, 최소, 최대, 및 일정한 GOP 길이의 예시적 값들이 언급되었고, 뿐만 아니라 최대 및 최소 압축 값들의 예시적 값들도 언급되었다. 그러나, 다른 값들이 사용될 수 있다. 이러한 것들은 인코딩 방법 혹은 인코더 시스템에서 사전-설정될 수 있거나, 혹은 이들은 사용자에 의해 입력될 수 있다. 이들 값들은 카메라 내의 특정 칩(chip)에 따라 선택될 수 있고, 전송 이미지의 목적에 따라 선택될 수 있으며, 그리고 이용가능한 대역폭에 따라 선택될 수 있다. 예를 들어, 하나의 칩에 대해서는 H.264 포맷에서 사용되는 바와 같은 15 내지 38의 압축 값들(QP)이 이로운 것으로서 발견되었으며, 반면 또 하나의 다른 칩에 대해서는 20 내지 40의 압축 값들이 바람직했다.
마찬가지로, 광의 레벨에 대한 임계 값의 예가 언급되었지만, 이러한 임계치에 대해 다른 값들이 사용될 수 있다. 이것은 또한 사전-설정될 수 있으며 사용자에 의해 구성가능할 수 있다.
앞서 논의된 것들과는 다른 프레임 레이트들이 또한 가능하다.
광의 레벨 및 움직임의 레벨은 다른 측정 스케일들을 사용하여 결정될 수 있다.
본 발명의 방법 및 시스템은 다수의 카메라들을 사용하는 시스템들에 대해 특히 유용하다. 그러나, 이들은 단지 몇 개의 카메라들만을 사용하는 시스템들에서도 또한 유리하게 사용될 수 있다.
본 발명은 모든 종류의 디지털 비디오 카메라들(예를 들어, 가시광을 사용하는 카메라들, IR 카메라들, 혹은 열 카메라들)과 함께 사용될 수 있다. 본 발명은 또한, 아날로그 카메라에 연결되도록 구성되는 비디오 인코더에서 사용될 수 있다.
따라서, 본 발명은 제시된 실시예들로만 한정되는 것이 아니며, 첨부되는 청구항들에 의해 오로지 정의돼야만 한다.

Claims (18)

  1. 압축된 비디오의 전송을 위한 이용가능한 대역폭의 활용을 증진시키는 디지털 비디오 데이터를 압축하는 방법으로서, 상기 방법은,
    입력 비디오 프레임(input video frame)들의 시퀀스(sequence)를 수신하는 단계와; 그리고
    상기 입력 비디오 프레임들의 시퀀스를 영상(picture)들의 그룹(group)들로 정렬되는 출력 비디오 프레임들의 시퀀스로 인코딩하는 단계를 포함하고,
    상기 영상들의 각각의 그룹은, 인트라-프레임(intra-frame) 및 0개 혹은 하나 이상의 후속 인터-프레임(inter-frame)들을 포함하고 그리고 상기 영상들의 그룹 내에 포함된 프레임들의 수에 의해 정의되는 GOP(Group Of Picture) 길이를 가지며,
    상기 입력 비디오 프레임들의 시퀀스를 인코딩하는 단계는,
    상기 입력 비디오 프레임들의 시퀀스로부터의 제 1 입력 비디오 프레임에 대해, 상기 제 1 입력 비디오 프레임의 광(light)의 레벨(level) 및 움직임(motion)의 레벨을 결정하는 것과,
    상기 제 1 입력 비디오 프레임을 인코딩하기 위해 사용될 제 1 압축 값 및 제 2 압축 값을 설정하는 것과, 상기 제 1 압축 값 및 상기 제 2 압축 값은 상기 결정된 광의 레벨의 감소 함수(decreasing function)로 설정되고, 상기 제 1 압축 값은 상기 제 2 압축 값보다 크며,
    상기 광의 레벨이 미리결정된 임계 값 이하인 상태에 있다면, 미리결정된 일정한 GOP 길이와, 그리고 상기 제 1 압축 값을 사용하여 출력 비디오 프레임을 형성하도록 상기 제 1 입력 비디오 프레임을 인코딩하는 것과,
    상기 광의 레벨이 상기 미리결정된 임계 값보다 큰 상태에 있다면, 상기 움직임의 레벨의 감소 함수인 계산된 GOP 길이와, 그리고 상기 제 2 압축 값을 사용하여 출력 비디오 프레임을 형성하도록 상기 제 1 입력 비디오 프레임을 인코딩하는 것을
    포함하는 것을 특징으로 하는 디지털 비디오 데이터를 압축하는 방법.
  2. 제1항에 있어서,
    상기 광의 레벨이 상기 미리결정된 임계 값보다 작은 상태에 있다면, 상기 움직임의 레벨이 움직임의 미리결정된 최소 레벨인 경우, 미리결정된 최대 압축 값이 상기 제 1 입력 비디오 프레임을 인코딩하기 위해 사용되는 것을 특징으로 하는 디지털 비디오 데이터를 압축하는 방법.
  3. 제2항에 있어서,
    상기 광의 레벨이 상기 미리결정된 임계 값보다 큰 상태에 있다면, 상기 광의 레벨이 광의 미리결정된 최대 레벨인 경우, 미리결정된 최소 압축 값이 상기 제 1 입력 비디오 프레임을 인코딩하기 위해 사용되는 것을 특징으로 하는 디지털 비디오 데이터를 압축하는 방법.
  4. 제1항에 있어서,
    상기 광의 레벨이 상기 미리결정된 임계 값보다 큰 상태에 있다면, 상기 움직임의 레벨이 움직임의 미리결정된 최대 레벨인 경우, 미리결정된 최소 GOP 길이가 상기 제 1 입력 프레임을 인코딩하기 위해 사용되는 것을 특징으로 하는 디지털 비디오 데이터를 압축하는 방법.
  5. 제1항에 있어서,
    상기 광의 레벨이 상기 미리결정된 임계 값보다 큰 상태에 있다면, 상기 움직임의 레벨이 움직임의 미리결정된 최소 레벨인 경우, 미리결정된 최대 GOP 길이가 사용되는 것을 특징으로 하는 디지털 비디오 데이터를 압축하는 방법.
  6. 제1항에 있어서,
    상기 인코딩하는 단계는 또한, 상기 움직임의 레벨의 증가 함수(increasing function)인 출력 프레임 레이트(output frame rate)에서 상기 입력 비디오 프레임들의 시퀀스를 인코딩하는 것을 포함하는 것을 특징으로 하는 디지털 비디오 데이터를 압축하는 방법.
  7. 제6항에 있어서,
    상기 인코딩하는 단계는 또한,
    상기 입력 비디오 프레임들의 시퀀스로부터의 제 2 입력 비디오 프레임에 대해, 상기 제 2 입력 비디오 프레임의 움직임의 레벨을 결정하는 것과,
    상기 제 2 입력 비디오 프레임의 움직임의 레벨이 상기 제 1 입력 비디오 프레임의 움직임의 레벨과 제 1 임계 변화량(threshold change amount)만큼 다른 상태에 있다면, 상기 출력 프레임 레이트를 미리결정된 프레임 레이트 양(frame rate amount)만큼 변경시키는 것을
    포함하는 것을 특징으로 하는 디지털 비디오 데이터를 압축하는 방법.
  8. 제1항에 있어서,
    상기 인코딩하는 단계는 또한, 상기 제 1 입력 비디오 프레임에 후속하는 제 2 입력 비디오 프레임에 대해, 상기 제 1 입력 비디오 프레임과 비교해 광의 레벨이 제 1 임계 변화량만큼 변경되었는지를 점검하는 것을 포함하는 것을 특징으로 하는 디지털 비디오 데이터를 압축하는 방법.
  9. 제8항에 있어서,
    만약 상기 제 1 입력 비디오 프레임과 비교해 광의 레벨이 상기 임계 변화량만큼 변경되지 않았다면, 상기 제 2 입력 비디오 프레임의 움직임의 제 2 레벨이 상기 제 1 입력 비디오 프레임의 움직임의 제 1 레벨과 제 2 임계 변화량만큼 다른 경우, 상기 움직임의 제 2 레벨에 근거하여 계산된 GOP 길이를 사용하여 상기 제 2 입력 비디오 프레임을 인코딩하는 것을 특징으로 하는 디지털 비디오 데이터를 압축하는 방법.
  10. 제1항에 있어서,
    만약 상기 광의 레벨이 상기 미리결정된 임계 값보다 크다면, 상기 광의 레벨이 광의 미리결정된 최대 레벨인 경우, 미리결정된 최소 압축 값이 상기 제 1 입력 비디오 프레임을 인코딩하기 위해 사용되는 것을 특징으로 하는 디지털 비디오 데이터를 압축하는 방법.
  11. 비-일시적 컴퓨터 판독가능 저장 매체로서, 상기 비-일시적 컴퓨터 판독가능 저장 매체는 프로세서에 의해 실행될 때 제1항의 방법을 수행하도록 되어 있는 명령들을 갖는 것을 특징으로 하는 비-일시적 컴퓨터 판독가능 저장 매체.
  12. 압축된 비디오의 전송을 위한 이용가능한 대역폭의 활용을 증진시키는 비디오 데이터를 압축하기 위한 디지털 비디오 인코더 시스템(digital video encoder system)으로서, 상기 디지털 비디오 인코더 시스템은,
    입력 비디오 프레임들을 수신하는 입력과;
    영상들의 그룹들로 정렬되는 출력 비디오 프레임들의 시퀀스를 전송하는 출력과; 그리고
    상기 입력 및 상기 출력에 통신가능하게 결합된 프로세서를 포함하고,
    상기 영상들의 각각의 그룹은, 인트라-프레임 및 0개 혹은 하나 이상의 후속 인터-프레임들을 포함하고 그리고 상기 영상들의 그룹 내에 포함된 프레임들의 수에 의해 정의되는 GOP 길이를 가지며,
    상기 프로세서는 상기 입력 비디오 프레임들의 시퀀스를 상기 출력 비디오 프레임들의 시퀀스로 인코딩하고, 상기 프로세서에 의한 인코딩은,
    상기 입력 비디오 프레임들의 시퀀스로부터의 제 1 입력 비디오 프레임에서의 광의 레벨을 결정하는 것과;
    상기 제 1 입력 비디오 프레임에서의 움직임의 레벨을 결정하는 것과;
    상기 광의 레벨의 감소 함수로 설정되게 되는 압축 값을 설정하는 것과; 그리고
    상기 광의 레벨에 근거하여 영상들의 그룹 내에 포함될 프레임들의 수로서 GOP 길이를 설정하는 것을
    수행함으로써 이루어지고,
    상기 GOP 길이는 상기 광의 레벨이 미리결정된 임계 값 이하인 경우 미리결정된 일정한 GOP 길이로 설정되고,
    상기 GOP 길이는 상기 광의 레벨이 상기 미리결정된 임계 값보다 큰 경우 상기 움직임의 레벨의 감소 함수로 설정되는 것을 특징으로 하는 비디오 데이터를 압축하기 위한 디지털 비디오 인코더 시스템.
  13. 제12항에 있어서,
    상기 프로세서는 또한, 입력 비디오 프레임들이 인코딩되는 프레임 레이트를 설정하는 것을 특징으로 하는 비디오 데이터를 압축하기 위한 디지털 비디오 인코더 시스템.
  14. 제13항에 있어서,
    상기 디지털 비디오 인코더 시스템은 또한, 상기 프로세서에 통신가능하게 결합되는 럭스 미터(lux meter)를 포함하는 것을 특징으로 하는 비디오 데이터를 압축하기 위한 디지털 비디오 인코더 시스템.
  15. 제13항에 있어서,
    상기 프로세서는 또한, 입력 비디오 프레임들에서의 신호 대 노이즈 비(signal-to-noise ratio)를 결정하는 것을 특징으로 하는 비디오 데이터를 압축하기 위한 디지털 비디오 인코더 시스템.
  16. 제12항에 있어서,
    상기 디지털 비디오 인코더 시스템은 또한, 상기 프로세서에 통신가능하게 결합되는 럭스 미터를 포함하는 것을 특징으로 하는 비디오 데이터를 압축하기 위한 디지털 비디오 인코더 시스템.
  17. 제12항에 있어서,
    상기 프로세서는 또한, 입력 비디오 프레임들에서의 신호 대 노이즈 비를 결정하는 것을 특징으로 하는 비디오 데이터를 압축하기 위한 디지털 비디오 인코더 시스템.
  18. 제12항에 기재된 디지털 비디오 인코더 시스템을 포함하는 카메라.
KR1020150144833A 2014-10-22 2015-10-16 비디오 인코딩 방법 및 비디오 인코더 시스템 KR101960006B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP14189913.8A EP3013050A1 (en) 2014-10-22 2014-10-22 Video compression with adaptive GOP length and adaptive quantization
EP14189913.8 2014-10-22

Publications (2)

Publication Number Publication Date
KR20160047395A KR20160047395A (ko) 2016-05-02
KR101960006B1 true KR101960006B1 (ko) 2019-03-20

Family

ID=51795510

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150144833A KR101960006B1 (ko) 2014-10-22 2015-10-16 비디오 인코딩 방법 및 비디오 인코더 시스템

Country Status (6)

Country Link
US (1) US9992455B2 (ko)
EP (1) EP3013050A1 (ko)
JP (1) JP6479621B2 (ko)
KR (1) KR101960006B1 (ko)
CN (1) CN105554498B (ko)
TW (1) TWI669941B (ko)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116883522A (zh) * 2015-12-14 2023-10-13 松下电器(美国)知识产权公司 三维数据编码方法、解码方法、编码装置、解码装置
CN106254869A (zh) * 2016-08-25 2016-12-21 腾讯科技(深圳)有限公司 一种视频数据的编解码方法、装置和系统
US10362307B2 (en) * 2016-09-09 2019-07-23 Hanwha Techwin Co., Ltd. Quantization parameter determination method and image capture apparatus
US10277901B2 (en) 2017-05-08 2019-04-30 Axis Ab Encoding a video stream having a privacy mask
EP3468187A1 (en) 2017-10-03 2019-04-10 Axis AB Method and system for encoding video streams
EP3493535B1 (en) * 2017-11-29 2020-09-09 Mitsubishi Electric R & D Centre Europe B.V. Method for controlling a video encoder of a video camera installed on a moving conveyance
JP7027554B2 (ja) * 2018-01-11 2022-03-01 ドルビー ラボラトリーズ ライセンシング コーポレイション コンテンツスキャン適応メタデータを用いた光レベル管理
CN111385571B (zh) * 2018-12-29 2022-07-19 浙江宇视科技有限公司 一种超长图像组码率控制方法及装置
US11470310B2 (en) 2019-06-28 2022-10-11 Comcast Cable Communications, Llc Processing media by adaptive group of pictures structuring
US10970555B2 (en) * 2019-08-27 2021-04-06 At&T Intellectual Property I, L.P. Data-driven event detection for compressed video
US11037599B2 (en) * 2019-11-01 2021-06-15 Qualcomm Incorporated Automatic slow motion video recording
CN112929701B (zh) * 2021-02-04 2023-03-17 浙江大华技术股份有限公司 一种视频编码方法、装置、设备及介质
CN113726815B (zh) * 2021-09-15 2022-12-09 荣耀终端有限公司 一种动态调整视频的方法、电子设备、芯片系统和存储介质
CN114401404B (zh) * 2022-03-24 2022-07-26 深圳比特微电子科技有限公司 一种vpu编码策略的实现方法和装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010012324A1 (en) 1998-03-09 2001-08-09 James Oliver Normile Method and apparatus for advanced encoder system

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03121037A (ja) * 1989-10-05 1991-05-23 Olympus Optical Co Ltd 内視鏡画像データ圧縮装置
US6084641A (en) 1997-08-06 2000-07-04 General Instrument Corporation Fade detector for digital video
US5987180A (en) 1997-09-26 1999-11-16 Sarnoff Corporation Multiple component compression encoder motion search method and apparatus
US6307886B1 (en) * 1998-01-20 2001-10-23 International Business Machines Corp. Dynamically determining group of picture size during encoding of video sequence
JP2002034030A (ja) * 2000-07-13 2002-01-31 Hitachi Ltd 監視カメラシステム
US6731685B1 (en) * 2000-09-20 2004-05-04 General Instrument Corporation Method and apparatus for determining a bit rate need parameter in a statistical multiplexer
US6959044B1 (en) * 2001-08-21 2005-10-25 Cisco Systems Canada Co. Dynamic GOP system and method for digital video encoding
JP3888533B2 (ja) * 2002-05-20 2007-03-07 Kddi株式会社 画像特徴に応じた画像符号化装置
JP2007081474A (ja) * 2005-09-09 2007-03-29 Toshiba Corp 画像符号化装置及び方法
JP2009010612A (ja) * 2007-06-27 2009-01-15 Sharp Corp 画像圧縮装置および画像圧縮方法
CN102037730B (zh) * 2008-05-22 2013-06-12 爱立信电话股份有限公司 内容自适应视频编码器和编码方法
US20110211633A1 (en) 2008-11-12 2011-09-01 Ferran Valldosera Light change coding
KR101346008B1 (ko) * 2009-03-13 2013-12-31 돌비 레버러토리즈 라이쎈싱 코오포레이션 고 동적 범위, 가시 동적 범위, 및 광색역 비디오의 층상 압축
US8976857B2 (en) 2011-09-23 2015-03-10 Microsoft Technology Licensing, Llc Quality-based video compression
US20130342690A1 (en) * 2012-06-26 2013-12-26 Thomas H. Williams Technique for Enhancing the Quality of Compressed Video Images
US9402114B2 (en) * 2012-07-18 2016-07-26 Cisco Technology, Inc. System and method for providing randomization in adaptive bitrate streaming environments
EP3070695B1 (en) * 2015-03-16 2017-06-14 Axis AB Method and system for generating an event video sequence, and camera comprising such system
US10542283B2 (en) * 2016-02-24 2020-01-21 Wipro Limited Distributed video encoding/decoding apparatus and method to achieve improved rate distortion performance

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010012324A1 (en) 1998-03-09 2001-08-09 James Oliver Normile Method and apparatus for advanced encoder system

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Yoneyama A et al: "MPEG encoding algorithms with scene adaptive dynamic GOP structure", Multimedia Signal Processing, 1999 IEEE 3rd Workshop on Copenhagen, pages 297-302.
Zhang Yang et al: "High dynamic range video compression by intensity depenent spatial quantization in HEVC", 8 December 2013, pages 353-356.

Also Published As

Publication number Publication date
US9992455B2 (en) 2018-06-05
CN105554498A (zh) 2016-05-04
TW201628405A (zh) 2016-08-01
KR20160047395A (ko) 2016-05-02
TWI669941B (zh) 2019-08-21
JP6479621B2 (ja) 2019-03-06
EP3013050A1 (en) 2016-04-27
US20160119588A1 (en) 2016-04-28
CN105554498B (zh) 2020-03-13
JP2016086412A (ja) 2016-05-19

Similar Documents

Publication Publication Date Title
KR101960006B1 (ko) 비디오 인코딩 방법 및 비디오 인코더 시스템
JP6496234B2 (ja) ビデオの符号化方法及びビデオ符号化システム
KR101439484B1 (ko) 잡음을 고려하여 영상을 복호화하는 방법 및 장치
KR101938805B1 (ko) 비디오 카메라의 적외선 차단 필터를 제어하기 위한 방법
TW201643830A (zh) 用於產生事件視訊序列之方法及系統及包含該系統之攝影機
US10341675B2 (en) Video encoding method and video encoder system
US10979711B2 (en) Method and encoder system for encoding video
TWI674796B (zh) 用於即時編碼之方法及裝置
US8488892B2 (en) Image encoder and camera system
EP3379820A1 (en) Controller, video camera, and method for controlling a video camera
EP3547684B1 (en) Method, device and system for encoding a sequence of frames in a video stream
WO2017104011A1 (ja) 画像符号化装置
KR100842545B1 (ko) 조도값을 이용한 가중요소 결정 방법 및 이를 위한 이동통신 단말기
JP2011029690A (ja) 電子カメラ及び画像符号化方法
JPWO2011161883A1 (ja) 画像処理装置および画像処理プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant