KR20190109476A - 비디오 인코딩 방법, 장치, 및 디바이스, 및 저장 매체 - Google Patents

비디오 인코딩 방법, 장치, 및 디바이스, 및 저장 매체 Download PDF

Info

Publication number
KR20190109476A
KR20190109476A KR1020197024476A KR20197024476A KR20190109476A KR 20190109476 A KR20190109476 A KR 20190109476A KR 1020197024476 A KR1020197024476 A KR 1020197024476A KR 20197024476 A KR20197024476 A KR 20197024476A KR 20190109476 A KR20190109476 A KR 20190109476A
Authority
KR
South Korea
Prior art keywords
image frame
encoded
frame
motion amplitude
image
Prior art date
Application number
KR1020197024476A
Other languages
English (en)
Other versions
KR102225235B1 (ko
Inventor
야오야오 궈
쉬난 마오
천천 구
신웨이 가오
타오 장
Original Assignee
텐센트 테크놀로지(센젠) 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 filed Critical 텐센트 테크놀로지(센젠) 컴퍼니 리미티드
Publication of KR20190109476A publication Critical patent/KR20190109476A/ko
Application granted granted Critical
Publication of KR102225235B1 publication Critical patent/KR102225235B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

멀티미디어 기술의 분야에 속하는, 비디오 인코딩 방법, 장치, 및 디바이스, 및 저장 매체가 개시되어 있다. 이 방법은: 슬라이딩 윈도에 따라 비디오의 이미지 프레임 시퀀스 상의 N개의 이미지 프레임을 결정하는 단계; 상기 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이 값을 취득하는 단계; 상기 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이 값에 따라 정적 변수를 업데이트하는 단계 - 상기 정적 변수는 결정된 연속적인 정적 이미지 프레임들의 수를 지시하는 데 사용됨 -; 상기 업데이트된 정적 변수가 제1 사전설정된 임계치 이상일 때, 인코딩될 이미지 프레임을 I-프레임으로 인코딩하는 단계를 포함한다. 본 출원은 비디오가 장시간 동안 정적 장면에 있는지를 결정하기 위한 방법을 제공하고, 비디오가 장시간 동안 정적 장면에 있다고 결정될 때 비디오가 I-프레임으로 인코딩되고, 이로써 너무 많은 P-프레임의 삽입을 피하여, 인코딩의 품질을 개선할 뿐만 아니라, 인코딩의 효율도 개선한다.

Description

비디오 인코딩 방법, 장치, 및 디바이스, 및 저장 매체
관련 출원
본 출원은 2017년 6월 15일에 중국 국가 지적 재산권 관리국에 출원된 발명의 명칭이 "비디오 인코딩 방법, 장치, 및 디바이스, 및 저장 매체"인 중국 특허 출원 제2017104613677호에 대한 우선권을 주장하며, 그 전체 내용이 인용에 의해 포함된다.
본 출원은 멀티미디어 기술들의 분야에 관한 것으로, 특히, 비디오 인코딩 방법, 장치, 및 디바이스, 및 저장 매체에 관한 것이다.
인터넷의 대중화와 멀티미디어 기술의 급속한 발전에 따라, 비디오의 응용은 점점 더 넓어지고, 많은 경우에, 예를 들어, 복수의 사용자가 비디오 통화를 행할 때 또는 사용자가 온라인으로 비디오를 시청할 때, 비디오 송신이 필요하다. 비디오의 이미지 프레임 시퀀스는 복수의 이미지 프레임을 포함하고, 비디오를 송신하는 프로세스에서, 송신되는 데이터의 양은 이미지 프레임들이 직접 송신되는 경우 매우 크다. 따라서, 데이터의 양을 감소시키기 위해 송신 전에 인코딩이 필요하다.
H.264 표준은 공통 비디오 인코딩 표준이고, I 프레임 및 P 프레임을 포함한다. I 프레임은 현재 이미지 프레임을 완전히 인코딩함으로써 획득된 프레임이고, P 프레임은 현재 이미지 프레임과 이전 이미지 프레임 간의 차이 데이터에 따라 인코딩을 수행함으로써 획득된 프레임이다. I 프레임은 이미지 프레임 내에 데이터를 완전히 유지하며, 여기서 인코딩 품질은 높다. 그러나, P 프레임은 차이 데이터에 따라 인코딩되기만 하면 되고, 여기서 인코딩 효율은 높지만, 인코딩 품질은 낮다. 인코딩된 I 프레임 및 P 프레임은 픽처 그룹(GOP)을 구성할 수 있고, GOP는 I 프레임으로 시작되고 다음 I 프레임 전에 P 프레임으로 종료된다.
비디오에서 발생하는 장면 스위칭 동안, 현재 이미지 프레임과 이전 이미지 프레임 간의 차이가 크다는 사실을 고려하여, 현재 이미지 프레임이 P 프레임으로서 인코딩되는 경우, 인코딩 품질은 너무 많이 열화되고, 따라서 현재 이미지 프레임은 I 프레임으로서 인코딩될 수 있다. 따라서, 인코딩 동안, 현재 이미지 프레임과 이전 이미지 프레임 간의 잔차가 획득될 수 있다. 잔차는 현재 이미지 프레임과 이전 이미지 프레임 간의 차이를 나타낼 수 있다. 잔차가 사전설정된 임계치보다 큰지가 결정되고, 잔차가 사전설정된 임계치 값보다 클 때, 장면 스위칭이 비디오에서 발생한다고 결정될 수 있고, 현재 이미지 프레임은 I 프레임으로서 인코딩된다.
본 출원을 구현하는 프로세스에서, 본 발명자는 관련 기술이 적어도 다음의 단점을 겪는다는 것을 발견하였다: 전술한 방법은 일부 경우에 과도한 P 프레임들을 연속적으로 인코딩하여, 인코딩 품질의 열화를 초래하는 결과로 이어질 수 있다.
본 출원의 실시예들은 인코딩 품질 열화의 문제점을 해결할 수 있는 비디오 인코딩 방법, 장치, 및 디바이스, 및 저장 매체를 제공한다. 기술적 해결책들은 다음과 같다:
제1 양태에 따르면, 비디오 인코딩 디바이스에 적용되는 비디오 인코딩 방법이 제공된다. 상기 방법은 다음을 포함한다:
슬라이딩 윈도에 따라 비디오의 이미지 프레임 시퀀스에서의 N개의 이미지 프레임을 결정하는 단계 - 상기 슬라이딩 윈도 내의 이미지 프레임들은 N-1개의 인코딩된 이미지 프레임 및 상기 윈도의 후미에 위치한 하나의 인코딩될 이미지 프레임을 포함함 -;
상기 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이를 획득하는 단계 - 상기 이미지 프레임의 모션 진폭 차이는 대응하는 이미지 프레임의 모션 진폭과 이전 이미지 프레임의 모션 진폭 간의 차이이고, 상기 이미지 프레임의 모션 진폭은 상기 대응하는 이미지 프레임의 프레임 간 예측 비용 및 프레임 내 예측 비용 간의 비율임 -;
상기 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이에 따라 정적 변수를 업데이트하는 단계 - 상기 정적 변수는 결정된 연속적인 정적 이미지 프레임들의 양을 지시하는 데 사용됨 -; 및
업데이트된 정적 변수가 제1 사전설정된 임계치 이상일 때, 상기 인코딩될 이미지 프레임을 I 프레임으로서 인코딩하는 단계.
제2 양태에 따르면, 비디오 인코딩 장치가 제공된다. 상기 장치는 다음을 포함한다:
슬라이딩 윈도에 따라 비디오의 이미지 프레임 시퀀스에서의 N개의 이미지 프레임을 결정하도록 구성된 결정 모듈 - 상기 슬라이딩 윈도 내의 이미지 프레임들은 N-1개의 인코딩된 이미지 프레임 및 상기 윈도의 후미에 위치한 하나의 인코딩될 이미지 프레임을 포함함 -;
상기 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이를 획득하도록 구성된 제1 획득 모듈 - 상기 이미지 프레임의 모션 진폭 차이는 대응하는 이미지 프레임의 모션 진폭과 이전 이미지 프레임의 모션 진폭 간의 차이이고, 상기 이미지 프레임의 모션 진폭은 상기 대응하는 이미지 프레임의 프레임 간 예측 비용 및 프레임 내 예측 비용 간의 비율임 -;
상기 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이에 따라 정적 변수를 업데이트하도록 구성된 제2 획득 모듈 - 상기 정적 변수는 결정된 연속적인 정적 이미지 프레임들의 양을 지시하는 데 사용됨 -; 및
업데이트된 정적 변수가 제1 사전설정된 임계치 이상일 때, 상기 인코딩될 이미지 프레임을 I 프레임으로서 인코딩하도록 구성된 인코딩 모듈.
제3 양태에 따르면, 비디오 인코딩 디바이스가 제공된다. 상기 비디오 인코딩 디바이스는 프로세서 및 메모리를 포함하고, 상기 메모리는 적어도 하나의 명령어를 저장하고, 상기 명령어는 상기 제1 양태에 따른 비디오 인코딩 방법을 구현하기 위해 상기 프로세서에 의해 로딩되고 실행된다.
제4 양태에 따르면, 컴퓨터 판독가능 저장 매체가 제공된다. 상기 컴퓨터 판독가능 저장 매체는 적어도 하나의 명령어를 저장하고, 상기 명령어는 상기 제1 양태에 따른 비디오 인코딩 방법에서 수행되는 동작들을 수행하기 위해 상기 프로세서에 의해 로딩되고 실행된다.
본 출원의 실시예들에서 제공되는 기술적 해결책들은 다음의 유익한 효과들을 야기한다:
본 출원의 실시예들에서 제공되는 방법, 장치, 디바이스, 및 저장 매체에서, 슬라이딩 윈도에 따라 N개의 이미지 프레임이 결정되고, 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이에 따라 정적 변수가 업데이트되고, 업데이트된 정적 변수가 제1 사전설정된 임계치 이상일 때, 슬라이딩 윈도 내부의 비디오는 장시간 동안 정적 장면에 있다고 결정되어, I 프레임이 인코딩된다. 본 출원은 비디오가 장시간 동안 정적 장면에 있는지를 결정하기 위한 방식을 제공하며, 여기서 비디오가 장시간 동안 정적 장면에 있다고 결정될 때 I 프레임이 인코딩되어, 과도한 P 프레임들의 삽입을 피하여, 인코딩 품질과 인코딩 효율 양쪽 모두가 개선된다.
본 출원의 실시예들에서의 기술적 해결책들을 보다 명확하게 설명하기 위해, 이하에서는 실시예들을 설명하기 위해 요구되는 첨부 도면들을 간단히 설명한다. 명백히, 이하의 설명에서의 첨부 도면들은 단지 본 출원의 일부 실시예들을 도시하고, 본 기술분야의 통상의 기술자는 창의적 노력 없이 이러한 첨부 도면들로부터 다른 도면들을 여전히 도출할 수 있다.
도 1은 본 출원의 실시예에 따른 구현 환경의 개략도이다.
도 2는 본 출원의 실시예에 따른 다른 구현 환경의 개략도이다.
도 3은 본 출원의 실시예에 따른 비디오 인코딩 방법의 흐름도이다.
도 4a는 본 출원의 실시예에 따른 슬라이딩 윈도 및 이미지 프레임의 개략도이다.
도 4b는 본 출원의 실시예에 따라 슬라이딩 윈도를 이동시키는 것의 개략도이다.
도 5는 본 출원의 실시예에 따른 비디오 인코딩 방법의 흐름도이다.
도 6은 본 출원의 실시예에 따른 비디오 인코딩 방법의 흐름도이다.
도 7은 본 출원의 실시예에 따른 비디오 인코딩 장치의 개략 구조도이다.
도 8은 본 출원의 실시예에 따른 단말기의 개략 구조도이다.
도 9는 본 출원의 실시예에 따른 서버의 개략 구조도이다.
본 출원의 실시예들에서의 기술적 해결책들은 본 출원의 실시예들에서의 첨부 도면들을 참조하여 이하에서 명확하고 완전히 설명될 것이다. 설명될 실시예들은 본 출원의 모든 실시예들이 아니라 단지 일부라는 것이 명백하다. 창의적 노력 없이 본 출원의 실시예들에 기초하여 본 기술분야의 통상의 기술자에 의해 획득되는 다른 모든 실시예들은 본 출원의 보호 범위 내에 있을 것이다.
관련 기술이 정적 장면에 I 프레임을 삽입하기 위한 해결책을 제공하지 않고 비디오가 장시간 동안 정적 장면에 있을 때 과도한 P 프레임들이 인코딩되어, 비디오의 인코딩 품질의 심각한 열화를 초래한다는 사실을 고려하여, I 프레임을 적절히 인코딩하는 것이 전반적인 성능에 상당히 기여한다. 따라서, 본 출원의 실시예들은 정적 장면이 장시간 동안 지속될 때 I 프레임을 인코딩하는 방법을 제공하여, 인코딩 품질을 개선할 수 있다. 또한, 비디오에서 장면 스위칭이 발생하는 동안 I 프레임을 인코딩하는 해결책이 제공되어, 과도한 I 프레임들을 인코딩하는 것을 피하면서 인코딩 품질을 개선할 수 있다. I 프레임을 인코딩하기 위한 전술한 방법의 상세에 대해서는 이하의 실시예들을 참조한다.
본 출원의 실시예들은 구현 환경을 제공한다. 구현 환경은 제1 디바이스(101) 및 제2 디바이스(102)를 포함한다. 제1 디바이스(101) 및 제2 디바이스(102)는 네트워크를 통해 서로 연결된다. 제2 디바이스(102)에 비디오를 송신할 때, 제1 디바이스(101)는 먼저 비디오를 인코딩하고, 인코딩된 비디오를 제2 디바이스(102)에 전송할 필요가 있다. 제2 디바이스(102)는 원래 비디오를 획득하기 위해 디코딩을 수행한다.
본 출원의 실시예들은 온라인으로 비디오를 재생하는 시나리오에 적용될 수 있다. 도 1을 참조하면, 제1 디바이스(101)는 비디오를 제공하도록 구성된 비디오 서버이고, 제2 디바이스(102)는 비디오를 재생하도록 구성된 단말기이다. 인코딩된 비디오를 획득한 후에, 비디오 서버는 트랜스코딩 프로세스 동안, 비디오를 트랜스코딩할 수 있고, 본 출원의 실시예들에서 제공된 인코딩 방법을 이용하여 I 프레임을 인코딩하여, 인코딩된 비디오를 획득하고, 인코딩된 비디오를 단말기에 전송한다. 인코딩된 비디오를 디코딩한 후에, 단말기는 비디오를 재생하여, 사용자가 단말기 상에서 비디오를 볼 수 있게 한다.
본 출원의 실시예들은 대안적으로 비디오 통화 시나리오에 적용될 수 있다. 도 2를 참조하면, 제1 디바이스(101) 및 제2 디바이스(102)는 비디오 통화를 행하는 2개의 단말기이다. 제1 디바이스(101) 및 제2 디바이스(102)는 서버(103)를 통해 서로 연결된다. 비디오 통화를 행하는 처리에서, 제1 디바이스(101)가 이미지 프레임을 획득할 때마다, 제1 디바이스(101)는, 이미지 프레임을 인코딩한 후에 이미지 프레임을 서버(103)에 전송하고, 서버(103)는 이미지 프레임을 제2 디바이스(102)에 전달한다. 제2 디바이스(102)는, 디코딩을 수행한 후에 이미지 프레임을 재생한다. 제1 디바이스(101)는 복수의 이미지 프레임을 획득할 수 있고, 제2 디바이스(102)는 복수의 이미지 프레임을 연속적으로 재생하여 비디오를 재생할 수 있어서, 사용자는 제2 디바이스(102) 상에서 비디오를 볼 수 있다.
물론, 본 출원의 실시예들은 대안적으로 비디오 송신의 다른 시나리오에 적용될 수 있다. 상세들은 본 명세서에서 제공되지 않는다.
도 3은 본 출원의 실시예에 따른 비디오 인코딩 방법의 흐름도이다. 본 출원의 이 실시예는 정적 장면에서 I 프레임으로서 이미지 프레임을 인코딩하는 프로세스를 설명하며, 여기서 프로세스는 비디오 인코딩 디바이스에 의해 실행된다. 비디오 인코딩 디바이스는 단말기 또는 서버와 같은 비디오 송신 기능을 갖는 디바이스일 수 있다. 도 3을 참조하면, 이 방법은 다음을 포함한다:
301: 비디오 인코딩 디바이스는 슬라이딩 윈도에 따라 비디오의 이미지 프레임 시퀀스에서의 N개의 이미지 프레임을 결정한다.
슬라이딩 윈도의 길이는 N과 동등하고, 여기서 N은 1보다 큰 양의 정수이다. N은 비디오의 프레임 레이트에 따라 결정될 수 있고, 예를 들어 프레임 레이트의 2/3일 수 있다.
비디오의 이미지 프레임 시퀀스를 인코딩하는 프로세스에서, N개의 이미지 프레임은 매번 슬라이딩 윈도를 이용하여 결정될 수 있다. N개의 이미지 프레임은 N-1개의 인코딩된 이미지 프레임 및 슬라이딩 윈도의 후미에 위치한 하나의 인코딩될 이미지 프레임을 포함한다. 이 경우에, 인코딩될 이미지 프레임은 슬라이딩 윈도 내의 이미지 프레임들에 따라 인코딩될 수 있다.
예를 들어, 도 4a를 참조하면, 비디오의 인코딩이 시작될 때, 이미지 프레임 시퀀스에서의 제1 이미지 프레임은 I 프레임으로서 인코딩되고, 비디오의 제2 이미지 프레임 내지 제(N-1) 이미지 프레임은 모두 P 프레임들로서 인코딩되고, 제N 이미지 프레임이 획득되고, 슬라이딩 윈도 내의 제N 이미지 프레임의 인코딩이 시작된다.
본 출원의 이 실시예에서, 하나의 인코딩될 이미지 프레임은 설명을 위한 예로서 사용된다는 점에 유의해야 한다. 인코딩될 이미지 프레임은 비디오의 제N 이미지 프레임, 또는 제N 이미지 프레임 이후의 임의의 이미지 프레임일 수 있다. 예를 들어, 슬라이딩 윈도가 매번 이동되는 스텝 길이는 1로 설정된다. 구체적으로, 슬라이딩 윈도는 매번 하나의 프레임만큼 이동된다. 따라서, 제N 이미지 프레임 및 제N 이미지 프레임 이후의 각각의 이미지 프레임은 모두 본 출원의 이 실시예에서 제공된 인코딩 방법을 이용하여 인코딩될 수 있다. 제N 이미지 프레임 이전의, 제1 이미지 프레임 이외의 이미지 프레임들과 관련하여, 이미지 프레임들이 I 프레임에 가깝고 인코딩 품질은 이미지 프레임들이 P 프레임들로서 인코딩될 때 너무 많이 열화되지 않을 것이기 때문에, 이미지 프레임들을 디폴트로 P 프레임들로서 인코딩하기만 하면 된다.
302. 비디오 인코딩 디바이스는 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이를 획득한다.
이미지 프레임의 모션 진폭은 이미지 프레임의 프레임 간 예측 비용 및 프레임 내 예측 비용 간의 비율이고, 이미지 프레임과 이전 이미지 프레임 간의 변화 진폭을 나타낼 수 있다. 이미지 프레임과 이전 이미지 프레임 간의 변화 진폭이 더 크면, 모션 진폭은 더 크고, 이미지 프레임과 이전 이미지 프레임 간의 변화 진폭이 더 작으면, 모션 진폭은 더 작다.
이미지 프레임의 모션 진폭 차이는 이미지 프레임의 모션 진폭과 이전 이미지 프레임의 모션 진폭 간의 차이이고, 이미지 프레임의 변화 진폭과 이전 이미지 프레임의 변화 진폭 간의 변동을 나타내는 데 사용된다. 모션 진폭 차이가 더 크면, 그것은 이미지 프레임의 변화 진폭과 이전 이미지 프레임의 변화 진폭 간의 변동이 더 급격하다는 것을 나타내고, 모션 진폭 차이가 더 작으면, 그것은 이미지 프레임의 변화 진폭과 이전 이미지 프레임의 변화 진폭 간의 변동이 더 완만하다는 것을 나타낸다. 전술한 변화 진폭들 간의 차이는 2개의 이미지 프레임의 디스플레이된 스크린들 간의 차이를 나타낼 수 있다. 모션 진폭 차이가 크면, 그것은 스크린 차이가 크다는 것을 지시하고, 모션 진폭 차이가 작으면, 그것은 스크린 차이가 작다는 것을 지시한다.
Icost는 프레임 내 예측 비용을 나타내고, Pcost는 프레임 간 예측 비용을 나타내고, 제N 이미지 프레임의 모션 진폭은
Figure pct00001
이고, 제N 이미지 프레임의 모션 진폭 차이는 ηnnn -1이고, n은 비디오의 이미지 프레임 시퀀스에서의 이미지 프레임의 일련 번호를 나타낸다.
=는 비디오의 이미지 프레임 시퀀스에서의 이미지 프레임의 일련 번호를 나타낸다. 이미지 프레임의 프레임 내 예측 비용 Icost와 관련하여, 이미지 프레임에 대해 다운-샘플링이 수행된 후에, 샘플링된 이미지 프레임은 지정된 크기의 복수의 매크로블록으로 분할되고, 복수의 방향에서 각각의 매크로블록의 예측된 블록들이 계산되고, 매크로블록과 예측된 블록 간의 잔차의 SATD가 계산되어, 최적의 프레임 내 예측 비용 Icost를 획득한다. 다운-샘플링 동안의 샘플링 진폭은 요건에 따라 결정될 수 있다. 예를 들어, 샘플링된 이미지 프레임의 길이는 원래 이미지 프레임의 길이의 절반일 수 있고, 폭은 원래 이미지 프레임의 폭의 절반일 수 있다. 또한, 지정된 크기도 예측 요건에 따라 결정될 수도 있고, 예를 들어, 8*8일 수 있다. SATD는 잔차에 대해 아다마르 변환을 수행한 다음 절대 값 합산을 수행하는 것을 지시한다.
이미지 프레임의 프레임 간 예측 비용 Pcost와 관련하여, 이미지 프레임에 대해 다운-샘플링이 수행된 후, 샘플링된 이미지 프레임은 지정된 크기의 복수의 매크로블록으로 분할된다. 각각의 매크로블록과 관련하여, 매크로블록의 최적 참조 블록이 정수 픽셀 다이아몬드 예측을 이용하여 획득되고, 매크로블록과 참조 블록 간의 잔차의 SATD가 계산되어, 최적의 모션 진폭을 획득한다. 매크로블록의 모션 진폭 및 Icost 중 최소가 매크로블록의 Pcost로서 사용되고, 복수의 매크로블록의 Pcost의 합이 이미지 프레임의 Pcost로서 사용된다.
각각의 이미지 프레임의 모션 진폭 차이는 인코딩 이전의 계산을 통해 획득될 수 있다는 점에 유의해야 한다. 현재 이미지 프레임이 인코딩될 때, 이미지 프레임의 모션 진폭 차이가 계산될 수 있다. 또한, 이미지 프레임 이전의 이미지 프레임들의 모션 진폭 차이들이 인코딩 동안 계산되었기 때문에, 이미지 프레임들의 모션 진폭 차이들을 재계산하는 것이 불필요하고, 대신에 모션 진폭 차이들이 직접 획득될 수 있다. 그러한 직접 획득 방식은 인코딩 프로세스에서의 계산의 양을 크게 감소시킨다.
303. 비디오 인코딩 디바이스는 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이에 따라 정적 변수를 업데이트한다.
정적 이미지 프레임은 정적 장면 내의 이미지 프레임을 의미한다. 정적 변수는 결정된 연속적인 정적 이미지 프레임들의 양을 지시하는 데 사용되고, 인코딩 프로세스에서 결정된 연속적인 정적 이미지 프레임들과 함께 증가된다. 정적 변수는 점진적으로 누적되고, 누적 프로세스 동안, 임의의 이미지 프레임이 정적 이미지 프레임이 아니면, 정적 변수는 0으로 리셋되고, 누적이 재개된다.
본 출원의 이 실시예에서, 인코딩될 이미지 프레임이 정적 이미지 프레임인지가 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이에 따라 결정될 수 있고, 결정 결과 및 결정된 정적 변수에 따라 업데이트가 수행되어, 업데이트된 정적 변수를 획득한다. 구현에서, 정적 이미지 프레임은 결정될 수 있고, 정적 변수는 다음의 프로세스를 통해 업데이트될 수 있다:
인코딩될 이미지 프레임이 정적 이미지 프레임인지가 결정될 때, 제1 사전설정된 조건이 현재 충족되는지가 결정된다. 제1 사전설정된 조건은 인코딩될 이미지 프레임의 모션 진폭 차이의 절대 값이 제2 사전설정된 임계치 미만이고, 슬라이딩 윈도 내의 모든 이미지 프레임들의 모션 진폭 차이들의 합의 절대 값이 제3 사전설정된 임계치 미만인 것이다. 따라서, 비디오 인코딩 디바이스는 인코딩될 이미지 프레임의 모션 진폭 차이의 절대 값이 제2 사전설정된 임계치 미만인지를 결정하고, 슬라이딩 윈도 내의 모든 이미지 프레임들의 모션 진폭 차이들의 합의 절대 값이 제3 사전설정된 임계치 미만인지를 결정하고, 그렇다면, 제1 사전설정된 조건이 충족되고, 인코딩될 이미지 프레임이 정적 이미지 프레임이라고 결정하고, 결정된 정적 변수를 1 증가시켜, 업데이트된 정적 변수를 획득한다. 그렇지 않고, 제1 사전설정된 조건이 충족되지 않고, 인코딩될 이미지 프레임이 정적 이미지 프레임이 아니라고 결정될 때, 업데이트된 정적 변수는 0으로 설정되고, 연속적인 정적 이미지 프레임들의 양의 카운팅이 재개된다.
예를 들어, 비디오 인코딩 디바이스는 다음의 수학식을 이용하여 정적 변수를 결정할 수 있다:
Figure pct00002
fn은 인코딩될 이미지 프레임에 따라 결정되는 정적 변수를 나타내고, fn -1은 인코딩될 이미지 프레임의 이전 이미지 프레임에 따라 결정되는 정적 변수를 나타내고, ηn은 인코딩될 이미지 프레임의 모션 진폭 차이를 나타내고, 여기서, ηnnn-1이고, αn은 인코딩될 이미지 프레임의 모션 진폭을 나타내고, αn -1은 인코딩될 이미지 프레임의 이전 이미지 프레임을 나타내고, ξn은 슬라이딩 윈도 내의 모든 이미지 프레임들의 모션 진폭 차이들의 합을 나타내고, n은 1보다 큰 양의 정수이고, ηT는 제2 사전설정된 임계치를 나타내고, ξT는 제3 사전설정된 임계치를 나타낸다. a 및 b의 값들은 인코딩 효율 및 인코딩 품질이 포괄적으로 고려된 후에 결정되고 실제 이미지 프레임 시퀀스에 따라 미세 조정될 수 있고, 예를 들어, ηT=0.2이고, ξT=1이다.
304. 비디오 인코딩 디바이스는 업데이트된 정적 변수가 제1 사전설정된 임계치 미만인지를 결정하고, 그렇다면, 단계 305를 수행하고, 그렇지 않다면, 단계 306을 수행한다.
본 출원의 이 실시예에서, 정적 장면에서 과도한 P 프레임들을 인코딩하는 것을 피하기 위해, I 프레임을 인코딩하기 위한 조건은 연속적인 정적 이미지 프레임들의 양이 제1 사전설정된 임계치에 도달한다는 것이고, 그러한 조건 하에서, 비디오는 장시간 동안 정적 장면에 있고, 충분한 양의 정적 이미지 프레임들에 따라 충분한 P 프레임들이 인코딩된다. P 프레임의 인코딩이 계속되면 인코딩 품질은 너무 많이 열화될 것이기 때문에, I 프레임을 인코딩할 필요가 있다.
따라서, 업데이트된 정적 변수를 획득할 때, 비디오 인코딩 디바이스는 업데이트된 정적 변수가 제1 사전설정된 임계치 미만인지를 결정한다. 업데이트된 정적 변수가 제1 사전설정된 임계치 미만이어서, 연속적인 정적 이미지 프레임들의 양이 상한을 초과하지 않는다는 것을 지시하면, 인코딩 효율을 개선하는 것을 고려하여, P 프레임의 인코딩이 계속될 수 있다. 업데이트된 정적 변수가 제1 사전설정된 임계치 이상이어서, 연속적인 정적 이미지 프레임들의 양이 너무 크다는 것을 지시하면, 인코딩 품질을 개선하는 것을 고려하여, I 프레임을 인코딩할 필요가 있다. 제1 사전설정된 임계치는 인코딩 품질 및 인코딩 효율에 대한 요건을 포괄적으로 고려함으로써 결정될 수 있다. 예를 들어, 제1 사전설정된 임계치는 N과 동등할 수 있다.
305. 비디오 인코딩 디바이스는 인코딩될 이미지 프레임을 P 프레임으로서 인코딩한다.
P 프레임을 인코딩하기 위해, 인코딩될 이미지 프레임과 이전 이미지 프레임 간의 차이 데이터가 획득되고, 차이 데이터에 따라 인코딩이 수행되고, 획득된 인코딩된 이미지 프레임은 P 프레임이다.
306. 비디오 인코딩 디바이스는 인코딩될 이미지 프레임을 I 프레임으로서 인코딩한다.
I 프레임을 인코딩하기 위해, 인코딩될 이미지 프레임 내의 데이터에 따라 직접 인코딩이 수행되고, 획득된 인코딩된 이미지 프레임은 I 프레임이다.
다른 실시예에서, 정적 변수가 제1 사전설정된 임계치 이상인 전술한 조건에 더하여, I 프레임을 인코딩하기 위한 조건은 제2 사전설정된 조건을 추가로 포함할 수 있다. 대응적으로, 전술한 단계들 304 내지 306은 다음의 단계들로 대체될 수 있다: 업데이트된 정적 변수가 제1 사전설정된 임계치 미만인지를 결정하고, 제2 사전설정된 조건이 충족되는지를 결정하는 단계; 상기 업데이트된 정적 변수가 상기 제1 사전설정된 임계치 이상이고, 상기 제2 사전설정된 조건이 충족될 때, 인코딩될 이미지 프레임을 I 프레임으로서 인코딩하는 단계; 및 상기 업데이트된 정적 변수가 상기 제1 사전설정된 임계치 미만이거나 또는 상기 제2 사전설정된 조건이 충족되지 않을 때, 인코딩될 이미지 프레임을 P 프레임으로서 인코딩하는 단계.
Figure pct00003
n은 인코딩될 이미지 프레임의 일련 번호를 나타내고; αn은 인코딩될 이미지 프레임의 모션 진폭을 나타내고; μI.n은 인코딩될 이미지 프레임의 이전이고 인코딩될 이미지 프레임에 가장 가까운 I 프레임의 휘도 성분의 피크 신호 대 잡음비(PSNR)를 나타내고; μn -1은 인코딩될 이미지 프레임의 이전 이미지 프레임의 휘도 성분의 PSNR을 나타내고, 여기서 휘도 성분의 PSNR은 대응하는 이미지 프레임의 인코딩 품질을 평가하는 데 사용될 수 있고; σ1, σ2, σ3, 및 σ4, 및 T1.n, T2.n, T3.n, 및 T4.n은 양의 임계치들이고, σ1, σ2, σ3, 및 σ4는 이미지 복잡도 변화의 임계치들을 나타내고, 요건: σ12, σ23, 및 σ34에 따라 설정될 수 있는데, 예를 들어, 다음과 같이 설정될 수 있다: σ1=0.2, σ2=0.3, σ3=0.4, 및 σ4=0.5, 및 T1.n>T2.n, T2.n>T3.n, 및 T3.n>T4.n.
전술한 제2 사전설정된 조건의 사용은 이미지 프레임의 모션 진폭이 비교적 작을 때 이미지 프레임을 표현하는 스크린이 비교적 안정적인 것을 보장할 수 있다. 이 경우에, P 프레임을 인코딩하는 것은 인코딩 품질의 너무 많은 열화를 야기하지 않는다. 따라서, 과도한 I 프레임들을 인코딩하는 것이 불필요하고, PSNR이 크게 감소될 때까지는 어떤 I 프레임도 인코딩되지 않을 수 있어서, 인코딩 품질이 보장될 뿐만 아니라 인코딩 효율도 가능한 한 많이 개선된다. 그러나, 이미지 프레임의 모션 진폭이 비교적 클 때, 이미지 프레임을 표현하는 스크린은 급격하게 변화한다. 이 경우에, 인코딩 품질의 너무 많은 열화를 피하기 위해, I 프레임을 인코딩하기 위한 조건이 완화될 수 있고, PSNR이 비교적 작은 진폭만큼 감소될 때 I 프레임이 인코딩될 수 있다.
본 출원의 이 실시예에서, 4개의 임계치 T1, T2, T3, 및 T4와 관련하여, 상이한 이미지 프레임들에 의해 사용되는 임계치들은 동등하거나 동등하지 않을 수 있다. 가능한 구현에서, 제n 이미지 프레임의 인코딩이 완료된 후에, T1.n, T2.n, T3.n, 및 T4.n은 업데이트되어 업데이트된 T1.n +1, T2.n +1, T3.n +1, 및 T4.n +1을 획득할 수 있고, 업데이트된 임계치들을 이용하여 제(n+1) 이미지 프레임이 결정된다. 업데이트 방식은 다음과 같다:
Figure pct00004
전술한 임계치들의 초기 값들, 즉, T1, T2, T3, 및 T4는, 제1 I 프레임 이후에 제1 I 프레임이 인코딩될 때 PSNR의 감소 진폭에 대한 요건에 따라 결정될 수 있고, 예를 들어, 다음과 같이 설정될 수 있다: T1.1=5, T2.1=4.5, T3.1=3, T4.1=2.5. ωT는 업데이트 프로세스에서 현재 PSNR 차이에 의해 점유되는 가중치를 나타내는 양의 임계치이고, 예를 들어 다음과 같이 설정될 수 있다: ωT=0.2.
본 출원의 이 실시예에서, 인코딩될 이미지 프레임의 인코딩이 완료된 후에, 다음 인코딩될 이미지 프레임이 획득될 수 있고, 슬라이딩 윈도는 하나의 이미지 프레임의 거리만큼 뒤로 이동되어, 슬라이딩 윈도의 후미에 다음 인코딩될 이미지 프레임을 위치시킨다. 이 경우에, 단계들 301 내지 306이 반복적으로 수행되어, 다음 인코딩될 이미지 프레임 등을 연속적으로 인코딩할 수 있다.
도 4a에 도시된 예에 기초하여, 제N 이미지 프레임의 인코딩이 완료된 후에(제N 이미지 프레임이 P 프레임으로서 인코딩된다고 가정한다), 슬라이딩 윈도는 하나의 이미지 프레임의 거리만큼 뒤로 이동되어, 도 4b에 도시된 바와 같이, 슬라이딩 윈도의 후미에 제(N+1) 이미지 프레임을 위치시킨다. 이 경우에, 제(N+1) 이미지 프레임의 인코딩이 시작된다.
비디오 인코딩 디바이스는 또한 구성 파일에서 GOP의 사전설정된 최대 길이를 설정할 수 있다는 점에 유의해야 한다. 사전설정된 최대 길이는 2개의 연속적인 I 프레임 간의 최대 길이를 지정한다. 따라서, 인코딩될 이미지 프레임을 인코딩할 때, 비디오 인코딩 디바이스는 전술한 단계 304에서의 조건을 이용하여 이미지 프레임을 I 프레임으로서 인코딩할지를 결정할 뿐만 아니라, 또한 인코딩될 이미지 프레임과 인코딩될 이미지 프레임의 이전이고 인코딩될 이미지 프레임에 가장 가까운 I 프레임 간의 거리를 획득하고, 그 거리가 사전설정된 최대 길이에 도달하는지를 결정하고, 그 거리가 사전설정된 최대 길이에 도달한다고 결정할 때, 단계 304에서의 조건이 현재 충족되지 않는 경우에도 인코딩될 이미지 프레임을 I 프레임으로서 인코딩할 필요가 있다.
본 출원의 실시예들에서 제공되는 방법에서는, 슬라이딩 윈도에 따라 N개의 이미지 프레임이 결정되고, 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이에 따라 정적 변수가 업데이트되고, 업데이트된 정적 변수가 제1 사전설정된 임계치 이상일 때, 비디오가 장시간 동안 정적 장면에 있다고 결정되어, I 프레임이 인코딩된다. 본 출원은 비디오가 장시간 동안 정적 장면에 있는지를 결정하기 위한 방식을 제공하며, 여기서 비디오가 장시간 동안 정적 장면에 있다고 결정될 때 I 프레임이 인코딩되어, 과도한 P 프레임들의 삽입을 피하고 인코딩 품질을 개선한다. 또한, I 프레임이 인코딩된 후에 P 프레임이 인코딩될 때, P 프레임에 의해 점유된 비트의 양이 감소되고, PSNR이 증가되어, 인코딩 효율이 개선된다.
본 출원은 프레임 간 예측 비용 및 프레임 내 예측 비용 간의 비율을 이용하여 현재 모션 진폭을 나타내고, 인코딩된 이미지 프레임의 PSNR을 이용하여 왜곡을 나타내고, 슬라이딩 윈도를 이용하여 슬라이딩 윈도 내의 이미지 프레임들을 사전-분석하고, 모션 진폭의 변화 상황을 참조하여, 구간별 함수를 이용하여 I 프레임을 적응적으로 인코딩하는 알고리즘을 구현하고, 이로써 인코딩 효율을 개선한다.
또한, 실시간 비디오 통화를 행하는 시나리오에서, 구성 파일에서의 GOP의 사전설정된 최대 길이는 비교적 큰 값으로 설정되어, 사전설정된 최대 길이에 따라 I 프레임이 빈번하게 인코딩되지 않는 것을 보장할 수 있고, 대신에, 더 많은 경우에, I 프레임이 인코딩되는지가 이미지 프레임의 상황에 따라 결정되고, 이로써 인코딩 효율을 크게 개선한다. 또한, armv7 및 arm64와 같은 유형들의 프로세서들에 대해 본 출원의 이 실시예에서 사용되는 알고리즘에서 컴파일 최적화가 행해져서, 처리 속도가 개선될 수 있다.
도 5는 본 출원의 실시예에 따른 비디오 인코딩 방법의 흐름도이다. 본 출원의 이 실시예에서, 3개의 이미지 프레임을 인코딩하는 프로세스가 예로서 사용되며, 여기서 프로세스는 비디오 인코딩 디바이스에 의해 실행된다. 도 5를 참조하면, 이 방법은 다음을 포함한다:
501. 길이가 N과 동등한 슬라이딩 윈도를 설정하고, 비디오 내의 제1 이미지 프레임을 I 프레임으로서 인코딩하고, 비디오의 제2 이미지 프레임 내지 제(N-1) 이미지 프레임을 P 프레임들로서 인코딩한다 - 여기서 인코딩된 N-1개의 이미지 프레임은 슬라이딩 윈도의 제1 N-1개의 위치에 위치하고, 제N 이미지 프레임이 획득될 때, 제N 이미지 프레임은 현재 인코딩될 이미지 프레임이고, 제N 이미지 프레임은 슬라이딩 윈도의 후미에 위치한다.
본 출원의 이 실시예에서, N은 3이라고 가정한다.
502. 슬라이딩 윈도 내의 N개의 이미지 프레임의 모션 진폭 차이들에 따라 제1 사전설정된 조건이 충족되고, 제N 이미지 프레임이 정적 이미지 프레임이라고 결정되면, 정적 변수를 1로 설정하고, 정적 변수, 즉, 1이 N 미만이기 때문에 제N 이미지 프레임을 P 프레임으로서 인코딩한다.
503. 제(N+1) 이미지 프레임을 획득하고, 슬라이딩 윈도를 하나의 이미지 프레임의 거리만큼 뒤로 이동시킨다 - 여기서 슬라이딩 윈도는 제2 이미지 프레임 내지 제(N+1) 이미지 프레임을 포함한다.
504. 슬라이딩 윈도 내의 N개의 이미지 프레임의 모션 진폭 차이들에 따라 제1 사전설정된 조건이 충족되고, 제(N+1) 이미지 프레임이 정적 이미지 프레임이라고 결정되면, 정적 변수를 2로 업데이트하고, 정적 변수, 즉, 2가 N 미만이기 때문에 제(N+1) 이미지 프레임을 P 프레임으로서 인코딩한다.
505. 제(N+2) 이미지 프레임을 획득하고, 슬라이딩 윈도를 하나의 이미지 프레임의 거리만큼 뒤로 이동시킨다 - 여기서 슬라이딩 윈도는 제3 이미지 프레임 내지 제(N+2) 이미지 프레임을 포함한다.
506. 슬라이딩 윈도 내의 N개의 이미지 프레임의 모션 진폭 차이들에 따라 제1 사전설정된 조건이 충족되고, 제(N+2) 이미지 프레임이 정적 이미지 프레임이라고 결정되면, 정적 변수를 3으로 업데이트하고, 정적 변수, 즉, 3이 N과 동등하기 때문에 제(N+2) 이미지 프레임을 I 프레임으로서 인코딩한다.
도 6은 본 출원의 실시예에 따른 비디오 인코딩 방법의 흐름도이다. 본 출원의 이 실시예는 장면 스위칭 동안 I 프레임을 인코딩하는 프로세스를 설명하며, 여기서 프로세스는 비디오 인코딩 디바이스에 의해 실행된다. 도 6을 참조하면, 이 방법은 다음을 포함한다:
601. 인코딩될 이미지 프레임과 인코딩될 이미지 프레임의 이전이고 인코딩될 이미지 프레임에 가장 가까운 I 프레임 간의 거리를 획득한다.
602. 거리에 따라 제4 사전설정된 임계치를 계산한다.
제4 사전설정된 임계치가 계산될 때, 다음의 수학식이 이용된다:
Figure pct00005
VScene는 지정된 임계치를 나타내고, 사전에 비디오 인코딩 디바이스에 의해 결정될 수 있고; D는 거리를 나타내고; GOPmin은 픽처 그룹 GOP의 사전설정된 최소 길이를 나타내고; GOPmax는 GOP의 사전설정된 최대 길이를 나타내고; Fbias는 제4 사전설정된 임계치를 나타낸다.
603. 인코딩될 이미지 프레임의 모션 진폭이 1과 제4 사전설정된 임계치 간의 차이보다 큰지 그리고 모션 진폭이 제5 사전설정된 임계치 미만인지를 결정하고, 거리가 제6 사전설정된 임계치 미만인지를 결정한다.
604: 인코딩될 이미지 프레임의 모션 진폭이 1과 제4 사전설정된 임계치 간의 차이보다 크고 제5 사전설정된 임계치 이상이고, 거리가 제6 사전설정된 임계치 이상일 때, 인코딩될 이미지 프레임을 I 프레임으로서 인코딩한다.
605: 인코딩될 이미지 프레임의 모션 진폭이 1과 제4 사전설정된 임계치 간의 차이보다 크지 않거나 제5 사전설정된 임계치 미만이거나, 거리가 제6 사전설정된 임계치 미만일 때, 인코딩될 이미지 프레임을 P 프레임으로서 인코딩한다.
관련 기술에서는, 비디오에서 장면 스위칭이 발생할 때 I 프레임이 인코딩된다. 그러나, 장면 스위칭이 비디오에서 빈번하게 발생하면, 과도한 I 프레임들이 인코딩되면, I 프레임들 후에 P 프레임들을 인코딩하는 것은 품질 열화를 초래할 수 있다. 따라서, 과도한 I 프레임들을 인코딩하는 것을 피하기 위해, I 프레임으로서 인코딩될 이미지 프레임의 모션 진폭은 1과 제4 사전설정된 임계치 간의 차이보다 커야 하고 제5 사전설정된 임계치 이상이고, 인코딩된 I 프레임과 이전 I 프레임 간의 거리는 제6 사전설정된 임계치 미만일 수 없다. 제5 사전설정된 임계치는 I 프레임으로서 인코딩될 이미지 프레임의 최소 모션 진폭을 결정하는 데 사용된다. 제6 사전설정된 임계치는 2개의 연속적인 I 프레임 간의 최소 거리를 결정하는 데 사용된다. 제5 사전설정된 임계치 및 제6 사전설정된 임계치는 인코딩 품질 및 인코딩 효율이 포괄적으로 고려된 후에 결정될 수 있다. 예를 들어, 제5 사전설정된 임계치는 0.8일 수 있고, 제6 사전설정된 임계치는 프레임 레이트의 절반일 수 있다.
실제 응용에서, 결정이 수행될 때, 비디오 인코딩 디바이스는 먼저 거리가 제6 사전설정된 임계치 미만인지를 결정하고; 그렇다면, 인코딩될 이미지 프레임을 P 프레임으로서 직접 인코딩하고; 그렇지 않다면, 또한 인코딩될 이미지 프레임의 모션 진폭이 1과 제4 사전설정된 임계치 간의 차이보다 큰지 그리고 모션 진폭이 제5 사전설정된 임계치 미만인지를 결정하고, 결정 결과에 따라 인코딩될 이미지 프레임을 I 프레임 또는 P 프레임으로서 인코딩할 수 있다.
도 3에 도시된 실시예는 도 6에 도시된 실시예와 조합될 수 있고, 인코딩 프로세스에서, 비디오 인코딩 디바이스는 전술한 단계들 301 내지 304를 이용하여 그리고 전술한 단계들 601 내지 603을 이용하여 결정을 수행하여, 인코딩될 이미지 프레임을 I 프레임 또는 P 프레임으로서 인코딩하기로 결정할 수 있다는 점에 유의해야 한다.
본 출원의 이 실시예에서 제공된 방법에서는, 인코딩될 이미지 프레임의 모션 진폭이 1과 제4 사전설정된 임계치 간의 차이보다 크고 제5 사전설정된 임계치 이상이고 인코딩될 이미지 프레임과 이전 I 프레임 간의 거리가 제6 사전설정된 임계치 이상일 때 인코딩될 이미지 프레임이 I 프레임으로서 인코딩되는 것이 보장되고, 이로써 과도한 I 프레임들의 인코딩을 피하고 인코딩 효율을 개선한다.
도 7은 본 출원의 실시예에 따른 비디오 인코딩 장치의 개략 구조도이다. 도 7을 참조하면, 이 장치는 다음을 포함한다:
전술한 단계 301을 수행하도록 구성된 결정 모듈(701);
전술한 단계 302를 수행하도록 구성된 제1 획득 모듈(702);
전술한 단계 303을 수행하도록 구성된 제2 획득 모듈(703); 및
전술한 단계 305 또는 306을 수행하도록 구성된 인코딩 모듈(704).
가능한 구현에서, 제2 획득 모듈(703)은 정적 변수를 업데이트하도록 구성된다.
다른 가능한 구현에서, 인코딩 모듈(704)은 업데이트된 정적 변수가 지정된 양 이상이고 제2 사전설정된 조건이 충족될 때 I 프레임을 인코딩하도록 구성된다.
제2 사전설정된 조건은 다음의 조건들 중 적어도 하나를 포함한다:
Figure pct00006
다른 가능한 구현에서,
Figure pct00007
ωT는 양의 임계치이다.
다른 가능한 구현에서, 인코딩 모듈(704)은 업데이트된 정적 변수가 제1 사전설정된 임계치 미만일 때 인코딩될 이미지 프레임을 P 프레임으로서 인코딩하도록 추가로 구성된다.
다른 가능한 구현에서, 이 장치는:
다음 인코딩될 이미지 프레임을 획득하고, 슬라이딩 윈도를 하나의 이미지 프레임의 거리만큼 뒤로 이동시키도록 구성된 스위칭 모듈을 추가로 포함하고,
제2 획득 모듈(703)은: 현재 업데이트된 정적 변수가 제1 사전설정된 임계치 이상일 때까지 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이에 따라 정적 변수를 연속적으로 업데이트하도록 추가로 구성되고, 인코딩 모듈(704)은 현재 인코딩될 이미지 프레임을 I 프레임으로서 인코딩한다.
다른 가능한 구현에서, 이 장치는:
전술한 단계 601을 수행하도록 구성된 제3 획득 모듈;
전술한 단계 602를 수행하도록 구성된 계산 모듈; 및
전술한 단계 604 또는 605를 수행하도록 구성된 인코딩 모듈(704)을 추가로 포함한다.
위의 모든 선택적인 기술적 해결책들은 본 개시내용의 선택적인 실시예들을 형성하기 위해 임의의 방식으로 조합될 수 있다. 상세들은 하나씩 본 명세서에서 더 설명되지 않는다.
전술한 실시예에서 제공된 비디오 인코딩 장치가 인코딩을 수행할 때, 전술한 기능 모듈들의 구분들만이 예를 이용하여 설명된다는 점에 유의해야 한다. 실제 응용 동안, 전술한 기능들은 요건들에 따라 상이한 기능 모듈들에 할당되고 그에 의해 완성될 수 있는데, 즉, 비디오 인코딩 디바이스의 내부 구조는 상이한 기능 모듈들로 분할되어, 전술한 기능들의 전부 또는 일부를 완성한다. 또한, 전술한 실시예에서 제공된 비디오 인코딩 장치는 비디오 인코딩 방법의 실시예와 동일한 개념에 속한다. 장치의 특정 구현 프로세스에 대해서는, 방법 실시예를 참조하고, 상세들은 본 명세서에서 다시 설명되지 않는다.
도 8은 본 출원의 실시예에 따른 단말기의 개략 구조도이다. 단말기는 전술한 실시예들에 예시된 비디오 인코딩 방법에서 비디오 인코딩 디바이스에 의해 수행되는 기능들을 구현하도록 구성될 수 있다. 구체적으로:
단말기(800)는 무선 주파수(RF) 회로(110), 하나 이상의 컴퓨터 판독가능 저장 매체를 포함하는 메모리(120), 입력 유닛(130), 디스플레이 유닛(140), 센서(150), 오디오 회로(160), 송신 모듈(170), 하나 이상의 처리 코어를 포함하는 프로세서(180), 및 전원(190)과 같은 컴포넌트들을 포함할 수 있다. 본 기술분야의 통상의 기술자는 도 8에 도시된 단말기의 구조가 단말기에 대한 제한을 구성하지 않고, 단말기가 도면에 도시된 것들보다 더 많거나 더 적은 컴포넌트들을 포함할 수 있거나, 또는 일부 컴포넌트들이 조합될 수 있거나, 또는 상이한 컴포넌트 배치가 사용될 수 있다는 것을 이해할 수 있다.
RF 회로(110)는 정보 수신 및 송신 프로세스 또는 호출 프로세스 동안 신호들을 수신 및 전송하도록 구성될 수 있다. 특히, RF 회로는 기지국으로부터 다운링크 정보를 수신하고, 그 후 다운링크 정보를 처리를 위해 하나 이상의 프로세서(180)에 전달하고, 관련된 업링크 데이터를 기지국에 전송한다. 일반적으로, RF 회로(110)는 안테나, 적어도 하나의 증폭기, 튜너, 하나 이상의 발진기, 가입자 식별 모듈(SIM) 카드, 송수신기, 커플러, 저잡음 증폭기(LNA), 듀플렉서 등을 포함하지만, 이로 제한되지는 않는다. 또한, RF 회로(110)는 또한 무선 통신에 의해 네트워크 또는 다른 단말기와 통신할 수 있다. 무선 통신은 글로벌 이동 통신 시스템(GSM), 일반 패킷 무선 서비스(GPRS), 코드 분할 다중 액세스(CDMA), 광대역 코드 분할 다중 액세스(WCDMA), 롱 텀 에볼루션(LTE), 이메일, , 단문 메시징 서비스(SMS) 등을 포함하지만, 이로 제한되지는 않는 임의의 통신 표준 또는 프로토콜을 사용할 수 있다.
메모리(120)는 소프트웨어 프로그램 및 모듈, 예를 들어, 전술한 예시적인 실시예들에 도시된 단말기에 대응하는 프로그램 명령어 및 모듈을 저장하도록 구성될 수 있고, 프로세서(180)는 메모리(120)에 저장된 모듈 및 소프트웨어 프로그램을 실행함으로써 다양한 기능 애플리케이션들 및 데이터 처리를 수행하고, 예를 들어, 비디오 기반 상호작용을 구현한다. 메모리(120)는 주로 프로그램 저장 영역 및 데이터 저장 영역을 포함할 수 있다. 프로그램 저장 영역은 운영 체제, 적어도 하나의 기능(예컨대 사운드 재생 기능 및 이미지 디스플레이 기능)에 의해 요구되는 애플리케이션 프로그램 등을 저장할 수 있다. 데이터 저장 영역은 단말기(800)의 사용에 따라 생성된 데이터(예컨대 오디오 데이터 및 주소록) 등을 저장할 수 있다. 또한, 메모리(120)는 고속 랜덤 액세스 메모리를 포함할 수 있고, 또한 비휘발성 메모리, 예컨대 적어도 하나의 자기 디스크 저장 디바이스, 플래시 메모리, 또는 다른 휘발성 솔리드-스테이트 저장 디바이스를 포함할 수 있다. 대응적으로, 메모리(120)는 메모리(120)에 대한 프로세서(180) 및 입력 유닛(130)의 액세스를 제공하기 위해 메모리 컨트롤러를 추가로 포함할 수 있다.
입력 유닛(130)은 입력 숫자 또는 문자 정보를 수신하고, 사용자 설정 및 기능 제어에 관련된 키보드, 마우스, 조이스틱, 광, 또는 트랙볼 신호 입력을 생성하도록 구성될 수 있다. 구체적으로, 입력 유닛(130)은 터치 감응 표면(131) 및 다른 입력 단자(132)를 포함할 수 있다. 터치 감응 표면(131)은 터치스크린 또는 터치 패널이라고도 지칭될 수 있고, 터치 감응 표면 상의 또는 그 근처에서의 사용자의 터치 조작(예컨대 손가락 또는 스타일러스와 같은 임의의 적절한 물체 또는 액세서리를 사용하는 것에 의한 터치 감응 표면(131) 상의 또는 그 근처에서의 사용자의 조작)을 수집하고, 사전설정된 프로그램에 따라 대응하는 연결 장치를 구동할 수 있다. 선택적으로, 터치 감응 표면(131)은 2개의 부분: 터치 검출 장치 및 터치 컨트롤러를 포함할 수 있다. 터치 검출 장치는 사용자의 터치 위치를 검출하고, 터치 조작에 의해 생성된 신호를 검출하고, 신호를 터치 컨트롤러에 전송한다. 터치 컨트롤러는 터치 검출 장치로부터 터치 정보를 수신하고, 터치 정보를 터치 포인트 좌표로 변환하고, 터치 포인트 좌표를 프로세서(180)에 전송한다. 더욱이, 터치 컨트롤러는 프로세서(180)로부터 전송된 명령을 수신하고 실행할 수 있다. 또한, 터치 감응 표면(131)은 저항성, 용량성, 적외선, 또는 표면 음파 유형 터치 감응 표면일 수 있다. 터치 감응 표면(131)에 더하여, 입력 유닛(130)은 다른 입력 단자(132)를 추가로 포함할 수 있다. 구체적으로, 다른 입력 단자(132)는 물리적 키보드, 기능 키(예컨대 볼륨 제어 키 또는 스위치 키), 트랙볼, 마우스, 및 조이스틱 중 하나 이상을 포함할 수 있지만, 이로 제한되지는 않는다.
디스플레이 유닛(140)은 사용자에 의해 입력된 정보 또는 사용자에 대해 제공된 정보, 및 단말기(800)의 다양한 그래픽 사용자 인터페이스들을 디스플레이하도록 구성될 수 있다. 디스플레이 유닛(140)은 디스플레이 패널(141)을 포함할 수 있다. 선택적으로, 디스플레이 패널(141)은 액정 디스플레이(LCD), 유기 발광 다이오드(OLED) 등의 형태로 구성될 수 있다. 또한, 터치 감응 표면(131)은 디스플레이 패널(141)을 커버할 수 있다. 터치 감응 표면(131) 상의 또는 그 근처에서의 터치 조작을 검출한 후에, 터치 감응 표면(131)은 터치 조작을 프로세서(180)에 전달하여, 터치 이벤트의 유형을 결정한다. 그 후, 프로세서(180)는 터치 이벤트의 유형에 따라 디스플레이 패널(141) 상에 대응하는 시각적 출력을 제공한다. 도 8에서, 터치 감응 표면(131) 및 디스플레이 패널(141) 이 입력 및 입력 기능들을 구현하기 위해 2개의 별개의 부분으로서 사용되지만, 일부 실시예들에서, 터치 감응 표면(131) 및 디스플레이 패널(141)은 입력 및 출력 기능들을 구현하기 위해 통합될 수 있다.
단말기(800)는 광 센서, 모션 센서, 및 다른 센서들과 같은 적어도 하나의 센서(150)를 추가로 포함할 수 있다. 구체적으로, 광 센서는 주변 광 센서 및 근접 센서를 포함할 수 있다. 주변 광 센서는 주변 광의 밝기에 따라 디스플레이 패널(141)의 휘도를 조정할 수 있다. 근접 센서는 단말기(800)가 귀로 이동될 때 디스플레이 패널(141) 및/또는 백라이트를 스위치 오프할 수 있다. 모션 센서의 일 유형으로서, 중력 가속도 센서는 각각의 방향(일반적으로 삼축임)에서 가속도의 값을 검출할 수 있고, 정적일 때 중력의 값 및 방향을 검출할 수 있고, 이동 전화 제스처의 응용(예컨대 수평 및 종방향 스크린들 간의 전환, 관련 게임, 및 자력계의 제스처 교정), 진동 식별의 관련 기능(예컨대 계보기 및 노크) 등을 식별하도록 구성될 수 있다. 단말기(800)에서 구성될 수 있는 자이로스코프, 기압계, 습도계, 온도계, 및 적외선 센서와 같은 다른 센서는 본 명세서에서 다시 설명되지 않는다.
오디오 회로(160), 확성기(161), 및 마이크로폰(162)은 사용자와 단말기(800) 간의 오디오 인터페이스들을 제공할 수 있다. 오디오 회로(160)는 수신된 오디오 데이터로부터 변환된 전기 신호를 확성기(161)에 송신할 수 있다. 확성기(161)는 전기 신호를 출력을 위한 사운드 신호로 변환한다. 한편, 마이크로폰(162)은 수집된 사운드 신호를 전기 신호로 변환한다. 오디오 회로(160)는 전기 신호를 수신하고, 전기 신호를 오디오 데이터로 변환하고, 오디오 데이터를 처리를 위해 프로세서(180)에 출력한다. 그 후, 프로세서(180)는 오디오 데이터를 예를 들어 RF 회로(110)를 사용하여 다른 단말기에 전송하거나, 오디오 데이터를 추가 처리를 위해 메모리(120)에 출력한다. 오디오 회로(160)는 주변 장치 이어폰과 단말기(800) 간의 통신을 제공하기 위해 이어플러그 잭을 추가로 포함할 수 있다.
단말기(800)는, 송신 모듈(170)을 이용하여, 사용자가 이메일을 수신 및 전송하고, 웹페이지를 브라우징하고, 스트림 미디어에 액세스하는 것 등을 도울 수 있으며, 이는 사용자에 무선 또는 유선 광대역 인터넷 액세스를 제공한다. 도 8은 송신 모듈(170)을 도시하지만, 송신 모듈(170)은 단말기(800)의 필요한 컴포넌트가 아니고, 요구될 때, 송신 모듈(170)은 본 개시내용의의 본질의 범위가 변경되지 않는 한 생략될 수 있다는 것이 이해될 수 있다.
프로세서(180)는 단말기(800)의 제어 센터이고, 다양한 인터페이스들 및 라인들을 이용하여 전체 이동 전화의 다양한 부분들에 연결되고, 메모리(120)에 저장된 소프트웨어 프로그램 및/또는 모듈을 가동 또는 실행하고, 메모리(120)에 저장된 데이터를 호출하고, 단말기(800)의 다양한 기능들을 수행하고, 데이터를 처리하여, 이동 전화에 대한 전반적인 모니터링을 수행한다. 선택적으로, 프로세서(180)는 하나 이상의 프로세서 코어를 포함할 수 있다. 바람직하게는, 프로세서(180)는 애플리케이션 프로세서 및 모뎀을 통합할 수 있다. 애플리케이션 프로세서는 주로 운영 체제, 사용자 인터페이스, 애플리케이션 프로그램 등을 처리한다. 모뎀은 주로 무선 통신을 처리한다. 전술한 모뎀은 대안적으로 프로세서(180)에 통합되지 않을 수 있다는 것을 이해할 수 있다.
단말기(800)는 컴포넌트들에 전력을 공급하기 위한 전원(190)(예컨대 배터리)을 추가로 포함한다. 바람직하게는, 전원은 전력 관리 시스템을 사용하여 프로세서(180)에 논리적으로 연결될 수 있고, 이로써 전력 관리 시스템을 사용하여 충전, 방전 및 전력 소비 관리와 같은 기능들을 구현한다. 전원(190)은 직류 또는 교류 전원, 재충전 시스템, 정전 검출 회로, 전원 컨버터 또는 인버터, 전원 상태 지시기, 및 임의의 다른 컴포넌트들 중 하나 이상을 추가로 포함할 수 있다.
도면에 도시되지는 않았지만, 단말기(800)는 카메라, 블루투스 모듈 등을 추가로 포함할 수 있으며, 이들은 본 명세서에서 더 설명되지 않는다. 구체적으로, 이 실시예에서, 단말기(800)의 디스플레이 유닛은 터치스크린 디스플레이이다. 단말기(800)는 메모리 및 적어도 하나의 명령어를 추가로 포함하고, 적어도 하나의 명령어는 메모리에 저장되고, 하나 이상의 프로세서에 의해 로딩되고 실행되어, 전술한 실시예들에서의 비디오 인코딩 방법을 구현하도록 구성된다.
도 9는 본 출원의 실시예에 따른 서버의 개략 구조도이다. 서버(900)는 상이한 구성들 또는 성능으로 인해 크게 달라질 수 있고, 하나 이상의 중앙 처리 유닛(CPU)(922)(예를 들어, 하나 이상의 프로세서) 및 메모리(932), 및 애플리케이션 프로그램(942) 또는 데이터(944)를 저장하는 하나 이상의 저장 매체(930)(예를 들어, 하나 이상의 대용량 저장 디바이스)를 포함할 수 있다. 메모리(932) 및 저장 매체(930)는 일시적 또는 지속적 저장소일 수 있다. 저장 매체(930)에 저장된 프로그램은 하나 이상의 모듈(도시되지 않음)을 포함할 수 있고, 각각의 모듈은 서버에 대한 일련의 명령어들을 포함할 수 있다. 또한, CPU(922)는 저장 매체(930)와 통신하고, 서버(900) 상에서, 저장 매체(930) 내의 일련의 명령어들을 로딩하고 실행하여, 전술한 실시예들에서의 비디오 인코딩 방법을 구현하도록 구성될 수 있다.
서버(900) 는 하나 이상의 전원(926), 하나 이상의 유선 또는 무선 네트워크 인터페이스(950), 하나 이상의 입력/출력 인터페이스(959), 하나 이상의 키보드(956), 및/또는 하나 이상의 운영 체제(941), 예를 들어, Windows Server™, Mac OS X™, Unix™, Linux™, 또는 FreeBSD™을 추가로 포함할 수 있다.
서버(900)는 전술한 실시예들에서 제공되는 비디오 인코딩 방법에서 비디오 인코딩 디바이스에 의해 수행되는 단계들을 수행하도록 구성될 수 있다.
본 출원의 실시예들은 컴퓨터 판독가능 저장 매체를 더 제공한다. 컴퓨터 판독가능 저장 매체는 적어도 하나의 명령어를 저장하고, 명령어는 전술한 실시예들에 따른 비디오 인코딩 방법에서 수행되는 동작들을 수행하기 위해 프로세서에 의해 로딩되고 실행된다.
본 기술분야의 통상의 기술자는 전술한 실시예들의 단계들의 전부 또는 일부가 하드웨어를 이용하여 구현될 수 있거나, 또는 관련 하드웨어에 지시하는 프로그램에 의해 구현될 수 있다는 것을 이해할 수 있다. 프로그램은 컴퓨터 판독가능 저장 매체에 저장될 수 있다. 저장 매체는 판독 전용 메모리, 자기 디스크, 광 디스크 등일 수 있다.
전술한 설명은 단지 본 출원의 바람직한 실시예들에 불과하고, 본 출원을 제한하기 위해 의도된 것이 아니다. 본 출원의 사상 및 원리 내에서 이루어진 임의의 수정, 등가의 대체 또는 개선은 본 출원의 보호 범위 내에 있을 것이다.

Claims (18)

  1. 비디오 인코딩 디바이스에 적용되는 비디오 인코딩 방법으로서, 상기 방법은:
    슬라이딩 윈도에 따라 비디오의 이미지 프레임 시퀀스에서의 N개의 이미지 프레임을 결정하는 단계 - 상기 슬라이딩 윈도 내의 이미지 프레임들은 N-1개의 인코딩된 이미지 프레임 및 상기 윈도의 후미에 위치한 하나의 인코딩될 이미지 프레임을 포함함 -;
    상기 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이를 획득하는 단계 - 상기 이미지 프레임의 모션 진폭 차이는 대응하는 이미지 프레임의 모션 진폭과 이전 이미지 프레임의 모션 진폭 간의 차이이고, 상기 이미지 프레임의 모션 진폭은 상기 대응하는 이미지 프레임의 프레임 간 예측 비용 및 프레임 내 예측 비용 간의 비율임 -;
    상기 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이에 따라 정적 변수를 업데이트하는 단계 - 상기 정적 변수는 결정된 연속적인 정적 이미지 프레임들의 양을 지시하는 데 사용됨 -; 및
    업데이트된 정적 변수가 제1 사전설정된 임계치 이상일 때, 상기 인코딩될 이미지 프레임을 I 프레임으로서 인코딩하는 단계를 포함하는, 방법.
  2. 제1항에 있어서, 상기 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이에 따라 정적 변수를 업데이트하는 단계는:
    상기 인코딩될 이미지 프레임의 모션 진폭 및 상기 슬라이딩 윈도 내의 모든 이미지 프레임들의 모션 진폭들이 제1 사전설정된 조건을 충족시킬 때, 상기 인코딩될 이미지 프레임이 정적 이미지 프레임이라고 결정하고, 상기 결정된 정적 변수를 1 증가시켜, 업데이트된 정적 변수를 획득하는 단계; 및
    상기 제1 사전설정된 조건이 충족되지 않을 때, 상기 인코딩될 이미지 프레임이 정적 이미지 프레임이 아니라고 결정하고, 상기 업데이트된 정적 변수를 0으로 설정하는 단계를 포함하고,
    상기 제1 사전설정된 조건은 상기 인코딩될 이미지 프레임의 모션 진폭 차이의 절대 값이 제2 사전설정된 임계치 미만이고 상기 슬라이딩 윈도 내의 모든 이미지 프레임들의 모션 진폭 차이들의 합의 절대 값이 제3 사전설정된 임계치 미만인, 방법.
  3. 제1항에 있어서, 상기 업데이트된 정적 변수가 제1 사전설정된 임계치 이상일 때 상기 인코딩될 이미지 프레임을 I 프레임으로서 인코딩하는 단계는:
    상기 업데이트된 정적 변수가 상기 제1 사전설정된 임계치 이상이고 제2 사전설정된 조건을 충족시킬 때 상기 인코딩될 이미지 프레임을 상기 I 프레임으로서 인코딩하는 단계를 포함하고,
    상기 제2 사전설정된 조건은 다음의 조건들:
    Figure pct00008

    Figure pct00009

    Figure pct00010

    Figure pct00011

    중 적어도 하나를 포함하고, n은 상기 인코딩될 이미지 프레임의 일련 번호를 나타내고; αn은 상기 인코딩될 이미지 프레임의 모션 진폭을 나타내고; μI.n은 상기 인코딩될 이미지 프레임의 이전이고 상기 인코딩될 이미지 프레임에 가장 가까운 I 프레임의 휘도 성분의 피크 신호 대 잡음비(PSNR)를 나타내고; μn -1은 상기 인코딩될 이미지 프레임의 이전 이미지 프레임의 휘도 성분의 PSNR을 나타내고; σ1, σ2, σ3, 및 σ4, 및 T1.n, T2.n, T3.n, 및 T4.n은 양의 임계치들이고, σ12, σ23, 및 σ34이고, T1.n>T2.n, T2.n>T3.n, 및 T3.n>T4.n인, 방법.
  4. 제1항에 있어서, 상기 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이에 따라 정적 변수를 업데이트하는 단계 후에: 상기 방법은:
    상기 업데이트된 정적 변수가 상기 제1 사전설정된 임계치 미만일 때 상기 인코딩될 이미지 프레임을 P 프레임으로서 인코딩하는 단계를 추가로 포함하는, 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 방법은:
    상기 인코딩될 이미지 프레임의 인코딩이 완료된 후에, 다음 인코딩될 이미지 프레임을 획득하고, 상기 슬라이딩 윈도를 하나의 이미지 프레임의 거리만큼 뒤로 이동시켜, 상기 슬라이딩 윈도의 후미에 상기 다음 인코딩될 이미지 프레임을 위치시키는 단계; 및
    현재 업데이트된 정적 변수가 상기 제1 사전설정된 임계치 이상일 때까지 상기 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이에 따라 상기 정적 변수를 연속적으로 업데이트한 다음, 현재 인코딩될 이미지 프레임을 I 프레임으로서 인코딩하는 단계를 추가로 포함하는, 방법.
  6. 제1항에 있어서, 상기 방법은:
    상기 인코딩될 이미지 프레임과 상기 인코딩될 이미지 프레임의 이전이고 상기 인코딩될 이미지 프레임에 가장 가까운 I 프레임 간의 거리를 획득하는 단계;
    상기 거리에 따라 제4 사전설정된 임계치를 다음의 수학식들:
    Figure pct00012

    Figure pct00013

    Figure pct00014

    을 이용하여 계산하는 단계 - VScene는 지정된 임계치를 나타내고; D는 상기 거리를 나타내고; GOPmin은 픽처 그룹 GOP의 사전설정된 최소 길이를 나타내고; GOPmax는 상기 GOP의 사전설정된 최대 길이를 나타내고; Fbias는 상기 제4 사전설정된 임계치를 나타냄 -;
    상기 인코딩될 이미지 프레임의 모션 진폭이 1과 상기 제4 사전설정된 임계치 간의 차이보다 크고 상기 인코딩될 이미지 프레임의 모션 진폭이 제5 사전설정된 임계치 이상이고, 상기 거리가 제6 사전설정된 임계치 이상일 때, 상기 인코딩될 이미지 프레임을 I 프레임으로서 인코딩하는 단계를 추가로 포함하는, 방법.
  7. 비디오 인코딩 장치로서,
    슬라이딩 윈도에 따라 비디오의 이미지 프레임 시퀀스에서의 N개의 이미지 프레임을 결정하도록 구성된 결정 모듈 - 상기 슬라이딩 윈도 내의 이미지 프레임들은 N-1개의 인코딩된 이미지 프레임 및 상기 윈도의 후미에 위치한 하나의 인코딩될 이미지 프레임을 포함함 -;
    상기 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이를 획득하도록 구성된 제1 획득 모듈 - 상기 이미지 프레임의 모션 진폭 차이는 대응하는 이미지 프레임의 모션 진폭과 이전 이미지 프레임의 모션 진폭 간의 차이이고, 상기 이미지 프레임의 모션 진폭은 상기 대응하는 이미지 프레임의 프레임 간 예측 비용 및 프레임 내 예측 비용 간의 비율임 -;
    상기 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이에 따라 정적 변수를 업데이트하도록 구성된 제2 획득 모듈 - 상기 정적 변수는 결정된 연속적인 정적 이미지 프레임들의 양을 지시하는 데 사용됨 -; 및
    업데이트된 정적 변수가 제1 사전설정된 임계치 이상일 때, 상기 인코딩될 이미지 프레임을 I 프레임으로서 인코딩하도록 구성된 인코딩 모듈을 포함하는, 장치.
  8. 제7항에 있어서, 상기 제2 획득 모듈은:
    상기 인코딩될 이미지 프레임의 모션 진폭 및 상기 슬라이딩 윈도 내의 모든 이미지 프레임들의 모션 진폭들이 제1 사전설정된 조건을 충족시킬 때, 상기 인코딩될 이미지 프레임이 정적 이미지 프레임이라고 결정하고, 상기 결정된 정적 변수를 1 증가시켜, 업데이트된 정적 변수를 획득하고;
    상기 제1 사전설정된 조건이 충족되지 않을 때, 상기 인코딩될 이미지 프레임이 정적 이미지 프레임이 아니라고 결정하고, 상기 업데이트된 정적 변수를 0으로 설정하도록 구성되고,
    상기 제1 사전설정된 조건은 상기 인코딩될 이미지 프레임의 모션 진폭 차이의 절대 값이 제2 사전설정된 임계치 미만이고 상기 슬라이딩 윈도 내의 모든 이미지 프레임들의 모션 진폭 차이들의 합의 절대 값이 제3 사전설정된 임계치 미만인, 장치.
  9. 제7항에 있어서, 상기 인코딩 모듈은 상기 업데이트된 정적 변수가 상기 제1 사전설정된 임계치 이상이고 제2 사전설정된 조건을 충족시킬 때 상기 인코딩될 이미지 프레임을 상기 I 프레임으로서 인코딩하도록 구성되고,
    상기 제2 사전설정된 조건은 다음의 조건들:
    Figure pct00015

    Figure pct00016

    Figure pct00017

    Figure pct00018

    중 적어도 하나를 포함하고, n은 상기 인코딩될 이미지 프레임의 일련 번호를 나타내고; αn은 상기 인코딩될 이미지 프레임의 모션 진폭을 나타내고; μI.n은 상기 인코딩될 이미지 프레임의 이전이고 상기 인코딩될 이미지 프레임에 가장 가까운 I 프레임의 휘도 성분의 피크 신호 대 잡음비(PSNR)를 나타내고; μn -1은 상기 인코딩될 이미지 프레임의 이전 이미지 프레임의 휘도 성분의 PSNR을 나타내고; σ1, σ2, σ3, 및 σ4, 및 T1.n, T2.n, T3.n, 및 T4.n은 양의 임계치들이고, σ12, σ23, 및 σ34이고, T1.n>T2.n, T2.n>T3.n, 및 T3.n>T4.n인, 장치.
  10. 제7항에 있어서, 상기 인코딩 모듈은 상기 업데이트된 정적 변수가 상기 제1 사전설정된 임계치 미만일 때 상기 인코딩될 이미지 프레임을 P 프레임으로서 인코딩하도록 구성되는, 장치.
  11. 제7항 내지 제10항 중 어느 한 항에 있어서,
    상기 인코딩될 이미지 프레임의 인코딩이 완료된 후에, 다음 인코딩될 이미지 프레임을 획득하고, 상기 슬라이딩 윈도를 하나의 이미지 프레임의 거리만큼 뒤로 이동시켜, 상기 슬라이딩 윈도의 후미에 상기 다음 인코딩될 이미지 프레임을 위치시키도록 구성된 스위칭 모듈을 추가로 포함하고;
    상기 제2 획득 모듈은: 현재 업데이트된 정적 변수가 제1 사전설정된 임계치 이상일 때까지 상기 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이에 따라 상기 정적 변수를 연속적으로 업데이트하도록 추가로 구성되고, 상기 인코딩 모듈은 현재 인코딩될 이미지 프레임을 I 프레임으로서 인코딩하는, 장치.
  12. 비디오 인코딩 디바이스로서, 프로세서 및 메모리를 포함하고, 상기 메모리는 적어도 하나의 명령어를 저장하고, 상기 명령어는 상기 프로세서에 의해 로딩되고 실행되어 다음과 같은 비디오 인코딩 방법:
    슬라이딩 윈도에 따라 비디오의 이미지 프레임 시퀀스에서의 N개의 이미지 프레임을 결정하는 단계 - 상기 슬라이딩 윈도 내의 이미지 프레임들은 N-1개의 인코딩된 이미지 프레임 및 상기 윈도의 후미에 위치한 하나의 인코딩될 이미지 프레임을 포함함 -;
    상기 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이를 획득하는 단계 - 상기 이미지 프레임의 모션 진폭 차이는 대응하는 이미지 프레임의 모션 진폭과 이전 이미지 프레임의 모션 진폭 간의 차이이고, 상기 이미지 프레임의 모션 진폭은 상기 대응하는 이미지 프레임의 프레임 간 예측 비용 및 프레임 내 예측 비용 간의 비율임 -;
    상기 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이에 따라 정적 변수를 업데이트하는 단계 - 상기 정적 변수는 결정된 연속적인 정적 이미지 프레임들의 양을 지시하는 데 사용됨 -; 및
    업데이트된 정적 변수가 제1 사전설정된 임계치 이상일 때, 상기 인코딩될 이미지 프레임을 I 프레임으로서 인코딩하는 단계를 구현하는, 비디오 인코딩 디바이스.
  13. 제12항에 있어서, 상기 명령어는 상기 프로세서에 의해 추가로 로딩되고 실행되어 다음의 방법:
    상기 인코딩될 이미지 프레임의 모션 진폭 및 상기 슬라이딩 윈도 내의 모든 이미지 프레임들의 모션 진폭들이 제1 사전설정된 조건을 충족시킬 때, 상기 인코딩될 이미지 프레임이 정적 이미지 프레임이라고 결정하고, 상기 결정된 정적 변수를 1 증가시켜, 업데이트된 정적 변수를 획득하는 단계; 및
    상기 제1 사전설정된 조건이 충족되지 않을 때, 상기 인코딩될 이미지 프레임이 정적 이미지 프레임이 아니라고 결정하고, 상기 업데이트된 정적 변수를 0으로 설정하는 단계를 구현하고,
    상기 제1 사전설정된 조건은 상기 인코딩될 이미지 프레임의 모션 진폭 차이의 절대 값이 제2 사전설정된 임계치 미만이고 상기 슬라이딩 윈도 내의 모든 이미지 프레임들의 모션 진폭 차이들의 합의 절대 값이 제3 사전설정된 임계치 미만인, 비디오 인코딩 디바이스.
  14. 제12항에 있어서, 상기 명령어는 상기 프로세서에 의해 추가로 로딩되고 실행되어 다음의 방법:
    상기 업데이트된 정적 변수가 상기 제1 사전설정된 임계치 이상이고 제2 사전설정된 조건을 충족시킬 때 상기 인코딩될 이미지 프레임을 상기 I 프레임으로서 인코딩하는 단계를 구현하고,
    상기 제2 사전설정된 조건은 다음의 조건들:
    Figure pct00019

    Figure pct00020

    Figure pct00021

    Figure pct00022

    중 적어도 하나를 포함하고, n은 상기 인코딩될 이미지 프레임의 일련 번호를 나타내고; αn은 상기 인코딩될 이미지 프레임의 모션 진폭을 나타내고; μI.n은상기 인코딩될 이미지 프레임의 이전이고 상기 인코딩될 이미지 프레임에 가장 가까운 I 프레임의 휘도 성분의 피크 신호 대 잡음비(PSNR)를 나타내고; μn -1은 상기 인코딩될 이미지 프레임의 이전 이미지 프레임의 휘도 성분의 PSNR을 나타내고; σ1, σ2, σ3, 및 σ4, 및 T1.n, T2.n, T3.n, 및 T4.n은 양의 임계치들이고, σ12, σ23, 및 σ34이고, T2.n>T3.n, 및 T3.n>T4.n인, 비디오 인코딩 디바이스.
  15. 제12항에 있어서, 상기 명령어는 상기 프로세서에 의해 추가로 로딩되고 실행되어 다음의 방법:
    상기 업데이트된 정적 변수가 상기 제1 사전설정된 임계치 미만일 때 상기 인코딩될 이미지 프레임을 P 프레임으로서 인코딩하는 단계를 구현하는, 비디오 인코딩 디바이스.
  16. 제12항 내지 제15항 중 어느 한 항에 있어서, 상기 명령어는 상기 프로세서에 의해 추가로 로딩되고 실행되어 다음의 방법:
    상기 인코딩될 이미지 프레임의 인코딩이 완료된 후에, 다음 인코딩될 이미지 프레임을 획득하고, 상기 슬라이딩 윈도를 하나의 이미지 프레임의 거리만큼 뒤로 이동시켜, 상기 슬라이딩 윈도의 후미에 상기 다음 인코딩될 이미지 프레임을 위치시키는 단계; 및
    현재 업데이트된 정적 변수가 상기 제1 사전설정된 임계치 이상일 때까지 상기 슬라이딩 윈도 내의 각각의 이미지 프레임의 모션 진폭 차이에 따라 상기 정적 변수를 연속적으로 업데이트한 다음, 현재 인코딩될 이미지 프레임을 I 프레임으로서 인코딩하는 단계를 구현하는, 비디오 인코딩 디바이스.
  17. 제12항에 있어서, 상기 명령어는 상기 프로세서에 의해 추가로 로딩되고 실행되어 다음의 방법:
    상기 인코딩될 이미지 프레임과 상기 인코딩될 이미지 프레임의 이전이고 상기 인코딩될 이미지 프레임에 가장 가까운 I 프레임 간의 거리를 획득하는 단계;
    상기 거리에 따라 제4 사전설정된 임계치를 다음의 수학식들:
    Figure pct00023

    Figure pct00024

    Figure pct00025

    을 이용하여 계산하는 단계 - VScene는 지정된 임계치를 나타내고; D는 상기 거리를 나타내고; GOPmin은 픽처 그룹 GOP의 사전설정된 최소 길이를 나타내고; GOPmax는 상기 GOP의 사전설정된 최대 길이를 나타내고; Fbias는 상기 제4 사전설정된 임계치를 나타냄 -; 및
    상기 인코딩될 이미지 프레임의 모션 진폭이 1과 상기 제4 사전설정된 임계치 간의 차이보다 크고 상기 인코딩될 이미지 프레임의 모션 진폭이 제5 사전설정된 임계치 이상이고, 상기 거리가 제6 사전설정된 임계치 이상일 때, 상기 인코딩될 이미지 프레임을 I 프레임으로서 인코딩하는 단계를 구현하는, 비디오 인코딩 디바이스.
  18. 적어도 하나의 명령어를 저장하는 컴퓨터 판독가능 저장 매체로서, 상기 명령어는 제1항 내지 제6항 중 어느 한 항에 따른 비디오 인코딩 방법에서 수행되는 동작들을 수행하기 위해 프로세서에 의해 로딩되고 실행되는, 컴퓨터 판독가능 저장 매체.
KR1020197024476A 2017-06-15 2018-05-18 비디오 인코딩 방법, 장치, 및 디바이스, 및 저장 매체 KR102225235B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201710461367.7 2017-06-15
CN201710461367.7A CN109151469B (zh) 2017-06-15 2017-06-15 视频编码方法、装置及设备
PCT/CN2018/087539 WO2018228130A1 (zh) 2017-06-15 2018-05-18 视频编码方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
KR20190109476A true KR20190109476A (ko) 2019-09-25
KR102225235B1 KR102225235B1 (ko) 2021-03-09

Family

ID=64659774

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197024476A KR102225235B1 (ko) 2017-06-15 2018-05-18 비디오 인코딩 방법, 장치, 및 디바이스, 및 저장 매체

Country Status (6)

Country Link
US (2) US10893275B2 (ko)
EP (1) EP3641310A4 (ko)
JP (1) JP6925587B2 (ko)
KR (1) KR102225235B1 (ko)
CN (1) CN109151469B (ko)
WO (1) WO2018228130A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112272297B (zh) * 2020-10-28 2023-01-31 上海科江电子信息技术有限公司 嵌入在解码器端的图像质量静止帧检测方法
CN112929701B (zh) * 2021-02-04 2023-03-17 浙江大华技术股份有限公司 一种视频编码方法、装置、设备及介质
CN113747159B (zh) * 2021-09-06 2023-10-13 深圳软牛科技有限公司 一种生成可变帧率视频媒体文件的方法、装置及相关组件
CN115695889A (zh) * 2022-09-30 2023-02-03 聚好看科技股份有限公司 显示设备及悬浮窗显示方法
CN116962685B (zh) * 2023-09-21 2024-01-30 杭州爱芯元智科技有限公司 视频编码方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060126735A1 (en) * 2004-12-13 2006-06-15 Canon Kabushiki Kaisha Image-encoding apparatus, image-encoding method, computer program, and computer-readable medium
JP2008187220A (ja) * 2007-01-26 2008-08-14 Kddi R & D Laboratories Inc 動画像符号化装置
US20100061461A1 (en) * 2008-09-11 2010-03-11 On2 Technologies Inc. System and method for video encoding using constructed reference frame
US20110002385A1 (en) * 2009-07-01 2011-01-06 Canon Kabushiki Kaisha Image coding apparatus, control method therefor and computer program

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09327023A (ja) 1996-06-06 1997-12-16 Nippon Telegr & Teleph Corp <Ntt> フレーム内/フレーム間符号化切替方法および画像符号化装置
US6025888A (en) * 1997-11-03 2000-02-15 Lucent Technologies Inc. Method and apparatus for improved error recovery in video transmission over wireless channels
US8654848B2 (en) * 2005-10-17 2014-02-18 Qualcomm Incorporated Method and apparatus for shot detection in video streaming
US7965771B2 (en) * 2006-02-27 2011-06-21 Cisco Technology, Inc. Method and apparatus for immediate display of multicast IPTV over a bandwidth constrained network
US8938005B2 (en) * 2007-11-05 2015-01-20 Canon Kabushiki Kaisha Image encoding apparatus, method of controlling the same, and computer program
US9628811B2 (en) * 2007-12-17 2017-04-18 Qualcomm Incorporated Adaptive group of pictures (AGOP) structure determination
CN101742293B (zh) * 2008-11-14 2012-11-28 北京中星微电子有限公司 一种基于视频运动特征的图像自适应帧场编码方法
CN102572381A (zh) * 2010-12-29 2012-07-11 中国移动通信集团公司 视频监控场景判别方法及其监控图像编码方法、及装置
US9300943B2 (en) * 2011-01-12 2016-03-29 Panasonic Intellectual Property Corporation Of America Image coding method, image decoding method, image coding apparatus, and image decoding apparatus
CN103796019B (zh) * 2012-11-05 2017-03-29 北京勤能通达科技有限公司 一种均衡码率编码方法
KR20140110221A (ko) * 2013-03-06 2014-09-17 삼성전자주식회사 비디오 인코더, 장면 전환 검출 방법 및 비디오 인코더의 제어 방법
JP6365253B2 (ja) 2014-11-12 2018-08-01 富士通株式会社 映像データ処理装置、映像データ処理プログラムおよび映像データ処理方法
CN105898313A (zh) * 2014-12-15 2016-08-24 江南大学 一种新的基于视频大纲的监控视频可伸缩编码技术
CN105761263A (zh) * 2016-02-19 2016-07-13 浙江大学 一种基于镜头边界检测和聚类的视频关键帧提取方法
CN106231301B (zh) * 2016-07-22 2020-06-12 上海交通大学 基于编码单元层次和率失真代价的hevc复杂度控制方法
CN106254873B (zh) * 2016-08-31 2020-04-03 广州市网星信息技术有限公司 一种视频编码方法及视频编码装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060126735A1 (en) * 2004-12-13 2006-06-15 Canon Kabushiki Kaisha Image-encoding apparatus, image-encoding method, computer program, and computer-readable medium
JP2008187220A (ja) * 2007-01-26 2008-08-14 Kddi R & D Laboratories Inc 動画像符号化装置
US20100061461A1 (en) * 2008-09-11 2010-03-11 On2 Technologies Inc. System and method for video encoding using constructed reference frame
US20110002385A1 (en) * 2009-07-01 2011-01-06 Canon Kabushiki Kaisha Image coding apparatus, control method therefor and computer program

Also Published As

Publication number Publication date
US20190260998A1 (en) 2019-08-22
EP3641310A4 (en) 2020-05-06
CN109151469B (zh) 2020-06-30
JP2020509668A (ja) 2020-03-26
US20210076044A1 (en) 2021-03-11
WO2018228130A1 (zh) 2018-12-20
US11297328B2 (en) 2022-04-05
US10893275B2 (en) 2021-01-12
EP3641310A1 (en) 2020-04-22
CN109151469A (zh) 2019-01-04
JP6925587B2 (ja) 2021-08-25
KR102225235B1 (ko) 2021-03-09

Similar Documents

Publication Publication Date Title
JP7229261B2 (ja) ビデオ符号化のビットレート制御方法、装置、機器、記憶媒体及びプログラム
KR102225235B1 (ko) 비디오 인코딩 방법, 장치, 및 디바이스, 및 저장 매체
US10986332B2 (en) Prediction mode selection method, video encoding device, and storage medium
CN108737908B (zh) 一种媒体播放方法、装置及存储介质
US11202066B2 (en) Video data encoding and decoding method, device, and system, and storage medium
CN106792120B (zh) 视频画面的显示方法、装置和终端
CN108391127B (zh) 视频编码方法、装置、存储介质及设备
CN111010576B (zh) 一种数据处理方法及相关设备
CN108337533B (zh) 视频压缩方法和装置
WO2019169997A1 (zh) 视频运动估计方法、装置、终端及存储介质
CN105992001A (zh) 一种对图片进行量化处理的方法及装置
US10827198B2 (en) Motion estimation method, apparatus, and storage medium
CN111263216B (zh) 一种视频传输方法、装置、存储介质及终端
CN109003313B (zh) 一种传输网页图片的方法、装置和系统
CN115955565B (zh) 处理方法、处理设备及存储介质
CN116156232A (zh) 一种视频内容的播放方法以及相关装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant