TWI648980B - Content-based adaptive video transcoding method and device - Google Patents

Content-based adaptive video transcoding method and device Download PDF

Info

Publication number
TWI648980B
TWI648980B TW103134240A TW103134240A TWI648980B TW I648980 B TWI648980 B TW I648980B TW 103134240 A TW103134240 A TW 103134240A TW 103134240 A TW103134240 A TW 103134240A TW I648980 B TWI648980 B TW I648980B
Authority
TW
Taiwan
Prior art keywords
video
value
parameter
transcoded
transcoding
Prior art date
Application number
TW103134240A
Other languages
English (en)
Other versions
TW201545537A (zh
Inventor
譚建國
Original Assignee
阿里巴巴集團服務有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 阿里巴巴集團服務有限公司 filed Critical 阿里巴巴集團服務有限公司
Publication of TW201545537A publication Critical patent/TW201545537A/zh
Application granted granted Critical
Publication of TWI648980B publication Critical patent/TWI648980B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440218Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440254Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering signal-to-noise parameters, e.g. requantization
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0102Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving the resampling of the incoming video signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0117Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving conversion of the spatial resolution of the incoming video signal
    • H04N7/0122Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving conversion of the spatial resolution of the incoming video signal the input and the output signals having different aspect ratios
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0127Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level by changing the field or frame frequency of the incoming video signal, e.g. frame rate converter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440263Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the spatial resolution, e.g. for displaying on a connected PDA
    • H04N21/440272Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the spatial resolution, e.g. for displaying on a connected PDA for performing aspect ratio conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/44029Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display for generating different versions

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Graphics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本發明揭示了一種基於內容的自適應視頻轉碼方法,包括:獲取在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值;根據表徵待轉碼視頻內容複雜程度的最小量化數值和待轉碼視頻的視頻參數值,設定轉碼參數的值;根據已設定的轉碼參數對所述待轉碼視頻進行轉碼,產生目標視頻。本發明同時提供一種基於內容的自適應視頻轉碼裝置。採用本發明提供的方法,能夠在保證轉碼後視頻品質的同時,避免對帶寬的無謂消耗。

Description

基於內容的自適應視頻轉碼方法及裝置
本發明關於視頻轉碼技術,具體關於一種基於內容的自適應視頻轉碼方法。本發明同時提供一種基於內容的自適應視頻轉碼裝置。
隨著資訊技術的飛躍,多媒體技術在網路中的應用得到了空前發展,作為多媒體技術重要組成部分的視頻通信技術也得到了極大的發展和應用。由於不同的視頻可能採用不同的編碼或者壓縮標準,而且具體應用場景也可能不同,因此在不同的設備間共用、交換或者播放視頻檔時,通常需要進行視頻轉碼操作。
視頻轉碼(Video Transcoding)是指將已經壓縮編碼的視頻碼流轉換成另一個視頻碼流,以適應不同的網路帶寬、不同的終端處理能力和不同的用戶需求。轉碼本質上是一個先解碼、再編碼的過程,在該過程中既可能關於不同視頻格式之間的轉換,例如從MPEG-2或者MPEG-4轉到H.264;也可能關於對碼率、解析度和框率等轉碼參數的調整,使得執行轉碼操作產生的視頻能夠滿足特定的需 求,例如:降低編碼碼率,以適應網路帶寬受限的傳輸場景或者適應終端設備播放速度的需求,或者調整編碼解析度,將高清視頻轉為標清甚至更低的清晰度,從而減少視頻檔所佔用的儲存介質空間。
目前很多視頻公司都提供了視頻轉碼工具。這些視頻轉碼工具通常採用傳統的視頻轉碼技術,即:採用預先設定好的視頻轉碼參數(解析度、碼率、或者框速率)進行轉碼,例如:用待轉碼視頻的解析度所對應的固定碼率進行轉碼,或者是將視頻圖片寬度固定、按照寬高比來設定高度,並根據圖元數來調整碼率並進行轉碼。
由此可見,傳統的視頻轉碼技術並沒有從待轉碼視頻內容的複雜程度出發,而基本上都是根據主觀經驗設定進行視頻轉碼的參數值,或者僅考慮了待轉碼視頻的某一兩個參數,因此傳統的視頻轉碼技術通常無法實現對不同內容的視頻檔的有效轉碼。例如:對於內容比較簡單的視頻,由於採用了較高的碼率進行編碼,從而造成網路帶寬的浪費;對於內容較為複雜的視頻,又可能因為採用較低的解析度導致轉碼後視頻的整體清晰度的下降。
本發明提供一種基於內容的自適應視頻轉碼方法,以解決現有視頻轉碼技術採用固定的轉碼參數進行轉碼可能導致的浪費網路帶寬以及影響輸出視頻品質的問題。本發明另外提供一種基於內容的自適應視頻轉碼裝置。
本發明提供一種基於內容的自適應視頻轉碼方法,包括:獲取在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值;根據表徵待轉碼視頻內容複雜程度的最小量化數值和待轉碼視頻的視頻參數值,設定轉碼參數的值;根據已設定的轉碼參數對所述待轉碼視頻進行轉碼,產生目標視頻。
可選的,所述轉碼參數包括:碼率參數、解析度參數和框率參數。
可選的,在所述獲取在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值之前,執行下述步驟:獲取所述待轉碼視頻的視頻參數值,所述視頻參數包括:解析度參數和框率參數。
可選的,所述預先設定的客觀品質標準是指,峰值信噪比PSNR大於或者等於40dB。
可選的,所述獲取在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值,包括:為所述待轉碼視頻建立量化參數QP和峰值信噪比PSNR的線性模型;根據所述線性模型,獲取所述量化參數QP在所述峰值信噪比PSNR大於或者等於40dB情況下的最大值; 依據所述量化參數QP的最大值對所述待轉碼視頻進行轉碼,獲取與所述量化參數QP的最大值對應的碼率最小值;所述碼率最小值即為在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值。
可選的,所述為所述待轉碼視頻建立量化參數QP和峰值信噪比PSNR的線性模型,採用如下方式實現:截取所述待轉碼視頻中的一個或者多個視頻片斷,並根據所述一個或者多個視頻片斷建立量化參數QP和峰值信噪比PSNR的線性模型。
可選的,所述根據表徵所述待轉碼視頻內容複雜程度的最小量化數值和所述待轉碼視頻的視頻參數值,設定轉碼參數的值,是指,將所述轉碼參數中的碼率參數的值設定為所述碼率最小值,將所述轉碼參數中的解析度參數的值設定為已獲取的待轉碼視頻的解析度值,將所述轉碼參數中的框率參數的值設定為已獲取的待轉碼視頻的框率值。
可選的,所述根據表徵所述待轉碼視頻內容複雜程度的最小量化數值和所述待轉碼視頻的視頻參數值,設定轉碼參數的值,包括:按照預先設定的規範,根據所述碼率最小值獲取待轉碼視頻的視頻類型;按照預先設定的規範,根據所述待轉碼視頻的視頻類型選擇一種或者多種目標視頻類型;為每一種目標視頻類型設定相應的轉碼參數值。
可選的,所述視頻類型包括:LD碼流、SD碼流、HD碼流、UD碼流或者UUD碼流。
可選的,在根據所述碼率最小值獲取待轉碼視頻的視頻類型後,執行下述操作對所述待轉碼視頻的視頻類型進行修訂:按照預先設定的規範,獲取所述待轉碼視頻的視頻類型對應的解析度的最小值;判斷已獲取的待轉碼視頻的解析度參數值是否低於上述最小值;若是,用所述已獲取的待轉碼視頻的解析度參數值對應的視頻類型作為所述待轉碼視頻的視頻類型。
可選的,所述為每一種目標視頻類型設定相應的轉碼參數值包括:根據所述碼率最小值和已獲取的所述待轉碼視頻的解析度參數值,為所述待轉碼視頻建立解析度與碼率的線性模型;針對所述每一種目標視頻類型,執行下述操作設定與該目標視頻類型對應的轉碼參數值:按照預先設定的規範,選擇當前目標視頻類型對應的碼率最大值與最小值之間的中間碼率值,並將所述轉碼參數中的碼率參數的值設定為所述中間碼率值;根據已建立的解析度與碼率的線性模型,獲取與所述中間碼率值對應的解析度值,並將所述轉碼參數中的解析度參數的值設定為所述解析度值;將所述轉碼參數中的框率參數的值設定 為已獲取的待轉碼視頻的框率值。
可選的,在根據已建立的解析度與碼率的線性模型,獲取與所述中間碼率值對應的解析度值之後,執行下述操作:對已獲取的解析度值的寬和高分別乘以同一個預先設定的調整因數,並將得到的解析度值作為對所述轉碼參數中的解析度參數進行設定所用的解析度值。
可選的,所述針對每一種目標視頻類型執行的設定轉碼參數值的操作,還包括:按照預先設定的規範,獲取當前目標視頻類型對應的解析度的最小值;判斷與所述中間碼率值對應的解析度值是否低於上述解析度的最小值;若是,用上述解析度的最小值作為對所述轉碼參數中的解析度參數進行設定所用的解析度值。
可選的,所述根據已設定的轉碼參數對所述待轉碼視頻進行轉碼是指,針對每一種目標視頻類型,使用已設定好的、與該目標視頻類型對應的所述碼率參數、所述解析度參數和所述框率參數,對所述待轉碼視頻進行轉碼。
相應的,本發明還提供一種基於內容的自適應視頻轉碼裝置,包括:量化數值獲取單元,用於獲取在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化 數值;轉碼參數設定單元,用於根據表徵待轉碼視頻內容複雜程度的最小量化數值和待轉碼視頻的視頻參數值,設定轉碼參數的值;視頻轉碼執行單元,用於根據已設定的轉碼參數對所述待轉碼視頻進行轉碼,產生目標視頻。
可選的,所述裝置還包括:視頻參數獲取單元,用於在獲取在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值之前,獲取所述待轉碼視頻的視頻參數值,所述視頻參數包括:解析度參數和框率參數。
可選的,所述量化數值獲取單元包括:第一模型建立子單元,用於為所述待轉碼視頻建立量化參數QP和峰值信噪比PSNR的線性模型;量化參數獲取子單元,用於根據所述線性模型,獲取所述量化參數QP在所述峰值信噪比PSNR大於或者等於40dB情況下的最大值;最小碼率獲取子單元,用於依據所述量化參數QP的最大值對所述待轉碼視頻進行轉碼,獲取與所述量化參數QP的最大值對應的碼率最小值;所述碼率最小值即為在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值。
可選的,所述第一模型建立子單元具體用於,截取所述待轉碼視頻中的一個或者多個視頻片斷,並根據所述一 個或者多個視頻片斷建立量化參數QP和峰值信噪比PSNR的線性模型。
可選的,所述轉碼參數設定單元具體用於,將所述轉碼參數中的碼率參數的值設定為所述碼率最小值,將所述轉碼參數中的解析度參數的值設定為已獲取的待轉碼視頻的解析度值,將所述轉碼參數中的框率參數的值設定為已獲取的待轉碼視頻的框率值。
可選的,所述轉碼參數設定單元包括:原始視頻類型獲取子單元,用於按照預先設定的規範,根據所述碼率最小值獲取待轉碼視頻的視頻類型;目標視頻類型獲取子單元,用於按照預先設定的規範,根據所述待轉碼視頻的視頻類型選擇一種或者多種目標視頻類型;轉碼參數設定執行子單元,用於為每一種目標視頻類型設定相應的轉碼參數值。
可選的,所述轉碼參數設定單元還包括:原始視頻類型修訂子單元,用於在根據所述碼率最小值獲取待轉碼視頻的視頻類型後,對所述待轉碼視頻的視頻類型進行修訂;所述原始視頻類型修訂子單元包括:第一最小解析度獲取子單元,用於按照預先設定的規範,獲取所述待轉碼視頻的視頻類型對應的解析度的最小值;第一最小解析度判斷子單元,用於判斷已獲取的待轉 碼視頻的解析度參數值是否低於上述最小值;原始視頻類型調整子單元,用於當所述第一最小解析度判斷子單元的輸出為“是”時,用所述已獲取的待轉碼視頻的解析度參數值對應的視頻類型作為所述待轉碼視頻的視頻類型。
可選的,所述轉碼參數設定執行子單元包括:第二模型建立子單元,用於根據所述碼率最小值和已獲取的所述待轉碼視頻的解析度參數值,為所述待轉碼視頻建立解析度與碼率的線性模型;轉碼參數設定控制子單元,用於針對每一種目標視頻類型,依次調用以下碼率參數設定子單元、解析度參數設定子單元和框率參數設定子單元進行轉碼參數的設定;碼率參數設定子單元,用於按照預先設定的規範,選擇當前目標視頻類型對應的碼率最大值與最小值之間的中間碼率值,並將所述轉碼參數中的碼率參數的值設定為所述中間碼率值;解析度參數設定子單元,用於根據已建立的解析度與碼率的線性模型,獲取與所述中間碼率值對應的解析度值,並將所述轉碼參數中的解析度參數的值設定為所述解析度值;框率設定子單元,用於將所述轉碼參數中的框率參數的值設定為已獲取的待轉碼視頻的框率值。
可選的,所述解析度參數設定子單元包括:解析度參數獲取子單元,用於根據已建立的解析度與 碼率的線性模型,獲取與所述中間碼率值對應的解析度值;解析度參數調整子單元,用於對所述解析度參數獲取子單元輸出的解析度值的寬和高分別乘以同一個預先設定的調整因數;第一解析度參數設定執行子單元,用於將所述轉碼參數中的解析度參數的值設定為所述解析度參數調整子單元輸出的調整後的解析度值。
可選的,所述解析度參數設定子單元包括:解析度參數獲取子單元,用於根據已建立的解析度與碼率的線性模型,獲取與所述中間碼率值對應的解析度值;第二最小解析度獲取子單元,按照預先設定的規範,獲取當前目標視頻類型對應的解析度的最小值;第二最小解析度判斷子單元,用於判斷與所述中間碼率值對應的解析度值是否低於上述解析度的最小值;第二解析度參數設定執行子單元,用於當所述第二最小解析度判斷子單元的輸出為“是”時,將所述轉碼參數中的解析度參數的值設定為上述解析度的最小值。
可選的,所述視頻轉碼執行單元具體用於,針對每一種目標視頻類型,使用已設定好的、與該目標視頻類型對應的所述碼率參數、所述解析度參數和所述框率參數,對所述待轉碼視頻進行轉碼,得到對應的目標視頻。
與現有技術相比,本發明具有以下優點: 本發明提供的基於內容的自適應視頻轉碼方法,透過獲取待轉碼視頻在滿足預先設定的客觀品質標準下的、表徵其內容複雜程度的最小量化數值,根據所述最小量化數值設定轉碼所需的各個參數值,並根據設定好的轉碼參數對所述待轉碼視頻進行轉碼,實現了在達到客觀圖像品質標準的前提下,以待轉碼視頻的信息量為依據自適應地設定轉碼所需的解析度參數以及碼率參數,從而在保證轉碼後視頻品質的同時,避免對帶寬的無謂消耗。
101-103‧‧‧步驟
101-1-101-4‧‧‧步驟
102-1-102-3‧‧‧步驟
601‧‧‧量化數值獲取單元
602‧‧‧轉碼參數設定單元
603‧‧‧視頻轉碼執行單元
圖1是本發明的一種基於內容的自適應視頻轉碼方法的實施例的流程圖;圖2是本發明的獲取在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值的處理流程圖;圖3是本發明的透過實驗獲取的PSNR和QP滿足近線性關係的示意圖;圖4是本發明的為產生多種目標視頻進行轉碼參數設定的處理流程圖;圖5是本發明的透過實驗獲取的解析度與碼率滿足近線性關係的示意圖;圖6是本發明的一種基於內容的自適應視頻轉碼裝置的實施例的示意圖。
在下面的描述中闡述了很多具體細節以便於充分理解本發明。但是本發明能夠以很多不同於在此描述的其他方式來實施,本領域技術人員可以在不違背本發明內涵的情況下做類似推廣,因此本發明不受下面揭示的具體實施的限制。
在本發明中,分別提供了一種基於內容的自適應視頻轉碼方法、以及一種基於內容的自適應視頻轉碼裝置。在下面的實施例中逐一進行詳細說明。
請參考圖1,其為本發明的一種基於內容的自適應視頻轉碼方法的實施例的流程圖。所述方法包括如下步驟:
步驟101:獲取在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值。
轉碼過程通常包含解碼和編碼兩個部分,編碼階段一方面要根據要求進行編碼格式的轉換,同時還需要根據轉碼目的,指定轉碼產生目標視頻資料的碼率、解析度、框率等參數,從而才能產生符合要求的目標視頻。本發明的技術方案關於其中對轉碼參數進行設定的部分,其他解碼、編碼格式轉換等處理可以採用現有技術實現,例如調用FFMPEG庫中提供的相關介面實現。
本發明技術方案的核心在於,以滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度(即:待轉碼視頻信息量)的最小量化數值為依據,進行轉碼參數的設定,從而在保證轉碼產生的目標視頻品質的同時,避免 對帶寬的無謂消耗。
採用本發明的技術方案,可以線上上為用戶提供一種或者多種檔次的片源,既保證線上視頻品質、同時也能夠降低整體視頻服務的帶寬。但是本發明的技術方案並不侷限于這種應用,只要是依據待轉碼視頻的信息量進行轉碼參數的設定並進行轉碼的應用場合,都可以使用本發明的技術方案。
為了實現本發明的技術方案,首先要獲取在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值。具體過程包括獲取待轉碼視頻參數值、建立模型、獲取量化參數QP的最大值以及獲取與所述QP的最大值對應的碼率最小值這樣幾個子步驟,下面結合圖2對各子步驟進行說明。
步驟101-1:獲取所述待轉碼視頻的視頻參數值,所述視頻參數包括:解析度參數和框率參數。
獲取所述待轉碼視頻的視頻參數值,可以透過讀取並分析待轉碼視頻檔的格式實現,也可以透過使用FFMPEG(Fast Forward MPEG的英文簡稱)開源代碼提供的、用於查看視音頻檔資訊的探測工具ffprobe實現。
FFMPEG是目前應用最廣泛的編解碼軟體庫,支持多種流行的編解碼器,它是C語言實現的,不僅被集成到各種PC軟體中,也經常被移植到多種嵌入式設備中。利用FFMPEG庫,既可以透過命令行進行視音頻的編解碼,也可以在代碼中調用該庫提供的編解碼函數API實現所需的 功能。
按照如下所述的格式,調用FFMPEG庫提供的ffprobe命令,在螢幕上就會輸出所述待轉碼視頻的視頻參數資訊,包括解析度res、框率fps等參數。
ffprobe-show_streams“待轉碼視頻檔”;其中,解析度(res是resolution的英文縮寫)是指視頻的寬/高圖元值,即:視頻圖像在橫向和縱向上的有效圖元數,對於同樣大小的視頻播放視窗來說,通常解析度越高圖像越清晰;框率(fps是frames per second的英文縮寫)是指每秒鐘填充圖像的框數(單位是框/秒),也稱每秒傳輸框數,通常框率值越大,用戶觀看到的視頻就會愈流暢。
步驟101-2:為所述待轉碼視頻建立量化參數QP和峰值信噪比PSNR的線性模型。
QP是量化參數Quantization Parameter的英文縮寫,在視頻編碼過程中,決定輸出碼率比特數的直接因素為DCT變換(離散余弦變換-Discrete Cosine Transform)後,對獲得的DCT係數進行量化時採用的量化參數。
量化參數QP反映了空間細節壓縮情況,如果量化參數小,大部分的細節都會被保留,輸出碼率較高;如果量化參數大,部分細節被丟棄,輸出碼率相對就會降低,但圖像失真較大、品質不高。由此可見,量化參數QP和輸出碼率成反比的關係,在轉碼過程中進行碼率控制的基本方法就是選擇適當的量化參數,控制轉碼器輸出碼流的碼 率。
上面提到的所謂碼率,是指每秒時間內的資料流程量。碼率越高,對畫面的描述就越精細,畫質的損失就越小,所得到的畫面就越接近於原始畫面。但同時也需要更大的存貯空間或者網路帶寬來存放或者傳輸這些資料。
本實施例採用PSNR(Peak Signal to Noise Ration峰值信噪比的英文縮寫)來評價視頻圖像的品質,通常在經過轉碼或者視頻壓縮等處理之後,輸出的視頻影像都會在某種程度與原始視頻影像不同,為了客觀評價經過處理後的視頻品質,通常會參考PSNR值。PSNR值是根據原視頻圖像與處理後視頻圖像之間的均方誤差MSE計算得到的,其單位為dB,PSNR值越大,就代表失真越少。
在本步驟中之所以要建立QP和PSNR的模型,就是為了能夠在後續步驟中根據PSNR的值確定對應的QP值,並進一步確定對應的碼率值。
通常,在其他視頻參數固定的情況下,PSNR和QP滿足近線性關係,請參見附圖3,其為本發明透過實驗獲取的PSNR和QP滿足近線性關係的示意圖。在本實施例的一個具體例子中,基於上述實驗基礎採用如下方式建立兩者之間的線性模型:在選定待轉碼視頻的其他視頻參數(包括解析度、框率等)的情況下,設定一個量化參數值QP1,使用FFMPEG提供的轉碼工具執行一次轉碼操作,根據螢幕輸出的相關資訊獲取轉碼輸出視頻的平均PSNR1;同理,再 設定一個不同於QP1的量化參數值QP2執行一次轉碼操作,獲取對應的轉碼輸出視頻平均PSNR2。由於PSNR和QP滿足近線性關係,用上述得到的(QP1,PSNR1)和(QP2,PSNR2)這兩個點連接成一條直線,就得到了所述線性模型。
在實際實施過程中,從提高時間性能的角度考慮,可以截取所述待轉碼視頻中的一個或者多個視頻片斷,並根據所述一個或者多個視頻片斷,採用上述方法建立量化參數QP和峰值信噪比PSNR的線性模型。由於截取的一個或者多個視頻片斷的總時長相對於待轉碼視頻來說是較短的,因此可以提高處理的速度,獲得較好的時間性能;但是由於截取的一個或者多個視頻片斷有可能無法準確地反映整個視頻的特徵,因此建立起來的模型也可能不夠準確,從而影響最終的轉碼結果。所以在具體實施過程中,要根據實際需求斟酌選擇合適的實施方式。
步驟101-3:根據所述線性模型,獲取所述量化參數QP在所述峰值信噪比PSNR大於或者等於40dB情況下的最大值。
進行視頻轉碼的前提條件是,保證轉碼後產生的目標視頻滿足一定的客觀品質標準。對於採用PSNR衡量轉碼後視頻圖像品質來說,通常認為PSNR大於或者等於40dB說明圖像品質極好,即非常接近原始圖像,在30dB-40dB之間通常表示圖像品質是好的,即有可察覺的失真但可以接受,而低於30dB通常說明圖像品質較 差。因此,如果採用PSNR衡量視頻圖像品質,那麼本發明所述的預先設定的客觀品質標準就是指,峰值信噪比PSNR大於或者等於40dB。
本實施例採用PSNR大於等於40dB作為衡量轉碼後視頻圖像品質的客觀品質標準,在該條件下,根據步驟101-2建立的線性模型,即可選取所述量化參數的最大值QP_max。
本實施例採用的是PSNR作為衡量處理後視頻品質的客觀標準,在其他實施方式中,也可以採用其他的衡量標準,例如:SSIM(Structural similarity index measurement是結構相似度衡量的英文簡稱)標準,同樣可以在步驟101-2中建立SSIM與QP之間的模型,並且在本步驟中獲取相應的QP_max,同樣可以實現本發明的技術方案。
步驟101-4:依據所述量化參數QP的最大值對所述待轉碼視頻進行轉碼,獲取與所述量化參數QP的最大值對應的碼率最小值;所述碼率最小值即為在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值。
本發明技術方案的核心在於,根據待轉碼視頻內容的複雜程度(即:包含的信息量)確定轉碼參數。要實現這一技術核心,首先要獲取能夠表徵待轉碼視頻內容複雜程度的量化數值。為此需要對視頻圖像的複雜度與量化參數QP以及編碼比特數(即:碼率)之間的關係進行分析。
圖像複雜度指的就是圖像的細節資訊,細節資訊越 多,圖像複雜度也就越高。對於相同的圖像來說,所選的量化參數QP越小,所需編碼比特數越大;對於不同的圖像來說,在相同的量化參數QP下,圖像複雜度越高,所需的編碼比特數越大。由此可見,在給定量化參數QP的情況下,編碼比特數(即:碼率)的大小可以表徵視頻圖像的複雜度,編碼比特數就是本發明所述的表徵待轉碼視頻內容複雜程度的量化數值。
在步驟101-3已經獲取了在PSNR大於或者等於40dB情況下的量化參數最大值QP_max,當量化參數取小於或者等於QP_max的值時,得到的轉碼後視頻都不失真,並且每個量化參數值都與一個碼率值相對應;當量化參數等於QP_max時,與其對應的碼率值最小,即得到了本發明所述的在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值Br_min。在框率、解析度等參數不變的情況下,使用該碼率最小值進行轉碼,既能保證產生的目標視頻檔不失真,同時佔用網路帶寬最小。
在本實施例的一個具體例子中,採用如下方式獲取與QP_max對應的碼率最小值Br_min:在使用待轉碼視頻的原有視頻參數(包括解析度、框率等)的情況下,設定量化參數的值為QP_max,然後使用FFMPEG提供的轉碼工具執行一次轉碼操作,根據螢幕輸出的相關資訊獲取轉碼輸出視頻的碼率值,即:與QP_max對應的碼率最小值Br_min,在後續步驟102中就可以以該數值為依據進行轉 碼參數的設定。
需要說明的是,本實施例採用的是在滿足預先設定的客觀品質標準下的、與量化參數最大值對應的碼率最小值,作為表徵待轉碼視頻內容複雜程度的最小量化數值,在其他實施方式中也可以採用其他數值作為表徵待轉碼視頻內容複雜程度的最小量化數值,並以此為依據進行後續轉碼參數的設定,上述實施方式的變更,並不偏離本發明的核心,也在本發明的保護範圍之內。
步驟102:根據表徵所述待轉碼視頻內容複雜程度的最小量化數值和所述待轉碼視頻的視頻參數值,設定轉碼參數的值。
對待轉碼視頻進行轉碼所需設定的轉碼參數通常包括:碼率參數、解析度參數以及框率參數。由於在步驟101中,已經獲取了在客觀視頻不失真情況下的、表徵待轉碼視頻內容複雜度的碼率最小值Br_min,因此在本步驟中,可以直接將所述轉碼參數中的碼率參數的值設定為所述碼率最小值Br_min,將所述轉碼參數中的解析度參數和框率參數的值分別設定為已獲取的待轉碼視頻的解析度值和框率值。步驟103根據按照上述方式設定的轉碼參數進行轉碼,就可以在框率和解析度不變的條件下,既保證目標視頻圖像不失真,同時還能夠最大限度減少對網路帶寬的佔用。
在本實施例的一個具體例子中,因為採用FFMPEG提供的函數進行轉碼,因此在本步驟中需要對函數所使用的 AVCodecContext資料結構中轉碼參數變數進行設定,其中已獲取的待轉碼視頻的解析度值儲存儲存在Res_org中,已獲取的待轉碼視頻的框率值為Fps_org,則進行轉碼參數設定的代碼如下所示:AVCodecContext *c; c->bit_rate=Br_min; //設定碼率c->width=Res_org.width; //設定解析度的寬c->height=Res_org.height; //設定解析度的高c->time_base.den=Fps_org; //設定框率的分母c->time_base.num=1; //設定框率的分子上面給出的代碼片斷僅僅是示意性的,重點描述了對轉碼參數中的碼率、解析度和框率參數的設定,在具體實施中,為了正確轉碼,還需要根據需要設定其他相關參數,這部分內容不屬於本發明技術方案的範疇,因此沒有示出。
採用上述設定方式,在步驟103中就可以轉碼產生與待轉碼視頻的框率和解析度相同條件下的、碼率為Br_min的目標視頻。考慮到實際應用中,視頻公司通常需要根據同一個待轉碼視頻檔,產生不同解析度的目標視頻,從而為用戶提供不同檔次的視頻服務片源,因此本發明的技術方案還進一步提供了以表徵待轉碼視頻內容複雜度的最小量化數值Br_min為依據,進行多個檔次的轉碼參數的設定,從而在後續步驟103中產生多個目標視頻的方案,下面結合圖4對該過程關於的子步驟進行詳細說 明。
步驟102-1:按照預先設定的規範,根據所述碼率最小值獲取待轉碼視頻的視頻類型videoType。
本發明所述的視頻類型包括:LD碼流、SD碼流、HD碼流、UD碼流以及UUD碼流。其中LD、SD、HD、UD、UUD分別是low definition(低清)、standard definition(標清)、high definition(高清)、Ultra High Definition(超高清)以及Ultra Ultra High Definition(超超高清)的英文縮寫,代表清晰度從低到高的各種級別。由於清晰度不同,每種碼流對應的碼率範圍和解析度範圍也不相同。
本步驟就是按照預先設定的規範,根據已經得到的碼率最小值獲取待轉碼視頻的視頻類型videoType。在本實施例的一個具體例子中,按照表一所示的規範獲取待轉碼視頻的視頻類型:
表1中有定義了三種碼率,其中最大值和最小值限定了視頻類型所在的碼率範圍,比如UD碼流對應的碼率範 圍是在最大值2Mbps和最小值1Mbps之間,如果Br_min位於2Mbps和1Mbps之間,就認為待轉碼視頻的視頻類型為UD類型。
在本實施例的上述具體例子中,採用了表一的規範定義碼率和視頻類型之間的對應關係,在其他實施方式中,可以根據實驗結果或者具體的實施需求,調整該表中的設定,也可以採用其他方式確定待轉碼視頻的視頻類型。
根據碼率最小值獲取待轉碼視頻的視頻類型後,可以根據已獲取的待轉碼視頻的解析度對所述視頻類型進行修訂。具體說是這樣的,按照預先設定的規範,獲取所述待轉碼視頻的視頻類型對應的解析度的最小值;判斷已獲取的待轉碼視頻的解析度參數值是否低於上述最小值;若是,用所述已獲取的待轉碼視頻的解析度參數值對應的視頻類型作為所述待轉碼視頻的視頻類型。
在本實施例的一個具體例子中,採用了表二的規範定義視頻類型與解析度的最小值之間的對應關係:
通常情況不,待轉碼視頻的解析度應該高於已選取的 視頻類型的最低解析度,在某些情況下,待轉碼視頻的解析度較低,此時如果用高碼率進行視頻轉碼,就會額外佔用不必要的網路帶寬資源,因此可以降低待轉碼視頻的視頻類型,即:用所述已獲取的待轉碼視頻的解析度參數值對應的視頻類型作為所述待轉碼視頻的視頻類型。
例如:透過表一獲取的待轉碼視頻的視頻類型為UD碼流,透過表二可以獲知UD碼流對應的最低解析度為1440 x 1080,而待轉碼視頻的解析度為1280 x 720,低於上述最低解析度值,此時,就應該用1280 x 720對應的HD碼流作為待轉碼視頻的視頻類型。
在本實施例的上述具體例子中,利用表二給出的規範獲取與某種視頻類型對應的最小解析度,在其他實施例中,可以根據具體的需要調整該表中的最小解析度值,也可以不利用表二而採用其他方式獲取與某種視頻類型對應的最小解析度值。
在本實施例的上述具體例子中,依據表二中的規範對待轉碼視頻的視頻類型進行修訂;在某些有特殊需求的應用場合,允許或者需要針對低解析度產生高碼率的片源,這種情況下,可以不執行上述修訂操作,直接根據碼率最小值Br_min獲取待轉碼視頻的視頻類型即可。
步驟102-2:按照預先設定的規範,根據所述待轉碼視頻的視頻類型選擇一種或者多種目標視頻類型genType。
為了能夠提供不同檔次的多種片源,本步驟根據待轉 碼視頻的視頻類型選擇一種或者多種目標視頻類型,選擇的具體策略是,在待轉碼視頻解析度的基礎上,可以降低目標視頻的解析度,產生解析度等於或者低於待轉碼視頻解析度的不同檔次片源,從而為用戶提供更多的選擇。
在本實施例的一個具體例子中,採用表三所述的規範確定目標視頻類型,例如,待轉碼視頻的視頻類型videoType為UD類型,那麼可以選擇的目標視頻類型genType就包括:UD碼流、HD碼流、SD碼流和LD碼流。
步驟102-3:為每一種目標視頻類型設定相應的轉碼參數值。
透過之前的步驟102-2已經選擇了一種或者多種目標視頻類型,在本步驟中就可以為每一種目標視頻類型設定相應的轉碼參數值。本發明技術方案對轉碼參數的設定, 主要關於碼率參數和解析度參數(框率參數的值直接使用待轉碼視頻的框率值即可)。為了能夠在限定碼率的情況下找到更為合適的解析度,達到碼率和解析度之間的更為合理的匹配,本發明技術方案透過建立待轉碼視頻的解析度和碼率模型,從而為各種目標視頻設定最佳的解析度和編碼碼率參數。
由於在框率、量化參數等視頻參數都確定的情況下,解析度與碼率之間同樣存在著近似線形的關係,請參見圖5,其為透過實驗獲取的解析度與碼率的近線性關係示意圖,可以以此為依據建立二者之間的模型。
在本實施例的一個具體例子中,在步驟101中已經獲取了在客觀視頻不失真情況下的、與量化參數最大值對應的碼率最小值Br_min,而已獲取的待轉碼視頻的解析度為Res_org,因此用(0,0)和(Br_min,Res_org)這兩個點就可以產生所述線性模型,即:解析度和碼率模型。
建立起上述模型後,就可以針對每一種目標視頻類型,設定與該目標視頻類型對應的轉碼參數值,即:按照預先設定的規範,選擇當前目標視頻類型對應的碼率最大值與最小值之間的中間碼率值,並將所述轉碼參數中的碼率參數的值設定為所述中間碼率值;根據已建立的解析度與碼率的線性模型,獲取與所述中間碼率值對應的解析度值,並將所述轉碼參數中的解析度參數的值設定為所述解析度值;將所述轉碼參數中的框率參數的值設定為已獲取的待轉碼視頻的框率值。
在本實施例的一個具體例子中,目標視頻類型包括HD、SD和LD三種碼流,先針對HD碼流,採用上述表一定義的規範,選取與HD碼流對應的中間碼率值900Mbps,並將與HD碼流對應的轉碼參數中的碼率參數設定為900Mbps,再根據已建立的解析度和碼率模型,獲取與900Mbps對應的解析度為1280 x 720,並將與HD碼流對應的轉碼參數中的解析度參數設定為該值。
然後按照同樣的處理方法,依次為目標視頻類型為SD和LD這兩種情況,設定對應的轉碼參數。由於本發明技術方案並不關於對框率參數的調整,因此與上述三種目標視頻類型各自對應的轉碼參數中的框率參數值都設定為已獲取的待轉碼視頻的框率值Fps_org。在具體實現中,依然可以採用與前面描述的產生一種目標視頻的設定方式相同,即:對轉碼函數所使用的AVCodecContext資料結構中轉碼參數變數進行相應設定即可,此處不再贅述。
在具體的實施過程中,可以對上述設定過程作進一步的優化。由於解析度與碼率模型為近線性模型,兩者之間的關係有時更接近於類抛物線的關係,因此在本步驟中可以對透過解析度和碼率模型獲取的解析度值進行加權處理,例如對所述解析度值的寬和高分別乘以同一個預先設定的調整因數0.9,並用得到的新的解析度值對所述轉碼參數中的解析度參數進行設定。
在具體的實施過程中,為了保證轉碼產生的視頻品 質,還可以對透過解析度和碼率模型得到的解析度值進行修訂。具體說是這樣的:按照預先設定的規範,獲取當前目標視頻類型對應的解析度的最小值;判斷與所述中間碼率值對應的解析度值是否低於上述解析度的最小值;若是,用上述解析度的最小值作為對所述轉碼參數中的解析度參數進行設定所用的解析度值。
在本實施例的具體例子中,根據上述表二定義的規範獲取與當前視頻類型對應的解析度的最小值,該值通常是根據經驗值設定的最差情況,那麼透過解析度和碼率模型獲取的解析度值應該大於等於所述最小值,如果小於該值,通常無法保證目標視頻的品質。因此如果出現小於的情況,可以放棄透過解析度和碼率模型獲取的解析度值,而使用根據規範獲取的解析度的最小值設定相應的轉碼參數。
至此,就完成了對轉碼參數的設定過程。透過上面的描述可以看出,本步驟對轉碼參數的設定,是在客觀視頻不失真情況下的、表徵待轉碼視頻內容複雜程度的Br_min的基礎上,以Br_min為依據進行的;對於產生多個片源的情況,也是以Br_min為依據先確定待轉碼視頻的視頻類型,再確定目標視頻的類型,並進一步為各種類型的目標視頻設定轉碼參數。
步驟103:根據已設定的轉碼參數對所述待轉碼視頻進行轉碼,產生目標視頻。
在本步驟中,直接使用已經設定好的碼率參數、解析 度參數和框率參數,對待轉碼視頻進行轉碼,就可以獲取所需的目標視頻。對於產生多個目標視頻的情況,針對每一種目標視頻類型,使用已設定好的、與該目標視頻類型對應的碼率參數、解析度參數和框率參數,對所述待轉碼視頻進行轉碼,獲取多個不同檔次的目標視頻。
在本實施例的一個具體例子中,在步驟102中已經對AVCodecContext資料結構中轉碼參數變數進行了相應的設定,因此本步驟可以直接調用FFMPEG庫提供的轉碼函數介面進行轉碼即可。
採用本發明提供的基於內容的自適應視頻轉碼方法,由於轉碼參數的設定過程是以在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值Br_min為依據的,也就是說在設定轉碼參數的過程中考慮了待轉碼視頻的信息量,並且針對不同的目標視頻類型,透過建立解析度和碼率模型,為每種目標視頻設定與轉碼碼率匹配更為合理的解析度參數,因此不僅能夠保證轉碼產生的目標視頻的品質,為用戶呈現更優的視頻顯示效果,同時也避免了對帶寬的無謂消耗。
下面,給出針對本發明提供的基於內容的自適應轉碼方法的評測結果。針對表四中的原始視頻,採用本發明提供的基於內容的自適應視頻轉碼方法產生的視頻檔的參數如表五所示,現有技術的線上系統產生的視頻檔的參數如表六所示。
根據上面的評測資料可以看出,採用本發明提供的基於內容的自適應轉碼方法,針對handu影片在500K碼率情況可以編碼產生框率是25框,解析度是736×412的SD視頻;同線上系統對比,解析度是後者的1.3倍,碼率是後者的9/10,並且兩個視頻從主觀觀看的角度來說,品質相當。
針對lion視頻,採用本發明提供的基於內容的自適應轉碼方法,在碼率是440K情況下,可以編碼產生框率是 25框,解析度是1164×654的SD視頻;同線上系統對比,解析度是後者的2.35倍,碼率為後者的3/4,而且從整體上來看,採用本發明的方法產生的視頻圖像品質更加清晰。
針對yzs視頻,採用本發明提供的基於內容的自適應轉碼方法,在碼率是432k情況下,可以編碼產生框率是25框,解析度是1060×596的SD視頻,同線上系統對比,解析度是後者的2.75倍,碼率為後者的3/4,而且從整體上看,採用本發明的方法產生的視頻圖像品質更加清晰。
在上述的實施例中,提供了一種基於內容的自適應視頻轉碼方法,與之相對應的,本發明還提供一種基於內容的自適應視頻轉碼裝置。請參看圖6,其為本發明的一種用於基於內容的自適應視頻轉碼裝置的實施例示意圖。由於裝置實施例基本相似於方法實施例,所以描述得比較簡單,相關之處參見方法實施例的部分說明即可。下述描述的裝置實施例僅僅是示意性的。
本實施例的一種基於內容的自適應視頻轉碼裝置,包括:量化數值獲取單元601,用於獲取在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值;轉碼參數設定單元602,用於根據表徵待轉碼視頻內容複雜程度的最小量化數值和待轉碼視頻的視頻參數值,設定轉碼參數的值;視頻轉碼執行單元603,用於根據已設定的轉碼參數對所述待轉碼視頻進行轉碼,產生 目標視頻。
可選的,所述轉碼參數設定單元設定的轉碼參數包括:碼率參數、解析度參數和框率參數。
可選的,所述裝置還包括:視頻參數獲取單元,用於在獲取在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值之前,獲取所述待轉碼視頻的視頻參數值,所述視頻參數包括:解析度參數和框率參數。
可選的,所述量化數值獲取單元獲取最小量化數值時,所滿足的預先設定的客觀品質標準是指,峰值信噪比PSNR大於或者等於40dB。
可選的,所述量化數值獲取單元包括:第一模型建立子單元,用於為所述待轉碼視頻建立量化參數QP和峰值信噪比PSNR的線性模型;量化參數獲取子單元,用於根據所述線性模型,獲取所述量化參數QP在所述峰值信噪比PSNR大於或者等於40dB情況下的最大值;最小碼率獲取子單元,用於依據所述量化參數QP的最大值對所述待轉碼視頻進行轉碼,獲取與所述量化參數QP的最大值對應的碼率最小值;所述碼率最小值即為在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值。
可選的,所述第一模型建立子單元具體用於,截取所述待轉碼視頻中的一個或者多個視頻片斷,並根據所述一 個或者多個視頻片斷建立量化參數QP和峰值信噪比PSNR的線性模型。
可選的,所述轉碼參數設定單元具體用於,將所述轉碼參數中的碼率參數的值設定為所述碼率最小值,將所述轉碼參數中的解析度參數的值設定為已獲取的待轉碼視頻的解析度值,將所述轉碼參數中的框率參數的值設定為已獲取的待轉碼視頻的框率值。
可選的,所述轉碼參數設定單元包括:原始視頻類型獲取子單元,用於按照預先設定的規範,根據所述碼率最小值獲取待轉碼視頻的視頻類型;目標視頻類型獲取子單元,用於按照預先設定的規範,根據所述待轉碼視頻的視頻類型選擇一種或者多種目標視頻類型;轉碼參數設定執行子單元,用於為每一種目標視頻類型設定相應的轉碼參數值。
可選的,所述原始視頻類型獲取子單元和所述目標視頻類型獲取子單元所處理的視頻類型包括:LD碼流、SD碼流、HD碼流、UD碼流或者UUD碼流。
可選的,所述轉碼參數設定單元還包括:原始視頻類型修訂子單元,用於在根據所述碼率最小值獲取待轉碼視頻的視頻類型後,對所述待轉碼視頻的視頻類型進行修訂;所述原始視頻類型修訂子單元包括:第一最小解析度獲取子單元,用於按照預先設定的規 範,獲取所述待轉碼視頻的視頻類型對應的解析度的最小值;第一最小解析度判斷子單元,用於判斷已獲取的待轉碼視頻的解析度參數值是否低於上述最小值;原始視頻類型調整子單元,用於當所述第一最小解析度判斷子單元的輸出為“是”時,用所述已獲取的待轉碼視頻的解析度參數值對應的視頻類型作為所述待轉碼視頻的視頻類型。
可選的,所述轉碼參數設定執行子單元包括:第二模型建立子單元,用於根據所述碼率最小值和已獲取的所述待轉碼視頻的解析度參數值,為所述待轉碼視頻建立解析度與碼率的線性模型;轉碼參數設定控制子單元,用於針對每一種目標視頻類型,依次調用以下碼率參數設定子單元、解析度參數設定子單元和框率參數設定子單元進行轉碼參數的設定;碼率參數設定子單元,用於按照預先設定的規範,選擇當前目標視頻類型對應的碼率最大值與最小值之間的中間碼率值,並將所述轉碼參數中的碼率參數的值設定為所述中間碼率值;解析度參數設定子單元,用於根據已建立的解析度與碼率的線性模型,獲取與所述中間碼率值對應的解析度值,並將所述轉碼參數中的解析度參數的值設定為所述解析度值;框率設定子單元,用於將所述轉碼參數中的框率參數 的值設定為已獲取的待轉碼視頻的框率值。
可選的,所述解析度參數設定子單元包括:解析度參數獲取子單元,用於根據已建立的解析度與碼率的線性模型,獲取與所述中間碼率值對應的解析度值;解析度參數調整子單元,用於對所述解析度參數獲取子單元輸出的解析度值的寬和高分別乘以同一個預先設定的調整因數;第一解析度參數設定執行子單元,用於將所述轉碼參數中的解析度參數的值設定為所述解析度參數調整子單元輸出的調整後的解析度值。
可選的,所述解析度參數設定子單元包括:解析度參數獲取子單元,用於根據已建立的解析度與碼率的線性模型,獲取與所述中間碼率值對應的解析度值;第二最小解析度獲取子單元,按照預先設定的規範,獲取當前目標視頻類型對應的解析度的最小值;第二最小解析度判斷子單元,用於判斷與所述中間碼率值對應的解析度值是否低於上述解析度的最小值;第二解析度參數設定執行子單元,用於當所述第二最小解析度判斷子單元的輸出為“是”時,將所述轉碼參數中的解析度參數的值設定為上述解析度的最小值。
可選的,所述視頻轉碼執行單元具體用於,針對每一種目標視頻類型,使用已設定好的、與該目標視頻類型對 應的所述碼率參數、所述解析度參數和所述框率參數,對所述待轉碼視頻進行轉碼,得到對應的目標視頻。
本發明雖然以較佳實施例揭示如上,但其並不是用來限定本發明,任何本領域技術人員在不脫離本發明的精神和範圍內,都可以做出可能的變動和修改,因此本發明的保護範圍應當以本發明權利要求所界定的範圍為准。
在一個典型的配置中,計算設備包括一個或多個處理器(CPU)、輸入/輸出介面、網路介面和記憶體。
記憶體可能包括電腦可讀取媒體中的非永久性記憶體,隨機存取記憶體(RAM)和/或非易失性記憶體等形式,如唯讀記憶體(ROM)或快閃記憶體(flash RAM)。記憶體是電腦可讀取媒體的示例。
1、電腦可讀取媒體包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現資訊儲存。資訊可以是電腦可讀指令、資料結構、程式的模組或其他資料。電腦的儲存媒體的例子包括,但不限於相變記憶體(PRAM)、靜態隨機存取記憶體(SRAM)、動態隨機存取記憶體(DRAM)、其他類型的隨機存取記憶體(RAM)、唯讀記憶體(ROM)、電可擦除可編程唯讀記憶體(EEPROM)、快閃記憶體或其他記憶體技術、唯讀光碟唯讀記憶體(CD-ROM)、數位多功能光碟(DVD)或其他光學儲存、磁盒式磁帶,磁帶磁磁片儲存或其他磁性儲存設備或任何其他非傳輸媒體,可用於儲存可以被計算設備訪問的資訊。按照本文中的界定,電腦可讀取媒體不包括非暫存電腦可讀媒 體(transitory media),如調製的資料信號和載波。
2、本領域技術人員應明白,本發明的實施例可提供為方法、系統或電腦程式產品。因此,本發明可採用完全硬體實施例、完全軟體實施例或結合軟體和硬體方面的實施例的形式。而且,本發明可採用在一個或多個其中包含有電腦可用程式碼的電腦可用儲存介質(包括但不限於磁盤記憶體、CD-ROM、光學記憶體等)上實施的電腦程式產品的形式。

Claims (15)

  1. 一種基於內容的自適應視頻轉碼方法,其特徵在於,該方法包括下述步驟:使用待轉碼視頻的原有視頻參數獲取在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值,該預先設定的客觀品質標準基於該待轉碼視頻的量化參數QP及峰值信噪比PSNR的線性模型;根據表徵該待轉碼視頻內容複雜程度的最小量化數值和該待轉碼視頻的視頻參數值設定轉碼參數的值;及根據已設定的轉碼參數對該待轉碼視頻進行轉碼,產生目標視頻,其中,該待轉碼視頻內容複雜程度為待轉碼視頻的信息量。
  2. 根據申請專利範圍第1項所述的基於內容的自適應視頻轉碼方法,其中,該轉碼參數包括:碼率參數、解析度參數和框率參數。
  3. 根據申請專利範圍第1項所述的基於內容的自適應視頻轉碼方法,其中,在該獲取在滿足該預先設定的客觀品質標準下的表徵待轉碼視頻內容複雜程度的最小量化數值的步驟之前,執行下述步驟:獲取該待轉碼視頻的視頻參數值,該視頻參數值包括:解析度參數和框率參數。
  4. 根據申請專利範圍第3項所述的基於內容的自適應視頻轉碼方法,其中,該預先設定的客觀品質標準是指,該峰值信噪比PSNR大於或者等於40dB。
  5. 根據申請專利範圍第4項所述的基於內容的自適應視頻轉碼方法,其中,該獲取在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值的步驟包括:建立該量化參數QP和該峰值信噪比PSNR的該線性模型;根據該線性模型,獲取該量化參數QP在該峰值信噪比PSNR大於或者等於40dB情況下的最大值;及依據該量化參數QP的最大值對該待轉碼視頻進行轉碼,獲取與該量化參數QP的最大值對應的碼率最小值,該碼率最小值即為在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值。
  6. 根據申請專利範圍第5項所述的基於內容的自適應視頻轉碼方法,其中,該建立量化參數QP和峰值信噪比PSNR的線性模型的步驟採用如下方式實現:截取該待轉碼視頻中的一個或者多個視頻片斷,並根據該一個或者多個視頻片斷建立量化參數QP和峰值信噪比PSNR的線性模型。
  7. 根據申請專利範圍第5項所述的基於內容的自適應視頻轉碼方法,其中,該根據表徵該待轉碼視頻內容複雜程度的最小量化數值和該待轉碼視頻的視頻參數值設定轉碼參數的值的步驟,是指,將該轉碼參數中的碼率參數的值設定為該碼率最小值,將該轉碼參數中的解析度參數的值設定為已獲取的待轉碼視頻的解析度值,將該轉碼參數中的框率參數的值設定為已獲取的待轉碼視頻的框率值。
  8. 根據申請專利範圍第5項所述的基於內容的自適應視頻轉碼方法,其中,該根據表徵該待轉碼視頻內容複雜程度的最小量化數值和該待轉碼視頻的視頻參數值設定轉碼參數的值的步驟,包括:按照預先設定的規範,根據該碼率最小值獲取待轉碼視頻的視頻類型;按照預先設定的規範,根據該待轉碼視頻的視頻類型選擇一種或者多種目標視頻類型;及為每一種目標視頻類型設定相應的轉碼參數值。
  9. 根據申請專利範圍第8項所述的基於內容的自適應視頻轉碼方法,其中,該視頻類型包括:LD碼流、SD碼流、HD碼流、UD碼流或者UUD碼流。
  10. 根據申請專利範圍第8項所述的基於內容的自適應視頻轉碼方法,其中,在根據該碼率最小值獲取待轉碼視頻的視頻類型後,執行下述操作對該待轉碼視頻的視頻類型進行修訂:按照預先設定的規範,獲取該待轉碼視頻的視頻類型對應的解析度的最小值;判斷已獲取的待轉碼視頻的解析度參數值是否低於上述最小值;及若是,用該已獲取的待轉碼視頻的解析度參數值對應的視頻類型作為該待轉碼視頻的視頻類型。
  11. 根據申請專利範圍第8至10項中任一項所述的基於內容的自適應視頻轉碼方法,其中,該為每一種目標視頻類型設定相應的轉碼參數值包括:根據該碼率最小值和已獲取的該待轉碼視頻的解析度參數值,為該待轉碼視頻建立解析度與碼率的線性模型;針對該每一種目標視頻類型,執行下述操作設定與該目標視頻類型對應的轉碼參數值:按照預先設定的規範,選擇當前目標視頻類型對應的碼率最大值與最小值之間的中間碼率值,並將該轉碼參數中的碼率參數的值設定為該中間碼率值,根據已建立的解析度與碼率的線性模型,獲取與該中間碼率值對應的解析度值,並將該轉碼參數中的解析度參數的值設定為該解析度值,將該轉碼參數中的框率參數的值設定為已獲取的待轉碼視頻的框率值。
  12. 根據申請專利範圍第11項所述的基於內容的自適應視頻轉碼方法,其中,在根據已建立的解析度與碼率的線性模型,獲取與該中間碼率值對應的解析度值之後,執行下述操作:對已獲取的解析度值的寬和高分別乘以同一個預先設定的調整因數,並將得到的解析度值作為對該轉碼參數中的解析度參數進行設定所用的解析度值。
  13. 根據申請專利範圍第11項所述的基於內容的自適應視頻轉碼方法,其中,該針對每一種目標視頻類型執行的設定轉碼參數值的操作,還包括:按照預先設定的規範,獲取當前目標視頻類型對應的解析度的最小值;判斷與該中間碼率值對應的解析度值是否低於上述解析度的最小值;及若是,用上述解析度的最小值作為對該轉碼參數中的解析度參數進行設定所用的解析度值。
  14. 根據申請專利範圍第11項所述的基於內容的自適應視頻轉碼方法,其中,根據已設定的該轉碼參數對該待轉碼視頻進行轉碼是指,針對每一種目標視頻類型,使用已設定好的、與該目標視頻類型對應的該碼率參數、該解析度參數和該框率參數,對該待轉碼視頻進行轉碼。
  15. 一種基於內容的自適應視頻轉碼裝置,其特徵在於,該裝置包括:量化數值獲取單元,用於使用待轉碼視頻的原有視頻參數獲取在滿足預先設定的客觀品質標準下的、表徵待轉碼視頻內容複雜程度的最小量化數值,該預先設定的客觀品質標準基於該待轉碼視頻的量化參數QP及峰值信噪比PSNR的線性模型;轉碼參數設定單元,用於根據表徵待轉碼視頻內容複雜程度的最小量化數值和待轉碼視頻的視頻參數值,設定轉碼參數的值;及視頻轉碼執行單元,用於根據已設定的轉碼參數對該待轉碼視頻進行轉碼,產生目標視頻,其中,該待轉碼視頻內容複雜程度為待轉碼視頻的信息量。
TW103134240A 2014-05-30 2014-10-01 Content-based adaptive video transcoding method and device TWI648980B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201410240464.XA CN105187835B (zh) 2014-05-30 2014-05-30 基于内容的自适应视频转码方法及装置
??201410240464.X 2014-05-30

Publications (2)

Publication Number Publication Date
TW201545537A TW201545537A (zh) 2015-12-01
TWI648980B true TWI648980B (zh) 2019-01-21

Family

ID=54699691

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103134240A TWI648980B (zh) 2014-05-30 2014-10-01 Content-based adaptive video transcoding method and device

Country Status (5)

Country Link
US (1) US10645449B2 (zh)
CN (1) CN105187835B (zh)
HK (1) HK1215770A1 (zh)
TW (1) TWI648980B (zh)
WO (1) WO2015183910A1 (zh)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9819984B1 (en) 2007-03-26 2017-11-14 CSC Holdings, LLC Digital video recording with remote storage
US10404986B2 (en) 2015-03-30 2019-09-03 Netflix, Inc. Techniques for optimizing bitrates and resolutions during encoding
CN106856570B (zh) * 2015-12-08 2018-08-24 阿里巴巴集团控股有限公司 一种转码方法及装置
CN106856571B (zh) 2015-12-09 2019-12-06 阿里巴巴集团控股有限公司 一种转码方法及装置
CN105657572A (zh) * 2015-12-29 2016-06-08 锐达互动科技股份有限公司 一种基于web的视频点播方法及系统
CN105812923B (zh) * 2016-03-18 2019-01-25 青岛海信电器股份有限公司 基于视频点播的播放处理方法及装置
CN107846595B (zh) * 2016-09-19 2021-08-06 阿里巴巴集团控股有限公司 一种视频编码的方法和视频编码器
US10904329B1 (en) * 2016-12-30 2021-01-26 CSC Holdings, LLC Virtualized transcoder
US11019349B2 (en) 2017-01-20 2021-05-25 Snap Inc. Content-based client side video transcoding
TWI721089B (zh) * 2017-01-23 2021-03-11 香港商阿里巴巴集團服務有限公司 轉碼方法及裝置
CN108805943B (zh) 2017-04-27 2022-12-09 腾讯科技(深圳)有限公司 图片转码方法和装置
CN107071562A (zh) * 2017-05-15 2017-08-18 深圳市茁壮网络股份有限公司 一种转码参数设置方法及装置
WO2018216929A1 (en) * 2017-05-25 2018-11-29 Samsung Electronics Co., Ltd. Methods and systems for saving data while streaming video
CN109213593B (zh) * 2017-07-04 2022-05-10 阿里巴巴集团控股有限公司 用于全景视频转码的资源分配方法、装置和设备
CN107371028B (zh) * 2017-08-22 2018-10-19 南京惟初信息科技有限公司 一种适应带宽的高质量视频编码方法
CN108174290B (zh) * 2018-01-25 2019-05-24 北京百度网讯科技有限公司 用于处理视频的方法和装置
CN108540807B (zh) * 2018-02-28 2019-05-31 北京达佳互联信息技术有限公司 视频文件转码的方法、装置及终端
CN109348244B (zh) * 2018-11-20 2021-05-18 浙江齐聚科技有限公司 视频编码参数的配置方法、装置、设备和存储介质
CN109474827B (zh) * 2018-12-03 2022-11-29 四川巧夺天工信息安全智能设备有限公司 监控视频快速转码的方法
CN109286825B (zh) * 2018-12-14 2021-04-30 北京百度网讯科技有限公司 用于处理视频的方法和装置
CN109788316B (zh) * 2019-02-27 2020-08-14 腾讯科技(深圳)有限公司 码率控制、视频转码方法与装置、计算机设备及存储介质
JP7279533B2 (ja) * 2019-06-14 2023-05-23 ソニーグループ株式会社 センサ装置、信号処理方法
EP3981155A4 (en) 2019-06-24 2022-08-17 Alibaba Group Holding Limited ADAPTIVE RESOLUTION CHANGE IN VIDEO PROCESSING
CN111193924B (zh) * 2019-12-26 2022-01-25 腾讯科技(深圳)有限公司 视频码率的确定方法、装置、计算机设备及存储介质
CN111107395B (zh) * 2019-12-31 2021-08-03 广州市百果园网络科技有限公司 一种视频转码的方法、装置、服务器和存储介质
CN111277826B (zh) * 2020-01-22 2022-03-11 腾讯科技(深圳)有限公司 一种视频数据处理方法、装置及存储介质
CN111277827B (zh) * 2020-02-24 2022-12-20 腾讯科技(深圳)有限公司 一种视频数据处理方法、装置、设备以及可读存储介质
CN111327950B (zh) * 2020-03-05 2021-08-06 腾讯科技(深圳)有限公司 一种视频转码方法及装置
US11792408B2 (en) * 2020-03-30 2023-10-17 Alibaba Group Holding Limited Transcoder target bitrate prediction techniques
CN111510740B (zh) * 2020-04-03 2022-08-30 咪咕文化科技有限公司 转码方法、装置、电子设备和计算机可读存储介质
CN113518249B (zh) * 2020-04-10 2023-03-10 华为技术有限公司 一种远端图像处理方法及装置
US11166035B1 (en) * 2020-04-30 2021-11-02 Wangsu Science and Technology Co., Ltd. Method and device for transcoding video
CN114556430A (zh) * 2020-10-30 2022-05-27 深圳市大疆创新科技有限公司 数据处理方法和装置、图像信号处理器、可移动平台
CN112492310A (zh) * 2020-11-19 2021-03-12 创盛视联数码科技(北京)有限公司 视频转码方法、装置、电子设备和存储介质
US11284165B1 (en) 2021-02-26 2022-03-22 CSC Holdings, LLC Copyright compliant trick playback modes in a service provider network
US11722710B1 (en) * 2021-12-03 2023-08-08 Amazon Technologies, Inc. Dynamic encoding parameter adjustment
CN115225961B (zh) * 2022-04-22 2024-01-16 上海赛连信息科技有限公司 一种无参考网络视频质量评价方法和装置
CN117729350A (zh) * 2023-09-26 2024-03-19 书行科技(北京)有限公司 一种视频数据处理方法、装置、设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050002454A1 (en) * 2003-05-14 2005-01-06 Hiromichi Ueno Picture processing apparatus, picture processing method, information processing apparatus, recording medium, and program
US20070230568A1 (en) * 2006-03-29 2007-10-04 Alexandros Eleftheriadis System And Method For Transcoding Between Scalable And Non-Scalable Video Codecs
US8290038B1 (en) * 2009-11-30 2012-10-16 Google Inc. Video coding complexity estimation
CN103548352A (zh) * 2011-04-15 2014-01-29 Sk普兰尼特有限公司 自适应视频转码方法和系统

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100498332B1 (ko) 2002-10-24 2005-07-01 엘지전자 주식회사 비디오 트랜스코더의 적응적 비트율 제어장치 및 방법
US7330509B2 (en) 2003-09-12 2008-02-12 International Business Machines Corporation Method for video transcoding with adaptive frame rate control
US7555006B2 (en) 2003-09-15 2009-06-30 The Directv Group, Inc. Method and system for adaptive transcoding and transrating in a video network
CN100375533C (zh) * 2004-03-10 2008-03-12 浙江大学 具有多种转换功能的自适应视频转码网关
US20050232497A1 (en) 2004-04-15 2005-10-20 Microsoft Corporation High-fidelity transcoding
KR100703399B1 (ko) 2004-12-13 2007-04-03 삼성전자주식회사 멀티미디어 컨텐츠를 연속적으로 전송하는 장치 및 방법
US8077775B2 (en) * 2006-05-12 2011-12-13 Freescale Semiconductor, Inc. System and method of adaptive rate control for a video encoder
US8428142B2 (en) * 2007-03-05 2013-04-23 Stmicroelectronics International N.V. System and method for transcoding data from one video standard to another video standard
US8396118B2 (en) * 2007-03-19 2013-03-12 Sony Corporation System and method to control compressed video picture quality for a given average bit rate
WO2009097284A1 (en) * 2008-02-01 2009-08-06 Zenverge, Inc. Intermediate compression of reference frames for transcoding
US8189677B2 (en) * 2008-04-15 2012-05-29 Sony Corporation Estimation of P frame average rate quantization parameter (QP) in a group of pictures (GOP)
CN101404767A (zh) * 2008-11-24 2009-04-08 崔天龙 一种基于图像分析及人工智能的可变参数的自动化视频转码方法
CN101998117B (zh) * 2009-08-13 2013-01-30 华为技术有限公司 视频转码方法和装置
CN102055966B (zh) * 2009-11-04 2013-03-20 腾讯科技(深圳)有限公司 一种媒体文件的压缩方法和系统
CN101888542B (zh) * 2010-06-11 2013-01-09 北京数码视讯科技股份有限公司 视频转码的帧级码率控制方法及转码器
CN103503462B (zh) * 2011-12-06 2017-09-19 华为技术有限公司 实时转码方法及设备
EP3886433A3 (en) * 2013-03-07 2021-10-27 Telefonaktiebolaget LM Ericsson (publ) Video transcoding
CN103414915B (zh) * 2013-08-22 2014-07-16 合一网络技术(北京)有限公司 一种网站上传视频质量评价方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050002454A1 (en) * 2003-05-14 2005-01-06 Hiromichi Ueno Picture processing apparatus, picture processing method, information processing apparatus, recording medium, and program
US20070230568A1 (en) * 2006-03-29 2007-10-04 Alexandros Eleftheriadis System And Method For Transcoding Between Scalable And Non-Scalable Video Codecs
US8290038B1 (en) * 2009-11-30 2012-10-16 Google Inc. Video coding complexity estimation
CN103548352A (zh) * 2011-04-15 2014-01-29 Sk普兰尼特有限公司 自适应视频转码方法和系统

Also Published As

Publication number Publication date
TW201545537A (zh) 2015-12-01
US20150350726A1 (en) 2015-12-03
HK1215770A1 (zh) 2016-09-09
CN105187835A (zh) 2015-12-23
CN105187835B (zh) 2019-02-15
WO2015183910A1 (en) 2015-12-03
US10645449B2 (en) 2020-05-05

Similar Documents

Publication Publication Date Title
TWI648980B (zh) Content-based adaptive video transcoding method and device
JP5160903B2 (ja) テレビ電話のための背景のスキッピングを用いた関心領域の符号化
US9225983B2 (en) Rate-distortion-complexity optimization of video encoding guided by video description length
KR101643790B1 (ko) 적응적 비디오 스트리밍용의 가변 비트 레이트 및 동적 해상도를 이용한 다중 비트 레이트 비디오 인코딩
US10574988B2 (en) System and methods for reducing slice boundary visual artifacts in display stream compression (DSC)
JP5301645B2 (ja) テレビ電話のための背景のスキッピングを用いた関心領域の符号化
US8934538B2 (en) Rate-distortion-complexity optimization of video encoding
JP6134650B2 (ja) シーンに基づく適用性のあるビットレート制御
JP7075983B2 (ja) ビデオ処理装置およびビデオストリームの処理方法
CA3028701A1 (en) Content-aware predictive bitrate ladder
US10491911B2 (en) Transcoding on-the-fly (TOTF)
WO2022001559A1 (zh) 视频编码方法、装置、电子设备和机器可读存储介质
WO2021129007A1 (zh) 视频码率的确定方法、装置、计算机设备及存储介质
JP2018509067A (ja) ほぼ視覚的無損失なビデオ再圧縮
US10645406B2 (en) Transcoding method and apparatus
WO2020098534A1 (zh) 编码数据处理方法、装置、计算机设备和存储介质
WO2020244328A1 (zh) 图像处理方法及装置
TWI703857B (zh) 視頻轉碼方法及設備、電腦儲存介質及電子設備
WO2021056575A1 (zh) 一种低延迟信源信道联合编码方法及相关设备
CN107846595B (zh) 一种视频编码的方法和视频编码器
US11582462B1 (en) Constraint-modified selection of video encoding configurations
US11930222B1 (en) Encoding video for film grain synthesis
TWI721089B (zh) 轉碼方法及裝置
Rajendran et al. Energy-Quality-aware Variable Framerate Pareto-Front for Adaptive Video Streaming
CN117714729A (zh) 直播视频编码方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees