CN111385577B - 视频转码方法、装置、计算机设备和计算机可读存储介质 - Google Patents

视频转码方法、装置、计算机设备和计算机可读存储介质 Download PDF

Info

Publication number
CN111385577B
CN111385577B CN202010264914.4A CN202010264914A CN111385577B CN 111385577 B CN111385577 B CN 111385577B CN 202010264914 A CN202010264914 A CN 202010264914A CN 111385577 B CN111385577 B CN 111385577B
Authority
CN
China
Prior art keywords
target video
image
video
coding
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010264914.4A
Other languages
English (en)
Other versions
CN111385577A (zh
Inventor
刘晓娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bigo Technology Pte Ltd
Original Assignee
Guangzhou Baiguoyuan Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Baiguoyuan Information Technology Co Ltd filed Critical Guangzhou Baiguoyuan Information Technology Co Ltd
Priority to CN202010264914.4A priority Critical patent/CN111385577B/zh
Publication of CN111385577A publication Critical patent/CN111385577A/zh
Application granted granted Critical
Publication of CN111385577B publication Critical patent/CN111385577B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234309Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4 or from Quicktime to Realvideo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440218Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种视频转码方法、装置、计算机设备和计算机可读存储介质,其中,该方法包括:提取目标视频的图像特征;根据所述图像特征和预设判定条件调整所述目标视频的编码参数;根据调整后的所述编码参数对所述目标视频进行编码处理。本发明实施例的技术方案,通过目标视频的图像特征对编码参数进行调整,增强视频图像的图像质量,降低图像失真,提高了视频图像的主观质量,可提升用户观看视频的体验程度。

Description

视频转码方法、装置、计算机设备和计算机可读存储介质
技术领域
本发明实施例涉及视频处理技术领域,尤其涉及一种视频转码方法、装置、计算机设备和计算机可读存储介质。
背景技术
随着时代的发展,观看视频已经成为日常娱乐生活中必不可少的重要活动,为满足不同人群对视频不同码率的需求,在视频进行展示时可以根据用户需求对视频进行转码处理。
现有技术中,在进行视频转码时,常将对不同档位的视频一个固定码率档位,对于不同的视频自适应程度远远不足,导致视频转码后显示效果极差。尤其对于图片类型视频,视频中图像帧多为静止帧,时域冗余很高,编码后压缩率非常高,由于人眼对静止视频的失真更加敏感,如果视频按照现有技术方式采用固定的转码参数进行转码,转码后视频的主观质量通常较差,用户观看的体验程度较低。
发明内容
本发明提供一种视频转码方法、装置、计算机设备和计算机可读存储介质,以实现目标视频的高质量展示,降低视频图像的失真,增强视频图像的主观质量,增强用户的观看体验程度。
第一方面,本发明实施例提供了一种视频转码方法,该方法包括:
提取目标视频的图像特征;
根据所述图像特征和预设判定条件调整所述目标视频的编码参数;
根据调整后的所述编码参数对所述目标视频进行编码处理。
第二方面,本发明实施例提供了一种视频转码装置,该装置包括:
提取模块,用于提取目标视频的图像特征;
参数调整模块,用于根据所述图像特征和预设判定条件调整所述目标视频的编码参数;
编码处理模块,用于根据调整后的所述编码参数对所述目标视频进行编码处理。
第三方面,本发明实施例提供了一种计算机设备,该设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的视频转码方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的视频转码方法。
本发明实施例的技术方案,通过获取目标视频的图像特征,基于图像特征和预设判定条件调整目标视频的编码参数,并根据编码参数对目标视频进行编码处理,实现了目标视频的高质量呈现,降低目标视频的失真,提高视频图像的主观质量,可提升用户的观看体验程度。
附图说明
图1是本发明实施例一提供的一种视频转码方法的流程图;
图2是本发明实施例二提供的一种视频转码方法的流程图;
图3是本发明实施例三提供的一种视频转码方法的流程图;
图4是本发明实施例三提供的一种视频转码方法的示例图;
图5是本发明实施例四提供的一种视频转码装置的结构示意图;
图6是本发明实施例五提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构,此外,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
现有技术中,可以通过对视频内容进行感知分析,形成不同场景的视频分类,例如,电影、运动和动漫等,可以针对不同的场景分类适配不同的编码参数,在相同场景分类下的视频使用相同的编码参数进行转码,可以在一定程度上缓解视频图像码率分配不合理的情况,然而仅通过不同的场景确定编码参数仍然存在局限性,由于属于相同的场景分类的视频在视频内容上的差别也非常大,对于不同视频内容的视频使用相同的编码参数进行转码时常不能保证合理的码率。特别是针对图片类视频,图片类视频中大部分图像帧为静止,时域冗余很高,经过统一的编码后导致压缩率非常高,而人眼对于静止视频的失真率更加敏感,图片类视频的主观质量较差,用户在观看时体验程度较低。本发明实施例的技术方案,通过判别视频内容是否为图片类视频,并对图片类视频的编码参数进行调整,提高图片类视频的主观质量,降低图片类视频的失真度。
实施例一
图1是本发明实施例一提供的一种视频转码方法的流程图,本实施例可适用于视频图像转码的情况,该方法可以由视频转码装置来执行,该装置可以由软件和/或硬件的方式来实现,一般可以集成在服务器或者终端设备中,参见图1,本发明实施例的视频转码方法包括以下步骤:
步骤101、提取目标视频的图像特征。
其中,目标视频可以是需要进行编码的视频,视频对应的数据内包括冗余数据,目标视频可以通过编码实现冗余数据的压缩。图像特征可以表示目标视频内容,图像特征具体可以通过目标视频的简介信息、目标视频的评论信息和目标视频的图像帧信息等确定。
具体的,可以提取目标视频的属性信息和内容信息等,根据属性信息和内容信息确定图像特征,图像特征可以是目标视频属性信息中被识别到关键字,图像特征还可以通过分析目标视频的内容信息生成。示例性的,由于图片类视频中包含大量的静止图片,图片类视频内存在较多画面相同的图像帧,可以统计视频内画面相同的图像帧的数量,将该数量与视频所有图像帧总数的比值作为图片类视频的图像特征。
步骤102、根据所述图像特征和预设判定条件调整所述目标视频的编码参数。
其中,预设判定条件可以用于判定目标视频是否需要进行编码参数调整的条件,当目标视频的图像特征满足预设判定条件时,目标视频需要调整编码参数以提高视频图像的清晰度。编码参数可以是控制视频编码压缩的参数,编码参数可以是量化数值,编码参数的数值代表目标视频内冗余数据的压缩程度,编码参数的数值越大,目标数据进行编码压缩时冗余数据的压缩程度可以越高。进一步的,目标视频未进行调整前的编码参数可以预先根据经验设定或者根据目标视频的场景分类确定。
在本发明实施例中,对比图像特征与预设判定条件,若图像特征满足预设判定条件,可以对目标视频的编码参数进行调整,编码参考的调整可以是增大或者减少编码参数对应的量化数值。例如,目标视频在按照恒定质量因子进行编码时,若目标视频的图像特征满足预设判断条件,可以提高目标视频的恒定码率,实现编码参数的调整。若目标视频的图像特征不满足预设判定条件,该目标视频对应的编码参数满足图像主观质量的要求,不需要调整编码参数。
步骤103、根据调整后的所述编码参数对所述目标视频进行编码处理。
具体的,可以根据调整后的编码参数对目标视频进行编码处理,目标视频的编码处理可以包括编码规则变换、运动估计、运动补偿和熵编码等,编码处理的目的可以是降低目标视频内冗余数据的占比,实现目标视频数据的压缩。编码参数与目标视频内冗余数据的压缩比率对应,编码参数的数值越大,目标视频经过编码处理后的数据压缩比率可以越大。
本发明实施例的技术方案,通过提取目标视频的图像特征,基于判定条件和图像特征调整目标视频的编码参数,根据调整后的编码参数对目标视频进行编码处理,实现了图片类视频显示质量的提高,降低了视频图像的失真率,可增强视频图像的主观质量,提升用户观看视频的体验程度。
实施例二
图2是本发明实施例二提供的一种视频转码方法的流程图,参见图2,本发明实施例是以上述实施例为基础的具体化,通过分析目标视频的视频内容获取图像特征,参见图2,本发明实施例的视频转码方法包括以下步骤:
步骤201、统计目标视频中完全相同的图像帧的相同帧总数。
其中,图像帧可以是目标视频的组成部分,图像帧按照时间排列后形成目标视频。目标视频中包括多个图像帧,由于目标视频中存在数据冗余,不同的图像帧的图像可以完全相同。可以将目标视频中具有相同图像的图像帧作为相同帧,相应的,相同帧总数可以表示目标视频中具有相同图像的图像帧的总数。例如,目标视频A由图像帧1、图像帧2、图像帧3、图像帧4和图像帧5组成,其中,图像帧1和图像帧2为相同帧,图像帧3和图像帧5为相同帧,目标视频A中相同帧总数可以为4。
具体的,可以采集目标视频中的图像帧,按照采集顺序依次比较图像帧的图像。确定任意两个图像帧的图像相同时,可以标记图像帧为相同帧,并统计标记为相同帧帧的总数。比较图像帧的方式可以通过生成任意两个图像帧的残差图像,当残差图像内仅包括0时,确定该两个图像帧具有相同的图像,可以将图像帧标识为相同帧,比较所有图像帧后统计相同帧总数。进一步的,由于跳过编码块是位于相同图像帧内不需要进行重复编码的编码宏块,并且跳过编码块与相同帧总数存在数量对应关系,还可以通过统计目标视频内跳过编码块的数量实现图像帧中相同帧总数的统计。
步骤202、将所述相同帧总数在所述目标视频中图像帧总数的占比作为图像特征。
其中,图像帧总数可以是目标视频中所有图像帧的总和。
具体的,可以将获取到的相同帧的总数与目标视频中的图像帧总数作为目标视频的图像特征,该图像特征可以表示相同的图像画面在目标视频所有图像画面中的比例。
步骤203、若所述图像特征的取值大于或等于预设判定条件中的目标内容阈值,则获取所述目标视频的编码参数。
其中,目标内容阈值是判定目标视频的视频内容为目标内容的阈值,具体可以判断目标视频的视频内容是否为静止图片,预设判定条件包括目标内容阈值,可以通过图像特征与目标内容阈值取值的比较确定目标视频的视频内容是否为目标内容。编码参数可以是控制视频压缩编码,不同数值的编码参数对应视频数据压缩编码程度不同,可以根据编码参数控制目标视频进行不同码率的编码压缩,可以理解的是,编码参数对应的数值越大,目标视频的编码压缩程度越高,相应的目标视频经过编码后的码率可以越低。
在本发明实施例中,若图像特征的取值大于或等于目标内容阈值,目标视频中相同图像帧数量的占比较大,可以判断目标视频的视频内容为静止图片。在确定目标视频的内容为目标内容的情况下获取该目标视频对应的编码参数,目标视频的编码参数可以预先根据用户需求设定或者根据目标视频的视频分类设定,可以通过目标视频的标识号查找到对应的编码参数。
步骤204、根据所述编码参数的类型调整所述编码参数的取值。
其中,由于目标视频对应的编码压缩的规则可以包括多种,因此,目标视频对应的编码参数为多种,不同的编码规则的编码参数对应的类型不同。当对目标视频的编码参数进行调整时,不同类型的编码参数对应的调整规则不同,因此在调整编码参数的取值时需要获取编码参数对应的类型。编码参数的类型具体可以包括恒定量化参数、恒定质量因子、平均码率和恒定码率等,编码参数的类型包括在编码参数的属性信息内,通过属性信息确定出不同编码参数的类型。
具体的,可以通过编码参数的属性信息确定编码参数的类型,根据编码参数的类型对编码参数的取值进行调整,调整编码参数取值的目标是提高目标视频的画面质量。例如,对于图片类视频,通过神经网络预测出的恒定质量因子类型的编码参数在调整前的数值普遍偏大,目标视频的画面内容不够清晰,当恒定质量因子的取值降低时,可以提高画面清晰度,因此可以将图片类视频的恒定质量因子向下调整1到2个数值实现编码参数的调整。图片类视频的码率本身较低,减少较小的编码参数数值不会对编码压缩后的目标视频的码率产生影响,但是通过调整编码参数取值却可以显著提高图片类视频的画面质量。
步骤205、根据调整后的所述编码参数对所述目标视频进行编码处理。
本发明实施例的技术方案,通过统计目标视频的相同帧总数,将相同帧总数在目标视频中图像帧总数的占比作为图像特征,当目标视频的图像特征大于或等于目标内容阈值,获取目标视频的编码参数,并调整该编码参数以提高目标视频的画面质量,根据调整后的编码参数对目标视频进行编码处理,实现了编码参数与目标视频的适配,提高了目标视频的主观质量,降低视频图像的失真率,增强用户观看视频的体验程度。
进一步的,在上述发明实施例的基础上,所述根据所述编码参数的类型调整所述目标视频的取值,包括:
若所述编码参数的类型为恒定量化参数QP或恒定质量因子CRF,则降低所述编码参数的取值以提高所述目标视频的画面质量;若所述编码参数的类型为平均码率ABR或恒定码率CBR,则提高所述编码参数的取值以提高所述目标视频的画面质量。
其中,恒定量化参数QP可以代表对目标视频的残差值量化的索引,目标视频使用该恒定量化参数QP进行压缩编码时,追求视频失真率的恒定,瞬时码率可以随目标视频内的内容场景复杂度波动性变化;恒定质量因子CRF在恒定量化参数QP的基础上根据目标视频的视频内容调整量化参数,使得快速运动或者细节丰富场景等人眼不易察觉的图像设置高失真率,对于静止或者平坦区域等容易被人眼发觉的场景设置低失真率;平均码率ABR可以在对目标视频进行压缩编码时,目标视频的整体码率达到一个平均值;恒定码率CBR可以是以恒定的码率对目标视频进行编码。
具体的,编码参数中恒定量化参数QP或恒定质量因子CRF的取值越小,经过编码后的目标视频的视频图像越清晰,相应的,可以在原有编码参数取值的基础上,进一步降低编码参数的取值,以提高目标视频的清晰度,例如,可以降低1个或2个编码参数的取值。而平均码率ABR或恒定码率CBR的取值越大,则目标视频的视频图像越清晰,相应的,可以在原有编码参数取值的基础上,进一步提高编码参数的取值,例如,可以提高1个或2个编码参数的取值。
进一步的,在上述发明实施例的基础上,统计所述目标视频中完全相同的图像帧的相同帧总数,包括:针对所述目标视频中的图像帧,获取所述图像帧至少一个相邻帧,并对所述相邻帧进行运动估计和运动补偿;将图像帧内与对应相邻帧相同的编码宏块记为跳过编码块;将所述目标视频中跳过编码块的数量作为相同帧总数。
其中,编码宏块可以是对目标视频的图像帧进行编码处理的最小单元,编码宏块与图像帧可以存在数量对应关系。例如,在H264编码规则中,编码宏块将视频按照16*16的方式进行不重叠分块,则图像帧与编码宏块之间数量对应关系可以为1:16*16。编码宏块进行运动估计和运动补偿后,当一个编码宏块在与相邻帧内的编码宏块重复时,可以将该编码宏块记为跳过编码块。
在本发明实施例中,由于视频编码过程中,图像帧与相邻帧内的编码宏块相同时,不对该图像帧内的编码宏块进行编码,该编码宏块被记为跳过编码块,可以通过统计目标视频内的跳过编码块的数量确定相同帧总数。
具体的,可以在目标视频的编码过程中获取目标视频中的跳过编码块,可以针对各图像帧的编码宏块进行帧间预测。其中,可以将图像帧的前一帧图像或者后一帧图像作为该图像帧的相邻帧,可以理解的是,相邻帧也可以是当前图像帧的前几帧图像或者后几帧图像。在帧间预测过程中,通过将图像帧的编码宏块与相邻帧内的编码宏块进行对比,确定两个编码宏块相同时,可以将该图像帧内的编码宏块作为跳过编码块,重复上述过程确定出目标视频中的所有跳过编码块,可以将跳过编码块的数量作为目标视频的相同帧总数。
实施例三
图3是本发明实施例三提供的一种视频转码方法的流程图,参见图3,本发明实施例是以上述实施例为基础的具体化,通过分析目标视频描述或者评论的方式获取图像特征,参见图3,本发明实施例的视频转码方法包括以下步骤:
步骤301、提取目标视频的描述信息和/或评论信息。
其中,描述信息可以是目标视频用户添加的描述性语言信息,用来表示目标视频的内容,例如,目标视频的描述信息具体可以包括目标视频的简介、标签等。评论信息可以是用户评论目标视频的视频内容生成的信息,用来反应目标视频的内容,评论信息可以包括目标视频的弹幕数据、点评数据等。
具体的,可以根据目标视频的标识号查找关联的描述信息和评论信息,例如,可以根据目标视频生成的哈希特征值在数据库中查找与该哈希特征值关联存储的描述信息和评论信息。
步骤302、语义分析所述描述信息和/或所述评论信息获取所述目标视频的内容关键词作为图像特征。
其中,内容关键词用于目标视频内容,例如,内容关键词可以包括用来描述风景图、人物图、肖像等词汇。
在本发明实施例中,可以对描述信息和/或评论信息进行语义分析,提取与目标视频内容相关的内容关键词作为图像特征,内容关键词可以在描述信息和/或评论信息中直接出现,也可以通过神经网络模型生成训练生成。
步骤303、若所述图像特征的内容关键词与预设判定条件内的预设内容关键词匹配,则获取所述目标视频的编码参数。
其中,预设内容关键词可以用于判定目标视频的视频内容是否为目标内容,不同的视频内容可以对应不同的预设内容关键字,例如,当目标内容为图片时,预设内容关键词可以包括图片、风景、人物等,预设判定条件包括预设内容关键词,可以通过图像特征的内容关键词与预设内容关键词进行比较,确定目标视频的视频内容是否为目标内容。
在本发明实施例中,可以将获取到的图像特征的内容关键词与预设内容关键词进行对比,当确定内容关键词属于预设内容关键词时,可以确定目标视频的视频内容为目标内容。示例性的,当图片特征的内容关键词“图片”与预设内容关键词“图片”相同时,可以确定内容关键词与预设内容关键词匹配,确定目标视频的内容为目标内容,获取该目标视频对应的编码参数。
步骤304、根据所述编码参数的类型调整所述编码参数的取值。
其中,类型是编码参数的属性信息,不同编码参数对应的编码规则可以不同,类型可以包括在编码参数的属性信息中,可以通过编码参数的属性信息确定出编码参数的类型,编码参数的类型包括恒定量化参数、恒定质量因子、平均码率和/或恒定码率等,不同类型的编码参数在进行编码时可以按照恒定量化参数、恒定质量因子、平均码率和/或恒定码率等规则进行编码。
具体的,通过属性参数确定编码参数的类型后,根据不同的编码参数的类型对编码参数的取值进行调整,调整编码参数取值的目标是提高目标视频的画面质量。
步骤305、根据调整后的所述编码参数对所述目标视频进行编码处理。
具体的,目标视频中由于数据冗余和视觉冗余的原因,可以根据编码参数进行压缩编码,编码参数可以对应目标视频编码处理后的显示码率,可以根据编码参数对目标视频进行编码处理,消除目标视频中的数据冗余和视觉冗余。
本发明实施例的技术方案,通过提取目标视频描述信息和/或评论信息中的内容关键词作为图像特征,当目标视频的内容关键词与预设内容关键词匹配,获取目标视频的编码参数,并调整该编码参数以提高目标视频的画面质量,根据调整后的编码参数对目标视频进行编码处理,实现了编码参数与目标视频的适配,提高了目标视频的主观质量,降低视频图像的失真率,增强用户观看视频的体验程度。
示例性的,图4是本发明实施例三提供的一种视频转码方法的示例图,参见图4,当进行视频转码时,可以先在转码视频的最低档位使用恒定质量因子CRF的方式进行编码并提取特征集,可以根据预先训练好的网络模型来预测该视频在其他档位的转码参数,可以确定视频的视频内容是否为图片类视频,若是,则对预测生成的转码参数进行调整并根据转码参数对视频进行编码处理并下发,若否,则直接使用预测生成的转码参数对视频进行编码处理并下发。
实施例四
图5是本发明实施例四提供的一种视频转码装置的结构示意图,可执行本发明任意实施例提供的视频转码方法,具体执行方法相应的功能模块和有益效果。该装置可以由软件和/或硬件实现,具体包括:提取模块401、参数调整模块402和编码处理模块403。
提取模块401,用于提取目标视频的图像特征。
参数调整模块402,用于根据所述图像特征和预设判定条件调整所述目标视频的编码参数。
编码处理模块403,用于根据调整后的所述编码参数对所述目标视频进行编码处理。
本发明实施例,通过提取模块提取目标视频的图像特征,参数调整模块基于判定条件和图像特征调整目标视频的编码参数,编码处理模块根据所述编码参数对目标视频进行编码处理,实现了图片类视频显示质量的提高,降低了视频图像的失真率,可增强视频图像的主观质量,提升用户观看视频的体验程度。
实施例五
图6是本发明实施例五提供的一种计算机设备的结构示意图,如图6所示,该设备包括处理器50、存储器51、输入装置52和输出装置53;设备中处理器50的数量可以是一个或多个,图6中以一个处理器50为例;设备中的处理器50、存储器51、输入装置52和输出装置53可以通过总线或其他方式连接,图6中以通过总线连接为例。
实施例六
本发明实施例六还提供一种包含计算机可读存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种视频转码方法,该方法包括:
获取目标视频的图像特征;
根据所述图像特征和预设判定条件调整所述目标视频的编码参数;
根据调整后的所述编码参数对所述目标视频进行编码处理。
当然,本发明实施例所提供的一种包含计算机可读存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的视频转码方法中的相关操作。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由权利要求范围决定。

Claims (5)

1.一种视频转码方法,其特征在于,所述方法包括:
获取目标视频的图像特征;
所述获取目标视频的图像特征,包括:
统计所述目标视频中完全相同的图像帧的相同帧总数;
将所述相同帧总数在所述目标视频中图像帧总数的占比作为图像特征;
所述统计所述目标视频中完全相同的图像帧的相同帧总数,包括:
针对所述目标视频中的图像帧,获取所述图像帧至少一个相邻帧,并对所述相邻帧进行运动估计和运动补偿;
将图像帧内与对应相邻帧相同的编码宏块记为跳过编码块;
将所述目标视频中跳过编码块的数量作为相同帧总数;
根据所述图像特征和预设判定条件调整所述目标视频的编码参数;
根据调整后的所述编码参数对所述目标视频进行编码处理;
所述根据所述图像特征和预设判定条件调整所述目标视频的编码参数,包括:
若所述图像特征的取值大于或等于所述预设判定条件中的目标内容阈值,则获取所述目标视频的编码参数;
根据所述编码参数的类型调整所述编码参数的取值。
2.根据权利要求1所述的方法,其特征在于,所述根据所述编码参数的类型调整所述编码参数的取值,包括:
若所述编码参数的类型为恒定量化参数QP或恒定质量因子CRF,则降低所述编码参数的取值以提高所述目标视频的画面质量;
若所述编码参数的类型为平均码率ABR或恒定码率CBR,则提高所述编码参数的取值以提高所述目标视频的画面质量。
3.一种视频转码装置,其特征在于,所述装置包括:
提取模块,用于提取目标视频的图像特征;
所述提取目标视频的图像特征,包括:
统计所述目标视频中完全相同的图像帧的相同帧总数;
将所述相同帧总数在所述目标视频中图像帧总数的占比作为图像特征;
所述统计所述目标视频中完全相同的图像帧的相同帧总数,包括:
针对所述目标视频中的图像帧,获取所述图像帧至少一个相邻帧,并对所述相邻帧进行运动估计和运动补偿;
将图像帧内与对应相邻帧相同的编码宏块记为跳过编码块;
将所述目标视频中跳过编码块的数量作为相同帧总数;参数调整模块,用于根据所述图像特征和预设判定条件调整所述目标视频的编码参数;
编码处理模块,用于根据调整后的所述编码参数对所述目标视频进行编码处理;
所述根据所述图像特征和预设判定条件调整所述目标视频的编码参数,包括:
若所述图像特征的取值大于或等于所述预设判定条件中的目标内容阈值,则获取所述目标视频的编码参数;
根据所述编码参数的类型调整所述编码参数的取值。
4.一种计算机设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-2中任一所述的视频转码方法。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-2中任一所述的视频转码方法。
CN202010264914.4A 2020-04-07 2020-04-07 视频转码方法、装置、计算机设备和计算机可读存储介质 Active CN111385577B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010264914.4A CN111385577B (zh) 2020-04-07 2020-04-07 视频转码方法、装置、计算机设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010264914.4A CN111385577B (zh) 2020-04-07 2020-04-07 视频转码方法、装置、计算机设备和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111385577A CN111385577A (zh) 2020-07-07
CN111385577B true CN111385577B (zh) 2023-01-13

Family

ID=71217380

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010264914.4A Active CN111385577B (zh) 2020-04-07 2020-04-07 视频转码方法、装置、计算机设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111385577B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111901631B (zh) * 2020-07-30 2023-02-17 有半岛(北京)信息科技有限公司 一种直播视频的转码方法、装置、服务器和存储介质
CN114727108A (zh) * 2021-01-04 2022-07-08 北京金山云网络技术有限公司 量化因子调整方法、装置、电子设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100464585C (zh) * 2006-05-16 2009-02-25 华为技术有限公司 一种视频压缩方法
CN101404767A (zh) * 2008-11-24 2009-04-08 崔天龙 一种基于图像分析及人工智能的可变参数的自动化视频转码方法
US11272191B2 (en) * 2014-11-07 2022-03-08 Ati Technologies Ulc Controlling power consumption in video encoding based on information regarding static amount of an image frame
CN107846590B (zh) * 2016-09-19 2020-09-08 阿里巴巴集团控股有限公司 一种视频编码的方法和视频编码器
CN110324708A (zh) * 2019-07-16 2019-10-11 浙江大华技术股份有限公司 视频处理方法、终端设备及计算机存储介质
CN110536168B (zh) * 2019-09-11 2021-09-17 北京达佳互联信息技术有限公司 视频上传方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN111385577A (zh) 2020-07-07

Similar Documents

Publication Publication Date Title
Zhu et al. No-reference video quality assessment based on artifact measurement and statistical analysis
Li et al. Closed-form optimization on saliency-guided image compression for HEVC-MSP
US20220030244A1 (en) Content adaptation for streaming
US10185884B2 (en) Multi-dimensional objective metric concentering
Xu et al. Region-of-interest based conversational HEVC coding with hierarchical perception model of face
EP3952307A1 (en) Video processing apparatus and processing method of video stream
US10623744B2 (en) Scene based rate control for video compression and video streaming
CN111385577B (zh) 视频转码方法、装置、计算机设备和计算机可读存储介质
WO2021129007A1 (zh) 视频码率的确定方法、装置、计算机设备及存储介质
WO2023134523A1 (zh) 内容自适应视频编码方法、装置、设备和存储介质
Zhang et al. Additive log-logistic model for networked video quality assessment
CN110740316A (zh) 数据编码方法及装置
CN113556544B (zh) 基于场景自适应的视频编码方法和装置、设备及存储介质
Micó-Enguídanos et al. Per-title and per-segment CRF estimation using DNNs for quality-based video coding
CN111767428A (zh) 视频推荐方法、装置、电子设备及存储介质
Zhao et al. Fast CU partition decision strategy based on human visual system perceptual quality
Chi et al. Region-of-interest video coding based on rate and distortion variations for H. 263+
CN115379291B (zh) 一种码表更新方法、装置、设备及存储介质
CN116827921A (zh) 一种流媒体的音视频处理方法、装置及设备
CN111614962B (zh) 一种基于区域块级jnd预测的感知图像压缩方法
US11880966B2 (en) Image quality assessment apparatus and image quality assessment method thereof
Meng et al. Learning to encode user-generated short videos with lower bitrate and the same perceptual quality
WO2024109138A1 (zh) 视频编码方法、装置及存储介质
Changbi et al. Research on video quality evaluation of sparring motion based on BPNN perception
US10848772B2 (en) Histogram-based edge/text detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20231008

Address after: 31a, 15 / F, building 30, maple mall, bangrang Road, Brazil, Singapore

Patentee after: Baiguoyuan Technology (Singapore) Co.,Ltd.

Address before: 5-13 / F, West Tower, building C, 274 Xingtai Road, Shiqiao street, Panyu District, Guangzhou, Guangdong 510000

Patentee before: GUANGZHOU BAIGUOYUAN INFORMATION TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right