CN113709461A - 视频信息处理方法、多媒体信息处理方法及装置 - Google Patents

视频信息处理方法、多媒体信息处理方法及装置 Download PDF

Info

Publication number
CN113709461A
CN113709461A CN202110298455.6A CN202110298455A CN113709461A CN 113709461 A CN113709461 A CN 113709461A CN 202110298455 A CN202110298455 A CN 202110298455A CN 113709461 A CN113709461 A CN 113709461A
Authority
CN
China
Prior art keywords
video
coding
coded
frame group
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110298455.6A
Other languages
English (en)
Inventor
高伟
陈家宁
袁航
林四新
王茹
江林燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Peking University Shenzhen Graduate School
Original Assignee
Tencent Technology Shenzhen Co Ltd
Peking University Shenzhen Graduate School
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd, Peking University Shenzhen Graduate School filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110298455.6A priority Critical patent/CN113709461A/zh
Publication of CN113709461A publication Critical patent/CN113709461A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提供了一种视频信息处理方法、多媒体信息处理方法、装置、电子设备及存储介质,方法包括:根据所述待分析视频片段所包括的当前编码帧组和参考编码帧组的结构相似性差异度,确定所述待编码视频中编码帧组的类型;确定所述待分析视频片段的当前编码单元和参考编码单元的纹理差异参数;基于所述当前编码单元和参考编码单元的纹理差异参数,确定与所述待编码视频相匹配的编码决策;通过所确定的编码决策对待编码视频进行处理,以实现对所述待编码视频的编码,由此,更加快速地确定对视频的编码方式,减少了选择编码决策的等待时间,提升视频编码过程的速度,同时,节省视频信息处理的计算量,减轻设备的计算量,提升用户的使用体验。

Description

视频信息处理方法、多媒体信息处理方法及装置
技术领域
本发明涉及视频信息处理技术,尤其涉及一种视频信息处理方法、多媒体信息处理方法、装置、电子设备及存储介质。
背景技术
视频编码标准AVS3(Audio Video coding Standard,信息源代码标准)、VVC(Versatile Video Coding,通用视频编码)、未来视频编码标准等采用了更多帧内、帧间编码工具以及环路滤波工具。在为待划分编码单元选择最佳划分方式时,编码器首先根据限制条件确定可供该待划分编码单元使用的可用划分方式。对于视频中的一个编码单元,选择最佳的划分模式需要对每一种划分模式进行遍历,进行率失真优化决策,而率失真优化决策过程在整体编码过程中耗时过长,不利于视频的压缩处理,延长了用户的等待时间。
发明内容
有鉴于此,本发明实施例提供一种视频信息处理方法、多媒体信息处理方法、装置、电子设备及存储介质,能够通过编码帧组的类型以及编码单元的纹理差异快速准确地确定与待编码视频相匹配的编码决策,也更加快速地确定对视频的编码方式,减少了选择编码决策的等待时间,提升视频编码过程的速度,同时,节省视频信息处理的计算量,减轻设备的计算量,提升用户的使用体验。
本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种视频信息处理方法,包括:
获取视频处理环境中的待编码视频,并截取所述待编码视频中的待分析视频片段;
根据所述待分析视频片段所包括的当前编码帧组和参考编码帧组的结构相似性差异度,确定所述待编码视频中编码帧组的类型;
当确定所述待编码视频中编码帧组为第一帧组类型时,确定所述待分析视频片段的当前编码单元和参考编码单元的纹理差异参数;
基于所述当前编码单元和参考编码单元的纹理差异参数,确定与所述待编码视频相匹配的编码决策;
通过所确定的编码决策对待编码视频进行处理,以实现对所述待编码视频的编码。
本发明实施例还提供了一种多媒体信息处理方法,所述方法包括:
从多媒体信息中分离出目标音频和目标视频;
确定与所述目标视频相匹配的编码决策;
根据所述编码决策确定相对应的编码决策;
通过所确定的编码决策对所述目标视频进行处理,以实现对所述目标视频的编码;
将经过编码处理的所述目标视频和所述目标音频封装为新的多媒体信息,以实现对所述多媒体信息的压缩;其中,所述编码决策如前述方法得到。
本发明实施例还提供了一种视频信息处理装置,所述装置包括:
信息传输模块,用于获取待编码视频,并截取所述待编码视频中的待分析视频片段;
信息处理模块,用于根据所述待分析视频片段所包括的当前编码帧组和参考编码帧组的结构相似性差异度,确定所述待编码视频中编码帧组的类型;
所述信息处理模块,用于当确定所述待编码视频中编码帧组为第一帧组类型时,确定所述待分析视频片段的当前编码单元和参考编码单元的纹理差异参数;
所述信息处理模块,用于基于所述当前编码单元和参考编码单元的纹理差异参数,确定与所述待编码视频相匹配的编码决策;
所述信息处理模块,用于通过所确定的编码决策对待编码视频进行处理,以实现对所述待编码视频的编码。
上述方案中,
所述信息处理模块,用于获取所述当前编码帧组的帧内预测帧和所述参考编码帧组的帧内预测帧;
所述信息处理模块,用于根据所述当前编码帧组的帧内预测帧和所述参考编码帧组的帧内预测帧,确定相对应的结构相似性差异度;
所述信息处理模块,用于确定与所述视频处理环境相匹配的结构相似性差异度阈值;
所述信息处理模块,用于当所述结构相似性差异度小于所述结构相似性差异度阈值时,确定所述待编码视频中编码帧组为第一类型编码帧组;
所述信息处理模块,用于当所述结构相似性差异度大于等于所述差异度阈值时,确定所述待编码视频中编码帧组为第二类型编码帧组。
上述方案中,
所述信息处理模块,用于获取所述当前编码帧组的帧内预测帧所对应的亮度平均值、亮度值方差、亮度值协方差,以及像素动态范围;
所述信息处理模块,用于获取所述参考编码帧组的帧内预测帧所对应的亮度平均值、亮度值方差、亮度值协方差;
所述信息处理模块,用于基于所述当前编码帧组的帧内预测帧所对应的亮度平均值、亮度值方差、亮度值协方差和所述参考编码帧组的帧内预测帧所对应的亮度平均值、亮度值方差、亮度值协方差,确定所述当前编码帧组和参考编码帧组的结构相似性差异度。
上述方案中,
所述信息处理模块,用于当确定所述待编码视频中编码帧组为第一帧组类型时,在所述待分析视频片段中确定对应的当前编码单元和参考编码单元;
所述信息处理模块,用于确定所述当前编码单元和参考编码单元的直方图差异参数和梯度差异参数;
所述信息处理模块,用于基于所述当前编码单元和参考编码单元的直方图差异参数和梯度差异参数,确定所述待分析视频片段的当前编码单元和参考编码单元的纹理差异参数。
上述方案中,
所述信息处理模块,用于当所述当前编码单元和参考编码单元的纹理差异参数小于纹理差异参数阈值时,确定与所述待编码视频相匹配的编码决策为不执行早期跳过模式;
所述信息处理模块,用于当所述当前编码单元和参考编码单元的纹理差异参数大于等于所述纹理差异参数阈值时,基于所述编码帧组的类型,确定与所述待编码视频相匹配的编码决策。
上述方案中,
所述信息处理模块,用于当所述当前编码单元和参考编码单元的纹理差异参数大于等于所述纹理差异参数阈值时,确定对应的编码帧组的类型;
所述信息处理模块,用于当所述编码帧组为第一帧组类型时,执行静态早期跳过模式;
所述信息处理模块,用于当所述编码帧组为第二帧组类型时,执行动态早期跳过模式。
上述方案中,
所述信息处理模块,用于确定所述当前编码单元中的拓展四叉树结构数量和二叉树结构数量;
所述信息处理模块,用于基于所述当前编码单元中的拓展四叉树结构数量和二叉树结构数量,对所述当前编码单元的类型进行标注;
所述信息处理模块,用于根据所述当前编码单元的类型,调整所述纹理差异参数阈值。
上述方案中,
所述信息处理模块,用于当待分析视频片段相匹配的四叉树划分的直方图差异度和结构性差异度均小于四叉树直方图差异度阈值和四叉树结构性差异度阈值,将所述四叉树划分确定为禁用划分方式;
所述信息处理模块,用于当待分析视频片段相匹配的二叉树划分的直方图差异度和结构性差异度均小于预设的二叉树直方图差异度阈值和二叉树结构性差异度阈值,将所述二叉树划分确定为禁用划分方式;
所述信息处理模块,用于当待分析视频片段相匹配的拓展四叉树划分的直方图差异度和结构性差异度均小于预设的拓展四叉树直方图差异度阈值和拓展四叉树结构性差异度阈值,将所述拓展四叉树划分确定为禁用划分方式。
上述方案中,
所述信息处理模块,用于获取所述待编码视频的标识信息,所述待编码视频对应编码决策和经过编码处理的视频信息;
所述信息处理模块,用于基于所述待编码视频的标识信息、所述待编码视频对应的编码决策和经过编码处理的视频信息,生成目标区块,将所述目标区块加入所述区块链网络中。
本发明实施例还提供了一种多媒体信息处理装置,所述多媒体信息处理装置包括:
信息分离装置,用于从多媒体信息中分离出目标音频和目标视频;
视频处理装置,用于确定与所述目标视频相匹配的编码决策;
所述视频处理装置,根据所述编码决策确定相对应的编码决策;
所述视频处理装置,用于通过所确定的编码方式对所述目标视频进行处理,以实现对所述目标视频的编码;
所述视频处理装置,用于将经过编码处理的所述目标视频和所述目标音频封装为新的多媒体信息,以实现对所述多媒体信息的压缩。
本发明实施例还提供了一种电子设备,备包括:
存储器,用于存储可执行指令;
处理器,用于运行所述存储器存储的可执行指令时,实现前序任意一项所述的视频信息处理方法,或者,实现前序的多媒体信息处理方法。
本发明实施例还提供了一种计算机可读存储介质,存储有可执行指令,所述可执行指令被处理器执行时实现前序任意一项所述的视频信息处理方法,或者,实现前序任意一项所述的点云数据解码方法。
本发明实施例具有以下有益效果:
本发明实施例通过获取视频处理环境中的待编码视频,并截取所述待编码视频中的待分析视频片段;根据所述待分析视频片段所包括的当前编码帧组和参考编码帧组的结构相似性差异度,确定所述待编码视频中编码帧组的类型;当确定所述待编码视频中编码帧组为第一帧组类型时,确定所述待分析视频片段的当前编码单元和参考编码单元的纹理差异参数;基于所述当前编码单元和参考编码单元的纹理差异参数,确定与所述待编码视频相匹配的编码决策;通过所确定的编码决策对待编码视频进行处理,以实现对所述待编码视频的编码,由此,能够通过编码帧组的类型以及编码单元的纹理差异快速准确地确定与待编码视频相匹配的编码决策,也更加快速地确定对视频的编码方式,减少了选择编码决策的等待时间,提升视频编码过程的速度,同时,节省视频信息处理的计算量,减轻设备的计算量,提升用户的使用体验。
附图说明
图1为本发明实施例提供的多媒体信息处理方法的使用场景示意图;
图2为本发明实施例提供的电子设备的组成结构示意图;
图3为本发明实施例中视频信息处理过程一个可选的的流程示意图;
图4为本发明实施例提供的视频信息处理方法一个可选的流程示意图;
图5为本发明实施例提供的视频信息处理方法一个可选的流程示意图;
图6为本发明实施例中不同序列的GOP间的SDIF变化示意图;
图7为本发明实施例提供的视频信息处理方法一个可选的流程示意图;
图8为本发明实施例提供的视频信息处理方法差异度计算示意图;
图9是本发明实施例提供的视频信息处理装置100的架构示意图;
图10是本发明实施例提供的区块链网络200中区块链的结构示意图;
图11是本发明实施例提供的区块链网络200的功能架构示意图;
图12为本发明实施例提供的多媒体信息处理方法一个可选的流程示意图
图13为本发明实施例中视频处理方法的数据处理示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
对本发明实施例进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。
1)参考帧:在视频编解码中,一种作为其他帧的参考数据,用于其他帧在编码/解码过程中获取帧间的参考数据的重建帧。
2)SDK:全称Software Development Kit,可翻译成软件开发工具包,是为特定的软件包、软件框架、硬件平台、操作系统等建立应用软件时的开发工具的集合广义上包括辅助开发某一类软件的相关文档、范例和工具的集合。
3)P帧:帧间预测帧,可采用帧内预测和帧间预测,可前向参考预测编码决策。
4)B帧:帧间预测帧,可采用帧内预测和帧间预测,可前向、后向、双向参考预测。
5)I帧:帧内预测帧,利用帧内信息进行预测。
6)视频编解码标准:某一种约定的视频码流解码规则。
7)视频信息处理(Video Transcoding),是指将已经压缩编码的视频码流转换成另一个视频码流,以适应不同的网络带宽、不同的终端处理能力和不同的用户需求。
8)客户端,终端中实现特定功能的载体,例如移动客户端(APP)是移动终端中特定功能的载体,例如执行线上直播(视频推流)的功能或者是在线视频的播放功能。
9)响应于:用于表示所执行的操作所依赖的条件或者状态,当满足所依赖的条件或状态时,所执行的一个或多个操作可以是实时的,也可以具有设定的延迟;在没有特别说明的情况下,所执行的多个操作不存在执行先后顺序的限制。
10)小程序(Mini Program),是一种基于面向前端的语言(例如JavaScript)开发的、在超文本标记语言(HTML,Hyper Text Markup Language)页面中实现服务的程序,由客户端(例如浏览器或内嵌浏览器核心的任意客户端)经由网络(如互联网)下载、并在客户端的浏览器环境中解释和执行的软件,节省在客户端中安装的步骤。例如,通过语音指令唤醒终端中的小程序实现在社交网络客户端中可以下载、运行用于实现图像编辑、人物人眼图像矫正等各种服务的小程序。
11)交易(Transaction):等同于计算机术语“事务”,交易包括了需要提交到区块链网络执行的操作,并非单指商业语境中的交易,鉴于在区块链技术中约定俗成地使用了“交易”这一术语,本发明实施例遵循了这一习惯。
例如,部署(Deploy)交易用于向区块链网络中的节点安装指定的智能合约并准备好被调用;调用(Invoke)交易用于通过调用智能合约在区块链中追加交易的记录,并对区块链的状态数据库进行操作,包括更新操作(包括增加、删除和修改状态数据库中的键值对)和查询操作(即查询状态数据库中的键值对)。
12)区块链(Block chain):是由区块(Block)形成的加密的、链式的交易的存储结构。
例如,每个区块的头部既可以包括区块中所有交易的哈希值,同时也包含前一个区块中所有交易的哈希值,从而基于哈希值实现区块中交易的防篡改和防伪造;新产生的交易被填充到区块并经过区块链网络中节点的共识后,会被追加到区块链的尾部从而形成链式的增长。
13)区块链网络(Block chain Network):通过共识的方式将新区块纳入区块链的一系列的节点的集合。
14)账本(Ledger):是区块链(也称为账本数据)和与区块链同步的状态数据库的统称。
其中,区块链是以文件系统中的文件的形式来记录交易;状态数据库是以不同类型的键(Key)值(Value)对的形式来记录区块链中的交易,用于支持对区块链中交易的快速查询。
15)智能合约(Smart Contracts):也称为链码(Chain code)或应用代码,部署在区块链网络的节点中的程序,节点执行接收的交易中所调用的智能合约,来对账本数据库的键值对数据进行更新或查询的操作。
16)共识(Consensus):是区块链网络中的一个过程,用于在涉及的多个节点之间对区块中的交易达成一致,达成一致的区块将被追加到区块链的尾部,实现共识的机制包括工作量证明(Po W,Proof of Work)、权益证明(PoS,Proof of Stake)、股份授权证明(DPo S,Delegated Proof-of-Stake)、消逝时间量证明(Po ET,Proof of Elapsed Time)等。
图1为本发明实施例提供的视频信息处理方法的使用场景示意图,参见图1,终端(包括终端10-1和终端10-2)上设置有能够执行不同功能相应客户端其中,所属客户端为终端(包括终端10-1和终端10-2)通过网络300从相应的服务器200中利用不同的业务进程获取不同的视频信息进行浏览,终端通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合,使用无线链路实现数据传输,其中,终端(包括终端10-1和终端10-2)通过网络300从相应的服务器200中所获取的视频类型并不相同,例如:例如:终端(包括终端10-1和终端10-2)既可以通过网络300从相应的服务器200中获取视频(即视频中携带视频信息或相应的视频链接),也可以通过网络300从相应的服务器400中获取仅包括不同类型视频(例如短视频或者长视频)进行浏览。服务器200和服务器400中可以保存有不同类型的视频。在本发明的一些实施例中,服务器200中所保存的不同类型的视频的进程可以是在不同编程语言的软件代码中所编写的,代码对象可以是不同类型的代码实体。例如,在C语言的软件代码中,一个代码对象可以是一个函数。在JAVA语言的软件代码中,一个代码对象可以是一个类,IOS端OC语言中可以是一段目标代码。在C++语言的软件代码中,一个代码对象可以是一个类或一个函数。其中本申请中不再对不同类型的视频的编译环境进行区分。
进一步地,服务器200通过网络300向终端(终端10-1和/或终端10-2)发送或接收不同类型的视频的过程中,由于视频信息所占用的存储空间较大,因此需要对视频信息进行压缩,因此。作为一个事例,服务器200用于获取视频处理环境中的待编码视频,并截取所述待编码视频中的待分析视频片段;根据所述待分析视频片段所包括的当前编码帧组和参考编码帧组的结构相似性差异度,确定所述待编码视频中编码帧组的类型;当确定所述待编码视频中编码帧组为第一帧组类型时,确定所述待分析视频片段的当前编码单元和参考编码单元的纹理差异参数;基于所述当前编码单元和参考编码单元的纹理差异参数,确定与所述待编码视频相匹配的编码决策;通过所确定的编码决策对待编码视频进行处理,以实现对所述待编码视频的编码。
下面对本发明实施例的服务器的结构做详细说明,服务器可以各种形式来实施,如带有视频信息处理功能的专用终端例如网关,也可以为带有视频信息处理功能的服务器,例如前述图1中的服务器200。图2为本发明实施例提供的电子设备的组成结构示意图,可以理解,图2仅仅示出了服务器的示例性结构而非全部结构,根据需要可以实施图2示出的部分结构或全部结构。
本发明实施例提供的服务器包括:至少一个处理器201、存储器202、用户接口203和至少一个网络接口204。电子设备20中的各个组件通过总线系统205耦合在一起。可以理解,总线系统205用于实现这些组件之间的连接通信。总线系统205除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统205。
其中,用户接口203可以包括显示器、键盘、鼠标、轨迹球、点击轮、按键、按钮、触感板或者触摸屏等。
可以理解,存储器202可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。本发明实施例中的存储器202能够存储数据以支持终端(如10-1)的操作。这些数据的示例包括:用于在终端(如10-1)上操作的任何计算机程序,如操作系统和应用程序。其中,操作系统包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序可以包含各种应用程序。
在一些实施例中,本发明实施例提供的视频信息处理装置可以采用软硬件结合的方式实现,作为示例,本发明实施例提供的视频信息处理装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本发明实施例提供的视频信息处理方法。例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,Application SpecificIntegrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或其他电子元件。
作为本发明实施例提供的视频信息处理装置采用软硬件结合实施的示例,本发明实施例所提供的视频信息处理装置可以直接体现为由处理器201执行的软件模块组合,软件模块可以位于存储介质中,存储介质位于存储器202,处理器201读取存储器202中软件模块包括的可执行指令,结合必要的硬件(例如,包括处理器201以及连接到总线205的其他组件)完成本发明实施例提供的视频信息处理方法。
作为示例,处理器201可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
作为本发明实施例提供的视频信息处理装置采用硬件实施的示例,本发明实施例所提供的装置可以直接采用硬件译码处理器形式的处理器201来执行完成,例如,被一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,ComplexProgrammable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable GateArray)或其他电子元件执行实现本发明实施例提供的视频信息处理方法。
本发明实施例中的存储器202用于存储各种类型的数据以支持电子设备20的操作。这些数据的示例包括:用于在电子设备20上操作的任何可执行指令,如可执行指令,实现本发明实施例的从视频信息处理方法的程序可以包含在可执行指令中。
在另一些实施例中,本发明实施例提供的视频信息处理装置可以采用软件方式实现,图2示出了存储在存储器202中的视频信息处理装置2020,其可以是程序和插件等形式的软件,并包括一系列的模块,作为存储器202中存储的程序的示例,可以包括视频信息处理装置2020,视频信息处理装置2020中包括以下的软件模块:信息传输模块2081,信息处理模块2082。当视频信息处理装置2020中的软件模块被处理器201读取到RAM中并执行时,将实现本发明实施例提供的视频信息处理方法,下面对视频信息处理装置2020中各个软件模块的功能进行介绍:
信息传输模块2081,用于获取待编码视频,并截取所述待编码视频中的待分析视频片段。
信息处理模块2082,用于根据所述待分析视频片段所包括的当前编码帧组和参考编码帧组的结构相似性差异度,确定所述待编码视频中编码帧组的类型。
信息处理模块2082,用于当确定所述待编码视频中编码帧组为第一帧组类型时,确定所述待分析视频片段的当前编码单元和参考编码单元的纹理差异参数。
信息处理模块2082,用于基于所述当前编码单元和参考编码单元的纹理差异参数,确定与所述待编码视频相匹配的编码决策。
信息处理模块2082,用于通过所确定的编码决策对待编码视频进行处理,以实现对所述待编码视频的编码。
根据图2所示的电子设备,在本申请的一个方面中,本申请还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述视频信息处理方法的各种可选实现方式中所提供的不同实施例及实施例的组合。
在介绍本申请所提供的视频信息处理方法之前,首先对相关技术中的视频信息处理过程进行介绍,其中,图3为本发明实施例中视频信息处理过程一个可选的的流程示意图,在视频压缩处理过程中,如VVC(Versatile Video Coding,通用视频编码)和AVS3(Audio Video coding Standard 3,音视频编码标准3)、HEVC(High Efficiency VideoCoding,高性能视频编码)编码过程中,涉及到许多模式决策过程。参考图3,相关视频编码技术中,如H.265/HEVC(High Efficient Video Coding,高效率视频压缩编码)、H.266/VVC(Versatile Video Coding,通用视频编码)标准、AVS(Audio Video coding Standard,音视频编码标准)(如AVS3)中,采用了混合编码框架,对输入的原始视频信号进行如下一系列的操作和处理:
1、块划分结构(Block Partition Structure):输入图像划分成若干个不重叠的处理单元,每个处理单元将进行类似的压缩操作。这个处理单元被称作CTU(Coding TreeUnit,编码树单元),或者LCU(Large Coding Unit,最大编码单元)。CTU再往下,可以继续进行更加精细的划分,得到一个或多个基本编码的单元,称之为CU(Coding Unit,编码单元)。每个CU是一个编码环节中最基本的元素。以下描述的是对每一个CU可能采用的各种编码方式。
2、预测编码(Predictive Coding):包括了帧内预测和帧间预测等方式,原始视频信号经过选定的已重建视频信号的预测后,得到残差视频信号。编码端需要为当前CU决定在众多可能的预测编码模式中,选择最适合的一种,并告知解码端。其中,帧内预测是指预测的信号来自于同一图像内已经编码重建过的区域。帧间预测是指预测的信号来自已经编码过的,不同于当前图像的其他图像(称之为参考图像)。
以AVS3编码标准为例,视频帧首先会被划分成为多个编码单元(Large CodingUnit,LCU),每一个编码单元会被递归划分成为更小的编码单元(Coding Unit,CU)。编码单元的划分共有6种可能性,分别是:不划分(Non-Split)、垂直二叉树划分(Vertical BinarySplit)、水平二叉树划分(Horizontal Binary Split)、垂直拓展四叉树划分(VerticalExtend Binary Split)、水平拓展四叉树划分(Horizontal Binary Split)以及四叉树划分(Quad Tree Split),对于视频中的一个编码单元,选择最佳的划分模式需要对每一种划分模式进行遍历,进行率失真优化决策,而率失真优化决策过程在整体编码过程中耗时过长,不利于视频的压缩处理,延长了用户的等待时间。
结合图2示出的电子设备20说明本发明实施例提供的视频信息处理方法,参见图4,图4为本发明实施例提供的视频信息处理方法一个可选的流程示意图,可以理解地,图4所示的步骤可以由运行视频信息处理装置的各种服务器执行,例如可以是如带有视频信息处理功能的专用终端、服务器或者服务器集群。下面针对图4示出的步骤进行说明。
步骤401:视频信息处理装置获取视频处理环境中的待编码视频,并截取所述待编码视频中的待分析视频片段。
其中,以微信小程序所上传的视频为例,用户通过微信小程序可以上传终端所拍摄的视频或者终端中已经保存的视频,封装在服务器的可读存储介质中的视频信息处理装置可以通过通信链路获取这些待编码视频,并截取固定帧数(例如视频前部的10帧)的视频或者固定时间(视频前部的1秒)的视频作为待分析视频片段。
步骤402:视频信息处理装置根据所述待分析视频片段所包括的当前编码帧组和参考编码帧组的结构相似性差异度,确定所述待编码视频中编码帧组的类型。
在本发明的一些实施例中,根据所述待分析视频片段所包括的当前编码帧组和参考编码帧组的结构相似性差异度,确定所述待编码视频中编码帧组的类型,可以通过以下方式实现:
获取所述当前编码帧组的帧内预测帧和所述参考编码帧组的帧内预测帧;根据所述当前编码帧组的帧内预测帧和所述参考编码帧组的帧内预测帧,确定相对应的结构相似性差异度;确定与所述视频处理环境相匹配的结构相似性差异度阈值;当所述结构相似性差异度小于所述结构相似性差异度阈值时,确定所述待编码视频中编码帧组为第一类型编码帧组;当所述结构相似性差异度大于等于所述差异度阈值时,确定所述待编码视频中编码帧组为第二类型编码帧组。
其中,图5为本发明实施例提供的视频信息处理方法一个可选的流程示意图,由于待编码的视频类型不同,可以分为动态场景视频和固定场景视频两类,动态场景视频可以包括影视剧视频、手机拍摄视频等类型视频,固定场景视频可以包括:网络会议视频、监控视频等类型视频,在计算结构相似性差异度时,可以获取所述当前编码帧组的帧内预测帧所对应的亮度平均值、亮度值方差、亮度值协方差,以及像素动态范围;获取所述参考编码帧组的帧内预测帧所对应的亮度平均值、亮度值方差、亮度值协方差;基于所述当前编码帧组的帧内预测帧所对应的亮度平均值、亮度值方差、亮度值协方差和所述参考编码帧组的帧内预测帧所对应的亮度平均值、亮度值方差、亮度值协方差,参考公式1和公式2和公式3,确定所述当前编码帧组和参考编码帧组的结构相似性差异度。
SDIF(Q,S)=1-SSIM(Q,S) (1)公式1
Figure BDA0002985186190000111
其中,μ0为Q图像中亮度的平均值,μS为S图像中亮度的平均值,
Figure BDA0002985186190000112
为Q中亮度的方差,
Figure BDA0002985186190000113
为S中亮度的方差,μQS为Q和S中亮的协方差,c1=(k1L)2,c2=(k2L)2是维持稳定的常数,L是像素值的动态范围,k1取0.01,k2取0.03。
Figure BDA0002985186190000114
在本发明的一些实施例中,通过编码帧组确定图像帧的编码帧组类型时,可以对AVS3标准参考序列的GOP间的SDIF进行统计,为了适配不同视频处理场景,还可以基于HEVC标准参考序列中的FourPeople、Johnny、KristenAndSara等不同测试序列对结构相似性差异度阈值进行调整。参考图6,图6为本发明实施例中不同序列的GOP间的SDIF变化示意图,如图6所示,通过设置自适应的阈值,可以区分待处理视频中的动态场景视频和静态场景视频,可以设置SDIF阈值为0.2,以为配不同的视频处理环境。
步骤403:视频信息处理装置当确定所述待编码视频中编码帧组为第一帧组类型时,确定所述待分析视频片段的当前编码单元和参考编码单元的纹理差异参数。
在本发明的一些实施例中,当确定所述待编码视频中编码帧组为第一帧组类型时,确定所述待分析视频片段的当前编码单元和参考编码单元的纹理差异参数,可以通过以下方式实现:
当确定所述待编码视频中编码帧组为第一帧组类型时,在所述待分析视频片段中确定对应的当前编码单元和参考编码单元;确定所述当前编码单元和参考编码单元的直方图差异参数和梯度差异参数;基于所述当前编码单元和参考编码单元的直方图差异参数和梯度差异参数,确定所述待分析视频片段的当前编码单元和参考编码单元的纹理差异参数。其中,图7为本发明实施例提供的视频信息处理方法一个可选的流程示意图,当编码器为当前CU进行编码时,可以搜索参考帧当中的CU的位置,计算当前CU和参考CU的纹理差异,然后将差异程度与阈值进行比较,判断是否会禁止EQT划分模式或者BT划分模式。如果差异度满足差异度阈值,则判断当前GOP是否为变化缓慢的GOP的,如果是,则使用静态的早期跳过模式,加速对于视频图像帧的处理过程,否则使用动态的早期跳过模式,提升对于变化幅度较大的视频的处理过程。如果差异度不满足阈值,则使用正常编码模式,不执行早期跳过模式。当条件判断为当前CU禁用EQT时,可用的选择为QT、BT和不划分;当条件判断为当前CU禁用BT时,可用的选择为QT、EQT和不划分。
步骤404:视频信息处理装置基于所述当前编码单元和参考编码单元的纹理差异参数,确定与所述待编码视频相匹配的编码决策。
在本发明的一些实施例中,当所述当前编码单元和参考编码单元的纹理差异参数大于等于所述纹理差异参数阈值时,基于所述编码帧组的类型,确定与所述待编码视频相匹配的编码决策,可以通过以下方式实现:
当所述当前编码单元和参考编码单元的纹理差异参数大于等于所述纹理差异参数阈值时,确定对应的编码帧组的类型;当所述编码帧组为第一帧组类型时,执行静态早期跳过模式;当所述编码帧组为第二帧组类型时,执行动态早期跳过模式。参考图8,图8为本发明实施例提供的视频信息处理方法差异度计算示意图,其中,直方图差异度的计算方式如公式4和公式5所示,梯度差异度的计算算子如图8所示。
HistDiff(CUcur,CUref)=1-Similarity(CUcur,CUref) (4)公式4
Figure BDA0002985186190000121
其中,CUcur和CUref分别是当前CU和参考CU,xm和ym是两个CU中每个亮度像素的数量。
步骤405:视频信息处理装置通过所确定的编码决策对待编码视频进行处理,以实现对所述待编码视频的编码。
在本发明的一些实施例中,对阈值进行调整时,还可以确定所述当前编码单元中的拓展四叉树结构数量和二叉树结构数量;基于所述当前编码单元中的拓展四叉树结构数量和二叉树结构数量,对所述当前编码单元的类型进行标注;
根据所述当前编码单元的类型,调整所述纹理差异参数阈值。其中,可以从高效视频编码标准(High Efficiency Video Coding,HEVC)中使用的参考序列BQMall、BQTerrace、FourPeople和Johnny中提取数据,提取的QP为{27,32,38,45},使用的模式为Rancom-Access(RA)。使用决策树进行训练。在本方案中,加入了尺寸大小的限制,因此,提取的特征为:
Figure BDA0002985186190000122
其中,CUEQT-num和CUBT-num表示的是当前CU内部使用的EQT和BT的数量。决策树训练的标签由CUEQT_num以及CUBT_num决定,参考公式6和公式7,:
Figure BDA0002985186190000123
Figure BDA0002985186190000124
如果CUEQT-num小于所设置的CUnum-theshold,将该CU标记为限制划分,否则设置为不限制划分;如果CUBTnum小于所设置的CUBTnum-theshold,将该CU标记为限制划分,否则设置为不限制划分。
其中,本发明实施例可结合云技术或区块链网络技术实现,云技术(Cloudtechnology)是指在广域网或局域网内将硬件、软件及网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术,也可理解为基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术及应用技术等的总称。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站,因此云技术需要以云计算作为支撑。
需要说明的是,云计算是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。作为云计算的基础能力提供商,会建立云计算资源池平台,简称云平台,一般称为基础设施即服务(IaaS,Infrastructure as a Service),在资源池中部署多种类型的虚拟资源,供外部客户选择使用。云计算资源池中主要包括:计算设备(可为虚拟化机器,包含操作系统)、存储设备和网络设备。
在本发明的一些实施例中,还可以获取所述待编码视频的标识信息,以及与所述待编码视频对应编码决策;基于所述待编码视频的标识信息、所述待编码视频以及所述待编码视频对应的编码决策,生成目标区块,将所述目标区块加入所述区块链网络中。具体来说,将所述待编码视频的标识信息、所述待编码视频对应的编码决策和经过编码处理的视频信息发送至区块链网络,以使
所述区块链网络的节点将所述待编码视频的标识信息、所述待编码视频对应的编码决策和经过编码处理的视频信息填充至新区块,且当对所述新区块共识一致时,将所述新区块追加至区块链的尾部。
上述方案中,所述方法还包括:
接收所述区块链网络中的其他节点的数据同步请求;响应于所述数据同步请求,对所述其他节点的权限进行验证;当所述其他节点的权限通过验证时,控制当前节点与所述其他节点之间进行数据同步,以实现所述其他节点获取所述待编码视频的标识信息、所述待编码视频对应的编码决策和经过编码处理的视频信息。
上述方案中,所述方法还包括:响应于查询请求,解析所述查询请求以获取对应的用户标识;根据所述用户标识,获取区块链网络中的目标区块内的权限信息;对所述权限信息与所述用户标识的匹配性进行校验;当所述权限信息与所述用户标识相匹配时,在所述区块链网络中获取相应的所述待编码视频的标识信息、所述待编码视频对应的编码决策和经过编码处理的视频信息;响应于所述查询请求,将所获取的相应的所述待编码视频的标识信息、所述待编码视频对应的编码决策和经过编码处理的视频信息向相应的客户端进行推送,以实现所述客户端获取所述区块链网络中所保存的相应的所述待编码视频的标识信息、所述待编码视频对应的编码决策和经过编码处理的视频信息。
继续参见图9,图9是本发明实施例提供的视频信息处理装置100的架构示意图,包括区块链网络200(示例性示出了共识节点210-1至共识节点210-3)、认证中心300、业务主体400和业务主体500,下面分别进行说明。
区块链网络200的类型是灵活多样的,例如可以为公有链、私有链或联盟链中的任意一种。以公有链为例,任何业务主体的电子设备例如用户终端和服务器,都可以在不需要授权的情况下接入区块链网络200;以联盟链为例,业务主体在获得授权后其下辖的电子设备(例如终端/服务器)可以接入区块链网络200,此时,成为区块链网络200中的客户端节点。
在一些实施例中,客户端节点可以只作为区块链网络200的观察者,即提供支持业务主体发起交易(例如,用于上链存储数据或查询链上数据)功能,对于区块链网络200的共识节点210的功能,例如排序功能、共识服务和账本功能等,客户端节点可以缺省或者有选择性(例如,取决于业务主体的具体业务需求)地实施。从而,可以将业务主体的数据和业务处理逻辑最大程度迁移到区块链网络200中,通过区块链网络200实现数据和业务处理过程的可信和可追溯。
区块链网络200中的共识节点接收来自不同业务主体(例如前序实施中示出的业务主体400和业务主体500)的客户端节点(例如,前序实施例中示出的归属于业务主体400的客户端节点410、以及归属于数据库运营商系统的客户端节点510)提交的交易,执行交易以更新账本或者查询账本,执行交易的各种中间结果或最终结果可以返回业务主体的客户端节点中显示。
例如,客户端节点410/510可以订阅区块链网络200中感兴趣的事件,例如区块链网络200中特定的组织/通道中发生的交易,由共识节点210推送相应的交易通知到客户端节点410/510,从而触发客户端节点410/510中相应的业务逻辑。
下面以多个业务主体接入区块链网络以实现对指令信息以及与所述指令信息相匹配的业务进程管理为例,说明区块链网络的示例性应用。
参见图9,管理环节涉及的多个业务主体,如业务主体400可以是视频信息处理装置,业务主体500可以是带有视频信息处理装功能的显示系统,从认证中心300进行登记注册获得各自的数字证书,数字证书中包括业务主体的公钥、以及认证中心300对业务主体的公钥和身份信息签署的数字签名,用来与业务主体针对交易的数字签名一起附加到交易中,并被发送到区块链网络,以供区块链网络从交易中取出数字证书和签名,验证消息的可靠性(即是否未经篡改)和发送消息的业务主体的身份信息,区块链网络会根据身份进行验证,例如是否具有发起交易的权限。业务主体下辖的电子设备(例如终端或者服务器)运行的客户端都可以向区块链网络200请求接入而成为客户端节点。
业务主体400的客户端节点410用于,获取所述待编码视频的标识信息,以及与所述待编码视频对应编码决策;基于所述待编码视频的标识信息、所述待编码视频对应的编码决策和经过编码处理的视频信息,生成目标区块,将所述目标区块加入所述区块链网络200中。
其中,将相应的指令信息以及与所述指令信息相匹配的编码决策发送至区块链网络200,可以预先在客户端节点410设置业务逻辑,当形成相应的编码决策时,客户端节点410将待处理的指令信息以及与所述指令信息相匹配的编码决策自动发送至区块链网络200,也可以由业务主体400的业务人员在客户端节点410中登录,手动打包指令信息以及与所述指令信息相匹配的编码决策以及相应的转换进程信息,并将其发送至区块链网络200。在发送时,客户端节点410根据指令信息以及与所述指令信息相匹配的编码决策以及相应的转换编码决策生成对应更新操作的交易,在交易中指定了实现更新操作需要调用的智能合约、以及向智能合约传递的参数,交易还携带了客户端节点410的数字证书、签署的数字签名(例如,使用客户端节点410的数字证书中的私钥,对交易的摘要进行加密得到),并将交易广播到区块链网络200中的共识节点210。
区块链网络200中的共识节点210中接收到交易时,对交易携带的数字证书和数字签名进行验证,验证成功后,根据交易中携带的业务主体400的身份,确认业务主体400是否是具有交易权限,数字签名和权限验证中的任何一个验证判断都将导致交易失败。验证成功后签署节点210自己的数字签名(例如,使用节点210-1的私钥对交易的摘要进行加密得到),并继续在区块链网络200中广播。
区块链网络200中的共识节点210接收到验证成功的交易后,将交易填充到新的区块中,并进行广播。区块链网络200中的共识节点210广播的新区块时,会对新区块进行共识过程,如果共识成功,则将新区块追加到自身所存储的区块链的尾部,并根据交易的结果更新状态数据库,执行新区块中的交易:对于提交更新待处理的指令信息以及与所述指令信息相匹配的编码决策以及相应的进程触发信息的交易,在状态数据库中添加包括指令信息以及与所述指令信息相匹配的编码决策以及相应的进程触发信息的键值对。
业务主体500的业务人员在客户端节点510中登录,输入指令信息以及与所述指令信息相匹配的编码决策查询请求,客户端节点510根据指令信息以及与所述指令信息相匹配的编码决策查询请求生成对应更新操作/查询操作的交易,在交易中指定了实现更新操作/查询操作需要调用的智能合约、以及向智能合约传递的参数,交易还携带了客户端节点510的数字证书、签署的数字签名(例如,使用客户端节点510的数字证书中的私钥,对交易的摘要进行加密得到),并将交易广播到区块链网络200中的共识节点210。
区块链网络200中的共识节点210中接收到交易,对交易进行验证、区块填充及共识一致后,将填充的新区块追加到自身所存储的区块链的尾部,并根据交易的结果更新状态数据库,执行新区块中的交易:对于提交的更新某一编码决策数据信息对应的人工识别结果的交易,根据人工识别结果更新状态数据库中该编码决策数据信息对应的键值对;对于提交的查询某个编码决策数据信息的交易,从状态数据库中查询指令信息以及与所述指令信息相匹配的编码决策对应的键值对,并返回交易结果。
值得说明的是,在图9中示例性地示出了将指令信息以及与所述指令信息相匹配的编码决策以及相应的进程触发信息直接上链的过程,但在另一些实施例中,对于指令信息以及与所述指令信息相匹配的编码决策数据量较大的情况,客户端节点410可指令信息以及与所述指令信息相匹配的编码决策的哈希以及相应的指令信息以及与所述指令信息相匹配的编码决策的哈希成对上链,将指令信息以及与所述指令信息相匹配的编码决策以及相应的进程触发信息存储于分布式文件系统或数据库。客户端节点510从分布式文件系统或数据库获取到指令信息以及与所述指令信息相匹配的编码决策以及相应的进程触发信息后,可结合区块链网络200中对应的哈希进行校验,从而减少上链操作的工作量。
作为区块链的示例,参见图10,图10是本发明实施例提供的区块链网络200中区块链的结构示意图,每个区块的头部既可以包括区块中所有交易的哈希值,同时也包含前一个区块中所有交易的哈希值,新产生的交易的记录被填充到区块并经过区块链网络中节点的共识后,会被追加到区块链的尾部从而形成链式的增长,区块之间基于哈希值的链式结构保证了区块中交易的防篡改和防伪造。
下面说明本发明实施例提供的区块链网络的示例性的功能架构,参见图11,图11是本发明实施例提供的区块链网络200的功能架构示意图,包括应用层201、共识层202、网络层203、数据层204和资源层205,下面分别进行说明。
资源层205封装了实现区块链网路200中的各个节点210的计算资源、存储资源和通信资源。
数据层204封装了实现账本的各种数据结构,包括以文件系统中的文件实现的区块链,键值型的状态数据库和存在性证明(例如区块中交易的哈希树)。
网络层203封装了点对点(P2P,Point to Point)网络协议、数据传播机制和数据验证机制、接入认证机制和业务主体身份管理的功能。
其中,P2P网络协议实现区块链网络200中节点210之间的通信,数据传播机制保证了交易在区块链网络200中的传播,数据验证机制用于基于加密学方法(例如数字证书、数字签名、公/私钥对)实现节点210之间传输数据的可靠性;接入认证机制用于根据实际的业务场景对加入区块链网络200的业务主体的身份进行认证,并在认证通过时赋予业务主体接入区块链网络200的权限;业务主体身份管理用于存储允许接入区块链网络200的业务主体的身份、以及权限(例如能够发起的交易的类型)。
共识层202封装了区块链网络200中的节点210对区块达成一致性的机制(即共识机制)、交易管理和账本管理的功能。共识机制包括POS、POW和DPOS等共识算法,支持共识算法的可插拔。
交易管理用于验证节点210接收到的交易中携带的数字签名,验证业务主体的身份信息,并根据身份信息判断确认其是否具有权限进行交易(从业务主体身份管理读取相关信息);对于获得接入区块链网络200的授权的业务主体而言,均拥有认证中心颁发的数字证书,业务主体利用自己的数字证书中的私钥对提交的交易进行签名,从而声明自己的合法身份。
账本管理用于维护区块链和状态数据库。对于取得共识的区块,追加到区块链的尾部;执行取得共识的区块中的交易,当交易包括更新操作时更新状态数据库中的键值对,当交易包括查询操作时查询状态数据库中的键值对并向业务主体的客户端节点返回查询结果。支持对状态数据库的多种维度的查询操作,包括:根据区块向量号(例如交易的哈希值)查询区块;根据区块哈希值查询区块;根据交易向量号查询区块;根据交易向量号查询交易;根据业务主体的账号(向量号)查询业务主体的账号数据;根据通道名称查询通道中的区块链。
应用层201封装了区块链网络能够实现的各种业务,包括交易的溯源、存证和验证等。
下面对本发明实施例的多媒体信息处理装置的结构做详细说明,多媒体信息处理装置可以各种形式来实施,如带有视频信息处理功能的专用终端例如网关,也可以为带有视频信息处理功能的多媒体信息处理装置,例如前述图1中的服务器400。
结合图2示出的电子设备说明本发明实施例提供的多媒体信息处理方法,参见图12,图12为本发明实施例提供的多媒体信息处理方法一个可选的流程示意图,可以理解地,图12所示的步骤可以由运行多媒体信息处理装置的各种服务器执行,例如可以是如带有多媒体信息处理功能的专用终端、多媒体信息处理装置或者多媒体信息处理装置集群。下面针对图12示出的步骤进行说明。
步骤1201:多媒体信息处理装置从多媒体信息中分离出目标音频和目标视频。
其中,图13为本发明实施例中视频处理方法的数据处理示意图,其中,每一帧的帧输出buffer后面额外分配一定的空间存储extra_info,这些信息包括但不限于,每个宏块的宏块类型,分割方式,bits大小,MV及参考帧、qp信息以及帧类型和帧Size数据等。编码器拿到一帧frame_data后,同时得到了这些extra_info信息,这些info信息可以直接用来指导估计当前帧的复杂度。在计算帧间复杂度时,参考以下步骤:
步骤1301:计算前后两个GOP的结构相似度。
步骤1302:与视频处理环境相匹配的结构相似性差异度阈值进行比较,判断是否小于结构相似性差异度阈值,如果是执行步骤1304,否则执行步骤1303。
步骤1303:确认为变化缓慢的gop。
步骤1304:确认为变化剧烈的gop。
步骤1305:计算Ref.CU和Curr.CU之间的纹理差异值。
步骤1306:纹理差异值与阈值进行比较,判断是否小于结差异度阈值,如果是执行步骤1308,否则执行步骤1307。
步骤1307:不执行早期跳过模式。
步骤1308:判断是否为动态gop,如果是执行步骤步骤1309,否则执行步骤1310。
步骤1309:执行动态早期跳过模式。
步骤1310:执行静态早期跳过模式。
在确定编码决策后,继续执行步骤1202。
步骤1202:多媒体信息处理装置确定与所述目标视频相匹配的编码决策。
步骤1203:多媒体信息处理装置通过所确定的编码决策对所述目标视频进行处理,以实现对所述目标视频的编码。
步骤1204:多媒体信息处理装置将经过编码的视频进行传输。
在本发明的一些实施例中,在HPM-9.1平台上,使用低延迟(LD,Low Delay)的编码模式进行了测试。测试服务器的配置可选为16.04.1-Ubuntu,40Intel(R),Xeon(R),Gold6148CPU@2.4GHz运行环境。本实施例使用的测试数据见表1。由于AVS3指定测试序列中固定场景类型视频较少,测试中进入了部分其他标准的固定场景测试序列,各序列名称见表1,其中,以上测试中,限制EQT数量的快速算法禁止了使用EQT数量预测少于5的LCU使用该方式。其中,用于预设差异度阈值的编码信息和差异度数据主要来自于视频序列SlidShow、Johnny、KristenAndSara和Vidyo4中的部分帧。CU尺寸限制算法对长宽之积大于2048的CU禁用EQT划分方式,编码QP分别使用27、32、38、45。表1中的HPM9.1-EQT编码时间为直接禁止所有CU使用EQT划分,表1中的HPM9.1-BT编码时间为直接禁止所有CU使用BT划分,表2中的HPM9.1-EQT+HPM9.1-BT编码时间为直接禁止所有EQT和BT划分。总时间节省ST、EQT时间节省SEQT、BT时间节省SBT的计算方式参考公式(8)8、公式(9)所示。
Figure BDA0002985186190000181
Figure BDA0002985186190000182
Figure BDA0002985186190000183
其中,Torg表示平均时间,Tfast表示最短时间
表1 EQT与BT分别实现在HPM-9.1上的测试性能
Figure BDA0002985186190000184
Figure BDA0002985186190000191
表2 EQT与BT同时实现在HPM-9.1上的测试性能
Figure BDA0002985186190000192
Figure BDA0002985186190000201
从测试数据中可以看出,通过使用EQT和BT限制算法总体可分别获得11%和24%的时间节省,使用EQT+BT限制算法总体可获得31%的时间节省。EQT、BT、EQT+BT限制算法带来的BD-PSNR分别为-0.011、-0.049、-0.058,带来的BD-BR分别为0.362%、1.677%、1.974%。上述的测试数据表明了本申请所提供的视频处理方法的有效性。
本发明实施例具有以下有益效果:
本发明实施例通过获取视频处理环境中的待编码视频,并截取所述待编码视频中的待分析视频片段;根据所述待分析视频片段所包括的当前编码帧组和参考编码帧组的结构相似性差异度,确定所述待编码视频中编码帧组的类型;当确定所述待编码视频中编码帧组为第一帧组类型时,确定所述待分析视频片段的当前编码单元和参考编码单元的纹理差异参数;基于所述当前编码单元和参考编码单元的纹理差异参数,确定与所述待编码视频相匹配的编码决策;通过所确定的编码决策对待编码视频进行处理,以实现对所述待编码视频的编码,由此,能够通过编码帧组的类型以及编码单元的纹理差异快速准确地确定与待编码视频相匹配的编码决策,也更加快速地确定对视频的编码方式,减少了选择编码决策的等待时间,提升视频编码过程的速度,同时,节省视频信息处理的计算量,减轻设备的计算量,提升用户的使用体验。
以上所述,仅为本发明的实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种视频信息处理方法,其特征在于,所述方法包括:
获取待编码视频,并截取所述待编码视频中的待分析视频片段;
根据所述待分析视频片段所包括的当前编码帧组和参考编码帧组的结构相似性差异度,确定所述待编码视频中编码帧组的类型;
当确定所述待编码视频中编码帧组为第一帧组类型时,确定所述待分析视频片段的当前编码单元和参考编码单元的纹理差异参数;
基于所述当前编码单元和参考编码单元的纹理差异参数,确定与所述待编码视频相匹配的编码决策;
通过所确定的编码决策对待编码视频进行处理,以实现对所述待编码视频的编码。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待分析视频片段所包括的当前编码帧组和参考编码帧组的结构相似性差异度,确定所述待编码视频中编码帧组的类型,包括:
获取所述当前编码帧组的帧内预测帧和所述参考编码帧组的帧内预测帧;
根据所述当前编码帧组的帧内预测帧和所述参考编码帧组的帧内预测帧,确定相对应的结构相似性差异度;
确定与所述视频处理环境相匹配的结构相似性差异度阈值;
当所述结构相似性差异度小于所述结构相似性差异度阈值时,确定所述待编码视频中编码帧组为第一帧组类型;
当所述结构相似性差异度大于等于所述差异度阈值时,确定所述待编码视频中编码帧组为第二帧组类型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述当前编码帧组的帧内预测帧和所述参考编码帧组的帧内预测帧,确定相对应的结构相似性差异度,包括:
获取所述当前编码帧组的帧内预测帧所对应的亮度平均值、亮度值方差、亮度值协方差,以及像素动态范围;
获取所述参考编码帧组的帧内预测帧所对应的亮度平均值、亮度值方差、亮度值协方差;
基于所述当前编码帧组的帧内预测帧所对应的亮度平均值、亮度值方差、亮度值协方差和所述参考编码帧组的帧内预测帧所对应的亮度平均值、亮度值方差、亮度值协方差,确定所述当前编码帧组和参考编码帧组的结构相似性差异度。
4.根据权利要求1所述的方法,其特征在于,所述当确定所述待编码视频中编码帧组为第一帧组类型时,确定所述待分析视频片段的当前编码单元和参考编码单元的纹理差异参数,包括:
当确定所述待编码视频中编码帧组为第一帧组类型时,在所述待分析视频片段中确定对应的当前编码单元和参考编码单元;
确定所述当前编码单元和参考编码单元的直方图差异参数和梯度差异参数;
基于所述当前编码单元和参考编码单元的直方图差异参数和梯度差异参数,确定所述待分析视频片段的当前编码单元和参考编码单元的纹理差异参数。
5.根据权利要求1所述的方法,其特征在于,所述基于所述当前编码单元和参考编码单元的纹理差异参数,确定与所述待编码视频相匹配的编码决策,包括:
当所述当前编码单元和参考编码单元的纹理差异参数小于纹理差异参数阈值时,确定与所述待编码视频相匹配的编码决策为不执行早期跳过模式;或者
当所述当前编码单元和参考编码单元的纹理差异参数大于等于所述纹理差异参数阈值时,基于所述编码帧组的类型,确定与所述待编码视频相匹配的编码决策。
6.根据权利要求5所述的方法,其特征在于,所述当所述当前编码单元和第二编码单元的纹理差异参数大于等于所述纹理差异参数阈值时,基于所述编码帧组的类型,确定与所述待编码视频相匹配的编码决策,包括:
当所述当前编码单元和参考编码单元的纹理差异参数大于等于所述纹理差异参数阈值时,确定对应的编码帧组的类型;
当所述编码帧组为第一帧组类型时,执行静态早期跳过模式;
当所述编码帧组为第二帧组类型时,执行动态早期跳过模式。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
确定所述当前编码单元中的拓展四叉树结构数量和二叉树结构数量;
基于所述当前编码单元中的拓展四叉树结构数量和二叉树结构数量,对所述当前编码单元的类型进行标注;
根据所述当前编码单元的类型,调整所述纹理差异参数阈值。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
当待分析视频片段相匹配的四叉树划分的直方图差异度和结构性差异度均小于四叉树直方图差异度阈值和四叉树结构性差异度阈值,将所述四叉树划分确定为禁用划分方式;
当待分析视频片段相匹配的二叉树划分的直方图差异度和结构性差异度均小于预设的二叉树直方图差异度阈值和二叉树结构性差异度阈值,将所述二叉树划分确定为禁用划分方式;
当待分析视频片段相匹配的拓展四叉树划分的直方图差异度和结构性差异度均小于预设的拓展四叉树直方图差异度阈值和拓展四叉树结构性差异度阈值,将所述拓展四叉树划分确定为禁用划分方式。
9.根据权利要求1-8任一所述的方法,其特征在于,所述方法还包括:
获取所述待编码视频的标识信息,所述待编码视频对应编码决策和经过编码处理的视频信息;
基于所述待编码视频的标识信息、所述待编码视频对应的编码决策和经过编码处理的视频信息,生成目标区块,将所述目标区块加入所述区块链网络中。
10.根据权利要求1-8任一所述的方法,其特征在于,所述方法还包括:
从多媒体信息中分离出目标音频和目标视频;
确定与所述目标视频相匹配的编码决策;
通过所确定的编码决策对所述目标视频进行处理,以实现对所述目标视频的编码;
将经过编码处理的所述目标视频和所述目标音频封装为新的多媒体信息,其中,所述编码决策如权利要求1至8任一项所述的方法得到。
11.一种视频信息处理装置,其特征在于,所述装置包括:
信息传输模块,用于获取待编码视频,并截取所述待编码视频中的待分析视频片段;
信息处理模块,用于根据所述待分析视频片段所包括的当前编码帧组和参考编码帧组的结构相似性差异度,确定所述待编码视频中编码帧组的类型;
所述信息处理模块,用于当确定所述待编码视频中编码帧组为第一帧组类型时,确定所述待分析视频片段的当前编码单元和参考编码单元的纹理差异参数;
所述信息处理模块,用于基于所述当前编码单元和参考编码单元的纹理差异参数,确定与所述待编码视频相匹配的编码决策;
所述信息处理模块,用于通过所确定的编码决策对待编码视频进行处理,以实现对所述待编码视频的编码。
12.一种多媒体信息处理装置,其特征在于,所述多媒体信息处理装置包括:
信息分离装置,用于从多媒体信息中分离出目标音频和目标视频;
视频处理装置,用于确定与所述目标视频相匹配的编码决策;
所述视频处理装置,根据所述编码决策确定相对应的编码决策;
所述视频处理装置,用于通过所确定的编码方式对所述目标视频进行处理,以实现对所述目标视频的编码;
所述视频处理装置,用于将经过编码处理的所述目标视频和所述目标音频封装为新的多媒体信息,以实现对所述多媒体信息的压缩。
13.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于运行所述存储器存储的可执行指令时,实现权利要求1至10任一项所述的视频信息处理方法。
14.一种计算机可读存储介质,存储有可执行指令,其特征在于,所述可执行指令被处理器执行时实现权利要求1至10任一项所述的视频信息处理方法。
CN202110298455.6A 2021-03-19 2021-03-19 视频信息处理方法、多媒体信息处理方法及装置 Pending CN113709461A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110298455.6A CN113709461A (zh) 2021-03-19 2021-03-19 视频信息处理方法、多媒体信息处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110298455.6A CN113709461A (zh) 2021-03-19 2021-03-19 视频信息处理方法、多媒体信息处理方法及装置

Publications (1)

Publication Number Publication Date
CN113709461A true CN113709461A (zh) 2021-11-26

Family

ID=78647845

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110298455.6A Pending CN113709461A (zh) 2021-03-19 2021-03-19 视频信息处理方法、多媒体信息处理方法及装置

Country Status (1)

Country Link
CN (1) CN113709461A (zh)

Similar Documents

Publication Publication Date Title
US20200304508A1 (en) Method and device for providing authentication in network-based media processing (nbmp) system
CN105915953B (zh) 直播视频鉴别的方法、装置、系统、服务器和存储介质
CN111787319B (zh) 一种视频信息处理方法、多媒体信息处理方法及装置
CN111294591B (zh) 视频信息处理方法、多媒体信息处理方法、装置
US10516903B2 (en) Method and apparatus for transmitting video data
WO2015120766A1 (zh) 一种视频优化系统及方法
CN110113306B (zh) 分发数据的方法和网络设备
US20170155712A1 (en) Method and device for updating cache data
US20230023369A1 (en) Video processing method, video processing apparatus, smart device, and storage medium
WO2024169391A1 (zh) 一种视频数据处理方法、装置、计算机设备以及存储介质
US20230082784A1 (en) Point cloud encoding and decoding method and apparatus, computer-readable medium, and electronic device
CN111294592B (zh) 视频信息处理方法、多媒体信息处理方法、装置
KR20230144620A (ko) 포인트 클라우드 인코딩 및 디코딩 방법, 포인트 클라우드 인코딩 및 디코딩 장치, 컴퓨터로 판독 가능한 매체, 그리고 전자 디바이스
US20230396783A1 (en) Data processing method and apparatus, device, and readable storage medium
KR102296987B1 (ko) 기계 학습 모델에 기초한 블록 체인을 이용한 hevc 분산형 복호화 방법, 장치 및 시스템
CN113709461A (zh) 视频信息处理方法、多媒体信息处理方法及装置
CN113192520B (zh) 一种音频信息处理方法、装置、电子设备及存储介质
US20240184632A1 (en) A method and apparatus for enhanced task grouping
CN112788341B (zh) 视频信息处理方法、多媒体信息处理方法、装置及电子设备
US20190227866A1 (en) Information processing device and method
KR102615305B1 (ko) Vmi 화면공유 방법 및 장치
Yasakethu et al. Efficient decoding algorithm for 3D video over wireless channels
WO2020188421A1 (en) Low delay content disarm and reconstruction (cdr) of live streaming video
US20240172046A1 (en) System and method for selectively increasing the reliability of select packets in a data network
CN115086730B (zh) 签约视频生成方法、系统、计算机设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination