CN107241598A - 一种针对多路h.264视频会议的GPU解码方法 - Google Patents

一种针对多路h.264视频会议的GPU解码方法 Download PDF

Info

Publication number
CN107241598A
CN107241598A CN201710513916.0A CN201710513916A CN107241598A CN 107241598 A CN107241598 A CN 107241598A CN 201710513916 A CN201710513916 A CN 201710513916A CN 107241598 A CN107241598 A CN 107241598A
Authority
CN
China
Prior art keywords
gpu
decoding
video
multichannel
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710513916.0A
Other languages
English (en)
Other versions
CN107241598B (zh
Inventor
周倩
龙姣
张昊
金海�
唐琪
潘永红
罗林
雷磊
张家树
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Power Grid Co Ltd
Original Assignee
Guizhou Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou Power Grid Co Ltd filed Critical Guizhou Power Grid Co Ltd
Priority to CN201710513916.0A priority Critical patent/CN107241598B/zh
Publication of CN107241598A publication Critical patent/CN107241598A/zh
Application granted granted Critical
Publication of CN107241598B publication Critical patent/CN107241598B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种针对多路h.264视频会议的GPU解码方法,包括以下步骤:S1:通过各分会场MCU输入多路视频会议流;S2:依据视频流中的IP信息区分每个会场;S3:采用CPU和GPU主从线程的协作方式对每个会场分别进行解码;S4:将解码之后的数据储存在服务器上;S5:针对客户端的请求对解码的数据重编码,传输到客户端;S6:客户端显示服务器发送的统计信息以及视频流。本发明解决了多个会场同时开会时,多路视频码流实时传输、解码、播放的问题,取缔CPU和GPU互相等待的状态,实现CPU和GPU的同时并行工作,并对解码之后的图像重新编码,并且存储,使之能够在客户端进行播放,从而拓展了易用性和功能性,具有较高的推广应用价值。

Description

一种针对多路h.264视频会议的GPU解码方法
技术领域
本发明涉及视频会议技术领域,特别涉及一种针对多路h.264视频会议的GPU解码方法。
背景技术
由ITU-T与IOS/IEC两大国际标准化组织于2003年共同提出的H.264视频编解码标准是当今视频压缩领域中压缩性能最优的实用视频编解码标准。与以前的国际标准如H.263和MPEG-4相比,最大的优势体现在以下四个方面:1.将每个视频帧分离成由像素组成的块,因此视频帧的编码处理的过程可以达到块的级别;2.采用空间冗余的方法,对视频帧的一些原始块进行空间预测、转换、优化和熵编码(可变长编码);3.对连续帧的不同块采用临时存放的方法,这样,只需对连续帧中有改变的部分进行编码。该算法采用运动预测和运动补偿来完成。对某些特定的块,在一个或多个已经进行了编码的帧执行搜索来决定块的运动向量,并由此在后面的编码和解码中预测主块;4.采用剩余空间冗余技术,对视频帧里的残留块进行编码。例如:对于源块和相应预测块的不同,再次采用转换、优化和熵编码。
H.264编解码算法性能的改善是以算法复杂度的提高为代价的,如何在不影响解码图像质量的前提下提高解码效率,是众多学者共同的研究方向。
近年来,图形处理器(Graphic Process Unit,GPU)的快速发展使得其逐步用于通用计算。NVidia于2007年推出的统一计算设备架构(Computed Unified DeviceArchitecture,CUDA)为通用计算提供了良好的软硬件开发环境。
对高清视频进行编解码过程中运算量庞大,不符合众多实时编解码应用的需要。国内外学者们尝试在不同的处理器上使用相应的多媒体扩展指令集来提高编解码速度。如英特尔针对奔腾系列处理器提供的MMX/SSE指令集,将具备SIMD处理机制的CPU用于视频编解码,取得了一定的加速效果,但是由于CPU超高负荷运转的问题没有解决,所以系统整理的利用率仍然不高。另有一些研宄人员使用DSP芯片、以及等硬件电路来实现视频编解码的加速,部分实验取得了不错的效果,但是由于硬件设备价格昂贵等原因,不能推广使用。
有鉴于此,有必要提出一种新的方法来解决多路实时视频流解码速度提升的问题。
发明内容
有鉴于此,本发明的目的是提供一种针对多路h.264视频会议的GPU解码方法。可有效地提高多路视频流的解码速度,达到实时的效果。
为实现上述发明目的,本发明提供了一种基于GPU的多路h.264视频实时解码方法,所述方法包括以下步骤:
S1:通过各分会场MCU输入多路视频会议流;
S2:依据视频流中的IP信息区分每个会场;
S3:采用CPU和GPU主从线程的协作方式对每个会场分别进行解码,并行的多路对视频流进行解封包、解码。
S4:将解码之后的数据储存在服务器上便于以后查看。
S5:针对客户端的请求对解码的数据重编码,并通过网络传输到客户端。
S6:客户端显示服务器发送的统计信息以及视频流。
进一步,所述步骤S3中,将CPU和GPU设计成主从线程的协作方式,取缔CPU和GPU互相等待的状态,实现CPU和GPU的同时并行工作。
进一步,所述步骤S3中,在传统解码器的基础上采用主机端和设备端协同工作的并行解码器架构,对H.264串行解码器各模块进行任务划分,其中将解析出的供后续模块使用的参数以及残差数据经过PCI-E总线传输给设备端,CPU负责从网络提取层中获取经压缩的码流,并对其进行码流分析、熵解码、重排序工作;GPU负责反变换、反量化、帧内预测、帧间预测以及环路滤波模块的并行实现。
进一步,所述步骤S3中,采用整帧图像并行的方法实现帧内编码过程,将模式选择过程与帧内预测编码过程中计算过程分开。
进一步,所述步骤S3中,在H.264视频编码的预测编码过程中,预测编码是以宏块为单位进行的,而宏块之间预测过程中利用相邻宏块的信息,帧内预测过程中利用相邻块的重建图像来预测当前块。
进一步,所述步骤S3中,整帧图像并行的帧内预测过程实现的步骤如下:(1)根据原始帧数据来计算预测帧的最佳4x4帧内预测模式,记录每个子宏块的最佳预测模式和代价cost_sub_4;(2)将每个宏块的16个cost__sub_4求和得到cost_4;(3)计算所有宏块的16x16宏内预测模式,并保存最佳预测模式及代价cost_16;(4)比较cost_4和cost_16的大小,保存宏块的最佳预测模式,并在共享内存中读取最佳的宏块预测编码值;(5)根据得到的最佳预测模式进行帧内预测编码。
进一步,所述步骤S3中,因为同一时刻会有多路码流同时到达解码端,通过下述方法协调多路码流的进入顺序,以使解码系统能够正常工作,具体是通过GPU轮询系统发出第i路码流的请求,视频网核心交换机进行应答,并发送相应的码流数据,再由轮询系统输出码流数据,并对码流数据进行检测。
进一步,所述步骤S5中,采用服务器与客户端交互的方式来完成视频的传输,根据客户端请求的不同采用多路解码之后对其中某一路单独编码的方式。
进一步,所述步骤S1中,通过摄像机获取各个分会场的视频会议的视频流,摄像机所处位置位于会场斜上方。
进一步,所述步骤S3中,GPU视频解码利用Direct3D、OpenGL和/或CUDA实现解码器中的运动补偿和可视化显示。
本发明的有益效果是:
本发明的多路h.264视频会议的GPU解码方法,能够对同时开会的多个会场的多路视频进行解码,实现了视频会议自动化,主要解决多个会场同时开会时,多路视频码流实时传输、解码、播放的问题,本发明针对每一路的h.264视频码流将CPU和GPU设计成主从线程的协作方式,取缔CPU和GPU互相等待的状态,实现CPU和GPU的同时并行工作,并对解码之后的图像重新编码,并且存储,使之能够在客户端进行播放,从而拓展了易用性和功能性,本发明可节省人力资源成本,提升了效率,具有较高的推广应用价值。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书和权利要求书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步的详细描述,其中:
图1为本发明一种针对多路h.264视频会议的GPU解码方法;
图2为GPU轮询工作系统运作流程示意图;
图3为本发明中CPU和GPU主从线程的协作方式示意图;
图4为GPU解码流程示意图;
图5为整帧图像并行的帧内预测编码流程。
具体实施方式
以下将参照附图,对本发明的优选实施例进行详细的描述。应当理解,优选实施例仅为了说明本发明,而不是为了限制本发明的保护范围。
下面结合附图所示的各实施方式对本发明进行详细说明。
请参图1所示,图1为本发明一种针对多路h.264视频会议的GPU解码方法的具体实施方式中的流程示意图。该方法包括如下步骤:
步骤S1:通过各分会场MCU输入多路视频会议流;
具体采用对应的视频会议的摄像机(一般位于视频会议会场正前方偏上方45度),将采集到的视频流通过H.264编码通过IP镜像的形式发送到服务器端。
步骤S2:依据视频流中的IP信息区分每个会场;
对接受到的IP报文进行解包后,根据IP地址的不同确定具体正在开会的会场。考虑到实时轮询系统的需求,同一时刻会有多路码流同时到达解码端,因此必须协调多路码流的进入顺序,以使解码系统能够正常工作。为此设计了如图2所示的GPU实时轮询系统。首先需要在GPU实时轮询系统与视频网核心交换机之间建立握手协议。完成三次握手,客户端与服务器便建立了握手协议。之后GPU轮询系统发出第i路码流的请求,视频网核心交换机进行应答,并发送相应的码流数据。再由轮询系统输出码流数据,并对码流数据进行检测。在实际的H264数据帧中,往往帧前面带有00 00 00 01或00 00 01分隔符,因此只需检测start code就能得到每一帧的网络提取层(NAL)单元。
步骤S3:采用CPU和GPU主从线程的协作方式对每个会场分别进行解码,并行的多路对视频流进行解封包、解码;
GPU的优势是利用最短的时间完成大量的并行运算,但是数据在主设端之间进行传输时,会花费许多额外的开销。如果进行过多的数据交换,将会大大降低解码所用的时间。另外,在原有的h.264的解码标准中,许多过程都是针对串行CPU设计的。本发明考虑将CPU和GPU设计成主从线程的协作方式,取缔CPU和GPU互相等待的状态,实现CPU和GPU的同时并行工作。如图3所示,GPU在处理第N帧的模块时,CPU同时解析第N+1帧的数据,充分利用碎片时间,达到更高的处理效率。
作为进一步的改进,该解码过程中,在传统解码器的基础上采用主机端和设备端协同工作的并行解码器架构,对H.264串行解码器各模块进行任务划分。其中,将解析出的供后续模块使用的参数以及残差数据经过PCI-E总线传输给设备端CPU主要负责从网络提取层中获取经压缩的码流,并对其进行码流分析、熵解码、重排序工作;GPU主要负责反变换、反量化、帧内预测、帧间预测以及环路滤波模块的并行实现。在整个解码过程中,CPU和GPU形成主从线程的并行执行,避免了主设端的任务等待,时间和空间资源得到了充分利用。CPU主要负贵逻辑控制复杂的部分,包括码流读取、码流分析、熵解码及重排序模块;GPU主要负责数据密集度高且独立性强的模块,包括帧内预测、帧间预测、变换解码和环路滤波,本发明采用模块内并行执行、模块间串行执行的设计,尽量减少主机端与设备端的数据传输,降低解码总耗。解码框架及主设端任务分配如图4所示。
其中步骤S3采用整帧图像并行的方法实现帧内编码过程,将模式选择过程与帧内预测编码过程中计算过程分开。模式选择过程根据原始帧的数据进行选择,这样可以所有宏块同时并行执行,提高并行粒度,而后面的过程仍然是按照之前H.264视频编码标准中的过程进行。而大量的实验表明,在量化参数QP不大的情况下,使用原始帧数据代替重构帧来进行模式选择,计算过程中的并行粒度会大幅度提升,由于帧内预测模式的选择使用的是原始数据,这种预测编码方式可能会造成图像质量的下降,这种图像质量的损失在普通人可以接受的范围之内,并不影响肉眼的感官。
步骤S3中,在H.264视频编码的预测编码过程中,预测编码是以宏块为单位进行的,而宏块之间预测过程中需要利用相邻宏块的信息,帧内预测过程中需要利用相邻块的重建图像来预测当前块。如果不釆取这种方式,会导致最后编解码不一致的情形,从而产生编码错误的问题,而GPU的优势是高并发性,不相关数据之间的多线程并发,很显然如果无法解决这些问题,就无法利用GPU的计算优势,很难有加速的效果。
步骤S3中,整帧图像并行的帧内预测过程实现的步骤如下:(1)根据原始帧数据来计算预测帧的最佳4x4帧内预测模式,记录每个子宏块的最佳预测模式和代价cost_sub_4,此过程中可以做到所有的子宏块同时并行执行,并行粒度可以达到(width/4)*(height/4;);1080P高清视频的并行粒度为30560;(2)将每个宏块的16个cost__sub_4求和得到cost_4;(3)计算所有宏块的16x16宏内预测模式,并保存最佳预测模式及代价cost_16,此过程是可以达到所有宏块并行,并行粒度为(width/16)*(height/16),1080P高清视频的并行粒度为8160;(4)比较cost_4和cost_16的大小,保存宏块的最佳预测模式,并在共享内存中读取最佳的宏块预测编码值;(5)根据得到的最佳预测模式进行帧内预测编码,此编码过程采用行波流水法进行帧内预测,之后是DCT变换、量化与反量化、反DCT变换过程,在此过中,1080P高清视频最多可以设置68个block并行,通过120层循环完成对整帧数据的帧内预测编码过程。具体的流程图如图5所示。
步骤S4:解码之后的数据储存在服务器上便于以后查看,本实施例中,会议视频按照日期存储于服务器上,数据的存储采用H.264裸流文件进行存储,这样的存储方式有两个优点,一方面有效地节省了存储空间,相对于解码完成的YUV原始视频数据而言,同一场会议的H.264裸流文件能够节约大约70%的空间,另一方面,H.264裸流文件能够在客户端请求观看的时候快速的通过网络从服务器传输到客户端,而不需要重新编码,降低了服务器整体的消耗。
步骤S5:针对客户端的请求对解码的数据重编码,由于实时的需求,H.264编码的过程中不能出现B帧,防止由于B帧对后续视频帧引用而造成的视频解码延迟,整个视频流主要由I帧和P帧组成,通过编码器按照固定的分辨率传输到客户端。
步骤S6:客户端对服务器发送的视频流进行解码并且实时显示在桌面上。
本发明的方法主要包括:对多路来自下方地区局会场的MCU的视频流数据经过滤筛选之后,通过GPU多线程对每一路视频流进行解封包、解码,将解码之后数据按照日期储存在视频服务器上,并与客户端发出的请求互动,在客户端请求某一路的视频数据之后,对该路视频流重新编码,以使视频流数据能够在客户端进行播放。该方法主要解决多个会场同时开会时,多路视频码流实时传输、解码、播放的问题,针对每一路的h.264视频码流将CPU和GPU设计成主从线程的协作方式,取缔CPU和GPU互相等待的状态,实现CPU和GPU的同时并行工作,并对解码之后的图像重新编码,并且存储,使之能够在客户端进行播放。本方法解决了多个会场同时开会时,多路视频码流实时传输、解码、播放的问题,取缔CPU和GPU互相等待的状态,实现CPU和GPU的同时并行工作,提升了效率,具有较高的推广应用价值。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (10)

1.一种针对多路h.264视频会议的GPU解码方法,其特征在于,该方法包括以下步骤:
S1:通过各分会场MCU输入多路视频会议流;
S2:依据视频流中的IP信息区分每个会场;
S3:采用CPU和GPU主从线程的协作方式对每个会场分别进行解码,并行的多路对视频流进行解封包、解码。
S4:将解码之后的数据储存在服务器上便于以后查看。
S5:针对客户端的请求对解码的数据重编码,并通过网络传输到客户端。
S6:客户端显示服务器发送的统计信息以及视频流。
2.如权利要求1所述的一种针对多路h.264视频会议的GPU解码方法,其特征在于:所述步骤S3中,将CPU和GPU设计成主从线程的协作方式,取缔CPU和GPU互相等待的状态,实现CPU和GPU的同时并行工作。
3.如权利要求2所述一种针对多路h.264视频会议的GPU解码方法,其特征在于:所述步骤S3中,在传统解码器的基础上采用主机端和设备端协同工作的并行解码器架构,对H.264串行解码器各模块进行任务划分,其中将解析出的供后续模块使用的参数以及残差数据经过PCI-E总线传输给设备端,CPU负责从网络提取层中获取经压缩的码流,并对其进行码流分析、熵解码、重排序工作;GPU负责反变换、反量化、帧内预测、帧间预测以及环路滤波模块的并行实现。
4.如权利要求1所述一种针对多路h.264视频会议的GPU解码方法,其特征在于:所述步骤S3中,采用整帧图像并行的方法实现帧内编码过程,将模式选择过程与帧内预测编码过程中计算过程分开。
5.如权利要求4所述一种针对多路h.264视频会议的GPU解码方法,其特征在于:所述步骤S3中,在H.264视频编码的预测编码过程中,预测编码是以宏块为单位进行的,而宏块之间预测过程中利用相邻宏块的信息,帧内预测过程中利用相邻块的重建图像来预测当前块。
6.如权利要求5所述一种针对多路h.264视频会议的GPU解码方法,其特征在于:所述步骤S3中,整帧图像并行的帧内预测过程实现的步骤如下:(1)根据原始帧数据来计算预测帧的最佳4x4帧内预测模式,记录每个子宏块的最佳预测模式和代价cost_sub_4;(2)将每个宏块的16个cost__sub_4求和得到cost_4;(3)计算所有宏块的16x16宏内预测模式,并保存最佳预测模式及代价cost_16;(4)比较cost_4和cost_16的大小,保存宏块的最佳预测模式,并在共享内存中读取最佳的宏块预测编码值;(5)根据得到的最佳预测模式进行帧内预测编码。
7.如权利要求1所述一种针对多路h.264视频会议的GPU解码方法,其特征在于:所述步骤S3中,因为同一时刻会有多路码流同时到达解码端,通过GPU实时轮询协调多路码流的进入顺序,以使解码系统能够正常工作,所述GPU实时轮询是通过GPU轮询系统发出第i路码流的请求,视频网核心交换机进行应答,并发送相应的码流数据,再由轮询系统输出码流数据,并对码流数据进行检测。
8.如权利要求1所述一种针对多路h.264视频会议的GPU解码方法,其特征在于:所述步骤S5中,采用服务器与客户端交互的方式来完成视频的传输,根据客户端请求的不同采用多路解码之后对其中某一路单独编码的方式。
9.如权利要求1所述一种针对多路h.264视频会议的GPU解码方法,其特征在于:所述步骤S1中,通过摄像机获取各个分会场的视频会议的视频流,摄像机所处位置位于会场斜上方。
10.如权利要求1所述一种针对多路h.264视频会议的GPU解码方法,其特征在于:所述步骤S3中,GPU视频解码利用Direct3D、OpenGL和/或CUDA实现解码器中的运动补偿和可视化显示。
CN201710513916.0A 2017-06-29 2017-06-29 一种针对多路h.264视频会议的GPU解码方法 Active CN107241598B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710513916.0A CN107241598B (zh) 2017-06-29 2017-06-29 一种针对多路h.264视频会议的GPU解码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710513916.0A CN107241598B (zh) 2017-06-29 2017-06-29 一种针对多路h.264视频会议的GPU解码方法

Publications (2)

Publication Number Publication Date
CN107241598A true CN107241598A (zh) 2017-10-10
CN107241598B CN107241598B (zh) 2020-03-24

Family

ID=59990137

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710513916.0A Active CN107241598B (zh) 2017-06-29 2017-06-29 一种针对多路h.264视频会议的GPU解码方法

Country Status (1)

Country Link
CN (1) CN107241598B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107809643A (zh) * 2017-11-13 2018-03-16 郑州云海信息技术有限公司 一种图像的解码方法、装置及介质
CN108234924A (zh) * 2018-02-02 2018-06-29 北京百度网讯科技有限公司 视频混流方法、装置、设备及计算机可读介质
CN111435995A (zh) * 2019-01-15 2020-07-21 北京字节跳动网络技术有限公司 用于生成动态图片的方法、装置和系统
CN112073810A (zh) * 2020-11-16 2020-12-11 全时云商务服务股份有限公司 一种多布局的云会议录制方法、系统和可读存储介质
WO2021008290A1 (zh) * 2019-07-15 2021-01-21 腾讯科技(深圳)有限公司 视频流解码方法、装置、终端设备及存储介质
CN112311734A (zh) * 2019-07-30 2021-02-02 杭州海康威视数字技术股份有限公司 一种多路视频的图像特征提取方法、电子设备及存储介质
CN112817913A (zh) * 2021-04-19 2021-05-18 浙江华创视讯科技有限公司 数据传输方法、装置、电子设备及存储介质
CN113873345A (zh) * 2021-09-27 2021-12-31 中国电子科技集团公司第二十八研究所 一种分布式的超高清视频同步处理方法
CN114640854A (zh) * 2022-03-09 2022-06-17 广西高重厚泽科技有限公司 一种多路视频流实时高速解码方法
CN115150639A (zh) * 2022-09-01 2022-10-04 北京蔚领时代科技有限公司 一种基于分散编码器的抗弱网方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1400541A (zh) * 2002-08-20 2003-03-05 西安交通大学 基于ip网的多媒体实时授课系统
CN101370114A (zh) * 2008-09-28 2009-02-18 深圳华为通信技术有限公司 视频及音频处理方法、多点控制单元和视频会议系统
CN101969561A (zh) * 2010-10-27 2011-02-09 北京中星微电子有限公司 一种帧内模式选取方法、装置及一种编码器
CN102325246A (zh) * 2011-10-18 2012-01-18 Tcl集团股份有限公司 一种视频会议系统、视频会议服务器及移动通信终端
CN102480618A (zh) * 2010-11-24 2012-05-30 中国电信股份有限公司 实现h264视频编码格式播放优化的方法及系统
US8213518B1 (en) * 2006-10-31 2012-07-03 Sony Computer Entertainment Inc. Multi-threaded streaming data decoding
US20120236940A1 (en) * 2011-03-16 2012-09-20 Texas Instruments Incorporated Method for Efficient Parallel Processing for Real-Time Video Coding
CN103747250A (zh) * 2013-12-28 2014-04-23 华中科技大学 一种H.264/AVC中4x4子宏块的并行帧内预测方法
CN103888713A (zh) * 2014-02-25 2014-06-25 广州市保伦电子有限公司 视频会议通讯方法
CN105491377A (zh) * 2015-12-15 2016-04-13 华中科技大学 一种计算复杂度感知的视频解码宏块级并行调度方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1400541A (zh) * 2002-08-20 2003-03-05 西安交通大学 基于ip网的多媒体实时授课系统
US8213518B1 (en) * 2006-10-31 2012-07-03 Sony Computer Entertainment Inc. Multi-threaded streaming data decoding
CN101370114A (zh) * 2008-09-28 2009-02-18 深圳华为通信技术有限公司 视频及音频处理方法、多点控制单元和视频会议系统
CN101969561A (zh) * 2010-10-27 2011-02-09 北京中星微电子有限公司 一种帧内模式选取方法、装置及一种编码器
CN102480618A (zh) * 2010-11-24 2012-05-30 中国电信股份有限公司 实现h264视频编码格式播放优化的方法及系统
US20120236940A1 (en) * 2011-03-16 2012-09-20 Texas Instruments Incorporated Method for Efficient Parallel Processing for Real-Time Video Coding
CN102325246A (zh) * 2011-10-18 2012-01-18 Tcl集团股份有限公司 一种视频会议系统、视频会议服务器及移动通信终端
CN103747250A (zh) * 2013-12-28 2014-04-23 华中科技大学 一种H.264/AVC中4x4子宏块的并行帧内预测方法
CN103888713A (zh) * 2014-02-25 2014-06-25 广州市保伦电子有限公司 视频会议通讯方法
CN105491377A (zh) * 2015-12-15 2016-04-13 华中科技大学 一种计算复杂度感知的视频解码宏块级并行调度方法

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107809643B (zh) * 2017-11-13 2020-11-20 苏州浪潮智能科技有限公司 一种图像的解码方法、装置及介质
CN107809643A (zh) * 2017-11-13 2018-03-16 郑州云海信息技术有限公司 一种图像的解码方法、装置及介质
CN108234924A (zh) * 2018-02-02 2018-06-29 北京百度网讯科技有限公司 视频混流方法、装置、设备及计算机可读介质
CN108234924B (zh) * 2018-02-02 2019-02-19 北京百度网讯科技有限公司 视频混流方法、装置、设备及计算机可读介质
CN111435995A (zh) * 2019-01-15 2020-07-21 北京字节跳动网络技术有限公司 用于生成动态图片的方法、装置和系统
WO2021008290A1 (zh) * 2019-07-15 2021-01-21 腾讯科技(深圳)有限公司 视频流解码方法、装置、终端设备及存储介质
CN112311734A (zh) * 2019-07-30 2021-02-02 杭州海康威视数字技术股份有限公司 一种多路视频的图像特征提取方法、电子设备及存储介质
CN112311734B (zh) * 2019-07-30 2022-09-02 杭州海康威视数字技术股份有限公司 一种多路视频的图像特征提取方法、电子设备及存储介质
CN112073810B (zh) * 2020-11-16 2021-02-02 全时云商务服务股份有限公司 一种多布局的云会议录制方法、系统和可读存储介质
CN112073810A (zh) * 2020-11-16 2020-12-11 全时云商务服务股份有限公司 一种多布局的云会议录制方法、系统和可读存储介质
CN112817913A (zh) * 2021-04-19 2021-05-18 浙江华创视讯科技有限公司 数据传输方法、装置、电子设备及存储介质
CN112817913B (zh) * 2021-04-19 2021-07-09 浙江华创视讯科技有限公司 数据传输方法、装置、电子设备及存储介质
CN113873345A (zh) * 2021-09-27 2021-12-31 中国电子科技集团公司第二十八研究所 一种分布式的超高清视频同步处理方法
CN113873345B (zh) * 2021-09-27 2023-11-14 中国电子科技集团公司第二十八研究所 一种分布式的超高清视频同步处理方法
CN114640854A (zh) * 2022-03-09 2022-06-17 广西高重厚泽科技有限公司 一种多路视频流实时高速解码方法
CN115150639A (zh) * 2022-09-01 2022-10-04 北京蔚领时代科技有限公司 一种基于分散编码器的抗弱网方法及装置

Also Published As

Publication number Publication date
CN107241598B (zh) 2020-03-24

Similar Documents

Publication Publication Date Title
CN107241598A (zh) 一种针对多路h.264视频会议的GPU解码方法
CN111405283B (zh) 基于深度学习的端到端视频压缩方法、系统及存储介质
WO2020083403A1 (zh) 图像预测方法及装置
WO2020140700A1 (zh) 色度块的预测方法和装置
CN107277505B (zh) 基于软硬件分区的avs-2视频解码器装置
WO2018067294A1 (en) Browser-based video decoder using multiple cpu threads
CN105163127A (zh) 视频分析方法及装置
CN1306822C (zh) 一种基于软硬件协同控制的视频解码器
CN110337002B (zh) 一种在多核处理器平台上hevc多层次并行解码方法
CN111741299B (zh) 帧内预测模式的选择方法、装置、设备及存储介质
WO2020038378A1 (zh) 色度块预测方法及装置
US8090028B2 (en) Video deblocking memory utilization
US20050259887A1 (en) Video deblocking method and apparatus
CN102595137B (zh) 基于图像像素块行/列流水线的快速模式判决装置和方法
CN116912385B (zh) 视频帧自适应渲染处理方法、计算机装置及存储介质
CN101426139B (zh) 图像压缩装置
CN105100799A (zh) 一种减少hevc编码器中帧内编码时延的方法
Jiang et al. GPU-based intra decompression for 8K real-time AVS3 decoder
Jiang et al. Highly paralleled low-cost embedded HEVC video encoder on TI KeyStone multicore DSP
CN108965814A (zh) 一种基于cuda加速技术的视频混合解码渲染方法
CN112422983B (zh) 通用多核并行解码器系统及其应用
CN104602026B (zh) 一种适用于hevc标准下编码器中全复用的重建环路结构
CN104519360B (zh) 一种基于hevc的压缩方法
CN103260019B (zh) 帧内图像预测编解码方法及视频编解码器
Rintaluoma et al. SIMD performance in software based mobile video coding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant