CN111372084B - 面向神经网络编解码工具的并行推理方法及系统 - Google Patents

面向神经网络编解码工具的并行推理方法及系统 Download PDF

Info

Publication number
CN111372084B
CN111372084B CN202010100106.4A CN202010100106A CN111372084B CN 111372084 B CN111372084 B CN 111372084B CN 202010100106 A CN202010100106 A CN 202010100106A CN 111372084 B CN111372084 B CN 111372084B
Authority
CN
China
Prior art keywords
image
neural network
tensors
size
boundary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010100106.4A
Other languages
English (en)
Other versions
CN111372084A (zh
Inventor
马思伟
林凯
贾川民
王苫社
赵政辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202010100106.4A priority Critical patent/CN111372084B/zh
Publication of CN111372084A publication Critical patent/CN111372084A/zh
Application granted granted Critical
Publication of CN111372084B publication Critical patent/CN111372084B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种面向神经网络编解码工具的并行推理方法,包括:对待处理的图像进行边界扩充,得到边界完整的图像;根据光栅扫描顺序将所述边界完整的图像划分成大小相同的图像块;将所述大小相同的图像块组织成若干个张量,并将所述若干个张量作为一组张量同时送入神经网络中进行前向传播处理,其中,根据神经网络编码工具以及硬件显存大小设置所述张量的批尺寸值。通过上述方法,可以有效减少神经网络推理时的显存,降低神经网络视频编码工具的编解码复杂度。

Description

面向神经网络编解码工具的并行推理方法及系统
技术领域
本发明涉及数字信号处理技术领域,特别涉及一种面向神经网络编解码工具的并行推理方法及系统。
背景技术
深度学习在传统计算机视觉任务上不断取得突破,环路滤波作为底层的计算机视觉任务,十分适合用深度学习处理,神经网络具有强大的非线性拟合能力,对于视频编码后产生的块效应、振铃效应等有较好的抑制作用。
现有技术中,已有许多针对AVS3,VVC,HEVC等主流视频编码标准的神经网络环路滤波工作。但是一方面神经网络模型计算量通常较大,直接嵌入视频编解码器中导致复杂度成倍增长,另一方面对于大分辨率(4K)的视频序列,由于显存大小的限制,无法整帧进行网络推理。
发明内容
本公开实施例提供了一种面向神经网络编解码工具的并行推理方法及系统。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
在一些可选地实施例中,一种面向神经网络编解码工具的并行推理方法,包括:
对待处理的图像进行边界扩充,得到边界完整的图像;
根据光栅扫描顺序将边界完整的图像划分成大小相同的图像块;
将大小相同的图像块组织成若干个张量,并将若干个张量作为一组张量同时送入神经网络中进行前向传播处理,其中,根据神经网络编码工具以及硬件显存大小设置张量的批尺寸值。
进一步地,对待处理的图像进行边界扩充,包括:
使用边界像素对待处理的图像进行镜像扩充;
使用边界像素对待处理的图像进行反射扩充。
进一步地,根据光栅扫描顺序将边界完整的图像划分成大小相同的图像块,包括:
所述图像块的大小可以任意设定;
所述图像块的大小可以与深度学习编码工具中率失真优化决策的块大小一致。
进一步地,将大小相同的图像块组织成若干个张量,包括:
将所述大小相同的图像块放入张量中;
与率失真优化结合,解码端当该图像块的率失真决策结果为真时,将该图像块放入张量中。
进一步地,还包括:
当剩余图像块数量少于设置的张量的批尺寸值时,将剩余图像块组织成一组张量。
进一步地,对待处理的图像进行边界扩充之前,还包括:
获取待处理的图像。
在一些可选地实施例中,一种面向神经网络编解码工具的并行推理装置,包括:
扩充模块,用于对待处理的图像进行边界扩充,得到边界完整的图像;
划分模块,用于根据光栅扫描顺序将边界完整的图像划分成大小相同的图像块;
组织模块,用于将大小相同的图像块组织成若干个张量,并将若干个张量作为一组张量同时送入神经网络中进行前向传播处理,其中,根据神经网络编码工具以及硬件显存大小设置张量的批尺寸值。
进一步地,扩充模块,包括:
第一扩充单元,用于使用边界像素对待处理的图像进行镜像扩充;
第二扩充单元,用于使用边界像素对待处理的图像进行反射扩充。
在一些可选地实施例中,一种面向神经网络编解码工具的并行推理系统,包括:
一个或多个处理器、存储一个或多个程序的存储装置;
当一个或多个程序被一个或多个处理器执行时,一个或多个处理器实现上述实施例提供的一种面向神经网络编解码工具的并行推理方法。
在一些可选地实施例中,一种计算机可读存储介质,其上存储有计算机程序,其特征在于,计算机程序被处理器执行时,实现上述实施例提供的一种面向神经网络编解码工具的并行推理方法。
本公开实施例提供的技术方案可以包括以下有益效果:
本发明提供了一种面向神经网络编解码工具的并行推理方法,首先将神经网络编码工具待处理的输入图像扩展边界后划分成尺寸相同的图像块,其次将相同大小的若干个图像块堆叠成一个批次并行进行神经网络推理。通过根据神经网络编码工具以及硬件显存大小灵活的设置每个批次的图像块数量,可以发挥硬件的并行推理能力,降低神经网络嵌入视频解码器中编解码复杂度。即使对于大分辨率(4K)的视频序列,本发明也可以不受显存大小的限制进行网络推理。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种面向神经网络编解码工具的并行推理方法的流程示意图;
图2是根据一示例性实施例示出的一种不同并行批尺寸值的解码复杂度示意图;
图3是根据一示例性实施例示出的一种面向神经网络编解码工具的并行推理装置的结构示意图;
图4是根据一示例性实施例示出的一种面向神经网络编解码工具的并行推理系统的结构示意图。
具体实施方式
为了能够更加详尽地了解本公开实施例的特点与技术内容,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或一个以上实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。
图1是根据一示例性实施例示出的一种面向神经网络编解码工具的并行推理方法的流程示意图;
在一些可选地实施例中,一种面向神经网络编解码工具的并行推理方法,包括:
S101、对待处理的图像进行边界扩充,得到边界完整的图像;
通常,为了避免边界像素的数量不足划分模块中的图像块大小,首先将待输入神经网络的图像进行边界扩充,在对待处理的图像进行边界扩充之前,还包括,获取待处理的图像,然后对待处理的输入图像进行边界扩充,得到边界完整的图像。
具体地,在对输入的图像进行边界扩充时,扩充使用的像素为最边界处的像素,可以使用边界像素对待处理的图像进行镜像扩充,也可以使用边界像素对待处理的图像进行反射扩充。
通过上述方法,对待输入神经网络的图像进行边界扩充,可以保证边界像素的数量满足划分模块的要求。
S102、根据光栅扫描顺序将边界完整的图像划分成大小相同的图像块;
通常,对图像的边界进行扩充后,根据光栅扫描顺序将扩充完成的图像划分成大小相同的图像块,其中,图像块的大小任意,当其与深度学习编码工具中率失真优化决策的块大小一致时,可以进一步降低解码复杂度。
在嵌入编解码器时,基于神经网络的环路滤波等编码工具往往与率失真优化相结合。通过将图像块的大小与深度学习编码工具中率失真优化决策的块大小保持一致,可以与块级率失真优化紧密结合,借助于码流中的块级率失真语法元素,将所有语法元素为“1”的图像块组成一组张量。在张量组织过程时可以跳过关闭神经网络编码工具的图像块,避免不必要的计算,进一步降低解码复杂度。
为不失一般性,本发明将图像块大小设为(h*w),在实际操作中,为避免分块并行带来额外的块效应,分块的时候会考虑周围像素,实际的分块尺寸为(h+2*p,w+2*p),其中p为卷积核大小,网络推理结束后只有中间(h*w)的区域作为运算结果返回。
通过上述方法,本发明中的图像块可以与神经网络编码工具的块级率失真优化紧密结合,可以跳过神经网络编码工具关闭的图像块,减少冗余计算,进一步加速解码过程。
S103、将大小相同的图像块组织成若干个张量,并将若干个张量作为一组张量同时送入神经网络中进行前向传播处理,其中,根据神经网络编码工具以及硬件显存大小设置张量的批尺寸值。
具体地,得到划分完成的大小相同的图像块后,将多个大小相同的图像块组织成一组张量,其中,根据神经网络编码工具以及硬件显存大小设置张量的批尺寸值,批尺寸值表示一个张量中图像块的数目。将组织完成的张量送入神经网络中进行前向传播处理。
可选地,当剩余图像块数量少于设置的张量的批尺寸值时,将剩余图像块按照实际数目组织成一组张量进行并行处理。
可选地,张量的批尺寸值可以是预先设定的值,也可以自适应根据实际使用的硬件决定。
通过上述方法,可以根据神经网络编码工具以及硬件显存大小灵活的设置每个批次的图像块数量,同时可以发挥硬件的并行推理能力,降低编解码复杂度。
图2是根据一示例性实施例示出的一种不同并行批尺寸值的解码复杂度示意图;
如图2所示,张量的批尺寸值(bs)分别为1、4、8、16、32,解码复杂度随着张量的批尺寸个数的增多而递减,由此可知,本发明提出的基于张量并行的前向推断方法能够有效的降低解码时间和运行时显存开销,并且可以根据显存的实际情况灵活的选择张量尺寸,即并行推理图像块个数,实现自适应的张量批尺寸决策。
进一步地,对待处理的图像进行边界扩充,包括:
使用边界像素对待处理的图像进行镜像扩充;
使用边界像素对待处理的图像进行反射扩充。
具体地,在对输入的图像进行边界扩充时,扩充使用的像素为最边界处的像素,可以使用边界像素对待处理的图像进行镜像扩充,也可以使用边界像素对待处理的图像进行反射扩充。
通过上述方法,对待输入神经网络的图像进行边界扩充,可以保证边界像素的数量满足划分要求。
进一步地,根据光栅扫描顺序将边界完整的图像划分成大小相同的图像块,包括:
图像块的大小任意,当其与深度学习编码工具中率失真优化决策的块大小一致,可以进一步降低解码复杂度。
在嵌入编解码器时,基于神经网络的环路滤波等编码工具往往与率失真优化相结合。通过将图像块的大小与深度学习编码工具中率失真优化决策的块大小保持一致,可以与块级率失真优化紧密结合,借助于码流中的块级率失真语法元素,将所有语法元素为“1”的图像块组成一组张量。在张量组织过程时可以跳过关闭神经网络编码工具的图像块,避免不必要的计算,进一步降低解码复杂度。
为不失一般性,本发明将图像块大小设为(h*w),在实际操作中,为避免分块并行带来额外的块效应,分块的时候会考虑周围像素,实际的分块尺寸为(h+2*p,w+2*p),其中p为卷积核大小,网络推理结束后只有中间(h*w)的区域作为运算结果返回。
通过上述方法,本发明中的图像块可以与神经网络编码工具的块级率失真优化紧密结合,可以跳过神经网络编码工具关闭的图像块,减少冗余计算,进一步加速解码过程。
进一步地,将大小相同的图像块组织成若干个张量,包括:
当该图像块的编码端率失真决策结果为真时,将该图像块放入张量中。
在嵌入编解码器时,基于神经网络的环路滤波等编码工具往往与率失真优化相结合。通过将图像块的大小与深度学习编码工具中率失真优化决策的块大小保持一致,可以与块级率失真优化紧密结合,借助于码流中的块级率失真语法元素,将所有语法元素为“1”的图像块组成一组张量。在张量组织过程时可以跳过关闭神经网络编码工具的图像块,避免不必要的计算,进一步降低解码复杂度。
进一步地,还包括:
当剩余图像块数量少于设置的张量的批尺寸值时,将剩余图像块组织成一组张量。
进一步地,对待处理的图像进行边界扩充之前,还包括:
获取待处理的图像。
图3是根据一示例性实施例示出的一种面向神经网络编解码工具的并行推理装置的结构示意图;
在一些可选地实施例中,一种面向神经网络编解码工具的并行推理装置,包括:
S301、扩充模块,用于对待处理的图像进行边界扩充,得到边界完整的图像;
S302、划分模块,用于根据光栅扫描顺序将边界完整的图像划分成大小相同的图像块;
S303、组织模块,用于将大小相同的图像块组织成若干个张量,并将若干个张量作为一组张量同时送入神经网络中进行前向传播处理,其中,根据神经网络编码工具以及硬件显存大小设置张量的批尺寸值。
进一步地,扩充模块,包括:
第一扩充单元,用于使用边界像素对待处理的图像进行镜像扩充;
第二扩充单元,用于使用边界像素对待处理的图像进行反射扩充。
在一些可选地实施例中,一种计算机可读存储介质,其上存储有计算机程序,其特征在于,计算机程序被处理器执行时,实现上述实施例提供的一种面向神经网络编解码工具的并行推理方法。
图4是根据一示例性实施例示出的一种面向神经网络编解码工具的并行推理系统的示意图。
在一些实施例中,一种面向神经网络编解码工具的并行推理系统,包括处理器41和存储有程序指令的存储器42,还可以包括通信接口43和总线44。其中,处理器41、通信接口43、存储器42可以通过总线44完成相互间的通信。通信接口43可以用于信息传输。处理器41可以调用存储器42中的逻辑指令,以执行上述实施例提供的面向神经网络编解码工具的并行推理方法。
此外,上述的存储器42中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
存储器42作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令/模块。处理器41通过运行存储在存储器42中的软件程序、指令以及模块,从而执行功能应用以及数据处理,即实现上述方法实施例中的方法。
存储器42可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器42可以包括高速随机存取存储器,还可以包括非易失性存储器。
本领域技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,可以取决于技术方案的特定应用和设计约束条件。技术人员可以对每个特定的应用来使用不同方法以实现所描述的功能,但是这种实现不应认为超出本公开实施例的范围。技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (9)

1.一种面向神经网络编解码工具的并行推理方法,其特征在于,包括:
对待处理的图像进行边界扩充,得到边界完整的图像;
根据光栅扫描顺序将所述边界完整的图像划分成大小相同的图像块,其中,所述图像块的大小可以任意设定,所述图像块的大小可以与深度学习编码工具中率失真优化决策的块大小一致;
将所述大小相同的图像块组织成若干个张量,并将所述若干个张量作为一组张量同时送入神经网络中进行前向传播处理,其中,根据神经网络编码工具以及硬件显存大小设置所述张量的批尺寸值。
2.根据权利要求1所述的方法,其特征在于,所述对待处理的图像进行边界扩充,包括:
使用边界像素对所述待处理的图像进行镜像扩充;
使用边界像素对所述待处理的图像进行反射扩充。
3.根据权利要求1所述的方法,其特征在于,将所述大小相同的图像块组织成若干个张量,包括:
将所述大小相同的图像块放入张量中;
与率失真优化结合,解码端当该图像块的率失真决策结果为真时,将该图像块放入张量中。
4.根据权利要求1所述的方法,其特征在于,还包括:
当剩余图像块数量少于设置的张量的批尺寸值时,将剩余图像块组织成一组张量。
5.根据权利要求1所述的方法,其特征在于,所述对待处理的图像进行边界扩充之前,还包括:
获取待处理的图像。
6.一种面向神经网络编解码工具的并行推理装置,其特征在于,包括:
扩充模块,用于对待处理的图像进行边界扩充,得到边界完整的图像;
划分模块,用于根据光栅扫描顺序将所述边界完整的图像划分成大小相同的图像块,其中,所述图像块的大小可以任意设定,所述图像块的大小可以与深度学习编码工具中率失真优化决策的块大小一致;
组织模块,用于将所述大小相同的图像块组织成若干个张量,并将所述若干个张量作为一组张量同时送入神经网络中进行前向传播处理,其中,根据神经网络编码工具以及硬件显存大小设置所述张量的批尺寸值。
7.根据权利要求6所述的装置,其特征在于,所述扩充模块,包括:
第一扩充单元,用于使用边界像素对所述待处理的图像进行镜像扩充;
第二扩充单元,用于使用边界像素对所述待处理的图像进行反射扩充。
8.一种面向神经网络编解码工具的并行推理系统,其特征在于,包括:
一个或多个处理器、存储一个或多个程序的存储装置;
当所述一个或多个程序被所述一个或多个处理器执行时,所述一个或多个处理器实现如权利要求1~5任一项所述的一种面向神经网络编解码工具的并行推理方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1~5任一项所述的一种面向神经网络编解码工具的并行推理方法。
CN202010100106.4A 2020-02-18 2020-02-18 面向神经网络编解码工具的并行推理方法及系统 Active CN111372084B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010100106.4A CN111372084B (zh) 2020-02-18 2020-02-18 面向神经网络编解码工具的并行推理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010100106.4A CN111372084B (zh) 2020-02-18 2020-02-18 面向神经网络编解码工具的并行推理方法及系统

Publications (2)

Publication Number Publication Date
CN111372084A CN111372084A (zh) 2020-07-03
CN111372084B true CN111372084B (zh) 2021-07-20

Family

ID=71206324

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010100106.4A Active CN111372084B (zh) 2020-02-18 2020-02-18 面向神经网络编解码工具的并行推理方法及系统

Country Status (1)

Country Link
CN (1) CN111372084B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022227062A1 (zh) * 2021-04-30 2022-11-03 Oppo广东移动通信有限公司 编解码方法、码流、编码器、解码器以及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108171776A (zh) * 2017-12-26 2018-06-15 浙江工业大学 一种基于改进的卷积神经网络实现图像编辑传播的方法
CN109344966A (zh) * 2018-07-26 2019-02-15 广东工业大学 一种高效张量化全连接神经网络的方法
CN109919315A (zh) * 2019-03-13 2019-06-21 科大讯飞股份有限公司 一种神经网络的前向推理方法、装置、设备及存储介质
CN110046705A (zh) * 2019-04-15 2019-07-23 北京异构智能科技有限公司 用于卷积神经网络的装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10685282B2 (en) * 2018-07-25 2020-06-16 WaveOne Inc. Machine-learning based video compression

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108171776A (zh) * 2017-12-26 2018-06-15 浙江工业大学 一种基于改进的卷积神经网络实现图像编辑传播的方法
CN109344966A (zh) * 2018-07-26 2019-02-15 广东工业大学 一种高效张量化全连接神经网络的方法
CN109919315A (zh) * 2019-03-13 2019-06-21 科大讯飞股份有限公司 一种神经网络的前向推理方法、装置、设备及存储介质
CN110046705A (zh) * 2019-04-15 2019-07-23 北京异构智能科技有限公司 用于卷积神经网络的装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种CNN网络卷积并行计算方法;宋鹤鸣;《工业控制计算机》;20191231;第32卷(第2期);全文 *

Also Published As

Publication number Publication date
CN111372084A (zh) 2020-07-03

Similar Documents

Publication Publication Date Title
US20200260117A1 (en) Methods and Apparatuses for Coding and Decoding Depth Map
CN109410123B (zh) 基于深度学习的去除马赛克的方法、装置及电子设备
CN110569961A (zh) 一种神经网络训练方法、装置及终端设备
CN110866862B (zh) 基于缓冲器的数据处理方法、装置、存储介质及电子设备
EP3024234A1 (en) Coefficient coding harmonization in hevc
CN110830808A (zh) 一种视频帧重构方法、装置及终端设备
CN111372084B (zh) 面向神经网络编解码工具的并行推理方法及系统
CN107392838B (zh) 基于OpenCL的WebP压缩并行加速方法及装置
CN105163126B (zh) 一种基于hevc协议的硬件解码方法和装置
CN110378860B (zh) 修复视频的方法、装置、计算机设备和存储介质
US20050259887A1 (en) Video deblocking method and apparatus
CN108668166B (zh) 一种编码方法、装置及终端设备
CN111179369A (zh) 一种基于安卓系统的gpu渲染方法及装置
CN110782415A (zh) 一种图像补全方法、装置及终端设备
CN111083479A (zh) 一种视频帧预测方法、装置及终端设备
CN112565778B (zh) 一种基于时间片管理的数据存取方法
CN112637609B (zh) 图像实时传输方法、发送端及接收端
CN109978801B (zh) 一种图像处理方法及图像处理装置
CN113887491A (zh) 基于跨时空图卷积网络的人体骨架行为识别系统及方法
CN114119377A (zh) 一种图像处理方法及装置
CN116503294B (zh) 基于人工智能的文物图像复原方法、装置及设备
CN110475044A (zh) 图像传输方法和装置、电子设备、计算机可读存储介质
CN114501035B (zh) 视频编解码滤波处理方法、系统、设备及存储介质
CN114584790B (zh) 一种视频亮度滤波方法、装置、设备及存储介质
CN110324620B (zh) 帧内预测方法、装置、电子设备及机器可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant