CN101256668A - 一种计算均衡的多核进行视频滤波的方法 - Google Patents
一种计算均衡的多核进行视频滤波的方法 Download PDFInfo
- Publication number
- CN101256668A CN101256668A CN 200810065556 CN200810065556A CN101256668A CN 101256668 A CN101256668 A CN 101256668A CN 200810065556 CN200810065556 CN 200810065556 CN 200810065556 A CN200810065556 A CN 200810065556A CN 101256668 A CN101256668 A CN 101256668A
- Authority
- CN
- China
- Prior art keywords
- filtering
- video
- processor
- processor cores
- carries out
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明涉及一种计算均衡的多核进行视频滤波的方法,该方法首先用一个处理器内核完成目标视频图像处理,得到计算资源总数后,结合达到实时处理要求时每个处理器内核可提供的计算能力,计算出需要的目标处理器内核个数;然后将视频图像帧分成与目标处理器内核个数相同的份数;每个处理器内核处理其对应部分的滤波,前一个处理器内核完成其对应部分的滤波后,通知下一个处理器进行滤波,依次进行,直到整个图像处理完成。本发明在对视频图像滤波结果没有任何影响的情况下,充分利用多核处理器的计算能力,均衡多个处理器核的计算开销,提高视频图像滤波过程的执行效率。
Description
技术领域
本发明属于视频信息压缩领域,具体涉及一种计算均衡的多核进行视频滤波的方法。
背景技术
随着用户对视频图像质量要求的提高,更大尺寸、更高分辨率成为了一个发展方向。这就需要具有更强计算能力的处理器芯片,并且有很好的系统架构,能够充分利用好处理器的计算能力。当前处理器芯片的一个发展趋势就是多核,一个芯片内部包含有2个、3个、4个甚至更多个的处理器内核。每个处理器内核有各自的计算单元,然后独有或共有一些片上内存等,共同组成一个多核的处理器芯片。当单个处理器内核达不到所需的视频图像处理要求时,就需要使用多个内核协同工作。
滤波是视频编码和图像处理领域的一种常用操作,根据功能的不同可以对输入的视频图像产生不同的作用,例如有插值滤波、降噪滤波、去块效应滤波等。这些滤波方法有的是被视频图像编解码标准规定的,有的是开放算法,没有被规定。例如在目前的高级视频编码标准中,基本都包含了分数象素插值和去块效应滤波功能(Deblocking Filter),其中环路滤波的主要作用是将反量化、反变换之后的重建图像进行处理,以消除相邻块边界明显的差异,即块效应。
在视频图像的处理过程中,有的步骤只针对当前块,所以不需要考虑多核并行处理,例如变换、量化等。有的步骤可以直接按照视频图像的位置进行分割,他们之间没有数据依赖或者可以通过Slice划分隔断数据依赖,这样多个核就可以很方便的在同一时刻进行并行处理,例如分数象素插值、运动预测等。但有的步骤由于存在数据依赖,不能简单的进行位置分割然后并行处理,如图1和图2所示,在H.264标准中,当前4×4块的边界a和边界e必须在其相邻块滤波完成后,才能开始处理,所以就需要一个合理的实现架构,来充分利用多核的计算能力,达到最佳的处理速度。
发明内容
本发明所要解决的技术问题是,提供一种计算均衡的多核进行视频滤波的方法,该方法在对视频图像滤波结果没有任何影响的情况下,充分利用多核处理器的计算能力,均衡多个处理器核的计算开销,提高视频图像滤波过程的执行效率。
本发明所述计算均衡的多核进行视频滤波的方法,包括以下步骤:
步骤一:一个处理器内核完成目标视频图像处理,得到计算资源总数Ctotal后,结合达到实时处理要求时每个处理器内核可提供的计算能力Ci,计算出需要的目标处理器内核个数N;
步骤二:将视频图像帧分成与目标处理器内核个数相同的份数;
步骤三:每个处理器内核处理其对应部分的滤波,前一个处理器内核完成其对应部分的滤波后,通知下一个处理器进行滤波,依次进行,直到整个图像处理完成。
上述步骤二所述视频图像帧的份数大小是根据各处理器内核的计算能力得到的。
所述步骤三中,当后一个视频图像帧的处理需要用到前一个视频图像帧的数据时,若该帧还没有滤波完毕,则需要等待其滤波完成。
所述视频图像帧的“码流交互周期”和“显示输出周期”相同,都等于单个处理器内核处理时间。
本发明在对视频图像滤波结果没有任何影响的情况下,充分利用多核处理器的计算能力,均衡多个处理器核的计算开销,提高视频图像滤波过程的执行效率。
附图说明
图1是H.264标准中宏块4×4块边界示意图;
图2是H.264标准中4×4块边界点示意图;
图3是视频图像帧分为两份的示意图一;
图4是视频图像分帧为两份的示意图二;
图5是两个处理器内核进行视频图像处理过程示意图;
图6是本发明所述方法流程图。
具体实施方式
下面结合附图对本发明作进一步的详细描述。这里以H.264标准中使用的环路滤波为例,但本发明给出的方法不仅限于H.264标准用到的滤波方法,并且在编码和解码端都可以使用。
如图6所示,此处假设两个处理器内核能够满足实时处理要求,则本方法的具体步骤如下:
第一步:使用单个处理器内核完成目标视频图像处理,得到所需要的计算资源总数Ctotal;
第二步:根据得到的计算资源总数Ctotal,结合达到实时处理要求情况下,每个处理器内核可以提供的计算能力Ci,计算出需要的目标处理器核个数N,这里以N=2为例;
第三步:将输入的视频图像按照各个处理器内核提供的计算能力Ci,按处理顺序分为Part1和Part2两份,在这里我们假设两个处理器核提供相同的计算能力;
因为在H.264标准中,处理单元U的基本单位是宏块,而输入图像在纵向上可能是偶数行宏块,也可能是奇数行宏块;当为偶数行宏块时,则按照如图3所示方法将视频图像帧分为Part1和Part2;否则,按照图4所示的方法将视频图像帧分为Part1和Part2(此处若一行中包含奇数个宏块,则可以令Part1多分一个),即Part1和Part2的大小不同。
第四步:第1个处理器内核完成Part1的滤波操作后,通知第2个处理器进行Part2的滤波操作,而第一个处理器内核此时处理下一个帧的Part1滤波,依次进行,直到整个图像处理完成,如图5所示。
从图5中,可以看出两个处理器内核的负载是一样的,达到了计算均衡,充分利用了两个内核的计算能力。另外,每一帧的“码流交互周期”和每一帧的“显示输出周期”是一致的,都等于单个处理器内核处理时间T。当N+1帧的Part1其他处理需要用到第N帧的Part2时,需要进行等待其滤波完成。
Claims (4)
1、一种计算均衡的多核进行视频滤波的方法,其特征在于,包括以下步骤:
步骤一:一个处理器内核完成目标视频图像处理,得到计算资源总数后,结合达到实时处理要求时每个处理器内核可提供的计算能力,计算出需要的目标处理器内核个数;
步骤二:将视频图像帧分成与目标处理器内核个数相同的份数;
步骤三:每个处理器内核处理其对应部分的滤波,前一个处理器内核完成其对应部分的滤波后,通知下一个处理器进行滤波,依次进行,直到整个图像处理完成。
2、如权利要求1所述的计算均衡的多核进行视频滤波的方法,其特征在于,步骤二所述视频图像帧的份数大小是根据各处理器内核的计算能力得到的。
3、如权利要求1或2所述的计算均衡的多核进行视频滤波的方法,其特征在于,所述步骤三中,当后一个视频图像帧的处理需要用到前一个视频图像帧的数据时,若该帧还没有滤波完毕,则需要等待其滤波完成。
4、如权利要求1或2所述的计算均衡的多核进行视频滤波的方法,其特征在于,所述视频图像帧的“码流交互周期”和“显示输出周期”相同,都等于单个处理器内核处理时间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810065556 CN101256668B (zh) | 2008-03-12 | 2008-03-12 | 一种计算均衡的多核进行视频滤波的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810065556 CN101256668B (zh) | 2008-03-12 | 2008-03-12 | 一种计算均衡的多核进行视频滤波的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101256668A true CN101256668A (zh) | 2008-09-03 |
CN101256668B CN101256668B (zh) | 2012-09-05 |
Family
ID=39891470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200810065556 Active CN101256668B (zh) | 2008-03-12 | 2008-03-12 | 一种计算均衡的多核进行视频滤波的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101256668B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010145424A1 (zh) * | 2009-06-18 | 2010-12-23 | 中兴通讯股份有限公司 | 多核图像编码处理设备及其图像滤波方法 |
CN101930421A (zh) * | 2009-06-17 | 2010-12-29 | 索尼公司 | 运算处理装置及方法、处理单元、运算处理系统 |
CN101369345B (zh) * | 2008-09-08 | 2011-01-05 | 北京航空航天大学 | 一种基于绘制状态的多属性对象绘制顺序优化方法 |
CN109819178A (zh) * | 2017-11-21 | 2019-05-28 | 虹软科技股份有限公司 | 一种用于帧处理的方法和装置 |
CN112165572A (zh) * | 2020-09-10 | 2021-01-01 | Oppo(重庆)智能科技有限公司 | 图像处理方法、装置、终端及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7080379B2 (en) * | 2002-06-20 | 2006-07-18 | International Business Machines Corporation | Multiprocessor load balancing system for prioritizing threads and assigning threads into one of a plurality of run queues based on a priority band and a current load of the run queue |
CN100562850C (zh) * | 2005-11-30 | 2009-11-25 | 迈普通信技术股份有限公司 | 多处理器负载分配调整方法 |
-
2008
- 2008-03-12 CN CN 200810065556 patent/CN101256668B/zh active Active
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101369345B (zh) * | 2008-09-08 | 2011-01-05 | 北京航空航天大学 | 一种基于绘制状态的多属性对象绘制顺序优化方法 |
CN101930421A (zh) * | 2009-06-17 | 2010-12-29 | 索尼公司 | 运算处理装置及方法、处理单元、运算处理系统 |
CN101930421B (zh) * | 2009-06-17 | 2012-11-07 | 索尼公司 | 运算处理装置及方法、处理单元、运算处理系统 |
WO2010145424A1 (zh) * | 2009-06-18 | 2010-12-23 | 中兴通讯股份有限公司 | 多核图像编码处理设备及其图像滤波方法 |
US8867606B2 (en) | 2009-06-18 | 2014-10-21 | Zte Corporation | Multi-core image encoding processing device and image filtering method thereof |
CN109819178A (zh) * | 2017-11-21 | 2019-05-28 | 虹软科技股份有限公司 | 一种用于帧处理的方法和装置 |
CN112165572A (zh) * | 2020-09-10 | 2021-01-01 | Oppo(重庆)智能科技有限公司 | 图像处理方法、装置、终端及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN101256668B (zh) | 2012-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cheung et al. | Video coding on multicore graphics processors | |
CN104885470B (zh) | 用于下一代视频的预测和编码的内容自适应划分 | |
CN105847795A (zh) | 管线化架构的视讯编码系统的帧内块复制方法与装置 | |
US11490078B2 (en) | Method and apparatus for deep neural network based inter-frame prediction in video coding | |
CN101256668B (zh) | 一种计算均衡的多核进行视频滤波的方法 | |
CN102098503A (zh) | 一种多核处理器并行解码图像的方法和装置 | |
CN101115201A (zh) | 视频解码方法与解码装置 | |
CN102625108B (zh) | 一种基于多核处理器实现的h.264解码方法 | |
CN101790093B (zh) | 一种利用sopc实现avs视频解码的装置及方法 | |
de Souza et al. | HEVC in-loop filters GPU parallelization in embedded systems | |
CN105245896A (zh) | Hevc并行运动补偿方法及装置 | |
CN102572430A (zh) | 一种基于可重构技术的h.264去块滤波算法的实现方法 | |
CN1703094A (zh) | 1/4像素插值应用于1/2像素插值结果的图象插值装置和方法 | |
CN106303544A (zh) | 一种视频编解码方法、编码器和解码器 | |
CN104378642A (zh) | 一种基于cuda的h.264分数像素快速插值方法 | |
Wang et al. | A collaborative scheduling-based parallel solution for HEVC encoding on multicore platforms | |
JP2010045690A (ja) | 動画像符号化装置および動画像符号化方法 | |
Gudumasu et al. | Software-based versatile video coding decoder parallelization | |
Doan et al. | Multi-asip based parallel and scalable implementation of motion estimation kernel for high definition videos | |
CN102281441B (zh) | 一种并行滤波的方法和装置 | |
Datla et al. | Parallelizing motion JPEG 2000 with CUDA | |
EP2814254A1 (en) | Combined parallel and pipelined video encoder | |
CN102075762B (zh) | 用于视频编码器的帧间预测电路及其实现方法 | |
Han et al. | HEVC decoder acceleration on multi-core X86 platform | |
Wang et al. | An optimized parallel IDCT on graphics processing units |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |