WO2014106400A1 - 一种多线程处理基带信号的方法及装置 - Google Patents
一种多线程处理基带信号的方法及装置 Download PDFInfo
- Publication number
- WO2014106400A1 WO2014106400A1 PCT/CN2013/084366 CN2013084366W WO2014106400A1 WO 2014106400 A1 WO2014106400 A1 WO 2014106400A1 CN 2013084366 W CN2013084366 W CN 2013084366W WO 2014106400 A1 WO2014106400 A1 WO 2014106400A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- score
- operations
- scalar
- hwa
- processing
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000004364 calculation method Methods 0.000 claims abstract description 56
- 230000008569 process Effects 0.000 claims abstract description 20
- 230000001133 acceleration Effects 0.000 claims abstract description 4
- 238000004891 communication Methods 0.000 claims description 15
- 230000003993 interaction Effects 0.000 claims description 12
- 230000008878 coupling Effects 0.000 abstract description 12
- 238000010168 coupling process Methods 0.000 abstract description 12
- 238000005859 coupling reaction Methods 0.000 abstract description 12
- 230000005540 biological transmission Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 101150083764 KCNK9 gene Proteins 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/5044—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
Definitions
- the VCORE performs a vector operation operation in the signal processing operation and a scalar operation operation having a tight coupling relationship with the vector operation operation, and calculates a processing task sent by the SCORE according to the parameter sent by the SCORE, and returns the calculation result to the SCORE;
- HWA Perform signal processing operations that are not suitable for vector implementation and computationally intensive computation processing. Calculate the processing tasks sent by SCORE according to the parameters sent by SCORE, and return the calculation results to SCORE.
- the VAU performs a corresponding vector operation operation according to the vector operation instruction sent by the CU-V; the QAU-V performs a corresponding scalar with a tight coupling relationship with the vector operation operation according to the scalar operation instruction sent by the CU-V. Operational operations.
- the HWA calculates the processing task, and returns the calculation result to the SCORE, including:
- the CU-S1 12 is specifically configured to process a task partition type of the baseband signal according to a preset task allocation rule. If the vector-intensive processing is performed, the processing task is sent to the VCORE 12, and the calculation result returned by the VCORE 12 is received; If the calculation is intensive processing that is not suitable for the vector operation, the processing task is sent to the HWA 13 to receive the calculation result returned by the HWA 13; and the parameters are calculated and supplied to the VCORE 12 and the HWA 13 .
- the CU-S 112 is configured to save a task allocation rule, and may be: if the current baseband signal needs to perform task scheduling, flow control, and parameter calculation, the task of processing the baseband signal is divided into scalar processing;
- the HWA 13 includes: an interface register 131, a control unit (CU-H) 132, and a data processing unit (HPU) 133;
- CU-H control unit
- HPU data processing unit
- Embodiment 1 The method of processing a baseband signal by using the multi-thread processing baseband signal of the present invention includes:
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mobile Radio Communication Systems (AREA)
- Complex Calculations (AREA)
- Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
Abstract
本发明公开了一种多线程处理基带信号的装置,包括:矢量处理器(VCORE),用于信号处理运算中的矢量运算操作及与所述矢量运算操作具有紧耦合关系的标量运算操作;硬件加速单元(HWA),用于信号处理运算中不适合矢量形式实现而又计算密集的运算处理;标量处理器(SCORE),用于信号处理中的标量运算,以及对VCORE和HWA的调度,即将处理任务发给VCORE和HWA,并接收VCORE和HWA返回的计算结果。本发明还公开了一种多线程处理基带信号的方法,采用本发明能多线程的处理基带信号中的矢量及标量运算,提高处理效率。
Description
一种多线程处理基带信号的方法及装置 技术领域
本发明涉及数字信号处理领域, 尤其涉及一种多线程处理基带信号的 方法及装置。 背景技术
当前无线通信领域不断发展, 各种通信标准层出不穷, 出现多种通信 体制并存的现象。 因此使用以硬件为主、 面向特定用途的专用集成芯片
( ASIC, Application Specific Integrated Circuit )的终端已经不适应这种局面。
ASIC终端对单一的通信协议实现可以做到性能、功耗、成本的最优,但是, 在多模情况下, 只能通过硬件模块叠加来支持, 导致芯片面积和功耗不断 膨胀, 且很不灵活, 升级成本很高。 因此, 基于矢量处理器的软基带方法 逐渐被引入并发挥越来越重要的作用, 目前较常见的基于矢量处理器的软 基带架构, 主要由射频接口、 协议栈处理器、 物理层控制处理器、 矢量处 理器、 信道编解码加速器组成。 其中矢量处理器完成除信道编解码加速器 之外的基带信号处理, 且矢量处理器通常采用标量通路加矢量通路的形式。
但是, 由于基带处理中仍然保留有较多诸如流程控制、 参数计算、 不 规则密集计算等步骤无法直接矢量化, 这些处理如果仍然采用现有的矢量 处理器完成, 其实现效率会比较低, 从而导致对处理器频率需求较高、 功 耗也较大。 因此现有简单的标量通路加矢量通路的结构还不能有效地胜任 高效灵活的处理需求。
可见, 现有技术终端中的矢量处理器, 无法高效的进行标量及矢量运 算。
发明内容
有鉴于此, 本发明的目的在于提供一种多线程处理基带信号的方法及 装置, 能多线程的处理基带信号中的矢量及标量运算, 提高处理效率。
为达到上述目的, 本发明的技术方案是这样实现的:
本发明提供了一种多线程处理基带信号的装置, 该装置包括: 标量处 理器 (SCORE ) 、 矢量处理器 (VCORE ) 和硬件加速单元 ( HWA ) ; 其中,
VCORE, 配置为信号处理运算中的矢量运算操作及与所述矢量运算操 作具有紧耦合关系的标量运算操作,根据 SCORE发来的参数对 SCORE发 来的处理任务进行计算, 将计算结果返回给 SCORE;
HWA,配置为信号处理运算中不适合矢量形式实现而又计算密集的 运算处理,根据 SCORE发来的参数对 SCORE发来的处理任务进行计算, 将计算结果返回给 SCORE;
SCORE, 配置为信号处理中的标量运算, 以及对 VCORE和 HWA 的调度, 将处理任务发给 VCORE和 HWA, 并接收 VCORE和 HWA返 回的计算结果, 并向 VCORE及 HWA提供参数。
上述方案中,所述 SCORE和 VCORE之间通过预设的总线通信方式进 行数据交互; 所述 SCORE和 HWA之间通过预设的总线通信方式进行数据 交互; 所述 VCORE直接对 HWA进行配置。
上述方案中, 所述 SCORE包括: 第二标量处理单元 QAU-S和第二 控制单元 CU-S; 其中,
QAU-S , 配置为完成 CU-S发来的处理任务中的标量运算;
CU-S , 配置为向 QAU— S发送 QAU指令, 控制 QAU— S执行相应的标 量运算操作。
上述方案中, 所述 VCORE包括: 第一控制单元 CU-V、 矢量处理单
元 VAU和第一标量处理单元 QAU-V; 其中,
CU-V, 配置为并行地或相互独立地向矢量处理单元 VAU 和第一标量 处理单元 QAU— V发送 VAU指令和 QAU指令,控制矢量处理单元 VAU和 第一控制单元 QAU— V 并行地或相互独立地执行相应的矢量运算操作和标 量运算操作。
VAU, 配置为根据 CU-V发来的矢量运算指令执行相应的矢量运算 操作;
QAU-V, 配置为根据 CU-V发来的标量运算指令执行相应的与所述 矢量运算操作具有紧耦合关系的标量运算操作。
上述方案中, 所述 HWA包括: 接口寄存器、 控制单元 CU-H以及数 据处理单元 HPU; 其中,
接口寄存器, 配置为接收 SCORE发来的配置参数;
CU-H, 根据接口寄存器的配置值, 配置为控制 HPU的执行; HPU, 配置为根据 CU-H发来的控制信息进行处理。
本发明还提供了一种多线程处理基带信号的方法, 该方法包括: SCORE执行当前基带信号处理中的标量运算, 对 VCORE和 HWA 的调度, 将处理任务发给 VCORE和 HWA;
VCORE执行信号处理运算中的矢量运算操作及与所述矢量运算操作 具有紧耦合关系的标量运算操作,根据 SCORE发来的参数对 SCORE发来 的处理任务进行计算, 将计算结果返回给 SCORE; HWA执行信号处理 运算中不适合矢量形式实现而又计算密集的运算处理,根据 SCORE发来 的参数对 SCORE发来的处理任务进行计算,将计算结果返回给 SCORE;
SCORE接收 VCORE和 HWA返回的计算结果。
上述方案中, 所述方法还包括: 使用专用于高效完成信号处理运算中 的标量运算的 SCORE中的 CU-S向 QAU— S发送 QAU指令, 控制 QAU— S
执行相应的标量运算操作; 所述 SCORE中的 QAU-S执行信号处理运算中 的标量运算。
上述方案中, 所述 VCORE进行计算, 将计算结果返回给 SCORE, 包 括:
所述 VCORE中的 CU-V并行地或相互独立地向 VAU 和 QAU— V发送 VAU指令和 QAU指令;
VAU和 QAU— V并行地或相互独立地执行相应的矢量运算操作和标量 运算操作
其中,所述 VAU根据 CU-V发来的矢量运算指令执行相应的矢量运 算操作; QAU-V根据 CU-V发来的标量运算指令执行相应的与所述矢量 运算操作具有紧耦合关系的标量运算操作。
上述方案中, 所述 HWA对处理任务进行计算, 将计算结果返回给 SCORE, 包括:
HWA中的接口寄存器接收 SCORE发来的配置参数后, 由 HWA中 的 CU-H根据接口寄存器的配置值, 控制 HWA中的 HPU的根据 CU-H 发来的控制信息进行处理。
本发明所提供了一种多线程处理基带信号的方法及装置, 通过使用 VCORE 进行矢量运算以及与矢量运算操作具有紧耦合关系的标量运算 操作; HWA 负责处理不适合矢量运算的特定计算密集型处理如峰值搜索 等; SCORE负责信号处理中的标量运算, 以及对 VCORE和 HWA的调 度, 将处理任务以及计算参数发给 VCORE和 HWA, 并接收 VCORE和 HWA 返回的计算结果; 如此, 就能够根据任务分配规则多线程的处理基 带信号中的矢量及标量运算, 以减少 SCORE和 VCORE交互带来的开销, 提升处理效率; 另夕卜, 可以有效地利用 SCORE、 VCORE, HWA的并行度, 提高总体处理效率。
附图说明
图 1为本发明的多线程处理基带信号的装置组成结构示意图一; 图 2为本发明的多线程处理基带信号的装置组成结构示意图二; 图 3为本发明的多线程处理基带信号的方法流程示意图;
图 4为本发明中处理任务执行顺序示意图。 具体实施方式
本发明的基本思想是: SCORE执行信号处理中的标量运算, 以及对 VCORE和 HWA的调度, 将处理任务发给 VCORE和 HWA; VCORE执 行信号处理运算中的矢量运算操作及与所述矢量运算操作具有紧耦合关系 的标量运算操作, 根据 SCORE发来的参数对 SCORE发来的处理任务进 行计算, 将计算结果返回给 SCORE; HWA执行信号处理运算中不适合 矢量形式实现而又计算密集的运算处理, 根据 SCORE 发来的参数对 SCORE发来的处理任务进行计算, 将计算结果返回给 SCORE; SCORE 接收 VCORE和 HWA返回的计算结果。
下面结合附图及具体实施例对本发明再作进一步详细的说明。
一种多线程处理基带信号的装置, 如图 1所示, 该装置包括: 标量处 理器(SCORE ) 1 1、 矢量处理器(VCORE ) 12和硬件加速单元( HWA ) 13 ; 其中,
VCORE12, 配置为信号处理运算中的矢量运算操作及与所述矢量运算 操作具有紧耦合关系的标量运算操作, 根据 SCORE11 发来的参数对 SCORE 11发来的处理任务进行计算, 将计算结果返回给 SCORE1 1 ;
HWA13 ,配置为信号处理运算中不适合矢量形式实现而又计算密集 的运算处理, 根据 SCORE11发来的参数对 SCORE 11发来的处理任务进 行计算, 将计算结果返回给 SCORE11 ;
SCORE11 , 配置为信号处理中的标量运算, 以及对 VCORE12 和
HWA 13的调度,将处理任务发给 VCORE 12和 HWA 13,并接收 VCORE 12 和 HWA13返回的计算结果, 并向 VCORE12及 HWA13提供参数。
所述 SCORE1 1和所述 VCORE12、 所述 SCORE1 1和所述 HWA13 之间通过专用总线通信方式进行数据交互。 所述 VCORE12也可以直接 配置所述 HWA13。 此外所述 SCOREl l、 所述 VCORE12、 所述 HWA13 也可以通过共享内存进行交互;通过专用总线通信方式进行数据交互指: 通过专门设计的交互总线方式进行点对点通信连接, 减小交互开销。
如图 2所示, 所述 SCORE1 1 包括: 第二标量处理单元 (QAU-S ) 111和第二控制单元 (CU-S ) 1 12; 其中,
QAU-S 11 1 , 配置为接收 CU-S1 12发来的 QAU指令, 根据 CU-S112 的控制标量运算;
CU-S1 12 , 配置为向 QAU-S111发送 QAU指令, 控制 QAU-S执行相 应的标量运算。
所述 CU-S1 12 , 具体配置为根据预置的任务分配规则, 将处理该基带 信号的任务划分类型,若为矢量密集型处理,则将处理任务发给 VCORE12 , 接收 VCORE12返回的计算结果;若为不适合矢量运算的指定计算密集型处 理, 则将处理任务发送给 HWA13, 接收 HWA13返回的计算结果; 同时计 算参数并提供给 VCORE12、 HWA13。
所述所述 CU-S 112 , 具体配置为保存任务分配规则, 可以为: 若对当 前基带信号需要进行任务调度、 流量控制和参数计算的处理, 则处理该基 带信号的任务划分为标量处理;
若对当前基带信号需要进行大量的运算而这些运算又不适合矢量形式 处理, 这些处理又有专门的硬件单元对应, 则将该基带信号的任务划分为 不适合矢量运算的指定计算密集型处理;
若对当前基带信号需要进行矢量运算以及与矢量运算有紧耦合关系的
标量运算, 则处理该基带信号的任务划分为矢量处理。
所述 VCORE12 包括: 第一控制单元 (CU-V ) 121、 矢量处理单元 ( VAU ) 122和第一标量处理单元 (QAU-V ) 123 ; 其中,
CU-V121 , 配置为并行或独立地向 VAU122和 QAU-V123发送 VAU 指令和 QAU指令, 控制 VAU122和 QAU-V123并行或独立地执行相应的 矢量运算操作和标量运算操作;
VAU122 , 配置为根据 CU-V121发来的矢量运算指令执行相应的矢 量运算操作, 将计算结果返回给 SCORE11 ;
QAU-V123 , 配置为根据 CU-V121发来的标量运算指令执行相应的 与所述矢量运算操作具有紧耦合关系的标量运算操作, 将计算结果返回 给 SCOREl l。
所述 CU-V121与 VAU122和 QAU-V123之间具有一条超大指令字 ( VLIW, Very Long Instruction Word )指令发射通道, 其可以根据程序 人员的程序设计, 进行 VLIW指令发射, 在程序调度和程序功能设计满 足的情况下, 通过 VLIW指令发射通道可并行发射矢量运算指令和标量 运算指令, V AU和 Q AU— V可同时执行相关标量线程和矢量线程的处理。 当矢量运算指令和标量运算指令的并行发射条件不满足时, VCORE12 的 VAU运算指令和 QAU运算指令也可以独立发射。 所述 VAU指令和 QAU指令可以并行发射的情况主要有: VAU指令和 QAU指令在执行过 程中不会造成处理器硬件上的相关和数据相关;程序人员在设计程序时, 判断可以有并行发射的条件下, 将指令安排在并行发射的指令位置上。
所述 QAU— V 与所述 VAU之间的数据交互是通过直接的 Q2V和 V2Q指令来实现的; Q2V用于将指定的标量寄存器值存入矢量寄存器, V2Q用于将矢量寄存器的指定元素存到指定的标量寄存器。 这是矢量处 理器内部的一类特殊的指令,所述 Q2V能够将标量寄存器堆内的数据直
接送入矢量寄存器堆中的某个矢量元素中,同时所述 V2Q指令也能将矢 量寄存器堆中的某个元素直接送入 QAU— V上的标量寄存器堆中, 这种 方式由指令流水形式完成, 最大效率的保证了交互的效率。 因此从整体 上看, VCORE12 已经具有了一定的标量处理能力, 但是其标量处理能 力的效率受制于并行指令发射的相关约束, 但是在一些场景中单独的 VCORE12就已经能够独立胜任通信算法的功能实现。
所述 HWA13 包括: 接口寄存器 131、 控制单元 (CU-H ) 132 以及 数据处理单元 (HPU ) 133 ; 其中,
接口寄存器 131, 配置为接收 SCORE1 1 发来的配置参数, 并为 CU-H132提供配置参数;
CU-H132 , 配置为根据接口寄存器的配置值控制 HPU133的执行计 算操作;
HPU133 , 配置为根据 CU-H132发来的控制信息进行计算处理。 系统中可以包括一个或多个 HWA13 ,多个 HWA13可以相同或者不 同。 HWA13 是一种可配置的加速器, 通常被设计为用来处理计算密集 而又不适合矢量操作的处理, 这些操作在不同的通信制式中又具有一定 的普通性, 如峰值搜索等。 通过 HWA13 实现这些处理能够更好地发挥 VCORE12的优势,使其更高效地负责矢量处理。 SCORE1 1和 VCORE12 通过接口寄存器 131 配置参数, HWA13将结果存回接口寄存器 131或 直接写入共享内存。
本发明提供的装置具有很强的灵活性和优势, 其中一点是可以灵活 地调度在 SCORE1 1和 VCORE12上的标量处理任务。对于一般的处理只 要满足 SCORE1 1和 VCORE12之间的数据相关要求,可以让程序人员将 标量处理任务分配给 SCORE1 1和 VCORE12 ,对于与 VAU122处理比较 紧密的标量运算可以尽量安排在 QAU— V上实现, 以减少 SCORE1 1 和
VCORE12 交互带来的开销, 提升处理效率。 对于耦合度不高, 但是对 标量运算相对集中的操作, 可以把任务分配于 SCORE11 上。 另外, 如 果 VCORE12 独立即可完成整个算法实现时, 可以关闭 SCORE11 让 VCORE12 独立工作, 以达到低功耗的设计目的。 所述装置安装于终端 的基带处理器中
本发明的多线程处理基带信号的方法, 如图 3所示, 包括以下步骤: 步骤 301 : SCORE执行当前基带信号处理中的标量运算,对 VCORE 和 H W A的调度, 将处理任务发给 VCORE和 HW A;
步骤 302: VCORE执行信号处理运算中的矢量运算操作及与所述矢量 运算操作具有紧耦合关系的标量运算操作, 根据 SCORE 发来的参数对 SCORE发来的处理任务进行计算, 将计算结果返回给 SCORE; HWA执 行信号处理运算中不适合矢量形式实现而又计算密集的运算处理, 根据 SCORE发来的参数对 SCORE发来的处理任务进行计算, 将计算结果返 回给 SCORE;
步骤 303 : SCORE接收 VCORE和 HWA返回的计算结果。
实施例一、 使用本发明的多线程处理基带信号的方法处理基带信号包 括:
步骤 401 : SCORE根据预置的任务分配规则, 判断当前基带信号的任 务类型, 若为矢量密集型处理, 则执行步骤 402; 若为不适合矢量的计算密 集型处理, 则执行步骤 403。
这里, 所述 SCORE确定处理当前基带信号所需的处理任务的类型: 当 SCORE收到物理层控制处理器发来的基带信号后, 根据预置的任务分配规 则, 将处理该基带信号的任务划分类型。
所述任务分配规则为根据实际情况预置的规则, 可以为: 若对当前基 带信号需要进行任务调度、 流量控制和参数计算的处理, 则处理该基带信
号的任务划分为标量处理;
若对当前基带信号需要进行峰值搜索等, 则处理该基带信号的任务划 分为不适合矢量形式的计算密集型处理;
若对当前基带信号需要进行矢量运算以及与矢量运算有紧耦合关系的 标量运算, 则处理该基带信号的任务划分为矢量处理。
所述将处理当前基带信号的任务划分类型之后, 该方法还包括: 使用 专用于高效完成信号处理运算中的标量运算的 SCORE 中的 CU-S 向 QAU S发送 QAU指令, 控制 QAU— S执行相应的标量运算操作;
所述 SCORE中的 QAU-S执行信号处理运算中的标量运算。
步骤 402 : SCORE 向 VCORE 提供所需的参数, 将处理任务发给 VCORE, 所述 VCORE进行矢量运算以及与矢量运算操作具有紧耦合关 系的标量运算操作, 将计算结果返回给 SCORE, 结束处理流程。
具体的, SCORE通过和 VCORE之间的专用总线通信路径, 将处理任 务写入 VCORE的标量寄存器堆; 所述 VCORE收到处理任务后, VCORE 对处理任务进行计算,完成计算后将计算结果返回给 SCORE;所述 SCORE 收到计算结果后,判断是否仍有处理任务需要处理,若有,则返回步骤 401, 若没有, 则结束处理流程。
所述 VCORE进行计算, 将计算结果返回给 SCORE, 包括:
所述 VCORE中的 CU-V并行地或相互独立地向 VAU 和 QAU— V发送 VAU指令和 QAU指令;
VAU和 QAU— V并行地或相互独立地执行相应的矢量运算操作和标量 运算操作
其中,所述 VAU根据 CU-V发来的矢量运算指令执行相应的矢量运 算操作; QAU-V根据 CU-V发来的标量运算指令执行相应的与所述矢量 运算操作具有紧耦合关系的标量运算操作。
所述 SCORE与 VCORE之间的数据交互通过专用总线通信方式; 所述 矢量计算为现有技术, 这里不做赞述。
步骤 403: SCORE向 HWA提供所需的参数,将处理任务发送给 HWA, 所述 HWA对处理任务进行计算, 将计算结果发给 SCORE。
这里, 所述计算为现有技术, 这里不做赘述。
所述 HWA对处理任务进行计算, 将计算结果返回给 SCORE, 包括:
HWA中的接口寄存器接收 SCORE发来的配置参数后, 由 HWA中 的 CU-H根据接口寄存器的配置值, 控制 HWA中的 HPU的根据 CU-H 发来的控制信息进行处理。
上述步骤 402及步骤 403完成后, 可以返回步骤 401继续进行基带 信号的任务划分。
比如,任务划分为任务(task ) 1、 task3为矢量处理, 适于在 VCORE 完成, task2为计算密集型处理在 HWA完成, 当 SCORE收到 VCORE 及 HWA返回的计算结果后, 分析 task3为矢量处理, 发送给 VCORE。 对于这样一个流程, 其相应的在 SCORE、 VCORE, HWA上的执行过程 如图 4所示, Sl、 S2、 S3分别表示 taskl、 task2、 task3在 SCORE上的 相关处理, VI、 V3表示 taskl、 task3在 VCORE上的处理, H2则表示 task2在 HWA上的处理。 图 4中的圓圈表示不同单元之间的并行执行, 可见 S2和 VI可以并行执行、 VI和 H2可以并行执行。 通过这种调度方 式可以有效地减少总体执行时间, 降低对系统的总体频率需求。
可见, 使用本发明提供的方法及装置能够根据任务分配规则灵活地调 度在 SCORE和 VCORE上的处理任务, 以减少 SCORE和 VCORE交互带 来的开销, 提升处理效率; 另外, 可以有效地利用 SCORE、 VCORE, HWA 的并行度, 提高总体处理效率。
以上所述, 仅为本发明的较佳实施例而已, 并非用于限定本发明的
保护范围。 工业实用性
本发明通过使用 VCORE 进行矢量运算以及与矢量运算操作具有紧 耦合关系的标量运算操作; HWA 负责处理不适合矢量运算的特定计算密 集型处理如峰值搜索等; SCORE 负责信号处理中的标量运算, 以及对 VCORE 和 HWA 的调度, 将处理任务以及计算参数发给 VCORE 和 HWA, 接收 VCORE和 HWA返回的计算结果。 从而根据任务分配规则 多线程的处理基带信号中的矢量及标量运算, 以减少 SCORE和 VCORE交 互带来的开销, 提升处理效率; 另外, 可以有效地利用 SCORE、 VCORE, HWA的并行度, 提高总体处理效率。
Claims
1、一种多线程处理基带信号的装置,该装置包括:标量处理器 SCORE、 矢量处理器 VCORE和硬件加速单元 HWA; 其中,
VCORE, 配置为信号处理运算中的矢量运算操作及与所述矢量运算操 作具有紧耦合关系的标量运算操作,根据 SCORE发来的参数对 SCORE发 来的处理任务进行计算, 将计算结果返回给 SCORE;
HWA,配置为信号处理运算中不适合矢量形式实现而又计算密集的 运算处理,根据 SCORE发来的参数对 SCORE发来的处理任务进行计算, 将计算结果返回给 SCORE;
SCORE, 配置为信号处理中的标量运算, 以及对 VCORE和 HWA 的调度, 将处理任务发给 VCORE和 HWA, 并接收 VCORE和 HWA返 回的计算结果, 并向 VCORE及 HWA提供参数。
2、 根据权利要求 1所述的装置, 其中, 所述 SCORE和 VCORE之间 通过预设的总线通信方式进行数据交互;
所述 SCORE和 HWA之间通过预设的总线通信方式进行数据交互; 所述 VCORE直接对 HWA进行配置。
3、 根据权利要求 1所述的装置, 其中, 所述 SCORE包括: 第二标量 处理单元 QAU-S和第二控制单元 CU-S; 其中,
QAU-S , 配置为完成 CU-S发来的处理任务中的标量运算;
CU-S , 配置为向 QAU— S发送 QAU指令, 控制 QAU— S执行相应的标 量运算操作。
4、 根据权利要求 1所述的装置, 其中, 所述 VCORE包括: 第一控制 单元 CU-V、 矢量处理单元 VAU和第一标量处理单元 QAU-V; 其中,
CU-V, 配置为并行地或相互独立地向矢量处理单元 VAU 和第一标量 处理单元 QAU— V发送 VAU指令和 QAU指令,控制矢量处理单元 VAU和
第一控制单元 QAU— V 并行地或相互独立地执行相应的矢量运算操作和标 量运算操作;
VAU, 配置为根据 CU-V发来的矢量运算指令执行相应的矢量运算 操作;
QAU-V, 配置为根据 CU-V发来的标量运算指令执行相应的与所述 矢量运算操作具有紧耦合关系的标量运算操作。
5、 根据权利要求 1所述的装置, 其中, 所述 HWA包括: 接口寄存 器、 控制单元 CU-H以及数据处理单元 HPU; 其中,
接口寄存器, 配置为接收 SCORE发来的配置参数;
CU-H, 根据接口寄存器的配置值, 配置为控制 HPU的执行;
HPU, 配置为根据 CU-H发来的控制信息进行处理。
6、 一种多线程处理基带信号的方法, 该方法包括:
SCORE执行当前基带信号处理中的标量运算, 对 VCORE和 HWA 的调度, 将处理任务发给 VCORE和 HWA;
VCORE执行信号处理运算中的矢量运算操作及与所述矢量运算操作 具有紧耦合关系的标量运算操作,根据 SCORE发来的参数对 SCORE发来 的处理任务进行计算, 将计算结果返回给 SCORE; HWA执行信号处理 运算中不适合矢量形式实现而又计算密集的运算处理,根据 SCORE发来 的参数对 SCORE发来的处理任务进行计算,将计算结果返回给 SCORE;
SCORE接收 VCORE和 HWA返回的计算结果。
7、 根据权利要求 6所述的方法, 其中, 所述方法还包括:
使用专用于高效完成信号处理运算中的标量运算的 SCORE中的 CU-S 向 QAU— S发送 QAU指令, 控制 QAU— S执行相应的标量运算操作;
所述 SCORE中的 QAU-S执行信号处理运算中的标量运算。
8、 根据权利要求 6所述的方法, 其中, 所述 VCORE进行计算, 将计
算结果返回给 SCORE, 包括:
所述 VCORE中的 CU-V并行地或相互独立地向 VAU 和 QAU— V发送 VAU指令和 QAU指令;
VAU和 QAU— V并行地或相互独立地执行相应的矢量运算操作和标量 运算操作,
其中,所述 VAU根据 CU-V发来的矢量运算指令执行相应的矢量运 算操作; QAU-V根据 CU-V发来的标量运算指令执行相应的与所述矢量 运算操作具有紧耦合关系的标量运算操作。
9、 根据权利要求 6所述的方法, 其中, 所述 HWA对处理任务进行计 算, 将计算结果返回给 SCORE, 包括:
HWA中的接口寄存器接收 SCORE发来的配置参数后, 由 HWA中 的 CU-H根据接口寄存器的配置值, 控制 HWA中的 HPU的根据 CU-H 发来的控制信息进行处理。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310003651.1A CN103914426B (zh) | 2013-01-06 | 2013-01-06 | 一种多线程处理基带信号的方法及装置 |
CN201310003651.1 | 2013-01-06 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2014106400A1 true WO2014106400A1 (zh) | 2014-07-10 |
Family
ID=51040121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2013/084366 WO2014106400A1 (zh) | 2013-01-06 | 2013-09-26 | 一种多线程处理基带信号的方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN103914426B (zh) |
WO (1) | WO2014106400A1 (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1523895A (zh) * | 1996-08-19 | 2004-08-25 | 三星电子株式会社 | 视频数据处理方法及装置 |
CN101799771A (zh) * | 2010-04-09 | 2010-08-11 | 上海华为技术有限公司 | 一种线程切换的矢量现场切换方法和装置 |
CN102170678A (zh) * | 2011-05-10 | 2011-08-31 | 中兴通讯股份有限公司 | 一种峰值搜索方法及装置 |
WO2012056368A1 (en) * | 2010-10-29 | 2012-05-03 | Nokia Corporation | Method and apparatus for providing efficient context classification |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4949250A (en) * | 1988-03-18 | 1990-08-14 | Digital Equipment Corporation | Method and apparatus for executing instructions for a vector processing system |
US5717947A (en) * | 1993-03-31 | 1998-02-10 | Motorola, Inc. | Data processing system and method thereof |
CN100442847C (zh) * | 2005-11-25 | 2008-12-10 | 浙江大学 | H.264整数变换加速的装置 |
CN102053945B (zh) * | 2009-11-09 | 2012-11-21 | 中国科学院过程工程研究所 | 一种面向多尺度离散模拟的并行计算系统 |
-
2013
- 2013-01-06 CN CN201310003651.1A patent/CN103914426B/zh active Active
- 2013-09-26 WO PCT/CN2013/084366 patent/WO2014106400A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1523895A (zh) * | 1996-08-19 | 2004-08-25 | 三星电子株式会社 | 视频数据处理方法及装置 |
CN101799771A (zh) * | 2010-04-09 | 2010-08-11 | 上海华为技术有限公司 | 一种线程切换的矢量现场切换方法和装置 |
WO2012056368A1 (en) * | 2010-10-29 | 2012-05-03 | Nokia Corporation | Method and apparatus for providing efficient context classification |
CN102170678A (zh) * | 2011-05-10 | 2011-08-31 | 中兴通讯股份有限公司 | 一种峰值搜索方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103914426B (zh) | 2016-12-28 |
CN103914426A (zh) | 2014-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101486025B1 (ko) | 프로세서에서의 쓰레드 스케쥴링 | |
WO2012052773A1 (en) | Data processing systems | |
US20150143073A1 (en) | Data processing systems | |
KR101622266B1 (ko) | 재구성 가능 프로세서 및 이를 이용한 인터럽트 핸들링 방법 | |
US9285793B2 (en) | Data processing unit including a scalar processing unit and a heterogeneous processor unit | |
JP2000047872A (ja) | 低消費電力動作機能を備えたマイクロプロセッサ | |
JP2017509059A (ja) | 電力消費を低減するための割り込み処理の同期化 | |
US10915488B2 (en) | Inter-processor synchronization system | |
JP6494155B2 (ja) | ミニコア基盤の再構成可能プロセッサ、そのためのスケジュール装置及び方法 | |
US12086592B2 (en) | Processor, processing method, and related device for accelerating graph calculation | |
JPWO2009005089A1 (ja) | データ暗号化/復号化処理方法およびデータ処理装置 | |
WO2015188016A2 (en) | Energy-efficient real-time task scheduler | |
WO2019153683A1 (zh) | 一种可配置且具弹性的指令调度器 | |
WO2006109835A1 (ja) | プロセッサ | |
JP2008152409A (ja) | 半導体集積回路 | |
WO2014106400A1 (zh) | 一种多线程处理基带信号的方法及装置 | |
US20160246740A1 (en) | Processor system having nested vectored interrupt controller | |
GB2484906A (en) | Data processing unit with scalar processor and vector processor array | |
JP2004038751A (ja) | プロセッサ及び命令制御方法 | |
US20160034291A1 (en) | System on a chip and method for a controller supported virtual machine monitor | |
CN107832255B (zh) | 一种运行时动态请求可重构核的优化方法 | |
JP4386852B2 (ja) | 信号処理装置 | |
KR20140105805A (ko) | 디지털 신호 프로세서 및 베이스밴드 통신 디바이스 | |
GB2484903A (en) | Power saving in a data processing unit with scalar processor, vector processor array, parity and FFT accelerator units | |
CN111984328B (zh) | 具有ooda循环分区机制的流式处理器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 13870162 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 13870162 Country of ref document: EP Kind code of ref document: A1 |