CN109828932B

CN109828932B - 一种地址微调加速系统

Info

Publication number: CN109828932B
Application number: CN201910120322.2A
Authority: CN
Inventors: 费晓龙; 王磊; 杨亭
Original assignee: Huaxiaxin Beijing General Processor Technology Co ltd
Current assignee: Beijing Beiyou Anbosheng Communication Technology Co.,Ltd.
Priority date: 2019-02-18
Filing date: 2019-02-18
Publication date: 2020-12-18
Anticipated expiration: 2039-02-18
Also published as: CN109828932A

Abstract

本发明公开了地址微调技术领域的一种地址微调加速系统，包括调度单元、高位物理寄存器组、共享映射单元、地址检查单元、低位物理寄存器组、立即数检测单元、实地址微调检测、新地址生成单元、保留站、执行和虚实地址转换单元和提交单元，所述调度单元的输出端通过导线与地址检查单元、立即数检测单元和低位单元的输入端连接，所述地址检查单元的输出端通过导线与保留站、实地址微调检测和低位物理寄存器组的输入端连接，所述高位物理寄存器组的输出端通过导线与共享映射单元的输入端连接，本发明能够提升地址微调指令的执行速度，降低整体地址转换的动态功耗，如果对于某条指令不符合优化条件也可以保持之前的执行通路不变，不会发生性能下降。并且可以实现一键开关。

Description

一种地址微调加速系统

技术领域

本发明涉及地址微调技术领域，具体为一种地址微调加速系统。

背景技术

目前主流访存指令通过将地址计算信息内置到指令中，当访存模块接受指令以后，通过内部AGU计算出虚拟地址，再把虚拟地址同时输入cache和TLB完成VIPT(virtualindexedphysicaltagged)的访问形式，因此虚实地址的mapping总是需要串在AGU以后，而且需要使用地址访存的时候进行地址转换，ISA决定了访存指令的虚实地址的转换的时机，如果把访存地址计算单独抽出来成为独立的指令，并且定义特殊的体系结构寄存器，就成为另一种访存风格：每次地址计算的时候顺带完成DTLB的访问，获得实地址和属性并同虚地址一起存到体系结构寄存器，访存指令每次都通过读地址寄存器来获得实地址和页信息。后者如果编译器调度合理，可以把地址计算和mapping过程中的延迟与其它指令重合，从而保证在访存指令来的时候直接读出实地址和页信息，访问cache。但是缺点就是每次地址计算都需要访问DTLB，加长了指令的流水线长度。本发明用来加速地址调整指令，减少流水线长度。

发明内容

本发明的目的在于提供一种地址微调加速系统，以解决上述背景技术中提出的每次地址计算都需要访问DTLB，加长了指令的流水线长度。本发明用来加速地址调整指令，减少流水线长度的问题。

为实现上述目的，本发明提供如下技术方案：一种地址微调加速系统，其特征在于：包括调度单元、高位物理寄存器组、共享映射单元、地址检查单元、低位物理寄存器组、立即数检测单元、实地址微调检测、新地址生成单元、保留站、执行和虚实地址转换单元和提交单元，所述调度单元的输出端通过导线与地址检查单元、立即数检测单元和低位单元的输入端连接，所述地址检查单元的输出端通过导线与保留站、实地址微调检测和低位物理寄存器组的输入端连接，所述高位物理寄存器组的输出端通过导线与共享映射单元的输入端连接，所述共享映射单元的输出端通过导线与高位脉冲的输入端连接，所述低位脉冲的输出低端通过导线与新地址生成单元和实地址微调检测的输入端连接，所述立即数检测单元的输出端通过导线与新地址生成单元和实地址微调检测的输入端连接，所述实地址微调检测的输出端通过导线与提交单元的输入端连接，所述保留站的输出端通过导线与执行和虚实地址转换单元、新地址生成单元和共享映射单元的输入端连接，所述新地址生成单元的输出端通过导线与低位物理寄存器组、共享映射单元和保留站的输入端连接，所述执行和虚实地址转换单元的输出端通过导线与低位物理寄存器组、高位物理寄存器组和提交单元的输入端连接，每次地址生成指令写回的时候顺带检测，地址是否在某一范围内不可能跨页，用两个比特分别表示是否会跨前后相邻的两个页。范围选择可以根据微调立即数的频度作调整，如果没有跨页风险对应的比特置位。每次地址微调指令从寄存器组读出base地址之后，如果立即数小于安全距离，并且base地址寄存器的地址转换完成，直接把转换结果读出赋值给自己的地址寄存器，此时选择寄存器组读出的低位地址和立即数作运算，结果写回地址寄存器低位。

优选的，所述执行和虚实地址转换单元通过结果和跨页位与所述的低位物理寄存器组连接。

优选的，所述地址检查单元通过地址生成类型推送与所述的保留站连接。

优选的，所述低位物理寄存器组通过跨页位与所述的实地址微调检测连接。

优选的，所述保留站通过新地址写入启用与所述的新地址生成单元和所述的共享映射单元连接。

优选的，所述新地址生成单元通过保持高位变化位与所述的低位物理寄存器组连接。

优选的，所述执行和虚实地址转换单元通过清除跨页位与所述的低位物理寄存器组连接。

与现有技术相比，本发明的有益效果是：本发明能够提升地址微调指令的执行速度，降低整体地址转换的动态功耗，如果对于某条指令不符合优化条件也可以保持之前的执行通路不变，不会发生性能下降。并且可以实现一键开关。对于地址寄存器采取双物理寄存器组来区分高、地位，并且支持多低位地址映射同一高位物理寄存器，进一步简化了地址微调指令的对物理寄存器的更新，节省了面积开销，地址微调指令共享地址生成指令的映射关系和属性，并节省保留站的带宽，降低了DTLB访问的功耗，缩短了流水线长度，采用跨页危险bit来使跨页判断简单，并通过快速设置该bit，来避免更新DTLB带来的不一致错误，多个层次配置完成不同复杂度的设计，包括配置危险范围，选择是否单独开辟写回通道。

附图说明

图1为本发明系统原理框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供一种地址微调加速系统，本发明能够提升地址微调指令的执行速度，降低整体地址转换的动态功耗，如果对于某条指令不符合优化条件也可以保持之前的执行通路不变，不会发生性能下降。并且可以实现一键开关，请参阅图1，包括调度单元、高位物理寄存器组、共享映射单元、地址检查单元、低位物理寄存器组、立即数检测单元、实地址微调检测、新地址生成单元、保留站、执行和虚实地址转换单元和提交单元，所述调度单元的输出端通过导线与地址检查单元、立即数检测单元和低位单元的输入端连接，所述地址检查单元的输出端通过导线与保留站、实地址微调检测和低位物理寄存器组的输入端连接，所述高位物理寄存器组的输出端通过导线与共享映射单元的输入端连接，所述共享映射单元的输出端通过导线与高位脉冲的输入端连接，所述低位脉冲的输出低端通过导线与新地址生成单元和实地址微调检测的输入端连接，所述立即数检测单元的输出端通过导线与新地址生成单元和实地址微调检测的输入端连接，所述实地址微调检测的输出端通过导线与提交单元的输入端连接，所述保留站的输出端通过导线与执行和虚实地址转换单元、新地址生成单元和共享映射单元的输入端连接，所述新地址生成单元的输出端通过导线与低位物理寄存器组、共享映射单元和保留站的输入端连接，所述执行和虚实地址转换单元的输出端通过导线与低位物理寄存器组、高位物理寄存器组和提交单元的输入端连接。

实施例1

每次地址生成指令写回的时候顺带检测，地址是否在某一范围内不可能跨页，用两个比特分别表示是否会跨前后相邻的两个页。范围选择可以根据微调立即数的频度作调整，如果没有跨页风险对应的比特置位。每次地址微调指令从寄存器组读出base地址之后，如果立即数小于安全距离，并且base地址寄存器的地址转换完成，直接把转换结果读出赋值给自己的地址寄存器，此时选择寄存器组读出的低位地址和立即数作运算，结果写回地址寄存器低位。另一种可选的优化方式是把地址寄存器的高位、页属性、低位分开为两个物理寄存器数组，高位和页属性一组物理寄存器，地位为另一组物理寄存器，每次检测到符合条件的地址微调指令，不需要分配新的高位物理寄存器，直接把原本base的物理寄存器mapping给当前新的地址寄存器。因此在资源上高位物理寄存器的个数应该小于低位物理寄存器的个数，作为代价，前端资源检测的逻辑需要更加细致。但是更加节省面积，因为只有跨页风险的地址微调指令和地址生成指令才需要新的存储来记录庞大页的属性，这不是一个大概率事件，分开可以使微体系的设计更容易扩展。因为引入了多个物理寄存器影射同一体系结构寄存器，因此在回收的时候，需要考虑是否存在多映射问题，多映射的高位物理寄存器不可以被回收。

实施例2

为满足可加速微调指令开通单独的提交通道，让retire单元可以快速看到这笔指令的完成，至此已经完成了该类指令流水线裁剪的需求。同样，也可以开辟单独的写回通道，并且把结果给访存模块，如果开辟单独的写回通道，则该类指令不需要push进保留站，在前一级就提前完成了指令，节省了保留站发射的带宽和容量。如果考虑到额外的写回通道给访存模块带来的复杂性(更多地址相关性检测的逻辑)，可以让该类加速指令同样push进保留站，正常执行并地址转换，复用之前给访存模块的写回通路。唯一区别是现在正常通路地址转换的结果不需要写回到寄存器组(之前的快速通路已经更新了寄存器组)，获得的好处就是缩短了该条指令的流水线，可以提前retire，其他逻辑保持不变，将其他开销降到了最低。如果微调指令可以做到当周期更新物理寄存器，那么不需要额外的写回通道给访存模块，也不需要被push进保留站，因为下一周期后面的访存指令可以读到新的物理寄存器内容，如果同一周期有地址相关的访存指令和地址微调指令，那么依然需要被push进保留站，因为来不及获得最新的数据

实施例3

开辟单独的提交和写回通路，那么对于顺序微调并且连续访存的序列来说，效果是只有最开始地址生成指令需要通用计算并访问一次DTLB，之后所有没有跨页风险的访存全部不需要再次访问DTLB，大大节省了流水线功耗，做到了极致的功耗比优化。这里注意一个问题，如果编译器保证每次在更改虚实地址mapp ing或者页属性的时候，在访问更改了mapping的页内某一个地址的时候，都提前有一条地址生成指令来更新mapping和页的属性，那么不需要做任何特殊处理，每次地址微调指令都可以安心使用同一页的mapping信息和属性。但是如果不保证，那么意味着如果擅自使用一个过时的页的mapping和属性是错误的，我们要做的是当程序每次更新页时，把对应页低位物理寄存器的两个跨页风险b it清0(0代表有跨页风险，1代表没有跨页风险，上电的时候初始化为0，如果不方便挑选相关的页也可以全部统一清0)，那么新进来的这个页的微调指令就会重新正常计算虚地址并访问一次DTLB获得最新的页mapping和属性，并根据虚拟地址重新生成跨页危险bit。

综合以上所述，本发明能够提升地址微调指令的执行速度，降低整体地址转换的动态功耗，如果对于某条指令不符合优化条件也可以保持之前的执行通路不变，不会发生性能下降。并且可以实现一键开关。对于地址寄存器采取双物理寄存器组来区分高、地位，并且支持多低位地址映射同一高位物理寄存器，进一步简化了地址微调指令的对物理寄存器的更新，节省了面积开销，地址微调指令共享地址生成指令的映射关系和属性，并节省保留站的带宽，降低了DTLB访问的功耗，缩短了流水线长度，采用跨页危险bit来使跨页判断简单，并通过快速设置该bit，来避免更新DTLB带来的不一致错误，多个层次配置完成不同复杂度的设计，包括配置危险范围，选择是否单独开辟写回通道。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种地址微调加速系统，其特征在于：包括调度单元、高位物理寄存器组、共享映射单元、地址检查单元、低位物理寄存器组、立即数检测单元、实地址微调检测、新地址生成单元、保留站、执行和虚实地址转换单元和提交单元，所述调度单元的输出端通过导线与地址检查单元、立即数检测单元和低位单元的输入端连接，所述地址检查单元的输出端通过导线与保留站、实地址微调检测和低位物理寄存器组的输入端连接，所述高位物理寄存器组的输出端通过导线与共享映射单元的输入端连接，所述共享映射单元的输出端通过导线与高位脉冲的输入端连接，所述立即数检测单元的输出端通过导线与新地址生成单元和实地址微调检测的输入端连接，所述实地址微调检测的输出端通过导线与提交单元的输入端连接，所述保留站的输出端通过导线与执行和虚实地址转换单元、新地址生成单元和共享映射单元的输入端连接，所述新地址生成单元的输出端通过导线与低位物理寄存器组、共享映射单元和保留站的输入端连接，所述执行和虚实地址转换单元的输出端通过导线与低位物理寄存器组、高位物理寄存器组和提交单元的输入端连接，每次地址生成指令写回的时候顺带检测，地址是否在某一范围内不可能跨页，用两个比特分别表示是否会跨前后相邻的两个页，范围选择可以根据微调立即数的频度作调整，如果没有跨页风险对应的比特置位，每次地址微调指令从寄存器组读出base地址之后，如果立即数小于安全距离，并且base地址寄存器的地址转换完成，直接把转换结果读出赋值给自己的地址寄存器，此时选择寄存器组读出的低位地址和立即数作运算，结果写回地址寄存器低位。

2.根据权利要求1所述的一种地址微调加速系统，其特征在于：所述执行和虚实地址转换单元通过结果和跨页位与所述的低位物理寄存器组连接。

3.根据权利要求1所述的一种地址微调加速系统，其特征在于：所述地址检查单元通过地址生成类型推送与所述的保留站连接。

4.根据权利要求1所述的一种地址微调加速系统，其特征在于：所述低位物理寄存器组通过跨页位与所述的实地址微调检测连接。

5.根据权利要求1所述的一种地址微调加速系统，其特征在于：所述保留站通过新地址写入启用与所述的新地址生成单元和所述的共享映射单元连接。

6.根据权利要求1所述的一种地址微调加速系统，其特征在于：所述新地址生成单元通过保持高位变化位与所述的低位物理寄存器组连接。

7.根据权利要求1所述的一种地址微调加速系统，其特征在于：所述执行和虚实地址转换单元通过清除跨页位与所述的低位物理寄存器组连接。