0 卖盘信息
BOM询价
您现在的位置: 首页 > 技术方案 >计算机及配件 > FTPA: 一种具有可配置核的灵活多核处理器结构(三)

FTPA: 一种具有可配置核的灵活多核处理器结构(三)

来源: 维库电子网
2021-04-14
类别:计算机及配件
eye 16
文章创建人 拍明

原标题:FTPA: 一种具有可配置核的灵活多核处理器结构(三)

 3 性能评估

  相对于现有的灵活多核处理器结构,FTPA在灵活性和通信开销上都有巨大进步,前者为FTPA 功耗和资源利用率的改进提供了巨大的优化空间,而后者则对性能带来有效提升。 本节量化评估FTPA 的低通信开销设计对程序性能的影响。3. 1 实验环境介绍

  FTPA 采用EDGE 指令集,因此我们复用了TFlex 软件模拟器的指令集定义部分,而重写了微结构部分。 SPEC2K 测试程序使用Scale[16]编译器生成可执行程序,超块内指令调度拓扑选项设为4,对应每个物理核内的4 个指令子队列。 测试程序均采用Ref 输入集。 鉴于软件模拟器的速度限制,每个测试程序运行50 M 个超块。 FTPA 每个物理核的配置在表1 中列出。

  3.2 实验结果及分析

  使用时钟的FTPA 模拟器,我们评估了16 个物理核组成的FTPA 逻辑核性能。 图4 示出了FTPA 物理核分别配置为4 发射和16 发射时的性能对比,数据相对配置为1 发射时的性能进行了归一化处理。 从实验结果可以看到,对于SPEC2K 这样的通用应用,物理核从1 发射增加到4 发射对性能的影响显着,平均提升33. 6% .但是,物理核从4 发射增加到16 发射,对性能的提升非常小,平均只有1. 5% 的提升。 该实验结果验证了FTPA 的4 发射物理核设计的合理性。

  FTPA 通信开销减小主要来自2 部分: 指令间通信和寄存器文件访问,分别对应第4 节物理核和逻辑核设计。 图5 示出了2 种通信开销的降低对性能的影响。 图5 中第1 项数据是TFlex 的性能数据,第2 项为实现4 发射物理核但仍采用全局共享寄存器文件的性能数据。 从该结果可以看出,超块内指令间通信开销的减小为程序整体性能带来了平均13. 3% 的提升。 第3 项显示了采用寄存器私有化后FTPA 的性能,从结果可以看出,寄存器文件访问通信的减少又带来平均5. 2% 的性能提升。 从而,相比于TFlex,指令间数据通信和寄存器文件访问通信开销的减少,总共为FTPA带来了平均19. 2% 的性能提升。

  4 讨论

  在改进通信开销和灵活性的同时,FTPA 也对处理器设计提出了新的挑战。 下一步工作主要从2 方面展开: 首先是探索何时对计算资源、何时对共享资源进行调整。 我们的思路是通过周期性统计IPC、执行部件利用率和各级高速缓存命中率,来判断对资源的调整时机; 其次,本文量化评估的程序主要是SPEC2K 这样的通用应用,对单个超块粒度而言,4 发射可以满足大部分并行需求。 但是对于数据级并行应用,4 发射物理核往往无法满足性能需求。 我们的初步想法是在逻辑核层面再增加,即首先由多个物理核组成逻辑核,每个超块对应一个逻辑核; 然后多个逻辑核再组成环形拓扑的二级逻辑核,这样在保证超块内并行性的同时,在各级逻辑上也能保持高灵活性。

  5 结论

  本文针对处理器核可配置的灵活多核处理器结构存在的问题,特别是在指令间通信开销、逻辑核重构开销和灵活性3 方面的不足,设计了具有低通信开销和高灵活性的FTPA 结构。 结合对通用应用的超块并行性的分析,发现4 发射的物理核可以在满足并行性的前提下,化超块内指令的数据通信开销; 同时,显式数据流编码的超块,可以通过编译器对指令放置进行静态调度,从而硬件上能够将指令窗口划分为4 个独立的子队列,有效简化指令发射逻辑的复杂度。 针对物理核中寄存器文件和高速缓存等共享资源对逻辑核灵活性的约束,FTPA 将寄存器文件对物理核私有化,同时将重构开销很大的高速缓存与容易扩展的计算资源进行逻辑上的分离,构建了逻辑拓扑环形、物理Mesh 的灵活多核处理器结构FTPA.

  运行SPEC2K 测试程序的结果显示,在提供了很好的灵活性的同时,相对于采用相同指令集的TFlex 结构,指令间通信和寄存器文件访问通信开销的减少,共为FTPA 带来了平均19. 2% 的性能提升。



责任编辑:

【免责声明】

1、本文内容、数据、图表等来源于网络引用或其他公开资料,版权归属原作者、原发表出处。若版权所有方对本文的引用持有异议,请联系拍明芯城(marketing@iczoom.com),本方将及时处理。

2、本文的引用仅供读者交流学习使用,不涉及商业目的。

3、本文内容仅代表作者观点,拍明芯城不对内容的准确性、可靠性或完整性提供明示或暗示的保证。读者阅读本文后做出的决定或行为,是基于自主意愿和独立判断做出的,请读者明确相关结果。

4、如需转载本方拥有版权的文章,请联系拍明芯城(marketing@iczoom.com)注明“转载原因”。未经允许私自转载拍明芯城将保留追究其法律责任的权利。

拍明芯城拥有对此声明的最终解释权。

标签: FTPA模拟器

相关资讯

方案推荐
基于MC33771主控芯片的新能源锂电池管理系统解决方案

基于MC33771主控芯片的新能源锂电池管理系统解决方案

AMIC110 32位Sitara ARM MCU开发方案

AMIC110 32位Sitara ARM MCU开发方案

基于AMIC110多协议可编程工业通信处理器的32位Sitara ARM MCU开发方案

基于AMIC110多协议可编程工业通信处理器的32位Sitara ARM MCU开发方案

基于展讯SC9820超低成本LTE芯片平台的儿童智能手表解决方案

基于展讯SC9820超低成本LTE芯片平台的儿童智能手表解决方案

基于TI公司的AM437x双照相机参考设计

基于TI公司的AM437x双照相机参考设计

基于MTK6580芯片的W2智能手表解决方案

基于MTK6580芯片的W2智能手表解决方案