燧原科技亮相Hot Chips大会,详解邃思芯片架构


原标题:燧原科技亮相Hot Chips大会,详解邃思芯片架构
燧原科技在Hot Chips大会上详解了邃思芯片架构,这一举动展示了燧原科技在高性能微处理器和集成电路领域的研发实力。以下是对邃思芯片架构的详细解析:
一、邃思芯片概述
邃思芯片是燧原科技自主研发的一系列高性能AI芯片,包括训练芯片和推理芯片。这些芯片专为云端训练和推理场景设计,旨在提供高效、可靠的AI计算能力。
二、邃思训练芯片架构(以邃思1.0和邃思2.0为例)
邃思1.0
众核结构:采用燧原科技自研的GCU-CARE计算引擎,整个SOC拥有32个GCU-CARE计算引擎,组成4个计算群组。
全面支持常见AI张量数据格式:包括FP32/FP16/BF16, INT8/INT16/INT32,能够更全面地支撑客户业务。
高效数据架构:GCU-DARE数据架构面向数据流优化,提供512GB/s的HBM和200GB/s的GCU-LARE互联,数倍于传统GPU、CPU。
分布式片上共享缓存:提供10TB/s的超大带宽,可编程共享缓存,可控线程内、线程间数据常驻共享,降低数据访问延时并节约IO带宽。
灵活互联:四路GCU-LARE智能互联,支持千卡级规模集群,为大中小型数据中心提供基于不同需求的人工智能训练产品组合。
发布时间:2019年12月
架构特点:
应用场景:支持CNN、RNN、LSTM、BERT等常用人工训练模型,可用于图像、流数据、语音等训练场景。
邃思2.0
发布背景:在邃思1.0的基础上进行了全面升级,成为国内首家发布第二代人工智能训练产品组合的公司。
计算能力:单精度FP32峰值算力达到40TFLOPS,单精度张量TF32峰值算力达到160TFLOPS。
存储与带宽:搭载了4颗HBM2E片上存储芯片,高配支持64GB内存,带宽达1.8TB/s。
互联能力:GCU-LARE全面升级,提供双向300GB/s互联带宽,支持数千张云燧CloudBlazer加速卡互联。
软件平台:同步升级的驭算TopsRider软件平台,成为燧原科技构建原始创新软件生态的基石。
三、邃思推理芯片架构(以邃思2.5为例)
发布时间:2021年12月
核心尺寸与工艺:Die核心尺寸为55mm×55mm,采用格芯12nm FinFET工艺打造。
架构特点:
高性能计算核心:采用第二代GCU-CARA架构,大幅提升单位面积的晶体管效率。
全面支持多种计算类型:张量、向量、标量计算全支持,同时支持虚拟化、动态节能技术等。
高效数据压缩格式:采用完全自研的Sparse Value Segment数据压缩格式,减少数据传输过程中的带宽和功耗。
高速内存与带宽:配备两颗HBM2e显存,容量16GB,带宽819GB/s。
四、总结
燧原科技的邃思芯片架构展示了其在AI芯片领域的深厚技术积累和创新能力。通过不断优化芯片架构和提升性能,燧原科技为云端训练和推理场景提供了高效、可靠的解决方案,推动了AI技术的广泛应用和发展。
责任编辑:David
【免责声明】
1、本文内容、数据、图表等来源于网络引用或其他公开资料,版权归属原作者、原发表出处。若版权所有方对本文的引用持有异议,请联系拍明芯城(marketing@iczoom.com),本方将及时处理。
2、本文的引用仅供读者交流学习使用,不涉及商业目的。
3、本文内容仅代表作者观点,拍明芯城不对内容的准确性、可靠性或完整性提供明示或暗示的保证。读者阅读本文后做出的决定或行为,是基于自主意愿和独立判断做出的,请读者明确相关结果。
4、如需转载本方拥有版权的文章,请联系拍明芯城(marketing@iczoom.com)注明“转载原因”。未经允许私自转载拍明芯城将保留追究其法律责任的权利。
拍明芯城拥有对此声明的最终解释权。