0 卖盘信息
BOM询价
您现在的位置: 首页 > 技术方案 >工业控制 > 使用瑞萨电子RA8M1 MCU快速部署强大而高效的AI和机器学习

使用瑞萨电子RA8M1 MCU快速部署强大而高效的AI和机器学习

来源: digikey
2024-03-25
类别:工业控制
eye 1
文章创建人 拍明芯城

  作者:Kenton Williston

  人工智能 (AI)、机器学习 (ML) 和物联网 (IoT) 网络边缘的其他计算密集型工作负载的兴起给微控制器 (MCU) 带来了额外的处理负载。即使设计人员被要求最大限度地降低功耗并加快上市时间,处理这些新的工作负载也会增加功耗。

  设计人员需要一种计算选项,既能保持 MCU 的效率,又能添加专门针对低功耗用例定制的高性能功能。此选项还应保留与传统 MCU 相关的简单部署模型,同时添加足够的功能来支持 AI 和 ML 启用的复杂应用程序,例如语音控制和预测性维护。

  本文讨论了推动人工智能和机器学习需求的因素,并解释了为什么需要新的处理器架构来有效地提供这些功能。然后介绍瑞萨电子的RA8M1 MCU 系列,并展示如何使用它来满足这些要求。

  边缘AI和ML的要求

  从楼宇自动化、工业设备到家用电器,边缘物联网应用对人工智能和机器学习的需求不断增加。即使是相对较小的低功耗嵌入式系统现在也承担着关键字识别、语音命令控制和音频/图像处理等工作负载。目标应用包括传感器集线器、无人机导航和控制、增强现实 (AR)、虚拟现实 (VR) 和通信设备。

  为了最大限度地减少能源使用、开销和延迟,同时确保隐私,通常首选在边缘处理数据而不是将其发送到云端。这对设计人员来说是一个挑战,因为边缘设备通常资源有限,特别是在电池供电时。

  用于边缘计算的增强型 MCU

  AI 和 ML 工作负载通常涉及在大型数据集中重复执行相同的数学运算。这些工作负载可以使用单指令、多数据 (SIMD) 处理进行加速。 SIMD 并行执行多项数学运算,与传统处理相比,可提供更高的吞吐量和更高的能效。

  由于传统 MCU 缺乏 SIMD 功能,因此它们需要帮助执行 AI 和 ML 工作负载。一种解决方案是与 MCU 一起使用数字信号处理器 (DSP) 或其他 SIMD 加速器。然而,这种多处理器方法使系统设计变得复杂。

  另一种选择是改用配备 SIMD 功能的更高性能微处理器单元 (MPU)。这可以在单处理器设置中提供必要的性能,但 MPU 在功耗和功能集方面需要权衡。例如,并非所有 MPU 都旨在提供面向 MCU 的应用程序所需的确定性、低延迟计算。

  在 MCU 中启用 AI 和 ML

  瑞萨电子认识到需要一套优化的 MCU 来支持 AI 和 ML 工作负载,因此推出了 RA8M1 MCU 系列(图 1)。该系列基于配备 Helium 和 TrustZone 的Arm® Cortex®-M85 架构,运行频率为 480 兆赫 (MHz),典型功耗为每兆赫 225 微安 (μA/MHz)。

  

Renesas RA8M1 MCU示意图(点击放大)


  图 1:Renesas RA8M1 MCU 基于 Arm Cortex-M85,并采用 Helium 技术来加速 AI 和 ML 处理。 (图片来源:瑞萨)

  RA8M1 MCU 专为高效性能和低功耗而设计,具有确定性、短中断时间和最先进的电源管理支持等功能。该处理器的性能效率达到 6.39 CoreMark 每兆赫 (CoreMark/MHz)。

  Helium 是一种 SIMD M-Profile 矢量扩展 (MVE),可显着加速信号处理和 ML。它添加了 150 个标量和向量指令,并支持 128 位寄存器的处理(图 2)。它针对资源受限、低功耗的微控制器进行了优化。例如,Helium 重用浮点单元 (FPU) 寄存器,而不是引入新的 SIMD 寄存器。这有助于降低处理器的功耗并降低设计复杂性。

  

Helium 重用 FPU 寄存器组进行矢量处理的示意图


  图 2:Helium 重用 FPU 寄存器组进行矢量处理。 (图片来源:Arm)

  如图 3 所示,RA8M1 的 Cortex-M85 包含 Arm 的 TrustZone 技术。 TrustZone 为关键固件、资产和私人信息提供硬件隔离。 Cortex-M85 还添加了新的安全保障功能,例如指针身份验证和分支目标识别 (PACBTI) 扩展。这些安全功能在设备可能与个人数据交互的人工智能环境中特别有价值。

  

Arm Cortex-M85 的 TrustZone 图像


  图 3:Cortex-M85 的 TrustZone 为关键固件、资产和私人信息提供硬件隔离。 (图片来源:Arm)

  支持 AI 的 MCU 需要具备的硬件功能

  MCU 应将高效性能与强大的功能集结合起来,以支持人工智能应用。 RA8M1 配备齐全,适用于电机控制、可编程逻辑控制 (PLC)、计量以及其他工业和物联网应用。

  例如,人工智能算法需要大量内存。 RA8M1 系统存储器包括高达 2 兆字节 (Mbytes) 的闪存和 1 MB 的 SRAM。 SRAM 包括 128 KB 的紧耦合存储器 (TCM),可实现快速存储器访问以实现高性能计算。

  为了确保可靠运行,384 KB 的用户 SRAM 和整个 128 KB TCM 被配置为纠错码 (ECC) 存储器。 32 KB 指令和数据高速缓存也受 ECC 保护。

  除了 Arm 内核中包含的功能之外,RA8M1 还包含多种安全功能。其中包括用于安全数据处理的可重编程安全知识产权 (RSIP) 加密引擎、用于关键数据保护的不可变存储以及篡改保护机制。

  对于通信接口,MCU 配备了用于网络连接的以太网、用于汽车和工业应用的控制器局域网灵活数据速率 (CAN FD) 以及用于一般连接的 USB 高速/全速。它还集成了一个摄像头接口和一个八进制串行外设接口 (SPI),可对外部存储器进行动态解密。

  模拟接口包括 12 位模数转换器 (ADC) 和数模转换器 (DAC)、高速模拟比较器以及三个采样保持电路。对于串行通信,RA8M1 支持多种协议,包括带 SPI 的串行通信接口 (SCI)、通用异步接收器/发送器 (UART) 和内部集成电路 (I²C) 模式。该 MCU 还提供改进的内部集成电路 (I3C),以提高数据传输速率和效率。

  需要完全访问这些输入/输出 (I/O) 功能的开发人员可以使用球栅阵列 (BGA) 封装,例如 224 引脚R7FA8M1AHECBD#UC0。寻求更简化的印刷电路板 (PC 板) 设计和组装流程的用户可以考虑使用薄型四方扁平封装 (LQFP) 选项,例如 144 引脚 R7FA8M1AHECFB #AA0。

  AI应用程序的开发环境

  有兴趣尝试 RA8M1 系列的设计人员可以从EK-RA8M1 R7FA8M评估板开始(图 4)。该板包括一个 RJ45 RMII 以太网接口、一个 USB 高速主机和设备接口以及一个三引脚 CAN FD 接头。对于存储器,它具有 64 MB 八进制 SPI 闪存。

  

Renesas EK-RA8M1 评估板图片(点击放大)


  图 4:EK-RA8M1 评估板具有强大的 I/O 支持来测试 RA8M1 MCU。 (图片来源:瑞萨)

  RA8M1 由瑞萨电子灵活软件包(FSP) 支持,这是一个综合框架,旨在为嵌入式系统设计提供用户友好、可扩展且高质量的软件基础。

  该软件包提供了开发工具,包括基于流行的 Eclipse IDE 的e² studio集成开发环境 (IDE)。它还包含两个著名的免版税实时操作系统:Azure RTOS 和 FreeRTOS。

  该软件包包括轻量级、生产就绪的驱动程序,支持嵌入式系统中的常见用例。这些驱动程序与评估板相结合,为开发人员提供了快速试验 RA8M1 I/O 的途径。

  结论

  RA8M1 为开发人员提供了在边缘物联网应用中实施 AI 和 ML 工作负载的新选择,从而节省功耗、增强性能、降低复杂性并缩短上市时间。



责任编辑:David

【免责声明】

1、本文内容、数据、图表等来源于网络引用或其他公开资料,版权归属原作者、原发表出处。若版权所有方对本文的引用持有异议,请联系拍明芯城(marketing@iczoom.com),本方将及时处理。

2、本文的引用仅供读者交流学习使用,不涉及商业目的。

3、本文内容仅代表作者观点,拍明芯城不对内容的准确性、可靠性或完整性提供明示或暗示的保证。读者阅读本文后做出的决定或行为,是基于自主意愿和独立判断做出的,请读者明确相关结果。

4、如需转载本方拥有版权的文章,请联系拍明芯城(marketing@iczoom.com)注明“转载原因”。未经允许私自转载拍明芯城将保留追究其法律责任的权利。

拍明芯城拥有对此声明的最终解释权。

相关资讯