瑞萨电子与Syntiant共同开发结合先进视觉与语音技术的语音控制多模态AI解决方案


原标题:瑞萨电子与Syntiant共同开发结合先进视觉与语音技术的语音控制多模态AI解决方案
瑞萨电子与Syntiant共同开发的结合先进视觉与语音技术的语音控制多模态AI解决方案,是面向物联网和边缘系统的一项创新技术。以下是对该解决方案的详细分析:
一、解决方案概述
瑞萨电子(Renesas)与Syntiant宣布共同开发出一款语音控制的多模态AI解决方案,该方案在基于视觉AI的物联网和边缘系统(如自助收银机、安全摄像头和视频会议系统)以及智能家电(如扫地机器人等)中实现了低功耗、非接触式的图像处理。该解决方案结合了瑞萨RZ/V系列视觉AI微处理器(MPU)和低功耗多模态、多功能Syntiant NDP120 Neural Decision Processor™,提供了先进的语音和图像处理功能。
二、核心技术与特点
瑞萨RZ/V系列视觉AI微处理器(MPU):
集成了瑞萨独有的DRP-AI(动态可配置处理器-AI)加速器,将高精度AI推理与业界领先能效充分结合。
卓越能效可消除对散热片或冷却风扇等散热措施的需求,降低材料清单(BOM)成本,使视觉AI集成至广泛的嵌入式应用成为可能。
Syntiant NDP120 Neural Decision Processor™:
集成了复杂的AI功能,可用于众多高精度免提语音应用,包括演讲人识别、关键词检测、多唤醒词和本地命令识别等。
-NDP120与Syntiant Core 2™神经网络推理引擎封装,可同时运行多个应用程序,并将功耗降至1mW电池功率。多模态架构:
该解决方案具备常开功能,可从待机模式快速通过语音激活,以执行物体识别、面部识别等视觉任务,以及其它安防摄像机等系统的关键功能。
多模态架构使得为基于视觉AI的系统创建非接触式用户体验变得更加容易。
三、应用场景与优势
应用场景:
物联网和边缘系统:如自助收银机、安全摄像头和视频会议系统。
智能家电:如扫地机器人等。
优势:
低功耗:利用专用的高能效芯片进行语音识别,降低待机功耗。
快速开发:可以独立于视觉AI功能进行软件开发,加速系统开发进程。
非接触式体验:多模态架构使得基于视觉AI的系统能够提供更安全的非接触式用户体验。
四、市场与前景
根据瑞萨电子和Syntiant的预测,随着物联网和边缘计算的快速发展,对采用多输入信息流(包括图像和语音)的多模态系统需求将会增加。因此,这款结合先进视觉与语音技术的语音控制多模态AI解决方案具有广阔的市场前景。
五、合作方简介
瑞萨电子:全球半导体解决方案供应商,致力于提供创新的半导体解决方案,以推动社会的智能化发展。
Syntiant:深度学习芯片技术供应商,专注于在边缘设备领域推动低功耗智能语音及传感器处理技术。
综上所述,瑞萨电子与Syntiant共同开发的语音控制多模态AI解决方案是一项创新的技术成果,将在物联网和边缘计算领域发挥重要作用。
责任编辑:David
【免责声明】
1、本文内容、数据、图表等来源于网络引用或其他公开资料,版权归属原作者、原发表出处。若版权所有方对本文的引用持有异议,请联系拍明芯城(marketing@iczoom.com),本方将及时处理。
2、本文的引用仅供读者交流学习使用,不涉及商业目的。
3、本文内容仅代表作者观点,拍明芯城不对内容的准确性、可靠性或完整性提供明示或暗示的保证。读者阅读本文后做出的决定或行为,是基于自主意愿和独立判断做出的,请读者明确相关结果。
4、如需转载本方拥有版权的文章,请联系拍明芯城(marketing@iczoom.com)注明“转载原因”。未经允许私自转载拍明芯城将保留追究其法律责任的权利。
拍明芯城拥有对此声明的最终解释权。