机器人语音唤醒芯片的功耗能降低到多少微瓦？

机器人语音唤醒芯片的功耗能降低到多少微瓦？语音唤醒功能已成为服务机器人、家用机器人和陪伴式机器人最核心的人机交互入口之一，要求芯片能够在极低功耗下保持始终在线的语音活动监测，只有在检测到预设唤醒词或者有效语音时才能唤醒主处理器执行后续的识别和理解任务。当前最先进的语音唤醒和语音活动检测芯片已经将功耗压缩到了微瓦级的极致水平，彻底打破了传统数字信号处理方案在功耗和性能之间的牵制。POLYN Technology公司于2025年推出的基于神经形态模拟信号处理技术的NeuroVoice VAD芯片，型号NV-VAD 100，在工作状态下的功耗仅为30至35微瓦，响应延迟仅为25毫秒，能够在任何嘈杂的背景环境中可靠地完成语音活动检测任务。NASP是2025年初推出的混合模拟-数字架构，在模拟域中执行神经网络推理，通过模拟生物神经计算的方式原生处理传感器信号，从根本上消除了数字转换所引入的功耗和延迟代价。

与此同时，国内厂商在低功耗语音唤醒芯片领域同样展示了强大的技术实力。某国产量产的语音唤醒芯片通过精密电路控制将待机功耗降至5微瓦以下，同时保证声音特征的持续在线监测，语音唤醒耗时可压缩至0.15秒，每日的耗电占比从传统方案中的37%大幅下降至5.8%。这一突破意味着即使是仅靠纽扣电池或者小型锂电池供电的可穿戴设备和微型机器人，也能够实现全天候的语音交互待机而无需频繁充电。AONDevices公司与Realtek联合推出的边缘AI平台将微瓦级功耗范围的处理器与低功耗蓝牙BLE连接相融合，支持唤醒词识别、语音命令、声学事件检测以及基于ML驱动的运动和环境传感器融合理解等多种机器学习功能包的并行运行。这种多模态始终在线处理能力对于需要融合语音、视觉和运动信息的下一代智能机器人而言具有重要的架构意义。

从低功耗实现的技术路线来看，语音唤醒芯片主要从三个层面进行了优化。在算法层面，硬件级别的VAD和唤醒词检测越来越多地采用深度神经网络模型，但与传统DSP跑CNN的区别在于采用了剪枝、量化和知识蒸馏等模型压缩技术，将模型参数量和计算量缩减到适合极小面积和极低功耗硬件实现的程度。在架构层面，NeuroVoice VAD之所以能将功耗降至几十微瓦，关键在于其在模拟域完成绝大部分神经网络推理运算，只有少量控制逻辑和数字接口采用标准数字电路实现。而在数字域中，采用异步电路设计、门控时钟、多电压域和动态电压频率缩放等技术的组合，可以使唤醒词检测核心在大部分时间内工作于近阈值或亚阈值电压区域，只有在检测到有效语音后才快速升频升压完成详细的特征提取和分类运算。STMicroelectronics和NXP等传统MCU大厂也在各自的跨界处理器和音频DSP产品线中集成了低功耗语音唤醒通路，例如恩智浦i.MX RT685在芯片设计层面实现了常开模式下的低主频运行功耗和静态功耗优化，为多场景应用下的超长续航和随时唤醒提供了保障。

对于机器人系统集成商而言，语音唤醒芯片的功耗选择需要综合考虑三个因素。一是功耗水平与唤醒准确率的平衡，降低功耗通常意味着降低模型复杂度和运算精度，可能增加误唤醒和漏唤醒的概率，尤其在强噪声环境中更为明显。二是在整个系统功耗预算中的占比，对于电池容量数十瓦时的中型服务机器人，几十微瓦到几百微瓦的语音唤醒功耗几乎可以忽略不计，但对于续航要求极高的微型机器人或者可穿戴设备，数微瓦和数十微瓦之间的差异就可能决定产品能否满足终端用户的期望。三是是否需要集成更多的传感器融合处理功能，AONDevices展示的微瓦级处理器能够同时处理语音唤醒和环境声学事件检测，一定程度上减少了单独使用环境声传感器的硬件成本和功耗开销。展望未来，随着神经形态计算和模拟AI加速器技术的进一步发展，语音唤醒芯片的功耗有望从目前的几微瓦到几十微瓦的水平继续向亚微瓦级别迈进，最终实现无需顾虑功耗的永远在线语音交互。

商品分类