华为海思昇腾系列芯片具有较高的能效比,以昇腾 310 和昇腾 910 为例:
- 昇腾 3101:这是一款高能效、灵活可编程的人工智能处理器,采用 12nm 工艺制程,在典型配置下可以输出 16TOPS@INT8、8TOPS@FP16,而功耗仅为 8W,其能效比表现出色,能够为低功耗场景提供高效的 AI 计算能力,适用于边缘计算、智能终端等对功耗要求较为严格的领域。
- 昇腾 9101:基于自研达芬奇架构 3D Cube 技术,支持云边端全栈全场景应用。半精度(FP16)算力达到 320TFLOPS,整数精度(INT8)算力达到 640TOPS,功耗 310W。虽然功耗相对较高,但考虑到其强大的算力,在数据中心等对算力需求极高的场景中,也能实现较高的能效比,以较低的能耗提供强大的 AI 计算支持。
华为昇腾系列芯片能效比高的主要原因如下:
- 自研达芬奇架构:以高性能的 3D Cube 矩阵计算单元为基础,每个矩阵计算单元可以由一条指令完成 4096 次乘加计算,并且处理器内部还支持多维计算模式,如标量、矢量、矩阵等,增加了计算的灵活度,同时支持多种类混合精度计算,能在不同场景下发挥出芯片的能耗优势。
- 优化芯片设计:集成了张量、矢量、标量等多种运算单元,采用场景化视角进行系统性设计,内置多种硬件加速器,还配备了一定容量的片上缓冲区,可提供高带宽、低延迟、高效率的数据交换和访问,减少了数据在片外传输的能耗。
- 先进制程工艺:采用先进的制程工艺,如昇腾 310 采用 12nm 工艺,昇腾 910 采用 7nm 工艺,能够在相同的芯片面积上集成更多的晶体管,提高芯片的性能,同时降低功耗。