站点图标 CNX中文站

可用于AIoT应用的T-Head玄铁C908 RISC-V内核

本文共计 763 字,预计阅读 2 分钟

最近我已经看到有两款高端 RISC-V 内核发布了,分别是 SiFive P670 和Andes AX65 处理器。这两个处理器都有 4 路乱序流水线。但本文要介绍的阿里巴巴 T-Head 半导体玄铁 C908 有所不同,这款产品采用了高效 9 级双发按序流水线,可以支持针对中端 AIoT 应用的 RISC-V Vector 扩展加速。

C908 64 位 RISC-V 内核采用的是 RV64GCB[V] 指令、符合 RVA22 profile、可以更好地兼容 Android 等“主流”操作系统。阿里 T-Head 表示,玄铁 C908 的性能介于 2020 年和 2019 年分别推出的 C906 和 C910 内核之间。

阿里巴巴 T-Head 玄铁 C908 的特点:

阿里 T-Head 还提供了该产品与 C908 T-Head C906 单发按序处理器的性能对比,但现在他们并没有提供它与更高端 C910 的数据对比。

通过 Linkpacks、Coremark、Whetstone 和 Dhrystone 等综合基准,C908 的性能比 C906 提高了 24% 到 64%。但我暂时还是不知道被测内核的制造工艺和频率,所以结果可能没有太大意义,除非两个内核使用的是相同节点和频率。

玄铁 C908 的运行频率最高可达 2GHz,采用的是台积电 12 纳米工艺,单核动态功耗低至 52.8mW/GHz。在相同频率和工艺限制(未定义)的典型场景下,玄铁C908 的能效比玄铁 C906 提升了 20% 以上。

RISC-V Vector Extension 1.0 确实有助于 AI 工作负载,在相同条件下,对使用 INT4 数据类型的唤醒词检测、图像分类、关键字定位和 MLPerf 微型 V0.7推理性能测试的异常检测中,C908 比 C906 快了大约 2 到 3.5 倍。

新的 C908 之后应该就会在 T-Head 网站上出售了,但目前我唯一能找到的公开信息只有 RISC-V 博客上的有一些

分享这篇文章
退出移动版