可用于AIoT应用的T-Head玄铁C908 RISC-V内核

原文链接:T-Head XuanTie C908 RISC-V core targets AIoT applications 由Jean-Luc Aufranc撰写。
本文共计 763 字,预计阅读 2 分钟

最近我已经看到有两款高端 RISC-V 内核发布了,分别是 SiFive P670 和Andes AX65 处理器。这两个处理器都有 4 路乱序流水线。但本文要介绍的阿里巴巴 T-Head 半导体玄铁 C908 有所不同,这款产品采用了高效 9 级双发按序流水线,可以支持针对中端 AIoT 应用的 RISC-V Vector 扩展加速。

C908 64 位 RISC-V 内核采用的是 RV64GCB[V] 指令、符合 RVA22 profile、可以更好地兼容 Android 等“主流”操作系统。阿里 T-Head 表示,玄铁 C908 的性能介于 2020 年和 2019 年分别推出的 C906 和 C910 内核之间。

阿里巴巴 T-Head 玄铁 C908

阿里巴巴 T-Head 玄铁 C908 的特点:

  • RV32GCB[V] 32 位和 RV64GCB[V] 64 位 RISC-V 架构,具有位操作和(可选)向量操作扩展
  • 支持 RV32 COMPAT 模式,允许 64 位 RISC-V CPU 运行 32 位二进制代码,合并到Linux 5.19 中
  • 玄铁扩展,包括指令、内存属性扩展(XMAE)
  • RVA22 配置文件兼容性
  • 1 到 4 个核心的集群
  • 9级双发按序流水线
  • 特权模式– 机器、主管和用户
  • Sv39/Sv48 虚拟地址系统
  • 两级缓存系统,支持硬件缓存一致性和可选的 ECC
  • 总线接口– 具有两个可选接口的 AXI4/ACE 协议:设备一致性端口 (DCP) 和低延迟端口(LLP)
  • 具有多达 64 个区域的增强型物理内存保护(ePMP)单元
  • RISC-V 调试和平台级中断控制器(PLIC),可配置多达 1023 个中断源

阿里 T-Head 还提供了该产品与 C908 T-Head C906 单发按序处理器的性能对比,但现在他们并没有提供它与更高端 C910 的数据对比。

C906 和 C908 的对比

通过 Linkpacks、Coremark、Whetstone 和 Dhrystone 等综合基准,C908 的性能比 C906 提高了 24% 到 64%。但我暂时还是不知道被测内核的制造工艺和频率,所以结果可能没有太大意义,除非两个内核使用的是相同节点和频率。

玄铁 C908 的运行频率最高可达 2GHz,采用的是台积电 12 纳米工艺,单核动态功耗低至 52.8mW/GHz。在相同频率和工艺限制(未定义)的典型场景下,玄铁C908 的能效比玄铁 C906 提升了 20% 以上。

C908 的 AI 推理性能

RISC-V Vector Extension 1.0 确实有助于 AI 工作负载,在相同条件下,对使用 INT4 数据类型的唤醒词检测、图像分类、关键字定位和 MLPerf 微型 V0.7推理性能测试的异常检测中,C908 比 C906 快了大约 2 到 3.5 倍。

新的 C908 之后应该就会在 T-Head 网站上出售了,但目前我唯一能找到的公开信息只有 RISC-V 博客上的有一些

分享这篇文章
订阅评论
提醒
0 评论
内联反馈
查看所有评论