Arm是全球领先的半导体知识产权提供商,该公司于2011年10月份发布了Armv8,这是Arm公司推出的第一个64位架构产品。该系列产品兼容32位的Armv7代码。产品发布10年以来,我们看到了很多以Armv8为内核的产品,从高能效的 Cortex-A35到功能强大的Cortex-X1内核,甚至还有来自Arm合作伙伴的一些定制内核。
2021年3月31日,Arm发布了新一代的Armv9架构。这是Arm自上一次Armv8之后又一次发布的新架构。Armv9在Armv8的基础上,增加了人工智能、安全和“专用计算”模块,这些新模块基本上是针对特定任务优化的硬件加速器或指令。

值得一提的是,新一代Armv9架构仍然支持Aarch32和Aarch64指令,同时也支持NEON、 加密扩展、Trustzone。所以,从严格意义上来讲,Armv9只是Armv8的升级版而并非一个全新的架构。
Armv9-A的部分新特性包括:
- 可伸缩矢量扩展v2(SVE2),这是在一些Arm超级计算机内核中采用的Armv8-A SVE的扩展(超集),同时增加了定点算术支持,矢量长度为128的倍数,最大可达2048位。从5G到基因组学再到计算机视觉,SVE2对专用DSP和XR(增强和虚拟现实)的工作负载而言都非常有用。
- Arm机密计算架构(CCA)
- 领域管理扩展(RME)建立了一个新硬件支持的安全环境,该环境将Arm平台上的“机密计算”扩展到所有开发者的工作负载上。成功案例如:处理敏感和有价值数据的公共云。
- Arm机密计算固件架构 – Arm机密计算固件架构是一个标准的平台软件架构,可简化硬件设计并鼓励重用和移植。成功案例如:保护移动设备上敏感的个人医疗健康数据。

- 跟踪& 调试
- 分支记录缓存扩展(BRBE)提供配置信息,比如:为调试/优化而进行热点分析和Auto FDO。这个特性将在2-A上实现,该公司计划于2021年第三或第四季度进行发布。
- 嵌入式跟踪扩展(ETE)和跟踪缓存扩展(TRBE)技术,可提高Armv9的跟踪能力。
- 事务性内存扩展(TME)为Arm架构带来了硬件事务性内存(HTM)支持,从而降低并行运算编写、多线程程序的难度。以及在这种情况下,减少锁链竞争导致的串行化和使粗粒化以及线程级并行度可以随着CPU数的增加而得到更好的扩展。

Armv9 SoC的CPU性能预计在代号为“Matterhorn”和“ Makalu”的下一代移动CPU架构中提升30%以上。
实际上,随着行业从通用计算向专业方向转变,每年两位数的CPU性能提升是完全不够用的了。因此,除了增强专业处理能力外,Arm公司强调,会在完全遵循“Total Compute”设计方法的基础上,通过针对性的系统硬件和软件优化,以及用例性能的提高来加快总体计算的性能。
虽然,现在在已经发布的新闻稿和全面计算网页中可以找到更多这方面的资料信息,但对于技术方面的细节,我建议大家从Arm开发者网站的A Profile和安全特性网页进行查看。 该网站的 “Arm愿景”部分提供了更详细的内容,例如:Arm高级副总裁、首席架构师兼研究员Richard Grisenthwaite的视频就对Armv9进行了更详实的介绍,并展示了新功能的使用案例。上文中的所有截图也都引自该视频,您可通过访问如下链接观看完整视频:https://www.cnx-software.com/2021/03/31/armv9-architecture-to-focus-on-ai-security-and-specialized-compute/

文章翻译者:Nicholas,技术支持工程师、瑞科慧联(RAK)高级工程师,深耕嵌入式开发技术、物联网行业多年,拥有丰富的行业经验和新颖独到的眼光!