工程师2年白干!英特尔砍掉至强旗舰原生TF32支持

就爱百科 百科资讯 2

7月1日消息,英特尔在至强Diamond Rapids平台正式亮相前,已正式终止AMX-TF32指令集开发。

最新版编程参考手册已移除AMX-TF32全部描述,一同被删除的还有用户定时器事件与中断相关规范。英特尔工程师已着手删除GCC编译器中的适配代码。

AMX-TF32原本是规划中的重要指令集扩展,目标是把英伟达首创的TensorFloat-32数据格式原生集成到高级矩阵扩展体系中。

TF32可兼顾FP32的数值动态范围,同时在AI与矩阵运算场景下获得接近FP16的算力表现。英特尔早在2024年就首次公开了这一特性。

针对Diamond Rapids的编译器补丁,此前明确将AMX-TF32列为标配指令集能力。Diamond Rapids系列处理器原计划2027年正式发布。

如今AMX-TF32在研发末期被砍,属于临上线前的重大设计变更,工程师近两年的准备工作付诸东流。

英特尔提交的补丁正式从GCC编译器中彻底移除AMX-TF32适配代码。移除原因是根本不存在搭载该功能的实际量产硬件。

由于GCC 15和GCC 16已提前加入AMX-TF32支持,现在还需提交反向移植补丁从旧版本中回滚删除。

AMX-TF32的命运与去年被砍掉的AMX-TRANSPOSE指令集如出一辙。后者原本同样是Diamond Rapids平台的AMX体系专属特性。

行业人士表示,接连两项AMX功能在正式出货前被取消,英特尔在AI指令集扩展路线图上接连受挫,至强旗舰的AI加速能力将大打折扣。