Zen 5架构的改良有几个要素构成,其中包括:1.全新的前端设计,更宽的执行窗口和重新设计的指令提取、译码、分发单元2.全新的前端设计让Zen5架构可以在每个时钟周期执行更多指令3.因为每个时钟周期可以执行更多指令,所以微操缓存和寄存器带宽也对应增大4.Zen 5架构有了完整的512-bit FPU执行模块,以提高运行AVX512/VNNI指令大语言模型的AI效率。
Zen 5架构的设计目标是奔着单线程和双线程性能优化而去的,我们将在Zen 5核心上看到显著的单核性能提高。除此以外,Zen 5核心整体的加大加宽思路还为以后的计算架构打下了基础,AVX 512的完整支持则是为了提高数据吞吐量以及AI性能。
前端部分,Zen 5架构主要优化了分支预测和预取单元,并将译码管道升级为两组4 inst/cycle并行操作,分发单元(Dispatch)和微操缓存(Op Cache)也对应升级为8-wide和6-wide x 2,主要是为了增加每个时钟周期,前端流水线可以同时处理的指令数。
Zen 5的流水线有一个很关键的数字是“8”,比如译码(Decode)和分发单元(Dispatch)都是8-wide/cycle,而现在Rename(重命名)和Retire(回退)寄存器同样也是8-wide/cycle,这保持了流水线增宽的统一效率。增宽的流水线让Zen5架构可以设计更多执行单元,Zen4时候是4个ALU和3个AGU,Zen5则增加至6个ALU和3个AGU,理论上能提高50%的运算吞吐量。