Le site tecchannel.de a effectué les premiers tests sur un prototype de ClawHammer, nom de code du futur Athlon XP 64. Les résultats obtenus, et en particulier les courbes de débits, nous fournissent quelques informations intéressantes sur l'architecture des mémoires caches de ce processeur.
Notons tout d'abord que le ClawHammer possède les mêmes quantités de cache que l'Athlon, c'est-à -dire 128Ko de cache L1, répartis en 64Ko de cache code et 64Ko de cache de données, et 256Ko de cache L2 intégré. Mais les similitudes ne s'arrêtent pas là :
Le mode de fonctionnement du cache
En premier lieu, les courbes révèlent un cache de données efficace de 320Ko, soit la quantité de L2 cumulée avec celle du cache de données L1. Ceci signifie que le cache L2 du ClawHammer fonctionne en mode exclusif, tout comme sur l'Athlon XP. Il faut noter que ce mode de fonctionnement est théoriquement plus performant que le mode inclusif (choisi par Intel depuis le Pentium !!! Coppermine), car il permet de cumuler les quantités des caches L1 et L2. La contrepartie réside dans une baisse d'efficacité du cache L2, qui sert en quelque sorte d'exutoire aux échecs du cache L1. Cependant, il convient de noter que la quantité élevée de cache L1 impose pratiquement ce mode de fonctionnement exclusif, du moins tant que la quantité de cache L2 n'augmente pas de façon significative.
Les performances des caches
En regardant de plus près les courbes, nous avons estimé les débits des différents niveaux de cache.
- En lecture 32 bits, le L1 du ClawHammer offre un débit de 3200Mo/s, ce qui correspond à la valeur théorique maximale que l'on peut obtenir à 800MHz (800 MHz x 4 octets). Le cache L2 quant à lui offre 2000Mo/s de débit, ce qui est supérieur à celui obtenu sur l'Athlon MP du test (1750Mo/s).
Le cache L2 du ClawHammer a donc bénéficié d'une certaine amélioration par rapport à celui de l'XP. Cependant, le L2 du Pentium 4 reste assez largement devant, avec un débit de 2500Mo/s.
Un transfert en 32 bits ne pousse pas les caches dans leurs derniers retranchements, et les résultats des tests en 128 bits sont plus significatifs des débits maximums réels. Notons au passage que les résultats en 128 bits manquent passablement de clarté : le test stipule que le test mémoire utilise l'instruction MOVDQA (déplacement aligné de deux "quadwords"), qui est en fait une instruction SSE2, non supportée par l'Athlon MP.
- En lecture 128 bits, le L1 du ClawHammer offre un débit d'environ 12000Mo/s à 800MHz, ce qui se traduit par un débit d'environ 15 octets par cycle ! Belle performance, jusqu'alors réservée au Pentium 4, ce dernier étant en théorie capable de tranférer 128 bits (16 octets) par cycle (voir l'article sur le Pentium 4 pour plus d'informations à ce sujet).
Cette performance est d'autant plus notable compte-tenu de la taille du cache L1 du ClawHammer, 8 fois plus élevée que celle du Pentium 4. Il reste à savoir si cette performance en débit suivra l'augmentation de fréquence du ClawHammer.
En ce qui concerne le L2, le débit en lecture plafonne à 3750Mo/s, ce qui donne environ 4,5 octets par cycle. Ce débit est de loin supérieur à celui d'un Athlon XP, qui plafonne à 3 octets par cycle environ, et cela confirme l'amélioration apportée sur le cache L2 du ClawHammer. Cependant, on est encore loin du débit du L2 du Pentium 4, qui permet une lecture tous les deux cycles, soit pas loin de 8 octets par cycle en transfert 128 bits.
En résumé, le cache L1 du ClawHammer bénéficie des excellentes performances de celui de l'Athlon XP, avec en plus la possibilité de fournir des débits théoriques proches du maximum en transfert 128 bits.
La bonne surprise provient du cache L2, AMD a pallié en partie au manque de performances de celui de l'Athlon XP, et celui du ClawHammer s'avère notablement plus rapide.
Cependant, le L2 du ClawHammer reste encore assez loin derrière celui du Pentium 4, notamment en terme de débits. Intel reste maître en la matière, mais il est probable que le cache L2 du ClawHammer subira des évolutions, et ce notamment pour faire face au futur Prescott.