Celeron 1.2 Ghz : Le Test
Le Céléron 1,2GHz Tualatin succède au Céléron
1,1GHz, dernière version utilisant le core Coppermine. Depuis la
version à 800MHz, le Céléron Coppermine utilise un
bus à 100MHz, et les versions successives ne diffèrent que
par l'augmentation de la fréquence d'horloge. Le Céléron
1,2GHz apporte quant à lui bien plus que 100MHz supplémentaires
par rapport à son prédécesseur à 1,1GHz. Ces
améliorations concernent essentiellement la mémoire cache
L2, comme le montrent ces deux tableaux :
Céléron Coppermine
|
Céléron Tualatin
|
Le cache L2 du Céléron Tualatin utilise un cache associatif
à 8 voies (contre 4 voies pour le Céléron Coppermine),
rejoignant ainsi les caractéristiques du Pentium III.
Le Céléron Tualatin conserve cependant quelques caractéristiques
de la famille Céléron :
- Le bus à 100MHz.
- Un cache à latence non nulle. Cette valeur est lue dans un
registre de configuration du processeur. En réalité, Intel
prétend que cette valeur ne signifie rien, et que le cache L2
du Céléron possède la même latence que celui
du Pentium III. Quoiqu'il en soit, la latence du cache L2 n'est certainement
pas nulle, ni même de 1 ou 2. Intel annonce une latence d'accès
de 7 cycles pour le cache L2 du Pentium III. Qu'en est-il pour le Céléron
?
Afin de mesurer précisément les améliorations apportées
par le Céléron Tualatin, nous avons utilisé un programme
de benchmark mémoire. Ce programme effectue des lectures par paquets
de 64 bits, en utilisant le jeu d'instruction MMX, et ce sur des buffers
de taille croissante. On relève alors le temps pris par chaque
lecture ; on en déduit les débits mémoires ainsi
que les temps de latence en lecture pour chaque niveau de mémoire
cache.
Pour ce test, nous avons comparé les débits du Céléron
Tualatin avec ceux du Céléron Coppermine dans sa version
à 1GHz, tous deux montés sur une Asus TUSL2-C (chipset i815EP).
Les résultats sont les suivants :
|
Céléron Coppermine 1 Ghz
|
Céléron Tualatin 1,2GHz
|
Débit L1 (pic) |
7830 Mo/s
|
9360 Mo/s
|
Débit L2 (moyen) |
4292 Mo/s
|
5280 Mo/s
|
Débit mémoire (moyen) |
750 Mo/s
|
785 Mo/s
|
Quelques remarques sur ces résultats :
- Les différents niveaux de cache apparaissent clairement sur
ces courbes. Le benchmark ne fait apparaître le cache L1 réservé
aux données, qui correspond au premier pic de 0 à 16Ko.
Le cache L2 étant unifié, il est tout entier utilisé,
et il correspond au pallier allant jusqu'à 128Ko pour le Coppermine
et 256Ko pour le Tualatin.
- Les quantités de mémoire cache ne se cumulent pas, car
les caches L1 et L2 sont gérés de façon inclusive.
Cela revient à dire que le contenu du L1 est présent dans
le L2, ce qui porte la quantité totale de mémoire cache
du Céléron Tualatin à 256Ko et non à 288Ko
(256+32).
- Les débits du L1 sont très proches des valeurs théoriques
pour les deux processeurs. En effet, l'unité de chargement du
noyau P6 nécessite au moins 1 cycle processeur pour lire 64 bits
(8 octets), ce qui nous donne les débits théoriques suivants
:
- pour le Tualatin 1,2GHz : 1200x8 = 9600Mo/s, pour une valeur lue de
9360Mo/s ;
- pour le Coppermine 1GHz : 1000x8 = 8000Mo/s, pour une valeur lue de
7830Mo/s ;
Ces résultats révèlent le temps de latence très
faible du cache L1 en lecture, en fait très proche de zéro.
- Bien que cadencé à la même fréquence, le
cache L2 présente pour les deux processeurs des débits
inférieurs. Ceci peut avoir deux origines :
- le temps d'accès du noyau au L2 (latence) ;
- la largeur du bus L2. Il n'est pas en cause dans ce test, car sa largeur
est de 256 bits alors que 64 bits sont transférés à
chaque cycle.
- Les débits mémoires sont également très
proches de leur valeur théoriques. Les deux processeurs utilisent
un bus mémoire large de 64 bits et à 100MHz, ce qui donne
un débit théorique maximal de 100x8 = 800Mo/s.
A partir des résultats théoriques, il est possible de déterminer
la latence générée par l'accès en lecture
aux différents niveaux de cache, et en particulier le L2. Nous
avons comparé les deux Célérons avec un Pentium III
Coppermine. Nous avons également ajouté au test un Céléron
A à core Katmaï, gravé en 0,25µm et intégrant
128Ko de cache L2.
Le Pentium III Coppermine (en vert sur le graphique) affiche une latence
de 7 cycles, comme annoncé par le constructeur. On constate avec
surprise que le Céléron Coppermine et le Tualatin possèdent
la même latence, avec même un petit avantage pour le Tualatin
dont la courbe apparaît en bleu.
Le Céléron A quant à lui dépasse les 10 cycles
de latence.
Il apparaît donc que le cache du Céléron Tualatin
n'est plus du tout bridé, ni part la taille, ni par les temps d'accès
au cache L2. Il offre même une latence légèrement
inférieure à celle du Coppermine, ce que l'on peut éventuellement
justifier par des temps de propagation légèrement améliorés
par la finesse de gravure inférieure, et donc un temps de transmission
légèrement supérieur.
Suite
( Pentium III-S - Le Test )
|