Quad Xeon MP 8M & E8500
By Samuel D. - 25/07/2005
Sommaire:

 

Intel Truland :
Chipset E8500 "Twin Castle"

 

Voici donc la partie la plus interessante de la plateforme : Le chipset. Anciennement baptisé "Twin Castle", l'E8500 est donc le premier chipset quadri-processeur d'Intel destiné à la famille Xeon. Au programme, beaucoup d'améliorations par rapport au chipset ServerWorks qui était utilisé jusque là. Entièrement axé sur la sécurité des données par le biais de nombreux mécanismes de fiabilisation et de vérification, l'E8500 apporte également son lot de progrès en terme de performances. Voyons tout de suite un schéma global du chipset :

 

 

Première innovation, la présence de quatre XMB pour eXternal Memory Bridge. La partie contrôleur mémoire est ainsi déportée en dehors du Northbridge. Nous verrons ce point en détail un peu plus loin. Côté communication externe, l'E8500 supporte 28 lanes PCI Express, réparties par défaut en 3 ports PCIe 8x et 1 port PCIe 4x. Bien sûr, chaque PCIe 8x peut être scindé en deux PCIe 4x. Côté FSB, c'est une grosse nouveauté : Les Xeons MP bénéficient maintenant de deux bus de communication distinct, chacun supportant deux CPUs. La fréquence du bus est également passée de 100 MHz (400 QDR) à 166 MHz (667 QDR), ce qui permet donc de tripler la bande passante disponible pour chaque processeur :

 

 

Alors que l'ancienne plateforme ne disposait que d'une bande passante de 800 Mo/s par CPU sur le FSB, l'E8500 offre donc 2.66 Go/s par CPU, avec des pointes à 5.3 Go/s, si un seul CPU utilise le bus. Avec le nombre de composant que le chipset a à gérer, on comprend mieux le choix d'Intel d'externaliser la gestion de la mémoire. En effet, l'E8500 est un composant Micro-FCBGA3 comportant la bagatelle de 1432 connections. Le chipset dispose d'un IHS, comme les Pentium 4. Un coup d'oeil sur le pinout permet de comprendre que, même dans ces conditions, il ne reste pas beaucoup de place pour la mémoire :

 

 

La mémoire est donc accédée sur quatre canaux simultanément. Concernant le fonctionnement logique du chipset, c'est également très impressionnant. Croyez-nous sur parole, l'E8500 dispose de fonctionnalités de détections et de corrections d'erreurs les plus nombreuses que nous n'ayons jamais vu sur un chipset. Des centaines de registres sont dédiés au monitoring de tous les elements du PC et l'intégralité des communications internes ou externes est encapsulée et traitée à grand coup d'ECC, de parité et autres checksums, à de multiples reprises. La moindre défaillance de n'importe quel composant est detectée et celui-ci est immédiatement isolé. Niveau fiabilité et tolérance de faute, il est ainsi quasi-impossible de prendre l'E8500 en défaut.

Et encore, le plus impressionant reste à venir.

 

  • E8500 XMB : Gestion mémoire

Comme nous l'avons dit précédemment, pour des raisons de places physiques et de performances, le chipset E8500 est doté d'un Northbridge et de XMB, des contrôleurs mémoires déportés sur d'autres chips. Ces XMB peuvent être jusqu'à 4 et sont capable de gèrer la DDR-I ou mieux, la DDR-II 400 de type ECC Registered. Voyons un schéma global :

 

 

Physiquement, ces XMB se situent sur quatre cartes Hotplug qui peuvent donc être changée à chaud en cas de panne. Chaque carte supportant un XMB et quatre ou huit slots de mémoires, DDR1 ou DDR2. Sur le server SW4850HW4, il s'agit de quatre cartes filles supportant chacune quatre modules de DDR2-400 ECC Registered :

 

 

En voit bien ici le XMB qui se trouve sous le radiateur ainsi que les slots de mémoires. Le XMB est un composant FC-BGA3 de 829 contacts. Il sert d'interface entre la mémoire et les contrôleurs IMI du Northbridge :

 

 

L'architecture peut donc être considérée comme du Quad Channel Dual DDR2-400. A noter que chaque XMB dispose d'une bande passante de 2.67 GB/s en écriture et de 5.33 GB/s en lecture, soit un total de 10.6 GB/s en ecriture et 21 GB/s en lecture.

Bien entendu, les XMB et l'E8500 disposent également de fonctionnalités de tolérance de pannes avancées et inédites. Les différents XMB peuvent ainsi fonctionner en mode RAID 1 (Mirroring), ou RAID 5 !! Voici un petit récapitulatif :

 

Mode
RAID Like
Mémoire Physique
Mémoire Utilisable
Tolérance de panne
Performance
RAID 0
8 Go
8 Go
Aucune
Mirror
RAID 1
8 Go
4 Go
2 modules sur 4
RAID
RAID 5
8 Go
6 Go
1 module sur 4

 

Le mode de fonctionnement est défini dans le BIOS et peut être contrôlé par des LEDs présentent sur les cartes :

 


RAID 0 "Performance"

RAID 1 "Mirroring"

RAID 5 "Integrity"

 

En mode RAID 5, on peut sans problème retirer à la volée une des banques de RAM, et même deux simultanément en RAID 1. De multiples LEDs sont présentes un peu partout pour signaler clairement un composant défaillant.

Il est maintenant temps de s'intéresser à la partie performance de ce chipset. Pour ce faire, nous avons mesuré la latence et la bande passante dans différents modes de fonctionnement. en effet, on s'aperçoit rapidement que le chipset est conçu dans une optique assez différente de ce qu'on connait d'habitude. Ainsi, avec un seul thread, voici les résultats obtenus :

 

 

Seulement 1.7 GB/s de bande passante mémoire et une latence record de 269 cycles. C'est très peu et à peine supérieur à ce qu'on pouvait trouver sur la plateforme MP basé sur le vieux ServerWorks et son FSB400. Où sont donc passé les Gigaoctets de bande passantes mémoire ? En fait, on le comprend lorsqu'on lance 4 threads simultanément :

 

 

Cette fois, les débits sont bien plus élevés et la latence par thread est divisée par deux. De même, nous avons pu obtenir quasiment 6 Go/s en lancant des threads bien distinct, sur chaque CPU. Visiblement, Intel à opté pour de la mémoire divisée pour chaque CPU. Tous les CPUs ont ainsi leur bande passante de mémoire dédiée et ne risquent pas de saturer si un des autres requiert une grosse capacité de mémoire. En contrepartie, il faut que tous les CPUs soient utilisés au maximum pour profiter de cette bande passante...

 

Suite ( AMD Opteron Dual Core )

Fermer