Quad Xeon MP 8M & E8500
By Samuel D. - 25/07/2005
Sommaire:

 

Win32/64 : Quelques chiffres

 

Rappelons le encore une fois : Il n'est ici pas question de réaliser des benchmarks représentatifs et donc, crédibles, d'une utilisation serveurs de CPUs et de ces plateformes. Celles-ci sont entièrement conçues pour des utilisations bien spécifiques qu'il est compliqué de reproduire. Charger une très grosse base SQL avec des milliers de requêtes nécessite clairement un matériel dédiés que nous n'avons pas. Toutefois, pour le plaisir des chiffres, nous avons réalisés quelques "benchmarks" des différentes plateformes. Or, nous nous sommes rapidement rendu compte que très peu de benchmarks arrivent à gérer correctement les 8 CPUs logiques de la plateforme Truland. Par exemple, Sandra 32-bit ne lance son benchmark que sur 4 threads et RMMA utilise des CPUs logiques comme CPU physique. Au final, une bonne partie de benchmarks donne des résultats fantaisistes, parfois beaucoup trop élevés, parfois beaucoup trop bas. Nous avons donc utilisé toutes les applications disponibles capables de gérer huit threads simultanément.

Nous avons choisi de comparer les plateformes suivantes :

  • 4 cores : Xeon MP 3.00 GHz (*4) - 1M L2 / 8M L3 - E8500 - 2 GB DDR2-400 "Performance" ECC Reg
  • 4 cores : Opteron 275 2.2 GHz (*2) - 2*1M L2 - nForce 4 Pro - 2 GB DDR-400 ECC Reg
  • 2 cores : Pentium XE 840 3.2 GHz (*1) - 2*1M L2 - nForce4 IE - 2 GB DDR2-667
  • 1 core : Pentium 4 680 3.8 GHz (*1) - 1*2M L2 - i955X - 2 GB DDR2-667

Dans tous les cas, l'ECC a été désactivé et les paramètres "par défaut" de toutes les plateformes ont été utilisés. Commençons par un test sous MTB, qui permet d'offrir une vision claire des performances théoriques maximales offertes par le SMP :

 

 

Première remarque : La scalabilité est excellente. C'est d'ailleurs une constante qu'on retrouvera tout au long du test et qui a été grandement améliorée avec la plateforme Truland. Par rapport au Pentium XE 3.2 GHz, le quad Xeon offre quasiment un ratio de 2:1 à fréquence égale. Ces excellentes performances sont dues au chipset E8500 et sa gestion particulière de la mémoire, mais également au mode de fonctionnement du cache L3 des Xeon MP, qui retire une grosse charge de travail au niveau de la cohérence des caches. Nous avons ensuite trouvé un benchmark CPU optimisé SMP qui peut scinder la charge jusqu'a 128 threads, il s'agit de Clibench

 

 

Opteron et Xeon MP sont au coude à coude avec, ici aussi, une scalabilité remarquable. Le Pentium 4 single core est largement derrière le Pentium XE, lui même largué par les systèmes quad-core. A première vue, tout cela parait logique, mais c'est sans compter les complexes problèmes de cohérence des caches qui font qu'un système avec 4 CPUs ne va pas 4 fois plus vite qu'un système à un seul CPU. L'achitecture mémoire et la rapidité des I/O est également très importante. Clibench permet de mesurer la bande passante mémoire par core :

 

 

Comme on le voit, l'Opteron, généralement maître de la situation, est ici dépassé d'une courte tête par l'E8500. Toutefois, il faut noter qu'une plateforme quadri Opteron obtiendrait sûrement ici de meilleurs résultats. En effet, les Opterons Dual Core ne disposent que d'un contrôleur mémoire pour les deux cores, ce qui limite donc par deux la bande passante maximale théorique. En pratique, un Opteron single core dispose d'environ 5 GB/s de bande passante par core. Un double cœur dispose également de 5 GB/s, mais pour deux cœurs, d'ou les 2.5 GB/s trouvés ici. Poursuivons avec un test pratique de rendu 3D sous 3DStudio Max 7 :

 

 

Généralement avantagé par la rapidité de ses unités SIMD, très utilisées dans le rendu 3D, le système quad Xeon s'en tire plutôt bien. L'Opteron reste toutefois largement devant le Pentium XE et le Pentium 4 680, malgré ses 3.8 GHz, ne peut rivaliser avec les ténors. Continuons avec un autre test de rendu graphique, cinebench, qui est disponible en version 32 et 64 bits :

 

 

Malgré la présence de l'Hyperthreading, c'est ici les deux Opteron Dual Core qui tiennent le haut du pavé, suivi de près par le système quadri Xeon. Terminons par un petit test sous Sandra. Si la version 32-bit ne semble pas gérer plus de 4 threads simultanément, la version 64-bit a bien créé 8 threads sans problème :

 

 

Ces chiffres ne veulent pas dire grand chose, mais ont au moins l'intérêt de montrer qu'encore une fois, la scalabilité du serveur E8500 est excellente. Ceci lui permet d'ailleurs de libérer tout son potentiel sur du traitement SIMD massif, comme on le voit dans le test multimédia

 

Suite ( Conclusion )

Fermer