Comparatif de GPU 2009 Nvidia GeForce GTX 200 (GT200)
Après l’énorme succès du G80 qui équipait les GeForce 8, Nvidia avait cru pouvoir se reposer sur ses lauriers avec le G92, quasi-identique, si ce n’est une finesse de gravure améliorée. Seulement voilà : l’architecture du G80/G92 est maintenant vieille de deux ans et il était temps de concevoir un véritable nouveau GPU. Mi-2008, Nvidia a donc accouché d’un monstre de 1.4 milliard de transistors, gravés en 65 nm sur un énorme die de 600 mm², et consommant presque 200 Watts à lui seul : le GT200. Ce nouveau chip graphique ne fait toute pas table rase du passe comme l’avait fait le G80 en son temps. En fait, il s’agissait plutôt pour Nvidia de pousser l’architecture du G80 dans ses derniers retranchements, en l’améliorant au maximum de ses possibilités. Voyons schématiquement comment ils ont procédés :
Dans le G80, les Stream Processors étaient répartis en 8 blocs appelés « Clusters ». On retrouve la même organisation dans le GT200, sauf que ceux-ci sont maintenant au nombre de 10 et que l’organisation interne de ces clusters a été largement modifiée, comme nous le verrons un peu plus loin. Mais passons directement au post-traitement et aux unités ROPs. Cette fois, on ne compte plus 16, mais 32 ROPs et afin de les utiliser au mieux, l’algorithme qui gère le dispatch des flux dans ces ROPs a été amélioré. Toujours groupés par 4, on a donc 32/4 = 8 contrôleurs mémoires 64 bits, ce qui donne une largeur de bus de 512 bits ! Toutefois, la mémoire gérée est toujours la GDDR3, même si certaines rumeurs avaient fait état d’un support de la GDDR5 au lancement la puce. Pour l'instant, aucun constructeur n'a doté ses cartes d'une capacité différente des 1 Go recommandés.
|
Mais revenons maintenant aux fameux Clusters, dont le nom officiel est TPC pour « Thread Processing Cluster ». Comme nous l’avons dit, ceux-ci sont au nombre de 10 au lieu de 8 dans le G80. Un TPC est constitué de multiprocesseurs de flux (SM : « Streaming Multiprocessors » selon la terminologie Nvidia), eux-mêmes constitués de Stream Processors (SP). Or, là aussi, le GT200 se voit nettement amélioré puisque désormais, on compte 3 SM par TPC et non plus 2 comme dans le G80. Chaque SM compte par contre toujours 8 Stream Processors, bien que plus efficaces sur certaines opérations fusionnées (FMAD, FMUL) et maintenant capables d’offrir une précision double sur le calcul flottant (FP64). La taille des registres des SM à également été doublé, ce qui permettra d’utiliser des shaders nettement plus long. Récapitulons : sur G80/G92, nous avions 8 clusters contenant chacun 2 multiprocesseurs de 8 SP, soit 8*2*8 = 128 SP. Dans le GT200, nous avons dorénavant 10 clusters de 3 multiprocesseurs de 8 SP, soit 10*3*8 = 240 SP, presque le double ! Les différents SP qui compose un SM ont maintenant une mémoire cache partagée (en violet sur le graphiques). Côté unité de texturing toutefois, rien de nouveau, puisqu’on en dénombre toujours 8 par cluster. Au final, on obtient tout de même une augmentation puisque les TPC passent de 8 à 10. En conséquence, le nombre d’unités de texture passe de 32 à 40. Au passage, celles-ci ont aussi été légèrement améliorées.
|
Parlons maintenant des fonctionnalités annexes. Tout d’abord, le GT200 est optimisé pour CUDA 2.0. En clair, il dispose d’un mode de fonctionnement spécialement dédié au calcul scientifique et à tout ce qui n’est pas du graphisme. Ensuite, comme fonctionnalité annexe, on peut citer le non-support de DirectX 10.1 puisqu’il est grosso-modo présenté comme tel par Nvidia. Et pour une fois, on n’a pas envie de leur donner tord. Allez savoir pourquoi ? Oh, j’y suis : peut-être parce que DX 10 est l’un des plus gros bullshit marketing de la décennie. Poursuivons en parlant maintenant des fréquences de fonctionnement.
Vu la taille dantesque du die, la fréquence de fonctionnement n’atteint pas des sommets : le cœur tourne à 600 MHz et les unités de shaders (SP) à 1300 MHz. Selon Nvidia, ceci permet tout de même d’approcher le Teraflop en vitesse de traitement brute des shaders. La GDDR3, quant à elle, est cadencée à 1.1 GHz par défaut. Reste enfin que, même à 600 Mhz, les 1400 millions de transistors gravés en 65 nm consomment une énorme puissance électrique (quasiment 200 Watts) et dégagent en conséquent une non moins énorme chaleur qu’il faut alors dissiper à grand coup de ventilateur.
Début 2009, après plusieurs mois de difficultés techniques, nVidia est finalement parvenu à graver le GT200 en 55 nm. Baptisé GT200b, ce « nouveau » GPU reste strictement identique à son grand frère du point de vue des fonctionnalités et se distingue uniquement par sa consommation électrique et sa dissipation thermique plus faible. Afin de justifier l’arrivée de nouvelles dénominations commerciales, Nvidia en a tout de même profiter pour booster quelque peu les fréquences des GT200b et de la mémoire qui l’accompagne.
- Les cartes que nous avons testés
nVidia GeForce GTX 295 |
|
Prenez deux GeForce GTX 285, faites les fonctionner aux fréquences d’une GTX 260, assemblez le tout sur une seule carte graphique et vous obtiendrez une GeForce GTX 295. Bâtie autour de deux GPU de type GT200b cadencés à 576 MHz, ce monstre de puissance embarque 2 x 896 Mo de GDDR3 cadencés à 1 GHz et un refroidissement en conséquence. Bien qu’elle offre actuellement (et de loin) les meilleures performances dans la gamme GTX de Nvidia, cette carte n’est pas pour tout le monde. Tout d’abord, il vous faudra un boitier capable de l’accepter … mais également une alimentation en mesure de fournir les 350 Watts requis ! Sans surprise, la GTX 295 chauffe énormément : il faudra donc une excellente ventilation du boitier. Enfin, il est techniquement possible d’en faire fonctionner deux en SLI. |
Coeur |
Gravure |
SP |
Fréq (Core) |
Fréq (SP) |
Fillrate |
RAM |
RAM (Fréq) |
RAM (débit) |
Conso |
GT200b |
55 nm |
2x240 |
576 MHz |
1242 MHz |
48.2 GT/s |
GDDR3 (512 bit) |
1000 MHz |
111.9 Go/s |
290 Watts |
nVidia GeForce GTX 285 |
Première carte mono-GPU basée sur le GT200b, la déclinaison gravée en 55nm du GT200, la GeForce GTX 285 a permis à Nvidia de récupérer nettement l’avantage face à ATi. D’un point de vue technique, cette carte reste très proche de la GTX 280 : 240 Stream Processors, 80 unités de texturing, 32 ROPs et 1 Go de GDDR3 interfacés en 512 bits. Elle se distingue donc principalement par la fréquence plus élevée du cœur (648 MHz contre 602) et de la mémoire (1242 MHz contre 1107). Malgré cela, elle consomme un peu moins puisque nous l’avons mesurée à 170 Watts au maximum, soit un gain d’une vingtaine de watts. Le design de référence de la carte est équipé d’un ventilateur qui sait se faire discret, même s’il ne peut pas vraiment être qualifié de silencieux en pleine charge.
|
|
Coeur |
Gravure |
SP |
Fréq (Core) |
Fréq (SP) |
Fillrate |
RAM |
RAM (Fréq) |
RAM (débit) |
Conso |
GT200b |
55 nm |
240 |
648 MHz |
1476 MHz |
51.8 GT/s |
GDDR3 (512 bit) |
1242 MHz |
159.0 Go/s |
200 Watts |
nVidia GeForce GTX 280 (OBSOLETE) |
|
Avant d’envisager l’achat d’une GeForce GTX 280, il faut impérativement vérifier que votre PC est en mesure de l’accepter. En effet, avec ses 27 cm de long et ses 200 Watts de consommation électrique, ce monstre de puissance ne s’accommodera que d’un boitier spacieux (et bien ventilé !) et d’une alimentation de très bonne qualité. Ce dernier point étant particulièrement important si vous ne voulez pas que votre PC flambant neuf ne devienne flambant tout court. Vous pourrez alors profiter à votre guise de ses 240 Stream Processors, de ses 80 unités de texturing, de ses 32 ROPs et de son bus mémoire 512 bits. Tant qu’à faire, vous pourrez également la faire fonctionner en SLI avec une autre de ses congénères. A noter que comme beaucoup de cartes haut de gamme, certains fabricants proposent des modèles overclockés en standard à des fréquences de 650, 670 et même 700 MHz chez MSI. Dans la majorité des cas, il reste toujours plus intéressant de l’overclocker vous-même...
|
Coeur |
Gravure |
SP |
Fréq (Core) |
Fréq (SP) |
Fillrate |
RAM |
RAM (Fréq) |
RAM (débit) |
Conso |
GT200 |
65 nm |
240 |
602 MHz |
1296 MHz |
48.2 GT/s |
GDDR3 (512 bit) |
1107 MHz |
141.7 Go/s |
190 Watts |
nVidia GeForce GTX 275 |
Après le remplacement de la GeForce GTX 280 par la 285 - plus performante grâce aux fréquences plus élevées permises par le 55 nm – il y avait un « trou » important dans la gamme entre cette dernière et la GTX 260, beaucoup plus modeste. En Avril 2009, nVidia a donc sorti la GeForce 275, à mi-chemin entre ces deux cartes. La fréquence du cœur est fixée à 633 MHz et celle de la mémoire à 1.1 GHz (contre 1 GHz pour la 260 et 1.2 GHz pour la 285). Elle délaisse par contre le bus 512 bit de sa grande sœur pour reprendre celui de 448 bit de la GeForce 260, ce qui implique la présence de 896 Mo de GDDR3. Pour les unités de shaders, c’est l’inverse : la GeForce GTX 275 en embarque 240, soit autant que la 285 et 24 de plus que la 260. Le reste est identique (on est toujours en présence du GT200b), à commencer par le format imposant de la carte et sa dissipation thermique importante.
|
|
Coeur |
Gravure |
SP |
Fréq (Core) |
Fréq (SP) |
Fillrate |
RAM |
RAM (Fréq) |
RAM (débit) |
Conso |
GT200b |
55 nm |
240 |
633 MHz |
1404 MHz |
50.6 GT/s |
GDDR3 (448 bit) |
1134 MHz |
127.0 Go/s |
180 Watts |
nVidia GeForce GTX 260+ |
|
Parlons maintenant de la GeForce 260+ GTX. Cette carte est basée sur une déclinaison du GT200 auquel on a désactivé un cluster (il en reste donc 9) ainsi qu’une unité ROP et son contrôleur mémoire associé (il en reste 7). Ceci nous donne donc un GT200 doté de 9*3*8 = 216 Stream Processors, 9*8 = 72 unités de texturing, 32-4 = 28 ROP et un contrôleur mémoire amputé de 64 bits, soit 448 bits au lieu de 512. La fréquence du cœur est également légèrement en retrait puisqu’elle passe de 602 à 575 MHz pour le cœur (de 1296 à 1242 pour les unités de shaders) et de 1.1 GHz à 1 GHz côté GDDR3. La capacité mémoire supportée chute aussi de 1 Go à 896 Mo. A part cela, le reste des fonctionnalités demeurent identiques. Pensez bien à vérifier le « + » dans la désignation de la carte, car les toutes premières versions du GeForce 260 GTX disposait d’une puce avec deux clusters désactivés au lieu d’un seul ! Théoriquement, ces cartes ne devraient plus être en vente actuellement. |
Coeur |
Gravure |
SP |
Fréq (Core) |
Fréq (SP) |
Fillrate |
RAM |
RAM (Fréq) |
RAM (débit) |
Conso |
GT200b |
55 nm |
216 |
576 MHz |
1242 MHz |
41.5 GT/s |
GDDR3 (512 bit) |
1000 MHz |
111.9 Go/s |
160 Watts |
|