Nvidia-GeForce-200-Serie
Die Geforce-200-Serie ist eine Serie von Desktop-Grafikchips der Firma Nvidia und ergänzt die Geforce-9-Serie im oberen Leistungs- und Preissegment. Alle Grafikprozessoren dieser Serie unterstützen das Shadermodell 4.0 (SM 4.0) nach DirectX 10, OpenGL 3.0, CUDA und damit auch PhysX.
Technisches
Die Architektur basiert auf der Vorgängerserien der GeForce 8 und GeForce 9 Serie, allerdings wurden einige Dinge verändert. Insbesondere wurden Architekturveränderungen vorgenommen von denen CUDA-Aplikationen profitieren sollten, so wurde zum Beispiel ein Memory-Buffer zwischen den Streamprozessoren integriert und die Registergröße vergrößert. Zudem unterstützt der G200 mit Hilfe von extra für diesen Zweck eingefügten Recheneinheiten auch das Rechnen mit Doppelter Genauigkeit, während die Vorgänger nur einfache Genauigkeit beherrschen. Im Zuge der Vergrößerung des Chips wurden beim G200 auch die Shadercluster vergrößert, so wurde die Shaderclustergröße von 16SPs pro Cluster beim G80/G92 auf 24 SPs pro Cluster vergrößert, wodurch natürlich auch an den restlichen Komponenten des Chips Anpassungen stattgefunden haben. Abseits der weiteren Optimierungen des Chips wie etwa der Verbesserungen am Thread Sheduler wurde eine Stromsparfunktion eingeführt, so dass man trotz höherer Rechenleistung und höherem Verbrauch unter Last, im 2D-Modus unter den Verbrauch der Vorgänger kommt.
Grafikprozessoren
Grafikchip | Fertigung | Einheiten | DirectX / OpenGL Version |
Video- prozessor |
Schnitt- stelle | |||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
Prozess (in nm) |
Transistoren (in Mio.) |
Die-Fläche (in mm²) |
ROP- Partitionen |
ROPs | Unified-Shader | TAUs | TMUs | |||||
Stream- prozessoren |
Shader- Cluster | |||||||||||
GT200 | 65 | 1400 | 576 | 8 | 32 | 240 | 10 | 80 | 80 | 10.0 / 3.0 | VP2 | PCIe 2.0 |
Modelldaten
Modell | Monat/Jahr | Grafikprozessor (GPU) | Grafikspeicher | Sonstiges | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Typ | Aktive Einheiten | Chiptakt (MHz) |
Shadertakt (MHz) |
Größe (MiB) |
Takt (MHz) |
Typ | |||||||
ROPs | Shader- Cluster |
SPs | TMUs | TAUs | |||||||||
Geforce GTX 260[1] | HybridPower | ||||||||||||
Geforce GTX 280[2] | HybridPower |
Hinweise:
- Die angegeben Taktraten sind die von Nvidia empfohlenen bzw. festgelegten. Allerdings liegt die finale Festlegung der Taktraten in den Händen der jeweiligen Grafikkarten–Hersteller. Daher ist es durchaus möglich, dass es Grafikkarten–Modelle gibt oder geben wird, die abweichende Taktraten besitzen.
- Mit dem angegebenen Zeitpunkt ist der Termin der öffentlichen Vorstellung angegeben, nicht der Termin der Verfügbarkeit der Modelle.
Leistungsdaten
Für die jeweiligen Modelle ergeben sich folgende theoretische Leistungsdaten:
Modell | Rechenleistung über die Streamprozessoren (GFlops) |
Pixelfüllrate des Grafikprozessors (MPixel/s) |
Texelfüllrate des Grafikprozessors (MT/s) |
Datenübertragungsrate zum Grafikspeicher (GB/s) |
---|---|---|---|---|
Geforce GTX 260 | 715,392 | 16128 | 36864 | 111,888 |
Geforce GTX 280 | 933,12 | 19264 | 48160 | 141,696 |
Hinweise:
- Die angegebenen Leistungswerte für die Rechenleistung über die Streamprozessoren, die Pixelfüllrate, die Texelfüllrate und die Speicherbandbreite sind theoretische Maximalwerte. Die Gesamtleistung einer Grafikkarte hängt unter anderem davon ab, wie gut die vorhandenen Ressourcen ausgenutzt bzw. ausgelastet werden können. Außerdem gibt es noch andere, hier nicht aufgeführte Faktoren, die die Leistungsfähigkeit beeinflussen.
- Die angegebene Rechenleistung über die Streamprozessoren bezieht sich auf die Nutzung beider MUL–Operationen, die bei Grafikshaderberechnungen nicht erreicht wird, da weitere Berechnungen ausgeführt werden müssen. Bei diesen Berechnungen liegt die Leistung der Rechenleistung über die Stream-Prozessoren daher geringer.