|
Opteron/Athlon FX (940 Pins) | Athlon 64 (754 Pins) | | Bildquelle: ixbtlabs
| | | Prozessortyp: | AMD Athlon 64 | AMD Athlon 64 FX | AMD Opteron | seit | 23.9.2003 | 1.6.2004 | 23.9.2003 | 1.6.2004 | 21.4.2003 | Codename | Newcastle, Clawhammer | Newcastle | Sledgehammer | Sledgehammer | Sledgehammer | Pins | 754 | 939 | 940 | 939 | 940 | Fertigung | 0,13u | 0,13u | 0,13u | 0,13u | 0,13u | Bezeichnung (Beispiele) | Quantispeed-Angabe: Athlon 64 3700+ (2,4 GHz, 1MB) Athlon 64 3400+ (2,2 GHz, 1MB) Athlon 64 3200+ (2 GHz, 1MB) Athlon 64 3200+ (2,2 GHz, 512kB) Athlon 64 3000+ (2 GHz, 512kB) Athlon 64 2800+ (1,8 GHz, 512kB) | Quantispeed-Angabe: Athlon 64 3800+ (2,4 GHz, 512kB) Athlon 64 3500+ (2,2 GHz, 512kB) | Produkt-Schlüssel: Athlon 64 FX-51 (2,0GHz) Athlon 64 FX-53 (2,2GHz) Athlon 64 FX-55 (2,4GHz) | Produkt-Schlüssel: Athlon 64 FX-53 (2,4GHz) | Produkt-Schlüssel: AMD Opteron 846 (8way/2,0 GHz) AMD Opteron 244 (2way/1,6 GHz) AMD Opteron 140 (1way/1,4 GHz) | Architektur | 64 Bit | 64 Bit | 64 Bit | 64 Bit | 64 Bit | Speicher- Schnittstelle | Single-Channel max. 200MHz DDR400/PC3200 ungepuffert ohne ECC | Dual-Channel max. 200MHz DDR400/PC3200 ungepuffert ohne ECC | Dual-Channel max. 200MHz DDR400/PC3200 registered DIMM mit oder ohne ECC | Dual-Channel max. 200MHz DDR400/PC3200 ungepuffert ohne ECC | Dual-Channel max. 166MHz DDR333/PC2700 registered DIMM mit oder ohne ECC | Max. Speicher- Transferrate | 3,2 GB/s | 6,4 GB/s | 6,4 GB/s | 6,4 GB/s | 5,3 GB/s | Hyper-Transport | 1 Kanal | 1 Kanal | 1 Kanal | 1 Kanal | 1, 2 oder 3 Kanäle (bei der 100er-, 200er- bzw. 800er-Serie) | L1-Cache | 64kB für Daten 64kB für Befehle | 64kB für Daten 64kB für Befehle | 64kB für Daten 64kB für Befehle | 64kB für Daten 64kB für Befehle | 64kB für Daten 64kB für Befehle | L2-Cache | 512kB oder 1 MByte | 512kB | 1 MByte | 1 MByte | 1 MByte | Cool 'n' Quiet | Ja | Ja | Nein | Nein | Nein | Produkte | XPC SN85G4, SK83G Mainboard AN50R, AN51R | XPC SN95G5 | - | - | - | Bemerkung: Athlon 64 (FX) im Sockel 754 oder Sockel 939 läuft mit herkömmlichen, kostengünstigen DDR-Chips, wobei Athlon 64 FX im Sockel 940 zwar schneller ist, aber registrierten DDR400-Speicher benötigt, der nur schwer und teuer zu bekommen ist. Auch die Mainboard-Preise fallen bei normalen Speichertypen moderater aus, da die Platinen nicht mehr im teuren Sechs-Layer-Prozess gefertigt werden müssen - vier Lagen reichen. Opteron benötigt registrierten DDR333-Speicher, ist aber nur für Workstation/Server-Anwendungen vorgesehen. | Allgemeines zur Hammer-Architektur Der Athlon 64 bzw. Athlon 64 FX Prozessor gehört zu AMDs achten Prozessorgeneration "Hammer" und ist der erste Windows®-kompatiblen 64-Bit-PC-Prozessoren. Die Umstellung von 16 auf 32-Bit vollzog Intel beim Übergang vom 286er zum 386er Prozessor im Jahre 1985. Die Verdopplung dieser sogenannten "Registerbreite" von damals 16 auf 32 Bit und jetzt von 32 auf 64 Bit bedeutet einfach gesagt, daß die Recheneinheit eines Prozessors viel größere Zahlen verarbeiten kann. Der 64-Bit-Vorteil (die x86-64 Befehlssatzerweiterung für den 64-Bit-Betrieb) macht sich besonders bei der Speicher-Adressierung bemerkbar (siehe unten). Die Server-Version des Hammers wird Opteron genannt und wurde bereits am 21. April 2003 offiziell vorgestellt. (Versions-Unterschiede siehe Tabelle oben) Die Prozessoren der Hammer-Serie sind als erste AMD-Prozessoren auch kompatibel zur SSE2-Technologie. Ihr Level-1-Cache beträgt jeweils 64kB für Befehle und Daten. Der Level-2-Cache beträgt bisher stets 1 MB. Im Gegensatz zu Intels 64-Bit-Prozessoren der "Itanium"-Serie, der keine weite Verbreitung fand, basiert Athlon 64 nicht auf einer komplett neuen Architektur, sondern fügt nur eine 64-Bit-Erweiterung zur vorhandenen 32-Bit-Technologie hinzu, so dass die AMD64-CPUs sowohl mit einem 32- als auch 64-Bit-Betriebssystem den aktuellen 16- und 32-Bit-Code ohne Performance-Verlust ausführen können. Somit kann der Anwender ohne Einbußen entscheiden, wann er zu einem 64-Bit-Betriebssystem wechseln möchte. Hammer-Prozessoren bieten flexibel 5 Betriebsmodi: je einen Legacy/Compatibility-Mode für 16- und 32-Bit und einen reinen 64-Bit-Modus. HyperTransport Schnittstelle Statt des üblichen parallelen Front Side Busses (FSB) kommuniziert die CPU über eine HyperTransport-Schnittstelle. Das serielle Interface mit variabler Bitbreite ermöglicht eine Datentransferrate von 3,2 GByte/s pro Richtung gleichzeitig. Bei 16 Bit mit 800MHz Takt DDR = 3,2GByte/s je Richtung ergibt eine Vollduplex-Bandbreite von max. 6,4 GByte/s. Beim Opteron bietet eine HyperTransport-Einheit mit gleich drei I/O-Pfaden insgesamt bis zu 19,2 GBit/s pro Prozessor. ( Zum Vergleich: Der Pentium 4 mit 533 bzw. 800 MHz FSB erlaubt einen maximalen Datendurchsatz von 3,97 bzw. 6,4 GByte/s - aber nicht in beiden Richtungen gleichzeitig.) Über das HyperTransport-Interface läuft der gesamte Datenverkehr der Hammer-Prozessoren und des integrierten Speichercontrollers. Um beispielsweise einer benachbarten CPU direkten Zugriff auf den Arbeitsspeicher zu gewähren, benutzt der Hammer den XBAR-Schalter. Integrierter Speicher-Controller Eine echte Neuerung ist die integrierte Speicherschnittstelle des Athlon 64. Bei bisherigen PC-Systemen liegt zwischen Prozessor und Speicher stets der sogenannte Northbridge-Chip. Dieser Umweg und die damit verbundenen Verzögerungszeiten fallen beim Athlon 64 weg, denn er steuert die Speichermodule direkt an. Diese Integration führt zu geringeren Latenzzeiten bei dem Speicherzugriff, was einen Geschwindigkeitsvorteil von bis zu 60 Prozent bringt (aus c't 22/03/146). Dies beschleunigt vor allem Steuerbefehle und die Zugriffe auf verstreute Datenhäppchen. Aber auch die Transferrate großer Datenblöcke nähert sich weiter dem theoretischen Maximum. Zudem verbessert der schnelle Crossbar im Prozessor das Verhalten beim gleichzeitigen Speicherzugriff durch CPU und externe Komponenten wie Grafikkarte oder Festplatte. Der Adressraum beträgt 256 Terabytes (48 Bit virtuell, 40 Bit physikalisch). Das Konzept der Hammer-Multiprozessor-Systeme sieht lokalen Speicher an jeder CPU vor, so dass die anderen CPUs via Hypertransport-Bus auf den Speicher dieser CPU zugreifen können. Opteron ist mit zwei 72 Bit breiten DDR-SDRAM-Kanälen ausgestattet. Mit insgesamt 8 DIMM-Slots lassen sich dann pro Prozessor 8 GB adressieren. Somit ermöglicht der Opteron mit seinem Dual-Channel-Interface eine Bandbreite von 5,4 GByte/s. Dabei skaliert die Speicherbandbreite mit der Anzahl der CPUs. Opteron und Athlon FX verlangen den teureren registrierte DDR-Speicher. Der Athlon 64 weist dagegen nur ein Single-Channel Interface auf, läuft dafür aber auch mit herkömmlichen ungepufferten DDR400-Speicher. Kleiner Exkurs in den Speicher-Adressraum: Mit einem 32-Bit-Betriebssystem wie Windows XP können maximal 4 GByte Speicher angesprochen werden, wobei PCI-Bus und AGP bis zu einem halben GByte direkt unterhalb der 4-GByte -Grenze belegen, womit also nur etwa 3,5 GByte genutzt werden können. Der Adressraum von 4 GByte, der von 32Bit abgedeckt wird, reicht bei größeren Servern schon längst nicht mehr aus und auch im Desktop-Bereich stößt man allmählich an die Grenzen. Man unterscheidet zwischen dem physischen Adressraum, der sich auf die eingesteckten Speicher bezieht und dem logischen oder virtuellen Adressraum, welches ein Kunstgriffs von Betriebssystem und Memory Management Unit (MMU) des Prozessors ist. Die Programme sehen nur virtuelle Adressen, die zur Laufzeit auf die physischen abgebildet werden (Page Translation mit Hilfe des Translation Lookaside Buffers TLB). Dieses Konzept ist in Multitasking-Umgebungen sehr praktisch, da die Speicherverwaltung einfach und effizient ist und die Prozesse in voneinander gut abgeschotteten Umgebungen laufen. Der virtuelle Adressraum ist unabhängig vom eingesteckten Speicher; wenn er nicht ausreicht, dann kann das Betriebssystem über die Swap-Datei mehr virtuellen Speicher zuordnen - durch die notwendigen Festplattenzugriffe entstehen dabei deutliche Performance-Einbußen. Mögliche Speicherbestückung beim Athlon 64: Der Athlon 64 Prozessor 3200+/3400+ benötigt PC3200-Speichermodule, gleichgültig welcher Chipsatz auf dem Mainboard sitzt. Langsamere Module funktionieren auch, aber bremsen den Prozessor etwas aus. Theoretisch verträgt der Athlon 64 Module mit bis zu 4 GByte, doch in der Praxis hängt die Maximalbestückung von der Anzahl und der Art der Speicher ab: Von PC3200-Modulen lassen sich maximal zwei einsetzen. Drei PC2700-Riegel sind möglich, aber nur zwei davon dürfen doppelreihig organisiert sein. Wer drei doppelreihige DIMMs nutzen will, muss sich mit PC2100 begnügen. Solange keine 2- oder 4-GByte-Module lieferbar sind und alle 512MB- und 1GB-Module doppelreihig organisiert sind, liegt die Maximalbestückung mit PC3200 bei 2 GByte, mit PC2700 bei 2,25 GByte und mit PC2100 bei 2 GByte. (vgl. ct 22/03/146) Mechanische Eigenschaften, CPU Sockel Athlon 64 paßt nicht mehr in den Sockel A, der seit Anfang 2000 für alle AMD-Prozessoren geeignet ist. Die Pin-Anzahl wurde von 462 (Sockel A) auf 754 (Sockel 754) erhöht. Die Server-/Workstation-Version des Athlon 64 heißt "Opteron" und weist sogar stattliche 940 Pins auf, die ist allerdings nicht für herkömmliche Anwender-PCs gedacht, sondern für Workstations und Server. Ein "Zwischending" ist der Athlon 64 FX mit ebenfalls zunächst 940 Pins. Eine Version mit 939 Pins ist in Planung. Die neuen AMD-Prozessoren haben jetzt auch einen IHS (integrated head spreader) wie beim Pentium 4 bekommen, das ist ein massiver Metalldeckel über dem Prozessor-Die, der vor Beschädigung bewahren soll und die Fläche zwischen Kühler und Prozessor vergrößert. AMD hat auch einen Überhitzungsschutz eingebaut, der bei einer Die-Temperatur von 125°C die internen Taktsignale des Prozessors abschaltet, wie schon beim Intel Pentium III und 4. Der Kühler wird nicht mehr an einer winzigen Nase am Prozessorsockel festgehalten, sondern in Gewinden einer Metallplatte, die auf der Rückseite des Boards aufgeklebt ist und zusätzlich vor allzu starkem Durchbiegen schützt. Tabellarische Übersicht verfügbarer Opteron-Prozessoren Serie | Model Name | MP | Clock Speed | L1 Cache | L2 Cache | 800 (1-8 way) | AMD Opteron 846 | 8P | 2.0GHz | I=64KB/D=64KB | 1024KB | AMD Opteron 844 | 8P | 1.8GHz | I=64KB/D=64KB | 1024KB | AMD Opteron 842 | 8P | 1.6GHz | I=64KB/D=64KB | 1024KB | AMD Opteron 840 | 8P | 1.4GHz | I=64KB/D=64KB | 1024KB | 200 (1-2 way) | AMD Opteron 246 | 2P | 2.0GHz | I=64KB/D=64KB | 1024KB | AMD Opteron 244 | 2P | 1.8GHz | I=64KB/D=64KB | 1024KB | AMD Opteron 242 | 2P | 1.6GHz | I=64KB/D=64KB | 1024KB | AMD Opteron 240 | 2P | 1.4GHz | I=64KB/D=64KB | 1024KB | 100 (1-way) | AMD Opteron 146 | 1P | 2.0GHz | I=64KB/D=64KB | 1024KB | AMD Opteron 144 | 1P | 1.8GHz | I=64KB/D=64KB | 1024KB | AMD Opteron 142 | 1P | 1.6GHz | I=64KB/D=64KB | 1024KB | AMD Opteron 140 | 1P | 1.4GHz | I=64KB/D=64KB | 1024KB | Tabelarischer Vergleich mit anderen Prozessor-Architekturen aus c't Magazin, Heft 20/2003, Seite 117 Pozessor | PPC970 | Power4+ | G4+(7455) | Itanium 2 LV | Pentium 4 | Opteron / FX | Athlon XP | Codename | | | Apollo | Deerfield | Northwood | Sledgehammer | Barton | Hersteller | IBM | IBM | Motorola | Intel | Intel | AMD | AMD | Transistoren | 52 Mio. | 184 Mio. | 33 Mio. | ca. 250 Mio. | 55 Mio. | 93 Mio. | 54,3 Mio. | Prozess | 0,13 µm | 0,13 µm | 0,18 µm | 0,13 µm | 0,13 µm | 0,13 µm | 0,13 µm | Chipgröße | 118 qmm | 267 qmm | 106 qmm | 266 qmm | 131 qmm | 212 qmm | 101 qmm | Architektur | 64 Bit | 64 Bit | 32 Bit | 64 Bit | 32 Bit | 64 Bit | 32 Bit | Virt./Phys. Adresse | 64 Bit / 42 Bit | 64 Bit/ 42 Bit | 32(52) Bit / 36 Bit | 58 Bit / 50 Bit | 32 Bit / 36 Bit | 48 Bit / 40 Bit | 32 Bit / 36 Bit | CPU-Kerne | 1 | 2 | 1 | 1 | 1 (HT) | 1 | 1 | µOps/Takt | 4+1 | 4+1 | 3+1 | 6 | 3 | 6 | 6 | µOps/ in Flight | 215 | 215 | 16 | 48 | 126 | 72 | 72 | Funktions- einheiten | 2x Int, 2x FPU, 2x Load/Store, 1x Branch, 1x Cond, 4x AltiVec | 2x Int, 2x FPU, 2x Load/Store, 1x Branch, 1x Cond | 4x Int, 1x FPU, 1x Load/Store, 4 x Altivec | 2x fastAGU, 1x ALU, 1x FPU, 3x Branch | 2x FastALU, 2x FastAGU, 1x ALU, 1x FPU, 1x Fload/Store | 3x Int/MMX, 3x AGU, FADD, FMUL, FMISC | 3x Int/MMX, 3x AGU, FADD, FMUL, FMISC | Basis-Pipeline | 16 | 12 | 7 | 8 | 20 (ab TC) | 12 | 10 | Max. Takt | 2 GHz | 1,7 GHz | 1,425 GHz | 1 GHz | 3,2 GHz | 2,0 (FX:2,2) GHZ | 2,2 GHz | Kernspannung | 1,3 V | 1,3 V | 1,3 V | 1,1 V | 1,5 V | 1,55 V | 1,65 V | Power (typ) | 42 W (1,8GHz) | 82 Watt | 22 Watt | < 55 Watt TDP | 82 Watt | 84,7 W (1,8 GHz) | 60,4 W (max) | L1-l-Cache | 64 K 1-way 128 Byte | 64 K 1-way 128 Byte | 32 K 8-way | 16 K 4-way 64 Byte | 12KµOps 8-way | 64 K WB 2-way 64 Byte | 64 K, WB 2-way 64 Byte | L1-D-Cache | 32 K, WT, 2-way, 128 Byte, 3 Ports | 32 K, WT, 2-way, 128 Byte, 3 Ports | 32 K, 8-way | 16 K, WT, 4-way, 64 Byte | 8 K, WT, 4-way, 64 Byte | 64 K, WB, 2-way, 64 Byte | 64 K, WB, 2-way, 64 Byte | L1-D-Cache Latenz | 4 T | 4 T | 3 T | 1 T (INT) | 2 T (int), 9 T (FP) | 3 T | 3 T | L2-Cache | 512 K, WB, 8Way, 128 Byte | 3x512K, WB, 8Way, 64 Byte | 256KB, 8-way, 64 Byte | 256 KB, WB, 8-way, 64 Byte | 512 K, WB, 8-way, 64 Byte | 1 MB, WB, 16-way, 64 Byte, exclusiv | 512 KB, 16-way, 64 Byte, exclusive | L2-Cache-Latenz | 12 T | 12 T | 9 T | 5 (INT), 6 (FP) | 7 (In), 7 (FP) | | 20 | L2-Cache-Bandbreite | 64 GByte/s | 3x 54,4 GByte/s | 45,6 GByte/s | 16 GByte/s | 100 GByte/s | 32 GByte/s (?) | 17,6 GByte | Bus-Breite | 2x 32 Bit | 2x 32 Bit | 64 Bit | 128 Bit | 64 Bit | 1..3x2x 16 Bit | 64 Bit | Bus-Transferrate | 2x 3,5 GByte/s | 2x 4 GByte/s | 1,0 GByte/s | 6,4 GByte/s | 6,4 GByte/s | 1..3x2x3,2 GByte/s | 3,2 GByte/s | Int-Regs | 32/80 | 32/80 | 32/? | 128 | 8/128 | 8/36 | 8/36 | FPU-Regs | 32/72 | 32/72 | 32/? | 128 | 8/128 | 8/36 | 8/36 | Neues Stepping für Athlon 64 Athlon64-Prozessoren im neuen CG-Stepping setzen die Stromspartechnik Cool'n'quiet effizienter um (der Athlon 64FX unterstützt diese Stromspartechnik nicht). Außerdem soll das neue Stepping mehr Leistung bieten und kompatibler mit DDR400-Speichermodulen umgehen. | alt | neu | Stepping | C0 | CG | Aufdruck | ...AP | ...AR | CPUID *) | F48 | F4A | Cool'n'Quiet erste Taktstufe | 1800MHz | 1800MHz | Cool'n'Quiet zweite Taktstufe | 800MHz 35 Watt 1,3 Volt | 1000MHz 22 Watt 1,1 Volt | *) Den CPUID kann man mit Tools wie CPU-Z oder AMD CPUID ermitteln. (siehe www.cpuid.com) Quelle: PC Games Hardware 4/04/03 Überblick: Athlon-64-Prozessoren aus PC Games Hardware (07/04, S. 47) Sockel | Typ | L2-Cache | Takt | Sp.-Int. | CPUID | PD | ST. Kern | 754 | Athlon 64 2800+ | 512 kB | 1800 MHz | SC | FCO | AX | CG Newcastle | 754 | Athlon 64 3000+ | 512 kB | 2000 MHz | SC | F48 | AP | CO Clawhammer | 754 | Athlon 64 3000+ | 512 kB | 2000 MHz | SC | F4A | AR | CG Clawhammer | 754 | Athlon 64 3000+ | 512 kB | 2000 MHz | SC | FCO | AX | CG Newcastle | 754 | Athlon 64 3200+ | 512 kB | 2200 MHz | SC | F48 | AP | CO Clawhammer | 754 | Athlon 64 3200+ | 512 kB | 2200 MHz | SC | F4A | AR | CG Clawhammer | 754 | Athlon 64 3200+ | 512 kB | 2200 MHz | SC | FCO | AX | CG Newcastle | 754 | Athlon 64 3200+ | 1024 kB | 2000 MHz | SC | F48 | AP | CO Clawhammer | 754 | Athlon 64 3200+ | 1024 kB | 2000 MHz | SC | F4A | AR | CG Clawhammer | 754 | Athlon 64 3400+ | 1024 kB | 2200 MHz | SC | F48 | AP | CO Clawhammer | 754 | Athlon 64 3400+ | 1024 kB | 2200 MHz | SC | F4A | AR | CG Clawhammer | 754 | Athlon 64 3700+ | 1024 kB | 2400 MHz | SC | F4A | AR | CG Clawhammer | 940 | Athlon 64 FX-51 | 1024 kB | 2200 Mhz | DC | F58 | AK | CO Sledgehammer | 940 | Athlon 64 FX-53 | 1024 kB | 2400 Mhz | DC | F58 | AK | CO Sledgehammer | 940 | Athlon 64 FX-53 | 1024 kB | 2400 Mhz | DC | F5A | AT | CG Sledgehammer | 939 | Athlon 64 3500+ | 512 kB | 2200 Mhz | DC | FF0 | AW | CG Newcastle | 939 | Athlon 64 3800+ | 512 kB | 2400 Mhz | DC | FF0 | AW | CG Newcastle | 939 | Athlon 64 FX-53 | 1024 kB | 2400 Mhz | DC | F7A | AS | CG Sledgehammer | | AP Athlon 64, CO AR Athlon 64, CG AX Athlon 64, (Newc.), CG AK Athlon 64, CO AT Athlon 64, CG | Die letzten beiden Ziffern geben einen Hinweis auf das Stepping: AP bedeutet "CO" AR bedeutet "CG" (= neu) | Sockel 940 | Sockel 939 | |
Navigation |
|
|