Tutorials

▷ Was ist der Prozessor-IPC?

Inhaltsverzeichnis:

Anonim

In heutigen Computern sind Anweisungen pro Zyklus oder auch als IPCs bezeichnet ein sehr wichtiger Aspekt der Prozessorleistung. Dieses Konzept stellt die durchschnittliche Anzahl von Befehlen dar, die für jeden Prozessortaktzyklus ausgeführt werden. Je höher dieser Wert ist, desto leistungsfähiger ist der Prozessor. In diesem Artikel erklären wir alles, was mit dem CPI zu tun hat.

Inhaltsverzeichnis

Was ist der Prozessor-CPI, wie wird er berechnet und wie wichtig ist er?

Die IPC-Berechnung erfolgt durch Ausführen eines Codesatzes, Berechnen der Anzahl der zum Ausführen erforderlichen Anweisungen auf Maschinenebene und anschließendes Verwenden von Hochleistungszeitgebern zum Berechnen der Anzahl der Taktzyklen, die zum Ausführen auf realer Hardware erforderlich sind.. Das Endergebnis ergibt sich aus der Division der Anzahl der Befehle durch die Anzahl der CPU-Taktzyklen.

Die Anzahl der Befehle pro Sekunde und die Gleitkommaoperationen pro Sekunde für einen Prozessor können abgeleitet werden, indem die Anzahl der Befehle pro Zyklus mit der Taktrate (Zyklen pro Sekunde in Hertz) des betreffenden Prozessors multipliziert wird. Die Anzahl der Anweisungen pro Sekunde ist ein grober Indikator für die wahrscheinliche Leistung des Prozessors.

Wir empfehlen, unseren Artikel über die besten Prozessoren auf dem Markt zu lesen

Die Anzahl der pro Takt ausgeführten Befehle ist für einen bestimmten Prozessor keine Konstante, da sie davon abhängt, wie die bestimmte ausgeführte Software mit dem Prozessor und in der Tat mit der gesamten Maschine, insbesondere mit der Speicherhierarchie, interagiert. Bestimmte Prozessoreigenschaften führen jedoch tendenziell zu Designs mit überdurchschnittlichen IPC-Werten, z. B. dem Vorhandensein mehrerer arithmetischer Logikeinheiten und kurzer Pipes. Beim Vergleich verschiedener Befehlssätze kann ein einfacherer Befehlssatz zu einer höheren IPC-Zahl führen als die Implementierung eines komplexeren Befehlssatzes, der dieselbe Chiptechnologie verwendet, jedoch den Befehlssatz Komplex kann mit weniger Anweisungen nützlichere Arbeit leisten.

Faktoren, die den VPI bestimmen

Ein bestimmtes Befehlsniveau pro Sekunde kann mit einem hohen IPC und einer niedrigen Taktrate (wie der AMD Athlon und der frühen Intel Core-Serie) oder mit einem niedrigen IPC und einer hohen Taktrate (wie dem Intel Pentium) erreicht werden 4). Beide sind gültige Prozessordesigns, und die Wahl zwischen beiden hängt häufig von der Historie, den technischen Einschränkungen oder dem Marketingdruck ab. Ein hoher IPC mit hoher Frequenz bietet jedoch die beste Leistung.

Zyklusanweisungen für mehrere Prozessoren.

Diese Zahlen sind nicht der IPC-Wert dieser CPUs, sondern repräsentieren die theoretisch mögliche Gleitkomma-Leistung. Bitte beachten Sie, dass die folgenden Zahlen nur die logischen Breiten der SIMD-Laufwerke des Prozessors darstellen. Sie berücksichtigen weder die in den meisten Architekturen vorhandenen mehreren SIMD-Pipes noch die Hauptarchitekturdefinition von IPC, die die Anzahl der pro Zyklus entfernten durchschnittlichen Skalarbefehle misst, sowohl Ganzzahlen als auch Gleitkommawerte und Steuerung.

CPU DP IPC mit doppelter Genauigkeit Einfache Präzision SP IPC
Intel Core und Intel Nehalem 4 8
Intel Sandy Bridge und Intel Ivy Bridge 8 16
Intel Haswell und Intel Coffee Lake 16 32
Intel Ice Lake ? ?
Intel Xeon Skylake (AVX-512) 32 64
AMD K10 6 12
AMD Bulldozer, AMD Piledriver und AMD Steamroller 12 24
AMD Ryzen 16 32
Intel Atom (Bonnell, Saltwell, Silvermont und Goldmont) 2 4
AMD Bobcat 2 4
AMD Jaguar und Puma 4 8
ARM Cortex-A7 1 8
ARM Cortex-A9 1 8
ARM Cortex-A15 1 8
ARM Cortex-A32 2 8
ARM Cortex-A35 2 8
ARM Cortex-A53 2 8
ARM Cortex-A57 2 8
ARM Cortex-A72 2 8
Qualcomm Krait 1 8
Qualcomm Kryo 2 8
IBM PowerPC A2 8 SP-Elemente verlängern sich

Ed zu DP und verarbeitet

in den gleichen Einheiten

IBM PowerPC A2 4

Um eine theoretische GFLOPS-Bewertung (Milliarden FLOPS) für eine bestimmte CPU zu erhalten, multiplizieren Sie die Anzahl in dieser Tabelle mit der Anzahl der Kerne und dann mit dem Werttakt (in GHz) eines bestimmten CPU-Modells. Ein Coffee Lake i7-8700K verarbeitet beispielsweise theoretisch 32 Flops mit einfacher Genauigkeit pro Zyklus, verfügt über 6 Kerne und einen 3, 7-GHz-Basistakt. Dies ergibt 32 x 6 x 3, 7 = 710, 4 GFLOPS.

Es ist wichtig zu beachten, dass Multithreading nicht bedeutet, dass zwei Threads gleichzeitig auf demselben Kern arbeiten und Pipeline-Ressourcen gemeinsam nutzen können. Stattdessen erlaubt die CPU einem Thread, den Kernel zu verwenden, während ein anderer darauf wartet, dass die Daten aus dem Speicher kommen, wie im Fall eines fehlenden Caches. Der Betriebssystementwickler kann den ursprünglichen Thread in die Warteschlange zurückgeben und nach Wiederherstellung der Daten zur CPU zurückkehren.

Daher hat diese Funktion keine Auswirkung auf die theoretische Gleitkomma-Leistung einer CPU. In bestimmten Fällen kann sie jedoch dazu beitragen, dass die CPU in der Praxis in mehreren Threads näher an diese Leistung heranrückt. Im Allgemeinen zeigt das große Prozessorprotokoll, wie große Prozessornummern einmal zählen können. Die Anzahl der Datensätze ist ebenfalls wichtig, da sie mit einigen Anweisungen für einen Moment miteinander verbunden werden können.

Der IPC ist nicht das einzige, was auf einem PC zählt

Die nützliche Arbeit, die mit jedem PC ausgeführt werden kann, hängt neben der Geschwindigkeit des Prozessors von vielen Faktoren ab. Zu diesen Faktoren gehören die Befehlssatzarchitektur, die Prozessormikroarchitektur und die Organisation des Computersystems, wie z. B. das Design des Plattenspeichersystems und die Fähigkeiten und Leistungen anderer verbundener Geräte, die Effizienz des Betriebssystems und vor allem: Wichtig ist die Software.

Für Benutzer und Käufer eines Computersystems sind Uhranweisungen kein besonders nützlicher Hinweis auf die Leistung ihres Systems. Für eine genaue Messung der für sie relevanten Leistung sind Anwendungsbenchmarks viel nützlicher. Das Wissen über ihre Existenz ist nützlich, da es ein leicht verständliches Beispiel dafür liefert, warum die Taktrate nicht der einzige Faktor ist, der für die Geräteleistung relevant ist.

Wir empfehlen, die folgenden Anleitungen zu lesen:

In unserem Artikel über den Prozessor-IPC hoffen wir, dass Sie ihn sehr nützlich finden.

Wikipedia-Quelle

Tutorials

Die Wahl des Herausgebers

Back to top button