Grafikkarten

Nvidia bringt tesla t4 auf den Markt, die schnellste Karte für Rechenzentren

Inhaltsverzeichnis:

Anonim

Nvidia hat seine neue GPU für maschinelles Lernen und Inferenz in Rechenzentren angekündigt. Die neue Tesla T4- Karte basiert auf der Turing-Architektur und ist der Nachfolger des aktuellen Tesla P4-Modells, das praktisch alle großen Cloud-Computing-Anbieter abdeckt.

Nvidia Tesla T4 will Rechenzentren revolutionieren

Nvidia argumentiert, dass die Tesla T4 deutlich schneller sind als die P4. Für Sprachinferenzen ist T4 beispielsweise 34-mal schneller als die Verwendung einer CPU und mehr als 3, 5-mal schneller als P4. Der maximale Durchsatz für Tesla P4 beträgt 260 TOPS für 4-Bit-Ganzzahloperationen und 65 TOPS für Gleitkommaoperationen. T4 befindet sich auf einer 75-Watt-PCI-e-Karte mit Standardprofil.

Wir empfehlen, unseren Beitrag über Details der Turing-Architektur von Nvidia zu lesen

Am wichtigsten ist, dass Nvidia diese Chips speziell für AI-Inferenz entwickelt hat. Dies macht Tesla T4 zu einer so effizienten GPU für Inferenzen, dass es sich um Turings neuen Tensor Core handelt. Jensen Huang hat bereits über den neuen Tensor Core gesprochen und darüber, was er für Spiele, Rendering und KI-Operationen tun kann. Insgesamt verfügt der Chip über 320 Tensor Core Turing und 2.560 CUDA-Kerne.

Neben dem neuen Chip führt Nvidia auch ein Update seiner TensorRT-Software ein, um Deep-Learning-Modelle zu optimieren. Diese neue Version enthält auch den TensorRT Inference Server, einen vollständig containerisierten Mikroservice für die Inferenz von Rechenzentren, der sich nahtlos mit einer vorhandenen Kubernetes-Infrastruktur verbindet.

Turing ist eine der innovativsten Nvidia-Architekturen, selbst auf dem Spielemarkt, wo erstmals Raytracing in Echtzeit verwendet werden kann, um das grafische Finish der modernsten Spiele zu verbessern.

Techpowerup-Schriftart

Grafikkarten

Die Wahl des Herausgebers

Back to top button