Tensor Processing Unit

Una tensor processing unit (TPU) è un acceleratore IA costituito da un circuito ASIC sviluppato da Google per applicazioni specifiche nel campo delle reti neurali. La prima tensor processing unit è stata presentata nel maggio del 2016 in occasione della Google I/O; la società specificò che le TPU erano già impiegate all'interno dei propri data center da oltre un anno[1][2]. Il circuito è stato appositamente progettato per la libreria open source TensorFlow[3]. La stessa Google continua ad impiegare le classiche CPU e GPU per altre tipologie di applicazioni orientate all'apprendimento automatico.
Descrizione
Google ha pensato per questo tipo di processore ad una architettura a specifico dominio progettata come un processore-matrice esclusivamente pensato per il lavoro per reti neurali a velocità incredibilmente elevate consumando molta meno energia e all'interno di uno spazio fisico ridotto[4]. In questa maniera viene ridotto grandemente il collo di bottiglia dell'architettura di von Neumann perchè Il compito principale del processore è di calcolare matrici,approcciando con una architettura ad array sistolico può usare migliaia di moltiplicatori e addenti e connetterli direttamente per formare una matrice fisica per questi operatori[4]. Per la seconda generazione di TPU ci sono due array sistolici da 128 x 128 che aggregano 32768 [{ALU]] per valori a 16 bit in virgola mobile per singolo processore[4]..
Prodotti
Prima generazione
Seconda generazione
Terza generazione
Note
- ^ (EN) Google's Tensor Processing Unit explained: this is what the future of computing looks like, su TechRadar. URL consultato il 14 aprile 2019.
- ^ (EN) Google supercharges machine learning tasks with TPU custom chip, su Google Cloud Platform Blog. URL consultato il 14 aprile 2019.
- ^ (EN) TensorFlow: Open source machine learning, su YouTube. URL consultato il 14 aprile 2019.
- ^ a b c What makes TPUs fine-tuned for deep learning?, in cloud.google.com. URL consultato il 28 aprile 2019.