Annuncio dell'anteprima di Trillium, la nostra TPU di sesta generazione e più avanzata finora.

Cloud Tensor Processing Units (TPU)

Accelera lo sviluppo dell'IA con Google Cloud TPU

Le Cloud TPU ottimizzano le prestazioni e i costi per tutti i carichi di lavoro di IA, dall'addestramento all'inferenza. Utilizzando un'infrastruttura di data center di livello mondiale, le TPU offrono affidabilità, disponibilità e sicurezza elevate.

Inizia

Non sai se le TPU sono adatte a te? Scopri quando utilizzare GPU o CPU su istanze Compute Engine per eseguire i carichi di lavoro di machine learning.

Panoramica

Che cos'è una Tensor Processing Unit (TPU)?

Le Google Cloud TPU sono acceleratori IA progettati su misura, ottimizzati per l'addestramento e l'inferenza di modelli IA di grandi dimensioni. Sono ideali per una varietà di casi d'uso, tra cui chatbot, generazione di codice, generazione di contenuti multimediali, sintesi vocale, servizi di visione artificiale, motori per suggerimenti e modelli di personalizzazione, tra gli altri.

Quali sono i vantaggi delle Cloud TPU?

Le Cloud TPU sono progettate per scalare in modo economico per un'ampia gamma di carichi di lavoro IA, compresi addestramento, ottimizzazione e inferenza. Le Cloud TPU offrono la versatilità per accelerare i carichi di lavoro sui principali framework di IA, tra cui PyTorch, JAX e TensorFlow. Orchestra senza problemi carichi di lavoro di IA su larga scala tramite l'integrazione di Cloud TPU in Google Kubernetes Engine (GKE). Utilizza Dynamic Workload Scheduler per migliorare la scalabilità dei carichi di lavoro pianificando tutti gli acceleratori necessari contemporaneamente. I clienti che cercano il modo più semplice per sviluppare modelli di IA possono sfruttare le Cloud TPU anche in Vertex AI, una piattaforma di AI completamente gestita.

Quando utilizzare le Cloud TPU?

Le Cloud TPU sono ottimizzate per l'addestramento di modelli di deep learning complessi e di grandi dimensioni che prevedono molti calcoli matriciali, ad esempio per creare modelli linguistici di grandi dimensioni (LLM). Le Cloud TPU includono anche SparseCore, ovvero processori di dataflow che accelerano i modelli basati sugli incorporamenti trovati nei modelli di suggerimenti. Altri casi d'uso includono il settore sanitario, come la modellazione del folding delle proteine e la scoperta di farmaci.

Quali sono le differenze tra le Cloud TPU e le GPU?

Una GPU è un processore specializzato progettato originariamente per la manipolazione della grafica computerizzata. La loro struttura parallela le rende ideali per algoritmi che elaborano grandi blocchi di dati presenti in genere nei carichi di lavoro di IA. Scopri di più.

Una TPU è un circuito integrato specifico per applicazioni (ASIC) progettato da Google per le reti neurali. Le TPU dispongono di funzionalità specializzate, come l'unità di moltiplicazione a matrice (MXU) e la topologia di interconnessione proprietaria, che le rendono ideali per accelerare l'addestramento e l'inferenza dell'IA.

Versioni di Cloud TPU

Versione Cloud TPU	Descrizione	Disponibilità
Trillium	La Cloud TPU più avanzata fino ad oggi	Durante l'anteprima, Trillium è disponibile in Nord America (regione degli Stati Uniti orientali), Europa (regione occidentale) e Asia (regione nord-orientale)
Cloud TPU v5p	La Cloud TPU più potente per l'addestramento di modelli IA	Cloud TPU v5p è in disponibilità generale in Nord America (regione degli Stati Uniti orientali)
Cloud TPU v5e	Una Cloud TPU versatile per le esigenze di addestramento e inferenza	Cloud TPU v5e è in disponibilità generale in Nord America (regioni degli Stati Uniti centrali/orientali/meridionali/occidentali), Europa (regione occidentale) e Asia (regione del sud-orientale)

Informazioni aggiuntive sulle versioni di Cloud TPU

Trillium

Descrizione

La Cloud TPU più avanzata fino ad oggi

Disponibilità

Durante l'anteprima, Trillium è disponibile in Nord America (regione degli Stati Uniti orientali), Europa (regione occidentale) e Asia (regione nord-orientale)

Cloud TPU v5p

Descrizione

La Cloud TPU più potente per l'addestramento di modelli IA

Disponibilità

Cloud TPU v5p è in disponibilità generale in Nord America (regione degli Stati Uniti orientali)

Cloud TPU v5e

Descrizione

Una Cloud TPU versatile per le esigenze di addestramento e inferenza

Disponibilità

Cloud TPU v5e è in disponibilità generale in Nord America (regioni degli Stati Uniti centrali/orientali/meridionali/occidentali), Europa (regione occidentale) e Asia (regione del sud-orientale)

Informazioni aggiuntive sulle versioni di Cloud TPU

Come funziona

Dai un'occhiata all'interno delle Google Cloud TPU, inclusa una rara vista dall'interno dei data center in cui avviene la magia. I clienti utilizzano le Cloud TPU per eseguire alcuni dei più grandi carichi di lavoro di IA al mondo e questa potenza proviene da molto più di un semplice chip. In questo video, dai un'occhiata ai componenti del sistema TPU, tra cui networking di data center, interruttori di circuiti ottici, sistemi di raffreddamento ad acqua, verifica della sicurezza biometrica e altro ancora.

Utilizzi comuni

Esegui carichi di lavoro per l'addestramento dell'IA su larga scala

Addestramento di modelli performante ed efficiente

Inizia rapidamente con MaxText e MaxDiffusion, deployment di riferimento open source ad alte prestazioni e altamente scalabili per l'addestramento di modelli di grandi dimensioni.

Scopri di più

Procedure

Addestramento di modelli performante ed efficiente

Inizia rapidamente con MaxText e MaxDiffusion, deployment di riferimento open source ad alte prestazioni e altamente scalabili per l'addestramento di modelli di grandi dimensioni.

Scopri di più

Risorse aggiuntive

Addestramento su IA potente, scalabile ed efficiente

Massimizza le prestazioni, l'efficienza e il time to value con le Cloud TPU. Scala fino a migliaia di chip con l'addestramento multislice delle Cloud TPU. Misura e migliora la produttività dell'addestramento ML su larga scala con ML Goodput Measurement. Inizia rapidamente con MaxText e MaxDiffusion, deployment di riferimento open source per l'addestramento di modelli di grandi dimensioni.

Scalabilità quasi lineare fino a decine di migliaia di chip con l'addestramento multislice

Ottimizza i modelli IA di base

Adatta gli LLM per le tue applicazioni con Pytorch/XLA

Ottimizza in modo efficiente i modelli di base sfruttando i tuoi dati di addestramento che rappresentano il tuo caso d'uso. Cloud TPU v5e offre prestazioni di ottimizzazione LLM fino a 1,9 volte superiori per dollaro rispetto a Cloud TPU v4.

Ottimizzazione delle prestazioni LLM di Cloud TPU/$

Risorse aggiuntive

Adatta gli LLM per le tue applicazioni con Pytorch/XLA

Ottimizza in modo efficiente i modelli di base sfruttando i tuoi dati di addestramento che rappresentano il tuo caso d'uso. Cloud TPU v5e offre prestazioni di ottimizzazione LLM fino a 1,9 volte superiori per dollaro rispetto a Cloud TPU v4.

Gestisci carichi di lavoro di inferenza IA su larga scala

Inferenza ad alte prestazioni, scalabile ed economica

Accelera l'inferenza dell'AI con JetStream e MaxDiffusion. JetStream è un nuovo motore di inferenza progettato nello specifico per l'inferenza dei modelli linguistici di grandi dimensioni (LLM). JetStream rappresenta un passo avanti significativo in termini di prestazioni ed efficienza dei costi e offre velocità effettiva e latenza senza precedenti per l'inferenza LLM sulle Cloud TPU. MaxDiffusion è un insieme di implementazioni di modelli di diffusione ottimizzate per le Cloud TPU, che semplificano l'esecuzione dell'inferenza per i modelli di diffusione su Cloud TPU ad alte prestazioni.

Scopri di più

Procedure

Inferenza ad alte prestazioni, scalabile ed economica

Accelera l'inferenza dell'AI con JetStream e MaxDiffusion. JetStream è un nuovo motore di inferenza progettato nello specifico per l'inferenza dei modelli linguistici di grandi dimensioni (LLM). JetStream rappresenta un passo avanti significativo in termini di prestazioni ed efficienza dei costi e offre velocità effettiva e latenza senza precedenti per l'inferenza LLM sulle Cloud TPU. MaxDiffusion è un insieme di implementazioni di modelli di diffusione ottimizzate per le Cloud TPU, che semplificano l'esecuzione dell'inferenza per i modelli di diffusione su Cloud TPU ad alte prestazioni.

Scopri di più

Risorse aggiuntive

Massimizza le prestazioni/$ con un'infrastruttura IA scalabile

Cloud TPU v5e consente un'inferenza ad alte prestazioni ed economica per un'ampia gamma di carichi di lavoro IA, inclusi i più recenti LLM e modelli di IA generativa. TPU v5e offre prestazioni in termini di velocità effettiva fino a 2,5 volte superiore per dollaro e una velocità fino a 1,7 volte superiore rispetto a Cloud TPU v4. Ogni chip TPU v5e fornisce fino a 393 trilioni di operazioni int8 al secondo, consentendo a modelli complessi di fare previsioni rapidamente. Un pod TPU v5e offre fino a 100 quadrilioni di operazioni int8 al secondo o 100 petaOps di potenza di calcolo.

Scopri di più sull'inferenza su TPU v5e

Cloud TPU in GKE

Esegui carichi di lavoro IA ottimizzati con l'orchestrazione della piattaforma

Una solida piattaforma AI/ML prende in considerazione i seguenti livelli: (i) Orchestrazione dell'infrastruttura che supporta le GPU per l'addestramento e la gestione dei carichi di lavoro su larga scala, (ii) Integrazione flessibile con i framework di trattamento dati e computing distribuito (iii) Supporto a più team sulla stessa infrastruttura per massimizzare l'utilizzo delle risorse.

Scopri di più sull'orchestrazione IA/ML su GKE

Procedure

Esegui carichi di lavoro IA ottimizzati con l'orchestrazione della piattaforma

Una solida piattaforma AI/ML prende in considerazione i seguenti livelli: (i) Orchestrazione dell'infrastruttura che supporta le GPU per l'addestramento e la gestione dei carichi di lavoro su larga scala, (ii) Integrazione flessibile con i framework di trattamento dati e computing distribuito (iii) Supporto a più team sulla stessa infrastruttura per massimizzare l'utilizzo delle risorse.

Scopri di più sull'orchestrazione IA/ML su GKE

Risorse aggiuntive

Scalabilità semplice con GKE

Combina la potenza delle Cloud TPU con la flessibilità e la scalabilità di GKE per creare ed eseguire il deployment di modelli di machine learning in modo più rapido e semplice che mai. Con le Cloud TPU disponibili in GKE, ora puoi avere un singolo ambiente operativo coerente per tutti i tuoi carichi di lavoro, standardizzando le pipeline MLOps automatizzate.

Scopri di più

Cloud TPU in Vertex AI

Addestramento e previsioni di Vertex AI con Cloud TPU

Per i clienti che cercano un modo più semplice per sviluppare modelli IA, puoi eseguire il deployment di Cloud TPU v5e con Vertex AI, una piattaforma end-to-end per la creazione modelli di IA su un'infrastruttura completamente gestita, creata appositamente per la gestione a bassa latenza e l'addestramento ad alte prestazioni.

Risorse aggiuntive

Addestramento e previsioni di Vertex AI con Cloud TPU

Per i clienti che cercano un modo più semplice per sviluppare modelli IA, puoi eseguire il deployment di Cloud TPU v5e con Vertex AI, una piattaforma end-to-end per la creazione modelli di IA su un'infrastruttura completamente gestita, creata appositamente per la gestione a bassa latenza e l'addestramento ad alte prestazioni.

Prezzi

Prezzi per Cloud TPU	Tutti i prezzi di Cloud TPU si intendono per chip/ora
Versione Cloud TPU	Prezzo di valutazione (USD)	Impegno di 1 anno (USD)	Impegno di 3 anni (USD)
Trillium	Starting at 2,7000 $ per chip/ora	Starting at 1,8900 $ per chip/ora	Starting at 1,2200 $ per chip/ora
Cloud TPU v5p	Starting at 4,2000 $ per chip/ora	Starting at 2,9400 $ per chip/ora	Starting at 1,8900 $ per chip/ora
⁠Cloud TPU v5e	Starting at 1,2000 $ per chip/ora	Starting at 0,8400 $ per chip/ora	Starting at 0,5400 $ per chip/ora

I prezzi di Cloud TPU variano in base al prodotto e alla regione.

Prezzi per Cloud TPU

Tutti i prezzi di Cloud TPU si intendono per chip/ora

Trillium

Prezzo di valutazione (USD)

Starting at

2,7000 $

per chip/ora

Impegno di 1 anno (USD)

Starting at

1,8900 $

per chip/ora

Impegno di 3 anni (USD)

Starting at

1,2200 $

per chip/ora

Cloud TPU v5p

Prezzo di valutazione (USD)

Starting at

4,2000 $

per chip/ora

Impegno di 1 anno (USD)

Starting at

2,9400 $

per chip/ora

Impegno di 3 anni (USD)

Starting at

1,8900 $

per chip/ora

⁠Cloud TPU v5e

Prezzo di valutazione (USD)

Starting at

1,2000 $

per chip/ora

Impegno di 1 anno (USD)

Starting at

0,8400 $

per chip/ora

Impegno di 3 anni (USD)

Starting at

0,5400 $

per chip/ora

I prezzi di Cloud TPU variano in base al prodotto e alla regione.

CALCOLATORE PREZZI

Stima i costi mensili di Cloud TPU, inclusi i prezzi e le tariffe specifici per regione.

Stima i costi

PREVENTIVO PERSONALIZZATO

Contatta il nostro team di vendita per ricevere un preventivo personalizzato per la tua organizzazione.

Richiedi un preventivo

Inizia la tua proof of concept

Cloud Tensor Processing Units (TPU)

Accelera lo sviluppo dell'IA con Google Cloud TPU

Caratteristiche principali del prodotto

Che cos'è una Tensor Processing Unit (TPU)?

Quali sono i vantaggi delle Cloud TPU?

Quando utilizzare le Cloud TPU?

Quali sono le differenze tra le Cloud TPU e le GPU?

Esegui carichi di lavoro per l'addestramento dell'IA su larga scala

Addestramento di modelli performante ed efficiente

Addestramento su IA potente, scalabile ed efficiente

Procedure

Addestramento di modelli performante ed efficiente

Risorse aggiuntive

Addestramento su IA potente, scalabile ed efficiente

Ottimizza i modelli IA di base

Adatta gli LLM per le tue applicazioni con Pytorch/XLA

Risorse aggiuntive

Adatta gli LLM per le tue applicazioni con Pytorch/XLA

Gestisci carichi di lavoro di inferenza IA su larga scala

Inferenza ad alte prestazioni, scalabile ed economica

Massimizza le prestazioni/$ con un'infrastruttura IA scalabile

Procedure

Inferenza ad alte prestazioni, scalabile ed economica

Risorse aggiuntive

Massimizza le prestazioni/$ con un'infrastruttura IA scalabile

Cloud TPU in GKE

Esegui carichi di lavoro IA ottimizzati con l'orchestrazione della piattaforma

Scalabilità semplice con GKE

Procedure

Esegui carichi di lavoro IA ottimizzati con l'orchestrazione della piattaforma

Risorse aggiuntive

Scalabilità semplice con GKE

Cloud TPU in Vertex AI

Addestramento e previsioni di Vertex AI con Cloud TPU

Risorse aggiuntive

Addestramento e previsioni di Vertex AI con Cloud TPU

CALCOLATORE PREZZI

PREVENTIVO PERSONALIZZATO

Inizia la tua proof of concept

Prova Cloud TPU gratuitamente

Leggi una rapida introduzione all'uso delle Cloud TPU

Esecuzione di TensorFlow su una VM Cloud TPU

Esecuzione di JAX su una VM Cloud TPU

Esecuzione di PyTorch su una VM Cloud TPU