Home Aziende Google Google Cloud: tutte le novità di Vertex AI per l’intelligenza artificiale aziendale

Google Cloud: tutte le novità di Vertex AI per l’intelligenza artificiale aziendale

Con l’accesso a una ampia varietà di modelli di base, solide opzioni di infrastruttura e una serie di strumenti per lo sviluppo di modelli e MLOps, Vertex AI di Google Cloud è una piattaforma unica per la creazione di applicazioni e agenti di intelligenza artificiale generativa, ma anche per la loro distribuzione e manutenzione.

In occasione della conferenza Google Cloud Next, Google ha presentato interessanti aggiornamenti dei modelli e funzionalità della piattaforma che continuano a migliorare Vertex AI.

Come prima novità, Gemini 1.5 Pro è ora disponibile in public preview in Vertex AI, portando la finestra contestuale più grande agli sviluppatori di tutto il mondo. Imagen 2, la famiglia di modelli per la generazione di immagini di Google, può ora essere utilizzata per creare brevi immagini live di 4 secondi a partire da prompt di testo. In Imagen 2 è disponibile anche l’editing delle immagini, che comprende l’inpainting/outpainting e il watermarking digitale. Inoltre, Google sta aggiungendo a Vertex AI CodeGemma, un nuovo modello della famiglia di modelli leggeri Gemma.

L’accuratezza della risposta è fondamentale per i servizi di AI generativa. Per questo Google sta ampliando le capacità di grounding in Vertex AI, compresa la possibilità di fornire il grounding alle risposte direttamente con Google Search, ora in public preview. Gli utenti di Vertex AI hanno ora accesso a informazioni fresche e di alta qualità che migliorano significativamente l’accuratezza delle risposte dei modelli.

Per aiutare i clienti a gestire e distribuire i modelli in produzione, Google sta poi ampliando le funzionalità MLOps per Gen AI, compresi i nuovi servizi di gestione e valutazione dei modelli di grandi dimensioni. Queste funzionalità rendono più facile per le aziende ottenere le migliori prestazioni dai modelli di gen AI su scala e iterare più rapidamente dalla sperimentazione alla produzione.

Annunciato a febbraio, Gemini 1.5 Pro è ora in public preview e mette a disposizione dei clienti la potenza della finestra di contesto da 1 milione di token, che Google definisce la più grande al mondo. Questa innovazione consente di ragionare in modo nativo su enormi quantità di dati specifici per una richiesta. I clienti – sostiene l’azienda – riferiscono che spesso questo elimina la necessità di perfezionare i modelli di base o di utilizzare la Retrieval Augmented Generation (RAG) per fondare le risposte del modello su dati esterni.

I clienti stanno creando casi d’uso completamente nuovi, tra cui la creazione di agenti di assistenza clienti e tutor accademici dotati di intelligenza artificiale, l’analisi di grandi raccolte di documenti finanziari complessi, l’individuazione di lacune nella documentazione e l’esplorazione di interi codebase o raccolte di dati tramite il linguaggio naturale.

Inoltre, Google Cloud ha annunciato che Gemini 1.5 Pro su Vertex AI supporta ora la capacità di elaborare flussi audio, compreso il parlato, e persino la parte audio dei video. Ciò consente agli utenti di effettuare analisi cross-modali senza soluzione di continuità, fornendo approfondimenti su testo, immagini, video e audio. Fornisce inoltre una trascrizione di alta qualità e può essere utilizzato per la ricerca di contenuti audio e video, ad esempio per ricercare, analizzare e rispondere a domande nelle call o nelle riunioni.

Mentre i modelli Gemini sono ottimi per il ragionamento avanzato e i casi d’uso generici, i modelli Gen AI specifici per le attività possono aiutare le aziende a fornire funzionalità specializzate. Google mette in evidenza come l’azienda stia assistendo a organizzazioni che sfruttano Imagen 2 per generare immagini di alta qualità e precisione su scala enterprise.

La nuova preview delle capacità di conversione text to live image rende Imagen ancora più potente per i carichi di lavoro aziendali. Ciò consente ai team di marketing e creativi di generare immagini animate, come gif e altro, a partire da un prompt di testo. Inizialmente, le immagini live saranno fornite a 24 fotogrammi al secondo (fps) con una risoluzione di 360×640 pixel e una durata di 4 secondi, con piani di miglioramento continui, ha annunciato Google Cloud.

Dato il design mirato di questo modello per le applicazioni aziendali, è adatto a temi come la natura, le immagini di cibo e gli animali. È in grado di generare una serie di angolazioni e di movimenti della telecamera, garantendo al contempo la coerenza dell’intera sequenza. A conferma dell’impegno di Google per la fiducia tra creatori di contenuti e utenti, Imagen per la generazione di immagini live è dotato di filtri di sicurezza e filigrane digitali.

Google sta inoltre aggiornando la capacità di generazione di immagini di Imagen 2 con funzioni avanzate di fotoritocco, tra cui l’inpainting e l’outpainting. Ora disponibili per Imagen 2 su Vertex AI, queste funzioni consentono di rimuovere facilmente gli elementi indesiderati in un’immagine, aggiungere nuovi elementi ed espandere i bordi dell’immagine per creare un campo visivo più ampio. Inoltre, la funzione di watermarking digitale, basata su SynthID di Google DeepMind, è ora generalmente disponibile, consentendo ai clienti di generare watermark invisibili e di verificare le immagini e le immagini live generate dalla famiglia di modelli Imagen.

I modelli foundation sono limitati dai loro dati di addestramento, che possono diventare rapidamente obsoleti e non includere le informazioni di cui i modelli hanno bisogno per i casi d’uso aziendali. Per questo ora Google Cloud ha annunciato che le organizzazioni possono rendere “grounded” i modelli in Google Search, dando ai clienti l’accesso alla potenza combinata dei più recenti modelli di base di Google insieme all’accesso a informazioni fresche e di alta qualità per migliorare significativamente la completezza e l’accuratezza delle risposte. Ciò significa che gli utenti ottengono risultati che si basano su quella che l’azienda definisce una delle fonti di informazione più affidabili, costruita su decenni di esperienza nella classificazione e nella comprensione della qualità delle informazioni.

Google Cloud offre inoltre alle aziende diverse modalità per sfruttare la retrieval augmented generation (RAG), che consente alle organizzazioni di ancorare le risposte dei modelli alle fonti di dati aziendali, utilizzando metodi come la somiglianza semantica per la ricerca di documenti e archivi di dati.

Google Cloud chiama questo concetto del grounding sulla ricerca e sui dati aziendali “Enterprise Truth e lo considera un fondamento per costruire la prossima generazione di agent AI, che vanno oltre la chat per cercare proattivamente informazioni e svolgere compiti per conto dell’utente.

Google Cloud ha inoltre ampliato le funzionalità MLOps di Vertex AI per soddisfare le esigenze di chi costruisce con modelli di grandi dimensioni, consentendo ai clienti di lavorare su tutti i progetti di intelligenza artificiale con un insieme comune di funzionalità, come il model registry, il feature store, le pipeline per gestire l’iterazione e il deployment dei modelli e altro ancora. In questo modo, i clienti possono continuare a trarre vantaggio dai loro investimenti in MLOps, soddisfacendo al contempo le esigenze dei loro carichi di lavoro Gen AI.

Questi ultimi annunci secondo Google rendono più facile per le aziende ottenere le migliori prestazioni dai modelli di Gen AI su scala e iterare più rapidamente dalla sperimentazione alla produzione:

  • Vertex AI Prompt Management affronta alcuni dei principali punti dolenti della Gen AI che vengono segnalati dai clienti: la sperimentazione dei prompt, la migrazione dei prompt e il monitoraggio di prompt e parametri. Vertex AI Prompt Management fornisce una libreria di prompt utilizzati dai team, con tanto di versioning, possibilità di ripristinare i vecchi prompt e suggerimenti generati dall’AI per migliorare le prestazioni dei prompt. I clienti possono confrontare le iterazioni dei prompt l’una accanto all’altra per valutare l’impatto di piccole modifiche sui risultati e il servizio offre funzioni come note e tag per aumentare la collaborazione.
  • Gli strumenti di valutazione di Vertex AI aiutano i clienti a confrontare modelli di prima parte, di terza parte e open source per una serie specifica di attività. Ora è supportata la Rapid Evaluation in preview per aiutare gli utenti a valutare le prestazioni del modello durante l’iterazione del miglior progetto immediato. Gli utenti possono accedere a metriche per varie dimensioni (ad esempio, somiglianza, rispetto delle istruzioni, fluidità) e a pacchetti per compiti specifici (ad esempio, qualità della generazione del testo). Per una valutazione più robusta, AutoSxS è ora generalmente disponibile e aiuta i team a confrontare le prestazioni di due modelli, includendo spiegazioni sul perché un modello supera un altro e punteggi di certezza che aiutano gli utenti a comprendere l’accuratezza di una valutazione.

Infine, ma non meno importante, Google Cloud sta espandendo la residenza dei dati memorizzati a riposo per le API Gemini, Imagen ed Embeddings su Vertex AI a 11 nuovi Paesi, tra cui il nostro: Australia, Brasile, Finlandia, Hong Kong, India, Israele, Italia, Polonia, Spagna, Svizzera e Taiwan. I clienti possono ora limitare l’elaborazione dell’apprendimento automatico agli Stati Uniti o all’Unione Europea quando utilizzano Gemini 1.0 Pro e Imagen. Queste nuove region, che si aggiungono ad altri 10 Paesi annunciati l’anno scorso, consentono ai clienti di avere un maggiore controllo sul luogo di archiviazione dei dati e sulle modalità di accesso, rendendo più facile per i clienti soddisfare i requisiti normativi e di sicurezza in tutto il mondo.

Per mantenere le promesse dell’AI generativa, secondo Google Cloud le organizzazioni devono bilanciare le capacità dei modelli e dell’infrastruttura rispetto ai costi, garantire che i modelli ancorino i loro ragionamenti ai dati appropriati e adattare gli MLOP per l’implementazione, la gestione e la manutenzione dei modelli su scala. Con gli annunci odierni, dal punto di vista di Google Cloud i clienti di Vertex AI possono soddisfare questi requisiti in modo più rapido e semplice che mai, consentendo loro di concentrarsi sull’innovazione basata sull’AI anziché sulla gestione della complessità di adozione.

Maggiori informazioni su Vertex AI e la possibilità di iniziare una prova gratuita sono disponibili sul sito di Google Cloud.

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche
css.php