Enterprise Aziende Ibm Intelligenza Artificiale Open source

IBM Granite 3.0: nuovi modelli AI ad alte prestazioni per le aziende

21 Ottobre 2024

Oggi, in occasione dell’evento annuale TechXchange di IBM, l’azienda ha annunciato il rilascio della sua famiglia di modelli di intelligenza artificiale più avanzata finora, Granite 3.0. I modelli linguistici di terza generazione Granite di IBM secondo l’azienda sono in grado di superare o eguagliare i modelli di dimensioni simili dei principali fornitori di modelli su molti benchmark accademici e di settore, dimostrando ottime prestazioni, trasparenza e sicurezza.

Coerentemente con l’impegno dell’azienda nei confronti dell’IA open-source, i modelli Granite sono rilasciati sotto la licenza permissiva Apache 2.0, il che li rende unici per la combinazione di prestazioni, flessibilità e autonomia che offrono ai clienti enterprise e alla comunità in generale.

La famiglia Granite 3.0 di IBM comprende:

Uso generale/linguaggio: Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
Guardrails & Safety: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
Mixture-of-Experts: Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base

I nuovi modelli linguistici Granite 3.0 8B e 2B sono stati progettati come modelli ‘workhorse’ per l’AI enterprise, in grado di offrire prestazioni elevate per compiti quali la Retrieval Augmented Geneneration (RAG), la classificazione, la sintesi, l’estrazione di entità e l’uso di strumenti. Questi modelli compatti e versatili sono progettati per essere messi a punto con i dati aziendali e integrati senza problemi in diversi ambienti aziendali o flussi di lavoro.

Mentre molti modelli linguistici di grandi dimensioni (LLM) vengono addestrati su dati disponibili pubblicamente, la maggior parte dei dati aziendali non viene sfruttata, sottolinea IBM. Combinando un modello Granite di piccole dimensioni con i dati aziendali, in particolare utilizzando la rivoluzionaria tecnica di allineamento InstructLab – introdotta da IBM e RedHat a maggio – IBM ritiene che le aziende possano ottenere prestazioni specifiche per le attività in grado di competere con i modelli più grandi a una frazione del costo (sulla base di una gamma osservata di costi inferiori di 3-23 volte rispetto ai modelli di frontiera di grandi dimensioni in diversi primi proof-of-concept).

Il rilascio di Granite 3.0 – sottolinea l’azienda – riafferma l’impegno di IBM a creare trasparenza, sicurezza e fiducia nei prodotti di intelligenza artificiale. La relazione tecnica e la guida all’uso responsabile di Granite 3.0 forniscono una descrizione dei set di dati utilizzati per addestrare questi modelli, i dettagli delle fasi di filtraggio, pulizia e curatela applicate e i risultati completi delle prestazioni dei modelli nei principali benchmark accademici e aziendali.

In particolare, IBM fornisce una garanzia di proprietà intellettuale per tutti i modelli Granite su watsonx.ai, in modo che i clienti enterprise possano essere più sicuri nel combinare i propri dati con i modelli.

IBM afferma che i modelli linguistici Granite 3.0 hanno ottenuto risultati promettenti anche per quanto riguarda le prestazioni grezze. Sui benchmark accademici standard definiti dalla OpenLLM Leaderboard di Hugging Face, le prestazioni complessive del modello Granite 3.0 8B Instruct sono in media superiori a quelle dei modelli open source di dimensioni simili di Meta e Mistral. Nel benchmark di sicurezza AttaQ di IBM, il modello Granite 3.0 8B Instruct è in testa a tutte le dimensioni di sicurezza misurate rispetto ai modelli di Meta e Mistral. Per quanto riguarda i compiti aziendali fondamentali di RAG, l’uso di strumenti e i compiti nel dominio della sicurezza informatica, il modello Granite 3.0 8B Instruct mostra in media prestazioni leader rispetto ai modelli open source di dimensioni simili di Mistral e Meta, sottolinea IBM.

I modelli Granite 3.0 sono stati addestrati su oltre 12 trilioni di token di dati provenienti da 12 diversi linguaggi naturali e 116 diversi linguaggi di programmazione, utilizzando un nuovo metodo di addestramento in due fasi, sfruttando i risultati di diverse migliaia di esperimenti progettati per ottimizzare la qualità dei dati, la selezione dei dati e i parametri di addestramento. Entro la fine dell’anno, annuncia inoltre IBM, i modelli linguistici 3.0 8B e 2B dovrebbero includere il supporto per una finestra di contesto estesa a 128K e capacità di comprensione multimodale dei documenti.

Dimostrando un eccellente equilibrio tra prestazioni e costi di inferenza, IBM offre i modelli Granite Mixture of Experts (MoE) Architecture, Granite 3.0 1B-A400M e Granite 3.0 3B-A800M, come modelli più piccoli e leggeri che possono essere utilizzati per applicazioni a bassa latenza e per implementazioni basate su CPU.

IBM ha annunciato anche una versione aggiornata dei modelli preaddestrati Granite Time Series, le cui prime versioni sono state rilasciate all’inizio di quest’anno. Questi nuovi modelli sono addestrati su un numero di dati 3 volte superiore e offrono prestazioni elevate su tutti e tre i principali benchmark di serie temporali, superando modelli 10 volte più grandi di Google, Alibaba e altri, afferma l’azienda. I modelli aggiornati offrono anche una maggiore flessibilità di modellazione con il supporto di variabili esterne e rolling forecast.

Nell’ambito di questa release, IBM introduce anche una nuova famiglia di modelli Granite Guardian che consentono agli sviluppatori di applicazioni di implementare guardrail di sicurezza controllando le richieste dell’utente e le risposte LLM per una serie di rischi. I modelli Granite Guardian 3.0 8B e 2B offrono la serie più completa di funzionalità di rilevamento dei rischi e dei danni oggi disponibile sul mercato, sostiene IBM.

Oltre a dimensioni di danno come pregiudizio sociale, odio, tossicità, blasfemia, violenza, jailbreaking e altro ancora, questi modelli forniscono anche una serie di controlli unici specifici per i RAG, come la fondatezza, la rilevanza del contesto e la rilevanza delle risposte. Nei test approfonditi su 19 benchmark di sicurezza e RAG, il modello Granite Guardian 3.0 8B ha ottenuto un’accuratezza complessiva nel rilevamento dei danni superiore in media a tutte e tre le generazioni di modelli Llama Guard di Meta, afferma IBM.

Inoltre, ha mostrato prestazioni complessive pari a quelle dei modelli specializzati nel rilevamento delle allucinazioni WeCheck e MiniCheck. Sebbene i modelli Granite Guardian siano derivati dai corrispondenti modelli linguistici Granite, possono essere utilizzati per implementare guardrail insieme a qualsiasi modello di intelligenza artificiale aperto o proprietario.

L’intera suite di modelli Granite 3.0 e i modelli aggiornati delle serie temporali sono disponibili per il download su HuggingFace sotto la licenza permissiva Apache 2.0. Le varianti instruct dei nuovi modelli linguistici Granite 3.0 8B e 2B e i modelli Granite Guardian 3.0 8B e 2B sono disponibili da oggi per uso commerciale sulla piattaforma IBM watsonx. Una selezione dei modelli Granite 3.0 sarà disponibile anche come microservizi NVIDIA NIM e attraverso le integrazioni Vertex AI Model Garden di Google Cloud con HuggingFace. Per aiutare a fornire agli sviluppatori una scelta e una facilità d’uso e per supportare le implementazioni locali, una serie curata di modelli Granite 3.0 è disponibile anche su Ollama e Replicate.

L’ultima generazione di modelli Granite amplia il solido catalogo open-source di potenti LLM di IBM. IBM ha collaborato con partner dell’ecosistema come AWS, Docker, Domo, Qualcomm Technologies, Inc. attraverso il suo Qualcomm AI Hub, Salesforce, SAP e altri per integrare una serie di modelli Granite nelle offerte di questi partner o per rendere i modelli Granite disponibili sulle loro piattaforme, offrendo una maggiore scelta alle aziende di tutto il mondo.

Oggi IBM ha anche annunciato l’imminente rilascio della prossima generazione di watsonx Code Assistant, alimentato dai modelli di codice Granite, per offrire un’assistenza generica al coding in linguaggi come C, C++, Go, Java e Python, con funzionalità avanzate di modernizzazione delle applicazioni per le Enterprise Java Applications. Le funzionalità di codice di Granite sono ora accessibili anche attraverso un’estensione di Visual Studio Code, IBM Granite.Code. IBM prevede inoltre di rilasciare nuovi strumenti per aiutare gli sviluppatori a costruire, personalizzare e distribuire l’IA in modo più efficiente tramite watsonx.ai – tra cui framework per agenti, integrazioni con ambienti esistenti e automazioni low-code per casi d’uso comuni come RAG e agenti.

IBM è concentrata sullo sviluppo di tecnologie di agenti di IA in grado di garantire una maggiore autonomia, un ragionamento sofisticato e la risoluzione di problemi in più fasi. La versione iniziale del modello Granite 3.0 8B è dotata di supporto per le principali capacità degli agenti, come il ragionamento avanzato e un modello di chat altamente strutturato e uno stile di prompting per l’implementazione di flussi di lavoro per l’utilizzo di strumenti. IBM prevede inoltre di introdurre una nuova funzionalità di chat con agenti AI in IBM watsonx Orchestrate, che utilizza le funzionalità degli agenti per orchestrare assistenti AI, competenze e automazioni che aiutano gli utenti ad aumentare la produttività dei loro team. IBM prevede di continuare a costruire funzionalità di agenti in tutto il suo portafoglio nel 2025, compresi agenti precostituiti per domini e casi d’uso specifici.

IBM ha infine annunciato anche un’importante espansione della sua piattaforma di delivery alimentata dall’intelligenza artificiale, IBM Consulting Advantage. La piattaforma multi-modello contiene agenti di intelligenza artificiale, applicazioni e metodi come framework ripetibili in grado di consentire a 160.000 consulenti IBM di fornire ai clienti un valore migliore e più rapido a un costo inferiore. Come parte dell’espansione, i modelli linguistici di Granite 3.0 diventeranno il modello predefinito in Consulting Advantage.

Sfruttando le prestazioni e l’efficienza di Granite, IBM Consulting sarà in grado di contribuire a massimizzare il ritorno sull’investimento per i progetti di IA generativa dei clienti IBM. Un’altra parte fondamentale dell’espansione è l’introduzione di IBM Consulting Advantage for Cloud Transformation and Management e IBM Consulting Advantage for Business Operations. Ciascuna di esse comprende agenti, applicazioni e metodi di IA specifici per il settore, integrati con le best practice di IBM, in modo che i consulenti IBM possano contribuire ad accelerare le trasformazioni del cloud e dell’IA dei clienti in attività come la modernizzazione del codice e l’ingegneria della qualità, oppure a trasformare ed eseguire le operazioni in settori come la finanza, le risorse umane e gli approvvigionamenti.

Per saperne di più su Granite e sulla strategia IBM AI for Business, è possibile visitare il sito visitare il sito di IBM.

IBM Granite 3.0: nuovi modelli AI ad alte prestazioni per le aziende

LASCIA UN COMMENTO Cancella la risposta

alla

NEWSLETTER

IBM Granite 3.0: nuovi modelli AI ad alte prestazioni per le aziende

LASCIA UN COMMENTO Cancella la risposta

Articoli correlati

Il futuro della Customer Experience è abilitato dall’AI, con Avaya

Mira Murati, ex CTO di OpenAI, starebbe raccogliendo fondi per una nuova startup AI

Red Hat Enterprise Linux AI sui server Lenovo ThinkSystem, per l’innovazione dell’AI generativa

alla

NEWSLETTER