Anthropic ha annunciato che il suo ultimo modello, Claude 2.1, è ora disponibile tramite API nella Console e alimenta l’esperienza di chat dell’azienda, claude.ai.
Claude 2.1 – spiega Anthropic – offre progressi nelle funzionalità chiave per le aziende, tra cui una finestra di contesto di 200.000 token allo stato dell’arte, riduzioni significative dei tassi di allucinazione del modello, prompt di sistema e la nuova funzionalità beta: tool use. L’azienda sta anche aggiornando il pricing per migliorare l’efficienza dei costi per i clienti in tutti i modelli.
Sin dal lancio di quest’anno, Claude è stato utilizzato da milioni di persone per un’ampia gamma di applicazioni, dalla traduzione di documenti accademici alla stesura di bozze di business plan e all’analisi di contratti complessi. Nelle discussioni con i suoi utenti, sottolinea Anthropic, questi hanno chiesto finestre di contesto più ampie e risultati più accurati quando lavorano con documenti lunghi.
In risposta a queste richieste, Anthropic ora raddoppia la quantità di informazioni che è possibile trasmettere a Claude, con un limite di 200.000 token, che si traduce in circa 150.000 parole, ovvero oltre 500 pagine di materiale. Gli utenti della piattaforma possono ora caricare documentazione tecnica come intere codebase, documenti finanziari o persino lunghe opere letterarie come l’Iliade o l’Odissea. Grazie alla possibilità di conversare con grandi quantità di contenuti o dati, Claude può riassumere, eseguire Q&A, prevedere trend, confrontare e comparare più documenti e molto altro ancora.
L’elaborazione di un messaggio di 200K di lunghezza è un’impresa complessa e una novità nel settore, sottolinea Anthropic, che ha voluto mettere questa nuova e potente funzionalità a disposizione dei suoi utenti: le operazioni che di solito richiedono ore di lavoro umano per essere completate possono richiedere a Claude pochi minuti e l’azienda prevede che la latenza diminuirà sostanzialmente con il progredire della tecnologia.
Anthropic afferma inoltre che Claude 2.1 ha anche raggiunto significativi miglioramenti in termini di “onestà”, con una diminuzione di due volte delle dichiarazioni false rispetto al precedente modello Claude 2.0. Ciò consente alle aziende di creare applicazioni AI ad alte prestazioni che risolvono problemi aziendali concreti e di distribuire l’AI nelle loro operazioni con maggiore fiducia e affidabilità.
Anthropic ha condiviso di aver messo alla prova l’onestà di Claude 2.1 raccogliendo un’ampia serie di domande complesse e basate su fatti concreti, che mettono alla prova le debolezze note dei modelli attuali. Utilizzando una griglia che distingue le affermazioni errate (come ad esempio: “La quinta città più popolosa della Bolivia è Montero“) dalle ammissioni di incertezza (“Non sono sicuro di quale sia la quinta città più popolosa della Bolivia“), Claude 2.1 è stato significativamente più propenso a demordere piuttosto che a fornire informazioni errate.
Claude 2.1 ha anche apportato significativi miglioramenti nella comprensione e nella sintesi, in particolare per i documenti lunghi e complessi che richiedono un elevato grado di accuratezza, come documenti legali, relazioni finanziarie e specifiche tecniche. Nelle valutazioni interne di Anthropic, Claude 2.1 ha dimostrato una riduzione del 30% delle risposte errate e un tasso 3-4 volte inferiore di conclusioni errate che un documento supporta una particolare affermazione.
Pur essendo incoraggiata da questi progressi nell’accuratezza, il miglioramento della precisione e dell’affidabilità dei risultati per gli utenti rimane una priorità assoluta per i team di prodotto e di ricerca di Anthropic, sottolinea comunque l’azienda.
A grande richiesta, Anthropic ha anche aggiunto il tool use, una nuova funzione beta che consente a Claude di integrarsi con i processi, i prodotti e le API esistenti degli utenti. Questa maggiore interoperabilità mira a rendere Claude più utile nelle operazioni quotidiane degli utenti.
Claude è ora in grado di orchestrare funzioni o API definite dagli sviluppatori, di effettuare ricerche su fonti web e di recuperare informazioni da knowledge base private.
Gli utenti possono definire un insieme di strumenti da utilizzare per Claude e specificare una richiesta. Il modello deciderà quindi quale strumento è necessario per svolgere il compito ed eseguirà un’azione per conto dell’utente, come ad esempio:
- Utilizzo di una calcolatrice per ragionamenti numerici complessi.
- Tradurre le richieste in linguaggio naturale in chiamate API strutturate
- Rispondere a domande cercando nei database o utilizzando un’API di ricerca sul web
- Esecuzione di semplici azioni nel software tramite API private
- Connettersi a set di dati di prodotti per formulare raccomandazioni e aiutare gli utenti a completare gli acquisti.
Tool use è attualmente in fase di sviluppo iniziale: Anthropic sta creando funzionalità per gli sviluppatori e linee guida per facilitare l’integrazione nelle applicazioni. L’azienda inoltre incoraggia gli utenti a condividere il feedback sulla funzionalità per contribuire a modellare e migliorare il prodotto.
Anthropic ha poi lavorato per semplificare l’esperienza della Console per sviluppatori per gli utenti dell’API Claude, rendendo più facile testare nuovi prompt per un apprendimento più rapido. Il nuovo prodotto Workbench consente agli sviluppatori di iterare i prompt in un’esperienza in stile playground e di accedere a nuove impostazioni del modello per ottimizzare il comportamento di Claude. Possono creare più prompt e navigare tra di essi per progetti diversi, e le revisioni vengono salvate man mano per conservare il contesto storico. Gli sviluppatori possono anche generare snippet di codice per utilizzare i loro prompt direttamente in uno degli SDK di Anthropic.
Anthropic sta anche introducendo i system prompt, che consentono agli utenti di fornire istruzioni personalizzate a Claude per migliorare le prestazioni. I system prompt creano un contesto utile che migliora la capacità di Claude di assumere personalità e ruoli specifici o di strutturare le risposte in modo più personalizzabile e coerente con le esigenze degli utenti.
Claude 2.1 – ha annunciato Anthropic – è ora disponibile nella API dell’azienda e alimenta anche l’interfaccia chat su claude.ai sia per il livello gratuito che per quello Pro. L’uso della context window da 200K token è riservato agli utenti di Claude Pro, che ora possono caricare file molto più grandi.