Adobe ha annunciato l’ampliamento della sua partnership di lunga data con NVIDIA per esplorare nuovi modi in cui le aziende possono sfruttare la business intelligence contenuta negli oltre 3 trilioni di documenti in formato PDF.
Insieme, le due aziende stanno lavorando per combinare la potenza dei servizi PDF di Adobe con le tecnologie di NVIDIA per far progredire le possibilità offerte dai modelli linguistici di grandi dimensioni (LLM) e dai PDF su tre fronti: attingere alla tecnologia e all’esperienza di Adobe nel campo dei PDF per supportare NVIDIA nell’addestramento e nella messa a punto degli LLM di nuova generazione; aiutare le aziende ad applicare l’intelligenza artificiale generativa ai dati archiviati nei PDF utilizzando i microservizi NVIDIA NIM e NVIDIA NeMo e i servizi Adobe PDF; e sviluppare dataset aperti per promuovere la ricerca e lo sviluppo degli LLM.
La recente introduzione di AI Assistant in Acrobat da parte di Adobe ha sfruttato l’intelligenza dei PDF per accelerare la produttività individuale e ora la società americana sta cercando di estendere questo valore alle aziende. L’innovazione di NVIDIA con gli LLM e la retrieval augmented generation (RAG), combinata con le tecnologie di estrazione dei PDF di Adobe, rappresenta un passo avanti verso una nuova era di intelligenza dei documenti.
“I documenti PDF conservano volumi immensi di informazioni preziose che possono essere utilizzate per personalizzare l’intelligence delle applicazioni di intelligenza artificiale generativa di ogni azienda“, ha dichiarato Manuvir Das, vicepresidente di Enterprise Computing di NVIDIA. “Questo nuovo capitolo della partnership fra NVIDIA e Adobe aiuterà le imprese a sfruttare il valore dei loro dati PDF utilizzando i microservizi NVIDIA per rendere i loro agenti e copiloti di intelligenza artificiale generativa dei potenti strumenti di produttività“.
Adobe e NVIDIA stanno collaborando per addestrare i nuovi LLM di NVIDIA. Abbinando i servizi di NVIDIA AI foundry al software NVIDIA AI Enterprise e sfruttando i servizi di Adobe PDF Extract, le due aziende stanno costruendo dataset per addestrare e mettere a punto i modelli foundation NVIDIA AI di nuova generazione, compresi gli LLM NVIDIA Nemotron. Questi modelli e gli LLM open-source e commerciali vengono eseguiti sui microservizi di inferenza NVIDIA NIM della suite software NVIDIA AI Enterprise.
I documenti PDF contengono alcune delle informazioni più preziose al mondo, sottolinea Adobe. Tuttavia, la trasformazione dei dati in intelligenza utilizzabile è solitamente difficile o impossibile perché i dati non sono strutturati. Adobe, quale inventore e innovatore dei PDF, è l’autorità in materia di struttura e contenuto dei PDF. I servizi PDF Extract dell’azienda offrono un’estrazione dei dati estremamente accurata su vari tipi di documenti, PDF nativi e scansionati, senza alcuna personalizzazione o impostazione. Questa tecnologia sfrutta gli stessi modelli di intelligenza artificiale e di apprendimento automatico alla base di Acrobat Liquid Mode per trasformare i dati non strutturati dei PDF in dati ricchi e strutturati per un’analisi efficiente.
Le due società hi-tech stanno anche studiando nuovi modi per scalare le capacità di IA generativa ad alte prestazioni per le imprese globali. Le capacità di retrieval augmented generation (RAG) possono aumentare l’utilità degli LLM per le imprese, combinando le risposte generate con dati proprietari e basi di conoscenza esterne per fornire risposte più aggiornate e affidabili.
Le due aziende stanno valutando la possibilità di combinare i servizi PDF di Adobe per estrarre le informazioni proprietarie dai PDF delle organizzazioni in basi di conoscenza specializzate con gli LLM NVIDIA pre-addestrati, consentendo alle aziende di “parlare” con i propri dati utilizzando il linguaggio naturale. Stanno anche studiando come aiutare le aziende a usare i prodotti e i servizi di Adobe Document Cloud con l’inferenza NVIDIA NIM e i microservizi NVIDIA NeMo Retriever per consentire l’uso sincrono dei PDF nelle applicazioni di produzione.
Inoltre, stanno valutando la possibilità di utilizzare il computing accelerato di NVIDIA e il software di AI enterprise, come NVIDIA NIM, con i prodotti Adobe AI-enabled, tra cui Adobe Firefly, per accelerare il time-to-market e fornire esperienze interattive ad alte prestazioni ai clienti.
Adobe e NVIDIA stanno inoltre apportando la loro esperienza collettiva per accelerare la ricerca sugli LLM e sul ruolo dei documenti digitali. Stanno collaborando a un set di dati curato congiuntamente per migliorare la ricerca e lo sviluppo di LLM che utilizzano i PDF come dati di pre-training. Insieme, le due aziende vogliono consentire una ricerca aperta sulle tecniche di post-elaborazione per rendere i dati PDF massimamente utili per l’addestramento di LLM e di modelli molto grandi (VLM, very large model). Adobe e NVIDIA hanno in programma di pubblicare i risultati, le metodologie e l’impatto di questo set di dati e di renderlo disponibile per scopi di ricerca, assicurando un facile accesso e una distribuzione diffusa tra i ricercatori, gli sviluppatori e gli appassionati nel campo dell’intelligenza artificiale e dell’apprendimento automatico.