Nel suo blog ufficiale, AMD ha illustrato il processo di esecuzione dei modelli DeepSeek R1 Distilled Reasoning su AMD Ryzen AI e le GPU Radeon.
I modelli di reasoning – sottolinea l’azienda – rappresentano una categoria emergente di LLM (large language model) appositamente sviluppati per svolgere task di elevata complessità attraverso l’impiego del metodo “chain-of-thought” (CoT).
DeepSeek R1, un modello di “reasoning” all’avanguardia, è stato recentemente reso disponibile in versioni più compatte ma altamente efficienti. L’integrazione di DeepSeek R1 con i processori AMD Ryzen AI e le GPU Radeon risulta estremamente agevole ed è ora disponibile tramite LM Studio.
I modelli di reasoning aggiungono una fase di “riflessione” prima dell’output finale, che si può vedere espandendo la finestra di “riflessione” prima che il modello fornisca la risposta finale. A differenza degli LLM convenzionali, che danno una risposta in un colpo solo, gli LLM CoT eseguono un ragionamento approfondito prima di rispondere.
Le ipotesi e l’auto-riflessione che il large language model esegue sono mostrati all’utente e questo migliora la capacità di ragionamento e di analisi del modello, anche se al costo di un time-to-first-token – cioè il tempo richiesto per ottenere il primo output finale – significativamente più lungo.
Un modello di ragionamento può utilizzare migliaia di token (e l’utente può vedere questa catena di pensieri, la chain of thought) per analizzare il problema prima di dare una risposta finale. Questo permette al modello di eccellere in compiti complessi di risoluzione di problemi matematici e scientifici e di affrontare un problema complesso da tutte le angolazioni prima di decidere una risposta.
A seconda dell’hardware AMD, sottolinea l’azienda, ciascuno di questi modelli offrirà capacità di ragionamento all’avanguardia sul processore AMD Ryzen AI o sulle schede grafiche Radeon.
Nel suo blog post, AMD spiega in modo dettagliato, anche con un video, i semplici passaggi che gli utenti possono seguire per essere operativi con DeepSeek R1 Distill in pochi minuti (a seconda della velocità di download).