Amazon Web Services (AWS) ha annunciato la disponibilità generale del modello Amazon Titan Image Generator v2 con nuove funzionalità in Amazon Bedrock, il servizio completamente gestito che offre una scelta di modelli di fondazione (FM) ad alte prestazioni di Amazon e di altre aziende leader nel settore dell’AI.
Con Amazon Titan Image Generator v2 – sottolinea AWS –, è possibile guidare la creazione di immagini utilizzando immagini di riferimento, modificare le immagini esistenti, rimuovere gli sfondi, generare variazioni di immagini e personalizzare in modo sicuro il modello per mantenere lo stile del brand e la coerenza dei soggetti. Questo potente strumento semplifica i flussi di lavoro, aumenta la produttività e dà vita a visioni creative.
AWS spiega che Amazon Titan Image Generator v2 offre una serie di nuove funzionalità oltre a tutte quelle di Amazon Titan Image Generator v1, tra cui in primo luogo la funzione di Image conditioning: è possibile fornire un’immagine di riferimento insieme a un prompt di testo, ottenendo risultati che seguono il layout e la struttura del riferimento forniti dall’utente.
Per il condizionamento delle immagini, AWS supporta due tipi di algoritmi Canny edge e segmentazione.
L’algoritmo Canny edge viene utilizzato per estrarre i bordi più evidenti all’interno dell’immagine di riferimento, creando una mappa che Amazon Titan Image Generator può utilizzare per guidare il processo di generazione. È possibile “disegnare” le fondamenta dell’immagine desiderata e il modello completerà i dettagli, le texture e l’estetica finale in base alle indicazioni fornite.
La segmentazione offre un livello di controllo ancora più granulare, spiega AWS. Fornendo l’immagine di riferimento, è possibile definire aree o oggetti specifici all’interno dell’immagine e istruire Amazon Titan Image Generator a generare contenuti in linea con le aree definite. È possibile controllare con precisione il posizionamento e il rendering di personaggi, oggetti e altri elementi chiave.
Il nuovo modello abilita il controllo preciso della palette di colori delle immagini generate fornendo un elenco di codici esadecimali insieme al prompt di testo. Si tratta di una opzione molto utile per le aziende: consente di fornire al modello un elenco di colori esadecimali come parte degli input, che aderiscono alle linee guida sul brand dei colori.
È anche possibile fornire un’immagine di riferimento come input (opzionale) per generare un’immagine con i colori esadecimali forniti, ereditando lo stile dall’immagine di riferimento.
Il modello di nuova generazione consente poi di rimuovere automaticamente lo sfondo dalle immagini contenenti più oggetti.
La possibilità di rimuovere lo sfondo in modo pulito e preciso è uno strumento essenziale nel flusso di lavoro creativo, sottolinea AWS. È possibile rimuovere istantaneamente lo sfondo dalle immagini con un solo passaggio. Amazon Titan Image Generator v2 è in grado di rilevare e segmentare in modo intelligente più oggetti in primo piano, assicurando che anche scene complesse con elementi sovrapposti vengano isolate in modo pulito.
Inoltre, per ottenere la coerenza con il soggetto, la nuova versione consente di mettere a punto il modello in modo da preservare un soggetto specifico nelle immagini generate.
Con il fine-tuning, è ora possibile incorporare senza problemi soggetti specifici in scene visivamente accattivanti. Che si tratti di un prodotto di marca, di un logo aziendale o di un animale domestico, è possibile perfezionare il modello Amazon Titan utilizzando immagini di riferimento in modo che impari le caratteristiche uniche del soggetto scelto.
Una volta perfezionato il modello, è sufficiente fornire un prompt di testo e Amazon Titan Generator genererà immagini che mantengono una rappresentazione coerente del soggetto, inserendolo naturalmente in contesti diversi e fantasiosi. Questo apre un mondo di possibilità per il marketing, la pubblicità e il visual storytelling.