Danilo Poccia, globetrotter evangelist di AWS, è planato a Milano con un carico di novità di Intelligenza artificiale che fanno capire quanto Amazon sia avanti sul tragitto dell’automatizzazione e come non possa (e non voglia) tornare indietro.
AWS, val la pena ricordarlo, ha più di un milione di clienti attivi nel mondo, e con cliente attivo si intende chi lo è stato nell’ultimo mese. Un esercito, quindi, di potenziali utilizzatori di quello che i cosiddetti two pizzas team, i piccoli gruppi di sviluppo (in media sette persone, tante quante ci vogliono per mangiare due pizze americane) rilasciano quotidianamente.
Nel 2016 AWS ha rilasciato 1.017 servizi, tre al giorno. Utili? Di più: al 90% sono tutti basati sui feedback degli utenti.
Intelligenza artificiale e deep learning
Amazon AI è la nuova iniziativa con cui Amazon vuole portare l’intelligenza artificiale agli sviluppatori. Al momento si basa su tre servizi.
Amazon Rekognition è un servizio per le immagini, fa deep learning con reti neurali. Da una foto capisce cosa c’è in termini di oggetti, analizza le facce, le confronta con un catalogo.
Il servizio è basato su Api: DetectLabels per gli oggetti: capisce il contenuto di una fotografia e lo cataloga per consentire descrizioni e ricerche. DetectFaces per i volti, un’interfaccia che lavora anche sulle emozioni, utilizzabile per analisi demografiche e di sentiment.
CompareFaces serve per confrontare volti e lavora in collegamento con IndexFaces per creare un catalogo di volti e con SearchFacebyImage per la ricerca dal catalogo.
Il servizio è in general availability in cloud. Può essere usato in modo batch o in real time: in questo secondo caso, si spedisce una foto e arriva un Json in meno di un secondo.
Dal testo alla voce
Amazon Polly è un servizio di Text to speech sviluppato in gran parte in Polonia, potenziato dal deep learning, che utilizza la voce di Alexa. Lo si può già sperimentare: è in general availability e per il primo anno il livello free include un milione di caratteri al mese.
Il servizio produce un mp3, replicabile quanto si vuole, veloce e gestito.
Supporta 24 lingue, incluso l’italiano, con anche le inflessioni e le voci infantili: 47 modalità in totale.
Per usarlo si inserisce il testo, si definiscono gli eventuali caratteri ambigui (il simbolo percentuale, per esempio) come parole, si applica la prosodia e si ottiene in tempo reale l’mp3.
Lo usano già realtà come Duolingo, GoAnimate, o il Royal National Institute Blind People inglese per la produzione di audiodocumenti.
Con un plugin per Polly si può trasformare un blog in un podcast: in pratica si trasforma un giornale in una radio.
Si possono usare i tag se serve fare lo spelling.
Bot di riconoscimento vocale
Amazon Lex è un servizio che unisce Natural language understanding e Automatic speech recognition, ossia riconosce il parlato in linguaggio naturale e crea delle interfacce conversazionali.
Serve, in pratica, a creare bot: dalla necessità (intent) alle espressioni (utterance) per invocarlo, la valutazione di tutte le variabili (slot) e infine il completamento dell’azione (fullfilment).
In pratica tramite il proprio smartphone si può dire a un bot ”Prenota un albergo a New York” e ottenere quel che si vuole, utilizzando solamente la voce.
Primi clienti del servizio, che è in preview e al momento supporta solamente inglese e americano, sono Capital One e HubSpot, che lo sperimenta per creare campagne marketing via voce.
[…] occasione dell’AWS re: Invent 2016 l’azienda aveva annunciato Amazon Polly, un servizio gestito di text to speech che mira a trasformare il testo in un parlato realistico. Il servizio è stato progettato per […]
[…] occasione dell’AWS re: Invent 2016 l’azienda aveva annunciato Amazon Polly, un servizio gestito di text to speech che mira a trasformare il testo in un parlato realistico. Il servizio è stato progettato per […]