Promuovere uno studio più accurato e preciso nell’ambito della tecnologia di riconoscimento facciale. Questo l’obiettivo di Ibm Research.
E per raggiungerlo propone il nuovo set di dati DiF, Diversity in Faces, un punto di partenza utile affinché la ricerca globale possa studiare e sviluppare una soluzione di intelligenza artificiale più corretta e mirata.
Oggi, alla base di tutti gli studi c’è infatti l’AI. Tuttavia, possono sorgere difficoltà nel realizzare i sistemi di riconoscimento facciale basati sull’AI che soddisfino le aspettative di accuratezza. In questo caso il cuore del problema non è la tecnologia AI in sé, ma come vengono addestrati i sistemi di riconoscimento facciale alimentati dall’IA.
Affinché tali sistemi funzionino come desiderato – e per ottenere risultati sempre più precisi – i dati di addestramento devono essere diversificati e offrire un’ampia copertura. Per esempio, i set di dati di addestramento devono essere sufficientemente grandi e diversificati da far sì che la tecnologia impari tutti i modi in cui i volti differiscono per riconoscere accuratamente tali differenze nelle più svariate situazioni. In altre parole, Le immagini devono riflettere la distribuzione delle caratteristiche dei volti che vediamo nel mondo.
Prima di tutto garantire la diversità
Ma come misurare e garantire la diversità tra i volti umani? Da un lato, conosciamo bene come i volti differiscono in funzione di età, sesso e tonalità della pelle, e come un medesimo volto possa modificarsi col variare di alcune di queste caratteristiche. Gran parte dell’attenzione riversata sulla tecnologia di riconoscimento facciale è stata rivolta a quanto bene si comporta all’interno di questi attributi.
Ma, come hanno dimostrato studi precedenti, questi attributi sono solo un tassello del mosaico e non del tutto adeguati a caratterizzare la piena diversità dei volti umani. Sono però importanti anche dimensioni come la simmetria del viso, il contrasto facciale, la posa del viso, la lunghezza o la larghezza dei tratti caratteristici (occhi, naso, fronte, naso, ecc.).
Ibm Research rilascia dunque un nuovo grande e diversificato set di dati chiamato Diversity in Faces (DiF) per far progredire lo studio dell’equità e della precisione nella tecnologia di riconoscimento facciale. Primo nel suo genere a disposizione della comunità di ricerca globale, DiF fornisce un set di dati relativo a 1 milione di immagini facciali umane.
Usando immagini disponibili pubblicamente dal set di dati Creative Commons YFCC-100M, Ibm ha annotato i volti usando 10 schemi di codifica ben consolidati e indipendenti dalla letteratura scientifica. Tali schemi includono principalmente misure oggettive dei volti umani, come le caratteristiche cranio-facciali (per esempio, lunghezza della testa, lunghezza del naso, altezza della fronte), così come annotazioni più soggettive, come le previsioni sull’età e sul sesso.
Ibm ritiene che, estraendo e rendendo disponibili queste annotazioni a partire da uno schema di 1 milione di immagini di volti, accelererà lo studio della diversità e la copertura dei dati per i sistemi di riconoscimento facciale dell’IA per garantire sistemi più equi e accurati. Il rilascio odierno è solo il primo passo verso il compimento del percorso.
Una base per la conoscenza collettiva
È opinione di Ibm che il set di dati DiF e i suoi 10 schemi di codifica offrano un punto di partenza per i ricercatori di tutto il mondo che studiano la tecnologia di riconoscimento facciale. I 10 metodi di codifica facciale includono, tra gli altri, le misure craniofacciali, i rapporti facciali (simmetria), gli attributi visivi (età, sesso), la posa e la risoluzione. Questi schemi sono tra i più forti identificati dalla letteratura scientifica e costituiscono una solida base per la conoscenza collettiva.
L’analisi iniziale, afferma Ibm, ha dimostrato che il set di dati DiF fornisce una distribuzione più equilibrata e una copertura più ampia delle immagini facciali rispetto ai set di dati precedenti. Inoltre, le intuizioni ottenute dall’analisi statistica dei 10 schemi iniziali di codifica sul set di dati DiF hanno favorito la comprensione di ciò che è importante per la caratterizzazione dei volti umani e ha permesso di continuare importanti ricerche sui modi per migliorare la tecnologia di riconoscimento facciale.
Il set di dati è oggi disponibile per la comunità di ricerca globale. E chiunque ne può fare richiesta. L’obiettivo di Ibm Research è aiutare la ricerca collettiva e contribuire a creare sistemi di IA più equi. L’azienda è infatti consapevole di non poter agire in autonomia e quindi, attraverso il rilascio odierno, invita gli altri a contribuire al crescente corpo di ricerca e a portare avanti questa importante indagine scientifica.