Nell’utilizzo di Google Maps come navigatore una delle sfide è, come sottolinea lo stesso team di sviluppo del software, l’orientamento. Capire cioè la direzione in cui andare. L’app ci dice la direzione sotto forma di coordinate, che non sono sempre intuitive e immediate da calare nel contesto.
Inoltre, evidenzia il team di Google Maps, strumenti quali GPS e bussola presentano alcuni limiti, specialmente negli ambienti urbani. Per migliorare la navigazione il team sta dunque sperimentando un nuovo metodo, che ha denominato global localization.
Questa global localization combina Visual Positioning Service (VPS), Street View e machine learning per identificare con maggiore precisione posizione e orientamento. Questa tecnologia potrebbe offrire un modo più intuitivo per indicare alle persone in quale direzione andare. Il tutto, con l’ausilio della fotocamera dello smartphone.
Il futuro di Google Maps
L’esempio, efficace, che fa Google è quando usciamo dalla metropolitana e l’app ci dice di dirigerci verso una determinata strada. Oppure di dirigerci verso nord. Il problema è che, se non conosciamo la zona, non sappiamo subito quale sia la strada giusta. E potremmo anche non comprendere in modo immediato in che direzione è, ad esempio, il nord. Spesso, l’unica soluzione è iniziare a spostarci sperando che il segnaposto blu sulla mappa ci confermi che stiamo andando nella direzione giusta.
Non è certo il massimo. Ci deve essere un modo migliore in cui la tecnologia possa aiutarci in situazioni del genere. Devono aver pensato questo, gli ingegneri di Google Maps.
Per effettuare la localizzazione sulla mappa di un device, cioè la posizione e l’orientamento, si usano varie tecniche. In scenari urbani densi di edifici la maggior parte di queste tecniche presenta dei limiti. Alcuni di questi limiti sono insiti nelle tecnologie stesse. E quindi la localizzazione può risultare meno accurata di quanto servirebbe.
La global localization utilizza una combinazione di tecniche che consentono alla fotocamera del dispositivo mobile di orientarsi come faremmo noi. Cioè guardandoci in giro e confrontando quello che stiamo vedendo con quello che ci aspettiamo di vedere.
Il Visual Positioning Service determina la posizione di un dispositivo in base alle immagini piuttosto che ai segnali GPS. Il VPS crea innanzitutto una mappa da una serie di immagini che hanno una posizione nota. E analizzandole per le principali caratteristiche visive, come la struttura di edifici o altri elementi architettonici. Ciò, allo scopo di creare un indice ricercabile su larga scala e velocemente, di quelle caratteristiche visive.
Una raccolta globale di riferimenti visivi
Per localizzare il device, la tecnologia confronta le caratteristiche delle immagini provenienti dallo smartphone con quelle dell’indice VPS. Tuttavia, l’accuratezza della localizzazione tramite VPS è fortemente influenzata dalla qualità delle immagini. Ed è qui che entra in gioco Street View.
Nell’arco degli anni, Street View ha continuato a espandere la sua ”copertura del mondo”. Quindi il team di Google Maps, per offrire la global localization, ha collegato VPS con i dati di Street View. Sfruttando, in questo modo, informazioni raccolte e testate, provenienti da oltre 93 Paesi in tutto il mondo.
Questo ricco dataset fornisce migliaia di miliardi di punti di riferimento affidabili, per poter applicare la triangolazione. Ciò aiuta a determinare con maggiore precisione la posizione di un dispositivo e a guidare le persone verso la loro destinazione.
Come spesso accade, benché questo approccio funzioni bene in teoria, farlo funzionare bene nella pratica rappresenta una sfida, ammette il team di Google. Il problema è che le immagini dello smartphone al momento della localizzazione potrebbero differire da come appariva la scena acquisita da Street View, magari mesi prima.
Per ottenere una corrispondenza soddisfacente è necessario filtrare le parti temporanee della scena e focalizzarsi sulla struttura permanente, che non cambia nel tempo. Ed è qui che entra in scena il terzo ingrediente chiave di questo nuovo approccio: il machine learning.
Machine learning e realtà aumentata
L’apprendimento automatico viene impiegato per decidere automaticamente a quali caratteristiche strutturali prestare attenzione, e quali, verosimilmente transitorie, ignorare. Ma questo è solo uno dei numerosi modi in cui il team utilizza il machine learning per migliorare la precisione.
Una delle funzionalità che il team sta testando è la possibilità di utilizzare ARCore. Questa è la piattaforma di Google per la creazione di esperienze di realtà aumentata. Lo scopo è di sovrapporre le indicazioni direttamente su Google Maps quando si è in modalità di navigazione a piedi. Attivando questa funzione, basta una rapida occhiata al telefono per visualizzare esattamente in quale direzione andare.
I primi risultati siano promettenti, afferma il team di Google Maps, ma c’è ancora molto lavoro da fare. Ad esempio, una sfida importante è far funzionare questa tecnologia in tutte le condizioni ambientali. Il team sta iniziando a testare questa funzione con alcune Local Guide selezionate, per raccoglierne il feedback e proseguire nello sviluppo.
Sembra quindi ancora lontana la disponibilità generale di questo nuovo metodo, che però di sicuro è di grande interesse.