Microsoft “Così useremo i dati domani”

L’obiettivo è di far accedere qualsiasi utente a Petabyte di dati multiformi. Per farlo, la casa di Redmond si è mossa da tempo, ma il lavoro richiede molto studio. Secondo il “guru” Jim Gray, i tool di oggi non sono sufficienti e va trovato un nuovo modo per accedere alle informazioni.

Come purtroppo accade per molti vocaboli di moda, il termine "guru" viene ormai sovente utilizzato a sproposito, cioè per indicare chiunque abbia conoscenze (nella fattispecie, informatiche) solo un minimo al di sopra della norma. Nel caso di Jim Gray questa inflazionata definizione sembra però essere effettivamente la più adatta a inquadrare il personaggio: indubbiamente per il bagaglio di conoscenze e di attività che il termine "guru" sottintende, ma anche e soprattutto per la dimensione, se vogliamo, spirituale associata, almeno originariamente, al termine.


Intervistato a Roma, dove si trovava per intervenire a un convegno dal titolo significativo, "Very Large Database", Gray ha dispensato, per conto di Microsoft, interessanti opinioni sul futuro dei database, e, più in generale, sulle nuove tendenze dell’informatica.

La parola al guru


Gray è ricercatore senior e direttore di uno dei laboratori Microsoft più attivi nel campo della ricerca pura, il Barc (Bay Area Research Center), con sede a San Francisco: un laboratorio di sole cinque persone, che si occupa di progetti la cui potenziale ricaduta commerciale è indubbia, ma che principalmente esplorano le possibili nuove frontiere dell’It, con un occhio di riguardo anche all’impatto sociale. Al momento, per esempio, il Barc segue due progetti sui server scalabili e sulla telepresenza, ma nel recentissimo passato si è occupato dei database di grandi dimensioni: Gray e il suo team, per esempio, hanno realizzato TerraServer, il più grande database mondiale pubblico. Al progetto hanno collaborato diversi partner, aziende private, ma anche il governo russo e quello americano: il database contiene più di un Terabyte di immagini compresse della terra, proveniente da satelliti e da riprese aeree, ed è consultabile via Internet (http://terraserver.microsoft.com) tramite un’interfaccia semplice, efficace e anche gradevole, come testimoniano gli oltre 2 miliardi di visitatori dal 1998 a oggi.


Buona parte dell’incontro con Gray ha riguardato proprio questi due temi, la gestione di basi dati di dimensioni (quasi) incalcolabili e l’accessibilità di tali informazioni da parte dell’utente finale. Le opinioni espresse in merito sono interessanti, anche e soprattutto perché comunque calate nella realtà operativa: Gray, infatti, non è per nulla avulso dalle conseguenze pratiche della ricerca, e ha contribuito, solo per citare una delle sue attività recenti, in modo più che significativo allo sviluppo di Sql Server.


Secondo Gray, i database della nuova generazione sono e saranno sempre più destinati a contenere immense quantità di dati, e per gestirle non si potranno applicare pedissequamente i paradigmi validi fino ad oggi. Per esempio, i tool di gestione attualmente in uso si rivelano inadatti a database nell’ordine dei Terabyte, ora, e dei Petabyte, fra poco: durante i test effettuati in laboratorio, anche l’operazione più classica che viene effettuata per assicurare l’affidabilità dei database, cioè il backup, si è rivelata del tutto inutile. A prescindere dal notevole tempo necessario, talmente elevato da essere praticamente non gestibile per una realtà commerciale, una volta portato a termine un backup completo di un database del genere si è infatti dimostrato inadeguato, perché risultava impossibile utilizzarlo per il restore dei dati.


Oltre all’esperienza concreta, ancora più interessanti sono le conclusioni che Gray trae da tutto ciò: non è necessario, come potrebbe sembrare logico a prima vista, progettare tool più avanzati, bisogna invece pensare a un nuovo modo per organizzare i dati. Per esempio, replicando le stesse informazioni in più database paralleli, che non siano però la semplice copia uno dell’altro, ma che contengano le stesse informazioni organizzate secondo chiavi


diverse: in questo modo è comunque possibile ricostruire i database a fronte di una perdita di dati, e contemporaneamente si ottiene il vantaggio di poter ricercare in modo differente le stesse informazioni. Nella visione di Gray, infatti, i database stand alone, soprattutto quelli di grandi dimensioni, non hanno più senso di esistere, ma diventano federazioni di informazioni distribuite, ovviamente collegate fra loro tramite Internet, un requisito dato per scontato. Uno dei progetti di cui Gray si sta occupando attualmente, non a caso, è quello dell’osservatorio astronomico virtuale, un’iniziativa che mira a condividere le enormi quantità di dati raccolte dagli astronomi nei vari osservatori nazionali. La "federazione" di tutti questi dati, fino ad ora presenti separatamente nelle varie sedi e consultabili solo tramite le pubblicazioni scientifiche cartacee, dovrebbe consentire una rapida evoluzione della scienza astronomica. Anche perché alla vastità di informazioni si unisce una possibilità di reperimento delle informazioni estremamente rapida, non altrimenti possibile con strumenti classici. Un altro requisito indispensabile dei database prossimi venturi è infatti il parallelismo: non è pensabile che query sempre più complesse siano soddisfatte in maniera diversa.

Un parallelismo diverso


Gray contribuisce al progetto dell’Osservatorio Astromico Virtuale, sul quale si possono trovare ulteriori dettagli nel già citato sito dello studioso statunitense, dal punto di vista tecnico, applicando nella pratica concetti quali la memorizzazione solo su supporti online e non su nastri, il parallelismo delle elaborazioni e la distribuzione del database su più server fisici di potenza unitaria anche non elevatissima: per Gray una scalabilità di questo tipo è infatti più efficace rispetto al pur altrettanto valido schema che prevede l’aumento di potenza di un singolo elaboratore tramite l’aggiunta di più processori.


Tutti concetti, questi, peraltro non applicabili solo all’ambito puramente scientifico: molti gli studi di Gray hanno, infatti, già trovato applicazione in database governativi e di grandi aziende, che fungono da supporto ad applicazioni per la gestione della moneta virtuale (circuiti simili al Bancomat in Italia, tanto per intenderci), per le prenotazioni aeree online e per il commercio elettronico. L’altro "building block" del futuro dell’elaborazione delle informazioni è rappresentato dalla possibilità di accedere a servizi remoti tramite la Rete. Un argomento, ricorda Gray, tutt’altro che nuovo: negli ultimi anni sono stati proposti, e anche trovato successo, svariati modelli per svolgere operazioni del genere, come l’Rmi di Java, il Com/Dcom proposto da Microsoft e, ovviamente, Corba. Secondo Gray, però, attualmente stiamo vivendo il momento in cui tutto ciò troverà la definitiva affermazione su larga scala, tramite i Web service. Le ragioni sono da ricercare nel fatto che questa tecnologia, al contrario delle precedenti, è basata su uno standard aperto, l’Xml, che deriva dallo standard "di fatto" più diffuso nel mondo, l’Html, e che si basa su protocolli di rete adottati universalmente, il Tcp/Ip e l’Http. I meccanismi alla base dei Web service, come Soap, Uddi e Wsdl, troveranno quindi applicazioni pratiche con estrema facilità, anche perché consentono, in sostanza, a qualsiasi Web server di diventare un application server. Alla comune obiezione relativa alla sicurezza di meccanismi del genere, che preoccupa non poco molti esperti del settore, Gray fornisce un’interpretazione singolare, ma senza dubbio interessante: è suo parere che sicuramente operare dal punto di vista tecnologico per aumentare la sicurezza intrinseca dei Web service, ma reputa anche che il problema, per essere veramente risolto, debba essere affrontato da un punto di vista, diciamo così, sociale. Molte strutture non informatiche, afferma Gray, offrono un livello di sicurezza non elevatissimo, ma il loro tasso di violazione è tutto sommato piuttosto basso, perché la loro diffusione è molto elevata e perché esistono regole sociali esplicite e implicite che limitano gli abusi. L’esempio più semplice, e forse proprio per questo più significativo, è quello delle abitazioni individuali: non è molto difficile, per un malintenzionato, entrare in una casa privata, ma non per questo tutte le case private vengono sistematicamente violate, proprio per le ragioni citate in precedenza. Anche per l’informatica di massa in ottica Internet, quindi, si dovrà necessariamente arrivare a modelli sociali analoghi, che forniranno quindi un adeguato substrato di sicurezza.

Opinioni "Microsoft oriented"


Testimoniando poi ancora come Gray non sia solo uno studioso teorico ma anche un attento osservatore della realtà, egli acutamente sottolinea come, oltre alle ragioni tecnologiche, la miglior garanzia del più che probabile successo dei Web service è data anche dal fatto che su progetti del genere non solo sono attive, ma collaborano fra loro le più grandi aziende mondiali, Ibm e Microsoft in testa.


Che Gray sia, comunque, un testimonial Microsoft a tutti gli effetti si nota comunque anche dal fatto che, durante l’intervista, abbia esaltato le doti dei nuovi tool di sviluppo della casa statunitense, come Visual Studio .Net, che permetteranno un’elevata produttività nella creazione e nell’integrazione dei Web service. La visione "Microsoft oriented" si evince anche da qualche battuta sul dibattito che si svolge attorno al software: Gray si esprime infatti in modo molto esplicito contro i modelli come il Gpl e l’open source, definendoli addirittura "virus" nell’accezione più negativa del termine, e vede invece come unico schema vincente, per l’evoluzione dell’informatica, quello del software commerciale. Una presa di posizione così netta e coerente, in un momento in cui quasi tutti si riempiono la bocca, spesso senza averne titolo, con pareri diametralmente opposti, è senza dubbio da apprezzare, come del resto sono da tenere in elevata considerazione le sue opinioni. D’altronde, il valore delle idee di Gray sono certificate nei suoi titoli: membro di vari organismi scientifici statunitensi, quali il National Research Council’s Computer Science and Telecommunications Board, collabora con il Comitato Consultivo Presidenziale per l’It, e nel 1999 ha ricevuto dall’Association of Computer Machinery (Acm) il Turing Award, un riconoscimento considerato da molti il Premio Nobel per l’It.

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome