Close

Not a member yet? Register now and get started.

lock and key

Sign in to your account.

Account Login

Forgot your password?

Il peso dei linked data

12 Ago Posted by in Uncategorized | 1 comment

L’altro giorno Stefano Quintarelli ha messo in relazione i dati di spesa di questo Paese con i presunti sprechi della casta che la guida, raccomandando di fare “attenzione alle spese maggiori dove uno zero virgola briscola di variazione produce un effetto molto maggiore” e prendendo come esempio l’asta di fine 2010 per l’assegnazione delle frequenze TV.

Pur rispettandola, la sua opinione mi trova in parziale disaccordo.

Ogni Euro risparmiato da un parlamentare NON corrisponde a un Euro di un singolo cittadino.

In un periodo di morìa delle vacche (cit.) come quello attuale l’esempio deve partire da chi ci rappresenta e il rapporto diventa quindi di uno a 60 mila, tanti quanti sono i cittadini rappresentati da ogni singolo parlamentare. Ogni gesto proveniente dall’alto, da quello puramente simbolico a quello più concreto e drastico, genera profonde ripercussioni sul comportamento della cittadinanza, specie oggi che le reti cittadine possono contare anche sui social media per comunicare e generare contagio.

Nei casi dove esiste un forte e diffuso interesse da parte dei cittadini ciò può rapidamente arrivare a creare tsunami comunicativi e partecip-attivi, che spesso si traducono in proteste di piazza.

In sostanza, i dati di spesa generale non sono sovrapponibili con quelli dei costi parlamentari.

Da un lato abbiamo un dataset di open data, dall’altro abbiamo dei dati destrutturati e messi in rete da più parti. Per comprendere meglio il concetto possiamo fare riferimento ai Linked Data, tenendo presente che

a linked data structure is a data structure which consists of a set of data records (nodes) linked together and organized by references (links or pointers).

Invece nel nostro caso si tratterebbe di mettere in relazione dati di unità di misura differenti. Dove sta il fattore moltiplicatore, nel nostro caso di 60 mila volte? Proprio in questi link!

Gli open data si contano. I linked data, se occorre, si pesano.

Si, ma come?

Prendiamo come esempio il debito pubblico USA: se realizziamo un mashup tra due dataset di open data, uno con i dati del debito e l’altro con i riferimenti geografici, potremmo ottenere la visualizzazione pesata della distribuzione del debito USA.

Al contrario, un esempio di applicazione di Linked Data contati e non pesati lo si può ottenere mettendo in relazione i dati demografici della distribuzione della povertà in UK con i dati geografici degli UK riots. Il risultato è il mirabile esempio di utilizzo di Linked Open Data realizzato Matt Stiles, evoluzione della precedente mappa interattiva del Guardian, che a sua volta ne ha ripubblicato il lavoro.

 

One comment

  • titti cimmino ha detto:

    Senza partire ab ovo, la questione posta da Quintarelli su una possibile “relazione” tra il set di dati di spesa generale e gli sprechi (presunti) della casta, è mal posta, IMHO. Mi spiego: i modelli di rappresentazione dei dati sono classificabili in due famiglie principali. Quelli dei DB RELAZIONALI e quelli dei LINKED DATA (RDF based). La differenza tra i due paradigmi sta non tanto e non solo nelle sue implicazioni socio-politiche del modello di rete. Un modello relazionale, piatto e tabulare (tante colonne, altrettanti attributi), è meno intuitivo e snello di un RDF (Graph) che mette in evidenza le relazioni tra gli oggetti del Database. E qui veniamo alla Quintarelli’s idea: in un dominio ben definito di conoscenze, il modello relazionale è ok, ma in un dominio in cui i dati sono “destrutturati” [cit. Roberto] provenienti da fonti e domini a loro volta diversi, magari incompleti e che non rientrano in uno schema , cioè in un’ontologia pre-definita (pesi, geo-localizzazioni et similia), ecco che il modello relazionale va in frantumi. Accolgo le osservazioni di Roberto, in merito ai “pesi” e alla “conta”. Ciò che Roberto chiama “peso” è in sostanza un tipo di valore che caratterizza ontologicamente una risorsa. Va da sè che l’ontologia definisce non solo tipi di legami quali i pesi, ma anche tipi di legami qualitativi (ed è il caso dei Riots in UK). Linked data è fare mash-up di dati provenienti da diverse sorgenti, combinandoli cioè sulla base di una struttura precisa, uno standard model (RDF) che garantisca l’identificazione univoca e non ambigua di un oggetto (risorsa). Lasciando a parte il tecnicismo della questione, confermo una generalizzazione ingenerosa dell’utilizzo di dati a mo’ di collegamento da parte di coloro che “sovrappongono” gli stessi dati! Ad es. i dati di una pubblica amministrazione sulle spese sanitarie di un’area geografica particolare possono essere combinati con altri dati relativi alle caratteristiche della popolazione della stessa regione per verificare l’efficacia delle politiche di quelle amministrazione. In una conferenza TED del 2006 Hans Rosling illustrava come è possibile combinare un set di dati statistici dell’ONU per stimare la povertà nel mondo e conoscerne i valori e l’evoluzione grazie ad applicazioni grafiche interattive. Ma ritorniamo ai due paradigmi: perché il modello relazionale è inefficace nel caso della comparazione ipotizzata da Quintarelli? Per varie ragioni, alcune tecniche. Dal momento che siamo in vacanza, lasciamo perdere i tecnicismi “pesanti” e indichiamo gli elementi meno tecnici e più “leggeri” :). Per definire lo scopo e l’interpretazione della mondo della conoscenza a cui i dati sono riferiti nel modello relazionale è necessario un solo schema. Per converso secondo l’approccio linked data lo schema e le affermazioni sui dati sono separati, cioè è possibile dare differenti interpretazioni (differenti inferenze) dei dati. E in quest’ultimo caso dall’inferenza è possibile aumentare la base di conoscenza di partenza. Nel primo caso invece, pur aumentando le dimensioni della base di conoscenza di partenza, l’insieme delle conclusioni possibili sulla base non aumenta. Per cui quello “zero virgola briscola” che varia, non aggiunge altro, se non il rimando ad un Butterfly Effect. Ma qui vi costringerei a leggermi mentre scrivo di caos matematico, equazioni non lineari e variazioni delle condizioni al contorno. In inverno, quando saremo al calduccio, per ammazzare il tedio, magari sarà corroborante una simile lettura:D


Leave a comment