La condivisione e la distribuzione delle informazioni passa in molti casi da grandi quantità di dati eterogenei raccolti con modalità collaborativa attraverso i social media.
I soggetti coinvolti sono giornalisti, cittadini, istituzioni oppure imprese: quando ci si trova a dover gestire e successivamente ad analizzare questi dati – che magari sono complessi, da filtrare, da arricchire con metadati, da collegare ad altri dati, da convertire – di solito cominciano i dolori.
Ecco una interessante infografica che mostra come la scienza dei dati può venire in nostro aiuto, riassumendo le risposte ai quesiti principali.
Cosa si intende per scienza dei dati? Quali sono le competenze richieste per l’analisi di dati complessi o di grandi volumi di dati? In che modo può essere utile utilizzare la scienza dei dati? Quali sono gli errori commessi più di frequente? Quali sono le modalità di raccolta e di immagazzinamento dei dati?
Via: The Role of the Data Scientist
Data Mining (text mining) , Computer Science Statistica e.. Semantic Web: questo è il Core del Data Science. E’ cominciato tutto con l’Analisi dei dati, ossia metodologia statistica e trattamento mediante elaboratore: in sintesi applicazione dell’informatica alla statistica. Ma alla potenza di calcolo – che ha fatto superare i problemi dell’analisi canonica dell’inizio del secolo scorso-si è affiancata ora la reale evidenza della esigenza semantica. L’interpretazione sotto il profilo concettuale, ontologico con schemi di riferimento di tipo descrittivo (i modelli RDF per Linked data). Fermo restando che occorre sempre considerare tutti gli aspetti statistici/informatici in termini di fasi della conoscenza, per passare dal dato alla formulazione, e quindi alla verifica. Il valore aggiunto del web semantico sta nel mining! Grazie per l’infografica di riferimento, d’altronde per una matematica come me, non poteva essere diversamente 🙂
Bella, vero?
Anche a me è piaciuta, occupandomi (tra le altre cose) di BI.
Grazie a te per i tuoi sempre preziosi commenti.
Tanti disastri di estrazione, manipolazione, analisi, comprensione, condivisione dei dati nascono proprio dalla scarsa o errata comprensione di questi concetti base e delle potenzialità dei servizi supportati (o supportabili) dai dati, come data journalism, egov, enterprise 2.0, social CRM, ecc.