La nuova pelle dell’informatica e la nuova figura del Data Scientist

I dati sono una nuova moneta. Su questo ormai non c’è alcun dubbio, almeno in questo momento storico e di sviluppo della nostra società.

Da una parte vi sono le “new co” che non possiedono nulla (o quasi) se non dati, accumulano grandi moli di dati in cambio in molti casi di servizi gratuiti, e poggiano i loro modelli di sviluppo sostanzialmente nell’accoppiare domanda e offerta in modo efficiente ed efficace, grazie ai dati che hanno.

Dall’altra vi sono le “old co”, che possiedono tutto ciò che serve per produrre e vendere prodotti o servizi. Posseggono meno dati, o quanto basta, magari non sanno neppure di possederli. Sono però concentrate nell’ideare nuovi prodotti o servizi o a ridurre i costi. Nel momento in cui scrivo questo contributo il più grande gruppo alberghiero al mondo, Wyndham Group, impiega 32.000 dipendenti, vale 8 miliardi di dollari, possiede 8,000 hotel, gestisce oltre 680.000 stanze in 73 nazioni. Dall’altra parte AirB&B, la nota azienda leader nello sharing di abitazioni, vale 30 miliardi di dollari, impiega 2.000 dipendenti, e non possiede case o stanze o alberghi.

Da dove trae il proprio valore AirB&B?

O meglio, da dove viene il maggior valore di AirB&B rispetto a Wyndham Group?

Certamente non può essere altro se non ciò che fa e il modello di business che impiega: la capacità di intermediare domanda e offerta in modo immediato e personale. La parte commerciale potremmo dire.

Come fa? Grazie ai dati che accumula su domanda e offerta attraverso le sue applicazioni o App. Il resto della complessità è delegata alla forza del “crowd”, vale a dire chi in realtà mette a disposizione le case e le gestisce.

Potrebbero essere fatti centinaia di altri esempi di questo tipo e il risultato sarebbe sempre lo stesso: ogni modello di business che valuteremmo avrebbe come elemento cardine l’uso e/o l’accumulo di dati per supportare decisioni di persone o di macchine o di robot.

Alcune analisi affermano che il 90% dei dati che la nostra società produce è stato prodotto negli ultimi due anni. Quindi, i nuovi modelli di business, si poggiano su dati relativamente freschi, si potrebbe concludere. Sul piano individuale, basti pensare a quanto grande è mediamente l’archivio delle foto digitali che ciascuno di noi conserva nel proprio hard disk e quanto sia a volte “complicato” o semplicemente “noioso” rintracciare una vecchia foto tra le tante che abbiamo.

Se qualcuno vuole vedere la traiettoria che ognuno di noi sta seguendo nel produrre dati e nel trasformare parti della propria vita in formato digitale mi piace sempre fare l’esempio di Chris Dancy, o come si definisce lui stesso, l’uomo più connesso al mondo (http://www.chrisdancy.com/). Nella sua Server Farm casalinga Chris conserva 60-70 terabyte, una specie di specchio digitale della propria esistenza, diremmo. I dati di Chris sono prodotti da centinaia di sensori e wearable device che ha acquistato negli anni e che sperimenta su se stesso.

Chris è un alchimista dei tempi moderni, diremmo, alla ricerca di una nuova forma di oro. Per coloro che lavorano in una media o grande organizzazione possono chiedere al proprio CIO (Chief Informaton Officer) o al Capo dell’Informatica quanto grande siano di dati accumulati sui server che conservano tutti i dati portanti dell’azienda. Scommetto che la risposta non sarà molto distante, se non inferiore, rispetto a quanto l’uomo più connesso al mondo ha accumulato a casa sua.

Se generalizziamo questo fenomeno, nel suo complesso, considerando i dati prodotti dalla nostra società, includendo individui e organizzazioni di ogni genere, possiamo capire quanto sempre più digitali e quanto Big sono i dati che ci circondano.

Cosa significa tutto questo?

Semplice (o difficile): l’informatica sta cambiando pelle. L’informatica si trasforma da “Computing Science” a “Scienza dell’Informazione”, ops ops, ma quest’ultimo era anche il nome di un corso di laurea che avevamo in Italia qualche anno fa? Esiste ancora?

Per decenni la priorità è stata quella di digitalizzare, o dematerializzare, come si dice in alcune industrie. In termini pratici significa trasformare carta in bit. Quindi l’impegno principale è stato quello di rendere digitali anche i processi aziendali. Al posto di passare carta da una parte all’altra abbiamo, in modo più economico ed efficiente, imparato a traferire bit da una parte all’altra della nostra organizzazione. Dismettendo, di fatto, la mansione di fattorini o postini aziendali. Adesso l’Informatica si pone un’altra sfida: guardare dentro le “carte”, ormai digitali, che vengono passate da una parte all’altra. Il fattorino o il postino vuole capirci, magari, qualcosa di quello che trasporta. Interpretare ciò che c’è scritto nei plichi o nei faldoni digitali, che viaggiano sulle autostrade e sulle strade elettroniche aziendali ci permette di automatizzare il processo o qualche step di lavorazione. Altra efficienza, in sostanza.

La nuova pelle dell’Informatica ci permette di passare da un mondo che potremmo definire di “automazione del processo” ad un mondo concentrato sulla “comprensione dei contenuti”. A che pro? Supportare e automatizzare quando possibile le decisioni di uomini e o robotizzare le azioni delle stesse macchine. Acquisire, Conservare, Trattare e ultimamente Analizzare e Interpretare dati digitali per realizzare sistemi di supporto decisionale o robotizzare un processo non è solo necessario ma è sempre questione di sopravvivenza delle aziende e delle organizzazioni, piccole e grandi.

Il mestiere dell’informatico cambia, evolve. Il Programmatore e Analista in grado di acquisire con interviste lunghe e faticose “requisiti” dagli utenti finali per realizzare l’auspicato sistema informativo aziendale vengono sempre più affiancati da nuovi mestieri, come quello del Data Scientist. Quest’ultimo racchiude tra le sue competenze molte esperienze e specializzazioni. In realtà saper analizzare ed interpretare dati è un vecchio mestiere. L’analisi dei dati sperimentali, economici, di business, provenienti da indagini sociali o censuari è una disciplina che ha una storia di più di due secoli e che ha un nome: statistica.

C’è un elemento di novità, però. I dati non sono solo numeri ma la digitalizzazione genera per forza di cose anche “contenuti”: immagini, video, audio, testi di ogni sorta che, abbinata all’abbondanza che si diceva prima, fa sì che alla statistica e alla Ricerca Operativa classica si affiancano nuove competenze come quelle di data mining, o competenze specializzate per l’analisi di contenuti: video, audio, testi, dati bioinformatici e cosi via.

Il Data Scientist estende lo spettro delle competenze originali in modo orizzontale, sempre più ampie ed eterogenee, combinando assieme competenze statistiche, matematiche e informatiche con competenze di problem solving e capacità di identificare problemi di business che possono essere affrontati grazie all’analisi e all’interpretazione dei dati. Possiamo dire che il Data Scientist ha anche competenze di mediazione quando aiuta a distinguere quello che si può fare da quello che irrealizzabile.

Il Data Scientist più che uno scienziato è un professionista che applica un metodo scientifico per affrontare i problemi che riguardano l’analisi e l’interpretazione dei dati nelle aziende pubbliche e private.

Questo testo è stato scritto come contributo al libro Data Scientist di Alessandro Giaume Edito da Franco Angeli, Milano, 2017.

Pietro Leo is an Executive Architect and CTO in IBM, Chief Scientist and Research strategist for IBM Italy Research and Business, a well-known Innovation Agitator and Analytics maker. Member of the IBM Academy of Technology Leadership Team (#IBMAoT) and Head of IBM Italy Center of Advanced Studies. You can also follow him on Twitter (@pieroleo)

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

Blog at WordPress.com.

Up ↑

%d bloggers like this: