Grafico 2: Correlazione spuria

Spurious Correlations: quando la ricerca di una correlazione ci fa cadere nel ridicolo!

Penso sia normale: l’approccio a una disciplina come quella del Data Science richiede rigore, ragionamento, competenza e un pizzico di fortuna. Fortuna che però non deve essere “aiutata” in maniera inverosimile solo per raggiungere più facilmente un traguardo.

Ecco quindi che a forza di cercare correlazioni, senza ragionare troppo su quello che si sta facendo, si finisce nel vortice delle correlazioni spurie (Spurious Correlations).

Per esempio, se vi dicessi che c’è una buona correlazione fra il numero di persone morte affogate in piscina fra il 1999 e il 2009 con il numero di film nei quali Nicolas Cage appare, voi come la prendereste?

Penso di conoscere già la risposta, ma date un’occhiata al grafico qui sotto:

Grafico 1: Correlazione spuria

ovviamente bisogna considerare i dati utilizzati come affidabili (avete Datasets per contrastare queste affermazioni?).

Ecco quindi che oltre a competenze in ambito matematico-statistico, in campo informatico e conoscenze riguardanti il dominio di sviluppo dei dati, è sempre necessaria una buona dose di buon senso. 

Potete trovare altri simpatici esempi di correlazioni spurie qui.

Articolo creato 2

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

Articoli correlati

Inizia a scrivere il termine ricerca qua sopra e premi invio per iniziare la ricerca. Premi ESC per annullare.

Torna in alto