Data Science from Scratch by Joel Grus

Questo libro, come già altri che ho letto ha un approccio learn by doing, senza tuttavia tralasciare di chiarire lo scopo ultimo degli strumenti che illustra.

Le librerie di Data science, i frameworks, i moduli ed i toolkit sono ottimi per fare Data Science, ma sono anche un modo per perdersi nella parte applicativa senza comprendere la base concettuale che sta dietro ai problemi che si vuole affrontare. In questo libro, l’autore ci guida a “ricostruire” gli strumenti e gli algoritmi fondamentali implementandoli da zero.

L’ho apprezzato perché:

  • Contiene buone basi di Python
  • Rinfresca concetti fondamentali della base matematica quali l’algebra lineare, la statistica e il calcolo della probabilità
  • Guida nei processi (noiosi ma necessari) di raccolta, esplorazione, pulizia e manipolazione dei dati disponibili
  • Spiega i fondamentali del Machine Learning
  • Implementa modelli imprescindibili nel cassetto degli attrezzi di un Data Scientist come , Naive Bayes, regressione lineare e logistica, alberi decisionali, reti neurali e clustering
  • Ripropone i sistemi di raccomandazione, la Linguistica computazionale, network analysis, MapReduce e  database
3 anni ago