Programming Collective Intelligence by Toby Segaran

Questo libro è già un po’ datato (2008) ma è un ottimo punto di vista su come passare dalla teoria all’uso della ML. In particolare introduce molti campi nei quali la Machine Learning accoppiata ai modelli statistici permette di trarre conclusioni sull’esperienza utente, sul marketing, sui gusti personali e sul comportamento umano in generale.

Interessante anche notare che tutte queste informazioni che ognuno di noi genera con i propri modi d’uso di siti e applicazioni vengono raccolte ogni giorno (spesso senza una vera consapevolezza utente.

Ogni algoritmo è descritto in modo chiaro e conciso con codice che può essere utilizzato immediatamente. Questo libro spiega:

  • Tecniche di filtraggio collaborativo che consentono ai rivenditori online di consigliare prodotti o supporti
  • Metodi di clustering per rilevare gruppi di elementi simili in un grande set di dati
  • Funzioni del motore di ricerca – crawler, indexer, motori di query e algoritmo PageRank
  • Algoritmi di ottimizzazione che cercano milioni di possibili soluzioni a un problema e scegli la migliore
  • Filtraggio bayesiano, utilizzato nei filtri anti-spam per classificare i documenti in base a tipi di parole e altre funzionalità
  • Utilizzando gli alberi decisionali non solo per fare previsioni, ma per modellare il modo in cui vengono prese le decisioni
  • Prevedere valori numerici piuttosto che classificazioni per costruire modelli di prezzo
  • Supporto macchine vettoriali per abbinare persone in siti di incontri online
  • Fatturazione della matrice non negativa per individuare le caratteristiche indipendenti di un set di dati
  • Evoluzione dell’intelligenza per la risoluzione dei problemi – come un computer sviluppa la sua abilità migliorando il suo codice proprio più gioca un gioco

Ogni capitolo include esercizi per estendere gli algoritmi per renderli più potenti. E’ ancora una volta un ottimo libro per prendere confidenza con questo tipo di usi andando oltre le semplici applicazioni web supportate da database e mettendo la ricchezza di dati disponibili sul web a fornire un valore aggiunto.

4 anni ago