Statistique et Big Data Analytics; Volumétrie, L'Attaque des Clones - Université Toulouse III - Paul Sabatier - Toulouse INP Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2014

Statistique et Big Data Analytics; Volumétrie, L'Attaque des Clones

Résumé

This article assumes acquired the skills and expertise of a statistician in unsupervised (NMF, k-means, SVD) and supervised learning (regression, CART, random forest). What skills and knowledge do a statistician must acquire to reach the "Volume" scale of big data? After a quick overview of the different strategies available and especially of those imposed by Hadoop, the algorithms of some available learning methods are outlined in order to understand how they are adapted to the strong stresses of the Map-Reduce functionalities
Fichier principal
Vignette du fichier
st-stat-bigdata-clones.pdf (800.74 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00995801 , version 1 (24-05-2014)
hal-00995801 , version 2 (26-05-2014)
hal-00995801 , version 3 (03-10-2014)

Identifiants

Citer

Philippe Besse, Nathalie Vialaneix. Statistique et Big Data Analytics; Volumétrie, L'Attaque des Clones. 2014. ⟨hal-00995801v3⟩
533 Consultations
5077 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More