Premiers pas en statistique descriptive : Manipuler, visualiser et décrire un jeu de données
Objectif de la formation : à l'issue de cette formation, le stagiaire sera capable de manipuler ses jeux de données avec le logiciel R afin de visualiser et décrire les observations contenues.
Niveau : Débutant
Pré-requis : niveau de base en mathématiques
Durée : 3 jours (21 heures)
Tarif : 1200 € H.T (soit 400 € H.T/jour)
Dates et lieu : selon votre choix - Rennes ou distanciel
Programme :
1. Manipuler les données
- Prise en main du logiciel R (les objets (vecteurs, matrices...), les fonctions, les packages, les aides)
- Premières manipulations d'un jeu de données
- importer un jeu de données (texte, csv, excel)
- manipuler les variables (recodage, découpage en classes, niveaux des facteurs)
- repérer et gérer les valeurs particulières (valeurs aberrantes, influentes, manquantes, doublons)
- concaténer des tableaux de données
- tableaux croisés
- exporter les résultats
2. Visualiser les données
- Les différents types de variables
- Quel graphique choisir et comment l'interpréter ?
- Les graphiques avec le logiciel R
- statistique univarié : histogramme, diagrammes en bâtons, diagramme circulaire, boîte à moustaches, diagramme de Pareto...
- statistique bivariée : nuage de points, diagrammes en barres, boîtes à moustaches parallèles...)
3. Décrire les données
- Statistique univariée
- Tendance centrale d'une distribution (moyenne, mode, médiane)
- dispersion d'une distribution (variance, écart-type, fractiles)
- Statistique bivariée
- Lien entre deux variables quantitatives : le coefficient de corrélation de Pearson
- Lien entre deux variables ordinales : le coefficient de corrélation de Spearman
- Lien entre deux variables qualitatives : la statistique du Chi2
- Lien entre une variable quantitative et une variable qualitative : le rapport de corrélation