Préparer et nettoyer un jeu de données
Objectif de la formation : à l'issue de cette formation, le stagiaire sera capable de préparer son jeu de données afin de pouvoir l'exploiter statistiquement dans le logiciel R.
Niveau : Débutant
Pré-requis : aucun
Durée : 2 jours (14 heures)
Tarif : 800 € H.T (soit 400 € H.T/jour)
Dates et lieu : au choix - Rennes ou distanciel
Programme :
1. Vérification de l'importation et de la structure des données
- Importer le jeu de données à l'aide de R
- Vérification de la nature des variables
- Vérification du format souhaité
2. Rectifier les problèmes de structure
- Séparer une variable en deux colonnes
- Regrouper deux variables en une colonne
- Séparer les valeurs d'une ligne
- Regrouper les valeurs de deux lignes
- Gérer les doublons
- Extraire un sous-ensemble
- Modifier le nom des variables/des individus
3. Rectifier et gérer les observations
- Modifier la valeur d'une variable
- Transformer un jeu de données
- Repérer et gérer les valeurs manquantes
- Identifier les valeurs aberrantes
- Détecter les outliers