# Exporter les données vers R

## 🌐 Charger des données dans RStudio

Commencez par exporter les données des répondants depuis NGSurvey au format CSV

<figure><img src="https://186103257-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2F-M8fLhS0bmfBRyq0HdUm%2Fuploads%2FyftK49SGJvh7fsYo5Pg4%2Fimage.png?alt=media&#x26;token=2bbc0413-b6cc-4319-9e26-4b44373d3180" alt=""><figcaption></figcaption></figure>

Dans RStudio, utilisez le script pour importer le fichier CSV et préparer votre jeu de données.

```r
survey_csv <- read.csv(file="C:/Users/Admin/Downloads/ClientSatisfactionSurvey.csv",stringsAsFactors = TRUE, header=TRUE, sep=",")
```

Où :

* **survey\_csv**: Variable pour stocker les données.
* **read.csv**: Fonction pour lire un fichier CSV.
* **file**: Chemin vers le fichier CSV.
* **stringsAsFactors**: Convertir les colonnes de type string en factor.
* **header**: Utiliser la première ligne comme noms de colonnes.
* **sep**: Délimiteur utilisé dans le fichier (virgule).

## 📊 Analyse et visualisation des données dans RStudio

Maintenant que vos données sont chargées dans R ou RStudio, vous pouvez commencer à les analyser et à créer des visualisations et des tableaux.

1. **Résumé des données :** Fournit un résumé rapide du jeu de données, incluant des statistiques pour chaque colonne.

```r
summary(survey_csv)
```

Où :

* **summary**: Fonction fournissant des statistiques descriptives de base pour chaque colonne de votre jeu de données
* **survey\_csv**: Votre jeu de données.

2. **Table simple :** Pour cet exemple, nous avons choisi la variable Recommend\_likelihood qui représente la question du sondage « How likely are you to recommend our service to a friend or colleague »

```r
table(survey_csv$Recommend_likelihood
```

<figure><img src="https://186103257-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2F-M8fLhS0bmfBRyq0HdUm%2Fuploads%2FOh6XfSr4TwCx5xArT4Gx%2Fimage.png?alt=media&#x26;token=a71d2ba7-9506-44ee-8eab-08b3088d2fdc" alt=""><figcaption></figcaption></figure>

Où :

* **table**: Cette fonction crée un tableau de fréquences.
* **survey\_csv$Recommend\_likelihood**: Cela spécifie la colonne `Recommend_likelyhood` depuis le `survey_csv` jeu de données.
* **Sortie**: Le tableau de fréquences montre la fréquence d'apparition de chaque catégorie de probabilité de recommandation dans le jeu de données.

**Optionnel :** Nous recommandons de garantir l'ordre correct de la variable catégorielle dans les tableaux et visualisations.

```r
survey_csv$Recommend_likelihood <- factor(
  survey_csv$Recommend_likelihood,
  levels = c("Very unlikely", "Unlikely", 
  "Neutral", "Likely", "Very likely")
)
```

Où :

* **factor**: Convertit la variable en factor (variable catégorielle).
* **levels**: Spécifie l'ordre des catégories pour le factor.

3. **Visualisation :** visualisation simple en diagramme à barres de la distribution de la probabilité de recommandation.

Créez le **barplot** pour visualiser les données :

```r
barplot(
  table(survey_csv$Recommend_likelihood), 
  main = "How likely are you to recommend our service to a friend or colleague",
  xlab = "Recommendation Likelihood",
  ylab = "Frequency",
  col = "lightblue",
  las = 2,
  cex.names = 0.8  # Réduit la taille des étiquettes des barres
)
```

<figure><img src="https://186103257-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2F-M8fLhS0bmfBRyq0HdUm%2Fuploads%2F6gtLMsHtRWQyWwOXRNOB%2Fimage.png?alt=media&#x26;token=9a1a35f1-720d-4b6c-ba5a-9ba127426666" alt=""><figcaption></figcaption></figure>

Où :

* **barplot**: Génère un diagramme à barres.
* **table(survey\_csv$Recommend\_likelyhood)**: Crée un tableau de fréquences pour les hauteurs des barres.
* **main**: Définit le titre du graphique.
* **xlab**: Étiquette pour l'axe des x.
* **ylab**: Étiquette pour l'axe des y.
* **col**: Définit la couleur des barres en bleu clair.
* **las = 2**: Fait pivoter les étiquettes de l'axe pour qu'elles soient perpendiculaires, pour une meilleure lisibilité.
* **cex.names = 0.8**: Réduit la taille des étiquettes des barres pour éviter le chevauchement.

**Optionnel :** Ajustez les marges et la position des étiquettes pour le barplot.

```r
par(mar = c(7, 5, 4, 2) + 0.1, mgp = c(4, 1, 0))
```

Où :

* **par**: Définit les paramètres graphiques.
* **mar**: Ajuste les marges du graphique : bas, gauche, haut, droite (augmentation de la marge inférieure pour éviter le chevauchement).
* **+ 0.1**: Augmente légèrement chaque marge du graphique afin de garantir un espace supplémentaire pour les éléments du graphique, empêchant qu'ils soient rognés ou surchargés.
* **mgp**: Contrôle le placement du titre de l'axe, des étiquettes et de la ligne. Ici, `4` décale l'étiquette de l'axe des x plus bas.
