# Daten nach R exportieren

## 🌐 Daten in RStudio laden

Beginnen Sie mit dem Export der Befragten-Daten aus NGSurvey im CSV-Format

<figure><img src="https://133942686-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2F-M8fLhS0bmfBRyq0HdUm%2Fuploads%2FyftK49SGJvh7fsYo5Pg4%2Fimage.png?alt=media&#x26;token=2bbc0413-b6cc-4319-9e26-4b44373d3180" alt=""><figcaption></figcaption></figure>

Verwenden Sie in RStudio das Skript, um die CSV-Datei zu importieren und Ihren Datensatz einzurichten.

```r
survey_csv <- read.csv(file="C:/Users/Admin/Downloads/ClientSatisfactionSurvey.csv",stringsAsFactors = TRUE, header=TRUE, sep=",")
```

Wo:

* **survey\_csv**: Variable zum Speichern der Daten.
* **read.csv**: Funktion zum Einlesen der CSV-Datei.
* **file**: Pfad zur CSV-Datei.
* **stringsAsFactors**: Konvertiert String-Spalten in Factor.
* **header**: Verwendet die erste Zeile als Spaltennamen.
* **sep**: Trennzeichen in der Datei (Komma).

## 📊 Datenanalyse und Visualisierung in RStudio

Sobald Ihre Daten in R oder RStudio geladen sind, können Sie mit der Analyse sowie der Erstellung von Visualisierungen und Tabellen beginnen.

1. **Datenzusammenfassung:** Bietet eine schnelle Zusammenfassung des Datensatzes, einschließlich Statistiken für jede Spalte.

```r
summary(survey_csv)
```

Wo:

* **summary**: Funktion zur Bereitstellung grundlegender deskriptiver Statistiken für jede Spalte Ihres Datensatzes
* **survey\_csv**: Ihr Datensatz.

2. **Einfache Tabelle:** Für dieses Beispiel haben wir die Variable Recommend\_likelihood gewählt, die die Umfragefrage "How likely are you to recommend our service to a friend or colleague" repräsentiert

```r
table(survey_csv$Recommend_likelihood
```

<figure><img src="https://133942686-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2F-M8fLhS0bmfBRyq0HdUm%2Fuploads%2FOh6XfSr4TwCx5xArT4Gx%2Fimage.png?alt=media&#x26;token=a71d2ba7-9506-44ee-8eab-08b3088d2fdc" alt=""><figcaption></figcaption></figure>

Wo:

* **table**: Diese Funktion erstellt eine Häufigkeitstabelle.
* **survey\_csv$Recommend\_likelihood**: Gibt die Spalte an `Recommend_likelyhood` aus der `survey_csv` Datensatz.
* **Ausgabe**: Die Häufigkeitstabelle zeigt, wie oft jede Kategorie der Empfehlungswahrscheinlichkeit im Datensatz vorkommt.

**Optional:** Wir empfehlen, die korrekte Reihenfolge der kategorialen Variable in Tabellen und Visualisierungen sicherzustellen.

```r
survey_csv$Recommend_likelihood <- factor(
  survey_csv$Recommend_likelihood,
  levels = c("Very unlikely", "Unlikely", 
  "Neutral", "Likely", "Very likely")
)
```

Wo:

* **factor**: Konvertiert die Variable in einen Factor (kategoriale Variable).
* **levels**: Legt die Reihenfolge der Kategorien für den Factor fest.

3. **Visualisierung:** Einfache Balkendiagramm-Visualisierung der Verteilung der Empfehlungswahrscheinlichkeit.

Erstellen Sie das **barplot** um die Daten zu visualisieren:

```r
barplot(
  table(survey_csv$Recommend_likelihood), 
  main = "How likely are you to recommend our service to a friend or colleague",
  xlab = "Recommendation Likelihood",
  ylab = "Frequency",
  col = "lightblue",
  las = 2,
  cex.names = 0.8  # Reduziert die Größe der Balkenbeschriftungen
)
```

<figure><img src="https://133942686-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2F-M8fLhS0bmfBRyq0HdUm%2Fuploads%2F6gtLMsHtRWQyWwOXRNOB%2Fimage.png?alt=media&#x26;token=9a1a35f1-720d-4b6c-ba5a-9ba127426666" alt=""><figcaption></figcaption></figure>

Wo:

* **barplot**: Erzeugt ein Balkendiagramm.
* **table(survey\_csv$Recommend\_likelyhood)**: Erstellt eine Häufigkeitstabelle für die Balkenhöhen.
* **main**: Legt den Titel des Plots fest.
* **xlab**: Beschriftung für die x-Achse.
* **ylab**: Beschriftung für die y-Achse.
* **col**: Legt die Balkenfarbe auf Hellblau fest.
* **las = 2**: Dreht Achsenbeschriftungen für bessere Lesbarkeit senkrecht.
* **cex.names = 0.8**: Verringert die Größe der Balkenbeschriftungen, um Überlappungen zu vermeiden.

**Optional:** Passen Sie die Ränder und Beschriftungspositionen für das Balkendiagramm an.

```r
par(mar = c(7, 5, 4, 2) + 0.1, mgp = c(4, 1, 0))
```

Wo:

* **par**: Legt grafische Parameter fest.
* **mar**: Passt die Plot-Ränder an: unten, links, oben, rechts (erhöhter unterer Rand, um Überlappungen zu vermeiden).
* **+ 0.1**: Erhöht jeden Plotrand leicht, um zusätzlichen Platz für Plot-Elemente zu gewährleisten und zu verhindern, dass diese abgeschnitten oder überfüllt werden.
* **mgp**: Steuert die Platzierung von Achsentitel, Beschriftungen und Linie. Hier `4` verschiebt die Beschriftung der x-Achse weiter nach unten.
