Daten nach R exportieren

In diesem Durchlauf sehen Sie, wie Sie Daten nach RStudio exportieren und daraus Diagramme und Tabellen erstellen

🌐 Daten in RStudio laden

Beginnen Sie mit dem Export der Befragten-Daten aus NGSurvey im CSV-Format

Verwenden Sie in RStudio das Skript, um die CSV-Datei zu importieren und Ihren Datensatz einzurichten.

survey_csv <- read.csv(file="C:/Users/Admin/Downloads/ClientSatisfactionSurvey.csv",stringsAsFactors = TRUE, header=TRUE, sep=",")

Wo:

  • survey_csv: Variable zum Speichern der Daten.

  • read.csv: Funktion zum Einlesen der CSV-Datei.

  • file: Pfad zur CSV-Datei.

  • stringsAsFactors: Konvertiert String-Spalten in Factor.

  • header: Verwendet die erste Zeile als Spaltennamen.

  • sep: Trennzeichen in der Datei (Komma).

📊 Datenanalyse und Visualisierung in RStudio

Sobald Ihre Daten in R oder RStudio geladen sind, können Sie mit der Analyse sowie der Erstellung von Visualisierungen und Tabellen beginnen.

  1. Datenzusammenfassung: Bietet eine schnelle Zusammenfassung des Datensatzes, einschließlich Statistiken für jede Spalte.

summary(survey_csv)

Wo:

  • summary: Funktion zur Bereitstellung grundlegender deskriptiver Statistiken für jede Spalte Ihres Datensatzes

  • survey_csv: Ihr Datensatz.

  1. Einfache Tabelle: Für dieses Beispiel haben wir die Variable Recommend_likelihood gewählt, die die Umfragefrage "How likely are you to recommend our service to a friend or colleague" repräsentiert

table(survey_csv$Recommend_likelihood

Wo:

  • table: Diese Funktion erstellt eine Häufigkeitstabelle.

  • survey_csv$Recommend_likelihood: Gibt die Spalte an Recommend_likelyhood aus der survey_csv Datensatz.

  • Ausgabe: Die Häufigkeitstabelle zeigt, wie oft jede Kategorie der Empfehlungswahrscheinlichkeit im Datensatz vorkommt.

Optional: Wir empfehlen, die korrekte Reihenfolge der kategorialen Variable in Tabellen und Visualisierungen sicherzustellen.

survey_csv$Recommend_likelihood <- factor(
  survey_csv$Recommend_likelihood,
  levels = c("Very unlikely", "Unlikely", 
  "Neutral", "Likely", "Very likely")
)

Wo:

  • factor: Konvertiert die Variable in einen Factor (kategoriale Variable).

  • levels: Legt die Reihenfolge der Kategorien für den Factor fest.

  1. Visualisierung: Einfache Balkendiagramm-Visualisierung der Verteilung der Empfehlungswahrscheinlichkeit.

Erstellen Sie das barplot um die Daten zu visualisieren:

barplot(
  table(survey_csv$Recommend_likelihood), 
  main = "How likely are you to recommend our service to a friend or colleague",
  xlab = "Recommendation Likelihood",
  ylab = "Frequency",
  col = "lightblue",
  las = 2,
  cex.names = 0.8  # Reduziert die Größe der Balkenbeschriftungen
)

Wo:

  • barplot: Erzeugt ein Balkendiagramm.

  • table(survey_csv$Recommend_likelyhood): Erstellt eine Häufigkeitstabelle für die Balkenhöhen.

  • main: Legt den Titel des Plots fest.

  • xlab: Beschriftung für die x-Achse.

  • ylab: Beschriftung für die y-Achse.

  • col: Legt die Balkenfarbe auf Hellblau fest.

  • las = 2: Dreht Achsenbeschriftungen für bessere Lesbarkeit senkrecht.

  • cex.names = 0.8: Verringert die Größe der Balkenbeschriftungen, um Überlappungen zu vermeiden.

Optional: Passen Sie die Ränder und Beschriftungspositionen für das Balkendiagramm an.

par(mar = c(7, 5, 4, 2) + 0.1, mgp = c(4, 1, 0))

Wo:

  • par: Legt grafische Parameter fest.

  • mar: Passt die Plot-Ränder an: unten, links, oben, rechts (erhöhter unterer Rand, um Überlappungen zu vermeiden).

  • + 0.1: Erhöht jeden Plotrand leicht, um zusätzlichen Platz für Plot-Elemente zu gewährleisten und zu verhindern, dass diese abgeschnitten oder überfüllt werden.

  • mgp: Steuert die Platzierung von Achsentitel, Beschriftungen und Linie. Hier 4 verschiebt die Beschriftung der x-Achse weiter nach unten.

Zuletzt aktualisiert

War das hilfreich?