Daten nach R exportieren

In diesem Durchgang sehen Sie, wie Sie Daten nach RStudio exportieren und diese anschließend in Diagramme und Tabellen umwandeln

🌐 Daten in RStudio laden

Beginnen Sie mit dem Export der Befragten-Daten aus NGSurvey im CSV-Format

Verwenden Sie in RStudio das Skript, um die CSV-Datei zu importieren und Ihren Datensatz einzurichten.

Wo:

  • survey_csv: Variable zum Speichern der Daten.

  • read.csv: Funktion zum Einlesen der CSV-Datei.

  • file: Pfad zur CSV-Datei.

  • stringsAsFactors: Konvertiert String-Spalten in Factor.

  • header: Verwendet die erste Zeile als Spaltennamen.

  • sep: Trennzeichen in der Datei (Komma).

📊 Datenanalyse und Visualisierung in RStudio

Sobald Ihre Daten in R oder RStudio geladen sind, können Sie mit der Analyse sowie der Erstellung von Visualisierungen und Tabellen beginnen.

  1. Datenzusammenfassung: Bietet eine schnelle Zusammenfassung des Datensatzes, einschließlich Statistiken für jede Spalte.

Wo:

  • summary: Funktion zur Bereitstellung grundlegender deskriptiver Statistiken für jede Spalte Ihres Datensatzes

  • survey_csv: Ihr Datensatz.

  1. Einfache Tabelle: Für dieses Beispiel haben wir die Variable Recommend_likelihood gewählt, die die Umfragefrage "How likely are you to recommend our service to a friend or colleague" repräsentiert

Wo:

  • table: Diese Funktion erstellt eine Häufigkeitstabelle.

  • survey_csv$Recommend_likelihood: Gibt die Spalte an Recommend_likelyhood aus der survey_csv Datensatz.

  • Ausgabe: Die Häufigkeitstabelle zeigt, wie oft jede Kategorie der Empfehlungswahrscheinlichkeit im Datensatz vorkommt.

Optional: Wir empfehlen, die korrekte Reihenfolge der kategorialen Variable in Tabellen und Visualisierungen sicherzustellen.

Wo:

  • factor: Konvertiert die Variable in einen Factor (kategoriale Variable).

  • levels: Legt die Reihenfolge der Kategorien für den Factor fest.

  1. Visualisierung: Einfache Balkendiagramm-Visualisierung der Verteilung der Empfehlungswahrscheinlichkeit.

Erstellen Sie das barplot um die Daten zu visualisieren:

Wo:

  • barplot: Erzeugt ein Balkendiagramm.

  • table(survey_csv$Recommend_likelyhood): Erstellt eine Häufigkeitstabelle für die Balkenhöhen.

  • main: Legt den Titel des Plots fest.

  • xlab: Beschriftung für die x-Achse.

  • ylab: Beschriftung für die y-Achse.

  • col: Legt die Balkenfarbe auf Hellblau fest.

  • las = 2: Dreht Achsenbeschriftungen für bessere Lesbarkeit senkrecht.

  • cex.names = 0.8: Verringert die Größe der Balkenbeschriftungen, um Überlappungen zu vermeiden.

Optional: Passen Sie die Ränder und Beschriftungspositionen für das Balkendiagramm an.

Wo:

  • par: Legt grafische Parameter fest.

  • mar: Passt die Plot-Ränder an: unten, links, oben, rechts (erhöhter unterer Rand, um Überlappungen zu vermeiden).

  • + 0.1: Erhöht jeden Plotrand leicht, um zusätzlichen Platz für Plot-Elemente zu gewährleisten und zu verhindern, dass diese abgeschnitten oder überfüllt werden.

  • mgp: Steuert die Platzierung von Achsentitel, Beschriftungen und Linie. Hier 4 verschiebt die Beschriftung der x-Achse weiter nach unten.

Zuletzt aktualisiert

War das hilfreich?