Das Auslesen eines Datensatzes oder das Erstellen eines Histogramms ist für mich nun schon kein Problem mehr, denn hier sind die Befehle wirklich einfach. Ich persönlich arbeite aber lieber mit RStudio als mit der R-Console. Hier habe ich einfach den besseren Überblick und kann im Bedarfsfall auch mit größeren Datenmengen arbeiten.
Müll über Daten - Daten über Müll
Nun traue ich mich mit R an mein erstes Datenprojekt heran. Bevor ich jedoch ein richtig großes, umfangreiches Konzept umsetze, möchte ich erst einmal mit einem kleinen Datensatz arbeiten. Meine Idee: Daten über Müll. Eigentlich hätte ich erwartet, dass sie nicht so einfach zu bekommen sind. Doch tatsächlich gibt es Datensätze über die unterschiedlichen Abfallarten und ihr Aufkommen in Deutschland, sowohl für das Jahr 2013 wie auch das Jahr 2014, die mich persönlich verwundern. Dies ist natürlich ideal für Testzwecke, wird aber wohl kaum bei jedem Thema der Fall sein, denn es gibt auch Datensätze, die mehr als die benötigten Daten enthalten oder verunreinigt sind. Auch gibt es Daten, die unter Verschluss gehalten werden.
Vom Datensatz zum Histogramm
Nun heißt es also erst einmal, den Datensatz für R vorbereiten und ihn dann importieren. Das Histogram selbst ist dann eigentlich nur eine Spielerei, vorausgesetzt, die Daten sind numerischer Natur. Aber von anderen Daten würde man ja auch kein Histogramm erzeugen.
Wenn ich nun also mit den Abfall-Daten in R zurecht komme, könnte ich sie in Python weiter verarbeiten, wenn ich dann soweit bin und der Annahme folge, dass ich auch Python weiter verwende. Aber ich denke, in Anbetracht meiner Motivation werde ich das wohl schaffen.
Keine Kommentare:
Kommentar veröffentlichen