Mittwoch, 30. März 2016

Mit Python begonnen, in R gelandet: Daten über Müll

In meinem letzten Beitrag habe ich Euch noch freudestrahlend erzählt, dass ich begonnen habe, Python zu lernen. Das ist auch immer noch so. Doch mittlerweile habe ich mir überlegt, dass ich ja mit Datensätzen arbeiten möchte und somit auch Grundlagen in R benötige.
Das Auslesen eines Datensatzes oder das Erstellen eines Histogramms ist für mich nun schon kein Problem mehr, denn hier sind die Befehle wirklich einfach. Ich persönlich arbeite aber lieber mit RStudio als mit der R-Console. Hier habe ich einfach den besseren Überblick und kann im Bedarfsfall auch mit größeren Datenmengen arbeiten.

Müll über Daten - Daten über Müll

Nun traue ich mich mit R an mein erstes Datenprojekt heran. Bevor ich jedoch ein richtig großes, umfangreiches Konzept umsetze, möchte ich erst einmal mit einem kleinen Datensatz arbeiten. Meine Idee: Daten über Müll. Eigentlich hätte ich erwartet, dass sie nicht so einfach zu bekommen sind. Doch tatsächlich gibt es Datensätze über die unterschiedlichen Abfallarten und ihr Aufkommen in Deutschland, sowohl für das Jahr 2013 wie auch das Jahr 2014, die mich persönlich verwundern. Dies ist natürlich ideal für Testzwecke, wird aber wohl kaum bei jedem Thema der Fall sein, denn es gibt auch Datensätze, die mehr als die benötigten Daten enthalten oder verunreinigt sind. Auch gibt es Daten, die unter Verschluss gehalten werden. 

Vom Datensatz zum Histogramm

Nun heißt es also erst einmal, den Datensatz für R vorbereiten und ihn dann importieren. Das Histogram selbst ist dann eigentlich nur eine Spielerei, vorausgesetzt, die Daten sind numerischer Natur. Aber von anderen Daten würde man ja auch kein Histogramm erzeugen. 
Wenn ich nun also mit den Abfall-Daten in R zurecht komme, könnte ich sie in Python weiter verarbeiten, wenn ich dann soweit bin und der Annahme folge, dass ich auch Python weiter verwende. Aber ich denke, in Anbetracht meiner Motivation werde ich das wohl schaffen.

Was bezwecke ich nun damit, R und Python zu lernen?

Eine Programmiersprache zu lernen ist immer nur ein Mittel zum Zweck, möchte ich also eine Homepage bauen können, so sollte ich HTML beherrschen. Geht es mir um objektbasierte Programmierung, wären Python oder auch Java sicherlich eine gute Idee. Aber ich habe es ja auch mit Daten zu tun, also brauche ich eine datenorientierte Programmiersprache, die mir im Zweifelsfall statistische Berechnungen erleichtert, sie bestenfalls sogar für mich übernimmt. Doch damit das klappt, sollte ich auch wissen, wie ich sie anwende und welche Daten sie jeweils fordert. Natürlich gibt es auch Bridges, die es mir ermöglichen, bestimmte Teilaspekte in andere Sprachen umzusetzen, so wie auf einer Homepage auch Java-Script-Elemente eingebaut werden können. Die Basis ist aber auch hier HTML, denn ohne, dass ich weiß, wie ich Java-Script einbaue, würde ich das Java-Script nicht ans Laufen bringen.

Keine Kommentare:

Kommentar veröffentlichen