R: Das kann die beschreibende Programmiersprache für Statistiken

Digitales Business

Digitales Business

Datum 27.07.2021
Lesezeit 5 Min.

R: Das kann die beschreibende Programmiersprache für Statistiken

Während sich Allround-Programmiersprachen wie Java, Python, C++ und C# wachsender Beliebtheit erfreuen, gibt es gleichzeitig auch weiter Bedarf für Spezialsprachen. Sie beherrschen nur wenige Aufgaben, diese aber richtig gut. Die Programmiersprache R ist eine solche Sprache. Ihr Aufgabengebiet ist die Statistik und da leistet sie Erstaunliches. So können auch Sie die Stärken von R für Ihre Arbeit nutzen.

 

Verbreitete Anwendungen für Statistiker:innen

Menschen, die beruflich viel mit Statistiken arbeiten, haben in der Regel ihre bevorzugten Werkzeuge: Viele, insbesondere Quereinsteiger:innen, arbeiten mit der Tabellenkalkulation Excel von Microsoft. Meist haben sie schon vorher Office-Anwendungen genutzt und hierbei auch die Analyse- und Diagramm-Werkzeuge in Excel entdeckt. Tatsächlich enthält Excel einige sehr brauchbare Statistik-Funktionen. Zudem ermöglicht Excel dank der mitgelieferten Scriptsprache VBA (Visual Basic for Applications) einfache bis mittelkomplexe Abfragen und Automationen.

Andere Anwender:innen haben im Studium das Software-Paket SPSS (Statistical Package for the Social Studies) kennengelernt. Es ist besonders in den Sozialwissenschaften und in der Psychologie weit verbreitet, kommt mittlerweile aber auch in der Marktforschung zum Einsatz. SPSS ist ein Urgestein der Computertechnik aus dem Jahr 1968, anfangs sogar noch mit Lochkarten programmiert. In den Jahren 2009 bis 2010 lief die Software unter dem Kürzel PA SW, seit der Übernahme durch IBM heißt sie wieder SPSS. Daneben gibt es noch weitere Statistik-Anwendungen wie SAS oder Stata. Auch Python wird als Programmiersprache in der Analyse genutzt.

 Internet of Things: Alles aus einer Hand

Internet of Things: Alles aus einer Hand

Durch die intelligente Vernetzung von Maschinen und Gegenständen werden unter anderem Produktion und Logistik effizienter gestaltet. So sparen Sie wichtige Ressourcen und erweitern Ihre Geschäftsmodelle.

Optimieren Sie jetzt Ihre Prozesse: Wir sind mit über 118 Millionen Connections führend im Bereich IoT und diese Zahl wächst täglich.

Die Programmiersprache R als Alternative

Platz 1 unter den beliebtesten Tools für Statistiker:innen belegt die Spezialsprache R. Das ist deshalb bemerkenswert, weil die Einarbeitung hier deutlich aufwendiger ist als bei anderen Statistik-Paketen. Excel und SPSS beispielsweise sind durch ihre sofort nach der Installation verfügbaren grafischen Oberflächen gerade für Lai:innen wesentlich intuitiver. Entsprechend kommen viele R-Nutzer:innen aus der Informatik oder den Naturwissenschaften und haben bereits mit anderen Programmiersprachen gearbeitet. Trotzdem oder gerade deswegen hat R viele Vorteile und Alleinstellungsmerkmale, die es nicht nur bei Statistik-Profis so beliebt machen:

  • Alle Arbeitsschritte der Datenauswertung sind aus den benutzergenerierten Skripten auch später noch ablesbar. Während einmal ausgeführte Analysen bei anderen Programmen im Nachhinein oft nicht mehr nachvollziehbar sind, bleibt in R alles durchgängig transparent. Das ist praktisch für die Zusammenarbeit in Arbeitsgruppen: Jedes Team-Mitglied kann im Code sehen, welche Daten in welcher Form analysiert und aufbereitet wurden. Nützlich ist dies aber auch für Wissenschaftler:innen. So können beispielsweise für Reviews alle Analyseschritte der zugrunde liegenden Forschungsarbeit auch später noch ausgelesen, Schritt für Schritt durchgegangen und auf eventuelle Fehler überprüft werden.
  • Die Sprache R wird unter der GNU-Lizenz vertrieben. Das heißt: Anwender:innenJa dürfen den Code kostenlos nutzen, bearbeiten und um eigene Inhalte erweitern. Bereitgestellt wird R von der R-Foundation über das CRAN (Comprehensive R Archive Network). Auf den CRAN-Servern steht nicht nur die Software selbst mit ihren rund 30 Funktionsbibliotheken („Pakete“ oder „Packages“) zum Download bereit. Hier liegen insgesamt über 15.000 Funktions-Pakete von Anwender:innen – und es kommen täglich neue hinzu. Die Mächtigkeit der Sprache wird somit immer größer, während SPSS und Excel nur zu festen Release-Terminen überarbeitet werden.
  • Die gute Erweiterbarkeit von R erlaubt das Programmieren von sehr leistungsfähigen Funktionspaketen, die weit über reine Erweiterungen der Rechenfunktionen hinausgehen. So können Sie etwa mit dem Paket Shiny Daten direkt in interaktive Webseiten hinein exportieren. Die Besucher:innen Ihrer Seite können dort beispielsweise in dynamisch aus ihren Daten befüllte Landkarten oder Tabellen klicken, um Abhängigkeiten zwischen Datenmengen sichtbar zu machen. Egal, ob Sie Erweiterungen wie Shiny für das interne Research in Ihrem Unternehmen nutzen möchten oder aber Kund:innen mit individualisierten Datenanalysen ansprechen wollen: R gibt Ihnen die Werkzeuge dazu an die Hand.
  • Eine große Community steht Ihnen bei Fragen rund um die Arbeit mit R hilfreich zur Seite. Auch knifflige Probleme werden so schnell gelöst. An Hochschulen und Forschungseinrichtungen finden Sie ebenfalls schnell Kontakt zu entsprechenden Nutzergruppen.

Viele bedeutende Software-Hersteller haben mittlerweile die Bedeutung von R erkannt und schaffen Schnittstellen zu ihren eigenen Produkten. Microsoft beispielsweise ermöglicht die die Ausführung von R-Code auf seiner Cloud-Computing Plattform Azure. Auch Oracle, SAP und IBM setzen bereits auf R als führende Sprache für Data Mining und Data Analysis.

 

YouTube / NooK

 

Erste Schritte mit R

Nach der Installation Ihres Programmpaketes für Windows, MacOS oder Linux können Sie R über die standardmäßig mitgelieferte Oberfläche RGui bedienen. Wesentlich komfortabler ist die Arbeit allerdings mit integrierten Entwicklungsumgebungen (IDEs) von Drittanbietern.


Sehr beliebt ist beispielsweise RStudio des gleichnamigen Software-Unternehmens. Die Community-Version der Software ist für Privatanwender:innen kostenfrei. RStudio kommt mit Funktionen wie integrierter Hilfe, Syntaxhervorhebung, Autovervollständigung oder automatischen Einrückungen. Für die Entwicklung und das Versenden eigener Packages liefert RStudio ebenfalls ein paar nützliche Funktionen. Aber auch die auf Java basierende Benutzeroberfläche JGR oder der Editor Visual Studio Code von Microsoft werden für die Arbeit mit R gerne genutzt.

Haben Sie die Software auf Ihrem Rechner installiert und sich mit der Oberfläche vertraut gemacht, sollten Sie sich für den Einstieg eines der vielen Tutorials auf YouTube oder anderen Plattformen anschauen. Sehr hilfreich sind beispielsweise die Videos von Björn Walther, die dieser auf seiner Homepage verlinkt hat. Wenn Sie R lieber in Buchform kennenlernen wollen, finden Sie entsprechende PDF-Dateien auf zahlreichen Hochschul-Seiten, etwa mit der „Einführung in R“ der TU Dresden oder mit den Kursunterlagen von Dr. Haiko Lüpsen von der Uni Köln (teilweise in Englisch). Zu den Standard-Werken für R-Nutzer:innen gehört außerdem das Handbuch R for Data Science (englisch) von Hadley Wickham und Garrett Grolemund. Auch dieses finden Sie kostenlos im Netz.

 

YouTube / r-statistik

 

Austausch mit anderen R-Nutzern

Rund um R hat sich eine äußerst aktive und gut vernetzte Community herausgebildet. An vielen Hochschulen und Forschungseinrichtungen finden Sie beispielsweise R-Nutzergruppen und Schulungsangebote. Zu den ersten Internet-Adressen für deutschsprachige Anwender gehören das R-Forum und das Deutsche R-Forum. Englischsprachige User:innen finden Hilfe bei Nabble sowie im Unterbereich für R des Entwicklerforums Stack Overflow.

Ein eigenes englischsprachiges Blog über das Thema Data Mining mit R hat Yanchang Zhao aufgesetzt. Die Seite R-Bloggers verknüpft weltweit Blogger:innen, die selber mit R arbeiten, regelmäßig News aus der Community berichten oder eigene Funktionen vorstellen möchten. Nutzen Sie also gerne das Wissen und die Unterstützung anderer R-Anwender:innen. Die Hilfsbereitschaft ist groß.

 

Verwenden auch Sie bereits R? Wie lange haben Sie für die Einarbeitung benötigt und was sind die besten Einstiegs-Tipps, die Sie anderen Nutzer:innen weitergeben möchten? Schreiben Sie uns Ihre Erfahrungen in die Kommentare unter diesem Beitrag.

 


Ihre Digitalisierungs-Berater:innen für den Mittelstand

Sie haben Fragen zur Digitalisierung? Unser Expert:innen-Team hilft Ihnen kostenlos
und unverbindlich im Chat (Mo.-Fr. 8-20 Uhr). Oder am Telefon unter 0800 5054512

Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Facebook Twitter WhatsApp LinkedIn Xing E-Mail