Die Begriffe „Data Science“ und „Big Data“ sind neben der „Cloud“ und „KI“ die wohl am häufigsten genutzten Buzzwords der letzten Jahre. Sie werden in Verbindung gebracht mit dem exzessiven Datensammelwahn großer Konzerne und werfen Datenschutzbedenken auf und bieten gleichzeitig unendliche Möglichkeiten zur Vorhersage und Analyse von Verhalten. Die Wichtigkeit von Big Data und den damit verbundenen Technologien erreicht mittlerweile immer mehr Unternehmen und macht so eine Verbindung zwischen Geschäftswelt und Wissenschaft nötig.
Inhaltsverzeichnis
1 Einführung
2 Der Beruf Data Scientist
2.1 Anforderungen
3 Analyse-Technologien
3.1 Text-Analyse
3.2 Web-Analyse
3.3 Netzwerk-Analyse
3.4 Mobile-Analytics
3.5 Big-Data-Analyse
4 Use Cases
4.1 Use Case: Markt Monitoring
4.2 Use Case: Customer-Relationship-Management
4.3 Use Case: Predictive Maintenance
5 Fazit
Zielsetzung und thematische Schwerpunkte
Die vorliegende Arbeit untersucht das Berufsbild des Data Scientist im Kontext von Big Data. Dabei wird analysiert, welche interdisziplinären Kompetenzen für diesen Beruf erforderlich sind, welche technologischen Analyseansätze in verschiedenen Anwendungsgebieten existieren und wie diese in der Praxis zur Wertschöpfung in Unternehmen beitragen.
- Anforderungen an die Qualifikation und Kompetenzen eines Data Scientist
- Methodische Klassifizierung von Analyse-Technologien (Text, Web, Netzwerk, Mobile)
- Bedeutung der Big-Data-Analyse für die Infrastruktur
- Praktische Anwendungsbeispiele in den Bereichen Markt-Monitoring und CRM
- Strategien zur Ausfallvorhersage in der Industrie (Predictive Maintenance)
Auszug aus dem Buch
2.1 Anforderungen
„Ein Data Scientist ist eine Berufsbezeichnung für einen Mitarbeiter oder einen Business-Intelligence (BI) -Berater, der Unternehmen bei der Analyse von Daten unterstützt beziehungsweise diese vollständig in Eigenregie ausführt. Analysiert werden dabei insbesondere Big Data - also große Mengen an strukturierten, unstrukturierten und semistrukturierten Daten, die ein Unternehmen produziert. Von der Analyse versprechen sich Geschäftsführer und Manager entscheidende Wettbewerbsvorteile.“ — Rouse
Da der Beruf des Data Scientists wie im Zitat von Rouse oben erwähnt viele Aspekte umfasst, werden unterschiedlichste Kompetenzen erwartet. So muss es Data Scientist umfassendes Wissen zu Technologien des Datensammlung, der Speicherung, Verarbeitung & Analyse sowie zur Auswertung besitzen. Er muss in der Lage sein, effiziente und passende Systeme mithilfe von entsprechenden Technologien zu designen. Dabei spielen u.a. die Wahl eines passenden Datenbanksystems, sowie die Nutzung von Lastverteilungstechnologien eine Rolle. So kann es bei „geringen“ Datenmengen genügen, eine MySQL-Datenbank zu nutzen, während zur Erfassung von großen Mengen von Daten in kurzer Zeit die Verwendung einer NoSQL-Datenbank wie MongoDB Sinn macht. In diesem Kontext sollte er sich außerdem über die Auswirkungen auf z.B. die Datenkonsistenz im Klaren sein. Zur Verarbeitung der Daten sollte der Data Sciencist in der Lage sein, Scripts u.a. zur Bereinigung und Homogenisierung von Datensätzen in einer Sprache wie R oder Python umzusetzen und schließlich auch in diesen Analysen durchzuführen.
Zusammenfassung der Kapitel
1 Einführung: Die Einleitung beleuchtet die Relevanz der Begriffe Data Science und Big Data im heutigen Unternehmenskontext und die wachsende Notwendigkeit einer Verbindung zwischen Wissenschaft und Geschäftswelt.
2 Der Beruf Data Scientist: Dieses Kapitel erörtert das enorme Wertschöpfungspotential der Datenanalyse und definiert das Anforderungsprofil sowie die notwendigen fachlichen Kompetenzen für Berufseinsteiger.
3 Analyse-Technologien: Hier werden verschiedene technische Analyseansätze, unterteilt in die Kategorien Text-, Web-, Netzwerk-, Mobile- und Big-Data-Analyse, vorgestellt und klassifiziert.
4 Use Cases: In diesem Kapitel werden drei konkrete Praxisbeispiele (Markt Monitoring, CRM und Predictive Maintenance) präsentiert, um die Anwendung der vorgestellten Technologien zu verdeutlichen.
5 Fazit: Das Fazit fasst das enorme Potenzial des Berufsbildes zusammen und betont die Notwendigkeit interdisziplinärer Fähigkeiten, um Big-Data-Technologien erfolgreich in der Praxis einzusetzen.
Schlüsselwörter
Data Science, Big Data, Data Scientist, Analyse-Technologien, Business Intelligence, Machine Learning, Predictive Maintenance, Customer-Relationship-Management, Datenanalyse, Statistik, Informatik, Visual Analytics, NoSQL, Open Data.
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit behandelt das interdisziplinäre Berufsbild des Data Scientist, dessen Rolle bei der Analyse großer Datenmengen (Big Data) und die technologischen Grundlagen, die für diesen Beruf unerlässlich sind.
Welche zentralen Themenfelder werden behandelt?
Die zentralen Themen umfassen die Anforderungen an das Qualifikationsprofil eines Data Scientist, die Klassifizierung moderner Analyse-Technologien und die praktische Anwendung dieser Methoden in der Industrie.
Was ist das primäre Ziel oder die Forschungsfrage der Arbeit?
Das Ziel ist es, aufzuzeigen, wie ein Data Scientist durch die Verknüpfung von Informatik, Mathematik und Wirtschaftswissenschaften sowie den Einsatz von Big-Data-Technologien Wettbewerbsvorteile für Unternehmen schaffen kann.
Welche wissenschaftlichen Methoden werden verwendet?
Die Arbeit nutzt eine Literaturanalyse sowie die Untersuchung von Fallbeispielen, um die theoretischen Anforderungen und die praktische Anwendung von Analyseverfahren zu validieren.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil gliedert sich in eine detaillierte Betrachtung der technologischen Analyse-Kategorien (von Text- bis Big-Data-Analyse) sowie in konkrete Use Cases aus der Praxis.
Welche Schlüsselwörter charakterisieren die Arbeit?
Die Arbeit wird maßgeblich durch Begriffe wie Data Science, Big Data, Machine Learning, Predictive Maintenance und Customer-Relationship-Management charakterisiert.
Warum ist die Wahl des Datenbanksystems für einen Data Scientist entscheidend?
Die Wahl ist entscheidend, da sie maßgeblich von der Datenmenge und -struktur abhängt; so sind für einfache Aufgaben relationale Datenbanken wie MySQL, für komplexe Big-Data-Szenarien hingegen NoSQL-Lösungen wie MongoDB effizienter.
Welche Rolle spielt die Visualisierung von Daten in diesem Berufsbild?
Die Visualisierung, oft im Kontext von „Visual Analytics“ betrachtet, ist essenziell, um komplexe Zusammenhänge für das Management verständlich aufzubereiten und fundierte Entscheidungen zu ermöglichen.
Wie trägt Predictive Maintenance zur Effizienz in der Luftfahrt bei?
Durch die statistische Auswertung von Flugdaten können Ausfälle von Bauteilen im Voraus erkannt werden, wodurch Lieferengpässe bei Ersatzteilen minimiert und Verspätungen vermieden werden.
- Quote paper
- Robert Bastei (Author), 2017, Data Science und Big Data. Eine Übersicht, Munich, GRIN Verlag, https://www.grin.com/document/412288