(Produkt)Datenmanagement

Analyse von Methoden zur Erhebung und Klassifizierung von unstrukturierten Daten an einem empirischen Beispiel


Diplomarbeit, 2013
150 Seiten, Note: 1,4

Leseprobe

Inhaltsverzeichnis

Kurzfassung

Abstract

Abbildungsverzeichnis

Tabellenverzeichnis

Abkürzungsverzeichnis

1 Einleitung
1.1 Problembeschreibung
1.2 Zielsetzung und Nicht-Ziele
1.3 Aufbau
1.4 Begrifflichkeiten
1.4.1 Daten
1.4.2 Data Mining
1.4.3 Datenmanagement
1.4.4 Information
1.4.5 Klassifizierung von Daten
1.4.6 Methoden zur Klassifizierung von Daten
1.4.7 Strukturierte Daten
1.4.8 Unstrukturierte Daten
1.5 Vorstudie
1.5.1 Wachsende Bedeutung von Information und Wissen
1.5.2 Daten– und Informationsflut
1.5.3 Wodurch entsteht die Daten– und Informationsflut
1.5.4 Welche Konsequenzen hat die Daten– und Informationsflut
1.5.5 Datenmanagement in Unternehmen
1.5.5.1 Konzepte und Anwendungen mit Datenmanagement
1.5.5.2 Klassifizierung von unstrukturierten Daten
1.5.5.3 Analyse von unstrukturierten Daten
1.5.5.4 Klassifikation von betrieblichen Daten
1.5.5.5 Speicherklassifizierungskonzepte
1.5.5.6 Generische Klassifizierungsansätze
1.5.6 Data Mining für Datenmustererkennung
1.5.6.1 Methoden des Data Mining
1.6 Rahmenbedingungen
1.6.1 Informationsverarbeitung in der Wirtschaft
1.6.2 Unternehmensbeschreibung
1.6.2.1 Allgemeines
1.6.2.2 Unternehmensorganisation
1.6.2.3 Historie
1.6.2.4 Produkte und Kunden
1.6.2.5 Unternehmensstruktur
1.6.2.6 Bedeutung der IT im Unternehmen
1.6.3 Ausgangssituation – Ist-Zustand
1.6.3.1 Einschränkungen
1.6.3.2 Arbeitsannahmen

2 Hauptteil
2.1 Problemlösungsweg
2.1.1 Vorgehensmodell
2.1.1.1 Voruntersuchung
2.1.1.2 Forschungsdesign
2.1.1.3 Studie
2.1.1.4 Ergebnis
2.1.2 Untersuchungsdesign
2.1.2.1 Verfahren qualitativer Analyse
2.1.2.2 Qualitative Inhaltsanalyse
2.1.3 Datenerhebung
2.1.3.1 Problemzentriertes Interview
2.1.3.2 Ablaufmodell
2.1.4 Datenauswertung, Datenanalyse
2.1.4.1 Schritte bei der Datenanalyse
2.1.4.2 Kategorien
2.2 Hypothesenbildung
2.2.1 Hypothese
2.2.1.1 Erfolgsfaktoren eines (Produkt)Datenmanagements
2.2.1.2 (Produkt)Datenmanagement als Erfolgsposition
2.2.2 Hypothese
2.2.2.1 Unstrukturierte Daten und organisationales Wissen
2.2.2.2 Unstrukturierte Daten und verstecktes Wissen
2.2.3 Hypothese
2.2.3.1 Daten – Information – Wissen als betriebliche Ressource
2.2.3.2 Information und Wissen als Produktionsfaktor
2.3 Fazit

3 Schlussbetrachtung
3.1 Ausblick und Handlungsempfehlungen

Literaturverzeichnis

Anhang A: Ergebnis der Vorstudie
Rahmenbedingungen der Erhebung
Auswertung 1
Auswertung 2
Auswertung 3
Fazit der Studie

Anhang B (I): Implementierung eines allgemeinen Data-Mining-Systems

Anhang B (II): Programm-Code
Laufwerke auslesen
Datei suchen
Allgemeine Klassenübersicht

Anhang C: Interviewleitfaden

Anhang D: Transkribiertes Interview

Anhang E: Interview in Form von Protokoll (I)

Interview in Form von Protokoll (II)

Interview in Form von Protokoll (III)

Interview in Form von Protokoll (IV)

Kurzfassung

Für ein Unternehmen stellt die effiziente Verfügbarkeit von relevanten (Produkt)Daten und allgemeinen Informationen ein wichtiges wirtschaftliches Gut dar. Das konkrete Problem ist, dass ein großer Teil dieser Daten in unstrukturierter Form vorliegt und diese unstrukturierten (Produkt)Daten stetig anwachsen.

Das Ziel der vorliegenden Diplomarbeit ist es, für AHT Cooling Systems GmbH Methoden zur Erhebung und Klassifizierung von unstrukturierten (Produkt)Daten zu erheben. Das in Rottenmann ansässige Unternehmen hat das umfassende Problem, dass viele der (Produkt)Daten in unstrukturierter Form vorliegen. Des Weiteren sind die (Produkt)Daten in den unterschiedlichsten Datenformaten abgespeichert und zudem sind diese (Produkt)Daten nicht zentral auf einem System, sondern verteilt auf den verschiedensten Netzlaufwerken, abgelegt.

In einer Vorstudie, in der IT Manager von 25 Unternehmen befragt werden, wird grundlegend die derzeitige IT Situation dieser Unternehmen aufgezeigt. Interessanterweise verfügen sieben von den 25 befragten Unternehmen über ein Datenmanagement-System, um die Menge von unstrukturierten Daten zu beherrschen.

In der AHT Cooling Systems GmbH wird für die vorliegende Arbeit eine entsprechende Datenerhebung in Anlehnung an Mayring durchgeführt und mittels qualitativer Inhaltsanalyse bewertet. Dabei werden Personen in den Abteilungen Einkauf, Lager, Marketing, Produktion und Vertrieb in Form eines strukturierten Interviews befragt. Nach der Analyse und Auswertung – welche deutlich aufzeigt, dass (Produkt)Daten, (Produkt)Information und (Produkt)Wissen wichtige betriebliche und operative Ressourcen darstellen – wird eine Literaturrecherche zur Bestätigung der Ergebnisse nachgereiht. Basierend auf den Erkenntnissen bilden mögliche Lösungsansätze und Empfehlungen den Abschluss der Diplomarbeit.

Abstract

For an enterprise, the efficient availability of relevant product(data) and general (product) information represents an important economic resource. The actual problem is that very large portions of this data are unstructured and the amount of this data grows steadily.

For AHT Cooling Systems GmbH, the goal of the present diploma thesis is to determine methods for the survey and classification of unstructured data. In Rottenmann/Styria located, this enterprise faces the serious problem that too many product(data) are unstructured. Furthermore, the (product)data are stored in various data formats and these (product)data are not centrally stored on one server system. Instead, these data are stored on various network drives.

In a pre-study, IT managers of 25 companies will be interviewed to highlight the current IT situation of their companies. Interestingly, seven out of 25 companies have a data management system in order to structure their data.

At AHT Cooling Systems GmbH the proper data collection based on Mayring is carried out through a qualitative content analysis. For that purpose, persons from the procurement, storage, marketing, production and sales department are interviewed. The analyses and evaluation show that (product)data, (product)information and (product)know-how are important economic and operational resources. The attached literature research confirms the study results. Based on that findings, possible solutions and recommendations are presented.

Abbildungsverzeichnis

Abbildung 1-1: Begriffshierarchie Zeichen, Daten, Information und Wissen

Abbildung 1-2: Schematische Darstellung der Treiber des Data Mining

Abbildung 1-3: Einordnung des Informationsbegriffes

Abbildung 1-4: Beschäftigung im Informationsund Produktionssektor in den USA

Abbildung 1-5: Entwicklung der Beschäftigung in Deutschland

Abbildung 1-6: Prognostizierter Anstieg von Daten und Informationen in digitaler Form

Abbildung 1-7: Schematische Darstellung einer Clusterstruktur

Abbildung 1-8: Schema eines Entscheidungsbaumes

Abbildung 1-9: Organigramm der AHT Cooling Systems GmbH

Abbildung 1-10: Schematische Ansicht der IT-Landschaft in der AHT

Abbildung 2-1: Schematische Darstellung des Vorgehensmodells

Abbildung 2-2: Ablaufmodell des problemzentrierten Interview

Abbildung 2-3: Prozesse bei der Datenanalyse in Anlehnung an Miles & Huberman

Abbildung 2-4: Hypothesen

Abbildung 2-5: Produktionsfaktoren nach Gutenberg

Abbildung 2-6: Wissenstreppe nach North

Abbildung 2-7: Transformationsprozess von Daten zum Wissen

Abbildung A-1: Auswertung der Fragestellung über das Vorhandsein eines DMS

Abbildung A-2: Auswertung Konsequenz aus der Datenund Informationsflut

Abbildung A-3: Auswertung von der Art des DM-Systems

Abbildung B I-1: Komponenten eines Data-Mining-Systems

Tabellenverzeichnis

Tabelle 1-1: Übersicht über die Funktionen im Datenmanagement

Tabelle 1-2: Beispiel für eine Datenklassifizierung

Tabelle 1-3: Beispiel für eine Datenbanktabelle

Tabelle 1-4: Wichtige Datentypen

Tabelle 1-5: Einfache Wahrheitstabelle für das Assoziationsverfahren

Tabelle 1-6: Übersicht der wichtigsten Dateiformate

Tabelle 2-1: Kategorien

Tabelle A-1: Auswertung der Fragestellung über das Vorhandensein eines DMS

Tabelle A-2: Auswertung Konsequenz aus der Datenund Informationsflut

Tabelle A-3: Auswertung von der Art des DM-Systems

Tabelle B I-1: Pseudo-Code der Data-Mining-Applikation

Tabelle B II-1: Listing 1 – Laufwerke auslesen

Tabelle B II-2: Listing 2 – Datei suchen

Tabelle B II-3: Listing 3 – Allgemeine Klassenübersicht

Abkiirzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

1 Einleitung

1.1 Problembeschreibung

Die Menge der Daten auf den Speichersystemen der Unternehmen nimmt aufgrund des technischen Fortschritts ständig zu.1 Jährlich, täglich, stündlich, ja sogar praktisch in jeder Minute werden die unterschiedlichsten Daten und Dokumente im Laufe der Geschäftsprozesse erzeugt. Das ist auch der Grund, warum der Umfang der unstrukturierten Daten in der AHT Cooling Systems GmbH rasant zunimmt und durch eine Vielzahl von Datenmultiplikatoren auch zusätzlich vorangetrieben wird. Der Gesetzgeber, Produktrichtlinien, Zertifizierungen, Patente oder aber auch die klassischen Bereiche in einem Unternehmen, wie z.B. Marketing, Forschung und Entwicklung usw., tragen ebenfalls erheblich zur weiteren Datenvermehrung bei.2 In der heutigen Zeit, in der schnell wachsende und globalisierende Märkte den Alltag der Unternehmen beherrschen, wächst der Bedarf an einer immer schnelleren Verfügbarkeit von Daten und Information. Natürlich ist in diesem Zusammenhang auch die Analyse der Daten ein sehr wichtiger Faktor geworden.3 Damit die Unternehmen mit der immer größer werdenden Datenflut flexibel arbeiten können, ist es absolut notwendig geworden die unstrukturierten Daten entsprechend erheben und klassifizieren zu können.4

In der AHT Cooling Systems GmbH liegt schon seit etwa fünf Jahren das Problem vor, dass eine große Vielfalt von unstrukturierten Daten vorhanden ist. Diese unstrukturierten Daten enthalten unter anderem auch produktspezifische Daten. Die produktspezifischen Daten, welche vor allem bei den Prozessen während des Tagesgeschäftes anfallen, liegen in den unterschiedlichsten Datenformaten vor und sie werden vor allem auch nicht zentral abgelegt. Durch den vorliegenden Sachverhalt der (verteilten) unstrukturierten Daten ist es für die Mit- arbeiter5, vor allem den externen Mitarbeitern im Bereich des Vertriebs, welche teilweise einen Gesamtüberblick über produktspezifische Daten abrufen wollen bzw. für ihr Tagesgeschäft unmittelbar benötigen, entweder sehr schwer die benötigten Daten auszulesen oder nur bedingt möglich, diese dann auch zielgerichtet zu verwenden.

1.2 Zielsetzung und Nicht-Ziele

In der vorliegenden Arbeit soll ein grundsätzlicher Überblick über Methoden zur Erhebung und Klassifizierung von unstrukturierten (Produkt)Daten gegeben und die grundsätzlichen Ziele der Methoden sollen soweit betrachtet werden, dass am Ende eine Handlungsempfehlung für das Bearbeiten der unstrukturierten (Produkt)Daten gegeben werden kann.

Der Beitrag soll durch eine empirische und wissenschaftliche Untersuchung in der AHT Cooling Systems GmbH die möglichen Erhebungsund Klassifizierungsmethoden zur Behandlung von unstrukturierten (Produkt)Daten liefern. Es wird eine empirische Studie aufgestellt, welche die wichtigsten Fakten der vorliegenden Problematik aufzeigen und anschließend sollen diese Ergebnisse mit der Literatur verglichen und ausgewertet werden.

Das Ziel der Diplomarbeit soll eine homogene Mischung aus dem empirischen Ergebnis und der Literatur zu den Themen Datenmanagement und unstrukturierte Daten sein. Im Zuge dessen soll die folgende Hauptforschungsfrage beantwortet werden:

- Forschungsfrage: Was macht (Produkt)Datenmanagement zu einer Erfolgsposition im Unternehmen?

Um die Hauptforschungsfrage mit einer ausreichenden Menge an Daten und Fakten beantworten zu können, werden zusätzlich die nachfolgenden Fragestellungen behandelt und im Zuge der Arbeit beantwortet:

- Was haben die unstrukturierten (Produkt)Daten mit Information bzw. Wissen zu tun?
- Wie tragen unstrukturierte (Produkt)Daten zur organisationalen Wissensbasis bei?

Aus der Hauptforschungsfrage und der daraus abgeleiteten Fragestellungen, drängt sich vorab aber auch eine weitere sehr interessante und nach wie vor auch aktuelle Problematik auf:

- Wie wirkt sich die Omnipräsenz von Daten und Informationen in Unternehmen aus und welche Problematik ergibt sich daraus?

Diese Problematik wird im Zuge einer Voruntersuchung bearbeitet bzw. mit Hilfe einer eigens dafür durchgeführten Studie untersucht.

Nicht-Ziel dieser Diplomarbeit sollen die nachfolgenden Punkte sein:

- Es sollen keine strukturierten (Produkt)Daten untersucht werden.
- Die vorliegende bzw. auch verwendete (Produkt)Datenqualität soll ignoriert werden.
- Die Prozesse selbst, welche im Zusammenhang zu den unstrukturierten (Produkt) Daten stehen, sollen nicht untersucht werden.

1.3 Aufbau

In dieser Diplomarbeit sollen schwerpunktmäßig Methoden zur Erhebung und Strukturierung von unstrukturierten (Produkt)Daten herausgearbeitet werden. Um dieses Ziel erreichen zu können, sollen unter anderem auch die vorher aufgeführten Forschungsfragen beantwortet werden.

Zunächst werden im Kapitel 1 (Einleitung) das vorliegende Problem in der AHT Cooling Systems GmbH Rottenmann beschrieben, die Zielsetzung sowie die Nicht-Ziele festgehalten und es wird im Zuge einer Vorstudie (Kapitel 1.5) ein grober Einblick über die Problematik in der heutigen Wirtschaft dargestellt. Außerdem wird in diesem Teil eine selbstständig durchgeführte Studie – in der 25 Unternehmen auf das Vorhandensein eines DM-Systems befragt wurden – kurz beschrieben (Kapitel 1.5.5). Das Ergebnis bzw. die Auswertung der Studie kann im Anhang nachgeschlagen werden. Es werden die wichtigsten Begrifflichkeiten (Kapitel 1.4) der Arbeit – es werden die Schwerpunkte zur Thematik Daten, Datenmanagement, Klassifizierung von Daten usw. ausgeführt – herausgearbeitet und die Rahmenbedingungen (Kapitel 1.6), in der die Unternehmensbeschreibung und die Ausgangssituation festgehalten werden, vorgestellt.

Kapitel 2 (Hauptteil) beinhaltet den Problemlösungsweg, das Ergebnis und die daraus gewonnenen Erkenntnisse. Der Problemlösungsweg (Kapitel 2-1) beschreibt – in Anlehnung an Mayring – wie an die vorliegende Thematik herangegangen wurde. Im Teil der Hypothesenbildung (Kapitel 2.2) werden die Forschungsfragen behandelt bzw. die angesammelten Daten, welche aus den Interviews und der Literaturrecherche zusammengetragen wurden, ausgewertet, um im abschließenden Teil der Arbeit (Kapitel 3 Schlussbetrachtung) die aus der Datenauswertung entsprechenden Erkenntnisse aufzuzeigen.

Im Kapitel 3 (Schlussbetrachtung) werden mögliche Ansätze bzw. Methoden, unter Zuhilfenahme einer sorgfältig ausgewählten Literatur, für die Lösung der Problemstellung und auch mögliche weitere Entwicklungen aufgezeigt. Am Ende der Arbeit (im Anhang B I und B II) wird ein schematisch dargestellter Such-Algorithmus in Java abgebildet.

1.4 Begrifflichkeiten

In diesem Kapitel werden die grundlegenden Begriffe zu der vorliegenden Thematik definiert und gleichzeitig auch gegeneinander abgegrenzt. Die Themengebiete, aus denen die nachfolgenden Begriffe stammen, umfassen Informationsmanagement und allgemein die Wirtschaftsinformatik. Das Ziel dieses Kapitels soll es sein, dass ein allgemeines Verständnis der definierten Begriffe vermittelt wird. Idealerweise kann das vermittelte Verständnis so weit reichen, dass es über den Kontext dieser Arbeit hinaus geht.

1.4.1 Daten

„Daten sind Sammlungen von unteilbaren, individuellen Elementen. Man unterscheidet Daten nach ihrer Struktur und ihrem Bearbeitungsgrad.“ 6 In der Umgangssprache sind lt. Proebster Daten Gegebenheiten, Tatsachen und Ereignisse. In der Fachsprache allerdings sind Daten fortlaufende Funktionen, welche Informationen darstellen.7 Durch genau definierte Ordnungsregeln wie beispielsweise einer festen Syntax werden aus einer Ansammlung von Zeichen isolierte Daten. Diese bestehen aus einer beinahe unendlichen Anzahl von verfügbaren Fakten, Statistiken, Bildern usw.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1-1: Begriffshierarchie Zeichen, Daten, Information und Wissen8

Wenn die zeichenorientierten Daten etwas genauer betrachtet werden, dann muss man zwangsläufig auch feststellen, dass diese in zwei wichtige Gruppen unterteilt werden: in strukturierte Daten (Punkt 1.4.7) und unstrukturierte Daten (Punkt 1.4.8).9 Daten werden in der Wirtschaftsinformatik als wirtschaftliches Gut betrachtet. Das kommt daher, dass Daten der Rohstoff für die Produktion von Information sind und sie können über einen sehr langen Zeitraum auf einem Datenträger, in einem Dokument usw. aufbewahrt werden, wobei sie nicht an Wert verlieren.10 In der heutigen Zeit fehlt es in den Unternehmen kaum an Daten. Vielmehr kann behauptet werden, dass eher zu viel an Daten vorhanden sind. Das Problem hierbei besteht darin, dass in den Unternehmen das Wissen fehlt, wie man von den vorhandenen Daten zu Informationen kommt.11

1.4.2 Data Mining

Der Begriff des Data Mining hat in den letzten Jahren immer mehr an Bedeutung gewonnen. Der Fokus des Data Mining liegt in der Analyse von großen Datenmengen (in der Literatur wird auch von Big Data gesprochen). Das Ziel des Data Mining ist es, Information und Wissen aus den Daten zu extrahieren. Unter Information bzw. Wissen werden interessante Muster verstanden, welche allgemein gültig, nicht trivial, neu, nützlich und verständlich sind.12 Mit- hilfe der Data Mining-Technik ist es möglich geworden, dass sehr große Datenmengen durchsucht werden, um verborgenen und somit in den häufigsten Fällen gleichzeitig auch wertvolle Muster und Strukturen zu identifizieren. Dieser Untersuchungsmethodik liegt so gut wie immer ein gut strukturiertes Vorgehensmodell zugrunde. Die daraus resultierenden Ergebnisse haben sich als äußerst vielfältig erwiesen. Das Data Mining als Forschungsdisziplin entstand aus der Vermutung heraus, dass in den Daten der Unternehmen viele Informationen, welche z.T. auch sehr wertvoll sein können, versteckt sind und mit den herkömmlichen zur Verfügung stehenden Mitteln nicht extrahiert werden konnten. Aus diesem Grund wird von Seiten der Experten das Data Mining sehr häufig auch als ein Teilprozess des Knowledge Discovery in Databases interpretiert.13

Die Anwendungsbereiche des Data Mining umfassen ganz allgemein betrachtet die folgenden vier Einsatzgebiete:

- die Assoziation,
- die Klassifizierung,
- die Segmentierung und
- die Vorhersage.

Diese vier Anwendungsgebiete sollen helfen die teilweise fast übermächtigen Datenmengen zu überblicken und sie in weiterer Folge auch auszuwerten.14 Das Data Mining-Konzept steht schon seit Jahren im Blickpunkt der praktischen Anwendungen und der wissenschaftlichen Forschungen. Die Treiber für die Entwicklungen des Data Mining sind so wie die Anwendungsmöglichkeiten selbst auch sehr vielseitig. Aber einer der wichtigsten Treiber war wohl der15 „Bedarf nach weitgehend automatischer Informationsund Wissensgenerierung auf Basis der angesammelten Daten“ 16 in den Unternehmen. Nachfolgend werden in der Abbildung 1-2 schematisch ein paar weitere wichtige Treiber des Data Mining-Konzepts angeführt.17

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1-2: Schematische Darstellung der Treiber des Data Mining18

1.4.3 Datenmanagement

Als Wissensbasis eines Unternehmens kann z. T. eine gut entworfene und auch gepflegte Datenbasis sein. Einfache Beispiele für so ein angesprochenes betriebliches Wissen können Patente, Pläne, technische Zeichnungen oder aber auch geheime Produktionsverfahren sein. Bei den aufgeführten Beispielen handelt es sich um geheime Daten, welche natürlich auch besonders geschützt werden müssen. Aber es muss selbstverständlich festgestellt werden, dass diese Daten nur ein Teil des organisationalen Wissens umfassen.

In Wirklichkeit umfasst die organisationale Wissensbasis erheblich mehr an Daten.19 Daher sehen es die Experten als gerechtfertigt an, dass die Daten genauso wie die Informationen eine Unternehmensressource darstellen. Eine Ressource, welche dementsprechend auch gleich wie die klassischen Produktionsmittel geplant, beschafft, verwaltet und genutzt werden sollte.20 „Das Datenmanagement betrifft alle betrieblichen und technischen Funktionen der Datenmodellierung 21, der Datenadministration, der Datentechnik und des datenbezogenen Benutzerservices.“ 22

Eine der großen Aufgaben des Datenmanagements ist es alle Daten23, welche im Unternehmen verwendet werden, zu planen, zu überwachen und zu steuern. Dies soll so ablaufen, dass die notwendigen Daten für die Informationsversorgung der Aufgabenträger jederzeit in der richtigen Menge zur richtigen Zeit am richtigen Ort verfügbar sind.24 Die klassischen Funktionen des Datenmanagements (siehe Tabelle 1-1) sind nicht alle zur gleichen Zeit entwickelt worden, sondern sie haben sich in einem fortschreitenden Entwicklungsprozess über die letzten 20 Jahre herausgebildet.25

Die eigentlichen Kernaufgaben des Datenmanagements sind, unabhängig von einer technologischen Entwicklung, die nachfolgenden Punkte:

- die Entwicklung von Datenmodellen,
- die Implementierung von Datenmodellen,
- die Organisation der Datenbeschaffung und der Datennutzung,
- die Wartung und die Pflege des Datensystems und
- die Überwachung der Datenqualität.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 1-1: Übersicht über die Funktionen im Datenmanagement26

In der heutigen Zeit haben sich die Kernaufgaben des Datenmanagements, vor allem durch die Verfügbarkeit neuer technischer Einrichtungen und durch den sehr rasch wachsenden Datenbestand ausgelöst, allerdings erheblich ausgeweitet.27 Die mittlerweile sehr rasch wachsenden Datenbestände beeinflussen ziemlich stark die Aufrechterhaltung des operativen Betriebes und damit einhergehend auch die Informationsextraktion aus den permanent wach- senden Datenmengen. Durch diese neuen Umstände mussten die traditionellen Aufgaben des Datenmanagements dementsprechend erweitert werden. Die neuen Aufgaben an das Datenmanagement werden in zwei Kategorien gegliedert:

- die datenbezogenen Aufgaben und
-die technologiebezogenen Aufgaben.

Die datenbezogenen Aufgaben enthalten folgende Punkte:

- Datawarehousing,
- Data Mining,
- Digital Asset Management,
- Digital Rights Management,
- Information Lifecycle Management und
- Web Mining.

Die technologischen Aufgaben enthalten diese Punkte:

- Content Management,
- Dokumentenmanagement,
- Speichertechnologien und
- das Wissensmanagement.

Durch diese neue Entwicklung im Bereich des Datenmanagements ist es so gut wie unmöglich geworden, dass ein Informationsmanager alle fachlichen Aufgaben alleine übernehmen kann. Aus diesem Grund wurden neue fachliche Aufgabengebiete geschaffen, welche aus Spezialisten in den Bereichen Content-, Wissensoder Dokumentenmanagement gebildet werden.28

1.4.4 Information

Dem Begriff Information kommt in der Umgangssprache die Bedeutung Auskunft, Aufklärung oder Belehrung zu. Im Fachbereich der Wirtschaftsinformatik bedeutet der Begriff Information „ zweckorientiertes Wissen“ 29, welches dazu dient, eine bestimmte Handlung vorzubereiten oder zu planen.30 Experten bezeichnen Information als eine Nachricht, welche ein Akteur oder ein Objekt verbreitet und die ein Empfänger als neu und auch als nutzbar ansieht. Der amerikanische Experte für Kommunikationstheorie und Lerntheorie lieferte diesbezüglich folgendes Zitat:31 „ What we mean by information – the elementary unit of information – is a difference which makes a difference.“ 32

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1-3: Einordnung des Informationsbegriffes33

Rein wissenschaftlich betrachtet gibt es keine allgemein anerkannte Definition für den Informationsbegriff. Wenn der Begriff Information definiert werden soll, dann wird sehr häufig die aus der Betriebswirtschaftslehre stammende Definition lt. Wittmann verwendet. Diese Definition ist auf eine Zweckorientierung ausgerichtet und wird mit „den Zwecken Entscheiden oder Handeln konkretisiert.“ 34 Allerdings sollte dabei nicht unerwähnt bleiben, dass diese Definition etwas problematisch anzusehen ist, da der Begriff Information durch Wissen erklärt wird. Da es, wie schon erwähnt, keine allgemeine Definition für den Informationsbegriff gibt, haben sich im Laufe der Zeit in jeder wissenschaftlichen Disziplin eigene Definitionen her- ausgebildet. Eines haben allerdings alle Disziplinen gemeinsam: die Einordnung des Informationsbegriffs wie dieser in der Abbildung 1-3 sinnbildlich veranschaulicht wird.35 „ Daten werden zu Information, wenn ihnen eine Bedeutung (Semantik) zugeordnet wird.“ 36

1.4.5 Klassifizierung von Daten

Der Prozess der Klassifizierung assoziiert Dateien mit Metadaten und/oder Inhalten37 wie bspw. Name des Autors, Erstellungsdatum, Änderungsdatum, Inhalt, einer (selbst erstellten) Kategorie usw. Durch eine dem Benutzer bzw. den Benutzern angepasste Klassifizierung ist es möglich, dass in einer Datenstruktur, welche weder hierarchisch aufgebaut noch in irgendeiner Form strukturiert sein muss, nach den verschiedenen angefertigten Parametern gesucht werden kann, um dann die entsprechenden Informationen aus den durchsuchten Daten zu extrahieren. Erst eine, an ein System auch angepasste, Klassifizierung der Daten gliedert dann alle Daten im Unternehmen in Kategorien mit den bestimmten Attributen.

Eine Datenklassifizierung erfolgt normalerweise so, dass die entsprechenden Daten38in eine dreibis fünfstufige Gruppe39 eingeordnet werden. Natürlich ist die Form der Einordnung von der Art des Unternehmens, der Unternehmensphilosophie, der IT-Landschaft in einem Unternehmen und auch von den Daten bzw. der Datenstruktur in einem Unternehmen abhängig.40 Die Tabelle 1-2 stellt eine Möglichkeit für die Klassifizierung von Daten in einem Un- ternehmen dar.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 1-2: Beispiel für eine Datenklassifizierung41

1.4.6 Methoden zur Klassifizierung von Daten

Methoden zur Klassifikation von Daten ermöglichen es funktionale Zusammenhänge in einer vorliegenden Datenbasis zu ermitteln. Die Voraussetzung für eine erfolgreiche Anwendung einer Klassifikationsmethode42ist das Vorliegen eines kategorialen Zielattributs 43 “, dass im Kontext eine zuvor definierte Zielgröße repräsentieren muss. Die Zielgröße ist der bestimmende Faktor wie44der funktionale Zusammenhang identifiziert werden soll.45 Eine der wichtigsten Techniken (die im Hauptteil dieser Arbeit betrachtet wird), welche als Methode zur Klassifizierung von Daten zur Anwendung kommt, ist das Modell des Data Mining.

1.4.7 Strukturierte Daten

Strukturierte Daten können Beziehungen zwischen Daten formal abbilden und dadurch wird es auch möglich, dass diese unmittelbar in eine Datenstruktur überführt werden können. Das beste Beispiel für den Inhalt von strukturierten Daten ist eine traditionelle Datenbank. In einer Datenbank sind alle Datensätze gleich aufgebaut und sie folgen alle dem allseits bekannten Datenbank-Schema. Die grundsätzliche Eigenschaft einer (traditionellen) Datenbank ist es, dass das Datenbanksystem nicht nur alleine die Daten enthält, sondern auch die vollständige Beschreibung dazu. Die angesprochene Datenbeschreibung enthält folgende Punkte (die ge- speicherten Punkte werden als Metadaten46 bezeichnet):

- eine Angabe über den Umfang,
- die Struktur,
- die Art der Daten,
- das Datenformat

und die Angabe über die Beziehung der Daten untereinander.47

Alle in einem Unternehmen erfassten Daten müssen dauerhaft in einem Datenspeicher abgelegt werden, um diese dann auch langfristig nutzen zu können. Unter dem Datenspeicher wird nicht zwingend ein relationales Datenbanksystem angesprochen, sondern eine Software, mit deren Hilfe das Speichern von Daten auf einem Speichermedium, wie bspw. einem Magnetband oder Festplatte, ermöglicht wird.48

Normalerweise sind alle betrieblichen Daten, welche für ein Unternehmen als relevant betrachtet werden, strukturierte Daten und deshalb können diese recht einfach in einer Datenbank in Tabellenform gespeichert werden.49 Nachfolgend wird in der Tabelle 1-3 (1. Spalte = Identifikationsschlüssel, 2. Spalte = Kundennummer, 3. Spalte = Name – in dem angeführten Beispiel wird nur der Nachname verwendet, 4. Spalte = Menge) ein ganz einfaches Beispiel dargestellt, wie eine Tabelle in einer Datenbank beschrieben sein könnte.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 1-3: Beispiel für eine Datenbanktabelle50

Die relevanten betrieblichen Daten, welche in den Datenbanken gespeichert werden, bestehen aus sogenannten Datentypen. In der folgenden Tabelle 1-4 werden die wichtigsten Datentypen dargestellt.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 1-4: Wichtige Datentypen51

1.4.8 Unstrukturierte Daten

„Im Gegensatz zu den strukturierten Daten fehlen bei unstrukturierten Daten die beschreibenden Mittel, um Beziehungen zwischen Daten auszudrücken.“ 52 Da bei den unstrukturierten Daten eine entsprechende Struktur nicht vorhanden ist, können die Daten auch nur nach deren in sich bergenden Informationen miteinander in einen Bezug gesetzt werden.53 Eine Informationsgewinnung aus den unstrukturierten Daten ist, eben wegen der fehlenden Struktur, sehr stark von einer Interpretation durch einen Informationsempfänger abhängig. Allerdings muss in diesem Zusammenhang erwähnt werden, dass dies nicht heißt,54 „dass unstrukturierte Daten nicht auch strukturierte Informationen enthalten können.“ 55 Jedoch sind diese strukturierten Informationen i.d.R. nicht unmittelbar und exakt zu erkennen. Typische Beispiele für unstrukturierte Daten sind Bilder, Dokumente, E-Mails usw.56

Die Handhabung der unstrukturierten Daten ist nach wie vor eines der größten unaufgeklärten Probleme im Bereich der Speichertechnologien. Eine Aussage von Thome und Sollbach lautet, dass vermutlich etwa 80 Prozent der abgespeicherten Daten in einem Unternehmen unstrukturiert sind. Die Strukturierung, Klassifizierung und Bereitstellung von unstrukturierten Daten ist wohl eine der größten Herausforderungen in der heutigen Zeit.57 Die Herausforderung an die modernen Informationssysteme ist es, eine effiziente Verwaltung der betrieblichen Informationen zu schaffen. Dies soll u.a. mit Hilfe der als Knowledge Management (ugs. als Wissensmanagement bekannt) bezeichneten Disziplin der Informationstechnologie er- reicht werden. Eine Verarbeitung bzw. Aufbereitung von unstrukturierten Daten ist hierbei eine der zentralen Aufgaben des Knowledge Managements. Dieses System soll eine Unterstützung darstellen, um aus den unstrukturierten Daten einen aufgabenbezogenen Wissenserwerb zu erreichen.58

1.5 Vorstudie

Die Omnipräsenz von Daten und Informationen lässt das gesamte Datenvolumen in Unternehmen unaufhaltsam anwachsen und beeinflusst dadurch negativ das Auffinden und Verarbeiten von Daten. Außerdem kann festgestellt werden, dass die Suche nach Datenund Informationen heutzutage sehr viel an wertvoller Ressource – in Form von Arbeitszeit – in Anspruch nimmt.

1.5.1 Wachsende Bedeutung von Information und Wissen

Die Wirtschaft und Gesellschaft von Heute macht einen Umbruch durch. Das wirtschaftliche und gesellschaftliche Leben, sowie der Mensch selbst auch, bewegt sich weg von einer Industriegesellschaft hin zu einer Informationsund Wissensgesellschaft.59 Die Hypothese von der Wandlung der Volkswirtschaften von einer Industriegesellschaft zu einer Informationsgesellschaft wird von sehr vielen Vertretern in der Wirtschaftsinformatik schon seit einigen Jahren mit großer Vehemenz vertreten.60 Einer Studie über die Entwicklung der deutschen Volkswirtschaft zufolge verzeichnete das Wachstum der Beschäftigung im Bereich der IT vor allem in den letzten Jahrzehnten einen überproportionalen Anstieg.61 Um die These vom Wandel der Volkswirtschaften untermalen zu können, wird in der vorliegenden Arbeit auf zwei Studien, eine welche Jonscher 62 bereits 1988 und eine welche Bullinger et al. 63 Mitte der 1990er Jahre durchgeführt hat, verwiesen. Beide Studien setzten sich mit der Entwicklung der Beschäftigung in den wichtigsten Erwerbssektoren auseinander, wobei natürlich ein besonderes Augenmerk auf die Entwicklung im Bereich des Informationssektors gerichtet war. Der Informationssektor besteht, lt. einer Forschungsgruppe der OECD64, aus Tätigkeiten von Kategorien, die dem Informationscharakter, also der Erzeugung, Verarbeitung und Verteilung von Informationen, zugeordnet werden können. Die angesprochenen Erwerbssektoren werden in den Mitgliedsstaaten der OECD in die folgenden vier Sektoren eingeteilt:

- Primärer Sektor – Landwirtschaft, usw.
- Sekundärer Sektor – Industrie (Produktionsunternehmen, usw.)
- Tertiärer Sektor – Dienstleistungen
- Quartärer Sektor – Information65

Die erste Studie, die in der Abbildung 1-4 dargestellt wird, welche als Basis für die Zugrundelegung der Aussage vom Wandel der Volkswirtschaft herangezogen wird, wurde in den USA durchgeführt und stützte sich bei der Untersuchung auf nur zwei Kategorien. Jonscher stellte in seiner Untersuchung nur die Erwerbsbevölkerung in den Kategorien des Produktionsund Informationssektors gegenüber, da er der Ansicht war, dass diese beiden Sektoren die größte Aussagekraft über den Strukturwandel haben. Die Studie stellt die Beschäftigungs- entwicklung in den USA seit 1900 bis zum Jahr 1980 dar und belegt die von Jonscher 66 auf- gestellte Hypothese vom Wandel zu einer Informationsgesellschaft. Das Diagramm in der Abbildung 1-4 zeigt auf recht anschauliche Art und Weise, dass sich ein immer geringerer Anteil der Erwerbsbevölkerung in den Vereinigten Staaten im Laufe der Zeit mit der Produktion und Manipulation von Gütern befasste, während allerdings der Beschäftigungsanteil im Informationssektor stetig angestiegen ist.67

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1-4: Beschäftigung im Informationsund Produktionssektor in den USA68

Bei der zweiten Studie, welche wie eingangs schon erwähnt Mitte der 1990er Jahre von Bullinger durchgeführt wurde, handelt es sich um eine Untersuchung, die die Hypothese des Strukturwandels noch etwas mehr bekräftigt. Auch bei dieser Studie wurde, um eine Vergleichbarkeit der Ergebnisse gewährleisten zu können, die Entwicklung der Beschäftigung untersucht. Wobei diese Studie in der Bundesrepublik Deutschland durchgeführt wurde – was die Vergleichbarkeit nicht mindern sollte, da die BRD so wie die USA auch ein Mitglied der OECD ist und daher auch praktisch die gleichen Voraussetzungen erfüllt – und es wurden sogar, im Gegensatz zu der Studie von Jonscher, alle vier Sektoren in die Untersuchung miteinbezogen. Außerdem wurde die Studie nicht nur zu einem späteren Zeitpunkt durchgeführt, sondern es wurde auch der Untersuchungszeitraum noch weiter ausgedehnt. Für diese Arbeit wurden sogar die letzten 150 Jahre betrachtet, d.h. etwa zu der Zeit als die Industrielle Revolution eingesetzt hat, um die Hypothese von der Wandlung der Volkswirtschaften zu bekräftigen. Die Abbildung 1-5 stellt auf eine sehr anschauliche Art und Weise grafisch die Entwicklung der Beschäftigung in Deutschland dar. Aus der Abbildung 1-569 „ scheinen ein- deutige Tendenzen ableitbar zu sein.“ 70 Bei der Betrachtung der Studie fällt auf, dass, wie bei der Untersuchung von Jonscher auch, die Informationstechnologie ein sehr starkes Wachstum durchmacht. Sehr deutlich heraus zu lesen ist, dass der einst größte bzw. gleichzeitig auch wichtigste Bereich, der Sektor der Landwirtschaft, extrem stark abgenommen hat. Die Verschiebung in den einzelnen Sektoren zeigt recht deutlich, wie sich die Wirtschaft im Laufe der Zeit entwickelt hat. Sehr deutlich ist die Tendenz erkennbar, die ganz klar aufzeigt, dass der Informationssektor – vor allem seit der Erfindung des Internets, aber zu dieser Thematik wird dann später noch näher darauf eingegangen – nicht nur eine stetig ansteigende Entwicklung bei der Beschäftigung aufzeigt, sondern auch gesamtwirtschaftlich eine tragende Rolle eingenommen hat.71

Die Rolle der Informatik bei diesem Strukturwandel scheint in ihrer Funktion als Basistechnologie, d.h. als neue, innovative Technologie zu liegen.72 Das Erfolgsgeheimnis der IT liegt in erster Linie darin, dass sich diese Art der Technologie73nicht nur auf die Mutation bestehender Abläufe oder Produkte noch auf die Generierung völlig neuartiger Produkte und Märkte beschränkt,74 sondern dieser Technologie ist es gelungen praktisch alle Bereiche der Volkswirtschaften zu durchdringen.75 Daher ist es auch nicht verwunderlich, dass in den letzten Jahren weltweit in sämtlichen Bereichen der Organisationen ein exponentieller Zuwachs an Rechnerleistung und auch Vernetzung beobachtet werden konnte. Vor allem das sehr rasch wachsende Internet führte verstärkt zu einer Vernetzung von Unternehmen.76

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1-5: Entwicklung der Beschäftigung in Deutschland77

Informatik als Basistechnologie

Bei einer Basistechnologie „handelt es sich um so genannte grundlegende Technologien, auf denen alle anderen Technologien aufbauen.“ 78 Als Beispiele für solche Technologien können folgende angegeben werden: Betriebssysteme, Datenbanken, Programmiersprachen usw.79 Eine Basistechnologie muss eine neue, innovative Technologie darstellen.80 Wie zuvor schon kurz erwähnt, spielt die Informatik beim Strukturwandel eine absolut tragende Rolle, da diese lt. Hanker bei der zukünftigen Entwicklung der Informationsgesellschaft81 „unmittelbar mit dem Innovationspotential der Informatik verknüpft sein“ 82 wird. Die OECD ordnete, nach einem Bericht einer Expertengruppe, die Informationstechnologie in die höchste Kategorie, als Pervasive generic technology (also eine durchdringende generische Technologie), für den technischen Wandel ein.83

Die Informatik, was nicht nur lokal sondern auch weltweit ganz zweifellos feststellbar war, als Basistechnologie hat die Wirtschaftsstrukturen sehr entscheidend beeinflusst. Diese Aussage kann vor allem deshalb getätigt werden, weil nachgewiesener Weise die Informationstechnologie in allen Bereichen der Wirtschaft eine tragende Rolle spielt. Die Informations-, Kommunikationstechnologie und die multimedialen Informationssysteme spielen schon seit einiger Zeit84 „für die Organisation und Wettbewerbsfähigkeit von Unternehmen eine Schlüs- selrolle.“ 85 Es gibt auch durchaus Forscher, wie bspw. Hanker 86, die im Bezug auf die Entwicklung und Rolle der Informatik als Basistechnologie, von einer dritten industriellen Revolution sprechen. Die Informatik ist lt. Hanker 87 „ geradezu prädestiniert für die Rolle eines eigentlichen Motors der Informationsgesellschaft“ 88 und diese Aussage bekräftigte er mit den folgenden zwei Hypothesen:89

- „Verbreitung der Informationstechnik: Der wachsende Umfang informationsproduzierender und –verarbeitender Tätigkeiten in einer Informationsgesellschaft erzeugt, im Sinne einer Demand pull-Theorie der Innovation, eine verstärkte Nachfrage nach Informationstechnik.“
- „Gesamtwirtschaftlicher Nutzen: Eine zunehmende Verbreitung der Informatik wirkt sich wiederum, einer Technology push-Interpretation folgend, sehr innovativ auf eine Volkswirtschaft aus und führt somit zur Steigerung der gesamtwirtschaftlichen Effizienz bzw. Produktivität sowie zu verstärkten Wirtschaftswachstum.“ 90

Vernetzte Unternehmen und Globalisierung

Unter einem Vernetzten Unternehmen wird eine Organisation verstanden, die alle substanziellen Geschäftsprozesse, die betriebswirtschaftlichen Funktionsbereiche und praktisch so gut wie alle Beziehungen zur Umwelt eines Unternehmens, speziell zu Kunden und Lieferanten, mit Hilfe von Informationsund Kommunikationstechnik unterstützt.91 „Der intensive Einsatz der IT in Wirtschaftsunternehmen seit Mitte der 1990er-Jahre sowie die gleichzeitige Umstrukturierung von Unternehmen haben die Bedingungen für ein neues Phänomen der Industriegesellschaft geschaffen: das vollkommen vernetzte Unternehmen.“ 92

Der Strukturwandel beeinflusste praktisch alle Wertschöpfungsketten in sämtlichen Branchen der Wirtschaftssektoren und das hatte somit zur Folge, dass sich auch die Wettbewerbslandschaft vollständig veränderte.93 Die Vernetzung der Unternehmen, was u.a. natürlich eine zunehmende Globalisierung der Unternehmen vorangetrieben hat, brachte bzw. bringt für diese und deren Geschäftsleitung jede Menge neue Herausforderungen mit sich. Die rasante Entwicklung in der IT, welche die Globalisierung vorangetrieben hat bzw. noch immer vorantreibt, stellt für die Unternehmen nicht nur eine neue Herausforderung bereit, sondern birgt auch eine gewisse Bedrohung in sich, denn dank der neuen Möglichkeiten bei den Kommunikationsund Managementsystemen94 „können Kunden jetzt auf einem weltweiten Markt ein- k aufen und rund um die Uhr Informationen zu Preisen und Qualitäten erhalten.“ 95 Eine Kon- sequenz daraus zeigt sich im Produktlebensund Absatzzyklus, welche sich durch die zunehmende Globalisierung immer mehr verkürzen und zudem entsteht immer häufiger eine inter- nationale Verflechtung der Wertschöpfungsketten. Die Auswirkung aus der internationalen Verflechtung der Wertschöpfungsketten vollzieht sich durch eine Umdisponierung von einzelnen Aktivitäten in begünstigende Standorte. Deshalb stellt für westeuropäische Unternehmen der zu bewältigende Kostendruck eine sehr zentrale Herausforderung der Globalisierung dar. Eine weitere Herausforderung an die Unternehmen entsteht durch die ebenfalls sehr rasch steigende Mobilität von Technologien. Diese mobilen Technologien96 „werden mit immer höherer Geschwindigkeit von einer Branche auf eine andere übertragen.“ 97 Die Auswirkungen der neuen mobilen Technologien sind, dass in vielen Branchen Outsourcingaktivitäten getätigt werden, speziell in jenen Bereichen bzw. Branchen,98 „wo die geforderte Innovationsgeschwindigkeit nicht mehr ohne fremde Hilfe aufrechterhalten werden kann.“ 99

Alle diese Auswirkungen durch das Vernetzen von Unternehmen und der dadurch stetig steigenden Globalisierung führen100 „zu einer Dynamisierung und Verschiebung von Marktbedürfnissen, denen sich die Unternehmen stellen müssen.“ 101

1.5.2 Datenund Informationsflut

Eine IDC102 -Studie mit dem Titel The Diverse and Exploding Digital Universe aus dem Jahr 2008 zeigt, dass das digitale Universum – Daten und Informationen in digitaler Form, die entweder erzeugt, erfasst oder repliziert werden – ständig an virtueller Masse zunimmt. Die forschenden Personen, welche das White Paper103 für IDC erstellt haben, gingen davon aus, dass die virtuelle Masse an digital zur Verfügung stehenden Daten und Informationen in einer Zeitspanne von 5 Jahren um das Zehnfache anwachsen wird. Des Weitern gingen die Forscher davon aus, dass die Menge an digitalen Daten und Informationen im Jahr 2006 bei etwa 200 Exabytes104 gelegen ist. Anhand dieser Ausgangsdaten wurde dann eine Prognose über die Entwicklung der jährlich produzierten Menge an digitalen Daten und Informationen erstellt. Die erstellte Prognose sagte anhand des vorliegenden Datenmaterials voraus, dass die Menge der produzierten digitalen Daten und Informationen am Ende des Jahres 2011 etwa bei 1.800 Exabytes liegt. Die Auswertung der Untersuchung besagt, dass sich die Mengen an digital produzierten Daten und Informationen im Vergleich zum Jahresbeginn des Jahres 2006 beinahe verzehnfacht hat, d.h. dass es sich hierbei um eine jährliche Wachstumsrate von fast 60 Prozent handelt. Die Abbildung 1-6 stellt zur Verdeutlichung der Ergebnisse die prognostizierte Entwicklung der IDC-Studie grafisch dar.105

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1-6: Prognostizierter Anstieg von Daten und Informationen in digitaler Form106

1.5.3 Wodurch entsteht die Datenund Informationsflut

Die heutige Gesellschaft kann wohl zweifellos als digitale Gesellschaft bezeichnet werden und in dieser Gesellschaft explodiert die Menge an Daten und Informationen förmlich. Ein Großteil der Bevölkerung in den Industrieländern lebt mittlerweile in einer Welt, in der die ständige Erreichbarkeit als normal angesehen wird. Internet, E-Mails, SMS, MMS, Pushmails usw. sind nur ein paar Beispiele für die Neuerungen in den letzten beiden Jahrzehnten. Es handel sich allerdings um Neuerungen, die ganz allmählich zu einem Übermaß an Daten und Informationen geführt haben.107

Als Ursache für die stark ansteigende Menge an digital produzierten Daten und Informationen sehen die Fachleute vor allem, in dem bereits zuvor schon beschriebenen, technischen Fortschritt der Basistechnologie. Allerdings muss, wenn es um die Produktion bzw. Vervielfältigung von Daten und Informationen geht, in jedem Fall kurz erwähnt werden, dass nicht nur die weltweit vernetzten Unternehmen an der stetig zunehmenden Menge von digitalen Daten und Informationen beteiligt sind, sondern auch die privaten Haushalte. Denn spätestens durch die Kommerzialisierung des Internets ist es für eine große Anzahl von privaten Haushalten auch sehr einfach geworden an eine scheinbar unendlich große Menge von Daten und Informationen zu gelangen. Ein weiterer Fakt bei der Verbreitung von Daten und Informationen ist, dass das Erstellen und Kopieren von diesen in der heutigen Zeit nicht wirklich mehr ein Problem darstellt. Denn die Kosten für die Erstellung und Verarbeitung von Daten und Informationen sind durch den technischen Fortschritt kein großes Hindernis mehr. Die Kosten für die Vielzahl heute verfügbarer Datenträger, wie z.B. CD, DVD, USB-Sticks, Festplatten usw., sind durch den technischen Fortschritt so gering geworden, dass sich heutzutage praktisch jeder private Haushalt solche ohne große Schwierigkeiten leisten kann.108 „Im Gegensatz zu früher, als Informationen ausschließlich papierbasiert zur Verfügung standen, trägt der technische Fortschritt also zur stetig anwachsenden Menge an Informationen bei.“ 109

1.5.4 Welche Konsequenzen hat die Datenund Informationsflut

„Je mehr Information desto besser?“ 110 Es gab in der Vergangenheit durchaus einmal eine Ära in der Information als ein knappes Gut galt. Danach, als nach und nach immer mehr Daten und Informationen zur Verfügung standen, war die Erwartungshaltung vor allem in den Unternehmen in Bezug auf das Treffen von Entscheidungen sehr groß gewesen. Allerdings war bzw. ist der Zugang zu mehr Daten und Information doch scheinbar mehr Fluch als Se- gen, denn Heute, wo speziell auch durch das Internet der Zugang zu Daten und Information beinahe in einer unendlichen Art und Weise offen zur Verfügung steht, gibt es immer mehr Menschen, die über die täglich auf sie hereinbrechende Flut von Daten und Informationen klagen. Viele Menschen fühlen sich an ihrem Arbeitsplatz, aber auch zu Hause bspw. beim Durchstöbern des Fernsehangebotes oder beim Surfen im Internet, durch die zunehmende Datenund Informationsflut allmählich überfordert und so gibt es durchaus schon Experten, die sich fragen, ob Daten und Informationen dadurch nicht sogar schon zur Plage geworden sind.111

Informationsflutam Arbeitsplatz

Die E-Mail-Kommunikation wird von einem Großteil der Unternehmen als Erstes genannt, wenn es um die Ursache der Daten und Informationsüberflutung geht. Laut einem Bericht im Magazin CIO112 klagt ein Fünftel der Arbeitnehmer über eine Datenund Informationsüberlastung (Dataand Information-Overload). In einem mittelständischen Unternehmen bekommt ein Mitarbeiter durchschnittlich 42 E-Mails pro Tag und in kleinen Unternehmen erhalten die Mitarbeiter etwa 22 E-Mails täglich. Bei großen Unternehmen ist die Anzahl der empfangenen E-Mails sehr unterschiedlich, da es sehr darauf ankommt, in welcher Abteilung ein Mitarbeiter beschäftigt ist. Durchschnittlich aber erhalten die Mitarbeiter dort etwa 34 E-Mails. Etwa jeder dritte der befragten Mitarbeiter in den Unternehmen ärgert sich über die Vielzahl von nicht relevanten E-Mails.113 Obwohl die Problematik der Daten und Informationsflut in den Unternehmen klar erkannt wird, hinkt lt. einer Studie der Living-e AG114 der Großteil der Betriebe bei der Eindämmung des Problems hinterher. Anlässlich dieser Studie wurden über 300 Mittelund Großunternehmen beim Umgang mit der Daten und Informationsflut genauer betrachtet. Das Ergebnis dieser Erhebung ergab, dass etwa 37 Prozent der Unternehmen die Gefahr der Datenund Informationsflut erkennen. 29 Prozent der Betriebe sind der Ansicht, dass sie mit der Problematik unter Umständen konfrontiert werden und nur 11 Prozent nehmen die stetig steigende Datenund Informationsmenge nicht wahr und sie befürchten auch nicht, dass sie damit in Berührung kommen werden.115 „Dagegen verbirgt sich in den Augen eines Viertels der Befragten dahinter längst keine auf die Zukunft gerichtete Frage mehr, sondern für sie ist der Informationsdschungel heute bereits Realität.“ 116

Technik und Verarbeitung

Durch den technischen Fortschritt wurden sehr viele und auch sehr gute Innovationen im Bereich der IuK-Technologie geschaffen, aber diese Technik für die Verarbeitung von Daten und Informationen birgt auch seine Schattenseiten. Da die IT-Systeme immer komplexer werden, werden diese in Verbindung mit der stetig steigenden Datenund Informationsmenge auch langsamer und fehleranfälliger.117 In den meisten Unternehmen, vor allem in den Mittel- und Großunternehmen, stecken die Daten und Informationen in den unterschiedlichsten Anwendungen und sind zudem auch noch im Netzwerk großflächig verteilt. Angesichts dieser, lt. der Erhebung durch die Living-e AG nachgewiesenen Tatsache gestaltet sich dann natürlich die Suche nach Daten bzw. Information als sehr schwierig und vor allem zeitaufwendig. Die Studie belegte, dass die Suche nach Daten und Informationen in den meisten Fällen kaum mehr effizient durchgeführt werden kann. Im Zuge dieser Erhebung wurde festgestellt, dass die Informationssuche bereits praktisch in jedem zweiten Unternehmen mindestens 15 Prozent der Arbeitszeit ausmacht und bei 24 Prozent der Unternehmen sind es zum Teil sogar mehr als ein Fünftel der Arbeitszeit. Nur bei einem sehr geringen Anteil von den untersuchten Unternehmen entstand bei der Suche nach Daten und Informationen ein verhältnismäßig geringer Zeitaufwand, d.h., dass in jedem fünften Vorgang der Informationssuche etwa 5 Prozent oder weniger der Arbeitszeit in Anspruch genommen werden mussten. Obwohl den meisten Unternehmen die Tragweite der Problematik schon seit einiger Zeit bekannt ist, haben aber lt. der Studie nur etwa 23 Prozent auch wirklich Konsequenzen daraus gezogen. Jene Unternehmen, die sich der Problematik stellen, nutzen entweder Lösungen für ein besseres Informationsmanagement oder planen zumindest deren Einsatz. Interessant ist auch die Tatsache, dass 31 Prozent der befragten Betriebe überhaupt keine Lösungsszenarien ausgearbeitet haben.118

1.5.5 Datenmanagement in Unternehmen

Nachdem die CIO-Studien, welche als Basisinformation für Ursachen und Konsequenzen der Datenund Informationsflut herangezogen wurden, bereits aus dem Jahr 2008 stammen, wird in dieser Arbeit im Zuge der Voruntersuchung, eine eigene Erhebung durchgeführt. Das Ziel der Studie ist es zu untersuchen, ob Unternehmen aus Österreich (20 befragte Unternehmen) und Deutschland (5 befragte Unternehmen) inzwischen mehr Konsequenz aus der Datenund Informationsproblematik ziehen.

In dieser Studie wird die Datenund Informationsproblematik mit den auftretenden bzw. ständig ansteigenden unstrukturierten Daten in einen direkten – anhand der Vorstudie, welche mit einer Literaturrecherche durchgeführt wird – Zusammenhang gebracht, da die unstrukturierten Daten als Hauptbestandteil bei der Datenund Informationsflut angesehen werden. Viele der unstrukturierten Daten werden, wie bei den beiden Studien des CIO-Magazins bereits aufgezeigt wurde, durch die Übertragung von E-Mails, SMS, MMS, Pushmails usw. in die Server und Netzwerke der Unternehmen integriert. Deshalb wird auch die Fragestellung auf die Existenz eines Datenmanagement-Systems, das die unstrukturierten Daten ganzheitlich verwaltet, als Kernpunkt dieser Studie angesehen. Denn nur wenn die unstrukturierten Daten, eben mit Hilfe eines dafür konzipierten Datenmanagement-Systems, ganzheitlich verwaltet bzw. bearbeitet werden können, kann die Datenund Informationsflut unter Kontrolle gebracht werden. Die Auswertung der Erhebung kann im Anhang nachgeschlagen werden.119

1.5.5.1 Konzepte und Anwendungen mit Datenmanagement

Gerade in der heutigen Zeit hängt eine erfolgreiche wirtschaftliche Entwicklung eines Unternehmens in sehr hohem Maße von kompetenten und strategisch richtigen Entscheidungen ab, welche vor dem Hintergrund eines kontinuierlichen organisatorischen Wandels (siehe Kapitel 1.5.1) zu treffen sind. Der Wandel, der sowohl den Wettbewerb selbst, als auch die eigene Unternehmensorganisation betrifft, kann bspw. Formen wie eine Prozessorientierung oder Segmentierung usw. annehmen. Ein Großteil der Unternehmen – vor allem so genannte alteingesessene Unternehmen, deren IT und auch die Organisation selbst, historisch gewachsen sind – die über konventionelle IT-Architekturen betrieblicher Informationssysteme verfügen 119 Eigene Darstellung sind dem kontinuierlichen Wandel oftmals nicht gewachsen. Deshalb wünschen sich auch viele Unternehmen eine effiziente und leistungsfähige IT-Infrastruktur, denn nur jene Unternehmen sind in der Lage auf geänderte Geschäftsanforderungen zu reagieren,120 „ deren IT sich nach den Geschäftsprozessen richtet, die das jeweils benötigte Wissen in Form von geeignet aufbereiteten Informationssystemen bereitstellt, und nicht umgekehrt.“ 121

Die modernen Speichersysteme von heute sind längst schon zu weit mehr als nur zu einfachen Festplatten geworden. Immer mehr wird die Intelligenz aus dem Betriebssystem des Servers in das Speichersystem der Unternehmen verlagert. Für die Unternehmen gilt es heutzutage, um bei der andauernden Globalisierung wettbewerbsfähig zu bleiben, dass die Produktionsfaktoren Daten, Information und Wissen systematisch gestärkt und effizient genutzt werden müssen. Um eine höhere Effizient und Produktivität der Produktionsfaktoren Daten, Information und Wissen zu erreichen, steht in den Unternehmen sowohl die zweckmäßige Nutzung der Ressourcen Daten, Information und Wissen im Blickpunkt als auch die Vernetzung der Mitarbeiter, die über das extrahierte Wissen verfügen. In der Praxis fehlt es jedoch sehr häufig an der Umsetzung eines entsprechenden Informationsmanagementsystems.122

Unter einem Informationssystem (IS) wird in der Regel – und auch im engeren Sinn – ein rechnergestütztes Anwendungssystem für die Ausführung von betrieblichen Aufgaben verstanden. Heutzutage benutzen die Unternehmen vielfältige Formen von Informationssystemen. Die Formen von solchen Informationssystemen unterscheiden sich in den im Einzelnen zur Verfügung gestellten Diensten und entsprechend den jeweiligen Anwendungen. Nachfolgend werden einige Anwendungsbeispiele aufgezeigt:

- Unternehmensführung,
- Personal-, Kundenund Materialverwaltung,
- Auftragsabwicklung,
- Betriebsmittelund Finanzüberwachung,
- Entscheidungsunterstützung usw.

Die von den Informationssystemen bereitgestellten Dienste müssen natürlich den unterschiedlichen Bedürfnissen der jeweiligen Anwendungen angepasst sein. In der Praxis hat sich aber auch gezeigt,123 „dass bei aller Unterschiedlichkeit der Anwendungen viele Dienstanforderungen an ein Informationssystem derart gleichartig sind, dass es sich lohnt, einige wenige Grundformen von Informationssystemen zu entwickeln und zu vermarkten.“ 124 Wenn von den jeweiligen Besonderheiten einmal abgesehen wird, dann können die bereitgestellten Dienste eines Informationssystems wie folgt beschrieben werden: Ein Informationssystem soll allgemein dazu dienen, dass

- eine große Mengen von Daten und Informationen
- dauerhaft und verlässlich,
- für eine große Anzahl und verschiedenartige Benutzer verfügbar gemacht und
- effizient verwalten wird.

Jedes Informationssystem, welches in einem Unternehmen zum Einsatz gebracht wird, verwaltet so große Mengen von Daten und Informationen, dass diese so gut wie immer, nicht mehr alle gleichzeitig in einem Hauptspeicher eines Rechensystems gespeichert werden können, sondern auf andere Speichersysteme bzw. –medien ausgelagert werden müssen. Große Systeme verwaltet heutzutage Datenund Informationsmengen von vielen Terrabytes.125 Eine Entwicklung bzw. auch eine Umsetzung von Methoden zum Sammeln und Analysieren von Daten und Informationen stellt daher für die Unternehmen und Informationsexperten eine große Herausforderung dar. In Zukunft wird lt. Thome & Sollbach der Schwerpunkt der Managementtätigkeit vermehrt darin liegen, dass neue Konzepte, Methoden und Praktiken entwickelt werden, um die Datenund Informationsressourcen effizienter nutzbar zu machen. Ein sehr zentrales Element für die Unternehmen heute ist daher der Datenspeicher und das Mana- gement von diesem. HSM126 (Hierarchical Storage Management), ILM127 (Information Life- cycle Management) usw. sind Schlagwörter in der aktuellen Datenverarbeitung. Diese Begriffe stellen aber keine Systeme im herkömmlichen Sinn dar, sondern es handelt sich hierbei nur um Techniken und Verfahren für eine kostenangepasste Speicherung und Archivierung von Daten und Informationen. Diese Techniken und Verfahren stellen also kein kaufbares Produkt dar, sondern sie sind nur eine Kombination aus verschiedenen Prozessen und Technologien, welche durch Software-Tools unterstütz werden.128

1.5.5.2 Klassifizierung von unstrukturierten Daten

Für einen Großteil der Unternehmen (siehe Anhang A: Ergebnis der Vorstudie) gewinnt die Notwendigkeit zur Klassifizierung der vorhanden Daten als Voraussetzung für einen ordnungsgemäßen Umgang mit diesen .immer mehr an Bedeutung, da diese Daten in immer größeren Mengen in unstrukturierter Form vorliegen. Krcmar gibt an, dass Analysten davon ausgehen, dass etwa 80 Prozent aller Daten in einem Unternehmen in unstrukturierter Form vorliegen und zudem auch noch stetig anwachsen. Die Folge dieser Entwicklung ist, dass die Unternehmen immer mehr an Speicherkapazität benötigen, um die Daten und Informationen zu speichern. Bei den Daten und Informationen handelt es sich um Dateien von Mitarbeiter, fremde Informationen und um die wertvollen Unternehmensdaten. So werden die Speichervolumen, welche zwar immer günstiger in der Anschaffung werden, immer weiter vergrößert und somit auch teurer, weil diese mehr Administration benötigen und somit die innerbetriebli- chen Kosten explodieren lassen.129 „Ein fruchtbarer Blick auf betriebliche Daten kann nur gelingen, wenn man in die Vielfalt betrieblicher Informationen eine Struktur bringt, die überschaubar ist und dauerhaft Bestand hat.“ 130

Es wird hierbei allerdings kein Entwicklungskonzept gesucht, sondern ein Ordnungsschema für Daten. Die Ziele der Datenklassifizierung sind wie folgt:

- die Verfügbarkeit, Vollständigkeit und Vertraulichkeit für die identifizierten Werte,
- ROI131 durch eine Einführung von Kontrollmechanismen, wo diese benötigt werden,
- die Datenschutzvorgaben mit den unternehmerischen Bestrebungen zusammenfügen,
- die Reduzierung von Bedrohungen durch unautorisierte Zugriffe und Offenlegung und
- das Erfüllen von gesetzlichen Anforderungen.132

1.5.5.3 Analyse von unstrukturierten Daten

Wie schon erwähnt, liegt ein sehr großer Anteil der Daten in den Unternehmen in unstrukturierter Form vor. Die unstrukturierten Daten werden in den unterschiedlichsten Formaten, in Form von E-Mails, Grafiken, Präsentationen, Tabellenkalkulationen, Textdokumenten usw., auf den diversen Plattformen geführt.133 Heinrich & Stelzer geben an, dass jene Mitarbeiter, die mit wissensintensiven Aufgaben betraut sind, bis zu 35 Prozent ihrer Arbeitszeit mit der Suche nach Informationen verbringen. Allerdings finden diese Personen in nur etwa 50 Prozent der Fälle die gewünschten Informationen. Daher besteht heutzutage die große Herausforderung darin, die unstrukturierten Daten für die betrieblichen Aufgaben zugänglich zu machen. Aus diesem Grund finden Begriffe wie Enterprise Search 134 und Information Retrie- val 135 immer mehr an Bedeutung, da mit Hilfe dieser Methoden die unstrukturierten Daten und Informationen – welche in unterschiedlichster Repräsentationsform vorliegen können – strukturiert, mit Metadaten beschrieben und gespeichert werden können, um diese dann für die Mitarbeiter im Unternehmen leichter auffindbar zu machen und somit auch den Zugriff auf die benötigten Informationen organisieren zu können. Der Unterschied zu der Suche in strukturierten Daten liegt vor allem darin, dass ein Mitarbeiter bei der Suche nach Informationen in unstrukturierten Daten sein Informationsbedürfnis nicht immer exakt formu- lieren kann und daher besteht über die Art, Menge und Qualität der Treffer eine Unsicherheit. Wichtige Werkzeuge beim Information Retrieval sind Data Mining und Text Mining. Hilfsmittel des Dataund Text Mining unterstützen die Extraktion von Informationen aus Dokumenten.136 „Sie kommen zum Einsatz, um implizite, nicht offensichtliche oder bisher nicht bekannte Zusammenhänge zu entdecken, und daraus Schlussfolgerungen ableiten zu können.“ 137

[...]


1 vgl. Krcmar, H. (2010), S. 55

2 Eigene Darstellung, Erkenntnis aus der Interviewauswertung.

3 vgl. Schöttner, J. (1999), S. 1 f.

4 vgl. Schröder, K. (1997), S. 119 ff.

5 Mit Mitarbeiter werden auch Mitarbeiterinnen angesprochen, im Laufe der vorliegenden Arbeit wird der Einfachheit halber allerdings nur das Maskulinum verwendet.

6 Großmann, M./Koschek, H. (2005), S. 12

7 vgl. Proebster, W. E. (2002), S. 59

8 vgl. Rehäuser, J./Krcmar, H. (1996), S. 6

9 vgl. Spitta, T./Bick, M. (2008), S. 36

10 vgl. Heinrich, L. J. et al. (2011), S. 151 ff.

11 vgl. Krcmar, H. (2010), S. 15

12 vgl. Runkler, T. A. (2010), S. 1 f.

13 vgl. Gabriel, R. et al. (2011), S. 12 f.

14 vgl. Gabriel, R. et al. (2011), S. 15 f.

15 vgl. Gabriel, R. et al. (2011), S. 116 f.

16 Gabriel, R. et al. (2011), S. 117

17 vgl. Gabriel, R. et al. (2011), S. 116 f.

18 vgl. Gabriel, R. et al. (2011), S. 117

19 vgl. Spitta, T./Bick, M. (2008), S. 58

20 vgl. Dippold, R. et al. (2005), S. 21

21 Datenmodellierung bedeutet eine formale Abbildung von Informationsobjekten einer betrachteten Diskurswelt mittels Attribute und Beziehungen. [Definition: Ferstl, O. K./Sinz, E. J., (2006), S. 131]

22 Krcmar, H. (2003), S. 86

23 Bei den angesprochenen Daten handelt es sich um Dateien und Datenbanken.

24 vgl. Heinrich, L. J./Lehner, F. (2005), S. 223

25 vgl. Dippold, R. et al. (2005), S. 22

26 vgl. Dippold, R. et al. (2005), S. 22

27 vgl. Heinrich, L. J./ Lehner, F. (2005), S. 224

28 vgl. Heinrich, L. J./Lehner, F. (2005) S. 224 f.

29 vgl. Wittmann, W. (1956), S. 14

30 vgl. Heinrich, L. J. et al. (2011), S. 12

31 vgl. Spitta, T./Bick, M. (2008), S. 49 f.

32 Bateson, G. (1972), S. 459

33 vgl. Großmann, M./Koschek, H. (2005), S.19

34 Spitta, T./Bick, M. (2008), S. 51

35 vgl. Spitta, T./Bick, M. (2008), S. 50 ff.

36 Bodendorf, F. (2006), S. 1

37 Thome, G./Sollbach, W. (2007), S. 173

38 vgl. Thome, G./Sollbach, W. (2007), S. 173 f.

39 Thome, G./Sollbach, W. (2007), S. 173

40 vgl. Thome, G./Sollbach, W. (2007), S. 173

41 vgl. Thome, G./Sollbach, W. (2007), S. 173

42 vgl. Piazza, F. (2010), S. 100

43 Ein kategoriales Attribut ist eine Zuordnung von Objekten, welche unterschiedliche Klassen repräsentieren.

44 vgl. Piazza, F. (2010), S. 100

45 Piazza, F. (2007), S. 100

46 Metadaten werden auch als „Daten über Daten“ bezeichnet

47 vgl. Großmann, M./Koschek, H. (2005), S. 125 f.

48 vgl. Großmann, M./Koschek, H. (2005), S. 14

49 vgl. Becker, F. G. (2006), S. 255

50 Eigene Darstellung

51 Eigene Darstellung

52 Großmann, M./Koschek, H. (2005), S. 127

53 vgl. Großmann, M./Koschek, H. (2005), S. 127

54 vgl. Hildebrand, K. et al. (2011), S. 146

55 Hildebrand, K. et al. (2011), S. 146

56 vgl. Hildebrand, K. et al. (2011), S. 146

57 vgl. Thome, G./Sollbach, W. (2007), S. 171 f.

58 vgl. Großmann, M./Koschek, H. (2005), 16 ff.

59 vgl. Dippold, R. et al. (2005), S. 1

60 vgl. Mertens, P./Wieczorrek, H. W. (2000), S. 7

61 vgl. Mertens P./Wieczorrek, H. W. (2000) S. 7 f.

62 Der amerikanische Ökonom Charles Jonscher erstellte zwei vielbeachtete Studien – 1983 und 1988 – in den USA, wobei er nur die Produktionsund Informationssektoren gegenüberstellte.

63 vgl. Bullinger, H.-J. et al. (1995), S. 15

64 Organisation für wirtschaftliche Zusammenarbeit und Entwicklung

65 vgl. Hanker J. (1990), S. 175 ff.

66 vgl. Jonscher, C. (1988), S. 40

67 vgl. Hanker, J. (1990), S. 175 ff.

68 vgl. Jonscher, C. (1988), S. 40

69 vgl. Mertens, P./Wieczorrek, H. W. (2000), S. 7 ff.

70 Mertens, P./Wieczorrek, H. W. (2000), S. 7

71 vgl. Mertens, P./Wieczorrek, H. W. (2000), S. 7 ff.

72 Mertens, P./Wieczorrek, H. W. (2000), S. 7

73 vgl. Mertens, P./Wieczorrek, H. W. (2000), S. 7

74 Mertens, P./Wieczorrek, H. W. (2000), S. 7

75 vgl. Mertens, P./Wieczorrek, H. W. (2000) S. 7 f.

76 vgl. Laudon, K. C. et al. (2010), S. 99 f.

77 vgl. Mertens P./Wieczorrek, H. W. (2000) S. 8

78 Versteegen, G. (2002), S. 1

79 vgl. Versteegen, G. (2002), S. 1

80 vgl. Hanker, J. (1990), S. 184

81 vgl. Hanker, J. (1990), S. 184

82 Hanker, J. (1990), S. 184

83 vgl. Hanker, J. (1990), S. 184

84 vgl. Lehner, F. (2009), S. 5

85 Lehner, F. (2009), S. 5

86 Hanke r tätigt diese Aussage in seinem Buch, Die strategische Bedeutung der Informatik für Organisationen, aus dem Jahr 1990.

87 vgl. Hanker, J. (1990), S. 185 f.

88 Hanker, J. (1990), S. 185

89 vgl. Hanker, J. (1990), S. 185 f.

90 Hanker, J. (1990), S. 185

91 vgl. Laudon, K. C. et al. (2010), S. 11

92 Laudon K. C. (2010), S. 11

93 vgl. Kaluza, B./Blecker, T. (2000), S. 63

94 vgl. Laudon, K. C. et al. (2010), S. 7 f.

95 Laudon, K. C. et al. (2010), S. 8

96 vgl. Kaluza, B./Blecker, T. (2000), S. 64

97 Kaluza, B./Blecker, T. (2000), S. 64

98 vgl. Kaluza, B./Blecker, T. (2000), S. 64

99 Kaluza, B./Blecker, T. (2000), S. 64

100 vgl. Kaluza, B./Blecker, T. (2000), S. 64

101 Kaluza, B./Blecker, T. (2000), S. 64

102 IDC (International Data Corporation) ist ein US-amerikanisches Beratungsund Marktforschungsunternehmen, welches international auf dem Gebiet der Informatrionstechnologie und der Telekommunikation tätig ist.

103 Ein White Paper ist ein Bericht, der einen Überblick über Leistungen, Standards und Technik zu IT-Themen liefert.

104 Ein Exabyte entspricht 1018 Bytes.

105 vgl. Gantz, J. F. et al. (2008), S. 3

106 vgl. Gantz, J. F. et al. (2008), S. 3

107 vgl. Brunner, W. L. et al. (2011), S. 29 f.

108 vgl. Krcmar, H. (2010), S. 55 f.

109 Krcmar, H. (2010), S. 55

110 Krcmar, H. (2010), S. 56

111 vgl. Krcmar, H. (2010), S. 56

112 Das CIO Magazin ist ein monatlich erscheinendes IT-Wirtschaftsmagazin, das sich mit dem Einsatz von IuKTechnologien in Unternehmen beschäftigt.

113 vgl. König, A. (2010), S. 1 f.

114 Die Living-e AG bietet verschiedene Software-Produkte und Dienstleistungen für den Business-Bereich an.

115 vgl. Pohl, J. (2008), S. 1 f.

116 Pohl, J. (2008), S. 1

117 vgl. Brunner, W. L. (2011), S. 22

118 vgl. Pohl, J. (2008), S. 1 f.

119 Eigene Darstellung

120 vgl. Thome, G./Sollbach, W. (2007), S. V f.

121 Thome, G./Sollbach, W. (2007), S. V

122 vgl. Thome, G./Sollbach, W. (2007), S. V f.

123 vgl. Biskup, J. (1995), S. 1 f.

124 Biskup, J. (1995), S. 1 f.

125 vgl. Biskup, J. (1995), S. 2

126 Unter einem Hierarchical Storage Management wird eine Systemkomponente verstanden, welche Dateien, auf die über eine gewisse Zeit nicht zugegriffen wurde, auf ein Speichermedium auslagert, dass einer niedrigeren Speicherhierarchiestufe zuzuordnen ist, d.h. eine größere Zugriffszeit besitzt.

127 Ein Information Lifecycle Management stellt eine Managementphilosophie dar, welche Strategien, Methoden und Anwendungen umfasst, um Daten und Information automatisiert entsprechend deren Wert und deren Nutzen optimal auf dem jeweils kostengünstigsten Speichermedium bereitzustellen, zu erschließen und langfristig sicher aufzubewahren.

128 vgl. Thome, G./Sollbach, W. (2007), S. V ff.

129 vgl. Krcmar, H. (2010), S. 54 ff.

130 Spitta, T./Bick, M. (2008), S. 65

131 ROI ist die Abkürzung für den Begriff Return on Investment.

132 vgl. Spitta, T./Bick, M. (2008), S. 65 f.

133 Eigene Darstellung

134 Enterprise Search (= Unternehmensweite Suche) ist ein Teilgebiet des Information Retrieval und bezeichnet einen Vorgang der computergestützten inhaltsorientierten Suche mit Hilfe einer unternehmensinternen Suchmaschine. Für ein Unternehmen ist der Nutzen dieses Vorgangs die Unterstützung der Mitarbeiter bei der Suche nach den arbeitsrelevanten Informationen.

135 Information Retrieval (= Informationsrückgewinnung) ist ein Fachgebiet, welches sich mit der computerge- tützten Suche nach komplexen Inhalten befasst. Bei diesem Vorgang geht es darum bereits bestehende Informationen, welche in komplexen Daten wie bspw. Bildern, Grafiken, Texten, Zeichnungen usw. gespeichert sind, abzurufen.

136 vgl. Heinrich, L. J./Stelzer, D. (2011), S. 254

137 Heinrich, L. J./Stelzer, D. (2011), S. 254

Ende der Leseprobe aus 150 Seiten

Details

Titel
(Produkt)Datenmanagement
Untertitel
Analyse von Methoden zur Erhebung und Klassifizierung von unstrukturierten Daten an einem empirischen Beispiel
Hochschule
Johannes Kepler Universität Linz
Note
1,4
Autor
Jahr
2013
Seiten
150
Katalognummer
V513222
ISBN (eBook)
9783346112217
ISBN (Buch)
9783346112224
Sprache
Deutsch
Anmerkungen
Diese Diplomarbeit wurde im Zuge eines Projektes in einem großen Unternehmen erstellt. Einige Teile der Anmerkungen in der Arbeit wurden anschließend tatsächlich im Unternehmen umgesetzt.
Schlagworte
Datenmanagement, unstrukturierte Daten
Arbeit zitieren
Gerald Oswald (Autor), 2013, (Produkt)Datenmanagement, München, GRIN Verlag, https://www.grin.com/document/513222

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: (Produkt)Datenmanagement


Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden