Leseprobe
Abstract
Im Zuge dieses Beitrags werden zunächst die Themengebiete Klassifizierungssysteme, Shop-Systeme, der Industriestandard eCl@ss und Ontologien näher erläutert. Aufbauend darauf werden die Unterschiede zwischen Ontologien und eCl@ss in Bezug auf die Produktklassifizierung abgeleitet. Das Ziel ist es, anhand selbst konzipierter Beispiele darzustellen, wie ein effek- tiver Einsatz von Ontologien zur Produktklassifikation in Shop- Systemen möglich ist. Zur Beschaffung der Information diente eine intensive Literaturrecherche. Diverse Beiträge aus der IEEE Xplore Digital Library stellen eine ergänzende Informations- quelle dar. In den Ergebnissen ist festzustellen, dass sich Pro- dukte mittels Ontologien klassifizieren lassen. Eine Produkt- klassifizierung durch Ontologien übersteigt die Ausdrucksfähig- keit sowie die Möglichkeiten im Vergleich zu eCl@ss.
Keywords: Ontologien, eCl@ss, Produktklassifizierung, Shop- Systeme, E-Business standards ist der Industriestandard eCl@ss. Dieser Industrie-
1. Einleitung und Problemstellung
Durch den rasanten Zuwachs von Computer und Internettech- nologie und der damit verbundenen gesellschaftlichen Trans- formation zur Informationsgesellschaft bzw. Wissensgesell- schaft werden die Menschen bei ihrer Informationssuche mit Unmengen an Informationen und Daten konfrontiert, die es zu klassifizieren und zu verarbeiten gilt (vgl. Kollmann, 2010, S.8)
Das Internet stellt heutzutage einen weltweiten Verbund von Rechnernetzen und autonomen Systemen dar, welche den Menschen als Informationsquellen dienen. Außerdem verfügt es über riesige Datenmengen und Informationen, ähnlich einer übergroßen Datenbank. Das Internet als Wissensbasis spielt eine wichtige Rolle bei der Informationssuche der Menschen. Jedoch gestaltet sich die Informationssuche mittels heutiger Suchmaschinen oft als schwierig, bedingt durch die großen Informations- bzw. Datenmengen etc. Weitere Probleme bei der Informationssuche im Internet sind, dass die Informationen bzw. Daten für Suchmaschinen nicht semantisch beschrieben sind und in keinerlei Beziehungen zueinander stehen (vgl. Man- ning, Raghavan & Schütze, 2008, S.3). Daraus ergibt sich die Tatsache, dass der überwiegende Teil der Webinhalte darauf ausgerichtet ist, vom Nutzer gelesen, klassifiziert und interpre- tiert zu werden und nicht von Maschinen.
Aus diesem Grund ist es notwendig, dass sämtliche Informatio- nen bzw. Daten klassifiziert werden, damit die Nutzer bei der Informationssuche effizienter an diese gelangen können und sich die Suche nicht nach einer „Nadel im Heuhaufen“ gestaltet.
Vor allem für E-Business-Plattformen, wie z.B. Shop-Systeme, spielt die Klassifizierung von Produkten eine wichtige Rolle. Für die Klassifizierung von Produkten gibt es mehrere Industrie- standards, die je nach Branche unterschiedlich stark zum Ein- satz kommen. Einer der bekanntesten Produktklassifizierungs- standard wurde durch das Kölner Institut der Wirtschaft in Zu- sammenarbeit mit führenden deutschen Unternehmen entwi- ckelt.
Die Aufgabe bei der Produktklassifizierung besteht darin, jedes Produkt einer spezifischen Produktgruppe zuzuordnen, die ei- nen gemeinsamen Anwendungsbereich oder dieselben bzw. ähnliche Attribute besitzt (vgl. Eigner & Stelzer, 2009, S. 71).
Produktklassifizierungssysteme sind im B2B-E-Commerce be- reits seit Jahren als Strukturierungsinstrument im Einsatz und stellen die Basis für eine einheitliche, unternehmensübergrei- fende Kategorisierung und Beschreibung von Produktdaten dar. Durch den flächendeckenden Einsatz von Produktklassifi- zierungsstandards in Shop-Systemen, können die Kunden die Produkte bei einer Suche leichter finden und untereinander vergleichen. Unternehmen hingegen, können ihre Produktda- ten effizienter von einem betrieblichen Informationssystem zu einem anderen portieren und integrieren. Durch die Anwen- dung von Produktklassifikationsstandards wird die Datenquali- tät erhöht (vgl. Scheer, 2013, S. 256).
2. Zielsetzung und Vorgehensweise
Im Rahmen dieses Beitrags soll der These nachgegangen wer- den, wie ein effektiver Einsatz von Ontologien in Shop- Systemen möglich ist.
Darüber hinaus wird versucht, einen strukturierten Überblick über den Aufbau von Ontologien und Klassifizierungsstandards darzustellen. Des Weiteren werden die Unterschiede zwischen Ontologien und Klassifizierungsstandards, wie z.B. eCl@ss in Bezug auf Shop-Systeme aufgezeigt. Außerdem werden die
Grenzen sowie die Vor- und Nachteile beim Einsatz von Ontolo- gien und Klassifizierungsstandards in Shop-Systemen ausgear- beitet. Davor werden sämtliche, für diesen Beitrag relevante Begrifflichkeiten definiert und voneinander abgegrenzt. Ein weiteres Ziel ist die Aufdeckung von Forschungslücken für die zukünftige Bearbeitung.
3. Klassifizierungssysteme
Klassifizierungssysteme stellen ein systematisch aufgebautes Ordnungssystem dar, das als Ziel hat, Objekte zu Klassen zu- sammenzufassen. Klassifizierungssysteme gruppieren und un- terteilen das Wissen einer Domäne nach wissenschaftlich ein- heitlichen Prinzipien (vgl. Eigner & Stelzer, 2009, S. 71).
Die Menge und die Frequenz der zu verarbeiteten Daten steigt stündlich an. Die unterschiedliche Qualität und verschiedenen Formate (PBSeasy, BMEcat, csv, pdf, XML, xlsc, xls, txt) der Daten, bestärkt den Einsatz von Klassifikationssystemen.
Klassifizierungssysteme lassen sich entweder induktiv oder deduktiv aufbauen. Bei dem Aufbauprozess von Klassifizie- rungssystemen können verschiedene Schwierigkeiten auftre- ten. Schwierigkeiten können unterschiedliche länderspezifische Bezeichnungen von Begriffen, ein unterschiedliches Begriffs- verständnis oder auch falsche Merkmale sowie fließende Be- griffsübergänge sein. Einerseits können verschiedene Objekte mit demselben Begriff beschrieben werden (Polysemie) und andererseits kann ein und dasselbe Objekt über verschiedene Bezeichnungen oder Synonyme beschrieben werden (Homo- nymie).
Bei Klassifizierungssystemen lassen sich, in Bezug auf die jewei- lige Aufbaustruktur, verschiedene Arten identifizieren. Neben Verzeichnisstrukturen und Ontologien, können Klassifizierungs- systeme auch in Form von Taxonomien und Thesaurus auftre- ten. Die in der Praxis am meist verbreitetste Art eines Klassifi- zierungssystems, ist eine Taxonomie (vgl. Eigner & Stelzer, 2009, S. 73).
Die bekanntesten Klassifikationssysteme sind: eCl@ss, ETIM, GPC, UNSPC und proficl@ss. In dem diesem Beitrag wird je- doch ausschließlich eCl@ss in Bezug auf die Produktklassifika- tion in Shop-Systemen näher betrachtet, da es in Europa das weitverbreitetste Klassifizierungssystem ist. (vgl. Otto, Beck- mann, Kelkar, Müller, 2002, S. 44) Außerdem hat sich eCl@ss weltweit als einziger ISO/IEC-normenkonformer Standard durchgesetzt.
4. Shop-Systeme
Die Fülle der am Markt angebotenen Shop-Systeme im E- Commerce ist grenzenlos. Die Einsatzmöglichkeiten von Shop- Systemen finden sich zumeist im Bereich von B2B sowie B2C wieder (vgl. Meier & Stormer, 2012, S.4). Die am meist genutz- ten und verbreiteten Shop-Lösungen im E-Commerce sind un- ter anderem OXID eSales Enterprise Edition B2B, Magento Enterprise Edition, IBM WebSphere Commerce 7 und hybris B2B Commerce. Prinzipiell besteht jedes Shopsystem aus ei- nem Frontend, Backend und mehreren Datenbanken. Über das Frontend kann der User nach Produkten suchen oder Bestellun- gen in Auftrag geben. Das Backend verarbeitet im Zusammen- spiel mit der Datenbank die Events des Users. Über das Front- end wird dem User das Ergebnis seiner Suche präsentiert. Pro- duktdaten, Kundendaten und Transaktionsdaten etc. werden dabei persistent in einer Datenbank gespeichert (vgl. Meier & Stormer, 2012, S.4 ff.).
Im weiteren Verlauf dieses Beitrags und in Bezug auf die These aus Kapitel zwei, wird die Produktsuche bzw. die Produktklassi- fikation in Bezug auf eCl@ss, Ontologien und Shop-Systeme näher betrachtet (Abbildung 1).
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1: Produktsuche in einem Magento-Shop-System, Produkte klassifiziert mit eCl@ss (Quelle: eigene Darstellung, in Anlehnung an: Meier & Stormer, 2012, S.5)
Prinzipiell bieten die meisten Shop-Systeme Schnittstellen zu Warenwirtschaftssystemen, ERP-Systemen, CRM-Systeme, Shop-Systemen, Preisvergleichsportalen, Zahlungsanbietern und Versanddienstleistern an. Darüber hinaus bieten Shop- System-Lösungen die Möglichkeit, Katalogdaten über eine OCI- Schnittstelle in das System zu übertragen.
Außerdem bieten Shop-System-Lösungen ihren Nutzern bei der Suche nach Produkten im Wesentlichen zwei Möglichkeiten an, um über das Frontend nach Produkten zu suchen. Zum ei- nen über die „Suche“, zum anderen über die „Navigation“. Bei der „Suche“ werden ein oder mehrere Suchbegriffe oder Pro- duktnummern in das Formularfeld eingegeben und in Echtzeit asynchron verarbeitet. Das Ergebnis der Suche liegt dem User unmittelbar vor. Die Suche funktioniert ähnlich, wie bei einer Internetsuchmaschine.
5. Industriestandard eCl@ss
Ein internationaler branchenübergreifender Industriestandard zur Klassifizierung und Beschreibung von Produkten und Dienstleistungen ist eCl@ss, welcher im Jahre 2000 entwickelt wurde. eCl@ss liegt in 14 Sprachen vor und wird permanent von Industrieunternehmen, Instituten und Fachverbänden weiter- entwickelt (vgl. Frick et. al., 2009, S. 150).
Außerdem bietet eCl@ss seinen Nutzern an, den Industriestan- dard kostenlos kennen zu lerne, bevor eine kostenpflichtige Lizenz erworben werden muss (Abbildung 2).
eCl@ss bietet Unternehmen die Möglichkeit, die Kosten zu senken sowie die unternehmensübergreifende Kommunikation, Prozesse zu verbessern. Darüber hinaus erlaubt eCl@ss eine einheitliche, überbetriebliche Klassifizierung und Beschreibung von Produkten und Dienstleistungen anhand ihrer Merkmale und Eigenschaften. Dies stellt wiederum die Basis der übergrei- fenden elektronischen Geschäftsabwicklung dar. Durch die Klassifizierung von Produkten und Dienstleistungen können diese leichter von Kunden verglichen werden. Außerdem kön- nen die Daten leichter in Informationssysteme eingespeist und integriert werden.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 3: Hierarchieebenen eCl@ss (Quelle: eCl@ss e.V, 2017)
Jede Produktklassifikation in eCl@ss ist durch eine achtstellige Nummer gegenzeichnet (Abbildung 4). Die Nummer 24-01-09- 01 steht beispielsweise für (Kommunikationstechnik, Bürotechnik)/(Hardware)/(Computer).
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2: Beispielklassifizierung Bohrmaschine mit eCl@ss (Quelle: eCl@ss e.V, 2017)
Das Ziel von eCl@ss ist unter anderem die Vereinheitlichung der Produktbeschreibungen sowie die Vereinfachung einer sys- tematischen Suche innerhalb eines großen Datenbestands. Durchgängige Prozesse ohne Systembrüche entlang der Wert- schöpfungskette gehören auch zu den Zielen von eCl@ss.
5.1 Abgrenzung von eCl@ss
Der Begriff eCl@ss wird oft in Zusammenhang mit Katalogaus- tauschformaten wie z.B. BMEcat verwendet. Klassifizierungs- standards wie eCl@ss müssen jedoch abgegrenzt werden von Katalogaustauschformaten. Katalogaustauschformate beinhal- ten unter anderem Informationen über den Preis und die Liefer- bedingungen und dienen dazu Katalogdaten zu transportieren.
5.2 Aufbau und Datenstruktur von eCl@ss
eCl@ss ist hierarchisch aufgebaut und besteht aus mehreren zehntausend Klassen, Eigenschaften sowie einer noch größeren Anzahl an Klasseneigenschaftsbeziehungen.
Insgesamt besteht das eCl@ss Klassifizierungssystem aus drei Komponenten. Zum einen aus der vierstufigen Klassifikation selbst, welche sich unterteilt in Sachgebiete, Hauptgruppen, Gruppen und Untergruppen. Und zum anderen aus Merkmalen und Schlagworten (Abbildung 3, vgl. eCl@ss e.V, 2017).
Die Granularität der Klassifikationen ist in der vierten Ebene, der „Untergruppe“, am höchsten und beschreibt konkrete Pro- dukte, welche wiederum mit Merkmalen und Schlagworten in Beziehung stehen. Sachgebiete, Hauptgruppen und Gruppen hingegen beschreiben noch keine konkreten Produkte, sondern Branchen oder Anwendungsbereiche (vgl. eCl@ss e.V, 2017).
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 4: eCl@ss Schlüsselnummer (Quelle: eigene Darstel- lung, in Anlehnung an: eCl@ss e.V, Kuhlins & Ströbel o.J.)
Durch die Nutzung von Klassen können Produkte zu einer ein- heitlichen Warengruppe zusammengefasst werden. Schlagwor- te hingegen stehen mit Klassen in Beziehung und vereinfachen und standardisieren so die Suche nach Produkten. Merkmale sind konkrete Produktattribute und beschreiben diese noch
detaillierter. Beispiele für Merkmale eines Produktes sind der konkrete Preis, die Abmessungen oder auch das Gewicht etc. (Abbildung 5) (vgl. eCl@ss e.V, 2017).
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 3: Hierarchieebenen eCl@ss (Quelle: eCl@ss e.V, 2017)
Jede Produktklassifikation in eCl@ss ist durch eine achtstellige Nummer gegenzeichnet (Abbildung 4). Die Nummer 24-01-09- 01 steht beispielsweise für (Kommunikationstechnik, Bürotechnik)/(Hardware)/(Computer).
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 4: eCl@ss Schlüsselnummer (Quelle: eigene Darstel-lung, in Anlehnung an: eCl@ss e.V, Kuhlins & Ströbel o.J.)
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 5: ER-Diagramm eCl@ss (Quelle: eigene Darstellung, in Anlehnung an: eCl@ss e.V, Kuhlins & Ströbel o.J.)
eCl@ss verwendet für die praktische Umsetzung von Produkt- klassifikationen Taxonomien (Abbildung 6). Taxonomien sind hierarchische Klassifikationsmodelle von Begriffen über eine Domäne. Taxonomien erlauben es Klassen, Unterklassen und deren Beziehungen zueinander abzubilden.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 6: eCl@ss Taxonomie (Quelle: eCl@ss e.V, 2017)
Taxonomien sind in eCl@ss nach der Baumstruktur aufgebaut. Die Verwendung der Baumstruktur als Datenstruktur für die Klassifizierung von Begriffen und Beziehungen einer Domäne, erlaubt es mehrere Abstraktionsebenen abzubilden (Abbildung 7).
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 7: Taxonomie Datenstruktur (Quelle: eigene Darstel- lung)
eCl@ss basiert aus der technischen Perspektive auf der Basis- technologie XML (Abbildung 8). Mittels Tags wie z.B. <eClass ></eClass> oder <Merkmale></Merkmale> können Produkte oder Dienstleistungen hierarchisch beschrieben werden. Dabei ist es bei eCl@ss möglich, ein Produkt oder Dienstleistung mit über 30 Merkmalen zu beschreiben (vgl. eCl@ss e.V, 2017).
Abbildung 8: eCl@ss in XML ss (Quelle: eigene Darstellung, in Anlehnung an: eCl@ss e.V, Kuhlins & Ströbel o.J.)
6. Ontologien
Der Begriff der Ontologie hat seinen begrifflichen Ursprung aus der Metaphysik, einem Teilgebiet der Philosophie und beschäf- tigt sich mit der Frage warum etwas existiert. In diesem Beitrag wird jedoch nur der Ontologie-Begriff in Bezug auf die wissen- schaftliche Disziplin der Informatik betrachtet (vgl. Noy & McGuinness, 2001).
Ontologien sind aus der Perspektive der Informatik ein Teilge- biet der Künstlichen Intelligenz. Ontologien beschreiben aus der Perspektive der Informatik eine formale Beschreibung von Kon- zepten und deren Beziehungen, innerhalb einer Wissensdomä- ne. Ontologien stellen somit eine Wissensdatenbank über ein oder mehrere Fachgebiete dar. Ontologien verkörpern somit ein Netz von Hierarchien, indem Informationen über ein oder mehrere Domänen über logische Beziehungen in Verbindung stehen (Abbildung 9). Ontologien enthalten sowohl Wissen über spezielle Themengebiete als auch Allgemeinwissen. Aus diesem Grund werden Ontologien oft als Wissensrepräsentationsspra- che bezeichnet.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 9: Ontologie mit T-Box und A-Box (Quelle: eigene transitiveProperty p+ ⊆ P Darstellung) functionalProperty T ⊆ ≤ 1P
Der grundlegende Aufbau einer Ontologie gliedert sich in meh- rere Bestandteile:
- Klassen: Klassen repräsentieren Konzepte über eine Domä- ne. Klassen enthalten Merkmale und sind mittels Relationen mit anderen Klassen logisch verbunden. Ein konkretes Bei- spiel für eine Klasse wäre z.B. die Klasse „Haus“, „Stadt“ o- der „Land“. In diesem Fall wäre die Klasse Haus eine Sub- klasse von Stadt.
- Merkmale: Merkmale beschreiben mittels Eigenschaften Klassen. Konkrete Merkmale einer Klasse Haus wären bei- spielsweise die Eigentümer, Verkehrswert oder Adresse etc.
- Typen: Typen repräsentieren Datentypen von Merkmalen und spezifizieren diese.
- Relationen: Relationen repräsentieren Beziehungen von Klassen und Instanzen zueinander. Ein konkretes Beispiel für eine Relation zwischen zwei Klassen wäre z.B. Stadt:Berlin Relation:istHauptstadtvon Land:Deutschland Allgemeine Relationen werden in der T-Box verwendet und konkrete Relationen in der A-Box.
- Instanzen: Instanzen repräsentieren konkrete Objekte einer Klasse bzw. einer Ontologie. Jede Instanz kann mehrere konkrete Merkmale besitzen, welche diese näher beschrei- ben. Ein konkretes Beispiel für eine Instanz wäre z.B. die Stadt Stuttgart als Instanz der Klasse Stadt.
- Vererbung: Mittels Vererbung und Mehrfachvererbung ist es möglich dass eine Subklasse die Eigenschaften, Merkma- le und Relationen ihrer Mutterklasse erbt.
- Axiome: Axiome stellen wahre und logische Fakten bzw. Aussagen innerhalb einer Ontologie dar. Axiome werde da- zu verwendet um die Grenzen der Ableitung von Wissen durch Inferenz zu überwinden. Axiome können mittels DL-Description Logic beschrieben werden welche zu Prädikats-logik erster Stufe gehört (Tabelle 1).
Abbildung in dieser Leseprobe nicht enthalten
Tabelle 1: Axiome - Description Logic (Quelle: Horrocks, Patel- Schneider, & Van Harmelen, 2002, S. 3)
Ontologien wurden unter anderem entwickelt um Informatio- nen, Content und Daten etc. für Maschinen, insbesondere für Computer semantisch interpretierbar zu machen. Das Ziel von Ontologien ist es bestehendes Wissen zusammenzufügen, in bestehenden Wissenskonzepten zu suchen bzw. dieses zu er- weitern sowie unbekanntes Wissen aus Wissenskonzepten lo- gisch abzuleiten (vgl. Noy & McGuinness, 2001).
Ontologien als persistenter Datenspeicher, können im Gegen- satz zu einer Datenbank, aus ihrem domänenspezifischen Da- tenpool, selbstständig neues Wissen ableiten sowie Widersprü- che erkennen. Außerdem wird die Struktur der Ontologie mit jedem automatisierten Erkenntnisgewinn erweitert (vgl. Noy & McGuinness, 2001)
Das logische Schlussfolgern aus Ontologien, wird durch Infer- enzregeln bzw. Reasoning umgesetzt. Eine sehr verbreitete Sprache um logische Inferenzregeln zu definieren ist SWRL- Semantic Web Rule Language (Abbildung 10).
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 10: SWRL-Rules, Protégé Ontology (Quelle: eigene Darstellung, in Anlehnung an: Stanford University, 2017)
[...]