Big Data im Fußball. Technische Grundlagen der Datensammlung und -analyse und ihre Auswirkungen auf den Fußball


Textbook, 2018
71 Pages

Excerpt

Inhaltsverzeichnis

Abkürzungsverzeichnis

Abbildungsverzeichnis

Tabellenverzeichnis

1 Einleitung

2 Big Data
2.1 Definition
2.2 Big Data im Fußball
2.3 Verschiedene Daten im Fußball

3 Datensammlung im Fußball
3.1 Regelungen der FIFA und der DFL
3.2 Trackingsysteme
3.3 Sensoren
3.4 Zukunft und Innovationen aus anderen Sportarten

4 Cloud Computing
4.1 Definition und Eigenschaften
4.2 Cloud-Servicemodelle
4.3 Cloud Typen
4.4 Abgrenzung zu anderen Technologien

5 In-Memory-Systeme
5.1 Definition und Funktionsweise
5.2 Vorteile
5.3 Herausforderung

6 Analyse von In-Memory Systemen im Fußball
6.1 Aktuelle Situation
6.2 Vorgehensweise
6.3 Analyse

7 SAP Sports One
7.1 Systemgrundlage
7.2 Entwicklungshistorie
7.3 Anwendungen

8 Fazit

Literaturverzeichnis

Anhang

Anlage A1: E-Mail von „Opta“ mit Definitionen für Fußballstatistiken

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

Abbildungsverzeichnis

Abbildung 1: Statistik WM-Halbfinal 2014. Quelle: Kicker.de (2014), eigene Darstellung

Abbildung 2: (b) X- und Y-Werte der Spieler; (c) Darstellung der Werte. Quelle: Memmert and Raabe (2017), S. 5

Abbildung 3: Spielszene aus dem Spiel Bremen gegen Köln. Quelle: Memmert and Raabe (2017), S. 162

Abbildung 4: Spielszene aus Abb. 3 im Voronoi Diagramm. Quelle: Memmert und Raabe (2017), S. 162; eigene Bearbeitung

Abbildung 5: GPS-Trackingsystem. Quelle: bvb.de (2017)

Abbildung 6: (a) Geteilter FSB, (b) QPI. Quelle: Plattner und Zeier (2012), S. 14

Abbildung 7: Entwicklung der Kosten von Speicherkapazität. Quelle: Plattner und Zeier (2012), S. 10

Tabellenverzeichnis

Tabelle 1: Tab. 1: Zugriffszeiten verschiedener Arten von Speichern. Quelle: o. V. (2017): „Zugriffszeit“; eigene Darstellung

Tabelle 2: Beispiel mit fiktiven Werten. (Eigene Darstellung)

1 Einleitung

„Der Ball ist rund und das Spiel dauert 90 Minuten“ [1], so beschrieb der ehemalige Bundestrainer Sepp Herberger einst das „Lieblingsspiel“ der Deutschen.

„Geht’s raus und spielt’s Fußball“ [2], gab Franz Beckenbauer seiner Weltmeistermannschaft von 1990 mit auf den Weg.

Ganz so einfach stellt sich der Fußball in der heutigen Zeit aber nicht mehr dar. Heute bestimmen Taktikdebatten oder Diskussionen über den „Laptop-Trainer“ [3] den Fußball. Auch die Digitalisierung macht vor dem Fußball nicht halt. Tracking-Geräte, Sensoren und Ähnliches haben schon lange den Weg in den Fußball geschafft. Es werden viele Daten gesammelt und somit ist auch der Begriff „Big Data“ im Fußball kein Fremdwort mehr. Stellt sich nur die Frage: Wie soll mit all diesen Daten umgegangen werden? Eine Möglichkeit dafür liefert die SAP mit ihrem Produkt „Sports One“. Dies ist ein In-Memory-System auf Grundlage von SAP HANA und ermöglicht die Analyse von Daten in Echtzeit. Außerdem hilft es beim Zusammentragen der Daten in einem System.[4]

Außerdem besteht noch eine zweite Frage: Wie können die Daten gewinnbringend genutzt werden? Um dieser Fragestellung auf den Grund zu gehen, folgt ein kurzer Exkurs in eine andere Sportart, den Baseball. Dort spielen Statistik und Daten mittlerweile eine große Rolle. Dort ist oft von „Moneyball“ die Rede. Dieses Prinzip beruht auf den Lehren von Bill James, einem großen Baseballfan und Statistiker. Umgesetzt wurde es sehr erfolgreich vom Team der „Oakland Athletic’s“ (kurz: „A’s“) und ihrem Manager Billy Beane. Eigentlich ist das Prinzip relativ einfach, denn es geht darum sich auf statistische Auswertungen zu verlassen und sich so Vorteile gegenüber anderen Teams zu schaffen. Dies half dem Team der A’s dabei sich Vorteile auf dem Transfermarkt zu schaffen. Sie konnten so ein Team aus Spielern zusammenstellen, die von allen anderen Teams unterschätzt und übergangen wurden, alles nur mithilfe von Statistik und Daten. Damit schafften die A’s es den finanziellen Nachteil gegenüber Schwergewichten, wie z. B. den „New York Yankees“ oder den „Bosten Red Sox“, auszugleichen. Nun könnte man denken: Schön und gut sie haben ein Team aus statistisch gleichwertigen Spielern aufgestellt, aber das bringt noch lange keinen Erfolg. Aber dem war nicht so. Die Oakland A’s schafften es zwischen 2000 bis 2003 drei Mal in die Play-offs und damit nicht genug. Im Jahr 2002 schafften es die A’s die längste Siegesserie der Baseballgeschichte aufzustellen. Sie blieben 20 Spiele am Stück ungeschlagen. Man sieht also im Baseball kann diese Strategie von Erfolg gekrönt sein. Die Thematik hat sogar so viel Aufsehen erregt, dass die Geschichte der Oakland A’s verfilmt wurde.[5] „Moneyball“ ist der Titel des Films und er ist mit bekannten Schauspielern, wie Brad Pitt und Jonah Hill, besetzt.[6]

Natürlich erfuhren durch diesen Film Sportfans auf der ganzen Welt von der Erfolgsstory der A’s und begaben sich auf die Suche nach der Umsetzung dieser Idee in ihrer Sportart. So auch im Fußball und die Suche brachte einen Treffer: Den FC Midtjylland, der wohl aktuell interessanteste Verein im europäischen Fußball. Der Verein ist in der dänischen Stadt Herning beheimatet und wurde 2014 vom englischen Geschäftsmann Matthew Benham übernommen. Benham gehören ein Unternehmen, das aufgrund statistischer Analysen auf Fußballspiele wettet, und der englische Verein FC Brentford. Er verpasste dem FC Midtjylland eine komplett neue Strategie. Diese besteht darin Daten zu nutzen, sowohl im Scouting-Bereich, als auch bei der Vor- und Nachbereitung von Spielen und dem Training. Es wird also versucht die Vorgänge innerhalb des Vereins durch statistische Analysen und mathematischen Methoden zu verbessern. Ein Beispiel dafür ist ein internes Ranking, das alle europäischen Mannschaften miteinander vergleicht und dadurch eine Tabelle erstellt. Dabei werden Wettbewerbe und Spielklassen ausgeklammert und nur die Spielstärke der Mannschaften bewertet. So ist beispielsweise ein Verein, wie der niederländische Erstligist FC Utrecht, unter den ersten fünf in diesem Ranking zu finden. Dieses Ranking hilft auch bei Transferfragen. Beispielsweise verpflichtete der FC Midtjylland in der Saison 2014/15 den Spieler Tim Sparv vom deutschen Zweitligisten Greuther Fürth. Warum gerade dieser Transfer? Die Antwort ist statistisch gesehen ziemlich simpel. Das Ranking zeigte, dass Greuther Fürth von der Spielstärke auf einem Level mit Vereinen aus dem unteren Drittel der englischen Premier League spielte. Weiter wurde mit diesem System herausgefunden, dass Tim Sparv als defensiver Mittelfeldspieler einen großen Anteil an dem Platz im Ranking hatte. So wurde der Spieler für nur 300.000 € verpflichtet und schlug sehr erfolgreich ein. Wie schon erwähnt spielen Daten auch bei Trainingseinheiten und Spielen eine große Rolle. So werden oft Standardsituationen, wie Ecken und Freistöße, trainiert. Auch hier die Frage: Warum? Wieder ist die Antwort ziemlich einfach. Aus einem Standard kann mit wenig Aufwand viel Ertrag, also ein Tor, erzielt werden. Auch hier zahlt sich diese Überlegung aus. In der Saison 2014/15 erzielte die Mannschaft mehr als ein Tor pro Spiel nach Standards. Bleibt nun die Frage nach dem Erfolg zu beantworten. Die Antwort: Ja. In der Saison 2014/15 wurde der FC Midtjylland zum ersten Mal in seiner Geschichte dänischer Meister.[7] In der aktuellen Saison 2017/18 steht der Verein auf dem zweiten Platz der Tabelle.[8] Natürlich bleibt die Frage nach dem langfristigen Erfolg, welche sich aber erst im Laufe der Zeit beantworten wird. Es wird sich also noch zeigen, ob dieser Ansatz wirklich revolutionär ist.

Diese Bachelorarbeit beschäftigt sich mit genau diesen Themen: Big Data und einem System zur Analyse dieser Daten. Im Bereich von Big Data beschäftigt sich diese Arbeit mit einer Definition des Begriffs und dem Zusammenhang von Big Data und Fußball. Des Weiteren wird ein kurzer Überblick über Daten, die im Fußball genutzt werden gegeben. Außerdem wird ein Einblick in die Methoden, mit denen die Daten gesammelt werden, gegeben und welche Vorschriften es hinsichtlich des Einsatzes von Geräten zur Datensammlung im Fußball gibt. Dabei dreht es sich um Trackingsysteme, Sensoren, Methoden aus anderen Sportarten und um zukünftige Innovationen. Danach widmet sich diese Arbeit einem System, mit dem die Daten zusammengeführt, analysiert und verwaltet werden können, dem System „Sports One“ von SAP. Im ersten Schritt geht es darum, die technischen Grundlagen des Systems kennenzulernen. Dabei handelt es sich um Cloud Computing und In-Memory-Systeme. Danach erfolgt eine Analyse, ob In-Memory-Systeme im Fußball sinnvoll sind. Dabei wird kurz die aktuelle Situation dieser Technik im Fußball beleuchtet. Nach der Analyse widmet sich diese Arbeit dann dem SAP-System „Sports One“. Dabei wird kurz auf die Systemgrundlage („SAP HANA“) und die historische Entwicklung dieses Systems eingegangen. Im letzten Schritt wird dann kurz auf die einzelnen Anwendungen von „Sports One“ eingegangen, die sich von der mobilen Kommunikation und dem Scouting bis zur Teamverwaltung erstrecken. Im letzte Kapitel wird dann ein Fazit im Hinblick auf die Zukunft von Analysesystemen im Fußball, Big Data und die Zukunft des Fußballs mit all den technischen Innovationen gezogen.

2 Big Data

2.1 Definition

Grundsätzlich ist die Verarbeitung von großen Datenmengen nichts Neues, denn sie existierte schon lange bevor die breite Öffentlichkeit davon erfahren hat. Durch Open Source-Komponenten (wie z. B. Hadoop oder MapReduce) ist die grundlegende Technologie der IT-Gemeinschaft schon einige Jahre zugänglich.[9]

Die am häufigsten verwendete Definition ist aber die der drei bzw. vier V’s (Volume, Velocity, Variety und Veracity).[10] Bei dieser Definition wird allerdings von Einigen die zu Informatik lastige Sichtweise kritisiert. Diese Kritiker sehen dabei die Sichtweise der Nutzer als wichtiger an und definieren diese bspw. über die 3 F‘s: Fast (schnell), flexibel und focused (fokussieren).[11]

Bei dieser Arbeit steht aber die weiter verbreitete Definition der drei bzw. vier V’s im Vordergrund. Diese V‘s beziehen sich auf die Eigenschaften von Big Data. Im Folgenden werden diese nun einzeln erklärt.

2.1.1 Volume

Die Eigenschaft Volume (deutsch: Volumen) assoziiert man wohl als erstes mit dem Begriff Big Data. Dabei geht es darum, dass es immer mehr erzeugte Daten gibt. Diese entstehen durch die steigende Rechenleistung, welche das Mooresche Gesetz erklärt: Es besagt, dass sich innerhalb eines Zeitraums von ca. zwei Jahren die Anzahl der auf einem Chip verbauten Transistoren verdoppelt, d. h. dadurch erhöht sich auch die Geschwindigkeit in der die Daten erzeugt werden. Diese Gesetzmäßigkeit besteht seit 1965, aber sie scheint ihrem Ende entgegen zu gehen, denn die physischen Grenzen der Verkleinerung sind langsam erreicht.[12]

Wichtig ist hier auch die Entwicklung der Speichermedien, denn die Daten müssen irgendwo gespeichert werden. Heute bekommt man USB-Sticks mit einem Speicher von mehreren Gigabyte, was früher noch Aufsehen erregt hätte, wenn ein Computer diese Speicherkapazität gehabt hätte. Heute sind bei einem Laptop oder Computer mehrere Terrabyte normal.[13]

Im Jahr 2016 lag die jährlich weltweit generierte digitale Datenmenge bei 16,1 Zettabyte und für 2025 sieht die Prognose ein Volumen von 163 Zettabyte voraus. Ein Zettabyte entspricht ca. einer Billion Gigabyte.[14]

2.1.2 Velocity

Bei der zweiten Eigenschaft Velocity (deutsch: Geschwindigkeit) gibt es unterschiedliche Interpretationen. Zum Teil wird damit die Geschwindigkeit, in der neue Daten entstehen, beschrieben[15], Andere verbinden damit die Geschwindigkeit in der die Daten erzeugt und verändert werden.[16] Eine weitere Interpretation ist, dass darunter die Geschwindigkeit, in der die Daten in den Systemen und Computern verarbeitet werden (also die Verarbeitungsgeschwindigkeit), verstanden wird.[17]

Durch die zunehmenden Daten und die Geschwindigkeit (egal in welcher Interpretation) in der diese anfallen, wird der Zeitraum in dem die Daten gewinnbringend genutzt werden können immer kleiner. Das bedeutet, dass schneller auf die Daten reagiert werden muss, am besten sogar in Echtzeit. Dies stellt somit die Anforderungen für Analysesysteme.[18]

2.1.3 Variety

Die dritte Eigenschaft Variety (deutsch: Vielfalt) bezieht sich auf die Vielzahl von möglichen Formaten in denen die Daten auftreten können und die Quellen der Daten. Dabei kann es sich um strukturierte und unstrukturierte Daten handeln, wobei es sich bei Big Data größtenteils um unstrukturierte Daten handelt.[19] Strukturierte Daten sind beispielsweise Kundenstammdaten in einer Tabelle oder in relationalen Datenbanken.[20] Unter unstrukturierten Daten versteht man Daten, die in keine vorher festgelegte Datenbank passen. Beispiele hierfür sind Texte (z. B. auch in sozialen Netzwerken), Audiodateien oder auch Videos.[21] Die Quellen dieser Daten sind ebenso sehr vielfältig. Beispiel dafür sind z. B. Transaktionen, E-Mails und Soziale Medien.[22]

2.1.4 Veracity

Bei einigen Definitionen (z. B. IBM) wird noch ein viertes V ergänzt. Bei dieser Eigenschaft dreht es sich um die Richtigkeit (=Veracity), Qualität und Vertrauenswürdigkeit der Daten. Hierbei sind Big Data Tools nötig, die aus den Daten wichtige Informationen herausfiltern und den Rest nicht beachtet.[23] Ein gutes Beispiel dafür sind Daten aus sozialen Netzwerken, wie z. B. von Usern verfasste Texte. Diese sind oft von persönlichen Empfindungen oder Gefühlen geprägt und müssen in einem zeitlichen und inhaltlichen Zusammenhang gesehen werden.[24] Die Daten können in ihrer Richtigkeit auch verfälscht werden. Dies kann z. B. bei automatisch übersetzten Texten (bspw. mit „Google Übersetzer“), Werbung, Spam oder auch über gezielte Falschinformationen bzw. -aussagen geschehen.[25]

2.2 Big Data im Fußball

Das Thema Big Data ist mittlerweile auch im Fußball angekommen. Der Fußball erzeugt mittlerweile eine riesige Menge an Daten. Diese müssen ausgewertet, analysiert und aufbereitet werden, damit aus den Daten die richtigen Schlüsse gezogen werden können. Damit sollen wiederum Trainer, Spieler und Manager unterstützt werden. Bei den Daten handelt es sich mittlerweile nicht mehr nur noch um die allseits bekannten Begriffe, wie z. B. Zweikampfquote, gelaufene Strecke oder Torschüsse. Nein, die eben genannten Begriffe geben zwar für den Zuschauer einen schönen Einblick ins Spiel, aber viel mit dem Spielausgang haben sie nicht zu tun.[26] Ein Beispiel dazu: WM-Halbfinale 2014, Deutschland gegen Brasilien, Endergebnis 7:1 für Deutschland. Betrachten wir zu diesem Spiel nun die Statistiken, wie die oben genannten z. B. Torschüsse, Ballbesitz und Passquote (siehe Abb. 1).

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Statistik WM-Halbfinal 2014. Quelle: Kicker.de (2014), eigene Darstellung

Die Brasilianer haben in diesem Spiel häufiger auf das deutsche Tor geschossen als umgekehrt. Ebenso haben sie eine höhere Quote angekommener Pässe als die Deutschen und der Ballbesitz ist mit 47% Brasilien und 53% Deutschland nahezu ausgeglichen. Trotzdem gewinnt Deutschland dieses Spiel mit 7:1. Daran kann man sehen, dass diese Daten bzw. Statistiken nicht unbedingt die Aussagekräftigsten sind.[27]

Es gilt also herauszufinden, welche Daten wirklich Schlüsse für den Ausgang eines Spiels geben, um sich so einen Vorteil zu erarbeiten.

Einen solchen Ansatz verfolgt Prof. Dr. Daniel Memmert von der Deutschen Sporthochschule in Köln. Er und der Sportinformatiker Prof. Dr. Jürgen Perl haben zusammen das von der DFL (Deutsche Fußball Liga) ausgeschriebene Projekt „Positionsdaten im Profifußball“ durchgeführt. Bei diesem Projekt wurden neu entwickelte Key-Performance-Indikatoren (KPI) festgelegt. Diese wurden dann mit Hilfe des Analysetools „Soccer“ von Jürgen Perl bei 50 Spielen in der Bundesliga angewendet, analysiert und ausgewertet. Ziel ist es gewesen, dass diese KPI automatisch analysiert werden (mehr zu den Positionsdaten und KPI in Kap. 2.3). Das Analysetool setzt sich aus neuronalen Netzen, herkömmlicher Datenanalyse und dynamischen Zustand-Ereignis-Modellierung zusammen.[28]

Eine weitere Kennzahl ist die Packing-Rate, welche die Anzahl der überspielten Gegner misst (auch hierzu mehr im Kap. 2.3). Diese Kennzahl wurde vom ehemalige Bundesligaprofi Stefan Reinartz und seinem Unternehmen „Impect“ entdeckt.[29]

Auch die Quellen der Daten haben sich im Laufe der Jahre verändert. In der Anfangszeit der Spielanalyse im Fußball wurden die Daten noch mit Zettel und Stift erhoben. Über aufgemalte Spielzüge und Passfolgen entwickelten sich mit der Zeit Notationssysteme mit festgelegten Begriffen und Symbolen. Dadurch konnte man Spiele systematischer und verständlicher dokumentieren. Diese Systeme wurden über die Zeit natürlich weiterentwickelt. Das Spielfeld wurde in kleine Felder bzw. Raster aufgeteilt, um den einzelnen Aktionen auch den richtigen Ort zuzuordnen. Diese Art der Aufzeichnung findet auch heute noch in Form von sogenannten „Heat-Maps“ statt. Die Methode des Wissenschaftlers A. H. Ali aus Schottland beruhte auch auf einer Notation mit einem Raster. Er zeichnete die Positionen auf seinen Zetteln als X-Y-Koordinaten ein. Wenn man so will, war diese Notation ein erster Vorläufer der oben erwähnten Positionsdaten. Einziges Problem bei diesen Handnotationssystemen war nur, dass sehr viel Zeit benötigt wurde alles zu dokumentieren und dass sie sehr komplex waren und somit ein Einlernen erforderlich war.[30]

Mit den Innovationen der 90er-Jahre wurden zahlreiche technische Hilfen für die Spielanalyse und die Erfassung der Daten geschaffen. So wurde zwar während der Spiele alles noch mit Zettel und Stift festgehalten, danach aber an Computern in Datenbanken eingepflegt. Außerdem wurden auch nach und nach Videos in der Analyse eingesetzt, was anfangs nur mit Hilfe von VHS-Recordern und -Playern möglich war. Durch die Zunahme der Rechenleistung verlagerte sich dies mit der Zeit aber auf den Computer.[31]

Heutzutage finden sich zahlreiche Möglichkeiten Daten zu sammeln. Dies geschieht über Trackingsysteme, verbesserte Kamerasysteme, Sensoren, Chips, usw..[32] Aber ohne eine sinnvolle Analyse und zeitnahe Verarbeitung (am besten in Echtzeit) ist der Mehrwert dieser erfassten Daten nicht gegeben. Dies versucht beispielsweise die SAP mit ihrer „Sports One“ Lösung zu erreichen. Das System bildet eine Plattform in der alle Daten zusammengetragen werden können. Eine Echtzeitanalyse der Daten wird durch das Grundsystem „SAP HANA“ ermöglicht (in Kap. 7 wird näher auf dieses System eingegangen).[33]

2.3 Verschiedene Daten im Fußball

Im Folgenden geht es darum einen Überblick über die verschiedenen Daten im Fußball zu bekommen. Hierbei werden sowohl die „neuen“ Daten, als auch die „alten“, vielleicht nicht so aussagekräftigen Daten kurz erklärt.

2.3.1 Positionsdaten

Die Positionsdaten beschreiben den Aufenthaltsort eines Spielers während des Spiels oder Trainings. Dabei wird das Spielfeld in ein Koordinatensystem mit X- und Y-Achse verwandelt. Den Spielern kann dann zu jedem Aufenthaltsort ein X- und ein Y-Wert zugeordnet werden (siehe Abb. 2, S. 9). Die Werte können mit Hilfe verschiedener Technologien, wie z. B. spezielle Kamerasysteme oder Sensoren unter oder am Trikot (mehr zu diesen Technologien in Kap. 3), erfasst werden. Diese Werte werden in Echtzeit generiert und können so auch schnellstmöglich genutzt werden. Beispielsweise kann so ein Spielzug, der zu einem Tor oder Gegentor führt, auf Basis der Positionsdaten innerhalb weniger Sekunden in seine Einzelteile zerlegt und ausgewertet werden, sowohl für die eigene Mannschaft als auch für den Gegner. Die Positionsdaten helfen außerdem dabei die Leistungen eines Spielers und der Mannschaft zu bewerten und das auf taktischer, technischer und physischer Ebene. Ziel ist es, dadurch Erkenntnisse für Spiel und Training zu erhalten und sich dadurch einen Vorteil zu erarbeiten. Ein weiteres Ziel ist die Erkennung von Spielmustern im eigenen Spiel und dem des Gegners.[34]

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2: (b) X- und Y-Werte der Spieler; (c) Darstellung der Werte. Quelle: Memmert and Raabe (2017), S. 5

In dem in Kap. 2.2 schon erwähnten Projekt „Positionsdaten im Profifußball“ der Wissenschaftler Memmert und Perl geht es darum aus diesen Positionsdaten neu geschaffene Key-Performance-Indikatoren (KPI) zu berechnen. Diese wurden unter Einbeziehung von neuronalen Netzen (Analysetool „Soccer“ von Perl) automatisch berechnet. Dabei wurden 50 Bundesligaspiele der Saison 2014/15 untersucht und 11.160 Leistungswerte, die dann weiter ausgewertet wurden, ermittelt. Bei dieser Analyse wurden nur Positionsdaten berücksichtigt, d. h. selbst Situationen, wie z. B. ein Ballgewinn oder Ähnliches, werden über die Position der Spieler und des Balls ermittelt. Die Rolle der neuronalen Netze beschreiben Memmert und seine Kollegen wie folgt:

„Der Grundgedanke dabei ist, dass die entwickelten neuronalen Netze es ermöglichen, Spielszenen aus einem Spiel oder aus verschiedenen Spielen miteinander zu vergleichen, um herauszufinden, welche Konstellationen auf dem Platz vorkamen und zu welchen Resultaten sie führten. Voraussetzung ist dafür, dass durch jeden Datensatz in einer Spielsequenz ein Neuron im Netz aktiviert wird. Verbindet man die nacheinander aktivierten Neuronen, dann erhält man eine Trajektorie[[35] ] als Muster der entsprechenden Spielsequenz. Klassen ähnliche[r] Muster von Spielsequenzen sollen nun durch ein neuronales Netz einer höheren Ebene[,] einem gemeinsamen Neuron oder einem Cluster benachbarter Neuronen zugeordnet werden.“[36]

So sollen beispielsweise alle Szenen, die einen kurzen Spielaufbau, also ein vom Torwart flach und kurz rausgespielter Abstoß, zeigen, mit dem Neuron oder Neuronen-Cluster „Spielaufbau“ versehen werden und darüber erkannt werden. Um zu sehen, ob das System auch wirklich zuverlässig funktioniert, wurde die Erkennung mit Hilfe der neuronalen Netze mit der traditionellen Art der Spielanalyse verglichen. Dabei wurde in einem erst Versuch 2011 festgestellt, dass beide zu fast 90% übereinstimmen. Bis 2016 hat sich dieses Ergebnis auf über 95% erhöht.[37]

Nachfolgen werden kurz die gewonnenen KPI erklärt.

Raumkontrolle: Um diesen Indikator zu beschreiben, bedienen sich die Wissenschaftler der Geometrie, nämlich dem Voronoi Diagramm. Mit diesem kann der Raum in Zahlen dargestellt werden. Dabei wird jeder der 22 Spieler als der Mittelpunkt einer Fläche angesehen. Diese Fläche beschreibt alle Punkte, die der Spieler vor einem anderen erreichen kann, d. h. die Berührungspunkte zweier Flächen sind die Punkte, die beide gleichzeitig erreichen können. Aus den gesamten Werten eines Spiels oder einer Halbzeit lassen sich so prozentuale Werte ermitteln, die beschreiben, welche Fläche ein Spieler während des Spiels oder der Halbzeit kontrolliert. Dieser Wert ist vor allem in den gefährlichen Zonen des Gegners (Strafraum und Angriffszone) von großer Bedeutung. Bei dem Projekt von Memmert und Perl wurden zusätzlich noch Pässe einbezogen, also wie sich diese Raumkontrolle bei Ballbesitz und Pässen in die gefährlichen Räume verschiebt und wie Räume in diesen Bereichen gehalten werden können. Dazu als Beispiel die Spielszenen aus Abb. 3 und 4.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3: Spielszene aus dem Spiel Bremen gegen Köln. Quelle: Memmert and Raabe (2017), S. 162

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 4: Spielszene aus Abb. 3 im Voronoi Diagramm. Quelle: Memmert und Raabe (2017), S. 162; eigene Bearbeitung

Diese Szene ist im Moment des Abspiels des Bremers Makiadi (A7, orange) auf Bartels (A8, lila) angehalten. Bremen hat in dem Moment vor dem Abspiel einen Raumkontrollwert von 31,5% in der Angriffszone und 1,9% im Strafraum. Durch den Pass kommen in Angriffszone und Strafraum noch einmal 6% bzw. 11% dazu. Des Weiteren besteht zwischen den Raumkontrollwerten und der tabellarischen Position in der Abschlusstabelle der Bundesliga ein Zusammenhang. So stehen Mannschaften mit einem hohen Raumkontrollwert in der Angriffszone in der Tabelle oben und Mannschaften mit einem niedrigen Wert unten.[38]

Pressinggeschwindigkeit: Hierbei dreht es sich um die Geschwindigkeit, die eine Mannschaft nach einem Ballverlust braucht, um den Druck auf den ballführenden Gegner zu erhöhen, also den Raum um ihn herum einzuengen. Diese Geschwindigkeit wird als Mittel aller Geschwindigkeiten der ballnahen Spieler zu zwei Zeitpunkten (t1 und t2) gemessen. Die Zeitpunkte sind zum einen 3 Sekunden nach dem Ballverlust (t1) und zum anderen nach einer bestimmten zurückgelegten Strecke des Balls (t2).[39]

2.3.2 Packing-Rate

Die Packing-Rate misst die überspielten Gegenspieler. Das Überspielen kann entweder durch Pässe oder Dribblings geschehen. Aufsummiert ergeben die überspielten Gegenspieler die Packing-Rate. Daneben gibt es noch die Kennzahl „Impect“, die speziell die überspielten Verteidiger misst, da durch das Überspielen der Verteidiger die Chance ein Tor zu erzielen wesentlich steigt.[40] Diese Kennzahl wurde von der Firma „Impect“ erfunden bzw. entdeckt. Diese Firma wurde von dem ehemaligen Bundesligaprofi Stefan Reinartz mitgegründet. Zur Ermittlung der Kennzahl beauftragten sie das Institut für Kognitions- und Sportspielforschung der Deutschen Sporthochschule in Köln. Dieses Institut zählte in 150 Bundesligaspielen die überspielten Gegenspieler. Nach Auswertung der Zahlen fiel auf, dass im Großteil der Spiele die Mannschaft gewann, die eine größere Anzahl an Gegnern überspielt hatte. Auch auf das Scouting von Spielern hat diese Zahl eine Auswirkung. So verpflichtete ein Ex-Verein von Reinartz, Bayer Leverkusen, den Spieler Kevin Kampl auf Grundlage dieser Zahlen.[41]

2.3.3 Einige „alte“ Statistiken

Bei den Statistiken, wie Ballaktion, Torschuss und Zweikampf, gibt es meist keine einheitliche Definition, da es oft auch auf den Datensammler der entsprechenden Firma ankommt und wie er eine Situation beurteilt. Diese Datensammler haben wiederum aber einige Vorgaben der Firma. Deshalb habe ich mich bei der Firma „Opta“ (ein Unternehmen das Daten für die Bundesliga sammelt) nach Definitionen bzw. Richtlinien erkundigt (siehe Anlage A1).

Ballaktion: Mit dieser Statistik wird die Anzahl der Aktionen von einem Spieler am Ball gemessen. Früher wurde diese Kennzahl als Ballkontakt bezeichnet. Eine Ballaktion ist mindestens eine Ballberührung, d. h. eine Ballaktion beinhaltet, dass man mit dem Ball läuft und ihn dabei berührt, auch mehrere Ballberührungen sind dabei eine Ballaktion. Ballaktionen sind beispielsweise Pässe, Torschüsse, klärende Aktionen, Dribblings, Tacklings und auch unkontrollierte Ballberührungen aber nicht verlorene Luftzweikämpfe.[42] Den Rekord in der Bundesliga hält Julian Weigl von Borussia Dortmund mit 214 Ballaktionen im Spiel 2016 gegen den 1. FC Köln.[43]

Torschuss: Bei einem Torschuss gibt der Definitionskatalog von „Opta“ keine genauere Definition, wann ein Schuss ein Torschuss ist. Aber es gibt einige „ungeschriebene Regeln“. Vor allem ist es wichtig, dass der Spieler mit dem Schuss ein Tor erzielen will. Außerdem wird der Schuss nur als solcher gewertet, wenn er nach vorne geht.[44]

Zweikampf: Bei Zweikämpfen geht es grundsätzlich darum, dass es ein Duell zwischen zwei Spielern ist. Aber es gibt natürlich viele unterschiedliche Arten von Zweikämpfen.

- Luftzweikämpfe definieren sich dadurch, dass zwei Spieler zu einem hohen Ball springen und beide so nahe zum Ball sind, dass sie sich darum duellieren. Außerdem muss einer der Spieler den Ball berühren. Gewonnen hat der Spieler, der den Ball am Ende behauptet.45
- Eine weitere Art ist der normale Zweikampf, um einem Gegenspieler den Ball abzunehmen, also das „Tackling“. Dabei wird zwischen einem gewonnenen und einem verlorenen Tackling unterschieden. Gewonnen ist es, wenn der Spieler, der das Tackling durchführt, danach den Ball hat, wenn die Mannschaft des Spielers den Ball bekommt oder wenn der Ball ins Aus geht. Verloren ist das Tackling, wenn Gegner den Ball zurückbekommt.45
- Auch ein Dribbling wird als Zweikampf gewertet. Gewonnen ist dieses, wenn ein Spieler seinen Gegner umdribbelt und den Ballbesitz behält. Der Gegner muss dabei nahe genug stehen, um ein Tackling machen zu können. Wenn bei dem Dribbling mehrere Gegner umspielt werden, wird für jeden umdribbelten Gegner ein gewonnener Zweikampf notiert. Verloren ist der Zweikampf hier, wenn dem Spieler der Ball abgenommen wird.45
- Ein Zweikampf mit dem Torwart ist gegeben, wenn es eine Eins gegen Eins Situation gibt. Der Torwart gewinnt, wenn er dem Gegner den Ball abnimmt.45
- Auch Fouls, die zu Freistößen führen, werden als Zweikämpfe gewertet.[45]

3 Datensammlung im Fußball

3.1 Regelungen der FIFA und der DFL

Das oberste Organ der FIFA in Sachen Regeln ist das International Football Association Board (IFAB), das sich aus FIFA- Funktionären und Vertretern der britischen Fußballverbände zusammensetzt. Das IFAB beschließt auf seinen Sitzungen Regeländerungen und überwacht diese. Auf der 129. Sitzung des IFAB 2015 wurde das Sammeln von Daten während eines Spiels mit Hilfe von Mikrochips prinzipiell erlaubt.[46] Die endgültige Entscheidung zum Einsatz solcher Technologien liegt aber bei den jeweiligen Verbänden. Es müssen aber einige grundlegende Bedingungen erfüllt sein:47

1. Die Technologie, die die Spieler tragen, darf in keinem Fall die Gesundheit eines Spielers beeinträchtigen. Die Geräte müssen vor dem Spiel von den Schiedsrichtern bzw. einem FIFA-Offiziellen kontrolliert werden und dürfen nur getragen werden, wenn diese sie genehmigen.47
2. Die von den Geräten erzeugten Daten dürfen nur intern genutzt werden und nicht für kommerzielle Zwecke an Dritte weitergegeben werden.47
3. Auf den Geräten darf kein Zeichen der Marke oder Dritter zu sehen sein.47
4. In der technischen Zone (Coachingzone, Auswechselbank) sind keine technischen Geräte erlaubt, ebenso dürfen dort keine Informationen von solchen Geräten genutzt werden.[47]

Die DFL sammelte schon seit der Saison 2011/12 in der Ersten und Zweiten Bundesliga Daten mit Hilfe von Tracking per Video (keine Sensoren oder Ähnliches werden benötigt). Diese Daten wurden zentral von der DFL gesammelt und alle Vereine hatten Zugriff darauf. Der DFB bzw. als Organ der Bundesliga die DFL (Deutsche Fußball Liga) entschied sich dazu, den Einsatz dieser Technologien nicht direkt ab der Saison 2015/16 zu erlauben. Erstmals erlaubt wurden die „Elektronischen Leistungs- und Aufzeichnungssysteme“ (ELAS) ab der Saison 2016/17. Diese Entscheidung wurde von den Vereinen getroffen. Wenn ein Verein nun ELAS nutzen möchte, muss er einen Antrag bei der DFL stellen. Dabei muss auch das Gerät, mit dem die Daten gemessen werden, eingereicht werden. Genehmigt die DFL dieses, können sie von den Vereinen nach den Vorschriften der FIFA genutzt werden.[48]

3.2 Trackingsysteme

3.2.1 GPS-Systeme

Sieht man in der heutigen Zeit einen Fußballprofi beim Training mit etwas, was eigentlich nach einem Sport-BH für Frauen aussieht, herumlaufen (siehe Abb. 6), wundert man sich nicht mehr unbedingt, aber anfangs war es doch ein etwas ungewohnter Anblick.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 5: GPS-Trackingsystem. Quelle: bvb.de (2017)

Dabei dienen diese Brustgurte einem ganz einfachen Zweck und zwar steckt in ihnen ein kleiner Transponder, der ein Signal sendet, um den Spieler per GPS zu erfassen. Im Endeffekt funktioniert das wie bei einem Smartphone. Vorteil dieses Trackingsystems ist natürlich zum einen, dass es extrem einfach ist. Es braucht nicht mehr als den Transponder, ein Gerät, das die Daten empfängt und einen Akku für die Stromversorgung. Des Weiteren können durch den Brustgurt und darin verarbeitete Sensoren auch noch andere Werte, wie z. B. die Herzfrequenz, gemessen werden. Auch andere Dinge zur Unterstützung der Genauigkeit, wie Beschleunigungssensoren, Gyroskope und Kompasse, sind in dem Brustgurt verarbeitet. Ein Problem dieser Technik ist aber, dass die Genauigkeit meist, trotz der eingebauten Hilfsmittel, nicht so hoch ist. Das heißt man weiß zwar über die Bewegungsabläufe auf dem Feld Bescheid, aber wo genau sich diese abspielen, sieht man nicht exakt.[49]

3.2.2 Videosysteme

Dieses Trackingsystem ist nicht auf Geräte angewiesen, die der Spieler an sich tragen muss. Es werden dabei aus unterschiedlichen Perspektiven Videos von Kameras gemacht. Mit Unterstützung von modernen Verfahren der Bildverarbeitung kann so jeder Spieler auf dem Feld erkannt werden und so die einzelnen Laufwege erfasst werden. Diese Systeme arbeiten noch semi-automatisch, d. h. Laufwege, Mannschaftszugehörigkeit und der einzelne Spieler als solcher werden zwar erkannt, aber wer nun der einzelne Spieler ist, muss extra zugeordnet werden. Außerdem haben diese Systeme Probleme, wenn sich die Laufwege kreuzen oder, wenn sich eine Spielertraube bildet, da sie dann meistens die Zuordnung verlieren. Dies muss anschließend wieder von Hand neu zugeordnet werden. Auch die Witterung oder die Beleuchtung beeinflussen das System bei der Erkennung der Spieler. Aufgrund dieser Dinge laufen videobasierte Systeme noch nicht automatisch. Experten denken aber, dass zukünftige Entwicklungen dies ändern könnten.[50]

3.2.3 Radar- bzw. mikrowellenbasierte Systeme

Bei dieser Variante tragen die Spieler auch einen Sensor. Hier wird das Signal allerdings nicht von einem Satelliten erfasst, sondern von festinstallierten Geräten im Stadion. Diese Geräte senden ein Signal an die Sensoren der Spieler. Trifft dieses Signal auf einen der Sensoren, wird von diesem eine elektromagnetische Welle an die Geräte im Stadion zurückgesendet. Daraus ermittelt dann ein zentraler Server mit Hilfe von Triangulation den Standort der einzelnen Spieler. Diese Daten sind dann in Echtzeit verfügbar und geben mit hoher Genauigkeit den Standort wieder. Ein Nachteil dieser Variante ist allerdings, dass die Installation sehr aufwendig ist, da die Geräte im Stadion möglichst hoch angebracht werden müssen. Dies ist vor allem beispielsweise bei Auswärtsspielen eine aufwendige Angelegenheit. Außerdem müssen die Geräte genaustens kalibriert werden, was einen hohen Aufwand bedeutet.[51]

[...]


[1] FAZ.net (2017): „Sportzitate des Tages“

[2] SZ.de (2010): „Franz Beckenbauer - Der weise Kaiser“

[3] Herceg (2017): „Trainer-Abrechnung: Scholl legt nach“

[4] Vgl. Schmitz 2015a): „Was ist eigentlich SAP HANA?“

[5] Vgl. Memmert und Raabe (2017): „Revolution im Profifußball“, S. 87-90

[6] Vgl. Filmstarts.de (2012): „Die Kunst zu gewinnen - Moneyball“

[7] Vgl. Biermann (2016): „Moneyball im Niemandsland“, S. 1-5; Memmert und Raabe (2017), S. 119-123

[8] Vgl. Kicker.de (2018): „ALKA Superliga - Spieltag / Tabelle“

[9] Vgl. Dorschel (2015): „Praxishandbuch Big Data“, S. 3

[10] Vgl. u.a. Davenport (2014), S. 2 ff.; Schroeck et al. (2012), S.4 ff.; TechAmerica Foundation (2012), S. 11

[11] Vgl. Freytag (2014): „Grundlagen und Visionen großer Forschungsfragen im Bereich Big Data“, S. 100

[12] Vgl. Dorschel (2015), S. 7 u. Gruber (2016): „Kleiner geht's nicht“

[13] Vgl. Freiknecht (2014): „Big Data in der Praxis“, S. 10

[14] Vgl. Statista (2017): „Prognose zum weltweit generierten Datenvolumen“

[15] Vgl. Fasel (2014): „Big Data - Eine Einführung“, S. 289

[16] Vgl. King (2014): „Big Data - Potential und Barrieren der Nutzung im Unternehmenskontext“, S. 35

[17] Vgl. Bendler et al. (2014): „Taming Uncertainty in Big Data“, S. 279

[18] Vgl. Klein et al. (2013), S. 320 u. Bendler et al. (2014), S. 279

[19] Vgl. Dorschel (2015), S. 8

[20] Vgl. Klein et al. (2013): „Aktuelles Schlagwort: Big Data“, S. 320

[21] Vgl. Dorschel (2015), S. 8

[22] Vgl. Freiknecht (2014), S. 11-12

[23] Vgl. Zikopoulos (2013): „Harness the power of big data“, S. 14-15

[24] Vgl. Dorschel (2015), S. 8

[25] Vgl. Freiknecht (2014), S. 13-14

[26] Vgl. Memmert und Raabe (2017), S. 1-2

[27] Vgl. Kramer (2017): „Siegen mit Big Data“

[28] Vgl. Memmert und Raabe (2017), S. 8-9

[29] Vgl. Nowroth 2016b): „Packing - Das steckt hinter der statistischen Analyse der Fußball-EM“

[30] Vgl. Memmert und Raabe (2017), S. 24, 31-32

[31] Vgl. Memmert und Raabe (2017), S. 33-37

[32] Vgl. Schramm et al. (2015): „Der gläserne Profi“

[33] Vgl. Lehner und Nier (2015): „Einen Schritt voraus“

[34] Vgl. Memmert und Raabe (2017), S. 4

[35] Trajektorie: Kurve, die sämtliche Kurven einer gegebenen Kurvenschar unter gleichbleibendem Winkel schneidet (Quelle: duden.de)

[36] Memmert et al. (2016): „Innovative Leistungsindikatoren im Profifußball auf der Basis von Positionsdaten“; S. 16

[37] Vgl. Memmert et al. 2016, S. 15-17

[38] Vgl. Memmert und Raabe (2017), S. 158-162; Memmert et al. (2016), S. 19

[39] Vgl. Memmert und Raabe (2017), S. 183; Memmert et al. (2016), S. 19

[40] Vgl. o.V. (2016): Homepage der Firma Impect

[41] Vgl. Nowroth 2016b)

[42] Vgl. Anlage A1

[43] Vgl. Laske (2016): „BVB-Spieler Weigl knackt gegen den FC Köln Liga-Rekord“

[44] Vgl. Anlage A1

[45] Vgl. Anlage A1

[46] Vgl. FIFA (2015a): „129th Annual General Meeting of The International Football Association Board“, S. 6-8

[47] Vgl. FIFA (2015b): „Brief an die Mitglieder der FIFA“

[48] Vgl. Memmert und Raabe (2017), S. 78-84

[49] Vgl. Memmert und Raabe (2017), S. 63-65

[50] Vgl. Memmert und Raabe (2017), S. 65-66

[51] Vgl. Memmert und Raabe (2017), S. 67-68

Excerpt out of 71 pages

Details

Title
Big Data im Fußball. Technische Grundlagen der Datensammlung und -analyse und ihre Auswirkungen auf den Fußball
Author
Year
2018
Pages
71
Catalog Number
V418152
ISBN (eBook)
9783960952923
ISBN (Book)
9783960952930
File size
2141 KB
Language
German
Tags
BWL, Fußball, SAP, In-Memory, SAP Sports One, Sport, Big Data
Quote paper
Daniel Gramlich (Author), 2018, Big Data im Fußball. Technische Grundlagen der Datensammlung und -analyse und ihre Auswirkungen auf den Fußball, Munich, GRIN Verlag, https://www.grin.com/document/418152

Comments

  • No comments yet.
Read the ebook
Title: Big Data im Fußball. Technische Grundlagen der Datensammlung und -analyse und ihre Auswirkungen auf den Fußball


Upload papers

Your term paper / thesis:

- Publication as eBook and book
- High royalties for the sales
- Completely free - with ISBN
- It only takes five minutes
- Every paper finds readers

Publish now - it's free