Click Fraud - Analyse und Methode zur Identifzierung


Diploma Thesis, 2011

114 Pages


Excerpt


Inhaltsverzeichnis

Danksagung

Informationen

Schlagwörter

Abstract

Abbildungsverzeichnis

Tabellenverzeichnis

Listings

1 Einleitung
1.1 Definition
1.2 Motivation der Klickbetrüger
1.3 Hintergrund

2 Online Werbung
2.1 Überblick
2.1.1 Ad-Netzwerke
2.1.2 Seareh Engine Marketing
2.2 Verrechnungsmodelle
2.2.1 Einteilung
2.2.1.1 Cost per view
2.2.1.2 Cost per eliek
2.2.1.3 Cost per aetion
2.2.2 Cost per eliek und Cliek Fraud
2.3 Schädigungspotential von Klickbetrug am Beispiel Unito (Otto und Uni­versal Versand)
2.3.1 Xeukunden
2.3.2 Anteil am Umsatz
2.3.3 Fazit

3 Varianten des Klickbetrug und technische Umsetzung
3.1 Manuelles Klicken
3.2 Automatisierte Verfahren zum Klickbetrug
3.2.1 Cliekbots
3.2.2 Beispiel Cliekbot.A
3.2.2.1 Verbreitung
3.2.2.2 Cliekbot.A Client
3.2.2.3 Cliekbot.A Server
3.2.2.4 Lebenszyklen des Cliekbot.A
3.2.2.5 "Geschäftsmodell" des Cliekbot.A
3.2.2.6 Fazit
3.2.3 Erzwungene Browser-Clieks
3.2.3.1 Ausführbarer Code im Webclient
3.2.3.2 Aufbau einer Badvertisement-Arehitektur
3.2.3.3 Fassadensites
3.2.3.4 Fazit
3.2.4 Social eliek humbuggery

4 Erkennung und Prävention
4.1 Definition invalid eliek
4.2 Erkennung
4.2.1 Verwertbare Eigenschaften eines HTTP-Requests
4.2.2 Operative Definition
4,3 Erkennungsverfahren
4.3.1 Betreiber Suchmaschinen und Ad-Xetzwerke
4.3.1.1 Pre-Filter
4.3.1.2 Online Filter
4.3.1.3 Post-Filter
4.3.2 Werbende Unternehmen
4.3.2.1 Auswertung Traffie
4.3.2.2 Auswertung des geschäftlichen Erfolges

5 Pickwick: Ein Framework zur Identifizierung unerwünschter Klicks
5.1 Einleitung
5.1.1 Umgebung und Systemvoraussetzungen
5.1.2 Überblick
5.1.3 Umgebung
5.2 Rulesets
5.2.1 Befehlsatz
5.2.1.1 load-ruleset
5.2.1.2 elear-eliek-eaehe
5.2.1.3 elear-or-define-ruleset
5.2.1.4 defrule
5.2.1.5 eount-elieks
5.2.1.6 save-value
5.2.1.7 load-value
5.2.1.8 elear-store
5.2.1.9 run-ruleset-on-esv-file
5.2.1.10 run-ruleset
5.2.1.11 Operatoren <, >,<=, und st ring
5.2.1.12 Kontrollstrukturen if, when, do, dotimes,
5.2.1.13 Kommentare

6 Beispiele für Rulesets
6.1 Doppelklick
6.2 Komplexere Variante des Doppelklick und Ausschluss einfacherer Vari­anten des manuellen Klickbetrugs
6.3 Anomalien zu Vortagen finden
6.4 Anomalien in den via Proxy generierten Klieks
6.5 Proof of Coneept: Integration in Webserver

7 Conclusio

Literaturverzeichnis

Abkürzungsverzeichnis

Anhang

A Quellcode Pickwick

A.l Lizenz
A.2 pickwick,asd
A.3 packages.lisp
A.4 click-buffer.lisp
A.5 ruleset.lisp
A.6 redirector.lisp
A.7 csvreader,lisp
A.8 testdaten-generator.lisp

Danksagung

Danke GUY!, Du bist Schuld, dass ich dieses Studium begonnen habe, Dir sei diese Arbeit gewidmet! ;)

Doro, Tanke viir Teine unermiitliehe Hielve pei tieser Arpeit, Du bist die beste Lektorin der Welt!

Meiner Liebsten, Danke für Deine Geduld!

Liebe Familie, 40 Semester Studienzeit sind doch sehr gründlich und fleißig? Danke für Eure immerwährende Unterstützung!

Weiters darf ich mich bei der Unito Versand & Dienstleistungen GmbH, insbesondere Hrn. Mag, Wolfgang Bankhamer, für die Zurverfügungstellung von Informationen und Testdaten und den regen Gedankenaustausch bedanken!

PLOCK!

Informationen

Abbildung in dieser Leseprobe nicht enthalten

Schlagwörter

Abbildung in dieser Leseprobe nicht enthalten

Abstract

Cliek Fraud is an upeoming and inereasing ehallenge for all aspeets of e-eommeree and online-marketing, This diploma thesis tries to eategorize the term eliek fraud. Common ways of performing eliek fraud (botnets, foreed browser-elieks) are deseribed and analyzed, The approaehes of eireumvention of eliek-fraud by the operators of ad- networks and searehengines are shown, as also the possibilities of afterwards deteetion of eliek fraud by eompanies, A framework with examples is provided to develop and analyze algorithms to deteet eliek fraud.

Abbildungsverzeichnis

2.1 Verteilung des Risikos zwischen werbenden Unternehmen und Suchma­schine oder Ad-Netzwerk, abhängig von dem gewählten Verrechnungs­modell

3.1 Eine Annonce in einer indischen Zeitung: Arbeit als Cliekrobot |2| , , ,

3.2 Überblick, in welchen Regionen Cliekfraud häufiger begangen wird |11|

3.3 Kommunikationsschritte des Clickbot.A-Client

3.4 Verteilung des Schadens / Gewinns eines Klickbetrugs

3.5 Funktionsweise Platzierung einer Ad via Javascript

3.6 Funktionsweise Badvertisment

3.7 Nutzung eines Fassadensites zur Verschleierung des Traffieursprungs , ,

3.8 Explizite Aufforderung eines Webseiten-Betreibers, dass User auf Wer­bung klicken

4.1 Stationen des Klickflusses, an denen Cliek Fraud erkannt werden kann,

4.2 Proxies, XATs oder das TOR Netzwerk können das Erkennen der IP- Adresse eines Clients erschweren oder unmöglich machen

4.3 Zipf-Verteilung und der "Long Tail of Invalid Clieks!!|18, Figure 1, Seite

Tabellenverzeichnis

4.1 Verwertbare Merkmale eines Hypertext Transfer Protocol (HTTP)-Requests

5.1 Die Tabelle dick sammelt die verarbeiteten HTTP-Requests

5.2 Parameter der Funktion run-ruleset-on-csv-file

5.3 Operatoren in AXSI Common Lisp

5.4 Kontrollstrukturen in AXSI Common Lisp

Verzeichnis der Listings

3.1 Identifizierung eines Cliekbot.A-Clients bei seinem Masterbot

3.2 Abfrage einer doorway site durch den Client gegenüber dem Botmaster

3.3 Abfrage eines keywords durch den Client gegenüber dem Botmaster .

3.4 Aufruf der doorway sites durch den Clickbot.A-Client

3.5 Nachfrage des Clients bevor ein Link der doorway site aufgerufen wird

3.6 Nachricht an den Botmaster über einen erfolgreichen dick fraud

3.7 Unsichere Platzierung einer Ad via Javascript |9, Seite 4|

3.8 Sicherere Platzierung einer Ad via Javascript innerhalb einer anonymen Funktion und der Nutzung eines IFrames |9, Seite 4|

4.1 Beispiel eines gefälschten HTTP-Requests

6.1 Beispiel zur Identifizierung Doppelklicks durch User

6.2 Beispiel zur Erkennung eines Doppelklicks und Ausschluss einfacherer Varianten des manuellen Klickbetrugs

6.3 Beispiel zum Auffinden von Anomalien aufgrund des Vergleichs von Zeit­abschnitten

6.4 Identifizierung von unerwünschten Klieks durch Proxies

1. Einleitung

1.1 Definition

Cliek Fraud (oder aueh Klickbetrug) bezeichnet jegliche Absicht, Pay per eliek Ver­rechnungsmodelle (vergleiche Abschnitt 2,2,1,1) unlauter auszunutzen. Jeder Klick, ausgelöst von einem Menschen oder automatisiert von Maschinen, auf eine Pay-per- Kliek-Anzeige wird als betrügerisch angesehen, wenn vom Benutzer kein Interesse an dem Inhalt oder dem Angebot des Werbers im weiteren Sinne besteht |16, Seite 9| |3, Seite 7| |7, Seite 9|, Diese Definition des Klickbetrugs ist nicht im juristischen Sinne zu verstehen[1],

Das Diskussionspapier der Kommission der Europäischen Union zur Schaffung einer ge­setzlichen Handhabe bezüglich Attacken gerichtet gegen Informationssysteme definiert Cliek Fraud ähnlich als:

Cliek fraud is a type of Internet crime that oeeurs in pay per eliek online

advertising when a person, automated Script, or Computer programme imi-

tates a legitimate user of a web browser elieking on an ad for the purpose of

generating a eharge per eliek without having aetual interest in the target of

the ad's link, Cliek fraud is the subjeet of some eontroversy and inereasing

litigation due to the advertising networks being a key benefieiary of the fraud [6, Seite 12].

Relevantes Kriterium im Sinne der meisten Vertragsbedingungen von Suchmaschinen und Ad-Netzwerken ist die Intention des Benutzers, unter der ein Klick ausgeführt wird |IS, Seite 16|.

1.2 Motivation der Klickbetrüger

Die Motivation zum Klickbetrug lässt sich gliedern in:

- Schädigung des Werbers oder des Betreibers der Pav-per-Klick-Anzeige: Der be­trügerische Klicker will dem Werbenden (zum Beispiel einem Mitbewerber) Scha­den zufügen, indem er die Werbekosten des werbenden Unternehmens erhöht.
- bedroht das Geschäftsmodell der Pay-per-Klick-Verrechnung[2],
auf die auf seinen Partner-Webseiten platzierten Anzeigen, um so die Vergütun­gen des Pay-per-Klick-Netzwerkebetreiber zu erhöhen,

1.3 Hintergrund

Klickbetrug ist etwa seit 2006 einer breiteren Öffentlichkeit bekannt geworden, als unter anderem Google von werbenden Unternehmen verklagt wurde. Man warf dem Suchmaschinen und Ad-Netzwerk-Betreiber vor, zu wenig Abwehrmechanismen gegen Klickbetrug installiert zu haben3 4 Google war damals - aus verständlichen Gründen - nicht bereit, seine Abwehrmechanismen gegen Klickbetrug zu veröffentlichen. Mit der Veröffentlichung wäre die Gefahr zu groß geworden, gezielten Attacken gegen die eingesetzten Mechanismen ausgesetzt zu werden.

In Folge wurde Prof, Dr. Alexander Tuzhilin beauftragt, die Maßnahmen von Goo­gle gegen Klickbetrug zu evaluieren, Ergebnis ist der häufig zitierte Tuzhilin-Berieht |18|, Die teilweise sehr schwammigen Ausführungen in diesem Bericht sind bis heu­te die einzigen Hinweise auf die von Suchmaschinen und Ad-Xetzwerken tatsächliche durchgeführten Aktionen gegen Klickbetrug, Mit der steigenden Relevanz von generierter Umsätzen und strategischer Ziele von Unternehmen (vergleiche Abschnitt 2,3), die im Bereich E-Commerce agieren, über die durch Klickbetrug bedrohten Werbeformen, gewinnt das Thema Klickbetrug an öffentlichem Interesse[3]'[4].

Diese Arbeit will in den folgenden Kapiteln: und von Klickbetrug möglich sind (Kapitel 4), gestellt, das das Entwickeln von Algorithmen zur Erkennung von Klickbetrug unterstützt (Kapitel 5), wiinsehter Klieks beziehungsweise potentiellen Klickbetrugs gezeigt (Kapitel 6).

2. Online Werbung

2.1 Uberblick

Mit dem Siegeszug des World Wide Web (WWW) zu Beginn der 90er Jahre begann auch die kommerzielle und werbewirtschaftliche Nutzung des Internets, Im Jahre 1994 nutzte das Online-Magazin "HotWired"[5]mit verschiedenen Sponsoren erstmals das Internet als Werbeplattform 114, Seite 17|, Die ersten inserierenden Unternehmen waren IBM und Volvo, Die Kosten für einen Werbeplatz beliefen sich auf etwa $30,000, Der klassische Banner als Werbefläche war geboren.

In den folgenden Jahren wurden alternative und spezifisch auf das Medium Internet zugeschnittene Varianten des Banners, der nur eine digitale Kopie der klassischen Pla­katwerbung beziehungsweise des Anzeigengeschäfts aus den Printmedien darstellte, ent­wickelt, Einerseits in der Gestaltung, zum Beispiel unter der Nutzung multimedialer Inhalte, als auch in der Schaltung, zum Beispiel unter Nutzung Zielgruppen gerichteten Contents 114, Seite 18|, tbd Gleichzeitig entstanden aus den ursprünglichen Verzeichnissen und Auflistungen en­gagierter Nutzer der Pionierzeit des Internets die ersten Suchmaschinen, Die ersten marktbeherrschenden Suchmaschinen waren AltaVista, AllTheWeb und Inktomi, die sich hauptsächlich durch Online Werbung finanzierten 110, Seite 34|, 1999 entstand Google als alternative Suchmaschine, Aus heutiger Sicht war ironischerweise einer der Hauptgründe des Erfolgs von Google in der Anfangszeit die fehlende Online Werbung auf der Startseite, Google schaltete damals, und auch heute noch, erst zum Suchergeb­nis auf die Suchanfrage abgestimmte Textanzeigen.

1995 wurde die Firma DoubleCliek und damit das erste Ad-Xetzwerk gegründet, Double- Cliek verkaufte als Produkt den Austausch von Werbung mit Werbeplätzen trafficstar- ker Webseiten, Double Cliek konnte zwar den Kollaps der Dot.com Krise 2000-2003 überstehen, behauptete sich in Folge aber nicht gegen Google und wurde 2007 von Google übernommen 110, Seite 51|.

Seither ist Google sowohl als Suchmaschinenbetreiber und dem damit verbundenen Anzeigenverkauf von Ads im Rahmen des Seareh Engine Marketing (SEM), als auch als Betreiber eines Ad-Xetzwerkes mit AdSense unangefochten führend, insbesondere in Europa, Der früheren Marktführer Yahoo (mit seiner Ad-Xetzwerk-Tocher Yahoo Seareh Marketing, früher Overture) wurde auf unter 5% Marktanteil verdrängt 110, Seite 691 |20|.

2.1.1 Ad-Netzwerke

Ad-Xetzwerke (Ad-Xetworks) bieten einerseits dem Werbenden das Konzept, Werbung über viele Webseiten zu verteilen, andererseits Webseitenbetreibern die Möglichkeit, Flächen oder sonstige Interaktionsvarianten auf ihren Webseiten zur Schaltung von Werbung zu vergeben.

Werbende Unternehmen oder Organisationen können durch Ad-Xetzwerke über nur einen einzigen Partner auf vielen verschiedenen Online-Ressourcen werben, sie haben dort einen einzigen Ansprechpartner und müssen nur einen einzigen Abwieklungspro- zess in ihre Prozesslandschaft integrieren, Betreiber von Webseiten können die Frequenz ihres Auftritts verwerten, ohne in einen Vertrieb oder Verkauf investieren zu müssen 113, Seite 3|.

Meistens stellt das Ad-Xetzwerk die Infrastruktur zur Auslieferung der Werbung, Über­prüfung der Integration der Werbung, Abrechnung und Reporting für beide Partner, Werbende und Webseitenbetreiber, sowie die rechtlichen und vertraglichen Rahmenbe­dingungen, zur Verfügung.

Derzeit marktbeherrschend ist Google mit seinem eigenen "AdSense Program" und der Tochter DoubleClick: Gemeinsam halten sie 65,97% der Webseiten, die Werbung schalten. Der frühere Marktführer Overture, heute Yahoo, hält nur mehr 4,39% der werbenden Webseiten[6],

2.1.2 Search Engine Marketing

SEM ist die Vermarktung einer Suchmaschine durch die Schaltung von Werbung (spon- sored links), Suchmaschinen sind im dezentral organisierte WWW die meistbesuchten Webseiten, da diese von den meisten Benutzern zum Auffinden von Informationen ge­nutzt werden[7]. Daher sind Suchmaschinen für Werber besonders reichweitenstarke und interessante Partner, Lag bei der ersten großen Welle der Internet Werbung das Hauptgewicht auf der Ver­breitung von Bannern über Ad-Xetzwerke, gewinnt das SEM ständig an Bedeutung, SEM ist in den meisten im E-Commerce tätigen Firmen mit einem Anteil von bis zu 50% im Werbebudget vertreten 110, Seite 40|.

Wie schon oben ausgeführt, platziert das klassische SEM zur Suchanfrage relevante sponsered links. Die Platzierung wird im Rahmen einer Versteigerung von Stichwörtern (keywords), die von werbenden Unternehmen erworben werden können, reguliert. Je nach Rang des ersteigerten Keyword wird bei einer Übereinstimmung von Suchphrase und Keyword die Werbung platziert.

2.2 Verrechnungsmodelle

2.2.1 Einteilung

Zur Verrechnung zwischen dem werbenden Unternehmen und den Ad-Xetzwerken oder Suchmaschinen haben sich in den letzten Jahren verschiedene Verrechnungsmodelle entwickelt. Diese sind bezüglich Ad-Xetzwerke und SEM identisch, Sie lassen sich unter anderem in die folgenden drei Gruppen teilen:

- Cost per impression (CPI) / Cost per view (CPV)

Ausschlaggebend für die Entwicklung unterschiedlicher Verrechnungsmodelle ist das zwischen werbenden Unternehmen und SEM-Partner entsprechend unterschiedlich ver­teilte Risiko, Abbildung 2,1 gibt einen Überblick, Die Wahl des Verrechnungsmodelles wird in einer konkreten Partnerschaft zwischen werbendem Unternehmen und Such­maschine oder Ad-Xetzwerk vom dominierenden Partner oder den Markgegebenheiten diktiert.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2.1: Verteilung des Risikos zwischen werbenden Unternehmen und Suchmaschine oder Ad-Netzwerk, abhängig von dem gewählten Verrechnungsmodell

2.2.1.1 Cost per view

Auch CPI genannt. Der Werbende zahlt für jede Auslieferung eines Banners, Dieses Modell ist den Verrechnungsformen der klassischen offline-Werbung nachempfunden. Für den Werbenden stellt dies das unattraktivste Verrechnungsmodell dar, da nur das Anzeigen der Werbung schon kostet. Der Werbende trägt das gesamte Risiko einer Kampagne, Daher ist dieses Verrechnungsmodell nur mehr selten in Verwendung, zum Beispiel bei sehr trafficstarken oder marktdominierenden Webseiten[8],

2.2.1.2 Cost per click

Jede Einschaltung, auf die ein Benutzer klickt und dadurch auf die Webseite des Wer­benden gelangt, wird verrechnet. Der Werbende muss daher nur für Besucher zahlen, die tatsächlich auf seinem eigenen Internet-Auftritt landen. Das Risiko einer online Werbekampagne verschiebt sich in die Mitte zwischen Werbenden und Webseitenbe­treiber (vergleiche Abbildung 2,1), beziehungsweise Ad-Network und Suchmaschine, Dieses Verrechnungsmodell ist das zur Zeit am häufigsten verwendete.

2.2.1.3 Cost per action

Dem Werbenden entstehen erst Kosten, wenn ein Benutzer, der vorher auf eine Wer­bung geklickt hat, auf der Webseite des Werbenden eine definierte Aktion, meist einen Kauf, ausgeführt hat. Dieses Verrechnungsmodell wird auch Cost per sale (CPS) ge­nannt, Bei Nutzung dieses Verrechnungsmodells trägt der Werber das geringste Risiko, Auch ist diese Art der Verrechnung weitestgehend immun gegen verschiedene betrü­gerische Szenarien, insbesondere dem Klickbetrug, Aber es verschiebt das Risiko über den Erfolg der Online Werbung, wie in Abbildung 2,1 dargestellt, massiv zu den Be­treibern von Suchmaschinen oder Ad-Netzwerken, die aber ihrerseits keinen Einfluss auf Sortimentspolitik, Preispolitik oder sonstiger angebotsrelevanter Strategien auf der Webseite des werbenden Unternehmens haben.

[...]


1Ein Betrug im österreichischen Strafrecht setzt unter anderem einen Bereicherungsvorsatz voraus, welcher im Klickbetrug nicht immer enthalten ist. vergleiche §§ 146ff öStGB. Bei Klickbetrug ohne Bereicherungsvorsatz könnte man eher den Tatbestand der Sachbeschädigung annehmen, vergleiche § 125 öStGB.

2Erprcssurigsvcrsuch Google http://www.heise.de/tp/'r4/artikel/22/22248/I.html

3 Vcrglcichc den Rechtsstreit Lane's Gifts and others versus Google: Daniel L. Hadjinian. Clicking Away the Competition: The Legal Ramifications of Cliek Fraud for Companies that Offer Pay Per Cliek Advertising Services. 2 Shidler J. L. Com. & Tech. 5 (Dec. 4. 2006). at http://www.lctjournal.washington.edu /Vol3/aOOöHadjinian.html

4 Vergleiche http://Vww.heise.de/newsticker/nieldiing/Grosse-Allianz-gegen-Klickbetriig-148346.htnil

5 Vergleiche http://Vww.heise.de/newsticker/nieldung/Yahof)-entscliaedigt-Werbekiinden-137237.1itnil

6 vergleiche http://attribiitor.corii/l)log/yahof)-ad-server-share-drops-by-half-google-doiibleclick- doriiiriato-riiarkot-2 /

7 http://www .lieise.de/riewsticker/riieldiirig/Google-verstaerkt-Erigageriierit-gegeri-Klickbetriig- 164748.html

8 In Österreich ist ORF.at eine prominente Webseite, die geschaltete Werbung noch per CPV vorroch

Excerpt out of 114 pages

Details

Title
Click Fraud - Analyse und Methode zur Identifzierung
College
Fachhochschule Salzburg  (Informationstechnik und System-Management)
Author
Year
2011
Pages
114
Catalog Number
V189448
ISBN (eBook)
9783656141136
ISBN (Book)
9783656141181
File size
5857 KB
Language
German
Keywords
Click Fraud, Klickbetrug, Onlinebetrug
Quote paper
Otto Diesenbacher (Author), 2011, Click Fraud - Analyse und Methode zur Identifzierung, Munich, GRIN Verlag, https://www.grin.com/document/189448

Comments

  • No comments yet.
Look inside the ebook
Title: Click Fraud - Analyse und Methode zur Identifzierung



Upload papers

Your term paper / thesis:

- Publication as eBook and book
- High royalties for the sales
- Completely free - with ISBN
- It only takes five minutes
- Every paper finds readers

Publish now - it's free