Das Bayes'sche Theorem in der theoretischen und empirischen Forschung. Eine systematische Literaturübersicht


Bachelor Thesis, 2016

76 Pages, Grade: 1


Excerpt


Inhaltsverzeichnis

Tabellenverzeichnis

Abbildungsverzeichnis

1 Ein plausibler Sonnenaufgang und das Bayes’sche Theorem

2 Prozessleitlinie und Untersuchungsmethodologie
2.1 Forschungsfragen
2.2 Analysemethodik
2.2.1 Explorative Datenanalyse
2.2.2 Qualitative Analyse
2.3 Erhebung
2.4 Selektion
2.5 Kategorisierung
2.6 Datenextraktion

3 Explorative Datenanalyse
3.1 Deskriptive Statistik
3.2 Trendanalyse
3.2.1 Absolute und relative Entwicklung
3.2.2 Exponentielle Regression
3.2.3 Poisson Regression mit der Regel von Bayes
3.3 Korrelationsanalyse.

4 Qualitative Analyse
4.1 Forschungsfelder und die Anwendung des Bayes’schen Theorems
4.2 Besondere Themen aus der Bayes’schen Statistik

5 Schlussbetrachtung

Literatur

A Anhang: Tabellen aus dem Selektionsverfahren
A.1 Artikelanzahl nach Fachdisziplin
A.2 Artikelanzahl nach Fachdisziplin und Rängen
A.3 Artikelanzahl nach Zeitschriften von 1900 bis 2015
A.4 Artikelanzahl nach Zeitschriften von 2014 bis 2015

B Anhang: Kategorisierung
B.1 Kategorisierungsschema
B.2 Prozessansatz für die Extraktion der Schwerpunkte.

C Anhang: Regressionsmodelle
C.1 Exponentielle Regression..
C.2 Poisson Regression mit der Regel von Bayes

D Anhang: PRISMA-Checkliste

Abstract

Content: This paper studies the influence of the Bayes’ theorem, particularly the resulting Bayesian methods and technics of theoretical and empirical research through a literature review.

Objective: The objective is the examination of the publication inclinations between 1900 and 2015 regarding the Bayesian methods and technics, which is completed by a summary of current focal points.

Methods: The subject of investigation of the exploratory data analysis are all journal articles regarding bayesian methods and technics between the years of 1900 and 2015 which can be ranked through SCImago Journal Ranking (SJR) indicator, as well as a self generated journal ranking including articles which are influential to research. Additionally the journal entries between the years of 2014 and 2015 are analyzed on a qualitative basis regarding research fields and bayesian application.

Results: It can be found that the interest in research increased exponentially after the year of 1960, but decreased after the year of 2010, caused by prior researches as well as the development of high performance computers. Furthermore the department of natural science shows high research interests, in which there is a tendency to estimation and distribution theory and Bayesian models.

Schlüsselwörter: Bayes’sches Theorem; systematische Literaturübersicht

Tabellenverzeichnis

1 Anzahl der Suchresultate in den Datenbanken

2 Screening-Sequenz des Selektionsalgorithmuses

3 Anzahl der Artikel ns und der Journale ms nach jedem Screening s = 1, . . . ,

4 Verteilungsschlüssel der 27 Fachdisziplinen auf vier Forschungsfelder nach Scopus®

5 Schwerpunkte der Bayes’schen Statistik erzeugt durch die Kategorisierungsfrage KF2 (ohne Subkategorien).

6 Deskriptive Statistik.

7 Plausibelsten Werte für die Parameter der Regression

8 Innovationszeitpunkte von Prozessoren und Takt in Hz zusammengestellt aus http://www.pc-erfahrung.de/prozessor/cpu-historie.html (aufgeru- fen am 16.03.2016) und http://ark.intel.com/ (aufgerufen am 16.03.2016)

9 Regressionsmaße

10 Kategorien Forschungsfelder nach Scopus® und die Artikelanzahl zugeteilt durch die Kategorisierungsfrage KF

11 Verteilung der Artikel ns(d) = nds nach den Screenings s = 1, . . . , 4 in Abhän- gigkeit der Fachdisziplinen d

12 Verteilung der Artikel ns(d) = nds nach den Screenings s = 1, . . . , 4 in Abhän- gigkeit der Fachdisziplinen d; sortiert nach Rängen für nd

13 Journalmenge J2 und die dazugehörige Anzahl der Zeitschriftenartikel n2(j) = nj2 von 1900 bis 2015..

14 Journalmenge J4 und die dazugehörige Anzahl der Zeitschriftenartikel n4(j) = nj4 von 2014 bis 2015..

15 Liste mit den Fragen und den Kategorisierungoptionen k sowie die Anzahl an Artikeln nk,4 gebildet aus der Artikelmenge A4

Abbildungsverzeichnis

1 Prozessleitlinie einer systematischen Literaturübersicht

2 Flussdiagramm PRISMA 2009 zur Veranschaulichung der Erhebung und des Selektionsalgorithmuses

3 Häufigkeitsverteilung der jährlichen Artiekl n(ny1) (links) und n(ny2) (rechts)

4 jährliche Anzahl an Artikel als Boxplot

5 Häufigkeitsverteilung n1(y) (grau) und n2(y) (blau) in den Jahren y ∈ [1960, 2015] als Balkendiagramm und zeitlich geordnet

6 Autokorrelationsfunktion für n1(y) (links) und n2(y) (rechst)

7 Häufigkeitsverteilung nselektiert(y) = nyselektion (links) und relativer Anteil η(y) = ηy (rechts) in den Jahren y ∈ [1960,2015]; zeitlich geordnet

8 exponentielle Regression für nt1 (oben) und nt2 (unten) in den Jahren yt ∈ [1960, 2015], mit t = 1, . . . , 56; zeitlich geordnet

9 Residuen ϵt1 (links) und ϵt1 (rechts) in den Jahren yt ∈ [1960, 2015], mit t = 1, . . . , 56; zeitlich geordnet

10 MCMC-Kette der A-posteriori-Verteilung der Parameter β01 und β11(oben) und die Haufigkeitsverteilungen.

11 Poisson Regression für nt1 (links) und für nt2 (rechts) mit den 95% Progno- sebänder als rückwirkende Messungen und den Residuen in den Jahren yt ∈ [1960, 2015], mit t = 1, . . . , 56; zeitlich geordnet

12 Prozessortakt und die Häufigkeitsverteilungen nt1 und nt2 in den Jahren yt ∈ [1971, 2015], mit t = 1, . . . , 45; zeitlich geordnet

13 Streudiagramme für nt1 und nt2 und die Prozessortakte.

14 Prozessansatz für die Identifikation der theoretischen und empirischen For- schungsschwerpunkte bezüglich der Bayes’schen Statistik

1 Ein plausibler Sonnenaufgang und das Bayes’sche

Theorem

In der Statistik gibt es zwei grundlegende Arten des Schlussfolgerns: den „frenquentischen An- satz“ und den „bayesianischen Ansatz“. Kennzeichnend für den Unterschied beider Ansätze ist das grundlegende Verständnis vom Wahrscheinlichkeitsbegriff, sodass der Disput zwischen den Frequentisten und den Bayesianisten eine der Hauptkontroversen in der Statistik des 20. Jahrhunderts (vgl. Gillies, 1987) ist. So sieht die frequentische beziehungsweise klassische Sta- tistik die Wahrscheinlichkeit als etwas objektives, nämlich als Interpretation des Grenzwertes der relativen Häufigkeiten (relative frequency) eines zufälligen Ereignisses (vgl. Fahrmeir, 2005, S. 191ff.), wohingegen die Bayes’sche Statistik die Wahrscheinlichkeit als etwas subjektives auf- fasst, das den Grad der Plausibilität (degree of believe) einer Aussage oder eines Ereignisses erst dann wiedergibt, wenn eine bestimmte Information gegeben ist(vgl. Prosper, 2000; Bättig, 2015, S. 76).

Diese subjektive Auffassung von Unsicherheit spiegelt sich durch das Bayes’sche Theorem wieder. In einfacher Form gibt letzteres die bedingte Wahrscheinlichkeit eines Ereignisses A angibt, falls ein bestimmtes Ereignis B eingetreten ist:

Abbildung in dieser Leseprobe nicht enthalten

Das Theorem wurde nach dem englischen Geistlichen und Mathematiker Thomas Bayes (1702 - 1761) benannt (vgl. Gillies, 1987). Sein Werk „An Essay towards solving a Problem in the Doctrine of Chances“ wurde post mortem von seinem Freund Richard Price veröffentlicht (vgl. Bayes, Thomas; Price, Richard und Canton, John, 1763) und formuliert nicht etwa das Theorem selbst, sondern den Bayes’schen Wahrscheinlichkeitsbegriff im Sinne einer subjektiven Einschät- zung über das Eintreten eines Ereignisses, im Fall neu aufkommender Informationen. Verdeut- licht wird dieses mit dem Gedankenexperiment über einem Menschen, der zum ersten Mal die Sonne aufgehen sieht und sich ohne Kenntnis über die physikalischen Gesetzmäßigkeiten nicht sicher sein kann, ob die Sonne nach dem untergehen wieder aufgehen wird oder dieses nur ein einmaliges Ereignis war. Mit jedem Tag nähert sich dieser Mensch jedoch einer Plausibilität an, indem er seine gewonnen Erkenntnisse in seiner Prognose berücksichtigt, sodass er nach einer sehr langen Zeit mit fast 100 prozentiger Gewissheit prognostizieren kann, dass die Sonne am nächsten Tag wieder aufgehen wird. Das Bayes’sche Theorem folgt demnach der Logik der Bayes’schen Interpretation der Wahrscheinlichkeit, der Annäherung an die Wahrheit durch das Berücksichtigen neuer Erkenntnisse oder Informationen, formuliert von Pierre-Simon Laplace (1749 - 1827) (vgl. Kruschke, 2015, S. 100).

In der Bayes’schen Schätztheorie verdeutlicht sich diese Logik durch die Annahme, dass ein zu schätzender Parameter θ als Zufallsvariable Θ = θ gilt, die durch eine A-posteriori-Verteilung pdf(θ | Daten)1 bedingt durch die Daten x′ = (x1, . . . , xN ) modelliert werden kann. Es sei dafür angenommen, dass die Daten Realisationen einer unabhängigen und gleich verteilten stetigen Zufallsvaribablen X sind. Durch Hinzunahme der subjektiven A-priori-Verteilung des Parameters pdf(θ) lässt sich mit dem Bayes’schen Theorem (1) die A-posteriori-Verteilung als Plausibilität zu dem Parameter θ berechnen durch:

Abbildung in dieser Leseprobe nicht enthalten

Das Verarbeiten der subjektiven A-priori-Verteilung durch die Daten in eine A-posteriori- Verteilung bezeichnet man als bayesianisches Lernen (vgl. Fahrmeir, 2005, S. 380f.) und liefert die Grundlage für die Bayes’sche Inferenz. pdf(x | θ) beschreibt die Wahrscheinlichkeit der Daten x gegeben dem Parameter θ, die sich über die Likelihood-Funktion berechnen lässt. Unter diesem Aspekt ist die A-posteriori-Verteilung von θ proportional zu dem Produkt Likelihood- Funktion der Daten x und der subjektiven A-priori-Verteilung(vgl. Box, George E. P. und Tiao, George C., 2011, S. 11):

A-posteriori ∝ Likelihood · A-P riori (3)

Obwohl die frequentsiche Statistik die Forschung und Lehre überwiegend zu dominieren scheint, gibt es dennoch eine Vielzahl von Autoren, die dessen statistischen Ansätze kritisie- ren (vgl. Cohen, 1995; Gill, 1999; Anderson, David R.; Burnham, Kenneth P. und Thompson, William L., 2000). Demgegenüber ist gerade der Nachteil der Bayes’schen Statistik die Ein- schätzung der subjektiven A-priori Wahrscheinlichkeit, denn je größer diese eingeschätzt wird, desto geringer fällt der Einfluss neuer Informationen aus. Darüber hinaus widerspricht die Be- rücksichtigung der eigenen Überzeugenden (Subjektivität) in einer Analyse dem Grundsatz der Objektivität in der Wissenschaft - obgleich die Überzeugungen auf langfristigen Beobachtungen, Studien oder Erfahrungen basieren können.

Es stellt sich somit die Frage, ob trotz erwähnten Nachteilen der Bayes’schen Statistik, die theoretische und empirische Forschung ein Interesse an dessen Methoden und Techniken aufweist und wie dieses zu messen ist. Hierfür soll in dieser Arbeit durch eine systematische Literaturübersicht (SLR - Systematic Literature Review vgl. Böhmer, Kristof und Rinderle-Ma, Stefanie, 2015) der Einfluss des Bayes’schen Theorems, insbesondere der daraus resultierenden Bayes’schen Statistik und den bayesianischen Methoden und Techniken auf die theoretische und empirische Forschung untersucht werden.

Eine Literaturanalyse eignet sich besonders, da einerseits durch die Publikationshäufigkeiten das Forschungsinteresse quantifiziert werden kann und andererseits durch eine inhaltliche Begutachtung die Forschungschwerpunkte extrahiert werden können. Der Untersuchungsgegenstand sollen hierbei alle veröffentlichten Forschungsarbeiten aus mehreren elektronischen Datenbanken sein, in denen bayesianische Methoden und Techniken vorkommen und die in den Jahren 1900 bis 2015 publiziert wurden.

Vor diesem Hintergrund befasst sich das nächste Kapitel (Kapitel 2) mit der Prozessleitlinie, insbesondere mit der Untersuchungsmethodologie, mit der diese systematische Literaturüber- sicht durchgeführt wurde. Zu Beginn werden Forschungsfragen für das Eingrenzen des Themas dieser Untersuchung und die Analysemethoden vorgestellt. Im Weiteren Fokus des Kapitels steht die Erhebung und Aufbereitung der Daten aus Zeitschriftenartikel mit bayesianischen Schwerpunkten.

Für die Analyse des Forschungsinteresses anhand der Publikationbshäufigkeiten folgt im Kapitel 3 eine explorative Analyse mit deskriptiver Statistik und einer Trendanalyse. Darüber hinaus soll durch eine Korrelationsanalyse ein möglicher externer Einflussfaktor für das Forschungsinteresse bestimmt werden.

Die gesammelten Informationen aus der explorativen Analyse werden durch eine qualitative Analyse des Inhalts von aktuellen Forschungsarbeiten im Kapitel 4 erweitert und in der Schlussbetrachtung (Kapitel 5) zusammengefasst und diskutiert.

2 Prozessleitlinie und Untersuchungsmethodologie

Eine Prozessleitlinie ist das Schema, mit dem die systematischen Literaturübersicht durchge- führt wird. Es lässt sich in der Literatur bezüglich Übersichtsarbeiten (vgl. Kitchenham et al., 2010; Fragoso, Tiago M. und Louzada Neto, Francisco , 2015; Böhmer, Kristof und Rinderle-Ma, Stefanie, 2015; Abdellatif, Tamer Mohamed ; Capretz, Luiz Fernando und Ho, Danny, 2015) und systematischen Ansätzen (vgl. Moher et al., 2009, 2015) keine einheitliche Vorgehensweise feststellen. Die folgende SLR soll daher auf Grundlage einer eigenständig entwickelten Methode basieren, welche in Anlehnung an Moher et al. (2009), Fragoso, Tiago M. und Louzada Ne- to, Francisco (2015) sowie Kitchenham et al. (2010) und Böhmer, Kristof und Rinderle-Ma, Stefanie (2015) erstellt wird.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Prozessleitlinie einer systematischen Literaturübersicht

Die daraus resultierende Leitlinie des Prozesses ist in Form eines Flussdiagramms in Abbildung 1 dargestellt. Kennzeichnend für den Prozess sind seine drei Phasen:

Phase 1: Vorbereitung und Planung

Phase 2: Untersuchungsmethodologie

Phase 3: Verfassen des Berichts der systematischem Literaturübersicht

Eine besondere Relevanz für die Literaturarbeit erzeugen die Knoten, welche grün gekennzeich- net sind; dazu gehören die Formulierung, Forschungsfragen und das Festsetzen der Analyseme- thoden während Phase 1 und die sechs Ebenen der Untersuchungsmethodologie aus Phase 2: Quellen identifizieren, Literatursuche, Selektion, Kategorisierung, Datenextraktion und Daten- analyse. Im Vergleich dazu stellen die Knoten, welche rot markiert sind, Instrumente bereit, die eine unterstützende Funktion während der gesamten Untersuchung ausüben; hierzu gehört das Festhalten aller relevanten Fakten des Prozesses in einem Protokoll während der Phasen 1 und 2 sowie eine Kontrollliste (Checkliste), die beim Verfassen des Berichts in Phase 3 gewährleistet, diese relevanten Fakten auch zu berücksichtigen.

Zu Beginn der Phase 1 des Prozesses steht die Spezifizierung und Eingrenzung der Untersu- chung durch die Formulierung verschiedener Forschungsfragen, um die sechs Ebenen der Unter- suchungsmethodologie zu planen. Die dadurch erhaltenen sieben Planungskomponenten werden zusätzlich mit den Analysemethoden und den Ergebnissen aus der Untersuchungsmethodologie in das Protokoll aufgenommen, damit sich während des gesamten Prozesses gewährleisten lässt, dass die Reliabilität der aufgrund der Reproduzierbarkeit der Untersuchung gegeben ist. Wei- terhin ist für das Protokoll kennzeichnend, dass eine Interdependenz zwischen der Planung der Untersuchungsmethodologie in Phase 1 und der Durchführung der Untersuchung in Phase 2 erzeugt wird. Dadurch können im laufenden Prozess identifizierte Planungsirrtümer angepasst werden. Aufgrund der sequentiellen Abhängigkeitsstruktur der Ebenen ist das adaptive Verhal- ten zwischen den Phasen eine notwendige Bedingung hinsichtlich einer validen Prozessleitlinie, denn ohne Fehlerkorrektur würden verzerrte Ergebnisse erzeugt werden.

Darüber hinaus lässt sich in der Abbildung 1 in der Phase 3 erkennen, dass ein Instrument für das Verfassen einer Literaturübersicht eingeführt wird. Dieses Instrument ist die von Moher et al. (2009, S. 266) vorgeschlagene Checkliste PRISMA (Preferred Reporting Items for Syste- matic Reviews and Meta-Analyses); eine Übersetzung der gesamten Checkliste ist im Anhang D dargestellt. Die Eignung dieser Liste zeichnet sich dadurch aus, da sie in einer dreitägi- gen Tagung im Juni 2005 in Ottawa (Kanada), von Fachleuten aus dem medizinischen und methodologischen Bereich entwickelt wurde und soll anhand von 27 Kontrollpunkte die Be- richtserstattungen systematischer Übersichten verbessern. Dennoch weist Moher et al. (2009) darauf hin, dass die PRISMA-Liste nicht für die Bewertung der Qualität einer systematischen Übersicht geeignet sei. Für die Tagungsgruppe stand neben der Entwicklung einer Checkliste für das methodische Erarbeiten systematischer Übersichten ebenso im Vordergrund, dass die Liste analog für Meta-Analysen insbesondere für den medizinischen Forschungsbereich verwen- det wird. Aus diesem Grund einfallen die Kontrollpunkte aus der PRISMA-Checkliste, welche sich auf die Meta-Analyse medizinischer Studien beziehen und die übrigen werden für den Fall einer systematischen Literaturübersucht adaptiert. Des Weiteren werden durch die PRISMA- Checkliste neben den Kontrollpunkten auch die Publikationsabschnitte festgelegt, in denen die geforderten Inhalte der Punkte berücksichtigt werden sollen. Die festgelegte Reihenfolge wird für das Verfassen des Berichts dieser Arbeit ebenso nicht eingehalten, denn zum einen wird das Beschreiben der jeweiligen Methode sowie die Ergebnisse nicht in separaten Abschnitten präsentiert und zum anderen erfolgt die Datenanalyse in einem gesonderten Abschnitt.

Nachfolgend werden im Sinne der eigenständig entwickelten Prozessleitlinie die Forschungsfragen im Abschnitt 2.1 formuliert, um im Anschluss die Analysemethoden zur Erkenntnisgewinnung mit dem Bezug auf die Forschungsfragen einzuführen. Weiterhin wird sich im Abschnitt 2.3 zunächst mit der Beschreibung der Informationsquellen befasst, um dann näher auf die Suchstrategie von Suchbegriffen und Zeitfiltern einzugehen. Eine nähere Erläuterung zur Selektion und der Auswahl der gefundenen Publikationen befindet sich im Abschnitt 2.4. Den Abschluss dieses Kapitels bildet das Kategorisierungsschema im Abschnitt 2.5, mit dessen Hilfe die qualitative Analyse durchgeführt werden soll.

2.1 Forschungsfragen

Die Formulierung von Forschungsfragen für eine wissenschaftliche Arbeit dient der Eingrenzung des Themas und gewährleistet dadurch ein zielgerichtetes Arbeiten (Wytrzens et al., 2014, S 75). Ungenau formulierte Forschungsfragen können demnach eine große Auswirkung auf die Untersuchung haben. Ausgehend von dieser Annahme werden die nachfolgenden Forschungs- fragen FFl, mit l = 1, . . . , 3, mit dem konkreten Ziel formuliert, dass durch sie der Einfluss des Bayes’schen Theorems auf die theoretische und empirische Forschung durch eine systematische Literaturübersicht untersucht werden kann und alle bedeutsamen Informationen aufgegriffen werden können. Die Forschungsfragen bilden somit den Ausgangspunkt der systematischen Li- teraturübersicht.

FF1 : Welche Wirkung hatte das Bayes’sche Theorem seit dem 20. Jahrhundert auf die theore- tische und empirische Forschung?

FF2 : Welche Forschungsfelder können aktuell besonders von der Bayes’schen Statistik oder dem bayesianischen Denkwesen in ihrem theoretischen und empirischen Forschungsfeld profitieren?

FF3 : Welche aktuellen Forschungstrends lassen sich hinsichtlich des bayesianischen Methoden und Techniken identifizieren?

Die Beantwortung der Forschungsfragen FF2 und FF3 soll eine ähnliche Diskussion erzeugen wie die Forschungsfragen zwei und drei von Kitchenham et al. (2010). Anders die Forschungsfrage FF1, die im Vergleich dazu eine eigenständig entwickelte Zielsetzungen verfolgt.

Bei einer näheren Betrachtung aller Forschungsfragen FFl lässt sich erkennen, dass für dessen Beantwortung ein differenzierter zeitlicher Parameter während der Analyse des Datensatzes aus Zeitschriftenartikeln berücksichtigt werden muss. In diesem Sinne soll der Parameter y das Jahr der Veröffentlichung eines Artikels angeben. So fordert zunächst die Forschungsfragen FF1 einen zeitliche Betrachtung des Datensatzes ab dem Jahr yUG = 1900, wobei die Obergrenze auf Zeitschriftenartikel gelegt wird, die bis einschließlich dem Jahr yOG = 2015 veröffentlicht worden sind, sodass keine Artikel aus dem Jahr y = 2016 berücksichtigt werden, da sich sonst der Beobachtungszeitraum mit dem Untersuchungszeitraum dieser Arbeit überschneiden würde.

Im Vergleich dazu sind für die restlichen Forschungsfragen FF2 und FF3 kennzeichnend, dass der zeitliche Fokus auf die aktuellen Forschungsarbeiten gelegt werden soll, welches impliziert, dass diejenigen Artikel, die für diese Forschungsfragen analysiert werden, sich auch aus der Menge an Artikeln extrahieren lassen, die für die Beantwortung der Forschungsfrage FF1 zur Diskussion stehen. Für die Umsetzung der zeitlichen Restriktion nach y in Hinblick auf die Aktualität eines Zeitschriftenartikels sollen nur Publikationen aus den Jahren 2014 und 2015 zur Diskussion stehen.

2.2 Analysemethodik

Nach der Abgrenzung des Zeitraums der Zeitschriftenartikel werden in diesem Abschnitt Analy- semethoden eingeführt, durch deren Hilfe letztendlich die Evidenz im Hinblick der Hypothesen generiert werden soll, die für die Beantwortung der Forschungsfragen aufgestellt werden.

2.2.1 Explorative Datenanalyse

Zu Beginn dieser Untersuchung steht die Erkenntnisgewinnung über den Einfluss der bayesia- nischen Methoden und Techniken auf die theoretische und empirische Forschung seit Beginn des 20. Jahrhunderts (FF1). Das Interesses der Forschung an den bayesianischen Ansätzen soll dabei durch Publikationshäufigkeiten quantifizieren. Durch eine explorative Datenanalyse so- wie einer deskriptiven Analyse (siehe Kapitel 3) der Publikationshäufigkeiten sollen letztendlich Erkenntnisse über den Einfluss des Theorems gewonnen werden. Aufgrund der marginalen Un- terschiede beschreibt Polasek (1994, S. 3f.) die explorative Datenanalyse als eine Unterdisziplin der deskriptiven Statistik, welche über das Bemerkenswerte einer Verteilung Aufschluss geben soll, wohingegen durch die deskriptive Analyse die Verteilung der Daten beschrieben werden sollen. In dieser Arbeit werden zwar beide Verfahren simultan in dem Kapitel „Explorative Datenanalyse“ präsentiert - obgleich eine thematische Differenzierung als sinnvoll erachtet wird - da dass die Analyseverfahren nicht als äquivalent, sondern als komplementäre Instrumente für die Erkenntnisgewinnung verstanden werden sollen. Demnach ist das Ziel der explorativen Datenanalyse das systematische Sammeln von Informationen über die Publikationshäufigkeiten um Regelmäßigkeiten und Veränderungen durch interne und externe Einflussfaktoren zu identifizieren (vgl. Riedel, 2000, S. 14).

Für die Auflistung der wichtigsten Aspekte der quantitativen Eigenschaften der Anzahl an Artikeln empfiehlt es sich diverse Analysemethoden synergetisch anzuwenden, um so eine um- fangreiche empirische Evidenz im Hinblick auf antizipierte Vermutungen oder Hypothesen zu generieren. Vor diesem Hintergrund steht zu Beginn der Datenanalyse die bereits erwähnte deskriptive Statistik (siehe Abschnitt 3.1) zu der gezählten Anzahl an Artikel. Im wesentlichen kommen hier Lagemaße sowie Dispersionsmaße zum Einsatz. Weiter folgt eine Trendanalyse im Abschnitt 3.2, in der die Anzahl der Zeitschriftenartikel in Abhängigkeit der Jahre auf Regelmäßigkeiten und Veränderungen untersucht werden, sodass daraus Rückschlüsse auf den Einfluss des Bayes’schen Theorems auf die Forschung abgeleitet werden kann. In diesem Sinne wird unter Zuhilfenahme von Regressionsanalysen rückwirkend der Verlauf der Artikelanzahl pro Jahre geschätzt. Die Theorie zu den Regressionsmodellen ist dem Anhang C angefügt. Im letzten Schritt soll die Identifizierung von Einflussfaktoren, welche das Publikationsverhalten zu den bayesianischen Methoden erklären soll, anhand einer Korrelationsanalyse (siehe Abschnitt 3.3) durchgeführt werden.

Alle Analyseverfahren und Schätzungen werden rechnergestützt mit der Statistiksoftware R®2 durchgeführt. In diesem Sinne sind alle Ergebnisse sowie Grafiken als Resultat der Analyse über die Software zu verstehen.

2.2.2 Qualitative Analyse

Im Anschluss an die explorative Datenanalyse soll der Untersuchungsgegenstand einer qualitativen inhaltlichen Analyse (siehe Kapitel 4) jene Menge an Zeitschriftenartikel sein, die durch die zeitliche Restriktion auf die Jahre 2014 und 2015 zurückzuführen ist und zuvor durch ein Beurteilungsverfahren als einflussreich beziehungsweise mit einer hohen Wirksamkeit und Relevanz auf Ebene der Forschung identifiziert werden konnte. Dementsprechend steht die qualitative Analyse in einem direkten Bezug zu den Forschungsfragen FF2 und FF3.

Ziel ist es alle wesentlichen bayesianischen Anwendungen in den Zeitschriftenartikeln in systematischer Weise zu erfassen und zu präsentieren, wodurch zum eine die Frage nach thematischen Forschungstendenzen hinsichtlich der bayesianischen Methoden und Techniken beantwortet werden soll und zum andern sollen die Forschungsfelder identifiziert werden, welche aktuell ein starkes Interesse an den Methoden aufweisen. Hierfür sollen vorab in einem Kategorisierungsprozess (siehe Abschnitt 2.5) alle Informationen extrahiert werden, die für die Analyse als notwendig erscheinen. So wird zwar während des Analyseprozesses auch auf quantitative Auszählverfahren zurückgegriffen, vielmehr steht aber die inhaltliche qualitative Analyse der Ergebnisse der Kategorisierung im Vordergrund.

Für die Durchführung des Kategorisierungsprozesses und der qualitativen Analyse wird das Literaturverwaltungsprogramm Citavi® verwendet, welches verfügbar ist unter http://www. citavi.de (aufgerufen am 06.02.2016).

2.3 Erhebung

Für die Erhebung von Publikationen einer systematischen Literaturübersicht werden zunächst Datenbanken identifiziert, bei denen eine Suche ein möglichst breites Resultat an Publikationen zum Bayes’schen Theorem gewährleistet. Das Risiko, dass hinsichtlich der Forschungsfragen re- levante Veröffentlichungen nicht berücksichtigt werden, soll hier minimiert werden. Demzufolge sollte die jeweilige Datenbank einen Zugang zu den Archiven möglichst vieler wissenschaftli- cher Fachzeitschriften haben und dieser Zugang muss auch kostenfrei zur Verfügung stehen.

Unter diesen Aspekten eigenen sich folgende große Datenbanken für eine Literatursuche über

Forschungsarbeiten des Bayes’sche Theorem:

- ScienceDirect® von ELSEVIER (http://www.sciencedirect.com/)
- JSTOR® (http://www.jstor.org/)
- arXiv® der Cornell University Library (http://arxiv.org/)
- Project Euclid® der Kollaboration zwischen Cornell University Library und Duke Uni- versity Press (http://projecteuclid.org/).

Der Suchbegriff konzentriert sich einheitlich in jeder Datenbank auf den Namen „Bayes“ im Titel oder der Zusammenfassung einer Publikation. Die Anwendungen und Modelle, die aus dem Bayes’schen Theorem entwickelt worden sind, werden aufgrund ihrer charakteristischen Eigenart und Abgrenzung zur frequentischen Statistik mit dem Nachnamen des Mathematikers und Entwicklers des Theorems gekennzeichnet. Folglich sollten auch alle Forschungsarbeiten, die hinsichtlich der Forschungsfragen relevant sind, im Titel seinen Namen angeben. Weiterhin können jedoch auch noch unterschiedliche Begriffe aus dem Namen abgeleitet werden. Darum wird dieser um ein Trunkierungszeichen erweitert und man erhält somit als finalen Suchbegriff: bayes*. Dieser liefert Suchresultate für alle Artikel, bei denen sich im Titel beispielsweise die Begriffe „bayes“, „bayesian“ oder „bayesianism“ befinden.

Der Zeitraum für die Literatursuche wird so gewählt, dass alle Publikationen berücksichtigt werden sollen, die vor 2016 veröffentlicht worden sind, jedoch nicht diejenigen, die sich mit der Bearbeitungszeit dieser Arbeit überschneiden. Dies ist zum einen für das systematische Sam- meln von quantitativen Informationen in dem Zeitraum von 1900 bis 2015 für die Forschungs- frage FF1 sinnvoll und zum anderen kann für die qualitative Untersuchung mit dem Fokus auf aktuelle Publikationen der Zeitraum noch weiter auf die Jahre 2014 und 2015 eingeschränkt werden.

Ausgehend von dem Suchbegriff und dem Beobachtungszeitraum erhält man so bei einer Suche über die oben genannten Datenbanken einen Datensatz mit der Menge an Artikeln A0, die n0 = 11.906 Forschungsarbeiten umfasst. Die konkrete Aufteilung der Resultate nach den jeweiligen Datenbanken befindet sich in Tabelle 1.

2.4 Selektion

Die 11.906 erhobenen Forschungsarbeiten haben vorerst für eine Analyse in Bezug auf die Forschungsfragen wenig Bedeutung, da die erzeugte Relevanz für die Forschung der einzelnen

Tabelle 1: Anzahl der Suchresultate in den Datenbanken

Abbildung in dieser Leseprobe nicht enthalten

Publikationen erst evaluiert werden muss. Viele Autoren systematischer Übersichtsarbeiten (vgl. Fragoso, Tiago M. und Louzada Neto, Francisco , 2015; Böhmer, Kristof und Rinderle- Ma, Stefanie, 2015) formulieren aus diesem Grund Auswahlkriterien, die die Daten geeignet aufbereiten. Die Idee hinter der Aufbereitung der Erhebungen dieser Untersuchung beinhalten einerseits Kriterien, die das Behalten bestimmen sollen und andererseits den Bedeutungsgrad eine Publikation hinterfragen. Zusätzlich sollen Kriterien für das Aussondern eine möglichste unverzerrte und isolierte Analyse hinsichtlich der Forschungsfragen ermöglichen. Ausgehend davon sind die Kriterien für das Aussondern (KA) und das Behalten (KB ) einer identifizierten Forschungsarbeit wie folgt formuliert:

KA : Die Publikation hat keine Relevanz zu den Forschungsfragen oder ein Zugang zu dem Abstract oder ein Volltext ist nicht gegeben. Ist ein Artikel in einem Buch, Tagungsband (inklusive Konferenzen, Meetings, Workshops und Symposien), als graue Literatur oder als Kurzartikel veröffentlicht, wird dieser ebenso ausgesondert wie diejenigen Artikel, die nicht als Erstveröffentlichungen identifiziert werden; darunter zählen unter andern Kommentare, Ergänzungen oder Erwiderungen zu bestehenden Artikeln.

KB : Die Publikation muss sowohl in englischer Sparache verfasst worden sein als auch im Titel mindestens das Schlagwort „Bayes“ aufweisen. Weiterhin muss der Artikel aus einer wis- senschaftlichen Fachzeitschrift mit Peer-Review-Verfahren sein und der wissenschaftliche Einfluss der Zeitschrift muss durch die Zeitschriftenbewertung SCImago Journal Ranking (SJR) 20143 von der SCImago® Forschungsgruppe zu evaluieren sein.

Die Kriterien aus KB und KA werden sequenziell auf den erhobenen Artikelbestand n0 an- gewendet, sodass isolierte Datensätze mit dem Ziel, Antworten auf die Forschungsfragen zu finden, generiert werden können. Darüber hinaus ist die Wirkung einer Publikation aus einem isolierten Datensatzes erst durch die Anzahl der zuvor angewendeten Kriterien zu messen, die wiederum notwendig waren um diesen Datensatz zu generieren. Dies liegt vordergründig daran, dass sich die Anzahl der einflussreichen Zeitschriftenartikel aufgrund der kumulierten Anzahl zuvor angewendeten Kriterien reduziert. Demnach lässt sich die Unterscheidung der isolierten Datensätze hinsichtlich ihrer Einflussnahme auf die Wissenschaft als Qualitätsmerkmal auffassen und bildet die Kernstrategie bei den im Anschluss folgenden Analysen.

Für die Umsetzung der Generierung isolierter Datensätze durch die partielle Anwendung der Kriterien soll ein Selektionsalgorithmus mit einer vorgegeben Sequenz aus den vier Screenings s = 1,...,4 angewendet werden. Die sequenziell ablaufenden Screenings sind in Tabelle 2 aufgelistet.

Tabelle 2: Screening-Sequenz des Selektionsalgorithmuses

Abbildung in dieser Leseprobe nicht enthalten

Darüber hinaus ist die Erhebung als Vor-Screening aufzufassen, sodass diese bereits im vor- hergehenden Abschnitt mit dem Index s = 0 bezeichnet wurde. Ausgehend von der auf dieser Ebene ermittelten Anzahl an Artikeln n0 = 11.906 aus der Artikelmenge A0 erzeugt der Selekti- onsalgorithmus nach jedem Screening s = 1, . . . , 4 eine neue Artikelmenge As mit der jeweiligen Anzahl an Artikeln ns, die als a priori Annahme in folgender Relation zur Ausgangsanzahl ste- hen:

Abbildung in dieser Leseprobe nicht enthalten

Weiterhin ermöglicht die Journalgruppierung des ersten Screenigs, dass sich ebenfalls eine Men- ge an Journale Js identifizieren lassen, dessen Anzahl im Folgenden mit ms bezeichnet wird. Eine Journalmenge J0 vor dem ersten Screening ist nicht sinnvoll zu erfassen, denn nicht alle erfassten Forschungsarbeiten aus A0 sind in einer Fachzeitschrift veröffentlicht. Schlussendlich lassen sich Mengen der jeweiligen Artikel Ais und dessen Journale Jis nach den Screenings s formulieren durch:

Abbildung in dieser Leseprobe nicht enthalten

Es wird im Folgenden die Screening-Sequenz aus Tabelle 2 näher diskutiert, wodurch auf die Frage eingegangen werden soll, in welcher logischen Abfolge die Kriterien aus KA und KB angewendet werden sollten, um eine sukzessive Steigerung der zu evaluierenden Qualität des generierten Datensatzes zu ermöglichen. Die Ergebnisse des Selektionsalgorithmuses in Form der jeweiligen Anzahl an Forschungsarbeiten, die ein Datensatz nach jedem Screening umfasst, sollen dabei ebenso in der nachfolgenden Betrachtung Bestandteil sein wie die Zuweisung der qualitativen und explorativen Datenanalysen zu den jeweiligen Datensätzen. In einem letz- ten Schritt werden die wesentlichen Resultate aus dir Selektion mithilfe eines modifizierten PRISMA-Flussdiagramms von Moher et al. (2009) visualisiert (siehe Abbildung 2).

Abbildung in dieser Leseprobe nicht enthalten

Das erste Screening dient vor allem dem Aufbereiten des Datenbestandes A0, sodass die in Tabelle 2 genannten Filter (Journalfilter, Zeitfilter und Titelfilter) angewendet werden können. Zunächst werden die n0 = 11.906 erhobenen Forschungsarbeiten als verzerrt angenommen, da diese aus vier verschiedenen Datenbanken stammen und von daher Duplikate vorhanden sein können. Nach der Eliminierung der Duplikate wird das erste Aussonderungskriterium aus KA angewendet. Dieses prüft, ob die Forschungsarbeit ein Zeitschriftenartikel aus einer Fachzeit- schrift ist und nicht etwa ein Artikel aus einem Buch, Tagungsband oder gar nicht publiziert ist.

Weiterhin fordert ein Kriterium für das Behalten aus KB , dass der Einfluss der Forschungs- arbeit über die Bewertung der Fachzeitschrift im SCImago Journal Ranking 2014 zu evaluieren sein muss. Daher wird in diesem Screening bereits den übrigen Fachzeitschriften deren SJR- Indikatoren 2014 zugewiesen und anschließend anhand den Angaben von SCImago® in große Fachdisziplinen d = 1, . . . , 27 gruppiert, welche aus der Tabelle 11 im Anhang A.1 zu entnehmen sind. Aufgrund von möglich auftretenden multidisziplinären Journalen sind in dem Gruppie- rungsalgorithmus überlappende Gruppenbildungen zulässig. So wird beispielsweise ein Journal, das nicht nur einer, sondern mehreren Fachdisziplinen zugeordnet werden kann, auch jeder infrage kommenden Disziplinen zugeordnet. Alle Artikel, dessen Journale kein SRJ-Indikators 2014 aufweisen, entfallen ebenso für den weiteren Begutachtungsprozess wie diejenigen Arti- kel, dessen Journal nicht im SCImago Journal Ranking 2014 jedoch in einem Vorjahr bewertet worden sind.

So erhält man unter der Berücksichtigung der Gleichung (5) die Journalmenge J1 mit m1 = 1.017 Journalen, aus denen sich unter Berücksichtigung der Gleichung (4) die Menge an Zeitschriftenartikel A1 mit n1 = 9.768 Forschungsarbeiten ableiten lässt, welche die Veröffentlichungsjahre von yi ∈ {1920, 1958, 1960, . . . , 2015} umfassen, wobei der Artikelindex definiert ist durch i = 1, . . . , 9.768.

Schlussendlich ist das Ergebnis der Häufigkeitsverteilung der Artikel n1(d) nach dem Scree- ning s = 1 in Abhängigkeit der überlappenden Fachdisziplinen d im Anhang A.1 in der Tabelle 11 dritte Spalte abgebildet.

Diese ersten isolierten Datensätze sind der Untersuchungsgegenstand einer explorativen Analyse im Hinblick auf die Forschungsfrage der langfristige Entwicklung des Bayes’schen Theorems in der Forschung (FF1). Zu beachten ist hierbei, dass die Wirkung einer Publikation Ai1 auf die Forschung mit der geringsten Qualitätsstufe angenommen wird, da bisher lediglich ein Kriterium als Bemessungsgrundlage angewendet wurde.

Abbildung in dieser Leseprobe nicht enthalten

Die Idee hinter dem zweiten Screening ist die, dass der qualitative Wert der Daten für die weitergehende Analyse steigen soll. Dass heißt konkret, dass anhand eines Bewertungsinstru- ments der wissenschaftliche Einfluss einer Forschungsarbeit aus der Menge A1 beurteilt wird und diejenigen Artikel ausgesondert werden, die einen Bewertungsmaßstab nicht erfüllen, wo- durch ein neuer -hinsichtlich der Forschung als einflussreicher angesehener - Artikelbestand A2 generiert wird. Für die Umsetzung der Beurteilung werden nicht die Arbeiten selbst, sondern dessen Journale aus der Menge J1 begutachtet, welches durch das oben bereits erwähnte SCI- mago Journal Ranking 2014 durchgeführt wird. Für die Evaluation wurde bereits während des Screenings s = 1 allen infrage kommenden Journalen Jj1 dessen SJR-Indikator zugewiesen.

Eine Untersuchung von González-Pereiraa, Borja; Guerrero-Boteb, Vicente P. und Moya- Anegónc, Félix (2010) zeigt, dass für die Brechung des SJR-Indikator ein Wert eingeführt wird, der den wissenschaftlichen Einflusses einer Zeitschrift daran misst, von welcher anderen Zeit- schrift diese zitiert wird. Weiterhin wird ausgeführt, dass dem SCImago Journal Ranking für die Zitate die umfassende Datenbank von Scopus® als Ressource zur Verfügung steht und der Indikator gewichtet ist, die Journal-selbst-Zitierungen limitiert und einen Zeitraum der Zitate von drei Jahren berücksichtigt, weshalb er für die Evaluation einer Zeitschrift (vgl. GonzálezPereiraa, Borja; Guerrero-Boteb, Vicente P. und Moya-Anegónc, Félix, 2010), insbesondere für Auswahl der qualitativ bedeutsameren Zeitschriften aus der Journalmenge J1 dieser Untersuchung besonders geeignet ist.

Aus diesen Gründen wird mithilfe des SJR-Indikatores ein Rangvergleich der Zeitschriften durchgeführt. Der Rangvergleich verletzt nur dann die Untersuchungsanforderungen nicht, wenn durch die Selektion nicht etwa Fachzeitschriften aus den Disziplinen d ausgesondert werden, die für die Beantwortung der Forschungsfrage FF3 von Bedeutung sind, was der Fall wäre, wenn die SJR-Indikatoren unabhängig von den wissenschaftlichen Disziplinen verglichen werden. Unter der Berücksichtigung, dass nicht nur das absolute Ranking betrachtet werden sollte, sondern auch das Journal-Ranking in Abhängigkeit der Forschungsdisziplin, werden vor der Journalfil- terung aus allen möglichen Journalen der Scopus® Datenbank anhand des SJR-Indikators 2014 eine eigenständig entwickelte Ranking-Liste SRL gebildet, welche die Bewertungsgrundlage für die Menge an Journalen J1 darstellt.

Im Folgenden soll die Frage beantwortet werden, wie die Ranking-Liste SRL als Bewertungs- instrument formuliert werden sollte, sodass zum einen in ihr die einflussreichsten Journale aller Fachdisziplinen involviert sind und zum anderen berücksichtigt wird, dass das Bayes’sche Theorem und auch dessen Applikationen in erster Linie statistischer Natur sind. Vor dem Hintergrund der Analyse kann hier von einer Antizipation ausgegangen werden, da eine nicht unwesentliche Anzahl an Publikationen in Fachjournalen aus dem Bereich der Mathematik, insbesondere der Statistik und der Wahrscheinlichkeitslehre (Statistics and Probability), veröf- fentlicht worden sind. Diese seien jedoch keinesfalls für eine qualitative Bewertung zu vernach- lässigen.

Für die Formulierung der Liste ist es demnach sinnvoll, diese aus mehren Teillisten zu bil- den, um so alle Bedingungen zu erfüllen. Die erste Komponente bildet die Menge der hundert einflussreichsten Journale über alle Fachdisziplinen hinweg ab. Dies ist sinnvoll, denn wie oben bereits beschrieben werden die Ränge über den gewichteten SJR-Indikator 2014 gebildet, wo- durch es ermöglicht wird einen relativen Vergleich des Einflusses eines Journals durchzuführen das unabhängig von der jeweiligen Fachdisziplin ist. Diese Liste wird im Weiteren als die Menge STop100 absolut bezeichnet.

Um den Radius der Zeitschriften im Hinblick auf die |d| = 27 wissenschaftlichen Disziplinen4 zu erweitern, die für den Begutachtungsprozess mit einbezogen werden sollen, werden für die zweite Komponente aus allen Disziplinen die jeweiligen besten zehn Journale extrahiert STop10 d und dessen Vereinigungsmenge gebildet:

Abbildung in dieser Leseprobe nicht enthalten

So steht beispielsweise STop101 für die Menge der zehn Zeitschriften mit den höchsten SJR- Indikator aus der Fachdisziplin d = 1 (Agriculural and Biological Science). Darüber hinaus er- möglicht die Gleichung 6, durch die Vereinigung der 27 Journalmengen aus den Disziplinen ein Journal, das in mehreren Disziplinen gelistet ist, nur einmal als Bewertungsmaßstab berücksich- tigt wird. Dadurch Duplikate vermieden werden. Die letzte Komponente für die Erstellung der Ranking-Liste JJR deutet an, dass die bayesianischen Ansätze für statistische Untersuchungen angewendet werden. Demzufolge sind einflussreiche Forschungen auch in Zeitschriften veröffent- licht, die Teildisziplinen der Mathematik (d = 18), die Statistik und Wahrscheinlichkeitslehre, zuzuordnen sind. Aus diesem Grund werden für das Bewertungsinstrument zusätzlich die hun- dert einflussreichsten Journale aus dieser Teildisziplin mit berücksichtigt und im Folgenden mit der Menge STop100 SaP bezeichnet.

Schlussendlich wird das zugrundeliegende Bewertungsinstrument gebildet durch die Vereinigung des absoluten Rankings aus Gleichung 6, des Rankings in Abhängigkeit der Fachdisziplinen und des Rankings in Abhängigkeit der Teildisziplin die Statistics and Probability:

Abbildung in dieser Leseprobe nicht enthalten

Der Bewertungsmaßstab umfasst |SRL| = 321 unterschiedliche Zeitschriften, in denen eine Veröffentlichung zu dem Bayes’schen Theorem als bedeutsam erachtet wird. Im nächsten Schritt wird überprüft, ob die Vorliegende Menge J1 Zeitschriften umfasst, die den Bewertungsmaßstab erfüllen und somit dessen identifizierten Artikel zu Bayes’schen Theorem als einflussreich evaluiert wird. In diesem Sinne generiert der Journalfilter die Menge J2 aus der Schnittmenge von J1und SJounalfilter, was konkret heißt, dass jedes Journal Jj1, mit j = 1,...,1.017, aus dem Screening s = 1, das ebenfalls als ein Element der selbst erstellten Ranking-Liste SRL identifiziert werden kann, den Bewertungskriterien des Screenings s = 2

[...]


1 pdf() steht für eine stetige Dichtefunktion (probability density function)

2 Verfügbar unter https://www.r-project.org/ (aufgerufen am 06.02.2016)

3 Das SCImago Journal Ranking 2014 ist verfügbar unter http://www.scimagojr.com/journalrank.php (aufgerufen am 11.02.2016).

4 Die jeweiligen Disziplinen d sind in der Tabelle 11 ersichtlich.

Excerpt out of 76 pages

Details

Title
Das Bayes'sche Theorem in der theoretischen und empirischen Forschung. Eine systematische Literaturübersicht
College
European University Viadrina Frankfurt (Oder)
Grade
1
Author
Year
2016
Pages
76
Catalog Number
V334599
ISBN (eBook)
9783668247604
ISBN (Book)
9783668247611
File size
2466 KB
Language
German
Keywords
Bayes’sches Theorem;, systematische Literaturübersicht, Trendanalyse, Poisson Regression mit der Regel von Bayes, Korrelationsanalyse;, Qualitative Analyse
Quote paper
Dennis Triepke (Author), 2016, Das Bayes'sche Theorem in der theoretischen und empirischen Forschung. Eine systematische Literaturübersicht, Munich, GRIN Verlag, https://www.grin.com/document/334599

Comments

  • No comments yet.
Look inside the ebook
Title: Das Bayes'sche Theorem in der theoretischen und empirischen Forschung. Eine systematische Literaturübersicht



Upload papers

Your term paper / thesis:

- Publication as eBook and book
- High royalties for the sales
- Completely free - with ISBN
- It only takes five minutes
- Every paper finds readers

Publish now - it's free