Die nachfolgende Datenanalyse untersucht den Datensatz "Arrests for Marihuana Possession". Der Datensatz erfasst Personen, die von 1997 bis 2002 in Toronto aufgrund des Besitzes kleiner Mengen von Marihuana festgenommen worden sind. Es handelt sich dabei um einen Auszug von einer umfassenderen Erhebung, die im Rahmen eines Artikels der Toronto Star-Zeitung veröffentlicht wurde.
Mit Hilfe von Rstudio wird die dekriptive Statistik betrachtet (diskrete, metrisch-verhältnisskalierte Variablen und kategoriale, nomalskalierte Variablen), T-tests sowie Signifikanztests durchgeführt und Korrelationskoeffizienten berechnet.
Inhaltsverzeichnis
- Vorstellung des Datensatzes „Arrests for Marihuana Possession“. Forschungsfragen und Hypothesen
- Datenimport und Überblick über den Datensatz
- Datenimport
- Überblick
- Variablenüberblick
- Sex - Geschlecht
- Age - Alter
- Employed - Beschäftigt
- Checks - Anzahl der Einträge in Polizeiakten
- Beschreibung und Analyse der Hypothesen
- Haben Männer und Frauen ein unterschiedliches Kriminalverhalten?
- Deskriptive Statistik
- Analyse
- Hat ein Beschäftigungsverhältnis einen Einfluss auf das kriminelle Verhalten?
- Deskriptive Statistik
- Analyse
- Steht das Alter der verhafteten Person in einem Zusammenhang mit dem kriminellen Verhalten?
- Vorbereitung der Datenanalyse
- Deskriptive Statistik
- Signifikanztest
- Fazit
Zielsetzung und Themenschwerpunkte
Diese Seminararbeit analysiert den Datensatz „Arrests for Marihuana Possession“, der Festnahmen wegen Marihuana-Besitzes in Toronto von 1997 bis 2002 umfasst. Ziel ist es, den Einfluss von Geschlecht, Beschäftigung und Alter auf das kriminelle Verhalten der verhafteten Personen zu untersuchen.
- Analyse des Zusammenhangs zwischen Geschlecht und Kriminalverhalten.
- Untersuchung des Einflusses des Beschäftigungsstatus auf das Kriminalverhalten.
- Beziehung zwischen Alter und Häufigkeit von Polizeieinträgen.
- Deskriptive Statistik und Datenvisualisierung.
- Interpretation der Ergebnisse im Kontext der Forschungsfragen.
Zusammenfassung der Kapitel
1 Vorstellung des Datensatzes „Arrests for Marihuana Possession“. Forschungsfragen und Hypothesen: Dieses Kapitel führt den Datensatz „Arrests for Marihuana Possession“ ein, der Festnahmen wegen kleinen Mengen Marihuana-Besitzes in Toronto zwischen 1997 und 2002 beinhaltet. Es werden die Forschungsfrage – ob Geschlecht, Beschäftigung und Alter das kriminelle Verhalten beeinflussen – und die dazugehörigen Hypothesen formuliert. Der Datensatz wird als Auszug einer größeren Erhebung beschrieben und seine Struktur (5226 Zeilen, 8 Spalten) sowie die Quelle angegeben. Die zentralen Hypothesen legen die erwarteten Zusammenhänge zwischen den unabhängigen Variablen (Geschlecht, Beschäftigung, Alter) und der abhängigen Variable (Anzahl der Polizeieinträge) dar. Das Kapitel legt den Grundstein für die anschließende Datenanalyse.
3 Datenimport und Überblick über den Datensatz: Dieses Kapitel beschreibt den Import des Datensatzes in RStudio und gibt einen ersten Überblick über die enthaltenen Variablen. Es werden die verwendeten R-Pakete genannt und der Importprozess detailliert dargestellt. Ein Auszug des Datensatzes wird gezeigt, und es wird erklärt, welche Variablen (year, released, colour, citizen) für die Analyse als irrelevant erachtet und somit ausgeschlossen werden. Anschließend wird ein neuer Datensatz erstellt, der nur die für die Hypothesen relevanten Variablen (age, sex, employed, checks) enthält. Der Kapitelabschluss beinhaltet eine deskriptive Übersicht der verbleibenden Variablen mithilfe der Funktion inspect(), welche kategoriale und quantitative Variablen auflistet und deren jeweilige Kennzahlen (z.B. Mittelwert, Standardabweichung) anzeigt.
4 Variablenüberblick: In diesem Kapitel werden die für die Datenanalyse relevanten Variablen genauer betrachtet. Der Fokus liegt auf der Beschreibung der Variablen Geschlecht, Alter, Beschäftigungsstatus und Anzahl der Polizeieinträge (Checks). Es wird jeweils die Skalierung der Variablen (kategorial, nominal, numerisch) erläutert und eine deskriptive Statistik (z.B. Häufigkeitsverteilungen) präsentiert. Besonders wird die starke Ungleichverteilung der Geschlechter im Datensatz (deutlich mehr Männer als Frauen) hervorgehoben und durch ein Balkendiagramm visualisiert. Die Kapitel liefert somit eine solide Grundlage für das Verständnis der Daten und deren Ausprägungen vor der eigentlichen Hypothesentestung.
Schlüsselwörter
Marihuana-Besitz, Kriminalverhalten, Geschlecht, Beschäftigung, Alter, Datenanalyse, RStudio, Deskriptive Statistik, Hypothesentestung, Toronto.
Häufig gestellte Fragen (FAQ) zur Seminararbeit: Analyse des Datensatzes „Arrests for Marihuana Possession“
Was ist der Gegenstand dieser Seminararbeit?
Diese Seminararbeit analysiert den Datensatz „Arrests for Marihuana Possession“, der Festnahmen wegen Marihuana-Besitzes in Toronto von 1997 bis 2002 umfasst. Ziel ist die Untersuchung des Einflusses von Geschlecht, Beschäftigung und Alter auf das kriminelle Verhalten der verhafteten Personen.
Welche Forschungsfragen werden behandelt?
Die zentrale Forschungsfrage lautet: Beeinflussen Geschlecht, Beschäftigung und Alter das kriminelle Verhalten der verhafteten Personen? Diese Frage wird durch die Analyse der Zusammenhänge zwischen diesen unabhängigen Variablen und der abhängigen Variable (Anzahl der Polizeieinträge) beantwortet.
Welche Daten werden verwendet?
Die Analyse basiert auf dem Datensatz „Arrests for Marihuana Possession“. Dieser beinhaltet Daten zu Festnahmen wegen Marihuana-Besitzes in Toronto zwischen 1997 und 2002. Der Datensatz umfasst 5226 Zeilen und 8 Spalten, wobei einige Spalten (year, released, colour, citizen) für die Analyse als irrelevant eingestuft und ausgeschlossen wurden. Die relevanten Variablen sind Alter, Geschlecht, Beschäftigungsstatus und Anzahl der Polizeieinträge.
Welche Methoden werden angewendet?
Die Arbeit verwendet deskriptive Statistik, Datenvisualisierung (z.B. Balkendiagramme) und statistische Tests (Signifikanztests) zur Analyse der Daten. Die Datenanalyse wird mit RStudio durchgeführt, wobei die verwendeten R-Pakete im Detail beschrieben werden.
Welche Variablen werden untersucht?
Die wichtigsten Variablen sind:
- Geschlecht (Sex): Kategoriale Variable, die das Geschlecht der verhafteten Person angibt.
- Alter (Age): Numerische Variable, die das Alter der verhafteten Person angibt.
- Beschäftigungsstatus (Employed): Kategoriale Variable, die den Beschäftigungsstatus der verhafteten Person angibt.
- Anzahl der Polizeieinträge (Checks): Numerische Variable, die die Anzahl der Einträge in den Polizeiakten der verhafteten Person angibt.
Wie ist die Arbeit strukturiert?
Die Arbeit gliedert sich in folgende Kapitel: Vorstellung des Datensatzes und der Forschungsfragen, Datenimport und Überblick, Variablenüberblick, Beschreibung und Analyse der Hypothesen und Fazit. Jedes Kapitel wird in der Zusammenfassung der Kapitel detailliert beschrieben.
Welche Software wird verwendet?
Die Datenanalyse wird mit RStudio durchgeführt.
Welche Schlüsselwörter beschreiben die Arbeit?
Marihuana-Besitz, Kriminalverhalten, Geschlecht, Beschäftigung, Alter, Datenanalyse, RStudio, Deskriptive Statistik, Hypothesentestung, Toronto.
Wo finde ich den vollständigen Inhaltsverzeichnis?
Das vollständige Inhaltsverzeichnis befindet sich zu Beginn des HTML-Dokuments. Es listet alle Kapitel und Unterkapitel detailliert auf.
Gibt es eine Zusammenfassung der Kapitel?
Ja, die Arbeit enthält eine Zusammenfassung der einzelnen Kapitel, die die wichtigsten Inhalte und Ergebnisse jedes Kapitels beschreibt.
- Quote paper
- Lena Vogel (Author), 2019, Angewandte Datenanalyse. Untersuchung des Datensatzes "Arrests for Marijuana Possession", Munich, GRIN Verlag, https://www.grin.com/document/583697