Zum Inhalt springen

„Barplot“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
[ungesichtete Version][ungesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
FachueberM27 (Diskussion | Beiträge)
Keine Bearbeitungszusammenfassung
FachueberM27 (Diskussion | Beiträge)
Keine Bearbeitungszusammenfassung
Zeile 1: Zeile 1:
Ein Barplot ist ein in der deskriptiven Statistik häufig verwendeter Diagrammtyp zur grafischen Darstellung von Zahlenwerten in Form von rechteckigen und nicht aneinandergrenzenden Säulen mit unterschiedlicher Länge (und bedeutungsloser Breite). Der englische Begriff Barplot umfasst die Darstellungsformen als '''Balkendiagramm''', '''Stab- oder Säulendiagramm''', '''Doppel-Säulendiagramm''' oder '''3D-Säulendiagramm''', das aus neben- oder hintereinander gestellten Säulen besteht. Diese Diagrammformen zeigen grafisch die absolute oder relative Häufigkeit für alle Arten von bivariaten empirischen Verteilungen für diskrete oder gruppierte stetige Merkmale durch die Höhe bzw. Länge eines isoliert stehenden Balkens.
Ein Barplot ist ein in der deskriptiven Statistik häufig verwendeter Diagrammtyp zur grafischen Darstellung von Zahlenwerten in Form von rechteckigen und nicht aneinandergrenzenden Säulen mit unterschiedlicher Länge (und bedeutungsloser Breite). Der englische Begriff Barplot umfasst die Darstellungsformen als '''Balkendiagramm''', '''Stab- oder Säulendiagramm''', '''Doppel-Säulendiagramm''' oder '''3D-Säulendiagramm''', das aus neben- oder hintereinander gestellten Säulen besteht. Diese Diagrammformen zeigen grafisch die absolute oder relative Häufigkeit für alle Arten von bivariaten empirischen Verteilungen für diskrete oder gruppierte stetige Merkmale durch die Höhe bzw. Länge eines isoliert stehenden Balkens.


== Funktionen und Eigenschaften ==
== Funktionen und Eigenschaften ==
Barplots dienen in erster Linie dazu, einen schnellen Überblick über absolute oder relative Häufigkeiten einer Verteilung zu geben. Sie können zeigen, wie häufig ein bestimmtes Objekt in einer Reihe aufeinanderfolgender Größenklassen auftritt. Darin liegt auch ihr Vorzug im Vergleich zu Kreisdiagrammen, die das Augenmerk stärker darauf richten, wie ein Ganzes durch seine Teile aufgegliedert wird.<br />
Barplots dienen in erster Linie dazu, einen schnellen Überblick über absolute oder relative Häufigkeiten einer Verteilung zu geben. Sie können zeigen, wie häufig ein bestimmtes Objekt in einer Reihe aufeinanderfolgender Größenklassen auftritt. Darin liegt auch ihr Vorzug im Vergleich zu Kreisdiagrammen, die das Augenmerk stärker darauf richten, wie ein Ganzes durch seine Teile aufgegliedert wird.<br />


Werden die Häufigkeiten im zeitlichen Verlauf betrachtet, so lassen sich mittels Barplots auch Entwicklungen in Form von Zeitreihen veranschaulichen. Darüber hinaus können auch statistische Kennwerte (z.B. arithmetisches Mittel, Median, Modus) verschiedener Gruppen verglichen werden. <br />
Werden die Häufigkeiten im zeitlichen Verlauf betrachtet, so lassen sich mittels Barplots auch Entwicklungen in Form von Zeitreihen veranschaulichen. Darüber hinaus können auch statistische Kennwerte (z.B. arithmetisches Mittel, Median, Modus) verschiedener Gruppen verglichen werden. Barplots eignen sich besonders, um wenige Ausprägungen (bis ca. 15) übersichtlich darzustellen. Bei mehr Kategorien sind zu Gunsten einer besseren Anschaulichkeit Liniendiagramme zu bevorzugen.<br />
Barplots eignen sich besonders, um wenige Ausprägungen (bis ca. 15) übersichtlich darzustellen. Bei mehr Kategorien sind zu Gunsten einer besseren Anschaulichkeit Liniendiagramme zu bevorzugen.<br />
Barplots lassen sich handschriftlich (manuell) und elektronisch erstellen. So haben nicht nur Statistikprogramme wie SPSS, Stata und R spezielle Funktionen zur Erstellung von Barplots, sondern auch das MS-Office-Paket mit Word und Excel sowie das Open Office Paket Funktionen, mit denen sich Daten grafisch als Säulendiagramme darstellen lassen.
Barplots lassen sich handschriftlich (manuell) und elektronisch erstellen. So haben nicht nur Statistikprogramme wie SPSS, Stata und R spezielle Funktionen zur Erstellung von Barplots, sondern auch das MS-Office-Paket mit Word und Excel sowie das Open Office Paket Funktionen, mit denen sich Daten grafisch als Säulendiagramme darstellen lassen.



Version vom 23. Juni 2011, 20:49 Uhr

Ein Barplot ist ein in der deskriptiven Statistik häufig verwendeter Diagrammtyp zur grafischen Darstellung von Zahlenwerten in Form von rechteckigen und nicht aneinandergrenzenden Säulen mit unterschiedlicher Länge (und bedeutungsloser Breite). Der englische Begriff Barplot umfasst die Darstellungsformen als Balkendiagramm, Stab- oder Säulendiagramm, Doppel-Säulendiagramm oder 3D-Säulendiagramm, das aus neben- oder hintereinander gestellten Säulen besteht. Diese Diagrammformen zeigen grafisch die absolute oder relative Häufigkeit für alle Arten von bivariaten empirischen Verteilungen für diskrete oder gruppierte stetige Merkmale durch die Höhe bzw. Länge eines isoliert stehenden Balkens.

Funktionen und Eigenschaften

Barplots dienen in erster Linie dazu, einen schnellen Überblick über absolute oder relative Häufigkeiten einer Verteilung zu geben. Sie können zeigen, wie häufig ein bestimmtes Objekt in einer Reihe aufeinanderfolgender Größenklassen auftritt. Darin liegt auch ihr Vorzug im Vergleich zu Kreisdiagrammen, die das Augenmerk stärker darauf richten, wie ein Ganzes durch seine Teile aufgegliedert wird.

Werden die Häufigkeiten im zeitlichen Verlauf betrachtet, so lassen sich mittels Barplots auch Entwicklungen in Form von Zeitreihen veranschaulichen. Darüber hinaus können auch statistische Kennwerte (z.B. arithmetisches Mittel, Median, Modus) verschiedener Gruppen verglichen werden. Barplots eignen sich besonders, um wenige Ausprägungen (bis ca. 15) übersichtlich darzustellen. Bei mehr Kategorien sind zu Gunsten einer besseren Anschaulichkeit Liniendiagramme zu bevorzugen.
Barplots lassen sich handschriftlich (manuell) und elektronisch erstellen. So haben nicht nur Statistikprogramme wie SPSS, Stata und R spezielle Funktionen zur Erstellung von Barplots, sondern auch das MS-Office-Paket mit Word und Excel sowie das Open Office Paket Funktionen, mit denen sich Daten grafisch als Säulendiagramme darstellen lassen.

Erscheinungsformen

Einfaches Säulendiagramm

Ein einfaches Säulendiagramm ermöglicht die Darstellung absoluter oder relativer Häufigkeiten einzelner Merkmale in Form einer vertikalen Säule. Die Häufigkeiten der Merkmale werden in einem Säulendiagramm über die Höhe und deren Differenzen definiert. Die Breite einer Säule hat somit keine Aussagekraft. Daher ist es notwendig, dass die Ordinate bei Null beginnt. Die Reihenfolge der Merkmalsausprägungen in einem Säulendiagramm ist bei nominalskalierten Merkmalen (z.B. Wohnort) willkürlich festlegbar. Im Vergleich dazu sollten die Ausprägungen bei ordinalskalierten Merkmalen (z.B. Schulnoten) einer Ordnung folgen. Bei quantitativen Merkmalen (z.B. Alter) sollte sich auch der Abstand der Merkmalsausprägungen proportional wiederfinden.

Sonderformen

Gestapeltes Säulendiagramm

Gestapelte Säulendiagramme, auch Stapeldiagramme genannt, stellen relative Häufigkeiten in einer Rechtecksäule dar. Die jeweiligen Häufigkeiten werden demnach als Flächen dargestellt. Die einzelnen Werte werden übereinander angeordnet und die Rechtecksäule bildet den Gesamtwert ab. Gesamtwerte werden auf diese Weise besser vergleichbar. Jedoch ist das Stapeldiagramm weniger gut geeignet, um Veränderungen der abgebildeten Anteile abzulesen.

Gruppiertes Säulendiagramm

Das gruppierte Säulendiagramm bildet die Werte mehrerer Kategorien nebeneinander ab. Die verschiedenen Variablen sind somit direkt miteinander vergleichbar. Die aggregierten Daten können in diesem Diagrammtyp jedoch schwer abgelesen und verglichen werden.

Überlappendes Säulendiagramm

In einem überlappenden Säulendiagramm werden die Säulen eines jeweiligen Merkmals überlappt dargestellt. Diese Darstellungsvariante wird häufig für mehrere Zeitreihen verwendet. Diesbezüglich findet sich die neueste Zeitreihe im Vordergrund und demensprechend sind ältere Zeitreihen teilweise verdeckt.

Balkendiagramm

Das Balkendiagramm ist dem Säulendiagramm sehr ähnlich. Der einzige Unterschied besteht in der Art der Visualisierung. Denn ein Balkendiagramm ist ein um 90° gedrehtes Säulendiagramm, d.h. dass anstatt der vertikalen Säulen horizontale Balken zu sehen sind. Die Kriterien bezüglich der Reihenfolge und sonstigen Darstellung sind mit denen des Säulendiagramms identisch. Besonders gut sind Balkendiagramme für die Darstellung von Rangfolgen geeignet.

Erstellung mit R

Der Begriff Barplot taucht häufig in Verbindung mit dem Statistikprogramm R auf. Aus diesem Grund wird hier genauer auf die Anwendung in R eingegangen. Mit der Funktion barplot () wird ein Säulendiagramm erstellt. Zu beachten ist, dass als Ausgangswerte nur Vektoren oder Matrizen fungieren können. Aus Vektoren werden einfache Säulendiagramme, aus Matrizen gruppierte oder gestapelte Säulendiagramme erzeugt.

Einfaches Säulendiagramm

Die Grundform für Kennwerte einer Variablen, die getrennt für verschiedene Gruppen dargestellt werden sollen, lautet in der allgemeinen Form:

barplot (height=(Vector), horiz=FALSE).

Wollschläger verdeutlicht dies anhand eines Beispiels, bei dem die Häufigkeiten von simultanen Würfen einen sechsseitigen Würfels gezählt wurden.

> Dice <- sample (1:6. 100, replace=TRUE)

> (dTab <- table (dice))

dice 1 2 3 4 5 6

17 23 14 20 14 12

> barplot(dTab, ylim=c(0,30), xlab=“Augenzahl“, ylab=“N“, col=“red“,

+ main=“Absolute Häufigkeiten“)

Anhand dieses Beispiels lassen sich die verschiedenen Einstellungsmöglichkeiten (vielleicht fällt euch hier ein besseres Wort ein…) erklären:

Als Vektor und somit als Basis für die Darstellung fungiert die Tabelle unter „dice“. Die erste Zeile beinhaltet die Werte der x-Achse und die zweite die Werte der y-Achse, durch die die Höhe der Säulen bestimmt wird. Ylim stellt den Wertebereich der y-Achse folgendermaßen dar: c(Minimum), (Maximum). Sind keine Angaben für xlim() und ylim() vorhanden, werden die Achsen anhand der kleinsten und größten Vektorwerte automatisch eingefügt. Mit Xlab und ylab werden die Achsenbezeichnungen festgelegt.

Sollen die relativen Häufigkeiten anstatt der absoluten abgebildet werden, müssen diese zuerst mit der Funktion Prop.table() berechnet und der Quelltext wie folgt verändert werden:

> barplot (Prop.table(table(dice)), ylim=c(0. 0.3). xlab=”Augenzahl”,

+ ylab=”relative Häufigkeit”, col=”blue”,

+ main=“Relative Häufigkeiten“)

Gruppierte und gestapelte Säulendiagramme

Möchte man Kombinationen mehrerer Faktoren darstellen, kann man gruppierte oder gestapelte Säulendiagramme nutzen. Um bei dem Würfelbeispiel zu bleiben, kann man einen Vekor hinzufügen, in dem die Ergebnisse eines zweiten Würfeldurchgangs eingetragen werden.

Mit dem Befehl beside=TRUE wird ein gruppiertes Diagramm, mit beside=FALSE ein gestapeltes Diagramm erstellt. Legend.text=TRUE führt dazu, dass eine Legende in das Diagramm eingefügt wird. Für die farbliche Gestaltung der Säulen wir der Befehl col in der Form col=c(„colour1“, „colour2“) genutzt.

Daraus ergibt sich folgender Quelltext:

> roll1 <- dice [1:50] # erste Serie Würfelwürfe

> roll1 <- dice [51:100] # zweite Serie

> rollAll <- rbind(table(roll1), table(roll2))

< rownames (rollAll) <- c(“first”,”second”); rollAll

1 2 3 4 5 6

First x1 x2 x3 x4 x5 x5

Second y1 y2 y3 y4 y5 y6


Mit folgendem Quelltext wird ein gestapeltes Säulendiagramm erzeugt:

> barplot (rollAll, beside=FALSE, legend.text=TRUE, xlab=”Augenzahl”,

+ Ylab=”N”, main=”Absolute Häufigkeiten in zwei Substichproben”)

Soll ein gruppiertes Diagramm erstellt werden, kann folgender Quelltext verwendet werden:

> barplot (rollAll, ylim=c(o,16), col=C(„red“, „blue“), beside=TRUE, legend.text=TRUE,

+ xlab=”Augenzahl”, ylab=”N”, main=”Absolute Häufigkeiten in zwei Substichproben”)

Darüber hinaus ist die Änderung diverser optischer Elemente möglich.