Statistik
Als eine Statistik bezeichnet man:
- namengebend (v. lat.: status = Staat, Zustand; mit griechischer Endung) die (vergleichende) Staatsbeschreibung (eingeführt wurde der Begriff vom Göttinger Kameralisten Gottfried Achenwall um 1749);
- die heute als amtliche Statistik fortlebt;
- davon verallgemeinernd quantitative Erhebungen aller Art, wie zum Beispiel für Markt- und Meinungsforschung (siehe Quantitative Methoden );
- deren Ergebnisse, deren Darstellung u.a. die deskriptive Statistik besorgt;
- die mathematische Statistik;
- gewisse Zufallsvariablen, z.B. eine »Teststatistik«;
- gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung, Fermi-Dirac-Statistik, Bose-Einstein-Statistik
Übersicht und Einteilung
Statistik wird eingeteilt in
- deskriptive Statistik (beschreibende Statistik, empirische Statistik), mit der vorliegende Daten in geeigneter Weise beschrieben und zusammengefasst werden. Mit ihren Methoden verdichtet man quantitative Daten zu Tabellen, graphischen Darstellungen und Kennzahlen. Bei einigen Institutionen, z. B. bei der amtlichen Statistik, ist die Erstellung solcher Statistiken die Hauptaufgabe.
- induktive Statistik (schließende Statistik, mathematische Statistik), mit der man aus vorliegenden Daten, die als Stichprobe erhoben worden sind, auf eine zu Grunde liegende verborgene Struktur schließt. Die Wahrscheinlichkeitstheorie liefert die Grundlagen für die erforderlichen Schätz- und Testverfahren.
Induktive Statistik und Wahrscheinlichkeitstheorie werden unter dem Oberbegriff Stochastik zusammengefasst.
Die Schaffung und Analyse empirischer Daten besteht im Idealfall aus folgenden Schritten:
- Versuchsplanung / Erhebungsvorbereitung (Erhebungskonzept, Fragebogenentwicklung, Stichprobenziehung),
- Datengewinnung / Erhebung (von Stichproben) / Nutzung von Betriebsdaten,
- Aufbereitung (Datenprüfungen, Typisierungen / Merkmalszusammenfassungen),
- Auswertung (Tabellierung, Modellierung, Hoch- und Fehlerrechnung, Wahrscheinlichkeit, Fehler 1. und 2. Art, Schätzen und Testen) sowie
- Ergebnispräsentation (Tabellen, Grafiken, Ergebnisinterpretation, Veröffentlichungen, CD-ROMs, Statistische Datenbanken).
Während sich die univariate Statistik mit der Beschreibung der Verteilung
eines Untersuchungsmerkmals beschäftigt, wird in der
multivariaten Statistik die gemeinsame Verteilung von mehreren Untersuchungsmerkmalen betrachtet.
Schulen und Denkrichtungen
Es wird in Lehrbüchern oft der Eindruck vermittelt es gäbe nur die eine, sich ständig weiterentwickelnde Statistik. Im Gegensatz dazu kann man verschiedene Denkschulen ausmachen, die ein Problem durchaus unterschiedlich analysieren, bewerten und numerisch berechnen:
- Kausalbeziehungen: Ronald Fisher
- Gedächtnisleistungen, ROC-Kurven: Jerzy Neyman und Karl Pearson
- Urteile aufgrund unsicherer Annahmen: Karl Pearson
- Induktion und Änderung der Meinung: Thomas Bayes
Software
Die moderne Statistik ist, unterstützt durch leistungsfähige Computer, in der Lage, mit teilweise rechenintensiven Methoden sehr große Datenmengen zu analysieren. Ganze Teilbereiche der Statistik haben ihren Einzug in die Datenanalyse neuer Software zu verdanken, zu nennen ist hier die Bayessche Statistik und deren Implementation in Markov Chain Monte Carlo Verfahren, üblicherweise abgekürzt durch MCMC-Verfahren.
Im folgenden sind einige gebräuchliche statistische Softwarepakete aufgelistet:
- SAS
- S-Plus basierend auf der S Programmiersprache
- R (GNU R) ist eine Open Source Variante der S Programmiersprache (Im Netz: The R project for statistical computing)
- SPSS
- Statistica
- Dataplot: frei, plattformunabhängig
- Stata
- MiniTab
- BUGS (Bayesian inference Using Gibbs Sampling) eine Open Source Software zur Analyse von komplexen statistischen Modellen mit Hilfe von MCMC-Verfahren
- qs-STAT
Zitate
- "Die Statistik ist so etwas wie die Physik der Mathematik"
- "Traue keiner Statistik, die du nicht selber gefälscht hast." Von der Nazipropaganda im Zweiten Weltkrieg erfunden und Winston Churchill zugeschrieben.
- "There are three kinds of lies: Lies, Damned Lies and Statistics." (Benjamin Disraeli, häufig fälschlicherweise Mark Twain zugeschrieben, der dieses Disraeli-Zitat in seiner Autobiografie bringt) Deutsche Übersetzung: "Es gibt drei Arten der Lüge: Lüge, Meineid und Statistik."
- "Statistik ist wie ein Bikini: Sie enthüllt eine Menge, aber das Wesentliche bleibt doch verborgen"
- "Kann man mit der Statistik auch die Statistik beweisen?"
Literatur
- Bleymüller, Gehlert, Gülicher: Statistik für Wirtschaftswissenschaftler. Verlag Franz Vahlen München 2004. ISBN 3800631156
- Volker Oppitz/Volker Nollau: Taschenbuch Wirtschaftlichkeitsrechnung, Carl Hanser Verlag 2003, 400 S., ISBN 3446224637
- Newbold, Carlson, Thorne: Statistics for Business and Economics, New Jersey 2003
- Dietrich, Schulze: "Statistische Verfahren zur Maschinen- und Prozessqualifikation", 4. Auflage, Carl Hanser Verlag, München 2003. ISBN 3-446-22077-1
- Fahrmeir, Künstler, Pigeot, Tutz: Statistik. Der Weg zur Datenanalyse. Springer Verlag Berlin 2002. ISBN 3-54-044000-3
- Hartung, Elpelt, Klösener: Statistik: Lehr- und Handbuch der angewandten Statistik. R.Oldenbourg Verlag München 2002. ISBN 3486259059
Empfehlenswert für Praktiker. - Lambacher-Schweizer: Stochastik Leistungskurs, Für die Sekundarstufe II. LS Mathematik. Hrsg. v. August Schmid u. Wilhelm Schweizer. KLETT. Nachdr. 1999. ISBN 3-12-739370-9
Didaktisch gut gemacht, viele Aufgaben mit Lösungen in einem separaten Lösungsband. - Levine, Berenson, Stephan: Statistics for Managers, New Jersey 1999
- Freedman, Pisani, Purves: Statistics 1998 (Third Edition) ISBN 0-393-97121-x
- Volker Oppitz: Gabler Lexikon Wirtschaftlichkeitsberechnung, Gabler-Verlag 1995, 629 S., ISBN 3409199519
- Lindgren, Bernard W.: Statistical Theory, New York 1993
- Dolic, Dubravko: Statistik mit R, Oldenbourg 2004, ISBN 3-486-27537-2
- Walter Krämer: So lügt man mit Statistik, 7. überarb. Auflage, Campus Verlag, Frankfurt/New York 1997. ISBN 3-593-35689-9
Siehe auch
- Zufall, Kausalität, Korrelation, Durchschnitt, Median, Standardabweichung, Mittelwert, Wahrscheinlichkeit und Statistik, Varianz, Statistische Signifikanz, Fragebogen, Absolute Häufigkeit, Faktorenanalyse, Power, Parameter, Volkszählung, Altersverteilung
- These, Deduktion, Induktion (Logik), Abduktion, Fehlschluss, Nullhypothese, Rhetorik, Dialektik, Fehler 1. und 2. Art, Prozentrang
Weblinks
- http://www.emilea.de/index.html Multimediale, internetbasierte und interaktive Lehr- und Lernumgebung EMILe@-stat
- http://www.statsoft.com/textbook/stathome.html guter Überblick der wichtigsten statistischen Verfahren (Englisch)
- http://www.statistik.tuwien.ac.at/public/dutt/vorles/inf_bak/node1.html Zusammenhängender Text über die Grundlagen
- Statistics Online Computational Resources (SOCR) - Sammlung statistischer Methoden zur Online Datenanalyse u.v.m. (engl.)
- http://www.statistik-portal.de/ Statistische Ämter des Bundes und der Länder, Deutschland
- http://www.statistik.admin.ch/ Bundesamt für Statistik der Schweiz
- http://www.statistik.at Statistik Austria, Österreich