Zum Inhalt springen

Diskussion:Methode der kleinsten Quadrate

Seiteninhalte werden in anderen Sprachen nicht unterstützt.
aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 25. Juni 2009 um 20:23 Uhr durch 91.13.168.79 (Diskussion) (Symbole). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Letzter Kommentar: vor 15 Jahren von 91.13.168.79 in Abschnitt Symbole

Versionsgeschichten der Artikel, aus denen Methode der kleinsten Quadrate zusammengesetzt worden ist

Versionsgeschichte von: Lineare Regression

  • (Aktuell) (Letzte) 22:20, 29. Aug 2004 DaTroll (Redirect Regressionsanalyse)
  • (Aktuell) (Letzte) 12:45, 13. Aug 2004 83.64.137.106 (Determinationskoeffizent)
  • (Aktuell) (Letzte) 02:37, 2. Aug 2004 Zwobot K (Head - Bot: konvertiere/korrigiere HTML)
  • (Aktuell) (Letzte) 18:37, 29. Jul 2004 83.64.137.106 (Determinationskoeffizent)
  • (Aktuell) (Letzte) 18:36, 29. Jul 2004 83.64.137.106 (Determinationskoeffizent)
  • (Aktuell) (Letzte) 18:34, 29. Jul 2004 83.64.137.106 (Determinationskoeffizent )
  • (Aktuell) (Letzte) 18:33, 29. Jul 2004 83.64.137.106 (Determinationskoeffizent)
  • (Aktuell) (Letzte) 18:33, 29. Jul 2004 83.64.137.106 ( : Determinationskoeffizent)
  • (Aktuell) (Letzte) 17:51, 29. Jul 2004 83.64.137.106 ( : Determinationskoeffizent)
  • (Aktuell) (Letzte) 17:50, 29. Jul 2004 83.64.137.106 (R^2 Determinationskoeffizent)
  • (Aktuell) (Letzte) 17:24, 29. Jul 2004 83.64.137.106 (Berechnung der Ausgleichsgeraden)
  • (Aktuell) (Letzte) 09:31, 20. Jul 2004 DaTroll (Doppeleintrag: Lineare Regressionsanalyse)
  • (Aktuell) (Letzte) 09:27, 20. Jul 2004 DaTroll (OLS auch Doppeleintrag)
  • (Aktuell) (Letzte) 20:42, 19. Jul 2004 DaTroll (Doppeleintrag: Methode der kleinsten Quadrate, Regressionsanalyse)
  • (Aktuell) (Letzte) 18:49, 15. Jul 2004 Kku K
  • (Aktuell) (Letzte) 21:53, 11. Jul 2004 Philipendula K
  • (Aktuell) (Letzte) 18:37, 11. Jul 2004 Gowilei (Bezeichnungen)
  • (Aktuell) (Letzte) 17:46, 11. Jul 2004 Gowilei K
  • (Aktuell) (Letzte) 19:56, 9. Jul 2004 Gowilei (Inhalt hinzugefügt)
  • (Aktuell) (Letzte) 00:58, 18. Jun 2004 Philipendula (Verlinkung. Ich hoffe, das war mit linearer Korrelation gemeint.)
  • (Aktuell) (Letzte) 17:57, 7. Mai 2004 Zwobot K (Echoray - robot Ergänze:nl)
  • (Aktuell) (Letzte) 23:28, 22. Apr 2004 PyBot K
  • (Aktuell) (Letzte) 16:14, 20. Apr 2004 Wurblzap K (Links zu OLS, Kleinste-Quadrate-Methode und Regression)
  • (Aktuell) (Letzte) 10:49, 11. Apr 2004 Pm (weblinkformat)
  • (Aktuell) (Letzte) 17:53, 3. Jan 2004 Wipape K (fix wiki)
  • (Aktuell) (Letzte) 17:51, 3. Jan 2004 Wipape K (+weblink)
  • (Aktuell) (Letzte) 11:59, 18. Nov 2003 Kku K (Wiederhergestellt zur letzten Änderung von Kku)
  • (Aktuell) (Letzte) 08:46, 18. Nov 2003 80.132.189.179
  • (Aktuell) (Letzte) 18:55, 23. Okt 2003 Kku (stub)


Versionsgeschichte von: Regressionsanalyse

  • (Aktuell) (Letzte) 00:11, 30. Aug 2004 Philipendula (Lineare Regression eingearbeitet)
  • (Aktuell) (Letzte) 22:59, 29. Aug 2004 Philipendula K (Beitrag der einzelnen Regressoren zur Erklärung von y)
  • (Aktuell) (Letzte) 22:55, 29. Aug 2004 DaTroll K (Abgrenzung zu Methode der kleinsten Quadrate)
  • (Aktuell) (Letzte) 22:52, 29. Aug 2004 Philipendula K (Schätzen und Testen im KLR)
  • (Aktuell) (Letzte) 22:50, 29. Aug 2004 DaTroll K
  • (Aktuell) (Letzte) 22:34, 29. Aug 2004 Philipendula
  • (Aktuell) (Letzte) 00:26, 29. Aug 2004 Philipendula (Neue Strukturierung des Komplexes Regression)
  • (Aktuell) (Letzte) 11:32, 28. Jul 2004 130.36.95.102
  • (Aktuell) (Letzte) 10:35, 21. Jul 2004 Juergen Bode (link)
  • (Aktuell) (Letzte) 10:18, 20. Jul 2004 Juergen Bode (Zuordnung)
  • (Aktuell) (Letzte) 09:35, 20. Jul 2004 DaTroll (Doppeleintrag: Lineare Regressionsanalyse)
  • (Aktuell) (Letzte) 09:26, 20. Jul 2004 DaTroll (OLS auch Doppeleintrag)
  • (Aktuell) (Letzte) 08:03, 20. Jul 2004 Juergen Bode
  • (Aktuell) (Letzte) 07:29, 20. Jul 2004 Juergen Bode
  • (Aktuell) (Letzte) 20:45, 19. Jul 2004 DaTroll (Doppeleintrag: Methode der kleinsten Quadrate, Lineare Regression)
  • (Aktuell) (Letzte) 13:53, 17. Jul 2004 Philipendula (Verbale Abschwächung + Verlinkung)
  • (Aktuell) (Letzte) 17:18, 15. Jul 2004 Kku
  • (Aktuell) (Letzte) 17:14, 15. Jul 2004 Kku (==, en:)
  • (Aktuell) (Letzte) 00:21, 22. Jun 2004 RolandD K (Kategorisiert)
  • (Aktuell) (Letzte) 22:45, 12. Mai 2004 62.204.120.158
  • (Aktuell) (Letzte) 13:54, 2. Mai 2004 JakobVoss K (+Signifikanztest)
  • (Aktuell) (Letzte) 13:30, 2. Mai 2004 JakobVoss K (+Korrelationskoeffizient)
  • (Aktuell) (Letzte) 13:12, 2. Mai 2004 JakobVoss K (Siehe auch: Konfidenzintervall, Bestimmtheitsmaß)
  • (Aktuell) (Letzte) 15:41, 9. Mär 2004 193.24.32.36
  • (Aktuell) (Letzte) 15:40, 9. Mär 2004 193.24.32.39
  • (Aktuell) (Letzte) 08:18, 20. Feb 2004 Juergen Bode
  • (Aktuell) (Letzte) 22:44, 19. Feb 2004 80.138.150.59 (+ Weblinks)
  • (Aktuell) (Letzte) 18:00, 22. Jan 2004 ErikDunsing K
  • (Aktuell) (Letzte) 12:12, 2. Jan 2004 Juergen Bode
  • (Aktuell) (Letzte) 12:08, 2. Jan 2004 Juergen Bode
  • (Aktuell) (Letzte) 12:07, 2. Jan 2004 Juergen Bode
  • (Aktuell) (Letzte) 12:06, 2. Jan 2004 Juergen Bode
  • (Aktuell) (Letzte) 03:54, 29. Okt 2003 Michael Schubart K
  • (Aktuell) (Letzte) 19:00, 23. Okt 2003 Kku (linx)
  • (Aktuell) (Letzte) 11:07, 20. Sep 2003 Caramdir (Formeln mit TeX)
  • (Aktuell) (Letzte) 16:13, 18. Sep 2003 Juergen Bode K
  • (Aktuell) (Letzte) 16:10, 18. Sep 2003 Juergen Bode K
  • (Aktuell) (Letzte) 14:03, 18. Sep 2003 Juergen Bode K
  • (Aktuell) (Letzte) 14:02, 18. Sep 2003 Juergen Bode K
  • (Aktuell) (Letzte) 13:58, 18. Sep 2003 Juergen Bode
  • (Aktuell) (Letzte) 13:48, 18. Sep 2003 Juergen Bode

Versionsgeschichte von: OLS

  • (Aktuell) (Letzte) 09:27, 20. Jul 2004 DaTroll (Doppeleintrag: Methode der kleinsten Quadrate, Regressionsanalyse, lineare Regression)
  • (Aktuell) (Letzte) 18:45, 25. Feb 2004 Croco97
  • (Aktuell) (Letzte) 18:44, 25. Feb 2004 Croco97
  • (Aktuell) (Letzte) 17:53, 25. Feb 2004 80.128.75.225
  • (Aktuell) (Letzte) 15:54, 22. Feb 2004 Triebtäter
  • (Aktuell) (Letzte) 23:22, 14. Feb 2004 Blaubart


Versionsgeschichte von: Lineare Regressionsanalyse

  • Aktuell) (Letzte) 08:37, 31. Aug 2004 BWBot K (Bananeweizen - Bot: ausser -> außer)
  • (Aktuell) (Letzte) 00:15, 22. Jun 2004 Weede K
  • (Aktuell) (Letzte) 19:21, 22. Apr 2004 Weede (Im alternativen "lineare Regression" werden nichtlineare Ansatzfunktionen verschwiegen.)
  • (Aktuell) (Letzte) 17:53, 22. Apr 2004 164.133.154.130
  • (Aktuell) (Letzte) 17:20, 22. Apr 2004 164.133.154.130

Least Square

  • (Aktuell) (Letzte) 16:34, 26. Apr 2004 DaTroll (Redirect)
  • (Aktuell) (Letzte) 16:21, 26. Apr 2004 G K (link)
  • (Aktuell) (Letzte) 18:41, 25. Feb 2004 Croco97



Lieber Freund, wenn die Entfernung in km gemessen wird, dann auch so berechnet wird, kann die Geschwindigkeit nicht in m/s herauskommen. 81.173.150.53 12:45, 30. Apr 2004 (CEST)


Verständnisfrage

Was soll eigentlich in dem Zahlenbeispiel das m? Steht das für gemessen? Man könnte das doch auch weglassen, oder man müsste es wenigstens tiefstellen. --Philipendula 12:28, 29. Aug 2004 (CEST)

Ich denke schon. Das Beispiel ist schon ewig alt und gefällt mir auch nicht besonders gut. Viele Gruesse --DaTroll 13:17, 29. Aug 2004 (CEST)
Nicht das Beispiel, sondern m sollte man weglassen. --Philipendula 19:31, 29. Aug 2004 (CEST)

Sollte in der Tabelle zum Schiffsbeispiel die vorletzte Spalte nicht t*t* bzw. t*^2 und die letzte Spalte y*y* bzw. y*^2 lauten?^

Ja danke, habe ich geändert. Gruß --Philipendula 20:52, 23. Feb 2005 (CET)

Neustrukturierung von Regression

Es muss noch verwurstet werden:

Der alte Inhalt von Regressionsanalyse (jetzt auf der Diskussionsseite zwischengelagert): vor allem nichtlineare Regression problematisiert. Emzymkinetik. Algorithmus nach Marquart. Resistente Verfahren. Sollte zu Kleinste Quadrate

Lineare Regression: betrifft zu 90% deskriptive lineare Regression. Es ist natürlich die Frage, wo packen wir die hin. Bei mir ist schon ein einfaches Zahlenbeispiel mit kurzer mathematisch-statistischer Erläuterung dazu. Es wäre vielleicht angebracht, bei den Kleinsten Quadraten einen eigenen Abschnitt zu linearer Regression zu machen.

OLS: Mal schaun.

Lineare Regressionsanalyse: Bringt das numerische Verfahren zur Lösung einer linearen Einfachregression und Vorschläge für nichtlineare Regressionsansätze (Polynomregression + Fouriersche Reihen). Sollte auch wieder zu Kleinste Quadrate.

Bei Methode der kleinsten Quadrate sollte man vielleicht das t durch x ersetzen, weil t doch als Zeiteinheit schon belegt ist.

--Philipendula 12:42, 29. Aug 2004 (CEST)

Lineare Regressionsanalyse ist IMHO völlig unverständlich, weil der Artikel eine schlechte Notation hat. Deswegen ist es hier auch t: um von x abzugrenzen und damit es, wenn man das Gleichungssystem als Ax=b schreibt, keine Verwirrung gibt. Viele Gruesse --DaTroll 13:20, 29. Aug 2004 (CEST)

Schon wieder ein Missverständnis. Ich sollte mich wirklich etwas präziser ausdrücken ;-): Es handelte sich bei dem "t" um das t in dem Zeit-Weg-Beispiel. Für das Beispiel ist es ja ok., aber für die allgemeine Darstellung braucht es das x. Das mit den Fourierschen Reihen ist schon in Ordnung.

Ansonsten: Der erste Teil mit der konkreten Herleitung wäre brauchbar. Allerdings würde ich die Mittelwerte weglassen, es geht analytisch auch ohne.

Der Teil mit der nichtlinearen Regression ist von der Notation her wohl wirklich etwas unklar. Heißt es, dass jedes Nj eine, z.B. "polynomische", Funktion aus verschiedenen X-Variablen darstellt? Allgemein müsste das denkbar sein, wenn die Kombinationen nicht zu abenteuerlich sind, könnte man vielleicht auch Ergebnisse rauskriegen.

Der Teil mit der Fourierschen Analyse ist ganz ordentlich. Wie so oft, würde ein Beispiel Wunder wirken.

Außerdem bezieht sich der Autor implizit auf Probleme wie Multikollinearität und/oder Überbestimmtheit des Gleichungssystems und schlägt als Lösung Forward-Regression und Backward-Regression vor. Statistisch würde man hier testen, ob eine weitere ins Modell genommene Variable einen wesentlichen Beitrag zur Regression leistet.

Solle wir ihn neilasse? Wie sollen wir jezt weiter vorgehen? Die verbliebenen Artikel verteilen? Oder killen? Die ersten Schläge habe ich mir schon abgeholt (Diskussion:Regressionsanalyse). Wer macht was? Hast Du überhaupt Zeit dazu? Ich könnte zeitlich was übernehmen. Viele Grüße --Philipendula 20:05, 29. Aug 2004 (CEST)

Ich hab hierzu mal auf Diskussion:Regressionsanalyse geantwortet. Was den speziellen Artikel hier angeht: das Beispiel und seine Notation würde ich als letztes überarbeiten, wenn der Rest steht. Was das tatsächliche Tuen angeht: ich habe zur Zeit selten länger am Stück Zeit für die Wikipedia und betätige mich momentan eher als Ausputzer. Wenn es Dir also in den Fingern juckt, dann mach einfach. Ich würde mich freuen. Viele Gruesse --DaTroll 22:40, 29. Aug 2004 (CEST)

OK. --Philipendula 22:45, 29. Aug 2004 (CEST)

Neuer MQK-Artikel

Die neue Fassung ist von mir aus, bis auf einige Kleinigkeiten, die ich noch entdeckt habe, fertig. Sie wirkt teilweise etwas inhomogen und sperrig, was daran liegt, dass eben verschiedene Artikel, so gut es geht, ausgeschlachtet wurden.

DaTroll: Wenn du mal Zeit haben solltest, lies es mal kritisch durch. Was ich noch ansprechen wollte:

  • Kann bei den Fourierschen Reihen bei der Minimierung auch das Mittel weggelassen werden? Numerisch hat es eigentlich keine Auswirkung. Vielleicht gibts da was Mathematisch-Physikalisches, was ich nicht blicke.
  • Mir ist die Bedeutung von bei
nicht ganz klar. Bezieht sich das auf das System der Normalgleichungen? Oder ist es das überbestimmte Gleichungssystem?
  • Könnte man nicht doch x statt t nehmen? Beim Ansatz mit mehreren Variablen müsste man sonst t1i, t2i usw. schreiben. Ist das üblich? Wenn ja, ändere ich meine "xe" in t um.
  • Bei einem Artikel stand "Angewandt als Systemidentifikation ist die Methode der kleinsten Quadrate in Verbindung mit Modellversuchen für Ingenieure ein Ausweg aus der paradoxen Situation, dass man etwas berechnen muss, was man gar nicht berechnen kann." Wie könnte man das übersetzen (muss man es?).
Zwischenbemerkung: Der Anatz ist durchaus nicht paradox. In jedem Fall muß man sich vor der Regression auf die Art der Funktion festlegen, zum Beispiel auf ein Polynom zweiten Grades. Die Regression liefert dann die besten Koeffizienten dieses Polynoms, auch wenn andere Funktionen besser passen würden. Mit anderen Worten: Der Kleinstquadrat-Ansatz ergibt stets die bestmögliche Anpassung gegebener Daten an eine gegebene Funktion. (Heinrich Faust 14. Juni 2005)

Jürgen Bode: Bist Du soweit zufrieden? Oder muss noch etwas geändert werden? Falls Dein Beitrag hier zu sehr untergeht, könntest Du ja überlegen, doch einen eigenen Beitrag zu Enzymkinetik zu verfassen.

Viele Grüße --Philipendula 10:28, 31. Aug 2004 (CEST)

Das System der Normalgleichungen folgt aus dem, was Du hier ansprichst. Was ich hingeschrieben habe, ist das ueberbestimmte lineare Gleichunggsystem. Ich hab noch mal was dazu in den Artikel geschrieben, bitte guck mal, ob das jetzt verstaendlicher ist. Ach ja, eine Frage: die Variable t ist doch nicht gegeben, sondern die Hauptvariable? (irgendwo im ersten Abschnitt hast du das so geschrieben).
Was x und t angeht: ich komme halt aus der numerischen linearen Algebra, wo man in diesem Kontext einfach ein ueberbestimmtes lineares Gleichungssystem betrachtet. Und lineare Gleichungssysteme heissen nun mal Ax=b :-) Mit den multivariaten Sachen habe ich mich nie richtig befasst: vom Standpunkt der linearen Algebra aus macht das halt keinen Unterschied. Viele Gruesse --DaTroll 11:05, 31. Aug 2004 (CEST)

Mit der linearen Algebra habe ich ja auch keine Probleme. Wir müssen uns nur einigen, ob wir im Regressionsmodell als Notation x oder t verwenden. Man könnte doch statt Ax=b auch Xβ=y schreiben oder kriegen Mathematiker dann Schrei(b)krämpfe? Rein algebraisch ist der multivariate Fall ja genau das. Wenn du in dem Artikel etwas weiterscrollst, entdeckst Du

"Hat man mehrere unabhängige Modellvariablen x1, ... xq, erhält man eine lineare Funktion der Art

.

Die Minimierung der Quadratsumme der Residuen ergibt wieder ein lineares System von Normalgleichungen

das bei Regularität der (qxq)-Matrix auf der linken Seite gelöst werden kann."

Da hatte ich ja eigentlich schon das Selbe in Grün geschrieben (nur bei der Notation von y=f(x) hatte ich noch einen Fehler). Meine xj sind die j-ten Spalten "Deiner" Koeffizientenmatrix A. Wie gesagt, ich müsste dann die xj in tj ändern, wobei natürlich t1 ein Einserspaltenvektor ist. Noch mal meine Frage: Ist das üblich, mehrere Vektoren tj zu betrachten? Im Bronstein ist übrigens immer von den Variablen x die Rede.

Zu fest vorgegeben: Was meinst Du mit Hauptvariable? Das mit dem fest vorgegeben bei t ist stochastisch gemeint. Es bedeutet, t kann stochastisch nicht variieren (auch wenn es das faktisch könnte), dagegen variiert y als Zufallsvariable. Es gehört eigentlich nicht hierher, war ein bisschen als Zugeständnis an unsere Ingenieure gedacht, die meistens Stochastik und Rechnerei vermischen.

Viele Grüße --Philipendula 14:01, 31. Aug 2004 (CEST)

oder auch ist glaube ich, beim Fall mit mehr als zwei Parametern besser aufgehoben, weil es ja oben nur eine (2x2)-Matrix ergibt, die eigentlich niemandem weh tut. Pfeile können meinetwegen weg, ich hasse sie sowieso. Man müsste sie dann nur ganz oben auch entfernen.
Was ist nun: x oder t??? Siehe obiger Beitrag von meiner einer!
Viele Grüße (;-))--Philipendula 13:29, 1. Sep 2004 (CEST)
Eins nach dem anderen :-) Also ich bin fuer t. x ist halt im Denken als Variable gepraegt. Da man es hier darum geht, die Modellparameter zu bestimmen, sind die Modellparameter die Unbekannten und sollten also solche deutlich als x sichtbar sein. Dann muss die Funktionsvariable einen anderen Namen haben, halt t. Ich weiss, dass das in der Statistik total unueblich ist man dementsprechend bei X^TX als Gleichungssystemmatrix landet. Es hat beides seine Berechtigung. Wir sollten uns wohl an der Frage orientieren, wer hier haeufiger nachguckt: Leute mit statistischem oder Leute mit numerischen Hintergrund? Tja, keine Ahnung. Ich hol mal ne dritte Meinung ein. Viele Gruesse --DaTroll 13:41, 1. Sep 2004 (CEST)

DaTroll hat mich gebeten, meinen Senf dazuzugeben. Nun denn, schnell und oberflächlich:

  • Glückwunsch zu dem, was Ihr als Text erstellt habt. Gut strukturiert und klar geschrieben.
  • Bei den Formeln herrscht, wie Ihr selbst am besten wisst, groteskes Durcheinander.
    • Ich persönlich bin f(x;p) gewohnt. Wenn ich aber Eure Diskussion recht verstanden und es eine Community gibt, die f(t;x) schreibt, dann sollte man auf x ganz verzichten - zumindest in den allgemein formulierten Teilen; bei den Beispielen fände ich einen Wechsel in einem Variablennamen (aber keine Permutation) hinnehmbar.
    • Ich fände f besser als y_m (wenn letzteres, müsste man y_{\rm m} schreiben).

Weiterhin frohes Schaffen wünscht Weialawaga 14:26, 1. Sep 2004 (CEST)

DaTroll: Wenn Du ohne nicht leben kannst, müsstest Du aber konsequenterweise auch die Elemente von A aij nennen, die Komponenten von b bi und die von x xj. Sonst gibt das ein hoffnungsloses Durcheinander. Ich setze das gern um. Es ist für mich keine Notationsart lebenswichtig. Die Beispiele jedoch muss man von Fall zu Fall betrachten :-). --Philipendula 18:42, 1. Sep 2004 (CEST)

Das sehe ich genauso. Ich würde für "X" plädieren (nicht "t"). Die Elemente einer Matrix A erwarte ich als aij, die Elemente des Vektors b als bj. Meine Herkunft ist - wie ihr daran seht - nicht die Statistik;-) -- tsor 21:39, 1. Sep 2004 (CEST)

Mhmh, vier Leute, und vier Meinungen :-) Dann mach ich mal einen Vorschlag. Ich halte diesen Artikel fuer den, in dem ausfuehrlich irgendwann auf die numerischen Aspekte eingegangen werden soll. Im linearen Teil geht es dann nur um lineare Algebra und die liebste Kombination der drei Buchstaben A, b und x ist fuer so jemanden halt Ax=b. Deswegen schlage ich folgendes vor:

Wir haben eine Modellfunktion f(t, x_1, x_2, ..., x_q) (q Parameter x_i). Diese wollen wir den Datenpunkten (t_1,b_1), (t_2,b_2), ..., (t_n,b_n) anpassen. Die Matrix A ist dann halt die Matrix wie sie da steht, nicht mit Eintraegen a_ij. Dann schreibt man einen Kommentar dazu, dass die Notation in der Statistik anders ist. Im multivariaten Fall macht man ein Beispiel mit zwei Variablen: f(t,s,x_1,x_2, ...,x_n). s ist noch frei, den Uebergang zu noch mehr Variablen muss der Leser dann selbst schaffen.

Und ganz nebenbei ist mir aufgefallen, dass mein Beispiel fuer nichtlineare Regression grosser Unsinn war, aber den hat Philippendula ja zum Glueck schon entfernt :-) Was meint ihr? Viele Gruesse --DaTroll 11:33, 2. Sep 2004 (CEST)
(Kann mich nicht erinnern, was entfernt zu haben. Schau mal lieber, ob's nicht noch dasteht.) Gut, dann mache ich es, wie gewünscht. :-) --Philipendula 11:43, 2. Sep 2004 (CEST)

Artikel jetzt CD-fähig

Also ich habe die x in t umgewandelt, die betas in x. Ich habe den linearen Teil noch ein wenig präzisiert, auch auf die Gefahr von Redundanz hin. Aber bei Doppel-Indizes kann es nicht schaden. Die Beispiele habe ich mal so gelassen. Bei meinem Beispiel (mit der polynomialen Regression) müsste ich sonst neue Grafiken machen, was mich gar nicht recht freut.

Als weiteres To-Do: Zeit-Weg-Beispiel entrümpeln. Die Grafik ganz oben ersetzen durch eine, die von der Notation her übereinstimmt. Irgendwie wäre noch ein "echtes", nichtlineares iterativ gerechnetes Beispiel supi!

Aber wenn jetzt der Snapshot oder wie das auch immer heißt, gemacht wird, brauchen wir uns nicht schämen. Danke an alle, die mitgearbeitet haben, vor allem an DaTroll. --Philipendula 14:28, 2. Sep 2004 (CEST)

Ich hab gerade gelesen, dass der Snapshot am 1.9. in der Fruehe gemacht wurde :-( Die Version von dem Artikel die da jetzt drauf ist, duerfte wie Kraut und Rueben aussehen. Oder wird wegen des Doppeleintragtags gar nicht reingenommen. Mhmh --DaTroll 14:34, 2. Sep 2004 (CEST)
Na super! Richtig toll. Aber ich habe schon Schlimmeres erlebt. Wenn nach dem Snapshot das Zeug erst manuell durchgefieselt wird, könnte doch eigentlich eine Chance bestehen, beide Artikel nachträglich reinzukriegen, oder? Kennst Du jemand von den Verantwortlichen? Wenn nicht, ist es auch nicht tragisch. Die erste Version der CD ist wahrscheinlich ohnehin grauenhaft. Gräm dich nicht, die Artikel sind relativ gut geworden, das ist auch was wert. Bei der nächsten CD sind sie dann 100%ig. Eigentlich muss ich jetzt sogar grinsen. So ein Chaos ist richtig filmreif! :-) Viele Grüße --Philipendula 17:09, 2. Sep 2004 (CEST)

Partielle Ableitungen, erstes Beispiel

Hi Philippendula, bei der Herleitung der Normalgleichungen aus dem Minimierungsproblem hast Du geschrieben, dass man das mittels partieller Ableitungen macht. Ich sehe das nicht: mein Problem:

.

Ableiten ergibt dann halt: . Also irgendwo ein Faktor 2 zuviel. Ichdenke, dass man auf jedenfall den Projektionssatz braucht. Oder uebersehe ich was? Dann noch was zu Deinem ersten Beispiel: kannst Du da die Notation nicht noch mehr an den Text anpassen? Das ist mit den Bildern etwas schwierig, aber vielleicht ein bisschen? Ich verstehe auch nicht, wieso x_3 multikollinear sein soll. Viele Gruesse --DaTroll 14:13, 3. Sep 2004 (CEST)

Hallo DaTroll,
mit partiell Ableiten meinte ich natürlich bezüglich der Parameter xj, wenn man die Normalgleichungen komponentenweise hinschreibt. Für das Ableiten der obigen Form erhält Du für
den Ausdruck und für entsprechend .
Alles klaro? Ich habe mal die 2. Form transponiert hingeschrieben, dann passt sie besser zur ersten.
Mein Fehler: ist abgeleitet natürlich . Da fehlte mir der Faktor zwei :-) Viele Gruesse --DaTroll 19:10, 3. Sep 2004 (CEST)
Wegen des Beispiels schau ich mal. Viele Grüße --Philipendula 18:24, 3. Sep 2004 (CEST)

Hallo DaTroll. So, Beispiel geändert. Das mit der Variablen t3 hat SPSS ungefragt gemacht, und ich konnte es ihm nicht ausreden. SPSS ist zwar mächtig, aber manchmal schrecklich schwerfällig. Dieses Mal habe ich Minitab genommen, das ist etwas flexibler (In diesem Sinn könnte man SPSS als Schlachtschiff und Minitab als Zerstörer bezeichnen ;-)). Aber ich habe die Erkenntnisse von Spss bezügl. t3 übernommen. Wahrscheinlich könnte man sogar noch eine Variable entfernen. Die Variablen sind halt alle hochkorreliert: Z.B. ist die Korrelation zwi. t2 und t3 0,991 und zwi. t3 und t4 0,994. Die Eigenwerte von A sind bei 4 Variablen 349,919, 0,039, 0,000 0,000 0,000. (Bei 3 Variablen haut es einen auch noch nicht um, aber das behalte ich für mich).

Ein paar Gedanken hätte ich noch:

  1. Wenn Du schon Anfälle von Didaktik bekommst, indem Du die einfachen LQ vor die multiplen schiebst: Sollte man beim einfachen linearen LQ noch direkt ein Rechenbeispiel mit einfügen, wie das Sektbeispiel bei Regressionsanalyse?
  2. Die Grafik in der Einleitung passt von der Notation nicht mehr.
  3. Ich suche noch nach einer griffigen Bezeichnung für t. Dich irritiert offensichtlich die Bezeichnung Variable: Datenvariable? In RA sagt man beispielsweise Regressor oder exogene oder unabhängige Variable.
  4. Ich habe beim linearen Verfahren von q Variablen und Parametern gesprochen. Es sind aber + Absolutglied q+1 Parameter. Das ist eleganter, weil dann das Absolutglied als Vektor t0 läuft. Aber dann müsste man in der Einleitung von q+1 Datenvektoren sprechen, was irgendwie blöd ist.

Viele Grüße --Philipendula 14:26, 4. Sep 2004 (CEST)

Ich habe noch ein Problem mit Deinem Beispiel und das haengt wirklich mit dem Wort Variable zusammen: t^3 ist fuer mich keine Variable, sondern eine Variable hoch drei (oder meinst Du t_3, dann ist es aber kein polynomialer Ansatz mehr). Variablen sind t und die x_i. Bzw. in meinem Verstaendnis sind die x_i Parameter und die t eine Variable. Die Regression wird zur Bestimmung der x_i durchgefuehrt. Viele Gruesse --DaTroll 10:30, 8. Sep 2004 (CEST)
Der Ansatz ist
In der Regressionsanalyse wird t^3 als eine neue Variable interpretiert, ähnlich wie das Vorgehen bei der biquadratischen Gleichung, wo ja auch "x^2" als eine neue Variable definiert wird. Nimmt man t^3 raus, bleibt als Ansatz
Ansonsten gehen wir konform: t ist (Daten)variable und x ist der gesuchte Parameter. Oder reden wir komplett aneinander vorbei? Der Begriff Variable für t scheint Dir eh nicht zu gefallen, hast Du da einen besseren Vorschlag? Viele Grüße --Philipendula 10:46, 8. Sep 2004 (CEST)
Nein, wir reden nicht aneinander vorbei :-) Nein, Variable ist schon OK. Aber ich wuerde nie t^3 als Variable bezeichnen. Ich wuerde es anders formulieren: man stellt fest, dass t^3 im Ansatz nicht gebraucht wird, die Daten also durch Weglassen auch nicht schlechter modelliert werden. Also streicht man den Parameter x_3 und entsprechend t^3. t^3 als Variable zu bezeichnen finde ich sehr verwirrend. Viele Gruesse --DaTroll 11:29, 8. Sep 2004 (CEST)
In der Regressionsanalyse ist es halt eine Variable, deshalb denke ich in dieser Kategorie. Oder man nennt es Regressor. Ich formuliere es mal in Deinem Sinn um. :-) --Philipendula 12:21, 8. Sep 2004 (CEST)
Naja, so ganz ging das nicht. Da ja die t^j alle einen signifikanten Beitrag leisteten, werden eigentlich alle benötigt. t3 wird nur wegen Multikollinearität rausgeschmissen! Das muss so erwähnt werden, sonst stimmt das mit dem Output nicht überein. Aber vielleicht passt es so, wie ich es geändert habe. --Philipendula 12:36, 8. Sep 2004 (CEST)
Habe die Multikollinearität im Beispiel doch rausgeschmissen. Das lenkt nur vom Beispiel ab. --Philipendula 23:16, 8. Sep 2004 (CEST)

Kuddelmuddel Ausgleichsrechnung, Pseudo Inverse

Der Artikel hier spielt die Rolle eines Artikels zur Ausgleichsrechnung, wobei ich persönlich mal für mich recherchieren müsste, ob damit auch andere, als 2-Norm Minimierungen gemeint sind. Es fehlt der an dieser Stelle übliche Hinweis auf Pseudoinverse, der momentan nur in Inverse Matrix kurz angerissen wird, und zur Moore-Penrose-Inversen . Eindruck: Das Thema wird von Numerikern, Stochastikern (Satz von Gauss-Markov) und Physikern gepflegt, der Artikel zeigt auch das entsprechende Durcheinander in der Bezeichnungsweise und Notation. --Marc van Woerkom 11:55, 27. Sep 2004 (CEST)

Dass der Artikel interdisziplinär gepflegt wird, täuscht Dich nicht. Er wurde in ziemlich mühseliger Kleinarbeit von 6 Artikeln zu einem zusammengefasst, was schlimmer ist, als einen neuen zu schreiben, denn jeder der ehemaligen Autoren möchte sich ja wiederfinden. Bau halt den Artikel über inverse Matrix bezüglich der Pseudoinversen aus. Erklär dort, für was man sie braucht, ev. mit Zahlenbeispiel. Wenn Du meinst, dass die Nennung des Begriffs Moore-Penrose-Inverse der Wahrheitsfindung dient ;-), kannst Du ihn ja in Regressionsanalyse parken, die das statistische Pendant zu diesem Artikel darstellt. Da Dich die unterschiedliche Notation stört: Wir haben uns bemüht, bei der theoretischen Erläuterung eine einheitliche Notation zu wählen. Die Beispiele stammen von den früheren Autoren. Hier wurde deren Notation beibehalten. Das größte Durcheinander an Notation hat eigentlich das von Dir eingebrachte Beispiel gebracht. Es wäre schön, wenn Du es erkennbar als Regressionsansatz formulieren könntest und auch ein Zahlenbeispiel dazu rechnen. --Philipendula 12:28, 27. Sep 2004 (CEST)
Die theoretische Erläuterung finde ich eher unschön und unübersichtlich, was die Dimensionen angeht. Ist halt Geschmackssache. Z.B. gefällt mir persönlich ein schlichter Fettdruck für Vektoren, oder gar keine Auszeichnung besser, als ein Vektorpfeil. --Marc van Woerkom 14:17, 27. Sep 2004 (CEST)
Ich kann den Einwand nicht ganz verstehen. Der Artikel ist extra so angelegt, dass sowohl Numeriker als auch Stochastiker als auch Anwender hier ihre Sichtweise widerfinden. Etwas anderes halte ich auch nicht fuer sinnvoll. Der allgemeinere Artikel ist wie Philipendula schon sagte: Regressionsanalyse. Was die Pseudoinverse angeht, so fehlt das natuerlich noch. Wie auch viel von der mathematischen Loesungstheorie (Singulaerwertzerlegung etc.) Da gehts mathematische aber schon ziemlich in die Tiefe.
Noch eine kleine Anmerkung: das Beispiel zur Tomographie finde ich nicht gelungen. So wie es jetzt dasteht, fehlt fast komplett der Zusammenhang zu diesem Artikel. Bis jetzt beschreibt das nur eine lineare Modellierung des Vorganges. Viele Gruesse --DaTroll 12:52, 27. Sep 2004 (CEST)
DaTroll: Ausgleichsrechnung haben wir noch nicht eingebaut. Viele Grüße --Philipendula 12:31, 27. Sep 2004 (CEST)
Mhmpf. Ja, dann muessen wir da nochmal ran :-( --DaTroll 12:47, 27. Sep 2004 (CEST)
Es ist halt ein Beispiel für eine Anwendung von linearer Ausgleichsrechnung. Ich kann aber gerne eine Beispielsrechnung dazu tun, damit man mal sieht, wie das Verfahren dann selbst in diesem Fall abläuft. Mit dem Beispiel haben wir seinerzeit in Aachen Maschbauer im Numerikpraktikum gequält. Ich habe es aus dem Gedächtnis reproduziert. Es fehlt auch noch ein nettes Bildchen, welches die Einteilung des Gebietes und einen Strahl dadurch zeigt. (Mache ich nachher, wenn ich Zeit habe). Wobei mir bei der Gelegenheit einfällt: Kann man eigentlich Java Applets für Beispiele in die Wikipedia laden, oder ist das Overkill?
--Marc van Woerkom 14:17, 27. Sep 2004 (CEST)

Ich habe mir jetzt nochmal die Regressionsanalyse angeschaut. Sehr speziell schon auf die Problematik der Statistiker zugeschnitten. Was tun, wenn die gleiche mathematische Technik in sehr vielen Gebieten unter anderem Namen, mit gewissen Problemstellungen auftaucht? Um die Verwirrung komplett zu machen, weise ich auch auf Approximationstheorie hin. Das Beispiel mit dem Bäumchen könnte man aus der Sicht eines E-Technikers auch unter Abtastung und Rekonstruktion aufführen. Eine Enzyklopädie zu machen, ist gar nicht so einfach. --Marc van Woerkom 14:47, 27. Sep 2004 (CEST)

Physiker und Ingenieure benutzen fast ausschliesslich (und mit guten Gruenden) die Methode der kleinsten Quadrate
Interessant wäre ja zu wissen, warum es eine gute Methode ist. Steht dazu hier etwas? --Marc van Woerkom 18:11, 27. Sep 2004 (CEST)
und sind hier prima aufgehoben. Deswegen ist Regressionsanalyse fuer Statistiker. Die Anwender sagen immer "Ausgleichsrechnung", "Regression" aber meinen nichts anderes als eben diese Methode hier. Approximationstheorie ist ein viel weiterer Begriff (Least Squares ist nur ein spezielles Approximationsverfahren).
Mir ist der Zusammenhang Approximationstheorie vs Regressionsanalyse noch nicht klar. Ist letztere nur Approximation von Funktionen im Kontext statistischer Probleme? --Marc van Woerkom 18:11, 27. Sep 2004 (CEST)
Rekonstruktion auch (Least Squares ist ein spezielles Verfahren, dass man zur Rekonstruktion nutzen kann) und Abtastung auch (Abtastung ergibt Daten, die man mit Least Squares weiterverarbeiten kann, aber auch mit voellig anderen Dingen). Deswegen ist das Beispiel mit den Baeumen hier bisher auch so unpassend: es beschreibt eine Modellierung, die dann Daten liefert, die man dann weiterverwursten kann in einer Regressionsanalyse (und da z.B. mit Least Squares). Viele Gruesse --DaTroll 16:31, 27. Sep 2004 (CEST)
Ich habe das ja absichtlich hinter der multilinearen Regression als Beispiel für ein mit dieser Methode lösbares Problem angeführt. Man kann Beispiele für Probleme, die man ins Verfahren steckt, also auch Beispiele für die Durchführung des Verfahrens, also eine Musterrechnung, angeben. Sind nicht beide wichtig? --Marc van Woerkom 18:11, 27. Sep 2004 (CEST)
Ich antworte mal hier auf alle drei Beitraege. Der Least-Squares-Schaetzer ist BLUE, also der Best Linear Unbiased Estimator, kurz gesagt er ist in einem weitreichenden Sinne optimal. Das fehlt leider noch komplett im Artikel. Regressionsanalyse ist fuer mich Approximation im Kontext endlich vieler statistischer Daten. Approximationstheorie beinhaltet zusaetzlich vor allem die Approximation von Funktionen.
Ansonsten hast Du Recht. Ein Beispiel, wo komplett die Modellierung und die Auswertung gemacht wird, klingt gut. Viele Gruesse --DaTroll 11:05, 28. Sep 2004 (CEST)
Gut dann stecke ich noch etwas Arbeit rein. Wenn es hinterher nicht passt, bin ich auch nicht böse. Ich habe wahrscheinlich keine Zeit dafür, der Gedanke liegt hier nahe, ein Java Applet zu basteln. Wie geht die Wikipedia mit rich content, wie Java Applets, Flash Animationen, GIF Animationen, MP3 und Video Dateien um? (Wobei ich ja schon froh bin, dass TeX erlaubt ist). --Marc van Woerkom 13:13, 28. Sep 2004 (CEST)
Animierte GIFs sind kein Problem, bei den anderen habe ich keine Ahnung. Ich persoenlich halte z.B. von Flash in der Wikipedia gar nichts, da das ja den Betrachter zwingt, sich noch ein weiteres Programm zu installieren. Viele Gruesse --DaTroll 16:16, 28. Sep 2004 (CEST)

Kleinst-Quadrat Methode

Mir ist das Verfahren auch schon als Kleinst-Quadrat Methode untergekommen, wobei ich jetzt nicht genau weiss, wie man dies dann korrekt schreibt. (Zusammenschreibung? Trennung? Bindestriche?) --Marc van Woerkom 12:00, 27. Sep 2004 (CEST)

Vermutlich orthografisch korrekt mit Bindestrichen. --Philipendula 12:29, 27. Sep 2004 (CEST)

BLUE

Warum Norm2? Ich bin momentan zu kommod, darüber etwas nachzulesen, weil über das Warum selten was zu finden ist. BLUE selber ist ja wieder ein Begriff aus der Schätztheorie, also stochastisch motiviert. Rein numerisch könnte man es vielleicht so begründen:

  • Die Quadrierung verhindert, dass positive und negative Abweichungen saldiert werden
  • Große Abweichungen des Messwertes von der Ausgleichsgeraden werden durch das Quadrat stark gewichtet, kleine nur schwach. (Wenn man davon ausgeht, dass in einer großen Abweichung entsprechend wertvolle Information steckt, ist das erwünscht, wenn es nur ein Ausreißer ist, eher nicht)
  • Die Ableitung des Quadrats ergibt eine lineare Funktion, was fein ist.
  • Die Ausgleichsgerade (oder -hyperebene)kann häufig analytisch berechnet werden. (deshalb ist die Summe der absoluten Abweichungen weniger doll).
  • Die Quadratsumme entspricht der Varianz als Maß für Informationsgehalt.

Wenn gewünscht, kann ich das noch einbauen. Ich habe es nur mal hier ins Unreine gedacht, weil ich mich dann weniger gifte, wenn es wieder weg muss ;-).

Viele Grüße --Philipendula 17:55, 28. Sep 2004 (CEST)

Das klingt aber sehr heuristisch, also mathematisch nicht so überzeugend. Nicht, dass ich es derzeit bessr könnte. Meine Schnappstheorie war ja, dass die meisten Energiefunktionale quadratische Formen sind, von bis zu den Feldenergien, z.B. (oder so ähnlich). Und in der Natur oft ein energetisches Minimum angestrebt wird. :-) Danke für den Versuch, ich muss es eh mal nachlesen. --Marc van Woerkom 00:31, 29. Sep 2004 (CEST)
War auch heuristisch gemeint. Theoretisch kriegt man es z.B. über die BLUE-Eigenschaft. --Philipendula 00:34, 29. Sep 2004 (CEST)

Historisches

Ich habe ein paar Links mit (legalen) Scans der Originalarbeiten unter den Artikel Satz von Gauß-Markow gesetzt. --Marc van Woerkom 21:27, 11. Okt 2004 (CEST)

Oma-Beispiel

Soll unser Oma auch ein Beispiel für mehrere unabhängige Datenvariablen kriegen? Ich hätte noch Tiefgang und Knoten anzubieten. --Philipendula 14:11, 12. Okt 2004 (CEST)

Ich denke wir haben genug Beispiele. Was hast Du eigentlich mit Kriegsschiffen? Viele Gruesse --DaTroll 11:33, 13. Okt 2004 (CEST)
Statistiker sind froh um alles, was sie an Daten kriegen können, vor allem metrisch skalierte Daten sind i.a. rar. Da mein Mann sich für Seekriegsgeschichte interessiert, hat er mir diese Daten gegeben. In der Vorlesung kriege ich damit immer Männeraugen zum Glänzen, vor allem, weil es da die kompletten Daten mit Namen der Schiffe usw. gibt. ;-). Das Beispiel oben hatte ich ehrlich gesagt nur eingefügt, weil das Baumtomographie-Beispiel für unser Oma vielleicht etwas schwerverdaulich war. Viele Grüße --Philipendula 12:43, 13. Okt 2004 (CEST)

Dieser Artikel ist etwas allgemeiner als Methode der kleinsten Quadrate. Hier geht es auch um andere Verfahren als nur die Quadratsumme der Residuen. Zudem werden hier allgemeine Überlegungen zur Konstruktion mathematischer Modelle und deren Struktur angestellt. Ich glaube, man sollte ihn lassen. Ich habe noch ein paar Links verstreut und ihn etwas umformuliert. --Viele Grüße --Philipendula 23:16, 12. Okt 2004 (CEST)

Noch was zu erledigen

Oben ist immer noch der ominöse Satz, den ich aus einem der Aufsatzvorgänger entnommen hatte: ...Ingenieure ein Ausweg aus der paradoxen Situation, "dass man etwas berechnen muss, was man gar nicht berechnen kann". Ich wusste nicht, was das konkret heißen soll. Vielleicht kann jemand das übersetzen. --Philipendula 18:26, 14. Okt 2004 (CEST)

Ich verstehe darunter folgendes: ein Ingenieur untersucht ein Phaenomen, ist aber nicht in der Lage fuer das Phaenomen eine mathematische Beschreibung zu geben. Er kann also nichts ausrechnen, haette aber gerne eine mathematische Beschreibung. Also macht er eine Regressionsanalyse. Besonders toll ist der Satz nicht :-) --DaTroll 13:08, 15. Okt 2004 (CEST)

Noch mal therapiert

  1. Einleitung noch mal umformuliert. Regression ist laut Stochastischem Lexikon von Müller in der Tat die stochastische Bezeichnung.
  2. Ominösen Ingenieurssatz übersetzt
  3. Ridgeregression gegen Multikollinearität

Überlegung: Führen eigentlich Vorwärts- und Rückwärtsselektion nicht zu weit? Ist das Baumtomographie-Beispiel nicht etwas zu schwierig? --Philipendula 12:16, 25. Okt 2004 (CEST)

Ja, der Ingenieurssatz ist jetzt viel besser. Ich hab die anfängliche Erklärung nochmal geändert. Ich finde sie jetzt verständlicher, aber so richtig zufrieden bin ich immer noch nicht. Was ist denn Vorwärts- und Rückwärtsselektion?

Ansonsten: Deine Tabelle für das Schiffsbeispiel ist noch irgendwie komisch: in der ersten Zeile gibt es bei mir einen Zeilenumbruch bei t_i-\bar{t}.

  • Bei mir auch. Da muss ich mal einen Hilferuf starten.

Ausserdem vermisse ich noch eine Erläuterung der Größen.

  • Was muss denn wie erläutert werden?

Und wo sind Tiefgang und Knoten aus der Einleitung des Beispiels hin?

  • Die hatte ich mal vorsorglich mit eingebracht, falls das Beispiel noch für den multiplen Fall aufgebohrt werden sollte. Die können raus.

Viele Gruesse --DaTroll 00:13, 26. Okt 2004 (CEST)

Ach ja: Das Baumbeispiel könnte von mir aus ersatzlos gestrichen werden. Aber was Marc dazu sagt?
  • Weiß nicht.
Ich bin noch mitten im Umzug nach München, daher kann ich diesen Teil nicht so schön gestalten, wie ich ihn mir vorstelle. Also könnt Ihr den Teil ruhig rausnehmen, geht ja nicht verloren. Der Artikel selbst gefällt mir noch nicht so. Die Gewichung stimmt nicht. Das Verfahren selbst ist ja einfach. Das würde ich auch einfach darstellen. Die Begründung, warum das Verfahren oft gerechtfertigt ist, erfordert jedoch die präzise Sprache der Mass- und Wahrscheinlichkeitstheorie und Stochastik. Das finde ich hier wiederum nicht. Die verwendeten Formeln finde ich oft recht hässlich, ich denke, das kann man schöner schreiben. Die Graphiken könnte man auch etwas netter gestalten. Danke für die Arbeit, man muss es erstmal besser machen. :) --Marc van Woerkom 14:47, 2. Nov 2004 (CET)

--DaTroll 00:15, 26. Okt 2004 (CEST)

Dauerwelle und Tönung:

  • Was heißt eigentlich Auslenkung einer Feder? Ist das die Dehnung?
  • Die Wahl dieser Modellfunktion geschieht mittels Annahmen über die Lösung des betrachteten Problems. Diesen Satz verstehe ich nicht so recht. Könnte es sein: ...über die Lösungsmethode des betrachteten Problems?
  • "Zunächst ist nicht klar, wie man zwei verschiedene Approximationen bezüglich ihrer Güte vergleichen soll. Gauß und Lagrange hatten die Idee, Annahmen über die Messfehler zu machen. Sind diese normalverteilt mit gleicher Varianz, so gibt es theoretisch keine Ausreißer. Das Kriterium zur Bestimmung der Approximation sollte dieses also wiederspiegeln und so gewählt werden, dass große Abweichungen von der Modellfunktion viel stärker bestraft werden als kleine."
Irgend etwas missfällt mir da. Wie wäre es damit:
  • "Zunächst ist nicht klar, wie man zwei verschiedene Approximationen bezüglich ihrer Güte vergleichen soll. Gauß und Lagrange hatten die Idee, Annahmen über die Messfehler zu machen. Sind diese normalverteilt mit gleicher Varianz, so gibt es theoretisch in den Messfehlern keine Ausreißer, die numerische Probleme hervorrufen können. Unter dieser Verteilungsannahme sollte das Kriterium zur Bestimmung der Approximationsmethode so gewählt werden, dass große Abweichungen von der Modellfunktion viel stärker bestraft werden als kleine."
  • Ja, und dann noch was, was wieder mal den Graben zwischen Physikern/Ingenieuren/Mathematikern und dem Rest der Welt offenbart ;-): Mir gefällt die Bezeichnung Messfehler für Residuen überhaupst nicht. Da geht man immer von Naturgesetzen aus, die bloß nicht korrekt gemessen werden. Für Fragestellungen wie Messung eines IQ, Gewinn, Länge - Breite des Schiffes (was ja nicht naturgesetzlich vorgeschrieben ist, sondern der Willkür des Erbauers unterliegt) ist Messfehler inadäquat. Man verwendet hier Residuen als Ausdruck einer zufälligen Restgröße, die bei der Anpassung übrig bleibt.

Viele Grüße --Philipendula 12:39, 26. Okt 2004 (CEST)

i) Genau, mit Auslenkung einer Feder meine ich die Dehnung. Ich ziehe mit irgendeiner Kraft und dann verlaengert sich die Feder.
ii) Nein, Loesungsmethode waere nicht das, was ich meine: ich habe ein Problem, zu dem ich keine genau mathematische Darstellung der Loesung kenne.

Aus irgendwie geartetem Wissen (Gefuehl, Empirie, Mathematik) habe ich aber ein ungefaehres Gefuehl, wie sie aussieht. Das stecke ich in die Modellfunktion: sprich ob das letztlich ein Polynom, eine Exponentialfunktion etc. sein soll. Vielleicht etwas zu pessimistisch formuliert?

  • Nö, letztlich geht man ja praktisch so vor. Wie wäre es mit etwas in Sinne von: Für die Wahl dieser Modellfunktion geht man im Allgemeinen von einem vermuteten Funktionstyp aus, was im Fall einer unabhängigen Variablen t meistens unproblematisch ist, und passt diese Funktion mittels der Parameter optimal an die Daten an.
iii) Der Absatz soll dazu dienen, verstaendlich zu machen, wieso man das Quadrat der Residuen nimmt und nicht vielleicht einfach den Betrag. Da ist das mit den numerischen Probleme unnoetig kompliziert, finde ich.
  • Wenn es nur darum geht, die Quadratsumme zu minimieren, wird aber die Normalverteilungsannahme nicht benötigt. Das war es, was mich irritiert hat, weil mir nicht klar war, wie diese beiden Aspekte zusammenpassen sollen. Das mit den numerischen Problemen war nur als Erläuterung, warum Normalverteilung. Ich schau mir das noch mal an.
iv) Ich sehe, was Du meinst. Das mit den Messfehlern laesst sich ja aber noch abschwaechen, indem man das beispielhafter darstellt. Haben wir eigentlich irgendwo schon eine Betrachtung, wozu man Regressionsanalyse macht (also nicht nur: wir haben Daten und wollen die verwursten)
  • Ich gehe davon aus, dass du hier Methode der Kleinsten Qu. meinst. Da gibt es natürlich die verschiedensten Motivationen. Es kann das Aufdecken von Naturgesetzen, der Erdwärmetransport durch Meeressedimente o.ä., sein, es können gewünschte Erkenntnisse im wirtschaftlich oder sozialen Bereich sein, etwa die Erstellung einer Preis-Absatz-Funktion, die Abhängigkeit der Gesamtzufriedenheit eines Kunden von bestimmten Einzelnoten (wobei wir hier das Problem ordinalskalierter Daten haben - was vom Thema abweicht), es kann aber schlicht auch "wir haben Daten und wollen die verwursten" sein, etwa beim Data Mining in großen Kundendatenbanken, wo man versucht, mit verschiedenen Verfahren auf verborgene Strukturen zu stoßen.
Ne, ich meinte das grundsaetzlich. Vielen ist glaube ich nicht so recht klar, welche Moeglichkeiten das ganze bietet. So ein Abschnitt ist aber vermutlich besser in Regressionsanalyse aufgehoben.
v) Ein Artikel ist mir noch aufgefallen: Kollinearität. Das ist doch eigentlich Multikollinearitaet in Gruen oder nicht?
  • Ja, scheint es ziemlich zu treffen.
vi) Den Abschnitt ueber Forward und Backward-Regression finde ich gut. Wie wichtig das ist, kann ich aber nicht beurteilen.
  • Na, lasse mir in drin.
Viele Gruesse --DaTroll 13:51, 26. Okt 2004 (CEST)
Ist Dir lieber, wenn ich Ümlaute als Uemlaute usw. schreibe?
Viele Grüße --Philipendula 14:36, 26. Okt 2004 (CEST)
Ich habe mal Deine Anmerkungen versucht, einzupflegen. Wie Du Deine Umlaute schreibst, ueberlasse ich Dir ;-) Ich sitze halt den Grossteil des Tages an einer amerikanischen Tastatur, da muss man sich halt behelfen. Viele Gruesse --DaTroll 17:23, 26. Okt 2004 (CEST)
Ach ja: kennst du eigentlich: Wikipedia:Review/Naturwissenschaft_&_Technik#Methode_der_kleinsten_Quadrate.2C_11._Oktober? Viele Gruesse --DaTroll 13:12, 27. Okt 2004 (CEST)
Danke, kannte ich noch nicht. Offensichtlich ist das Ganze noch zu abgehoben. Ich glaube, ich könnte da noch einen wesentlichen Omaschub leisten, aber da müsste ich mit dem Hackebeil ran und alles, was formal ist, einer Nasenoperation unterziehen. Allerdings gibt es da ein Problem: Möglicherweise fallen dann entscheidende Beiträge der Vorautoren unter den Tisch. Ich kann ja mal einen Vorschlag machen. Zur Not kann man ihn reverten. Allerdings weiß ich nicht, ob ich diese Woche noch dazu komme. Viele Grüße --Philipendula 16:51, 27. Okt 2004 (CEST)

Anregungen aufgegriffen

  • Beispiel für lineare Einfachregression nach oben
  • Mittelwert als Formel
  • Baumdoktor nach unten. Die Symbole sind nicht erklärt. Es wird auch nicht sofort ersichtlich, wie sich das Modell als MKQ-Modell anwenden lässt.

--Philipendula 16:51, 29. Okt 2004 (CEST)

Diskussion aus Wikipedia:Review

Auf Anregung von Necrophorus stelle ich ihn mal hier rein. Glättet und poliert ihn, bis er gar schön erstrahlet ;-) Viele Gruesse --DaTroll 20:38, 11. Okt 2004 (CEST)

Hallo Da Troll, ich habe nur mal schnell überflogen und gelobe hoch und heilig, nächstens in Ruhe zu lesen. Vorab: die Einleitung kann m.E. so nicht bleiben, abschreckend unverständlich. Offenbar habt Ihr versucht, dem Unverständnis mit drei Klammererlärungen abzuhelfen. Das ist aber a) nicht gelungen und b) machen sich drei erklärende Klammern in der Einleitung denkbar schlecht. Da kann also ein Fach-"Polier" gleich vorne loslegen :-) --Lienhard Schulz 12:09, 14. Okt 2004 (CEST)
Ich bin das mal angegangen und habe die gesamte erste Bildschirmseite hoffentlich verstaendlicher gemacht. Viele Gruesse --DaTroll 16:36, 14. Okt 2004 (CEST)
Erst mal ein super Artikel. Hab kaum was daran auszusetzen: Einige Anregungen, die eingebaut werden können aber nicht müssen: Der Begriff "Baumdoktor" hört sich etwas infantil an, ist das ein Begriff? Das CG-Verfahren ist gar nicht mal so schlecht und ist zumindest für grosse Probleme einem QR überlegen, weil man die Matrix nicht speichern muss. Mit Algorithmus von Marquart ist wahrscheinlich das Levenberg-Marquart Verfahren gemeint? Bei der Tomographie sollte man unbedingt die schlecht gestelltheit des Problem nennen, ein naives least squares funktioniert nur bei einer geringen Anzahl von Variablen (grobe Diskretisierung), ansonsten braucht man Regularisierung. Zu den Problemen mit Ausreisern: Hier kann man anmerken, dass in solchen Fällen eine L1-Norm oft besser ist als L2, (ist aber schwerer zu berechnen), eventuell die "Robuste Statistik" nennen, die beschäftigt sich damit (Literatur: P. Huber "Robust statistics"). Unyxos 19:08, 14. Okt 2004 (CEST)
Mir persoenlich gefaellt das Tomographie-Beispiel gar nicht. Es haengt kontextlos im Artikel und wie Du schon sagst: in der Praxis ist das so gar nicht durchfuehrbar. Ansonsten: Algorithmus von Marquart aendere ich mal ab. Zu robuste Statistik kann ich leider nichts schreiben, da kenne ich mich nicht aus. Viele Gruesse --DaTroll 13:15, 15. Okt 2004 (CEST)

Vorschläge, Fragen:

  1. Einleitung: Methode ... ist so prominent - "prominent" eindeutschen.
  2. Einleitung gesamt: Viiiiiel besser jetzt, selbst ich (Soziologe) weiß, worum es geht.
  3. Tabelle neben dem Inhalt einen Tick kleiner? - Inhalt zieht sich bei kleinen Bildschirmen extrem in die Länge ... ansonsten Klasse in der optischen Aufteilung
  4. Sehr gelungen die folgende Gauß-Historie. Dann ab: Das Verfahren besteht darin ... ... für mich unverständlich. Gibt es eine Möglichkeit, das grundlegende Verfahren dem Laien mit einfachen Worten so ungefähr zu erläutern, bevor Ihr ins mathematische Detail geht?
  5. Der gesamte Rest ist m.E. für den Durchschnittsverbraucher (bis auf den "Baumdoktor") nicht verständlich. Vorausgesetzt, dass mathematisch alles korrekt und auch exzellent ist, ergibt sich die wohl entscheidende Frage, ob die recht wenigen allgemeinverständlichen Passagen zur Exzellenz reichen. Ich weiß es nicht.
  6. Vielleicht lässt sich bei jedem Kapitel eingangs in zwei, drei Zeilen "laienhaft" ausdrücken, worum es geht?
  7. Und bei Anwendung noch ein wenig mehr Allgemeines wär nicht schlecht, wobei der "Baumdoktor" in seinem allzu gewollten Laienjargon tatsächlich etwas seltsam rüber rüberkommt.
  8. Bitte nicht zu lange ablachen (max 5 Minuten) :-): bereits in der Einleitung weckt die Beschreibung bei mir Erinnerungen ans Integral/Differential unseliger Schulzeiten. Falls das nicht nur Unsinn ist, kann man hier per Analogie noch etwas für den Laien Sinnvolles schreiben?
  9. Layout, Grafiken, Aufteilung - Klasse.

Gruß --Lienhard Schulz 17:51, 20. Okt 2004 (CEST)

Ich habe Punkte 1 und 3 mal versucht, umzusetzen. Fuer eine einfache Erklaerung werde ich nochmal nen eigenen Abschnitt spendieren. Das Niveau des Artikels bewegt sich halt notwendigerweise jenseits von Mathe-Leistungskurs: Etwas Stochastik und gute Kenntnisse der linearen Algebra werden hier verlangt. Wenn ein Ingenieur das versteht, waere ich schonmal gluecklich :-) Allerdings gibt es die Moeglichkeit, den Geschichtsteil noch etwas auszubauen. Zusammen mit einer verstaendlichen grundsaetzlichen Erklaerung des Verfahrens halte ich persoenlich den Artikel dann erstmal fuer Oma-geeignet.
Bei Integral/Differential-Rechnung musste ich dann wirklich mal schmunzeln ;-) Ich nehme mal an, dass es Dir wegen des Hantierens mit Funktionen irgendwie bekannt vorkommt. Eine echte Parallele gibt es aber nicht. Allerdings ist das Ziel einer Regressionsanalyse ja, aus reinen diskreten Daten eine Funktion zu basteln (die dann ja prinzipiell an unendlich vielen Stellen existiert). Die Funktion kann man dann ableiten, integrieren also alles was man so an "unseligen" Sachen kennt, was man mit den Daten leider nicht kann. (DaTroll als ip, wohl zu schwer fuer die Hamster) --141.51.166.91 14:48, 21. Okt 2004 (CEST)
Zum allzu gewollten Laienjargon: Ich rede immer so. :-)
Das ihr mir den Baumdoktor nicht abnehmt ist schade, deswegen mache ich noch einen Link mit interessanten Bildern rein. --Marc van Woerkom 15:46, 2. Nov 2004 (CET)


Also ich muss mal sagen ich finde dn Artikel noch sehr unverständlich. Obwohl ich immerhein Tutor für Methoden der empirischen Sozialforschung und Statistik bin, hab ich erhebliche Probleme mit dem Verständnis. Das geht auch einfacher und Anschaulicher. Richardfabi 12:53, 23. Okt 2004 (CEST) Verwirrend ist z.B. das plötzlich eine multiple Regression eingeführt wird und dann wieder eie bivariate Regression als Beispiel angeführt wird. Richardfabi 12:59, 23. Okt 2004 (CEST)

Am Wochenende hab ichs nicht geschafft, das ganze verstaendlicher zu gestalten, aber eine Frage noch: Du moechtest also ein tri- oder noch hoeher variates statt des bivariaten Beispiels fuer die multiple Regression? -17:11, 25. Okt 2004 (CEST)

Nein so wars nicht gemeint :-)Ich würde eventuell erst das Beispiel für den einfachen linearen Fall anführen und dann das allgemeine lineare Modell anführen. Außerdem könnten ev. die kürzel (also die abkürzungen z.B. für den Mittelwer) teilweise etwas besser erläutert werden, die schreibweisen dafür sind nämlich sehr unterschiedlich und nicht jeder kennt jeden Kürzel. Sonst hat dem Artikel die Überarbeitung schon ganz gut getan. Richardfabi 22:59, 25. Okt 2004 (CEST)

Ich habe den Abschnitt "Das Verfahren" nochmal neu geschrieben. Vielleicht kannst du ja nochmal Bescheid sagen, bis wo Du es jetzt verstehst. Viele Gruesse --DaTroll 14:48, 26. Okt 2004 (CEST)

Hallo DaTroll

ich hab mir den Artikel nun nochmal genau durchgelesen. Der Abschnitt das Verfahren ist nun viel besser. Auch sonst ist der Text etwas geschmeidiger geworden. Bei der Fourieranlyse steige ich verständnismässig trotzdem aus, da weiß ich zu wenig. dennoch ein paar Anmerkungen:

  1. Um was für variablen t1 t2 t3 und t4 handelt es sich bei den Gewichten?
    1. Erledigt

Es handelt sich ja, soweit ich es verstanden habe um eine Regression mit einer Parabel. Aber was ist z.B. das T3 das weggelassen wird?

    1. Es wurde aus dem Modellansatz x3t3 entfernt, weil t3 keinen zusätzlichen Benefit bringt.
  1. Müssen die messfehler um eine Sinnvolle Regressionsgerde zu bekommen (oder auch andere Regression) tatsächlich Normalverteilt sein? Müssen auch die Variblen, die in einen Zusammenhang gebracht werden normalverteilt sein? (An einer Stelle steht so etwas, wenn ich das richtig verstanden habe, was michjedoch wundern würde)
    1. Müssen sie nicht. Sie sollen bloß keine Ausreißer enthalten. Das Selbe gilt für die unabhängigen Variablen. Für ein sinnvolles Ergebnis ist eher Unkorreliertheit und Homoskedastie der Residuen erforderlich.
  2. Zu den Ausreiissern könnte man noch etwas mehr schreiben, in der Soziologie gibt es da nohc einige mehr verfahren.
    1. Führt das in diesem Zusammenhang nicht zu weit?
  3. bei nominal skalierten Variablen wird in der Soziologie oft die logistische Regression verwendet. funktioniert die auch nach der kleinste Quadrate Methode?
    1. Im Prinzip ja, ebenso wie die Probitregression.

Ich glaub das wars erstmal, bleib dran, der Artikel wir immer besser :-) Richardfabi 23:28, 26. Okt 2004 (CEST)

Hallo Leute, bin von DaTroll auf diese Seite hingewiesen worden. Jetzt lasse ich mal alles ausdrucken, lese es und sag was dazu. Falls sich jemand wundert, warum ich das schreibe: Ich bin zur Zeit beim Endtuning mit eingespannt. --Philipendula 17:31, 27. Okt 2004 (CEST)
Ist die neue Einleitung zu kindisch? --Philipendula 17:20, 28. Okt 2004 (CEST)
Ich find die super. Viele Gruesse --DaTroll 11:35, 29. Okt 2004 (CEST)
Ich habs noch mal kräftig geliftet. --Philipendula 00:06, 30. Okt 2004 (CEST)

So, wenn nichts mehr kommt würde ich ihn vorschlagen auf der Kandidatenliste. Viele Gruesse --DaTroll 23:09, 1. Nov 2004 (CET)

Also mir fällt auch nichts mehr ein. Man könnte höchstens das Verteilungsgesumse noch zusammenstreichen. Viele Grüße --Philipendula 23:28, 1. Nov 2004 (CET)

Fourierzerlegung

Das Beispiel der Fourierzerlegung gefällt mir nicht so. Speziell frage ich mich, ob nicht andere Basen des üblichen Funktionenraumes (z.B. diverse Basen aus der Quantenmechnik) nicht die gleiche Eigenschaft haben. Es gibt vermutlich auch einen Bezug in Richtung Energie = quadratsche Form und deren Minimierung. --Marc van Woerkom 15:46, 2. Nov 2004 (CET)

Gut moeglich, dass andere Basen diese Eigenschaft ebenfalls haben, allgemeine garantiert nicht, da das mit der Verteilung dann nicht passt. Und natuerlich gibts einen Bezug, das ist im wesentlichen der Satz von Gauß-Markow. --DaTroll 16:34, 2. Nov 2004 (CET)

Einleitung

Die Einleitung finde ich viel zu vage:

Es soll eine möglichst genau passende Kurve in diese Punktwolke gelegt werden. Man bestimmt diese Kurve numerisch, indem man die Summe der quadratischen Abweichungen der Kurve von den beobachteten Punkten minimiert.

Es wird überhaupt nicht klar, dass nur Parameter eines gegebenen Modells ermittelt werden. Der Eindruck, eine allgemeine Kurve werde ermittelt, ist falsch. Vorschlag:

Unter den jeweiligen Modellannahmen, denen bestimmte parametrisierbare Kurven entsprechen, werden die Parameter einer speziellen Kurve ermittelt. Die Summe der quadratischen Abweichungen dieser Kurve von den beobachteten Punkten ist für diese Kurve minimal; diese Kurve ist im Sinne der kleinsten Quadrate die beste Annäherung der Punkte durch das Modell.

-- Schewek 16:16, 2. Nov 2004 (CET)

Stimmt, da hast Du Recht. Auf der anderen Seite wird genau das im Abschnitt "Das Verfahren", wos Butter bei die Fische gibt, dann ausgiebig erlaeutert. Die Einleitung liefert dem Leser derzeit den Eindruck: "Ich habe Daten und lege da mittels eines speziellen Kriteriums eine Kurve rein, die ganz gut passt." Damit kann ich ganz gut leben: Erst einfach, dann komplizierter.
Als Alternative noch ein Vorschlag, der mehr in Deine Richtung geht (Dein Textvorschlag ist mir noch zu kompliziert): "Es soll eine möglichst genau passende parameterabhängige Modellkurve in diese Punktwolke gelegt werden. Man bestimmt die Parameter und damit die Kurve numerisch, indem man die Summe der quadratischen Abweichungen der Kurve von den beobachteten Punkten minimiert." Viele Gruesse --DaTroll 16:28, 2. Nov 2004 (CET)
Mein Vorschlag war auch mehr zur Verdeutlichung der empfundenen Mängel denn als Muss gedacht; sieh es als Kritik und Anregung. Ich verstehe schon, dass die Einleitung einfach gehalten werden sollte; allerdings nicht so einfach, dass sie evtl. irreführend ist. Dein Vorschlag räumt meine Bedenken aus. Mach man... -- Schewek 17:13, 2. Nov 2004 (CET)
Hab man gemacht ;-) --DaTroll 17:42, 2. Nov 2004 (CET)


Baumdoktor

Nach der vielen Kritik an dem Beispiel habe ich es rausgenommen und unter ich unter Benutzer:Marc van Woerkom/Baumdoktor abgespeichert. Die Kritikpunkte sind foldende: a) der Text ist noch nicht besonders toll. b) Hauptkritikpunkt: es hat einfach kaum was mit dem Thema des Artikels zu tun. Es wäre besser unter Regressionsanalyse aufgehoben. Viele Gruesse --DaTroll 16:50, 6. Nov 2004 (CET)

Mein Beispiel basiert auf der Methode der kleinsten Quadrate. Ich kann nicht nachvollziehen, wieso Du das raus schmeisst und die anderen drin lässt. Sieht doch recht willkürlich aus, wo Du die Grenzen für on- und off-topic ziehst. --Marc van Woerkom 18:55, 6. Nov 2004 (CET)
Um es noch präziser zu sagen, eigentlich sollte man dann auch
3 Lineare Modellfunktion

3.1 Beispiel für ein einfaches lineares Modell y = x0 + x1t
3.2 Der allgemeine lineare Fall
3.3 Anforderungen an die Daten

3.3.1 Multikollinearität
3.3.2 Ausreißer
4 Nichtlineare Modellfunktionen

4.1 Beispiel einer polynomialen Ausgleichskurve
4.2 Beispiel einer Ausgleichskurve als Quotient
4.3 Beispiel der Fourieranalyse
4.4 Beispiel aus der Enzymkinetik einer nicht linearisierbaren Modellfunktion
in einen Artikel zu statistischen Verfahren verlagern, oder was macht deren höhere Relevanz in Bezug auf die Methode der kleinsten Quadrate aus? --Marc van Woerkom 19:05, 6. Nov 2004 (CET)
Die Symbole sind nicht richtig erklärt und der Zusammenhang mit der MKQ wird immer noch nicht auf den ersten Blick klar. Man muss einfach zuviel Detektivarbeit investieren, um aus dem Beitrag schlau zu werden. Leider ist es in Regressionsanalyse auch nicht besser aufgehoben. --Philipendula 19:09, 6. Nov 2004 (CET)
Welches Symbol ist nicht richtig erklärt?
Man könnte oben etwas schöner unterstreichen, dass die Lösung eines überbestimmten Gleichungssystems, und genau das wir ja in meinem Beispiel vorgeführt -ein Strahl, eine Gleichung- eine Lösung im Sinne der MKQ ist. Das ist der Bezug. --Marc van Woerkom 19:27, 6. Nov 2004 (CET)
Findest Du wirklich, dass der von mir aufgelistete Teil weiter im Artikel bleiben sollte, ich denke bei keinem der Punkte sofort an MQM. Ich glaube nicht, dass das nur an meiner persönlichen Sicht der Mathematik liegt. --Marc van Woerkom 19:29, 6. Nov 2004 (CET)
Ich habe den Baumdoktor im Review kritisiert, weil mir einiges daran nicht gefallen hat. (Eigentlich vorderhand nur der Begriff Baumdoktor). Zum Zweiten bestand der Abschnitt hauptsächlich aus der Modellierung der Tomographie. Ich glaube ein entsprechender Absatz wär sicher in Computertomographie sehr gut aufgehoben. Des weiteren ist das Tomographieproblem eigentlich ein Beispiel dafür, warum das MkQ-Verfahren nicht funktioniert: Das Problem ist schlecht gestellt, d.h. auch bei einem Least squares kommen bei hinreichend vielen Variablen nur mehr Hausnummern raus. Meiner Meinung nach wären das Problem besser in einem Artikel über schlecht gestellte Probleme, bzw. Regularisierungsverfahren aufgehoben. Der Absatz in MkQ wär nicht falsch, aber verschleiert die Probleme, die auftreten. Unyxos 18:59, 9. Nov 2004 (CET)

Alternative Version des Artikels

Ich sehe in der Wikipedia leider oft das Phänomen des Platzhirsches. Es ist menschlich verständlich, wer einmal viel Arbeit in seinen Artikel gesteckt hat, pflegt ihn dann auch ähnlich liebevoll wie einen Schrebergarten, da kann auch nicht einfach ein anderer Gartenbauarchitekt rein schneien und in einem anderen Stil um- und weiter bauen. Ausserdem ist Geschmack verschieden. Leider wird mir in Wikipedia zu oft so argumentiert, dass es rationale Gründe geben, wenn es in Wahrheit auch oft eine Frage des persönlichen Geschmacks ist. Blöderweise führt das übliche Hickhack nicht immer zu dem besten Artikel. Ich werde versuchen eine alternative Variante dieses Artikels zu erstellen, damit hier und dann dort die jeweilige Linie verfolgt werden kann und bei Fertigstellung versuchen, ob wir vielleicht noch eine Synthese hinbekommen, auch wenn ich da so meine Zweifel habe. Das der Artikel hier ausgeufert ist, bemerke ich ja nicht zum ersten Male. Mein Ideal wäre in etwa der englische Artikel, ergänzt um eine weitere Definition, aus Sicht der stärker masstheoretisch formulierten Statistik. Dazu weniger Beispiele, die aber sehr simpel. --Marc van Woerkom 19:27, 6. Nov 2004 (CET)

Wie schon einmal erwähnt, hatte dieser Artikel "historisch" vor allem die Aufgabe, ca. 6 verschiedene Beiträge zu diesem Thema zusammenzufassen. Nachdem jeder der Autoren sich etwas bei seinem Beitrag gedacht hatte, haben wir auch alles, so weit möglich, übernommen, auch die Beispiele zu den diversen Spezialfällen. Gut, ich verstehe quasi nix von Fourieranneliese, aber zumindest war mir die Symbolik sofort klar. Und auch alle anderen Beispiele sind eigentlich von der Symbolik her sofort verständlich. Zumindest konnte ich sie unmittelbar in die t,x,y-Notation umsetzen. Von einem Platzhirschverhalten kann hier wohl nicht die Rede sein, eher von einem "Platzhalterhirschverhalten", weil ich ja die Inhalte der Vorautoren erhalten will. Die beteiligten Leute sind auch nicht ganz doof, es ist mindestens ein Prof mit von der Partie. Wenn man übrigens die Diskussion um die Qualität dieses Artikels verfolgt, haben sich doch viele Leute an dem Baumdoktorbeispiel gestört. Es ist sehr informativ, scheint aber auf wenig Akzeptanz zu stoßen. Viele Grüße --Philipendula 13:16, 7. Nov 2004 (CET)
Hier muss ich doch energisch widersprechen. Du hast irgendwann Dein Baumdoktorbeispiel völlig kontextlos (vom Lesefluss, vom Inhalt, von der Notation) in den Artikel gepatscht. Und auf Kritik darauf nur gesagt, naja, ich finds halt ganz nett, das Beispiel, aber nichts daran geändert. Das ist bis heute so geblieben und nach einem Monat (oder mehr) habe ich übereifriger Platzhirsch das Beispiel dann einfach rausgenommen. Was Deine Kritik im Absatz drüber angeht, so kann ich die absolut nicht nachvollziehen. In diesem Artikel wird das Verfahren beschrieben und vor allem auf die numerischen Aspekte eingegangen. Die Modellierung selber ist nicht Thema dieses Artikels. --DaTroll 16:17, 7. Nov 2004 (CET)
Das sehe ich anders:
  • Kontextlos: Das ist ein Anwendungsbeispiel für die Methode der kleinsten Quadrate. Die Messungen liefern Gleichungen, man führt die Methode der kleinsten Quadrate durch, in dem man statt löst, erstere Lösung minmiert die Fehlerquadrate. (Ob das nu numerisch immer gut konditioniert ist, stand nicht zur Debatte, es sollte ja ein einfaches und kein optimales Anwendungsbeispiel sein.)
  • Lesefluss: Ich habe eine Stelle bei den Beispielen gesucht. Das hätte man auch woanders hinschieben können, wenn ich da die falsche Stelle erwischt habe.
  • Notation: ich habe das übliche x als Unbekannte und y als Lösungsvektor genommen, und statt t glaube ich i verwendet, wenn das ein Problem darstellt, bin ich doch verwundert. Ich hätte jetzt eher eine Frage zur Diskretisierung erwartet.
Sag doch einfach, wenn Du das Beispiel nicht magst, deine Kritikpunkte sind jedenfalls an den Haaren herbei gezogen. Korrekt wäre ein Einwand Stilbruch gewesen. Deswegen werde ich versuchen einen alternativen Artikel abzufassen.
Was mich wirklich frustriert: Der Artikel ist gurkig und ihr wollt ihn noch als exzellenten Artikel vorschlagen. Das hätte ich mich in der Form nicht getraut. (Wie ich es oben schon geschrieben habe, kann man, will man sich denn wirklich auf die Essenz konzetrieren, die zweite Hälfte des Artikels stark zusammenstreichen, weil das alles kein Inhalt ist, der spezifisch für die Methode der kleinsten Quadrate ist. Das ist alles Stoff der eher in eigene Artikel zur Statistik, Modellierung oder ähnlichem richtig aufgehoben wäre). Wenn wir in diesen Punkt keinen Konsenz finden, ist es einfach sinnlos mit euch zu diskutieren. Richtig ist, dass ich momentan kritisiere und es nicht besser mache, das wird vielleicht noch bis Weihnachten so sein, weil ich einfach zu wenig Zeit habe (bin noch mit Umzug beschäftigt).
--Marc van Woerkom 10:35, 9. Nov 2004 (CET)
Ja, kontextlos. Ich kann alles moegliche was mit der MkQ zusammenhaengt, in den Artikel packen an irgendeine Stelle. Das heisst noch lange nicht, dass es auch in den Artikel passt. Du hast es, wie Du ja schon sagst, an irgendeine Stelle von irgendwelchen Beispielen gepackt und auch, wie Du oben sagst, nicht gross gekuemmert wie die Notation wohl ist. Auf dieser Seite wurde einiges ueber die Notation diskutiert, weil die unterschiedlichen Communities unterschiedliche Notationen benutzen, was Dir halt gleich nicht so wichtig war. Ansonsten wird es wirklich schwierig hier Konsens zu finden: Ich verstehe einfach nicht was Du willst. Wenn Du also nicht konkret mal sagst (mit Textbeispielen am besten), was Dir am Artikel nicht gefaellt, kommen wir hier auch auf keinen gruenen Zweig mehr. Viele Gruesse --DaTroll 14:36, 9. Nov 2004 (CET)
Ich frage mich langsam, ob Du mich veralberst. --Marc van Woerkom 18:07, 9. Nov 2004 (CET)

Ergebnis der Kandidatendiskussion

Kein Votum, da Mitautor. --DaTroll 09:27, 2. Nov 2004 (CET)
Von mir auch keins, aber danke an DaTroll für das Organisatorische! --Philipendula 23:31, 2. Nov 2004 (CET)

  • pro: nach eurer fleißigen überarbeitung in der Review und mir den schönen neuen Schaubildern. Richardfabi 20:02, 2. Nov 2004 (CET)
  • pro: Ich fand den Artikel bereits vor dem Review gut und dort hat er weiter gewonnen. Wieder mal ein Beispiel, daß auch so "langweiliges" Zeug wie Mathematik spannend und verständlich verpackt werden kann -- Necrophorus 20:29, 2. Nov 2004 (CET)
Jaja, vielleicht ist Mathematik auch einfach spannend? ;-) --DaTroll 17:26, 3. Nov 2004 (CET)
  • pro Elasto 09:38, 3. Nov 2004 (CET)
  • abwartend: Als Nichtmathematiker erscheint mir der Artikel umfassend und stilistisch gut geschrieben. Da ich aber ein regelmäßiger Anwender der nichtlinearen Regression bin (Gott sei Dank gibts für so etwas kompliziertes Softwarelösungen), bleiben für mich einige Fragen, die ich gern beantwortet wüsste und auch ein paar Anregungen: (i) Gibt es außer Gauss-Newton und Levenberg-Marquart auch noch andere Algorithmen (Simplex habe ich schon mal gehört). Deren Funktionsweise könnte auf den noch rot verlinkten Artikeln erklärt werden. (ii) Regression einer linearisierten nichtlinearen Funktion liefert zwar eine optimale Ausgleichsgerade mit der kleinsten Quadratsumme für die linearisierte Funktion aber nach Rückprojektion auf die nichtlineare Ausgangsfunktion ist die Quadratsumme hier nicht mehr zwingend minimal. Darauf sollte hingewiesen werden. Ansonsten Hut ab. Sven Jähnichen 12:30, 3. Nov 2004 (CET)
Prinzipiell handelt es sich bei nichtlinearer Regression um ein spezielles nichtlineares Optimierungsproblem, alle Algorithmen der nichtlinearen Optimierung (Simplex gerade nicht ;-) koennen hier also benutzt werden. Da Levenberg-Marquardt jedoch die spezielle Struktur der nichtlinearen Regression nutzt gibt es dafuer wenig Gruende. Trotz allem ist Levenberg-Marquardt nicht das Ende der Fahnenstange, da es in einigen Faellen nur linear konvergiert. Ein konsequent besseres Verfahren ist meines Wissens aber nicht bekannt. Ich hab den Abschnitt aber nochmal etwas aufgemotzt. Viele Gruesse --DaTroll 17:27, 3. Nov 2004 (CET)
Simplexverfahren sind für lineare Optimierung zuständig. Man kann damit auch Ungleichungen berücksichtigen. Hier findet zwar auch eine Optimierung statt, Minimierung der Fehlerquadrate, aber vom Wesen her ist es eher eine Approximation, denn Optimierung. --Marc van Woerkom 11:14, 9. Nov 2004 (CET)
  • An sich pro, aber der Baumdoktor stört mich immer noch, umformulieren oder link verblauen Unyxos 18:49, 4. Nov 2004 (CET)
  • abwartend: Zwei Abbildungen sind auf Englisch beschriftet. Das sollte noch geändert werden. --zeno 01:18, 5. Nov 2004 (CET)
Es sind halt SPSS-Outputs. Sollte man die wirklich übersetzen?? --Philipendula 19:07, 7. Nov 2004 (CET)
  • pro, sehr schöner Artikel BS Thurner Hof 20:52, 18. Nov 2004 (CET)
  • contra - Ich finde Formulierungen wie Ein Baumdoktor möchte einen Blick in den Stamm eines Baumes werfen, ohne diesen aufzusägen. Zum Glück gibt es die Computertomographie auch für Bäume arg kindisch. Die Form der Diagramme sollte bitte annähernd einheitlich aussehen, was Konventionen wie Graphenform/-Farbe und ähnliche Aspekte angeht. Im Moment ist das noch sehr kunterbunt, und das nicht einmal schön. -- מישה 06:16, 6. Nov 2004 (CET)
Ich habe das Baumdoktorbeispiel jetzt ersatzlos rausgenommen. Bei den Graphen muss ich mal laut nach Philippendula rufen: "Zu Hülf!". Viele Gruesse --DaTroll 16:47, 6. Nov 2004 (CET)
Tut mir leid, das war halt Umgangssprache. Das hätte ich auch seriöse ausdrücken können. Die Graphen sind leider nicht einheitlich (mehrere) Autoren. DaTroll es sich einfach gemacht, und meinen Beitrag entfernt. Damit bleiben dann nur ursprünglichen Graphen übrig, die sind dann in der Tat einheitlich unschön. --Marc van Woerkom 11:07, 9. Nov 2004 (CET)
Genügt es, wenn ich die Farben der Graphen angleiche? Ist ein weißer Hintergrund genehm?. Ich hoffe, dass ich die Graphiken noch auf der Festplatte habe. --Philipendula 17:52, 6. Nov 2004 (CET)
Wobei ich allerdings nicht weiß, was bei den Grafiken jetzt speziell "noch nicht einmal schön" ist. Es ist die Frage, ob es überhaupt einen positiven Effekt hat, wenn ich mich nochmal drüber mache. Vielleicht könnte M. Schindler da etwas konkreter werden :). --Philipendula 12:39, 7. Nov 2004 (CET)
  • abwartend - den Anfangsabschnitt finde ich sehr unanschaulich, der zweite Satz mit Es ist eine Punktwolke aus Daten gegeben,... setzt dem erklärungsuchenden Enzyklopädie-Leser -pardauz- gleich zwei Fachbegriffe vor die Nase, zu denen nicht mal wikilinks geboten werden.
    Als erklärender Anfangsabschnitt scheint mir der Absatz unter "Zum Einstieg" anschaulicher. Der jetzige Anfangsabschnitt mit seinen ziemlich speziellen Erläuterungen wäre dann weiter unten besser. --WHell 09:31, 8. Nov 2004 (CET)
Punktwolke dürfte eher Umgangssprache sein und kein fester Fachbegriff. --Marc van Woerkom 11:12, 9. Nov 2004 (CET)
Mh. Also die Gliederung i) Allgemeine Erlaeuterung, ii) Geschichtlicher Hintergrund, iii) Genaue Erlaeuterung moechte ich nicht aendern. Der Abschnitt Zum Einstieg ist deswegen nicht als erster geeignet, einfach weil er nichts erklaert. Ansonsten muss ich sagen: weder Punktwolke noch Daten sind Fachbegriffe. Punktwolke ist der Versuch, anschaulich zu erklaeren, was passiert: Du hast eine Wolke von Datenpunkten und legst da eine Kurve rein. Viele Gruesse --DaTroll 15:42, 8. Nov 2004 (CET)
@Troll: das mit der Punktwolke und Daten ist mir genauso klar wie Dir - aber verstehen das auch alle anderen Leute, Nicht-Techniker und Nicht-Mathematiker? Punkte ja, eine Wolke aus Punkten auch ja - aber woher kommen die "Punkte"? Das ist das qualitativ diffuse Pünktchen, auf das ich hinauswill. Gruß --WHell 11:23, 9. Nov 2004 (CET)
Wird das nicht im folgenden Nebensatz klar? Viele Gruesse --DaTroll 14:06, 9. Nov 2004 (CET)
Ja stimmt. Aber angesichts der sonstigen berechtigten Einwände hier auch egal. Gruß --WHell 17:24, 10. Nov 2004 (CET)
  • abwartend: Schon sehr gut, nur eine Kleinigkeit stört mich: Viele Absätze sind einfach zu lang, insbesondere die Einleitung. Das stört den Lesefluss. Kann man da vielleicht noch etwas mehr Absätze, vielleicht sogar Zwischenüberschriften einfügen? Stern !? 01:05, 9. Nov 2004 (CET)
Ich hab mal versucht, das umzusetzen und noch ein Bild von Gauß reingepappt. So besser? --DaTroll 14:06, 9. Nov 2004 (CET)
  • contra/abwartend: Der Artikel schiesst über das Ziel hinaus. Ein Artikel zu Methode der kleinsten Quadrate sollte sich auf Beschreibung und Geschichte diese Methode beschränken und nicht Statistische Modellierung erklären. Die Hälfte des Materials ca. gehört in andere Artikel aus dem Bereich der Statistik oder angewandte Mathematik. Vergleicht mal dazu den englischen Artikel.

Es fehlt die noch die Darstellung aus Sicht der modernen W-Theorie und Statistik. Es macht keinen Sinn, diese ausschliesslich zu verwenden, weil die benötigte Mathematik (Masstheorie) sehr speziell ist. Damit allein wäre keine allgemeinverständliche Einführung möglich. Andererseits ist diese Mathematik nun auch schon wieder etwa 100 Jahre alt, die darauf fussenden modernen mathematischen Modellierungen sind auch ein paar Jahrzehnte alt, daher sollte unbedingt darauf eingegangen werden. DaTroll ist Numeriker, ok. Aber Philipendula scheint mir eine angewandte Statistikerin zu sein, verwundert mich, dass sie nicht auf die Theorie eingeht.

Ich arbeite gerade an einer alternativen Fassung dieses Artikels. Es macht keinen Sinn jetzt satzweise um Änderungen zu streiten, das gibt nur einen Edit War, weil wir offensichtlich stark abweichende Vorstellungen haben. Bis dahin, sagen wir 24.11., bitte ich noch abzuwarten und dann sich für eine Fassung zu entscheiden. --Marc van Woerkom 11:07, 9. Nov 2004 (CET)

Hallo Marc van Woerkom, ich halte den Weg über eine vollkommen neue Alternativfassung für absolut falsch. Wenn es inhaltlich unterschiedliche Auffassungen zum Thema gibt bzw. irgendetwas aus deiner Sicht falsch dargestellt wird, dann ist die Diskussion der richtige Ort, dieses anzusprechen. Durch die Diskussion wird auch verhindert, daß es zu einem Editwar kommen kann, denn dort ist es gemeinhin möglich, konstruktiv und gemeinsam eine Verbesserung des Artikels zu erreichen. Eine "Alternativversion" (besser wohl Gegenversion) ist demgegenüber schlicht destruktiv zu nennen. -- Necrophorus 12:20, 9. Nov 2004 (CET)
Mir fällt kein besserer Weg ein, als eine Alternativversion zu erstellen. Ich brauche auch längere Zeit und eine Vielzahl von Änderungen, bis ich den Artikel da habe, wo ich ihn gerne hätte. Das kann ich am vorhandenen Artikel nicht machen. Das der Artikel hier im Reviewprozess ist, besagt doch schon einiges. Wie soll man gegen so ein Trägheitsmoment ankommen? --Marc van Woerkom 13:35, 9. Nov 2004 (CET)
Also noch einmal (S. Diskussion:Methode der kleinsten Quadrate): Dieser Artikel war eine Synthese aus ca. 6 verschiedenen Artikeln mit ähnlichem Inhalt. Es ging uns zum Einen darum, Ordnung in diesen Wildwuchs zu bringen, und zum Anderen, die vorherigen Beiträge, so weit möglich, zu erhalten. Man hätte natürlich die Schrittweise Regression, die Ausreißer usw. auch in Regressionsanalyse packen können, aber dann hätte man einen Artikel komplett zerrissen. Ich bring so was halt nicht übers Herz. Einen neuen Artikel zu schreiben ist immer leichter.
Man muss dabei auch bedenken, dass einige wahrscheinlichkeitstheoretische Aspekte wie Normalverteilung und Homoskedastie/Unkorreliertheit der Störgröße letztlich lediglich eine vernünftige Berechenbarkeit des linearen Ansatzes garantieren. Man könnte natürlich auch mit etwas in der Art: Gegeben ist ein Parameterraum usw. daherkommen. So etwas kann ich auch. Aber ich finde es einfach unhöflich, den Lesern so etwas um die Ohren zu hauen. Dagegen kann man sich Punktwolke durchaus vorstellen.
Im Übrigen brauche ich mir fachlich von Marc nicht ans Bein pinkeln zu lassen. Ich bin beruflich erfolgreich und anerkannt.
--Philipendula 12:48, 9. Nov 2004 (CET)
Die Theorie fehlt. Wenn Du Statistik machst (was ich Dir gerne glaube, weil Du viel Arbeit in die Artikel gesteckt hast, dass macht man nur freiwillig) dann darf doch die Frage erlaubt sein, warum die abstraktere Theorie nicht vorgestellt wird. Ich habe mir die Artikel nicht systematisch angeschaut, mich nur gewundert, dass ich nur selten mal was von W-Massen, Stichprobenräumen etc. lese. An's Bein pinkeln unterstellt, dass ich Dich irgendwo unfair kritisiere oder Deine (mir unbekannte) fachliche Qualifikation in Zweifel ziehe. Ich bitte da um Entschuldigung, solltest Du Dich unfair behandelt fühlen. --Marc van Woerkom 13:35, 9. Nov 2004 (CET)
Es gab gerade einen Dopplungsbug. Hoffentlich habe ich beim Beheben nix gelöscht. --Philipendula 12:51, 9. Nov 2004 (CET)
Doch, du hast den Messeturm gekickt >;O). Ich habs wieder rengebastelt. -- Necrophorus 13:21, 9. Nov 2004 (CET)
Sorry, danke!--Philipendula 14:09, 9. Nov 2004 (CET)
Hi Marc, der Artikel beschreibt folgendes: Was ist die Methode der kleinsten Quadrate prinzipiell ist, geschichtlichen Hintergrund und vor allem: Wie loese ich die aus der Methode resultierenden Minimierungsprobleme und was kann dabei alles passieren. Er beschreibt NICHT: Statistische Modellierung (ist mir voellig schleierhaft wie du immer behauptest, das waere im Artikel) und auch nur kurz den statistischen Hintergrund. Soll auch so sein, denn darauf sollte man in Regressionsanalyse und Satz von Gauß-Markow eingehen. Ansonsten ist das Hauptproblem nicht etwa Traegheit von Philipendula oder mir, sondern dass Du nie konkret sagst, was Dir nicht gefaellt. Deine Kritik bleibt leider immer auf dem sehr oberflaechlichen Niveau "Das gefaellt mir so nicht" und dann musst Du Dich nicht wundern, wenn da nicht gross drauf eingegangen wird.-DaTroll 14:29, 9. Nov 2004 (CET)
Vielleicht sollten wir doch diese Diskussion an anderer Stelle weiterführen, sonst wird das Ganze hier unübersichtlich. --Philipendula 14:56, 9. Nov 2004 (CET)
Habe die Diagramme jetzt mal einheitlich mit weißem Hintergrund gemacht und auch teilweise die Legende geändert. Es kann sein sein, dass es etwas dauert, bis das neue Erscheinungsbild im Artikel aufscheint, dass hängt davon ab, ob wir gerade einen Hamster frei haben, der das Bild ausschneidet und einklebt ;-). --Philipendula 14:47, 9. Nov 2004 (CET)
Jetzt auch die Auswertungsdiagramme in Deutsch!! --Philipendula 11:16, 18. Nov 2004 (CET)

Pro: Ich versteh nichts von Mathematik, aber ich kann den Inhalt in etwa nach vollziehen, was bei vielen Mathe-Artikeln nicht unbedingt der Fall ist. Besonders gelungen finde ich die Story mit dem Asteroiden. --Grammatikus 17:15, 18. Nov 2004 (CET)

Neutral: Fachlich ist der Artikel sicher einwandfrei, aber den Oma-Test besteht dieser Artikel niemals. Ich befürchte, dass sich selbst mathematisch durchschnittlich gebildete, fachfremde Akademiker mit dem Verständnis schwer tun. Spätestens nach dem dritten Absatz werden die meisten aussteigen. Das kann man sicher verkraften – die Formeln muss ja nicht jeder nachvollziehen. Ein Lexikonartikel sollte aber auch dem interessierten Laien zumindest vermittelt was das Verfahren macht und wo es praktisch angewendet wird. Um diese Zielgruppe den Einstieg zu erleichtern sollte der Einstiegsabsatz m.E. noch durch ein einfaches, sehr anschauliches Beispiel ergänzt werden. (Frage zum Inhalt: Heißt der Mann jetzt Legendre oder Lagrange bzw. - Wenn das nicht ein und dieselbe Person ist, wer ist dann Lagrange?).--Bernd Untiedt 00:34, 19. Nov 2004 (CET)

Das war Legendre, warum ich Joseph-Louis Lagrange im Hinterkopf hatte, keine Ahnung :-) Ansonsten ist Deine Einschaetzung richtig: ab Abschnitt 4 (lineare Modellfunktion) wird die Laien-Handbremese geloest und ohne Matheleistungskurs bzw. Hochschulkenntnisse in Linearer Algebra ist man recht schnell verloren. Das muss auch IMHO zwangslaeufig so sein, sonst kann man einfach nichts erzaehlen. Dafuer haben wirs ja mit vielen Beispielen gespickt. Viele Gruesse --DaTroll 11:35, 19. Nov 2004 (CET)

abwartend:ich hab ihn mir noch nicht ganz durchgelesen, aber inhaltlich denke ich ist er sehr gut, aber zumindest die Einleitung sollte allgemeinverständlicher sein. Es sollte jeder, ohne links, erkennen können, für was die Methode benutzt wird. --G 23:56, 21. Nov 2004 (CET)

kleine Stilfrage

In "Das Verfahren" ganz unten: Warum nicht die 2-Norm zum Quadrat, wie es in Berechnungen gemacht wird? Natürlich ist min |x|_2^2 = min |x|_2, aber wir ziehen nicht gerne Wurzeln und eine Zeile darüber wird auch die quadrierte Norm ausgeschrieben. Das fördert auf jeden Fall die Konstistenz (und der Leser wird nicht verführt, |x|_2=\sum x_i^2 anzunehmen). --Ibotty 00:04, 15. Mai 2005 (CEST)Beantworten

Es ist halt äquivalent, ich habs mal deutlicher hingeschrieben. Bitte schreibe immer einen Kommentar in der Kommentarzeile, wenn Du etwas änderst. Viele Gruesse --DaTroll 15:12, 15. Mai 2005 (CEST)Beantworten
Nachvollziehbar ! Es ist genehm. docmo 20:04, 15. Mai 2005 (CEST)Beantworten
Sorry für den fehlenden Kommentar. Ich bin noch newb :) Aber ich verspreche zu lernen... --Ibotty 20:46, 15. Mai 2005 (CEST)Beantworten

nichtlineare Funktion

Ich fand eigentlich die Version mit den zwei Möglichkeiten besser, weil ja dieser Artikel vor allem auf die numerischen Aspekte eingeht. --Philipendula 21:34, 15. Mai 2005 (CEST)Beantworten

Der Abschnitt war halt zum einen falsch, weil das Gauß-Newton-Verfahren nicht der einzige wichtige Algorithmus ist, und zum anderen fügte er sich nicht in den Rest des Abschnitts ein, weil ja weiter unten die numerischen Verfahren nochmal genauer erklärt werden. --DaTroll 22:15, 15. Mai 2005 (CEST)Beantworten
Na dann, ok. Gruß --Philipendula 22:17, 15. Mai 2005 (CEST)Beantworten

Nach einigem zeitlichen Abstand..

.. finde ich den Artikel immer noch schlecht. Kapitel 3 und 4 gehören gestrichen oder ausgelagert, denn die Wahl spezieller Modelfunktionen gibt keine weitere Einsicht in die Methode. Es sind Rechenbeispiele, mehr nicht. --Marc van Woerkom 19:19, 21. Mär 2006 (CET)

stochastische Verfahren?

In der Einleitung steht zu lesen: "Werden bei der Methode der kleinsten Quadrate stochastische Verfahren angewendet, spricht man von Regression und Regressionsanalyse." Was unter "stochastischen Verfahren" zu verstehen ist, wird jedoch nirgendwo in der Einleitung, noch im Artikel, noch sonstwo in der deutschen WP erklaert. Rl 10:10, 17. Apr 2006 (CEST)

Brauchen wir Kriegsschiffe?

Gibt es kein ziviles Beispiel, das sich ebenso gut oder sogar besser eignet als die Korrelation von Länge und Breite von Kriegsschiffen? --84.138.143.4 14:28, 17. Apr 2006 (CEST)

Eine physikalische Interpretation des konstanten Terms x0 wäre doch sehr wünschenswert -- ebenso eine Berechnung und Angabe der Standardabweichungen für die beiden Parameter. Vermutlich ist x0 nämlich ungefähr 0 und eine besser begründete Modellfunktion hätte nur einen einzigen Parameter, nämlich das Verhältnis von Breite zu Länge. Dann brauchen wir aber gar keine lineare Regression sondern nur eine Mittelwertbildung für die Verhältnisse Breite/Länge. --84.138.133.192 14:59, 17. Apr 2006 (CEST)
Das mit x0 müsste man abtesten, das ist dann Sache der Regressionsanalyse. Ansonsten ist es das beste Zahlenbeispiel mit metrischen Variablen, das ich habe. Rein wahrscheinlichkeitstheoretisch hat es meistens keinen Sinn, in das Absolutglied etwas Vernünftiges reinzuinterpretieren, weil die Konfidenzintervalle für die Prognose riesíg werden, wenn sich der Prognosewert sehr weit weg vom Mittel der Daten befindet. Ansonsten ist halt das Leben nicht immer perfekt. --Philipendula 20:50, 17. Apr 2006 (CEST)
x0 ist signifikant, kann also nicht weggelassen werden. Gruß --Philipendula 20:59, 17. Apr 2006 (CEST)

Fehlerfortpflanzung

Sollte man auch die Fehlerfortpflanzug mit reinnehmen also

oder hat das mit dem Thema nichts zu tun? --DB1BMN 16:14, 17. Apr 2006 (CEST)

Aus der Einleitung

"1829 konnte Gauß eine Begründung liefern, wieso sein Verfahren im Vergleich zu den anderen so erfolgreich war: Die Methode der kleinsten Quadrate ist in einer breiten Hinsicht optimal, also besser als andere Methoden." - auf deutsch: das Verfahren ist erfolgreicher als andere, da es optimal ist und somit besser. Hat dieser Satz irgendeinen Inhalt, der mir entgeht? Modran 14:57, 18. Apr 2006 (CEST)

Eine Begründung ist, dass es sich dabei um die Optimierung einer Funktion handelt, nämlich der Quadratsumme der Residuen. --Philipendula 15:49, 18. Apr 2006 (CEST)

Unabhängigkeit der Variablen

(nach unten verfrachtet) Noch ein Punkt: Der Begriff der Unabhängigkeit von Variablen müsste noch erklärt (oder verlinkt?) werden. --Christianh 50907 08:45, 24. Mai 2006 (CEST)Beantworten

Welche Unabhängigkeit genau? --Philipendula 09:09, 24. Mai 2006 (CEST)Beantworten

Querverbindungen zum Artikel Optimierung (Mathematik)

Teilweise überdeckt sich dieser Artikel hier mit jenem Optimierungsartikel. Jener ist jedoch abstrakter und allgemeiner verfasst, weswegen eine Anmerkung sehr weit vorne, dass die Fehlerquadratsumme ein (häufig vorkommender) Spezialfall der Optimierung sei, notwendig erscheint.

Zusätzlich ist dieser Artikel hier zu scheuklappenmäßig auf Optimierungsalgorithmen beschränkt, die Ableitungen der Theoriefunktion benutzen. Auch hier ist der Optimierungsartikel allgemeiner, umfassender, vollständiger. Ein Verweis dorthin ist unbedingt nötig. --PeterFrankfurt 00:09, 28. Sep 2006 (CEST)

Der Verweis ist doch da. Es gehört halt nur nicht in die Einleitung, denn dafür ist der Bezug nicht wichtig genug. --P. Birken 09:24, 28. Sep 2006 (CEST)
Ok, ok, so kann ich halbwegs damit leben, auch wenn ich das mit der Wichtigkeit ziemlich anders einschätze. Um wieder einmal über den Tellerrand zu gucken: Wenn dieser Artikel auch aus 6 Ur-Artikeln zusammengefasst wurde, haben wir immer noch die Situation, dass es mit Ausgleichungsrechnung und Optimierung (Mathematik) (mindestens) noch zwei weitere Artikel mit sehr verwandter Thematik gibt. Die drei Artikel soll man nun natürlich nicht auch noch zusammenschmeißen, aber es ist immer nötig aufzuzeigen, was in dem einen Artikel abgedeckt wird und was im anderen und das dann auch durch passende Verweise erwähnen. Für den Leser muss ein Gesamtbild entstehen. Da bleibt auf jeden Fall noch einiges zu tun, in allen diesen Artikeln. --PeterFrankfurt 18:26, 28. Sep 2006 (CEST)
Ja, "Ausgleichungsrechnung" ist damals etwas stiefmütterlich behandelt worden. Ich weiß immer noch nicht so genau, was da werden soll. "Optimierung" halte ich zu dem Artikel ausreichend abgegrenzt. Allerdings stimme ich Dir zu, dass "Optimierung" noch stark verbesserungswürdig ist. Die mathematische Formulierung wird IMHO nicht prägnant genug beschrieben und auch diesen Begriff der vektorwertigen Optimierung finde ich komisch und halte ihn nicht für gebräuchlich. --P. Birken 09:04, 29. Sep 2006 (CEST)
Für mich sieht es so aus, dass der Artikel Optimierung der allgemeinste von all diesen ist. Die Ausgleichungsrechnung ist eine Untermenge davon, und MdkQ ist eine Methode, die in beiden anderen Gebieten verwendet wird:
Optimierung_(Mathematik)
  |     \
  |    Ausgleichungsrechnung
  |     |
Methode der kleinsten Quadrate
Entsprechend sollten sich die hierarchisch niedriger angeordneten Artikel irgendwie nach Vorgaben in Optimierung richten und auf diese Verweise von dort sozusagen reagieren und sie berücksichtigen. Sprich ich finde es weniger passend, MdkQ als eigenständiges Verfahren zu präsentieren, es ist doch eher eine - wenn auch die gängiste - Methode innerhalb der anderen, allgemeineren Verfahren.
Ach ja, was ich hier noch vermisse: Bei der Geradenapproximation ist die MdkQ deshalb so angenehm, weil sie sich durch Finden der Nullstellen der ersten Ableitung direkt ausrechnen lässt, weil die gesuchten Parameter (lineare Koeffizienten) linear in dieser Ableitung auftreten. Dies wird nicht erwähnt, die Lösung fällt ohne Angabe dieses Lösungsweges/Ansatzes irgendwie vom Himmel. Aber man traut sich ja gar nicht mehr, so eine Ergänzung hier einfach reinzuschreiben...
Dass der Artikel Optimierung auch noch nicht optimal ist, ist wohl allgemein anerkannt. Allerdings liegt das wohl eher an seiner sehr breiten Thematik und der angemessenen Orientierung an der Praxis und dem Einsatz in der Praxis. Deshalb sehe ich auch nicht, dass er mathematisch konsequenter und dichter formuliert werden sollte, es geht hier mehr um aus der Praxis für die Praxis. (Merkt man, dass ich Physiker und Mathematiker nur in deren Pflichtanteil bin?) --PeterFrankfurt 20:54, 29. Sep 2006 (CEST)
Ich halte nicht die Optimierung als den hier wichtigen Überbegriff, sondern die Regressionsanalyse. Ansonsten finde ich den Fall bei dem man ein eindimensionales Gleichungssystem bekommt, wirklich nicht erwähnenswert. Was das Reinschreiben angeht: das hier ist ein exzellenter Artikel, über den sich einige Leute bereits viele Gedanken gemacht haben. Da ist es nicht verwunderlich, wenn Änderungen extrem kritisch beäugt werden. Ich widme mich dann mal wieder meinem Umzug ;-) Viele Grüße --P. Birken 18:23, 30. Sep 2006 (CEST)

Normalgleichungen

Ich dachte das hieße Normalengleichungen(von Normale) hier mit Bild Grüße --Mathemaduenn 00:53, 18. Dez. 2006 (CET)Beantworten

Normalgleichungen erscheint mir verbreiteter, auch wenn Normalengleichungen evt. die bessere Uebersetzung von Normal equation ist. --P. Birken 10:21, 18. Dez. 2006 (CET)Beantworten
Stoer schreibt in Numerische Mathematik 1 Normalgleichung. --schizoschaf 10:26, 18. Dez. 2006 (CET)Beantworten
Habe mich auch gerade davon überzeugt das dies eher selten verwendet wird. Grüße --Mathemaduenn 12:34, 18. Dez. 2006 (CET)Beantworten

latex

moin, kann mal wer die latex formeln reparieren? irgendwas klappt da nicht.. --StehtaMfG 19:04, 22. Jan. 2007 (CET)Beantworten

lag an mir ^^ haut alles hin.. --StehtaMfG 19:05, 22. Jan. 2007 (CET)Beantworten

Zu kompliziert

Wieso ist denn die Erklärung, dass die Fehlerquadratsumme bei der Ableitung wieder zu linearen Termen führt, die man dann per linearen Gleichungssystemen lösen kann, "zu kompliziert"? Ich halte eher die derzeitige Form für zu kompliziert, wo es überhaupt keine Erklärung gibt, dafür nach einem schon hoch abstrakt formulierten Ansatz sofort die Lösung vom Himmel fällt! Da hielt ich es doch für angebracht, grob den Lösungsweg zu skizzieren, der dieses Erklärungsloch füllt. Man könnte sogar darüber nachdenken, ob man womöglich alle Zwischenschritte komplett ausformulieren sollte, aber das verlange ich erstmal nicht. --PeterFrankfurt 01:11, 11. Feb. 2007 (CET)Beantworten

? --Philipendula 11:56, 11. Feb. 2007 (CET)Beantworten

Oder um es noch konkreter zu machen: Es geht mir um das Kapitel "Der zweidimensionale Fall" und dort um die Textzeile "Für die resultierende Ausgleichsgerade dieses einfachen (aber durchaus relevanten) Beispiels lassen sich die Lösungen für die Parameter direkt angeben als". Dies ist alles korrekt, bloß die Lösungen fallen halt vom Himmel. Und wenn man sich schon so weit auf Mathematik einlässt, dass man die Matrixschreibweise der Zeile davor versteht, nimmt man doch bestimmt auch gern ein paar Hinweise auf den Weg zu diesen Lösungen an. (Ein bisschen weiter unten beim allgemeineren Fall gibt es diese Hinweise sogar schon.) Mein Vorschlag ist also, diesen eben zitierten Satz etwas zu erweitern, wenn nicht im Textteil davor, dann vielleicht besser hier:

Für die resultierende Ausgleichsgerade dieses einfachen (aber durchaus relevanten) Beispiels lassen sich die Lösungen für die Parameter direkt angeben, denn die gesuchten Parameter x0 und x1 kommen in der obigen Funktion in quadratischen Termen vor. Wenn man das Minimum der Fehlerquadratsumme sucht, muss man diese Funktion nach diesen Parametern ableiten (die partiellen Ableitungen bilden) und davon die Nullstelle suchen. Die Ableitung einer quadratischen Funktion ist aber wieder eine einfache Gerade, von der sich die Nullstelle einfach berechnen lässt. Damit ergeben sich die Parameter im Endeffekt zu
--PeterFrankfurt 00:21, 12. Feb. 2007 (CET)Beantworten

Beweise sind hier eigentlich unerwünscht. Ich denke, für eine Enzyklopädie reichen diese dürren Worte doch. --Philipendula 00:54, 12. Feb. 2007 (CET)Beantworten

Nee, das wäre doch kein Beweis, nur ein Hinweis auf den Lösungsweg, und ich gehe ja auch nicht so weit, diesen Lösungsweg konkret durchzuixen. Nur würde ich gerne die nötigen Schritte erwähnen, deren konkrete Ausführung ja durch andere WP-Artikel abgedeckt wäre. Und wie schon gesagt, beim nächsten Unterkapitel mit dem allgemeineren Fall sind diese Hinweise schon vorhanden, ich möchte sie halt ähnlich vorher beim einfacheren Fall auch schon haben. Also Hinweise als zusätzlichen Service für den interessierten Leser. --PeterFrankfurt 15:33, 12. Feb. 2007 (CET)Beantworten

GPS

Wegen der andauernden Diskussionen beim Linearen Gleichungssystem habe ich letztens heftig herumgegoogelt und bin darauf gestoßen, dass das Anwendungsbeispiel schlechthin für solche Gleichungssysteme heutzutage die Ortsbestimmung beim GPS ist. Ein immer erwähnter Punkt dabei ist, dass man eine Ausgleichungsrechnung durchführen muss, wenn man mehr als 3 (bzw. 4, wenn auch die Höhe bestimmt wird) Satelliten empfängt, und dafür wird die MdkQ verwendet. Wenn das heute an Unis schon das Standardbeispiel ist, wäre zu überlegen, ob das nicht auch (zusätzlich?) hier hinpassen würde. --PeterFrankfurt 01:18, 17. Mai 2007 (CEST)Beantworten

Ich bezweifle, dass es an Unis das Standardbeispiel ist. Wie kommst du auf die Idee? --Stefan Birkner 01:48, 17. Mai 2007 (CEST)Beantworten
Wie gesagt: Google. Ich habe nach '"Lineares Gleichungssystem" + überbestimmt' gesucht, und (gefühlt?, nicht exakt ausgezählt) ca. 70 % der Treffer waren irgendwelche Uni-Übungsaufgaben oder -Skripte, die sich alle auf dieses Anwendungsbeispiel bezogen. --PeterFrankfurt 02:19, 17. Mai 2007 (CEST)Beantworten
Daraus zu folgern, dass es „das Anwendungsbeispiel schlechthin“ ist, ist aber gewagt. --Stefan Birkner 02:24, 17. Mai 2007 (CEST)Beantworten
Dieser Eindruck drängte sich mir dadurch halt auf. Ist ja nur eine Anregung, hätte ja sein können, dass jetzt gleich Hundertschaften aufspringen und mit den Fingern schnippen, "genau!", und es sofort umsetzen. Wenn nicht, dann halt nicht. --PeterFrankfurt 02:27, 17. Mai 2007 (CEST)Beantworten
Ich denke auch, dass das eher in Global_Positioning_System eingearbeitet gehört. Insgesamt stehen leider bei technischen Artikeln viel zu wenig mathematische Hintergründe. --P. Birken 11:48, 17. Mai 2007 (CEST)Beantworten

Einleitung 2

Ich finde die Einleitung nicht unbedingt optimal, sie hat mich selbst vor ein paar Jahren (mit Stand Mathematik-Leistungskurs, also meiner Meinung nach Zielgruppe) vom Artikel abgeschreckt. Hier mal ein (sicher auch nicht optimaler) Alternativvorschlag:

"Die Methode der kleinsten Quadrate (bezeichnender auch: der kleinsten Fehlerquadrate; englisch: Least Squares Method) ist das mathematische Standardverfahren zur Ausgleichungsrechnung. Bei der Ausgleichsrechnung soll für eine Menge von Datenpunkten, beispielsweise physikalischen Messwerten oder wirtschaftlichen Größen, eine möglichst gut passende Funktion gefunden werden. Eine Möglichkeit dieses Ziel zu erreichen ist eine Funktion mit freien Parametern vorzugeben und die Paramter an die Daten anzupassen. Durch die Methode der kleinsten Quadrate können die Paramter so bestimmt werden, dass der Abstand zwischen den Punkten und der Funktion minimiert wird.

Bei dieser Methode wird ein bestimmter, namensgebender Abstand minimiert, die Summe der quadratischen Abweichungen der Funktion von den gegebenen Punkten. Das heißt in der Grafik rechts, dass die zur y-Achse parallelen Abstände (die grünen Pfeile) der Punkte von der Funktion getrennt berechnet, quadriert und dann zum Gesamtabstand addiert werden.

Die Berechnung der Parameter erfolgt meist numerisch mit Hilfe eines Computers. Die Methode dient nur zur Berechnung der Parameter, eine passende Funktion muss durch andere Überlegungen gefunden werden.

In der Stochastik wird..."

Eine weitere sinnvolle Ergänzung wäre für mich ein konkretes Beispiel (z.B. Strecke/Geschwindigkeit aus Messpunkten) ganz am Anfang. --G 19:46, 7. Sep. 2008 (CEST)Beantworten

Das prinzipielle Problem dieses Lemmas und auch Deiner Umformulierung ist, dass hier eigentlich zwei verschiedene Sachen vermengt werden: 1. Die Definition einer Fehler-/Gütefunktion, hier in Form der Fehlerquadratsumme; 2. das Verfahren, die Ausgleichung durch Minimierung dieser Fehlerfunktion durchzuführen. Wie gesagt, die Fehlerquadratsumme ist nur eine mögliche Definition von mehreren (Alternative wäre z. B. Absolutbetragssumme, die wäre aber nicht differenzierbar). Und das Verfahren, wie ich meine Parameter optimiere, ist eigentlich ein allgemeines Problem der nichtlinearen Optimierung mit jeder Menge zur Verfügung stehender Verfahren, nicht nur dem linearen, das hier verwendet wird. Deswegen kribbelt es bei mir immer etwas angesichts der "Methode" im Lemma, wo es eigentlich nur um die Definition der Fehlerfunktion gehen sollte, also um ein Teilproblem der Optimierung. --PeterFrankfurt 02:20, 9. Sep. 2008 (CEST)Beantworten
Mir ging es bei der Änderung weniger um den Inhalt als um eine einfachere Verständlichkeit. Ich war der Meinung der Name bezeichnet die Fehlerdef. + die Lösung mittels Normalgleichung, hatte mich da leider nicht informiert weil ich inhaltlich eigentlich nichts ändern wollte. Hier ein neuer Vorschlag:
"Die Methode der kleinsten Quadrate (bezeichnender auch: der kleinsten Fehlerquadrate; englisch: Least Squares Method) ist das mathematische Standardverfahren zur Ausgleichungsrechnung. Bei der Ausgleichsrechnung soll für eine Menge von Datenpunkten, beispielsweise physikalischen Messwerten oder wirtschaftlichen Größen, eine möglichst gut passende Funktion gefunden werden. Eine Möglichkeit dieses Ziel zu erreichen ist eine Funktion mit freien Parametern vorzugeben und die Parameter an die Daten anzupassen. Die Parameter werden dann so bestimmt, dass der Abstand zwischen den Punkten und der Funktion minimiert wird, das entspricht dem finden einer Näherungslösung für ein überbestimmtes Gleichungssystems.
Bei der Methode der kleinsten Quadrate wird ein bestimmter, namensgebender Abstand minimiert, die Summe der quadratischen Abweichungen der Funktion von den gegebenen Punkten. Das heißt in der Grafik rechts, dass die zur y-Achse parallelen Abstände (die grünen Pfeile) der Punkte von der Funktion getrennt berechnet, quadriert und dann zum Gesamtabstand addiert werden.
Die Methode gibt nur an, welche Bedingung (eben die Minimierung der quadratischen Abweichungen) die berechneten Parameter erfüllen müssen. Eine passende Funktion mit Parametern muss durch andere Überlegungen gefunden werden. Zur wirklichen Berechnung der Parameter stehen dann verschiedene Verfahren, wie die oft mit der Methode assoziierte Normalgleichung zur Auswahl, sie erfolgt meist numerisch mit Hilfe eines Computers.
In der Stochastik wird..."--G 10:20, 9. Sep. 2008 (CEST)Beantworten

Ja, finde ich schon besser. Um die Rechtschreibung kann ich mich dann ja kümmern. Jetzt muss nur noch der hiesige Hauptautor seinen Segen geben, der ist bei solchen Änderungen immer sehr kritisch. --PeterFrankfurt 02:26, 10. Sep. 2008 (CEST)Beantworten

Hab noch die Links ergänzt.--G 16:58, 10. Sep. 2008 (CEST)Beantworten

Also ich finde die neue Einleitung nicht so gut, aber ich stimme zu, dass die alte Einleitung verbessert werden kann. Vielleicht kannst Du ja Deine Kritik an der alten mal präziser fassen? Das Verfahren ist erstmal der Ansatz, den quadratischen Fehler zu minimieren. Gauß selbst hatte als er Ceres gefunden hatte, noch keinen wirkliche Idee von der Bestimmung der optimalen Lösung, er hat halt nach diesem Kriterium wild rumprobiert. Die modernen Lösungsverfahren sind also streng genommen kein Teil des Verfahrens, aber halt auch nicht mehr davon zu trennen. Normalgleichungen gibt es schließlich nur im linearen Fall, bei nichtlinearen tauchen die gar nicht auf. Aber man könnte Normalgleichungen und Gauß-Newton ruhig in der einleitung erwähnen. --P. Birken 22:15, 10. Sep. 2008 (CEST)Beantworten
Ich finde die Einleitung für Laien zu schwer verständlich.--G 23:30, 10. Sep. 2008 (CEST)Beantworten
Kannst Du das bitte konkreter machen? --P. Birken 00:03, 11. Sep. 2008 (CEST)Beantworten

Wenn ich mich wieder einmischen darf: Mir schwebt eine deutliche Zweiteilung der Erläuterung des Prinzips vor, erstens definiert man ein Verfahren zur Berechnung des Fehlers (der Güte) einer Approximation (und wählt dann aus guten Gründen die Fehlerquadratsumme), zweitens minimiert man diesen Fehler dann methodisch, um eine möglichst optimale Approximation zu erhalten. Durch diese Aufspaltung in Einzelaussagen macht man die beiden Teile je für sich einfacher in Formulierung und Verständnis. Weiter sollte man die Teile nicht trennen, da sie sinnvollerweise wie im Rest des Artikels kombiniert werden. Aber zur systematischen und didaktischen Klarheit wäre dieser deutlicher gegliederte Ansatz vorteilhaft. Soll ich mal einen Formulierungsveruch hier starten? (Ich frag lieber vorher, anstatt mir womöglich unnötige Arbeit zu machen.) --PeterFrankfurt 01:54, 11. Sep. 2008 (CEST)Beantworten

Ok, dann hier doch schon mein Ansatz. Zum Vergleich zuerst die derzeitige Formulierung:

Die Methode der kleinsten Quadrate (bezeichnender auch: der kleinsten Fehlerquadrate; englisch: Least Squares Method) ist das mathematische Standardverfahren zur Ausgleichungsrechnung. Es ist eine Wolke aus Datenpunkten gegeben, die physikalische Messwerte, wirtschaftliche Größen oder Ähnliches repräsentieren können. In diese Punktwolke soll eine möglichst genau passende, parameterabhängige Modellkurve gelegt werden. Dazu bestimmt man die Parameter dieser Kurve numerisch, indem die Summe der quadratischen Abweichungen der Kurve von den beobachteten Punkten minimiert wird.
In der Grafik sind die (t;y)-Paare als Datenpunkte zu erkennen. Es wurde hier eine logistische Funktion in die Punktwolke gelegt. Die Parameter dieser Funktion werden so bestimmt, dass die Quadratsumme der senkrechten Abweichungen e der Beobachtungen y von der Kurve minimiert wird.

Nach diesem Beginn würde ich gern ergänzen:

Die Methode der kleinsten Quadrate ist in zwei Schritte unterteilbar: Zunächst entscheidet man, wie man die Güte der Modellkurve sinnvoll berechnen sollte. Die Summe der Fehlerqudrate erweist sich bei näherer Untersuchung als besonders gut geeignet. Im zweiten Schritt wendet man ein – meist schrittweises („iteratives“) – Näherungsverfahren an, um die Parameter der Modellkurve so zu optimieren, dass der Fehlerwert der Abweichung von den Eingangs-Messwerten minimal wird. Bei linearen Zusammenhängen wie in den Beispielen unten kann das auf relativ leicht lösbare Gleichungen – oder die Lösung eines linearen Gleichungssystems – hinauslaufen, bei komplizierteren Zusammenhängen stehen andere Optimierungsverfahren zur Verfügung.

--PeterFrankfurt 02:08, 11. Sep. 2008 (CEST)Beantworten

Ich finde dass Begriffe wie "Punktwolke", "Modellkurve" und "(t;y)-Paare" nicht in der Einleitung auftauchen, Begriffe wie "numerisch", "Ausgleichsrechnung" und "Quadratsumme der senkrechten Abweichungen" irgendwie erklärt werden sollten.--G 15:17, 11. Sep. 2008 (CEST)Beantworten
@PeterFrankfurt: Tut mir leid, aber das ist so eine ziemlich schiefe Darstellung des Verfahrens. Die Festlegung des Modells ist nicht Teil der Methode der kleinsten Quadrate sondern ein Schritt davor. @G: Mh, wenn man alle Fachvokabeln weglässt bleibt vom Verfahren nichts mehr übrig. Meiner Meinung nach sollte eine Einleitung denen die nicht wissen worum es geht die grundsätzliche Einordnung ermöglichen und denen, die ungefähr wissen worum es geht, das schnelle Nachschlagen ermöglichen. Und ich denke das leistet sie. --P. Birken 20:00, 11. Sep. 2008 (CEST)Beantworten
Aber ich finde keinen der Begriffe den ich weggelassen habe unverzichtbar, und im Artikel kann man das ganze dann exakt formulieren. Als ich vor 2 Jahren die Einleitung gelesen habe, habe ich auf jeden Fall nicht verstanden, um was es geht. Außerdem finde ich bei Wikipedia die Verständlichkeit wichtiger als immer 100% exakt zu sein.--G 20:51, 11. Sep. 2008 (CEST)Beantworten
Ich denke halt nicht, dass der Artikel für die Leute an die er gerichtet ist, unverständlich ist. Wer mit Punktwolke und Modellkurve nichts anfangen kann, auch nicht in Kombination mit dem Bild, da weiß ich irgendwie auch nicht. Die t-y-Paare könnte man wohl aber rausnehmen. --P. Birken 22:01, 11. Sep. 2008 (CEST)Beantworten
Ob man jetz Modellkurve oder Modellfunktion schreibt finde ich ziemlich egal. Und wenn man weiß um was es geht hört sich die Punktwolke lächerlich an, aber wenn nicht erwartet man hinter dem neuen Begriff alles mögliche. Ich spreche wie gesagt aus eigener Erfahrung und war damals ein mathematisch sicher überdurchschnittlicher Abiturient.--G 22:08, 11. Sep. 2008 (CEST)Beantworten
Hab nochmal nachgedacht woran das liegen kann. Vermutlich ist die Grafik nicht besonders aussagekräftig und eine Kurvenschar, von denen eine die optimale Lösung ist, wäre sinnvoller? --P. Birken 22:20, 11. Sep. 2008 (CEST)Beantworten
Das ist eine sehr gute Idee. Aber auch unbekannte Begriffe (auch wenn eigentlich nichts dahinter steckt) können es komplizierter machen und abschreckend wirken.--G 22:58, 11. Sep. 2008 (CEST)Beantworten

Also die Formulierung mit der "logistischen Funktion" ist ja für einen Nicht-Stochastiker (wie mich) erstmal vollkommen unverständlich. In der Einleitung sollte man es nicht lebensnotwendig machen, einen zweiten Artikel zu verstehen, bevor man die Einleitung zu Ende studieren kann. Es ist wohl gemeint, dass für diese speziellen Daten so eine logistische Funktion die angemessene Modellfunktion ist? Das fehlt noch in der Formulierung. Das sieht für mich aber doch so aus, als ob diese Wahl der Modellfunktion mit zum ganzen Anpassungsverfahren gehört. --PeterFrankfurt 00:54, 12. Sep. 2008 (CEST)Beantworten

Wie sieht es aus?-G 12:39, 16. Sep. 2008 (CEST)Beantworten

Ich habe im Lauftext auch noch entsprechend ausführlicher nachformuliert. --PeterFrankfurt 01:24, 17. Sep. 2008 (CEST)Beantworten

Hab gemeint ob noch jemand neue Vorschläge machen will.--G 21:29, 18. Sep. 2008 (CEST)Beantworten

Ich hab Phili mal gefragt, ob sie ein neues Bild erstellt. --P. Birken 18:46, 19. Sep. 2008 (CEST)Beantworten
Bitte verzeiht mir, wenn ich nicht die ganze Schriftrolle oben durchlesen mag. Was soll ich denn nu machen? Beispielsweise eine Gerade durch eine erkennbar nichtlineare Punktwolke legen? Gruß -- Philipendula 11:28, 21. Sep. 2008 (CEST)Beantworten
Verstehe ich auch nicht so ganz. Wichtig ist doch nicht, was eine logistische Funktion ist, sondern was die Methode der kleinsten Quadrate ist. --Scherben 16:50, 21. Sep. 2008 (CEST)Beantworten
Also Rücksprache mit P. ergab, dass wohl gemeint ist, zum Vergleich eine optimale Anpassung und eine weniger optimale zu erstellen. Damit man sieht, dass bei letzterer die Quadratsumme nicht minimal ist. -- Philipendula 17:11, 21. Sep. 2008 (CEST)Beantworten

Und was ist mit dem Text?--G 17:49, 8. Okt. 2008 (CEST)Beantworten

Ich halte ein neues Bild für ausreichend. --P. Birken 20:36, 13. Okt. 2008 (CEST)Beantworten
Ich nicht.--G 15:15, 14. Okt. 2008 (CEST)Beantworten
Ich finde die aktuelle Version völlig in Ordnung. Wer mit Punktwolken und Modellkurven nichts anfangen kann, hat eh den falschen Artikel angeklickt. --Scherben 18:49, 14. Okt. 2008 (CEST)Beantworten
Uh, ich hatte die Grafiken vergessen *schwitz*... -- Philipendula 19:44, 14. Okt. 2008 (CEST)Beantworten

"Ich finde die aktuelle Version völlig in Ordnung. Wer mit Punktwolken und Modellkurven nichts anfangen kann, hat eh den falschen Artikel angeklickt." Was ist denn das für ein Kommentar??? Ich finde die Grundlagen der Methode könnte man ohne besondere Kenntnisse verstehen, das sollte unser Ziel sein und das wird mit unnötigen Fachbegriffen erschwert. Es geht ja nicht darum, dass er nicht in Ordnung ist, sondern dass er besser werden soll.--G 19:56, 15. Okt. 2008 (CEST)Beantworten

a) Das sind keine unnötigen Fachbegriffe.
b) Ich glaube nicht, dass man die Methode verstehen kann, wenn man keine grundsätzliche Vorstellung hat, worum es geht. --Scherben 20:47, 16. Okt. 2008 (CEST)Beantworten
Wo ist der Verlust wenn man statt Modellkurve Funktion und statt Punktwolke Menge von Punkten schreibt? Es geht darum an eine Linie möglichst Nahe an ein paar Punkte zu bringen, um das zu verstehen braucht man kein Mathe-Studium. --G 23:06, 16. Okt. 2008 (CEST)Beantworten
Du verlierst dann Informationen. "Modellkurve" impliziert schon begrifflich, dass du bestimmte Vorauswahlen hinsichtlich der Funktionenklasse tätigst. --Scherben 09:08, 17. Okt. 2008 (CEST)Beantworten
Der Artikel ist ja noch lang genug um es genau zu beschreiben, außerdem steht das in meinem Vorschlag auch drinnen, nur ohne den Begriff. Die kompakte Formulierung passt vielleicht für den Bronstein, wenn es allgemeinverständlich sein soll muss man halt ein bisschen mehr schreiben.--G 13:14, 17. Okt. 2008 (CEST)Beantworten
"Möglichst gut passende" Funktion ist deutlich zu unpräzise. --Scherben 14:00, 17. Okt. 2008 (CEST)Beantworten
Ich finde es eine Voraussetzung für einen exzellenten Artikel, dass er so gut verständlich ist wie möglich und bin mir sicher, dass man hier noch was machen könnte. Außerdem halte ich es prinzipiell für besser wenn mehr Leute den Anfang verstehen als wenn ein paar Leute etwas mehr lesen müssen um eine genaue Definition zu erhalten (da bin ich auch nicht der einzige Wikipedia:Oma-Test.--G 17:23, 21. Okt. 2008 (CEST)Beantworten

Nachdem sich nichts geändert hat und ich finde, dass so ein "exzellener" Artikel kein gutes Bild abgibt habe ich die Einleitung geändert. Wir können gern weiter darüber reden und es soll nicht an der Punktwolke scheitern, auch wenn ich nicht verstehe wofür man die braucht.--G 17:35, 26. Dez. 2008 (CET)Beantworten

Die Änderung ist damals um Weihnachten an mir vorbeigegangen, so dass ich nun etwas verärgert bin, eine neue Einleitung vorzufinden, obwohl Deine Kritik hier nicht ganz nachvollzogen werden konnte. Ich habe entsprechend die alte Einleitung wiederhergestellt. Konkret ist Deine stilistisch deutlich schlechter, benutzt Klammersätze und Füllworte und ist damit sprachlich unpräziser. --P. Birken 23:02, 3. Mai 2009 (CEST)Beantworten

Und ich finde es unblaublich, dass ein für Laien unverständlicher Artikel exzellent ist und Artikel als persönlicher Besitz gesehen werden.--G 19:33, 4. Mai 2009 (CEST)Beantworten

Persönlicher Besitz? Dann schau Dir die Diskussion nochmal an. Deine Kritik an der Einleitung konnte nicht nur von mir, sondern auch von Scherben und Philipendula nicht nachvollzogen werden. --P. Birken 20:12, 6. Mai 2009 (CEST)Beantworten
Ich stütze mich hier ebenfalls nicht nur auf meine Meinung, und dass Leute die schon am Artikel mitgeschrieben haben ihn nicht zu kompliziert finden, wundert mich auch nicht. Wenn ihr den Artikel exzellent findet, können wir ja nochmal darüber abstimmen lassen.--G 16:46, 7. Mai 2009 (CEST)Beantworten

Überdeterminiertes System linearen Gleichungen

Mmn. ware es besser im Allgemeinen die Methode dkK zu betrachten als annäherendes Losungsverfahren von überdeterminierte Systemen linearer Gleichungen. Nijdam 22:47, 31. Mai 2009 (CEST)Beantworten

Das ist sie meiner Meinung nach nicht, je nach Problem sind andere Arten der Regression sinnvoller. --P. Birken 16:05, 1. Jun. 2009 (CEST)Beantworten
Was hat es mit Regression zu tun? Zwar kan man die Meth.dkK in einige Regressionsproblemen anwenden, ansonsten gibt es keine Beziehung. Nijdam 18:55, 1. Jun. 2009 (CEST)Beantworten
Wenn ich mich mit meinem Lieblingsthema einmischen darf: Die kleinsten Quadrate haben von sich aus überhaupt nichts mit linearen Gleichungen zu tun. Man kann auch Kurvenfitten von Sinussen oder Exponentialkurven machen mit Hilfe der kleinsten Quadrate. Die Fälle mit linearen Gleichungen als Modellfunktion haben nur den Vorteil, dass sie sich bei der Verwendung der kleinsten Quadrate als Fehlerfunktion direkt in ein lineares Gleichungssystem überführen lassen, für das es dann sehr gut bekannte Lösungsverfahren gibt. Wenn die Modellfunktion aber nicht linear ist, dann klappt das nicht mit dem Gleichungssystem, es wird dann auch kein überbestimmtes, sondern man muss ganz andere Optimierungsverfahren anwenden, stets aber immer noch mit den kleinsten Quadraten als Fehlerfunktion, die es zu minimieren gilt. --PeterFrankfurt 23:54, 1. Jun. 2009 (CEST)Beantworten
Da hast du recht. Ich meinte eigentlich: überdeterminierte Systemen von Gleichungen. Ich wollte betonen, dass es nicht unbedingt Kurvenfitting betrifft, obwohl man es vielleicht immer als solches auffassen kann. 10:31, 2. Jun. 2009 (CEST) (ohne Benutzername signierter Beitrag von Nijdam (Diskussion | Beiträge) )
Ich hab schon verstanden was Du meinst. Lineare Gleichungssysteme kommen immer irgendwoher. Und je nach zugrundeliegendem Problem kann es sinnvoll sein, die Methode der kleinsten Quadrate anzuwenden oder eben eine andere Form der Fehlerbewertung, die einer anderen Form der Regression entspricht. --P. Birken 20:43, 2. Jun. 2009 (CEST)Beantworten

Wiederwahldiskussion

  • Kontra - Der Artikel ist für einen Laien aufgrund der vielen Fachbegriffe unverständlich, obwohl das Thema für einen Mathematikartikel sehr anschaulich wäre. Meine Versuch zumindest die Einleitung zu vereinfachen wurden nicht angenommen. Ich bin der Meinung es ist eine Grundvoraussetzung für die Exzellenz, dass man auch ohne Studium versteht um was es geht und bin deshalb für eine Abwahl.--G 22:35, 31. Mai 2009 (CEST)Beantworten
    Mir ist weiterhin nicht begreiflich, was an der Einleitung unverständlich sein sollte. Sie stellt deutlich heraus worum es geht, und im Gegensatz zu den meisten Mathematikartikeln ist eine vernünftige Balance zwischen Anschaulichkeit und formaler Korrektheit gefunden worden. Sowieso bin ich der Meinung, dass ein Abwahlantrag besser begründet sein sollte. --Scherben 13:18, 1. Jun. 2009 (CEST)Beantworten
Wie gesagt ging es mir selbst so und weiß auch von anderen, dass sie den Artikel unverständlich finden. Der Grund ist meiner Meinung nach die Schwemme an Fachbegriffen, die für auch nicht nötig ist. Es wird sich ja hier in der Abstimmung zeigen, wie das andere Leute sehen. Sicher ist der Artikel noch besser verständlich als viele andere Mathematik Artikel, das liegt aber leider an den anderen Artikeln. Für mich hat auch die totale Korrektheit nur eine geringe Bedeutung. Das heißt nicht, dass etwas falsches drinnen stehen darf, aber man kann "normale" Begriffe verwenden, auch wenn Fachbegriffe das ganze natürlich genauer charakterisieren würden, die exakte Definition kann man dann irgendwo im Artikel machen. Leute die es interessiert lesen die dann auch noch. Ich denke, dass die exzellenten Artikel auch hin und wieder von Schülern oder anderen Laien angeschaut werden und finde es schade, dass die dann von so einer anstrengenden Einleitung abgeschreckt werden. --G 13:22, 1. Jun. 2009 (CEST)Beantworten
Totale Korrektheit ist gerade bei mathematischen Begriffen von entscheidender Bedeutung. WP fungiert hier nicht (nur) als populärwissenschaftliches Lexikon, das sich damit begnügen mag Begriffe nur anschaulich und im Zweifelsfall ungenau zu erläutern, sonder WP fungiert auch als Fachlexikon, dass mathematische Begriffe exakt erklären muss (wie dies allgemeine Enzyklopädien übrigens normalerweise auch tun, auch wenn weniger ausführlich). Das ist jetzt natürlich ein kein Freibrief für Mathematiker unverständlich daherzuformulieren, aber Exaktheit und "totale Korrektheit" sind unverzichtbar. In Fällen in denen die exakte Formulierung für Laien schwer verständlich ist, kann man allerdings überlegen den Artikel in verschiedene Abschnitte aufzuspalten, bei denen sich ein Abschnitt einer leicht verständlichen (aber unter Umständen nicht exakten oder völlig korrekten) Darstellung widmet.--Kmhkmh 20:42, 1. Jun. 2009 (CEST)Beantworten
(BK)Das einzige, was mir am Einleitungsabsatz unklar ist, ist das Wort „parameterabhängig“. „Punktwolke“ und „Modellkurve“ erscheinen mir allgemein verständlich, und die Motivation, warum man ausgerechnet die Quadratsumme minimiert, ist im ersten Absatz noch nicht erforderlich. --Joachim Pense (d) 13:34, 1. Jun. 2009 (CEST)Beantworten
Werter G, was hälst Du davon Deinen Wiederwahlantrag zurück zu nehmen? Als Mathematiklaie ist die Einleitung verständlich und nachvollziehbar. Vielleicht solltest Du einfach mal WP:DM als Lösungsmöglichkeit in Erwägung ziehen? Achso, falls der Antrag nicht zurückgezogen wird: Pro --MfG Markus S. 18:44, 1. Jun. 2009 (CEST)Beantworten

Pro Mathe läuft auf meinem Gehirn leider sehr schlecht, aber diesen Artikel finde ich dann doch sehr anschaulich und sehr gut gemacht - no need for Abwahl, IMHO. --TRG. 19:05, 1. Jun. 2009 (CEST)Beantworten

Neutral Ich finde den Artikel tatsächlich exzellent, bemängele dennoch die Verständlichkeit für Nicht-Mathematiker. Ich bin Betriebswirt und denke, dass ich das Thema in den Grundzügen beurteilen kann. Ob für die Diskussion hier die richtige Stelle ist, sei dahingestellt. Ich möchte den ersten Abschnitt hier einmal einem alternativen Textvorschlag gegenüberstellen, der für einen Mathematiker grauenhaft aussehen mag. Er drückt aber für mich besser aus, was da eigentlich gemacht wird.

jetziger Text: Die Methode der kleinsten Quadrate (bezeichnender auch: der kleinsten Fehlerquadrate; englisch: Least Squares Method) ist das mathematische Standardverfahren zur Ausgleichungsrechnung. Es ist eine Wolke aus Datenpunkten gegeben, die physikalische Messwerte, wirtschaftliche Größen oder Ähnliches repräsentieren können. Zu dieser Punktwolke soll eine möglichst genau passende Kurve aus einer Familie von gegebenen Funktionen gefunden werden. Sind diese Kurven (wie in den meisten klassischen Fällen) parameterabhängig, so bestimmt die Methode der kleinsten Quadrate die optimalen Parameter numerisch, indem die Summe der quadratischen Abweichungen der Modellkurven von den beobachteten Punkten minimiert wird.
Variante: Die Methode der kleinsten Quadrate (bezeichnender auch: der kleinsten Fehlerquadrate; englisch: Least Squares Method) ist ein mathematische Verfahren zur Beschreibung eines Zusammenhangs verschiedener Werte, die in einem Koordinatensystem dargestellt werden. Bei den Werten kann es sich um naturwissenschaftliche Messwerte, wirtschaftliche Größen oder ähnliche Daten zum Beispiel aus der Medizin oder den Sozialwissenschaften handeln. Es wird dabei eine Funktion berechnet, bei der der Abstand der Daten zur Kurve minimal ist. Weil die Abstände zur Funktion positiv oder negativ sein können, berechnet man nicht die Summe der Abstände, sondern die Summe der Quadrate der Abstände und bestimmt deren Minimum. Die Methode der kleinsten Quadrate ist das Standardverfahren zur Ausgleichsrechnung.

Ich hoffe es wird deutlich, wo ein Nicht-Mathematiker einhakt. Gruß Lutz Hartmann 19:17, 1. Jun. 2009 (CEST)Beantworten

Der untere Absatz stimmt dann nur eben nicht mehr. „Weil die Abstände zur Funktion positiv oder negativ sein können, berechnet man nicht die Summe der Abstände, sondern die Summe der Quadrate der Abstände“: Das stimmt so einfach nicht, man haette dann ja jedebeliebige Funktion, derer Ergebnisse nicht negativ sind waehlen koenen: Beispielsweise die Betragsfunktion oder x4, es hat aber einen bestimmte Sinn, warum quadriert wird. Fossa?! ± 20:49, 1. Jun. 2009 (CEST)Beantworten
Das die Betragsfunktion als Bewertungsmethode für die Abstände nicht so brauchbar ist, liegt an der nicht vorhandenen Differenzierbarkeit im Punkte 0, d.h. man muss immer Fallunterscheidungen einführen, aber warum soll eine Bewertung mit x4 nicht sinnvoll sein? Mir fällt nur die noch stärkere Betonung von Ausreißern ein, die aber nicht in jedem Datensatz vorhanden seien müssen.--Mirko Junge 06:26, 2. Jun. 2009 (CEST)Beantworten
Die Dritte Meinung hole ich ja gerade ein. Wenn hier mehr Leute der Meinung sind, dass die Exaktheit wichtiger als die Verständlichkeit ist, werde ich das akzeptieren. Ich bin mir sicher, dass viele Leute ein Problem haben, diesen Artikel zu verstehen. Natürlich sind alle Leute die sich hier beteiligen gewohnt zu recherchieren und mit unbekannten Begriffen zu arbeiten, aber das gilt sicher für viele andere nicht. Ich denke, dass es einigen Leuten helfen würde zuerst zu schreiben, dass man mit diesem Verfahren versucht, eine Funktion möglichst gut an (Mess)punkte anzupassen. Dass man damit nicht alles abdeckt ist mir klar und natürlich gehört das Exakte noch in den Artikel, das reicht aber auch noch im 2. Absatz.--G 10:28, 2. Jun. 2009 (CEST)Beantworten
Zur Anmerkung von Fossa: Ich möchte darauf hinweisen, dass wir hier über die Einleitung reden. Entweder habe ich es überlesen, oder der Artikel erklärt nicht, warum man Quadrate nimmt und nicht x4. (Ich nehme mal an: So einfach wie möglich (Ockhams Rasiermesser)). Der untere Absatz ist nicht falsch und Erläuterungen im Text braucht der obere Absatz viel mehr (woher kommt die Familie der gegebenen Funktionen? was bedeutet das? was heißt es, dass ein Kurve parameterabhängig ist? Was heißt numerisch?), um für einen Laien etwas auszusagen. Ich möchte auch für den letzten Absatz der Einleitung eine Umformulierung vorschlagen:
Text bisher: Angewandt als Systemidentifikation ist die Methode der kleinsten Quadrate in Verbindung mit Modellversuchen für Ingenieure ein Ausweg aus der paradoxen Situation, Modellparameter für unbekannte Gesetzmäßigkeiten zu bestimmen.
Alternative: Ingenieure verwenden die Methode der kleinsten Quadrate bei Modellversuchen zur Systemidentifikation, um aus vorhandenen Daten Modellparameter zu bestimmen, wenn bisher keine Gesetzmäßigkeiten bekannt sind.
Diese Vorgehensweise ist übrigens nicht paradox, sondern eine Form der Abduktion, der einzigen Schlussweise, mit der man neue Erkenntnisse generieren kann. Wie gesagt, ich werde hier nicht mit Kontra stimmen, weil ich den Artikel insgesamt für sehr gut halten. Lutz Hartmann 10:53, 2. Jun. 2009 (CEST)Beantworten
Doch, Dein Textvorschlag ist falsch. Wenn Du nicht genau weißt, was Kurvenparameter sind, kannst Du keine Einleitung zu einem mathematischen Artikel neu schreiben. Verfahren zur Beschreibung eines Zusammenhangs verschiedener Werte ist Kokolores, egal was Du mit Zusammenhang eigentlich meinst. Es wird dabei eine Funktion berechnet ist erst recht falsch, wär natürlich prima. woher kommt die Familie der gegebenen Funktionen? Tja, die muss der Physiker/Ingenieur/etc erraten, herleiten usw, das ist sein Job. Abstand der Daten zur Kurve ergibt keinen Sinn. Versteh mich nicht falsch, evtl kann man das alles noch besser formulieren, aber wer noch nie von Ausgleichsrechnung gehört hat, hat natürlich Schwierigkeiten, eine spezielle Methode derselben zu verstehen; deswegen ist der Link zum Hauptartikel im ersten Satz schon gut aufgehoben.--Sommerkom 11:08, 2. Jun. 2009 (CEST)Beantworten
@Sommerkorn: In diesem Ton solltest Du hier nicht schreiben. Du tust Luha damit mehr als unrecht. Insbesondere ist Luhas Textvorschlag nicht so "falsch", wie Du es darstellst. --Zipferlak 11:33, 2. Jun. 2009 (CEST) Beantworten
Kokolores etc sollte eigentlich nur launig sein, wenn das Luha gegenüber anders rüberkommt, tut's mir ausdrücklich leid. Das "Wer noch nie" bezog sich sowieso nicht auf Autoren, sondern auf den allgemeinen Leser, dem man die grundlegenden Begriffe im Hauptartikel erklären sollte. --Sommerkom 11:42, 2. Jun. 2009 (CEST)Beantworten
@ Sommerkom: ich glaube schon, dass ich weiß, wie man durch Einsatz von Parametern und bestimmten Funktionsstrukturen bestimmte Kurvenverläufe erzeugt. Die Fragen die da stehen, sind nicht unbedingt meine Fragen. Darum geht es aber nicht. Dass „mathematisch Gebildete“ den Text nicht exakter formulieren könnten als ich, habe ich ja überhaupt nicht behauptet. Das Problem ist doch, dass die mathematisch korrekte Formulierung, die derzeit im Artikel steht, sehr viel impliziert und einem nicht vorbelasteten Leser nur sehr eingeschränkt vermittelt, worum es eigentlich geht. Die Einleitung sollte unter Verzicht auf die letzte mathematische Feinheit - dafür ist der Artikel dann ja da – dem „normal Gebildeten“ mitteilen, über welch prächtige Möglichkeiten die Mathematik verfügt, um praktische Probleme zu lösen. Irgendwie muss es doch möglich sein, den Sinn des Ganzen und die zugrunde liegende Idee mit nur begrenztem Einsatz des Fachvokabulars auszudrücken. Ja, ich bin tatsächlich der Meinung, dass man verstehen kann, was die „Methode der kleinsten Quadrate“ ist, ohne den Begriff „Ausgleichsrechnung“ zu kennen. Deshalb sollte der Hinweis auf „Ausgleichsrechnung“ durchaus da stehen, aber nicht zur Erklärung verwendet werden. Versucht es doch mal wie der gute Lehrer aus der Feuerzangenbowle: „Wat is änn Dampfmaschin?“. Lutz Hartmann 16:40, 2. Jun. 2009 (CEST)Beantworten
Zur Wahl der Funktion: Es gibt natürlich auch andere Möglichkeiten, insbesondere wird in der Statistik mitunter auch die Betragsfunktion genutzt, um ausreißerrobust zu minimieren. Sollte tatsächlich noch ergänzt werden. --Scherben 20:51, 2. Jun. 2009 (CEST)Beantworten
Man könnte das noch klarer formulieren, bisher ist es etwas verschämt versteckt in dem Satz zur Regressionsanalyse in der Einleitung und im geschichtlichen Teil bei der Erwähnung des Satzes von Gauß-Markow. --P. Birken 20:55, 2. Jun. 2009 (CEST)Beantworten

Nur so als diffuse Bemerkung am Rande: Der Begriff Kurvenschar könnte aus der Schule bekannt sein, so dass er sich evtl. gewinnbringend in der Einleitung verwursten ließe. (Etwa: "Auf der Grundlage eines Erklärungsmodells für die gemssenen Daten wird eine Kurvenschar vorgegeben und die Kurve ermittelt, die am besten zu den Datenpunkten passt. Wie gut eine Kurve zu den Datenpunkten passt, wird durch die Summe der Quadrate der Abstände der Messwerte von den Werten der Kurve bestimmt." Ja, das ist jetzt ins Blaue geballert und sicherlich alles andere als sauber formuliert.) -- Ben-Oni 00:22, 3. Jun. 2009 (CEST)Beantworten

Kontra - Dem Antragsteller ist insofern zuzustimmen, als in diesem Artikel bei vergleichsweise geringer mathematischer Tiefe des Artikelinhalts ein umfangreiches Werk an Fachbegriffen und fachsprachlicher Ausdrucksweise verwendet wird. MaW: Das hätte man auch einfacher sagen können. Inhaltlich gefällt mir die Fokussierung auf numerische Mathematik nicht - die Stochastik kommt mir zu kurz. Beispielsweise fehlt im linearen Standardmodell y = a + bx das Fehlerglied Epsilon. Es fehlen auch Aussagen zu den Konfidenzintervallen für die gefundenen Schätzer. Die fehlende Gewichtung der Stochastik merkt man auch an den Formulierungen; z.B. "Außerdem sollten die Messfehler normalverteilt sein, was zum einen wahrscheinlichkeitstheoretische Vorteile hat und zum anderen garantiert, dass Ausreißer in y so gut wie ausgeschlossen sind." (welche Vorteile ? was genau soll das heissen; "Aussreisser so gut wie ausgeschlossen"); "Mit Hilfe der Maximum-Likelihood-Methode (maximale Wahrscheinlichkeit) kann letztendlich folgende Vorschrift begründet werden" - Nein, der Grund besteht vielmehr im Satz von Gauss-Markow, was weiter oben auch richtig steht; "Die linearen Regressionsmodelle sind in der Statistik wahrscheinlichkeitstheoretisch intensiv erforscht worden." - dieser Satz schreit nach Literaturangaben; "Besonders in der Ökonometrie werden beispielsweise komplexe rekursiv definierte lineare Strukturgleichungen analysiert, um volkswirtschaftliche Systeme zu modellieren." - das hat wiederum wenig Bezug zum vorherigen Satz; "Strenggenommen ist die Normalverteilungsannahme für die abhängige Variable y nicht zwingend notwendig." - naja, bei Heteroskedastizität gilt der Satz von Gauss-Markow nicht und es ist zumindest aus dem Artikel nicht klar, inwiefern Least-Square dann noch minimalvariant ist. --Zipferlak 01:34, 3. Jun. 2009 (CEST)Beantworten

Die stochastischen Teile sind absichtlich nicht drin, weil diese (wie es IMHO sein sollte) in Regressionsanalyse behandelt werden. --P. Birken 19:29, 4. Jun. 2009 (CEST)Beantworten
  • Pro Zunächst einmal: der Artikel wurde 2004 zum EA gewählt. Dass nicht alles so ist, wie manche sich das heute vorstellen liegt in der Natur der Sache; spricht aber nicht zwangsläufig gegen den Artikel. Mit der recht pauschalen Begründung des Antragsstellers kann ich nichts anfangen. Beim Querlesen kann ich keine künstlich gestelzte Verwendung von Fachbegriffen feststellen. Formulierungsvorschläge und Beispiele sollten schon gebracht werden, bevor so ein Abwahlantrag gestellt wird. Ich kann auch nicht feststellen, dass der Hauptautor gebeten wurde, den Artikel ggf. zu überarbeiten. Die Einleitung beschreibt in groben Zügen, was das Verfahren macht. Es folgt ein kurzer, gut geschriebener geschichtlicher Abriss. Danach wird das Verfahren allgemein beschrieben und im Folgenden werden Spezialfälle behandelt. Auch die Grafiken und die Animation verdeutlichen die Methode anschaulich. Nachbesserungen im Detail mögen angebracht sein. Eine generelle Abwahl sehe ich nicht gerechtfertigt. – Wladyslaw [Disk.] 09:22, 5. Jun. 2009 (CEST)Beantworten
Wenn er heute die Anforderungen für einen exzellenten Artikel nicht mehr erfüllt muss man ihn verbessern oder abwählen. Zum Thema Verbesserungsvorschläge solltest du erst einmal einen Blick auf die Diskussionseite werfen.--G 10:35, 5. Jun. 2009 (CEST)Beantworten
Oh ja, ich finde da so Erbauliches von Dir wie Ich finde dass Begriffe wie "Punktwolke", "Modellkurve" und "(t;y)-Paare" nicht in der Einleitung auftauchen, Begriffe wie "numerisch", "Ausgleichsrechnung" und "Quadratsumme der senkrechten Abweichungen" irgendwie erklärt werden sollten. Jemand, der vorgibt Mathematik LK gehabt zu haben sollte damit keine wirklichen Verständnisprobleme haben. Derartige mathematische Sachverhalte auf die Ebene herabzutrivialisieren, dass sie auch derjenige versteht, der nur Prozentrechnung versteht ist schlicht unmöglich und würde den Artikel nicht verbessern sondern wirklich zu einem Abwahlkandidaten werden lassen. – Wladyslaw [Disk.] 10:50, 5. Jun. 2009 (CEST)Beantworten
Es geht nicht darum, dass ich es nicht verstehe. Aber es ist in diesem Artikel definitiv möglich eine eine Erklärung zu finden, die von mehr Leuten verstanden wird. Wikipedia ist kein Mathematik-Lehrbuch sondern eine Enzyklopädie. Warum kann man hier eigentlich nicht seine Meinung äußern mit der man Artikel verbessern will, ohne dass man gleich angegriffen wird?--G 12:35, 5. Jun. 2009 (CEST)Beantworten
Ich habe Dich in keinem Jota angegriffen. Ich verstehe deine Argumente nicht und artikuliere das. Wieso kann man in diesem Laden keine Gegenposition äußern, ohne dass sie gleich als persönliche Kriegserklärung verstanden wird? Die Wikipedia und besonders ihre stetige Verbesserung lebt vom Disput und der Auseinandersetzung und nicht etwa vom kuschlig-verlogenen Konsens oder von faulen Kompromissen. – Wladyslaw [Disk.] 12:52, 5. Jun. 2009 (CEST)Beantworten
Die Aussage "der vorgibt Mathematik LK gehabt zu haben sollte damit keine wirklichen Verständnisprobleme haben" ist für mich schon ein persönlicher Angriff, und auch die falsche Behauptung, dass es keine Vorschläge von meiner Seite gab finde ich nicht ok. Ich sehe es auch so, dass Diskussion Wikipedia weiterbringen (aber man wird auch immer Kompromisse finden müssen) und will in diesem Fall, dass über die Prioritäten und die Verständlichkeit von Mathe-Artikeln diskutiert wird.--G 13:08, 5. Jun. 2009 (CEST)Beantworten
Lass bitte die Kirche im Dorf. Ich schrieb der vorgibt, Mathematik LK gehabt zu haben ... weil Du eben vorgegeben hast, Mathematik LK gehabt zu haben. War doch so? Da ich diese Aussage glauben, aber nicht nachprüfen kann, nehme ich Sie als wahr an und verweise auf deine Vorgabe. Wenn ich eine Aussage von Dir aufgreife, so kannst du das schwerlich zum persönlichen Angriff erklären und nun schlage ich vor, dass wir die Diskussion beenden weil sie dem Artikel nicht weiter hilft. – Wladyslaw [Disk.] 13:23, 5. Jun. 2009 (CEST)Beantworten

Pro Mathematische Artikel müssen nunmal exakt sein, es geht hier nicht um ein Aufmaß für Malerarbeiten. Die wesentlichen Fachbegriffe sind verlinkt, das Meiste erklärt. Zudem lässt sich auch klar trennen, wo noch der Mathekurs der Oberstufe und der Biologiestudent dabei sind und wo Mathematiker, Physiker und Informatiker unter sich bleiben. Das ist hier doch recht gut gelungen. Wer nicht aus einem der drei Fachbereiche kommt, braucht davon Vieles nicht und steigt halt an genau dieser Stelle aus. So ist das nunmal mit Mathematik. Bei Mathematikfachlexika hat ein Biologe auch keine Chance etwas zu verstehen und selbst Physiker kommen da mitunter an ihre Grenzen (freilich hier nicht, aber deshalb ist der Artikel auch exzellent, vergleiche das einmal mit üblichen Skripten zur Einführung in die Numerische Mathematik aus dem 3. Semester Mathe oder Physik-Nebenfach). --Cup of Coffee 23:37, 5. Jun. 2009 (CEST)Beantworten

Pro Ich kann zwar rechnen aber habe von Mathematik wenig Ahnung. Wenn ich Formeln sehe, wie in diesem Artikel, klicke ich normalerweise weg. Angestachelt durch die Diskussion, die Unverständlichkeit suggeriert, habe mich dazu aufgerafft den Artikel zu lesen. Und siehe da, ich habe die Einleitung sofort verstanden und nach zweimal lesen auch die Methodik und Anwendungsmöglichkeiten gut nachvollziehen können. Wenn das einem Lexikonartikel bei einem Laien gelingt, ist das in meinen Augen perfekt. Vielleicht könnte die Einleitung noch einfacher formulieren aber die Exaktheit dürfte nicht darunter leiden. Wie wäre es mit einem Abschnitt praktische Anwendungsmöglichkeiten direkt nach der Einleitung? Da könnte man die Formulierungen von Lutz Hartmann aufgreifen. Wer die Einleitung nicht versteht, könnte gleich zu diesem Abschnitt springen und hat dann wenigstens eine praktische Vorstellung worum es geht. -- Mgehrmann 08:43, 6. Jun. 2009 (CEST)Beantworten

Neutral Kontra Von der Verständlichkeit her finde ich den Artikel insgesamt in Ordnung, aber beim Durchlesen sind mir doch zahlreiche verwirrende Ungenauigkeiten und Inkonsistenzen aufgefallen, vor allem bei den Formeln und Grafiken. Ein paar Beispiele:

  • Die Modellfunktion heißt manchmal , manchmal y, manchmal f. Überhaupt halte ich die Bezeichnung für unglücklich, da y mit Index ja die Messwerte sind. Einmal steht sogar da, was irgendwie gar keinen Sinn macht.
  • Der allgemeine lineare Fall scheint mir nicht sehr allgemein zu sein. Kann es sein, dass hier Linearität in t mit Linearität in x vermischt wird? Linearität bezieht sich hier doch immer auf Linearität in den Parametern, oder? Der genaue Zusammenhang mit dem linearen Ausgleichsproblem bleibt auch ziemlich vage und wird nur im Zusammenhang mit Beispielen erwähnt.
  • Die Grafik in der Einleitung wirkt insgesamt etwas "schlampig". Grüne Pfeile enden im Nirgendwo, drei der Pfeile sind mit e beschriftet, da kann man auf die Idee kommen, dass die alle gleich lang sein sollen. Auch sollten die y durchindiziert werden.
  • Beim Kriegsschiffbeispiel sollte auf alle Fälle noch die Lösung in die Grafik eingezeichnet werden.
  • Die Animation steht im falschen Abschnitt und, soweit ich sehe, wird nirgends erklärt, was bedeuten soll. --91.13.195.194 13:39, 6. Jun. 2009 (CEST)Beantworten

Nach nochmaligem Durchlesen habe ich meine Meinung leider ändern müssen. Weitere Gründe:

  • Es fehlt eine korrekte Definition des allgemeinen Problems: Die Formel ist nur verständlich, wenn man schon weiß, was gemacht wird. Es müsste doch deutlich werden, dass die für die gegebenen -Werte aufsummiert werden. Und dass der Vektor mit Komponenten und dass die die verschiedenen Messwerte sein sollen, muss man an dieser Stelle auch erahnen.
  • Es fehlt, wie oben schon angedeutet, der allgemeine lineare Fall mit Modellfunktionen der Gestalt . In diesem Zusammenhang sollten auch wichtige Spezialfälle wie Ausgleichung durch Fourierpolynome oder Splines erwähnt.
  • Durch die ausgelagerte Stochastik hängen die gelegentlich eingestreuten Bemerkungen über die Verteilung der Messfehler völlig in der Luft. --91.13.228.1 10:47, 7. Jun. 2009 (CEST)Beantworten
Danke, das sind sehr nützliche Hinweise, ich habe einiges direkt umgesetzt. Die Notation ist bei diesem Artikel ein echtes Problem und uns ist damals nichts wirklich besseres eingefallen. Ich werde nochmal darüber nachdenken, konkrete Hinweise wären hier hilfreich. In den Büchern die ich so rumliegen habe, mogeln sich die Autoren um das Problem halt irgendwie rum. --P. Birken 20:02, 7. Jun. 2009 (CEST)Beantworten
Zur Notation: Im Artikel sollte es eine einheitliche Bezeichung für Modellfunktionen geben, die man nicht mit den Messwerten verwechseln kann. Warum nicht einfach (oder meinetwegen )? Noch besser würde ich allerdings finden, wie im englischen Artikel. Das würde auch besser zu Regressionsanalyse passen, aber dann müsste man hier alle t in x und alle x in umbenennen. --91.13.169.93 18:30, 8. Jun. 2009 (CEST)Beantworten
  • Ich habe noch folgenden Anmerkung: Man sollte im zweidimensionalen Fall der linearen Modellfunktion sagen, dass die Frage der Minimierung dadurch gelöst wird, dass man annimmt, dass die Gleichung deshalb die beste Lösung ist, weil man davon ausgeht, dass und auf der Geraden liegen. Sonst bleibt die Frage, warum diese und nicht eine parallele Gerade die beste Schätzung ist. Ich bin übrigens auch im ersten Moment darüber gestolpert, dass die : nicht die Variablen, sondern die Parameter bezeichnen. Lutz Hartmann 09:54, 9. Jun. 2009 (CEST)Beantworten

Was mir aufgefallen ist:

  • Schon in der Einleitung wird von "Kurve" und "Punkt"wolke gesprochen. Die Methode kann jedoch allgemeiner genutzt werden, z.B. um aus Richtungs- und Streckenmessungen (<> Punktwolke) Koordinaten (<> Kurve) zu schätzen.
  • Die Begriffe "Überbestimmung" und "Redundanz" fehlen hier gänzlich (indirekt kann man das zwar unter Ausgleichungsrechnung nachlesen), dabei wird erst durch die Redundanz an Meßwerten die Methode erforderlich. "Überbestimmung" wird nur einmal unter Multikollinearität genannt.
  • Für ein nichtlineares Beispiel würde sich ein Vermessungsbeispiel vielleicht eignen, da Gauß die Methode ja auch sehr früh hierfür verwendet hat.
  • Betrachtungen zur Gewichtung von Beobachtungen fehlen ganz (außer zur Unterdrückung von Ausreißern). Durch eine Gewichtsmatrix für die Beobachtungen können sowohl unterschiedliche Varianzen als auch Korrelationen der Beobachtungen berücksichtigt werden. Außerdem lassen sich aus der Inversen der Normalgleichungsmatrix Varianzen und Kovarianzen der Schätzwerte ableiten.
  • Die Methode kann man auch mit Regewichtung (abhängig von den Residuen im vorherigen Schritt) verwenden. Mit einer bestimmten Regewichtung erhält man z.B. dasselbe Ergebnis wie bei einer L1-Norm-Schätzung.
  • Auf einen möglichen Rangdefekt der Normalgleichungsmatrix und dessen Behandlung wird nicht eingegangen.
  • Als Literatur sind 4 Werke aus dem Wirtschaftslehre angegeben. Ist sie vielleicht überrepräsentiert?
  • Einzelne Formulierungen:
    • "Sind diese Kurven ... parameterabhängig, so bestimmt die Methode der kleinsten Quadrate ...": was im anderen Fall?
    • Das Verfahren: "Man interessiert sich für eine abhängige Variable y": Eigentlich interessiert man sich doch für die Parameter. Die gemessenen/beobachteten y-Werte dienen dazu, die unbekannten Parameter zu bestimmen oder die Modellfunktion zu prüfen, sind also nur Mittel zum Zweck.
    • "Außerdem sollten die Messfehler normalverteilt sein, was zum einen wahrscheinlichkeitstheoretische Vorteile hat und zum anderen garantiert, dass Ausreißer in y so gut wie ausgeschlossen sind." unglücklich formuliert?
    • "Der einfachste lineare Ansatz ist ym=x0+x1*tm." Der einfachste Fall ist der Mittelwert. Es läßt sich zeigen, daß die L2-Norm-Schätzung in diesem einfachen Fall gerade zum Mittelwert führt, so daß man sie als Verallgemeinerung des Mittelwertes ansehen kann.
    • "es werden etwa 92 Prozent der Information in Breite mit Hilfe des Merkmals Länge erklärt": woher kommt der Wert?
    • Mehrere Variablen: das Beispiel ist kein allgemeiner Fall, da eine Spalte der Matrix A nur mit Einsen besetzt ist.
    • "Diese motivierte auch den Ausdruck der Pseudoinversen" ??
    • "[Ausreißer] verursachen numerische Probleme, ebenso wie Multikollinearität." Ausreißer verursachen in erster Linie Verzerrungen der Schätzwerte, weniger (wenn überhaupt) numerische Probleme.
    • "Als Ausreißer sind Datenwerte definiert, die untypisch weit von der Masse der Daten entfernt sind": Manchmal (auch durch diese Definition) wird der Eindruck erweckt, daß alle Meßwerte, die zu weit von der Modellfunktion abweichen (große Residuen), schädlich sind. Tatsächlich sind jedoch auch die großen Abweichungen wichtig, um z.B. Varianzen korrekt zu schätzen.
    • "Kreuzproduktmatrix": Begriff?

Meiner Meinung nach kann also noch einiges verbessert werden. Bei Interesse kann ich mich an einer Überarbeitung beteiligen. 80.146.55.150 11:36, 11. Jun. 2009 (CEST)Beantworten

Klar, da der Antragsteller den Artikel einfach so zur Wiederwahl gestellt hat, ohne vorher die Möglichkeit zu geben, den Artikel nochmal zu überarbeiten, bin ich jetzt zeitlich nicht in der Lage, einfach zu springen, weil er "Hopp" ruft. Ein Abschnitt Varianten, bei dem auf weighted Least Squares und Least Squares mit Nebenbedingungen eingegangen würde, wäre auf jedenfall sinnvoll. --P. Birken 15:36, 11. Jun. 2009 (CEST)Beantworten

Kontra Für einen exzellenten enthält der Artikel mir zu viele Unstimmigkeiten und Schwachpunkte. 1.) Das Ergebnis eines Fits sind Parameter, Fehlerabschätzungen für die Parameter sowie ein statistisches Maß für die Qualität der Anpassung. Im Artikel ist nur der erste Punkt "Parameter" adressiert, der Rest fehlt. 2.) Damit verwandt: Es fehlen Informationen zur Gewichtung von Fehlern (z.B. Chi-Quadrat-Verteilung) 3.) Der eine Satz zum theoretischen Hintergrund (Stichwort "Maximal-Likelihood-Schätzer") ist etwas mager. 4.) Die Inhalte der Tabellen T1 und T2 werden nur unzureichend erläutert. Was ist "Signifikanz"? Warum ist die Signifikanz in den Tabellen fast immer 0? Was ist "T-Prüfgröße"? 5.) Zu der Abgrenzung zur Regressionsanalyse könnte auch etwas erwähnt werden (auf der Diskussionsseite gab es dazu kilobyteweise Diskussionen). -- Belsazar 14:39, 11. Jun. 2009 (CEST)Beantworten

Siehe den allerersten Satz im Artikel: "Dieser Artikel behandelt die numerischen Aspekte dieser Methode. Für eine stochastische Sichtweise siehe Regressionsanalyse." --P. Birken 15:36, 11. Jun. 2009 (CEST)Beantworten
Ist mir schon klar. Aus dem Satz geht aber nur hervor, dass es eine Unterscheidung gibt, aber nicht, worin diese besteht. Nachdem so lange über das Thema diskutiert wurde, hätte ich der Abgrenzung etwas mehr als den einen Satz spendiert. Aber um Missverständnisse zu vermeiden: Das alleine wäre für mich natürlich kein Contra-Grund.-- Belsazar 15:56, 11. Jun. 2009 (CEST)Beantworten
Es sind doch nun eine Reihe konkreter sachlicher Punkte genannt. Kann man nicht das eine oder andere innerhalb der verbleibenden 8 Tage abarbeiten? Einige dieser Punkte scheinen mir gar nicht so schwierig und damit könnte man vielleicht auch schon das eine oder andere negative Votum einkassieren. Aber überhaupt eine Reaktion im Artikel selbst erscheint mir unumgänglich. --Lutz Hartmann 00:00, 12. Jun. 2009 (CEST)Beantworten
"Überhaupt eine Reaktion" finde ich in Anbetracht dessen, was sich seit Listung hier getan hat, ziemlich ungerechtfertigt. Tatsache ist: G meinte aus Trotz, den Artikel hier einstellen zu müssen und andere machen mit. Ich bin durchaus gewillt, den Artikel zu verbessern und habe das ja auch shcon gemacht nur: Nur weil G Hott schreit, werde ich mich nicht mehr stressen als jetzt schon. Alleine die Notation zu überdenken und zu verbessern würde mich über ne Stunde konzentrierten Arbeitens kosten. In ein paar Wochen mache ich das Thema eh in meiner Vorlesung, jetzt sind aber Eigenwerte dran. Mein Vorschlag: Ein Review draus machen, die Aktion hier finde ich ziemlich Panne. --P. Birken 19:57, 12. Jun. 2009 (CEST)Beantworten
Wäre für mich auch ok. Wie votiert man dafür?-- Belsazar 20:42, 12. Jun. 2009 (CEST)Beantworten
Eine Überarbeitung ohne den Zeitdruck dieser KEA-Diskussion bringt mehr, als jetzt hier und da Kleinigkeiten anzupassen. Da eine Überarbeitung angekündigt wurde und vor solchen Abwahlen zuerst versucht werden sollte, den Artikel zu verbessern, plädiere ich auch für eine Beendigung/Zurückstellung dieser Abwahl, bis der Artikel überarbeitet ist. 80.146.114.27 15:00, 13. Jun. 2009 (CEST)Beantworten
Habe ich richtig gelesen, dass der Hauptautor vorschlägt, die Abwahldiskussion abzubrechen, und dies ausdrücklich vor dem Hintergrund, dass der Abwahlantrag ("Aktion Panne") Erfolg zu haben droht ? Ich bin angesichts soviel Dreistigkeit etwas überrascht. Wenn das Schule macht, brauchen wir keine Abwahldiskussionen mehr. --Zipferlak 17:49, 13. Jun. 2009 (CEST)Beantworten
Vor dem Wiederwahlantrag sind IMHO nicht alle verfügbaren Möglichkeiten ausgeschöpft worden, den Artikel ohne Aberkennung des Exzellenz-Status zu verbessern. G hat auf der Disussionsseite -wie auch hier beim Abwahlantrag- nur sehr pauschal, d.h. ohne konkrete Nennung von konkreten Schwachpunkten, moniert, dass die Einleitung unverständlich sei. Stattdessen bestand er darauf, dass seine eigene Alternativversion der Einleitung besser sei. Nachdem sich dann niemand seiner Meinung anschloss, stellte er den Artikel hier zur Wiederwahl ein. Hier hätten 1.) zunächst die Kritikpunkte konkret genannt werden müssen, und 2.) die Möglichkeit eines Reviews in Erwägung gezogen werden sollen. Insofern kann ich die Reaktion von P. Birken nachvollziehen.-- Belsazar 19:06, 13. Jun. 2009 (CEST)Beantworten
Zum Glück haben wir ja Richtlinien zu Abwahldiskussionen, stehen direkt im Kopf über dieser Diskussion und die verlangen zu Recht, dass man solche Aktionen wir hier sein lässt. Extra für Dich, weil Du ja diesen großen Skandal, dass ich es gewagt habe, mich darüber zu beschweren, zum Glück für alle aufgedeckt hast, zitiere ich das nochmal: "Bevor du einen Artikel hier zur Wiederwahl vorschlägst, solltest du dessen Mängel auf der Artikeldiskussionsseite oder bei fehlender Betreuung in einem Fachportal ansprechen, sodass eine Chance zur Verbesserung besteht. Sofern es Hauptautoren gibt, die sich für den Artikel verantwortlich fühlen, kann auch ein vorheriges Review sinnvoll sein." --P. Birken 00:52, 20. Jun. 2009 (CEST)Beantworten

Von mir ein Pro. Nu auch mal mein Senft (fränkische Schreibweise):

  • Das Gute für das Pro brauche ich wohl hier nicht auszuführen.
  • Die Trennung in die numerische Version (Methode der kleinsten Quadrate) und eine stochastische Version (Regressionsanalyse) war motiviert durch die Erkenntnis, dass Methode der kleinsten Quadrate häufig angewendet wird, ohne dass sich um die stochastischen Bedingungen gekümmert wird. Allerdings vermute ich mal, dass wahrscheinlichkeitstheoretische Folgerungen nur in dem Fall machbar sind, in dem von linearen oder linearisierten Modellen gesprochen wird. Bei iterativen Anpassungen wird das nicht mehr möglich sein. Anderseits kommt erstere "klassische" Variante ohne ein bisschen Stochastik nicht aus. Das ist die Zwickmühle. Man könnte nun in diesem Artikel mal, so weit möglich, die Stochastik rauswerfen und die entsprechenden Sachverhalte "unstochastisch" erklären.
  • Die Verwendung der Symbole x und t irritiert mich als Nichtphysiker auch immer etwas, ist aber sicher auch nicht schlechter als b und x.
  • Die Verwendung von kleinsten Quadraten dürfte zu einem großen Teil darin begründet liegen, dass sich beim Ableiten lineare Funktionen für die optimale Lösung ergeben.
  • Die Einleitung ist IMHO ok. Wenig belastbare Studenten kriegen so oder so Asthmaanfälle.
  • Auch die bemängelten Gleichungen im Text sind im Detail verbesserungsfähig.

Ich frage mich bloß, ob ich da noch Arbeit investieren soll, denn es ist ja offensichtlich erklärtes Ziel einiger Querulanten, den Artikel zu kippen. -- Philipendula 11:26, 18. Jun. 2009 (CEST)Beantworten

Es hat sich ja eine Menge Text angesammelt seit das letzte Mal hierher geschaut habe, aber Beiträge von Querulanten kann ich hier beim besten Willen nicht finden. Eigentlich hätte ich ja dieses Wochenende etwas Zeit und Lust gehabt, einige der von mir angemerkten Schwachpunkte auszubessern zu helfen (ich bin die 91.13... IP), aber wenn euer Artikel trotz der inzwischen grob überschlagenen 30 konkreten Verbesserungsvorschläge so toll exzellent ist, will ich da als nicht angemeldeter Benutzer natürlich nicht reinpfuschen.--91.13.252.168 22:41, 19. Jun. 2009 (CEST)Beantworten
Nun, zum einen war schon das Einstellen des Artikels hier eine reine Retourkutsche, zum anderen heißt es nicht automatisch, dass die 30 Verbesserungsvorschläge alle sinnvoll sind. Hier redet ja jeder mit. Außerdem läuft eh morgen die Kandidatur ab. Da müsstest du dich schon ranhalten. -- Philipendula 23:25, 19. Jun. 2009 (CEST)Beantworten
Ranhalten? Wusste gar nicht, dass es ab übermorgen nicht mehr möglich ist, Fehler im Artikel auszubessern. Er wird doch hoffentlich nicht gleich gelöscht werden ;-) Übrigens, wenn ich Beiträge Verbesserungsvorschläge nenne, heißt das, dass das Umsetzen dieser Vorschläge meiner Meinung nach eine Verbesserung des Artikels bringen würden. --91.13.236.108 23:52, 19. Jun. 2009 (CEST)Beantworten
Nu, gelöscht wird er wohl nicht werden. Verbesserung schadet ja nie. -- Philipendula 00:16, 20. Jun. 2009 (CEST)Beantworten
Naja, da über die 30 Verbesserungsvorschläge kein Dialog in Gang kommt, wird die Welt wohl nie erfahren, ob sie sinnvoll waren. Und dass ich hier mitgeredet habe, bitte ich zu entschuldigen. Ich wusste nicht, dass dies nicht gewollt ist. --Zipferlak 23:34, 19. Jun. 2009 (CEST)Beantworten
Ein Großteil der Verbesserungsvorschläge der beiden IPs ist sinnvoll und ein Großteil dessen wurde auch schon umgesetzt. Und wenn man die Muße hätte, könnte man darüber auch Dialoge führen, ich wusste halt nicht, dass die Autoren die Diskussionsteilnehmer auch noch bespaßen müssen? --P. Birken 00:52, 20. Jun. 2009 (CEST)Beantworten
6 Pro, 4 Contra, die Contras sind gut begründet, daher abgewählt AF666 10:55, 20. Jun. 2009 (CEST)Beantworten
Hier wurde gar nichts gemacht. Die Formalien für einen Wiederwahlantrag wurden nicht eingehalten. Das klingt nach Korinthenkacken, Tatsache ist aber, dass bei den Autoren der Wille da war und ist, den Artikel zu verbessern, aber ihnen nicht die Zeit gegeben wurde, das zu tun. Und genau das wird vor einem Wiederwahlantrag gefordert. Es ist einfach superdaneben, das zu ignorieren. --P. Birken 11:58, 20. Jun. 2009 (CEST) P.S. Das ist auch die Meinung zweier Contrastimmer, wie man ja leicht nachlesen kann.Beantworten
Stimmt. Eigentlich bin ich ja für sowas nicht zu haben, aber ich würde eine eine zweite Meinung einholen. Wenn ich ausgewertet hätte, dann hätte ich wahrscheinlich sogar für exzellent ausgewertet. Es geht halt nicht immer nur ums Auszählen, mE überwiegen die Pro-Argumente klar. --MEWRS Zigarre gefällig? Feuer? 14:26, 20. Jun. 2009 (CEST)Beantworten
Auf Wikipedia:Kandidaten für exzellente Artikel/Hinweise für die Auswertung#Bei_Abwahlen heißt es: „Ein Wiederwahlkandidat wird abgewählt, wenn es mindestens drei Contra-Stimmen gibt und die Anzahl der Pro-Stimmen weniger als doppelt so groß ist wie die Anzahl der Contra-Stimmen“ Und demnach ist der Artikel abgewählt worden
Es gibt keine drei Contrastimmer, da zwei der Contrastimmer explizit gesagt haben, dass sie eine Abwahl nicht unterstützen, sondern ein Review vorziehen. --P. Birken 19:42, 20. Jun. 2009 (CEST)Beantworten
Hast Du absichtlich falsch gezählt ? Es gibt vier Contras. Ich bin angesichts des hier gebotenen Schauspiels ziemlich sauer. Du kannst Dir doch den Exzellenzstatus nicht ertrotzen. Mach Dein Review und stell den Artikel dann erneut in die Kandidatur. Etwas anderes kommt angesichts der Diskussion nicht ernsthaft in Betracht. --Zipferlak 21:37, 21. Jun. 2009 (CEST)Beantworten
Du, sauer bin ich schon lange bei der Hartnäckigkeit mit der Du hier versuchst, anderen ans Bein zu pinkeln. Die Diskussion wurde durch Orci beendet, es wäre schön wenn Du das respektieren würdest. --P. Birken 21:50, 21. Jun. 2009 (CEST)Beantworten
Orci ist weder befugt, als "Ober-Auswerter" zu fungieren, noch, die Regeln ausser Kraft zu setzen. --Zipferlak 21:54, 21. Jun. 2009 (CEST)Beantworten
Ich sehe es so, dass dies eine strittige Auswertung war, bei der es mehrere Auswertungen gab (was extra so vorgesehen ist). AF666 hat als erster mit "nicht exzellent" gewertet, MEWRS hat sich als Auswerter Pro exzellent ausgesprochen (damit steht es 1:1) und ich habe es als dritter eben Pro exzellenz gewertet, sehe da kein Problem. --Orci Disk 22:01, 21. Jun. 2009 (CEST)Beantworten
MEWRS hat sich nicht pro exzellent ausgesprochen (er schrieb lediglich, dass er "wahrscheinlich" für exzellent ausgewertet hätte), sondern vorgeschlagen, eine zweite Meinung einzuholen. Was nicht heissen kann, dass die zweite Meinung (also Deine, Orci) die erste Meinung sticht und die Diskussion damit beendet ist. --Zipferlak 22:09, 21. Jun. 2009 (CEST)Beantworten
Ich hatte das so interpretiert (was nicht unbedingt richtig sein muss, ich gebe zu das ist nicht ganz eindeutig). Ich kann ihn aber natürlich auch fragen, ob er das als "offizielle" Meinung sieht und ob er (wenn das nur eine allgemeine Bemerkung war) nochmal endgültig und offiziell als dritter Auswerter fungieren möchte und das entgültige "Urteil" fällen möchte. --Orci Disk 22:18, 21. Jun. 2009 (CEST)Beantworten
Nachdem sich in der Exzellenzkandidatur schon zehn Benutzer ihren Kopf zerbrochen haben, finde ich es nicht so geschickt, wenn jetzt die Schlacht der Auswerter kommt. Eine Auswertung zu kippen, sollte eigentlich nur in Betracht kommen, wenn sie nicht vertretbar war. Hältst Du die Auswertung von AF666 nicht für nachvollziehbar ? Dem Artikel schadet es nichts, wenn er nochmal durch die Kandidaturmühle muss, ganz im Gegenteil. --Zipferlak 22:27, 21. Jun. 2009 (CEST)Beantworten
Naja, was heißt "nicht vertretbar"? Für Dich als Contra-Stimmer ist die Auswertung durch AF666 natürlich i.O., für den Hauptautoren offenbar nicht (sonst hätte er sich nicht zunächst hier beschwert und dann eine weitere Meinung auf der KEA-Disk angefordert). Meine Meinung ist, dass jeder Beteiligte das Recht haben sollte, durch eine zweite oder dritte Meinung eine Auswertung überprüfen lassen zu dürfen. Das erspart viele Willkür-Vorwürfe, böses Blut o.ä.. Von einer "Schlacht der Auswerter" kann man da imo schlecht sprechen, ist eben so etwas die die Lösch- oder Sperrprüfung eben für Bapperl, bei der eine unzufriedene Partei eine neutrale weitere Stimme anfordern kann,die dann die Auswertung bestätig oder eben widerlegt. Wie ich zu meiner Meinung gekommen bin, steht unten, ich bin aus den vorhandenen Stimmen, Begründungen usw. eben zu einem anderem Ergebnis als AF666 gekommen. --Orci Disk 22:46, 21. Jun. 2009 (CEST)Beantworten
  • Ich habe in der Diskussion gesagt, dass ich den Artikel für exzellent halte. Ich weiß nicht wie meine Beiträge gewertet worden sind. In jedem Fall bin ich der Meinung, dass die Bitte von P. Birken, ihm Zeit für die Nacharbeit zu geben, maßgeblich sein sollte. Die Auswertung ist so im Rahmen eines vorhandenen Spielraums ziemlich daneben. --Lutz Hartmann 22:14, 20. Jun. 2009 (CEST)Beantworten
Meine dritte Meinung zur Auswertung auch noch hierher kopiert:
Hm, ist nicht einfach zu entscheiden. Gegen Exzellent spricht die reine Zahlenauswertung (nur die expliziten Pro- und Contra-Stimmen gezählt) und dass es vorwiegend inhaltliche Argmente gegen einen Exzellent-Status sind. Für Exzellent spricht, dass der Hauptautor sehr aktiv bei der Beseitigung der angesprochenen inhaltlichen Schwächen ist und nur mehr Zeit braucht, das fehlende Review und dass auch einige Contra- und Neutralstimmen für die Beibehaltung des Exzellent-Status sind (unter der Bedingung, dass die beanstandeten Mängel beseitigt werden). Letzteres entwertet natürlich die reine Zahlenauswertung. Im gesamten würde ich sagen, dass es für mich knapp pro Exzellent-Status ausgeht unter der Bedingung, dass die angesprochenen inhaltlichen Schwächen in angemesserer Zeit beseitigt werden. Davon gehe ich angesichts der Diskussion aber aus. Viele Grüße --Orci Disk 23:26, 20. Jun. 2009 (CEST)Beantworten
Danke, in den nächsten Wochen wird sich noch so einiges am Artikel tun und so fühlt man sich doch auch gleich motivierter. --P. Birken 16:16, 21. Jun. 2009 (CEST)Beantworten
Ich stimme zwar P. Birken zu, möchte mich aber nicht definitiv festlegen, ob ich den Artikel jetzt als exzellent einstufen würde oder nicht. Mir ging es auch weniger um die Qualität desselben, als dass ich der Meinung war, dass man die genannten Mängel in absehbarer Zeit beheben könnte. Ob ihr den Artikel jetzt im Exzellent-Status belasst oder erst ein Review laufen lasst und ihn dann nochmal zur Wahl stellt, ist für mich nicht von besonderer Bedeutung. --MEWRS Zigarre gefällig? Feuer? 22:38, 21. Jun. 2009 (CEST)Beantworten
Wenn ich mir nach der Lektüre der Versionsgeschichte noch ein P.S. erlauben darf: AF666 hat als nicht exzellent ausgewertet. Jetzt lasst doch erstmal die Version ohne Bapperl, sonst kopmmt ein besonders lieber Admin aud die Idee 1. euch und 2. den Artikel zu sperren. --MEWRS Zigarre gefällig? Feuer? 22:44, 21. Jun. 2009 (CEST)Beantworten

(BK)Wie schon oben erwähnt, gemäß den Regeln ist der Artikel abgewählt. Bei der Auswertung aller Stimmen kommt man zu dem Schluss, dass die Argumente auf beiden Seiten ihre Berechtigung haben, so dass alle Stimmen zu zählen sind.
Auf Grund der bisherigen Diskussion hier dachte ich, Benutzer:G hätte die Abwahl einfach ins Blaue gestartet, doch er hat ja bereits letztes Jahr (7. September 2008) den Grund für seine Abwahlbegründung vorgebracht. Er sieht dabei nichts umgesetzt und stellt daher den Abwahlantrag. Hier nun ein Review zu fordern, weil der Antragsteller dem Artikel im Vorfeld kein Review einräumte, finde ich nicht richtig. Es wurden zahlreiche Argumente vorgebracht, die gegen eine Exzellenz des Artikels sprechen und die auch niemand anzweifelt. Also ist der Artikel momentan nicht exzellent und sollte daher aus der Vorbildliste herausgenommen werden, zumal der Hauptautor von Wochen spricht, die eine Überarbeitung dauern wird. Um mal auf den von mir eigentlich nicht geliebten Begriff Glaskugel zurückzugreifen: Wer garantiert, dass der Artikel wirklich in ein paar Wochen auf exzellentem Stand sein wird? Was ist, wenn dem Hauptautor etwas dazwischen kommt und sich keiner um den Artikel kümmert? Dann gibt es einen abgewählten Artikel, der trotzdem exzellent ist. Folgt man dem Beispiel hier, kann sich jede gescheiterte Exzellenz-Kandidatur darauf berufen, in nächster Zeit eine exzellente Version zu verfassen und sich das "grüne Bapperl" verpassen.
Fazit: Der Artikel ist momentan nicht exzellent und somit muss ihm dieser Status aberkannt werden. --Kauk0r 22:45, 21. Jun. 2009 (CEST)Beantworten
Nachtrag: Ich finde es auch nicht in Ordnung, dass die Auswertung von AF666 nach nur einer anderen Meinung rückgängig gemacht wird, das ist genau dieselbe Willkür, die der ersten Auswertung unterstellt wird. --Kauk0r 22:52, 21. Jun. 2009 (CEST)Beantworten

Wie gesagt, ich hatte MEWRS' Bemerkung so interpretiert, dass dies schon die 2. Auswertung war und meine als dritte gesehen. Da er sich aber offenbar nicht entscheiden möchte und Du ihn als nun endgültig dritter als "nicht exzellent" wertest, habe ich nichts dagegen, dass Du das Bapperl entfernst. Die weitere Vorgehensweise sollte also so sein, dass der Artikel nun zunächst überarbeitet wird (ggf. mit Review) und dann erneut auf KEA antritt. --Orci Disk 23:05, 21. Jun. 2009 (CEST)Beantworten
Es ist genau diese Art von Vorwürfen, die das Arbeiten hier so unangenehm macht. Aber mal konkret: Die Diskussion ist ein Musterbeispiel, warum das reine Stimmen zählen nix taugt und warum die Auswertung durch Benutzer:AF666 in allen Fällen wo man nicht einfach die Pro und Kontra-Vorlage zählen kann, seit Jahren jedesmal zu Streit führt. Nehmen wir mal Benutzer:G. Sein einziger Kritikpunkt am Artikel ist, dass die Einleitung Mist ist. Diese Einschätzung konnte sich auf der Diskussionsseite nicht durchsetzen und sie wurde ihm in dieser Diskussion von zahlreichen Benutzern um die Ohren gehauen, aber ohne dass diese eine Vorlage hingepackt hätten. Ich weiß trotzdem nicht, wie man das, wenn man die Aussage von G als Contra wertet, anders werten will als gegen die Abwahl. Und mal zu Deinem Analogon: Der wesentliche Unterschied von einer Wiederwahl zu einer normalen Kandidatur ist, dass die Kandidatur auf Wunsch der Hauptautoren kommt und das bedeutet insbesondere zu einem Zeitpunkt, wo sie im Thema drinstecken und Zeit haben, sich drum zu kümmern. Das ist bei einer Wiederwahl nicht der Fall und deswegen gibt es Regeln für Wiederwahlen, die hier nicht eingehalten wurden und daraus den Hauptautoren einen Strick zu drehen, konterkarikiert den Sinn dieser ganzen Veranstaltung, als Motivation für Autoren zu dienen, exzellente Arbeit zu leisten. Wenn die Hauptautoren sich nicht um den Artikel kümmern? Ja, dann stell halt nen Wiederwahlantrag, so ist das Problem? --P. Birken 23:15, 21. Jun. 2009 (CEST)Beantworten
Ja gut, dann werten wir Benutzer:G nicht, dann dürfen die Stimmen von Benutzer:Trg und Benutzer:Mgehrmann auch nicht gewertet werden, denn diese sagen sie hätten keine Ahnung von der Materie. In diesem Fall sind ihr Stimmen gegen fundierte Kontras wertlos. Dann hätten wir 4 Pro und 3 Kontra, bleibt also dasselbe Ergebnis.
Ich gebe zu mein Beispiel war überspitzt. Trotzdem: Der Antrag war korrekt. Das er sich als falsch herausstellte ist nicht relevant, da weitere Mängel aufgezeigt wurden. Diese waren im Vorfeld nicht abzusehen, also konnte auch kein Review durchgeführt werden. Zudem ist ein Review keine Pflicht, bevor ein Abwahlantrag gestellt wird, es wäre lediglich sinnvoll.
In diesem Fall sehe ich es eher als deine Aufgabe, wieder eine KEA zu starten, wenn der Artikel überarbeitet ist, denn das es meine ist, hier dafür zu sorgen, dass die Verbesserungen durchgeführt werden. --Kauk0r 23:28, 21. Jun. 2009 (CEST)Beantworten
Dann hätte G, nachdem er auf der Diskussionsseite nicht Recht bekommen hat, damit Erfolg, dass er es trotzig den Autoren zeigen wollte. Wenn er mit so einer Aktion durchkommt, dann wird Trollerei belohnt. Ein Review hatte ich ja schon länger angeregt, was dann von Zipferlak mit höhnischen Kommentaren quittiert wurde. Wenns nur darum geht, andere zu ärgern, dann können wir uns das auch gerne direkt sparen, dann entferne das Bapperl, nur ist mir die Sache dann zu blöd, dann überarbeite ich den Artikel erst gar nicht und eine Wiederwahl wird es dann garantiert nicht geben. So eine Aktion gebe ich mir garantiert dann nicht nochmal. --P. Birken 23:37, 21. Jun. 2009 (CEST)Beantworten
Wieso denn? Wäre der Artikel eindeutig exzellent, wäre die Abwahl gescheitert. Da sie dies jedoch nicht ist zeigt, dass der Artikel momentan nicht exzellent ist. Ich finde es nicht gut, dass du jetzt damit drohst, dem Artikel den Rücken zuzuwenden, wenn er nicht exzellent bleibt. Ob du ihn jetzt mit oder ohne Bapperl überarbeitest, spielt doch keine Rolle. Wenn er überarbeitet ist, dann spricht doch nichts gegen eine Exzellent-Status, was die Diskussion unstrittig gezeigt hat. Also wirst du damit (wohl) keine solche Aktion mehr erleben. --Kauk0r 23:46, 21. Jun. 2009 (CEST)Beantworten
Der Artikel wurde 2004 als exzellent gewählt, seitdem sind die Ansprüche unglaublich stark gestiegen. Deswegen ist es nicht verwunderlich, dass der Artikel im Rahmen einer Wiederwahl überarbeitet werden muss. Und genau deswegen macht man so eine Wiederwahl nicht einfach so, sondern in Absprache mit den Hauptautoren. Es gibt keinen einzigen exzellenten Artikel aus dieser Zeit, bei dem die Diskussion nicht genauso aussehen würde. Schau Dir mal Relativitätstheorie an. Wenn ein Exzellenz-Bapperl für mich bedeutet, dass ich auf der Diskussionsseite erpressbar werde, indem jemand, dem ein winziger Teilaspekt des Artikels nicht passt, so eine Diskussion lostritt, in der dann Kritik kommt, auf die ich aus Zeitgründen gar nicht eingehen kann, gepaart mit Seitenhieben durch Typen wie Zipferlak, dann erwarte ich vom Prozess selbst Rückendeckung. Wenn das aber erwünscht ist, dass solche Aktionen kommen, dann verzichte ich da ganz einfach lieber drauf. Die Bapperl sind etwas, was mich motiviert. Wenn sie den gegenteiligen Effekt haben, dann brauche ich sie nicht, die Artikel werden dadurch nicht schlechter. --P. Birken 23:57, 21. Jun. 2009 (CEST)Beantworten
Du bist doch nicht erpressbar (genausowenig wie ich es bin, weil ich den Artikel als "nicht exzellent" auswerten will), ein exzellenter Artikel wird nicht abgewählt. Der Weg war nicht der richtige, doch sehe es doch mal so: Der Zweck heiligt die Mittel. Exzellente Artikel sollten es auch sein, ich denke da stimmen wir überein. Wenn dir aber schon von vorneherein klar war, dass der Artikel nicht mehr den Anforderungen entspricht, warum hast du ihn dann nicht selbst in den letzten Monaten/ Jahren mal ins Review gestellt? Ich bitte dich um deine ehrliche Meinung: Hättest du auch ohne Abwahl-Diskussion den Artikel in den nächsten Wochen grundlegend überarbeitet? Wenn nicht, dann hatte die Abwahl etwas Gutes, nämlich das der Artikel vorankommt.
Ein anderer Punkt: Schau mal hier...da geht es auch nicht seinen geregelten Weg, doch auf Grund größerer Mängel, wird es hingenommen. So schlimm steht es um den Artikel hier nicht, aber es zeigt, dass die Art und Weise der Abwahl nicht ganz abwegig ist. --Kauk0r 00:31, 22. Jun. 2009 (CEST)Beantworten
Nein, der Zweck heiligt nicht die Mittel. Wenn hier Autoren harte Arbeit reinstecken und dafür andere Dinge vernachlässigen, um sich um exzellente Artikel zu kümmern, dann hat dem ein gewisser Respekt vor dieser Arbeit entgegenzustehen. Faktisch geht alles was ich hier tue, auf Kosten meiner wissenschaftlichen Karriere. Wenn das dann noch auf so eine Weise belohnt werden sollte, dann kann die Konsequenz nur sein, aus dem Verfahren auszusteigen.
Ansonsten stellst Du die falsche Frage: Wenn dieser Artikel oder ein beliebiger anderer aus dieser Liste von 2004 heute kandidieren würde als Neuling, dann würde 80% durchfallen. Und genau deswegen gibt es Regeln für die Wiederwahl, damit das nicht zur Schikane für Autoren ausartet. Wie ich diesen Artikel in der heutigen Version sehe? Lesenswert allemal, von heutigen Exzellenzstandards noch etwas Arbeit weg, deutlich über den Standards von 2006. Ich würde ihm aus diesen Überlegungen raus ein klares Pro für die Wiederwahl geben. Der krasse Unterschied zu Vagina muss Dir doch klar sein: Bei Vagina gibt es nicht nur keine aktiven Hauptautoren, nein, es hat noch nie welche gegeben! --P. Birken 09:15, 22. Jun. 2009 (CEST)Beantworten
Ja sicher muss man sich die Zeit irgendwo selbst wegnehmen, das ist aber mit allem so, was in der Freizeit gemacht wird. Ob nun WP, Sport, Musikverein oder Sonstiges. Aber tust gerade so, als ob man dir alle Auszeichnungen aufeinmal wegnehmen und nie wieder geben will. Das will ja niemand, keiner bestreitet das Potential des Artikels, aber dazu muss noch an ihm gearbeitet werden (übrigens auch ein häufiges Argument bei Neukandidaten, in die ein Autor genauso sein Herzblut steckt).
Also gut, eine andere Frage: Wann genau ist der Artikel wieder exzellent?
Sicher sind da viele Artikel bei, die nicht mehr den heutigen Standards, so nach und nach werden sie wohl auch alle irgendwie verbessert werden. Ich weiß das du mit Pro stimmen würdest, aber für mich geht es um die Auswertung der Abwahl-Diskussion und die ist für mich erfolgreich. --Kauk0r 12:21, 22. Jun. 2009 (CEST)Beantworten
Ich muss mich da wiederholen: Wenn das Bapperl für mich bedeutet, dass ich, nachdem ein Benutzer auf der Diskussionsseite nicht Recht bekommen hat, mich mit Arbeit überschütten darf, wann immer er das will und nicht, wann ich dazu überhaupt Zeit habe, dann diskutiere ich in Zukunft lieber ohne Bapperl in meinen Artikeln. Deswegen gibt es die Regeln zu Wiederwahlen, um solche Schikane und Demotivation von Hauptautoren zu verhindern. Wenn Du mal was richtig trolliges machen willst: Stell einfach zu den zehn der hundert ältesten exzellenten Artikel nen Wiederwahlantrag. Einfach so, weil dir irgendein Abschnitt nicht passt. Diese Position wurde in dieser Abwahldiskussion bestätigt: Dem Antragsteller wurde der Antrag sofort von fünf (!) Benutzern um die Ohren gehauen, er war nicht zulässig, so einfach ist das.
Will man das ganze tatsächlich inhaltlich auswerten, dann ist Zipferlak derjenige, der eine echte Abwahldiskussion einläutete und damit den Antrag von G adelte. In dieser dann beginnenden Diskussion (die Stimme von Luha sollte man aber noch mitnehmen), sind alle Stimmen inhaltlicher Natur, es sind drei Contras und vier Pros. Zwei der Contras äußern sich explizit so, dass sie eine Überarbeitung einer Abwahl vorziehen würden, sie ändern also ihr Contravotum, eben weil ihnen das mit dem Abwahlantrag nicht gefällt. Die IP sagt explizit: "Da eine Überarbeitung angekündigt wurde und vor solchen Abwahlen zuerst versucht werden sollte, den Artikel zu verbessern, plädiere ich auch für eine Beendigung/Zurückstellung dieser Abwahl, bis der Artikel überarbeitet ist." Wie man dann noch davon reden kann, dass der Artikel abgewählt sei, ist mir schleierhaft, insbesondere wo ich diese Überarbeitung auch noch explizit anbiete.
Wann der Artikel wieder exzellent ist? Ich interpretiere das mal als: "Wann wird die Überarbeitung stattfinden?" Ich schlage wie gesagt ein ganz normales Review vor, ab Ende dieser Woche mache ich das Thema eh in meiner Vorlesung und muss mich stärker einarbeiten, bis Mitte Juli bin ich damit durch. --P. Birken 20:10, 22. Jun. 2009 (CEST)Beantworten
Du wirst aber nicht zu unrecht mit Arbeit überschüttet und es zwingt dich auch keiner dazu, die Arbeit zu machen. Doch die Arbeit ist nötig, wie die Diskussion gezeigt hat.
Die Interpretation ist falsch, hier die richtige: Wann ist die Überarbeitung abgeschlossen? Bist du damit in drei Wochen fertig oder gehts da erst los und wie lange dauert es dann noch? --Kauk0r 20:39, 22. Jun. 2009 (CEST)Beantworten
Das ist eine Sache von maximal vier Wochen. Es sind im wesentlichen noch drei Dinge zu tun, die Notation zu überarbeiten, etwas zu "gewichteten Ansätzen" zu schreiben und den Artikel zu Regressionsanalyse besser abzugrenzen. --P. Birken 22:18, 22. Jun. 2009 (CEST)Beantworten
Also gut, dann muss man in vier Wochen nochmal schauen, wie weit der Artikel gediehen ist. --Kauk0r 12:10, 23. Jun. 2009 (CEST)Beantworten

Mir ist AF666 bisher nicht als derjenige in Erscheinung getreten, der sich in mathematischen Themen auskennt. Wie kann so jemand überhaupt eine Auswertung vornehmen, wo es bei KEA um Argumente und deren Gewichtung und nicht um eine reine Stimmauszählung handelt. Und selbst wenn wir das Verhältnis von 6 pro und 4 contra ansetzten und alle Argumente außen vor lassen dann wäre das m.E. für eine Abwahl nicht ausreichend. Bei WP:KEB ist eine Abwahl eines Bildes nur dann möglich, wenn mindestens 2/3 der Gesamtstimmen sich für eine Abwahl aussprechen. – Wladyslaw [Disk.] 10:00, 23. Jun. 2009 (CEST)Beantworten

Das ist jetzt ja lustig, mir wurde neulich in einer Diskussion um die Auswertung strittiger Kandidaturen gesagt, es geht nicht um Fachwissen sondern rein um die Gewichtung der Argumente und das könnten andere genauso. Nach den Vorgaben ist die Stimmenzahl ausreichend: mindestens drei Contra-Stimmen gibt und die Anzahl der Pro-Stimmen weniger als doppelt so groß ist wie die Anzahl der Contra-Stimmen. Sollte vielleicht geändert werden. --Kauk0r 12:10, 23. Jun. 2009 (CEST)Beantworten
Und wie soll jemand ohne wenigstens elementare Fachkenntnis (er muss ja nicht mal Fachmann auf dem Gebiet sein) Argumente gewichten können? Selten so einen ausgemachten Quatsch gehört. – Wladyslaw [Disk.] 12:23, 23. Jun. 2009 (CEST)Beantworten


  • Beim Stellen des Wiederwahlantrages ist anerkanntermaßen etwas falsch gelaufen und zwar zu Ungunsten der Autoren. Das ist ein Grund, das Verfahren abzubrechen. Falls ein Auswerter darauf entscheidet, das nicht zu tun, muss er in seiner Entscheidung darauf eingehen. Insbesondere ist es eindeutig ein falsches Verfahren, in so einem Fall dann lapidar ein paar Stimmen zu auszählen. Erinnerung: "Äußerungen werden als Meinungsbild gewertet, nicht ausgezählt". Es ist daher ein Fehler bei der Auswertung zu erkennen. Eine Revision der Entscheidung ist angebracht, nur gibt es dafür kein Verfahren.
  • Die Entscheidung, wie die Einleitung aussehen soll, ist jedoch eine fachliche Entscheidung; und die ganze Wiederwahlgeschichte ist in meinen Augen nur ein Streit um die richtige Einleitung am falschen Ort (per Wiederwahl/Abwahl sind wohl keine inhaltlichen Konflikte zu klären, im Gegenteil) - den anderen Einwänden wurde ja entsprochen. Anstelle ein wie auch immer geartetes Revisionsverfahren ist ein Review und - für die Autoren - Bearbeitungszeit die einzig mögliche Lösung.
  • Konkret: Die Einleitung ist nicht zu schwer, im Gegenteil, sie ist für meine Begriffe sehr entgegenkommend. Es wird zum Beispiel sehr bildlich "durch eine Datenpunktwolke eine Kurve gelegt, die möglichst nahe an den Datenpunkten verläuft". Über Funktionen und Werte ausschließlich mit der "Kurven"- und "Punkte"-Metapher zu sprechen, wie es in der Einleitung geschieht, ist eigentlich eine simplification terrible, aber da in diesem Fall die Einleitung ergänzend zu formalen Definition ein anschauliches Bild von der ganzen Sache liefert, ist es schon in Ordnung. Schön wäre, die "Kurven" und "Punkte" in der formalen Definition noch mal aufzugreifen, aber für solche Kleinigkeiten ist wie gesagt, das Review das richtige Forum.

Fazit: Die Entscheidung von Benutzer:AF666 wird zurückgenommen, das Wiederwahlverfahren wird abgebrochen und es wird ein Review mit für die Autoren komfortabler Bearbeitungszeit veranstaltet, um einen exzellenten Artikel den wachsenden Ansprüchen anzupassen. --Erzbischof 13:28, 23. Jun. 2009 (CEST)Beantworten

Der Autor sagt er braucht noch vier Wochen. Das nehme ich jetzt mal als Dead-Line, da schon drei Wochen während der Wiederwahl zur Verfügung standen. Somit wäre man auch im Rahmen der vier bis sechs Wochen Review. Wie oben schon gesagt, nicht ganz glücklich gelaufen, aber eindeutige Missstände aufgedeckt, so dass etwas geschehen muss. --Kauk0r 13:51, 23. Jun. 2009 (CEST)Beantworten
Ich denke mit der Entscheidung, den Autoren noch vier Wochen zu geben und dann mal zu gucken was passiert, können alle leben. Und ich glaube, wir müssen die Sache dann hier auch nicht weiter vertiefen, aber vielleicht sollte man das Wiederwahlprozedere nochmal auf Wikipedia_Diskussion:Kandidaten_für_exzellente_Artikel thematisieren. --P. Birken 19:22, 23. Jun. 2009 (CEST)Beantworten

Meine erste Kritik an dem Artikel war schon lange vorm Stellen des Antrags. Da nur meine Änderungen rückgängig gemacht wurden, aber keine Änderung des Artikels von anderer Seite erfolgte habe ich in der Diskussion darauf hingewießen, dass ich ihn zur Abstimmung stellen will und dies 3 Wochen später gemacht. Es ist nicht so, dass ich es den Autoren zeigen wollte. Ich finde den Artikel nicht exzellent. Die meisten anderen finden die Einleitung gut und dann kann sie natürlich so bleiben. Dass der Artikel dann trotzdem abgewählt wurde freut mich nicht, aber wenn die Ansprüche inzwischen gestigen sind ist das auch richtig.-- G 18:20, 23. Jun. 2009 (CEST)Beantworten

Fitting

"In der mathematischen Statistik nennt man das Verfahren auch Kleinste-Quadrate-Schätzung, während in der Physik die Bezeichnung Fitting verwendet wird." - das stimmt so nicht. Fitting bezeichnet allgemein die Anpassung einer Kurve an eine Punktwolke, unabhängig davon, welches Verfahren zur Ermittlung der Fitkurve verwendet wird. --Zipferlak 10:06, 22. Jun. 2009 (CEST)Beantworten

Ist es nicht umgekehrt: Wenn von Fitting gesprochen wird, ist implizit die Methode der kleinsten Quadrate gemeint, wenn man anders fittet, erwaehnt man das explizit (etwa Interpolation)? --P. Birken 10:15, 22. Jun. 2009 (CEST)Beantworten
Leider kann ich nur mit meiner eigenen Erfahrung argumentieren. Demnach entspricht das "Fitting" eher der "Ausgleichungsrechnung" als der "Methode der kleinsten Quadrate". Der englische Artikel en:Curve fitting ist mit seinem Einschluss von Interpolation m.E. unzutreffend, da eigentlich nur überbestimmte Systeme "gefittet" werden, d.h. in der Physik werden aus naheliegenden Gründen mehr Messpunkte erhoben als dies mathematisch erforderlich wäre. --Zipferlak 10:48, 22. Jun. 2009 (CEST)Beantworten
Ausgleichsrechnung und Methode der kleinsten Quadrate werden in der Regel synonym verwendet, da die Methode der kleinsten Quadrate _das_ Standardverfahren zur Ausgleichsrechnung ist. --P. Birken 10:59, 22. Jun. 2009 (CEST)Beantworten
Warum gibt es dann zu den beiden Lemmata zwei verschiedene Artikel ? --Zipferlak 11:06, 22. Jun. 2009 (CEST)Beantworten
Weil die Methode der kleinsten Quadrate das Standardverfahren ist, es aber noch weitere Verfahren gibt, etwa die Minimierung der Summe der Beträge (ohne diese zu quadrieren). --P. Birken 19:54, 22. Jun. 2009 (CEST)Beantworten
Genau. Wie gesagt, kann ich nur mit meiner Erfahrung argumentieren, die besagt, dass unter "Fitting" jedes Verfahren der Anpassung einer Kurve an eine Punktwolke verstanden wird - nicht nur die Anpassung mit der Methode der kleinsten Quadrate (wenngleich diese auch das Standardverfahren des "Fittings" ist). --Zipferlak 22:41, 22. Jun. 2009 (CEST)Beantworten
Endlosschleife? --P. Birken 23:09, 22. Jun. 2009 (CEST)Beantworten

Zurück zum Anfang: Die Behauptung, in der Physik würde man die Methode der kleinsten Quadrate auch als "Fitting" bezeichnen, ist unpräzise, weil mit "Fitting" auch andere Verfahren der Ausgleichsrechnung gemeint sein können. --Zipferlak 23:17, 22. Jun. 2009 (CEST)Beantworten

Also ich als Physiker muss Zipferlak hier zustimmen: "Fitting" (oder Fitten) kenne ich als alles übergreifenden Begriff, identisch mit der Ausgleichungsrechnung, und die Kleinsten Quadrate sind dann schon ein Spezialfall davon. --PeterFrankfurt 01:48, 23. Jun. 2009 (CEST)Beantworten
Ja, das wissen alle hier. Ich wiederhole mich dann tatsächlich, wenn das hier nicht anders funktioniert: Wenn man von Fitting spricht, meint man implizit die Methode der kleinsten Quadrate, soweit ich das verstanden habe. Wenn man etwas anderes meint, erwähnt man das explizit. --P. Birken 09:03, 23. Jun. 2009 (CEST)Beantworten
Habs mal entschärft. Der Begriff Fitting müsste eigentlich auch in anderen Disziplinen bekannt sein. -- Philipendula 09:21, 23. Jun. 2009 (CEST)Beantworten
Ja, danke, so passt es. --Zipferlak 09:41, 23. Jun. 2009 (CEST)Beantworten

Editwar

Erst mal ein bisschen Ruhe bis zur Einigung über das weitere Vorgehen reingebracht. --Seewolf 09:58, 23. Jun. 2009 (CEST)Beantworten

Symbole

Ist es in deutsche Literatur üblich die Punktenpaare mit (t,y) zu bezeichnen, statt (x,y)? Eine Gerade z.B. würde ich notieren wie: y=α+βx, mit Parametern α und β. Nijdam 20:59, 24. Jun. 2009 (CEST)Beantworten

Siehe Diskussion oben. --Lutz Hartmann 21:29, 24. Jun. 2009 (CEST)Beantworten
Habe sie gelesen, aber sie überzeugt nicht. Ich weiss leider nicht was man so in jedes Fachbereich schreibt, aber jedenfalls ist oft die Rede von eine Funktion y=f(x), wobei f zu einer parametrisierte Familie gehört. Das würden die Leser auch besser verstehen. Nijdam 23:57, 24. Jun. 2009 (CEST)Beantworten
Wenn ich das da oben richtig verstanden habe, wird P. Birken auch das Thema der Bezeichnungen angehen. Lutz Hartmann 07:53, 25. Jun. 2009 (CEST)Beantworten
Wenn mir auch die Notation x;β vertrauter ist, fände ich es trotzdem überlegenswert, es so zu belassen, wie es ist. Denn dieser Artikel beschreibt nur die numerische Vorgehensweise, wo die Lösung eines Gleichungssystems die "Regressionskoeffizienten" betrifft. Als Unbekannte müssten sie dann als x bezeichnet werden. Man hätte dann auch eine klare Abgrenzung zum statistischen Modell der Regressionsanalyse. -- Philipendula 08:45, 25. Jun. 2009 (CEST)Beantworten
Ein Problem bei t könnte sein, dass man da unwillkürlich an eine Zeitvariable denkt und dann (vielleicht auch unbewusst) verwirrt wird, wenn plötzlich t mehrdimensional ist. Andererseits ist natürlich x als Unbekannte schon irgendwie ideal. Noch eine Anmerkung: Aus rein numerischer Sicht spielt die Variable t doch so gut wie keine Rolle. Da kann man das Problem als Spezialfall der Minimierung von mit einer vektorwertigen Funktion F auffassen. Im linearen Fall ist und wie die Matrix A entstanden ist, durch Einstzen von t in f oder irgendwie anders, ist eigentlich egal. Wahrscheinlich ist das etwas zu abstrakt, um den Artikel von Anfang an so aufzuziehen, aber erwähnen sollte man es in einem Artikel, der die numerische Sichtweise darstellen soll, wohl schon.--91.13.168.79 20:23, 25. Jun. 2009 (CEST)Beantworten