Zum Inhalt springen

„Klassifikationsverfahren“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
[ungesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
K kat
Beispiele: Logistische Regression ist kein Klassifikationsverfahren
 
(71 dazwischenliegende Versionen von 53 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
'''Klassifikationsverfahren''' sind Methoden und Kriterien zur Einteilung von Objekten oder Situationen in [[Klasse (Kategorie)|Klassen]], das heißt zur [[Klassifizierung]]. Ein solches Verfahren wird auch als '''Klassifikator''' bezeichnet. Viele Verfahren lassen sich als [[Algorithmus]] implementieren; man spricht dabei auch von '''maschineller''' oder '''automatischer Klassifikation'''. Klassifikationsverfahren sind immer anwendungsbezogen, so dass viele verschiedene Methoden existieren.
'''Klassifikationsverfahren,''' auch '''Klassifizierungsverfahren,''' sind Methoden und Kriterien zur Einteilung (Klassierung) von Objekten oder Situationen in Klassen, das heißt zur [[Klassifizierung]]. Ein solches Verfahren wird auch als '''Klassifikator''' bezeichnet. Viele Verfahren lassen sich als [[Algorithmus]] implementieren; man spricht dabei auch von '''maschineller''' oder '''automatischer Klassifikation.''' Klassifikationsverfahren sind immer anwendungsbezogen, sodass viele verschiedene Methoden existieren.


Im engen Sinne stehen im Gegensatz zu den Klassifikationsverfahren die ''Klassierungsverfahren,'' die dem Einordnen von Objekten in bereits existierende Klassen dienen. Umgangssprachlich wird jedoch zwischen ''klassifizieren'' und ''klassieren'' kein Unterschied gemacht.<ref>Hardwin Jungclaussen: ''Kausale Informatik. Einführung in die Lehre vom aktiven sprachlichen Modellieren durch Mensch und Computer.'' [[Springer Fachmedien Wiesbaden]], 2013, ISBN 978-3-322-81220-9, [https://books.google.de/books?id=kW31BQAAQBAJ&pg=PA57 S.&nbsp;57.]</ref>
Klassifikationsverfahren spielen unter anderem bei der [[Mustererkennung]], in der [[Künstliche Intelligenz|Künstlichen Intelligenz]] und der [[Dokumentationswissenschaft]] beziehungsweise dem [[Information Retrieval]] eine Rolle. Zur [[Beurteilung eines Klassifikators]] können verschiedene [[Kenngröße]]n ermittelt werden.


Klassifikationsverfahren spielen unter anderem bei der [[Mustererkennung]], in der [[Künstliche Intelligenz|künstlichen Intelligenz]], in der [[Dokumentationswissenschaft]] und im [[Information Retrieval]] eine Rolle. Zur [[Beurteilung eines Klassifikators]] können verschiedene [[Kennzahl|Kenngrößen]] ermittelt werden.
== Arten von Klassifikationsverfahren ==


== Arten von Klassifikationsverfahren ==
Da eine streng [[hierarchisch]]e Einteilung von Klassifikationsverfahren kaum möglich ist, lassen sie sich am besten anhand verschiedener Eigenschaften einteilen:
Da eine streng [[hierarchisch]]e Einteilung von Klassifikationsverfahren kaum möglich ist, lassen sie sich am besten anhand verschiedener Eigenschaften einteilen:


* Manuelle und automatische Verfahren
* Manuelle und automatische Verfahren
* Numerische und nicht-numerische Verfahren
* Numerische und nichtnumerische Verfahren
* Statistische und verteilungsfreie Verfahren
* Statistische und verteilungsfreie Verfahren
* Überwachte und nicht-überwachte Verfahren
* Überwachte und nichtüberwachte Verfahren
* Fest dimensionierte und lernende Verfahren
* Fest dimensionierte und lernende Verfahren
* Parametrische und nicht-parametrische Verfahren
* Parametrische und nichtparametrische Verfahren


=== Manuelle und automatische Verfahren ===
=== Manuelle und automatische Verfahren ===
Bei automatischen Verfahren findet die Klassifizierung mittels eines automatischen Prozesses durch [[Software]] statt. Der Prozess der ''maschinellen Klassifikation'' kann als formale Methode des ''Entscheidens in neuen Situationen aufgrund erlernter Strukturen'' bezeichnet werden. Die ''maschinelle Klassifikation'' ist ein Teilgebiet des [[Maschinelles Lernen|maschinellen Lernens]].
''Siehe zum Beispiel'' [[manuelle Indexierung]] und [[automatische Indexierung]].


Genauer ist dies die Erzeugung eines Algorithmus (des lernenden Algorithmus), der –&nbsp;angewandt auf bekannte und schon klassifizierte Fälle (die Datenbasis)&nbsp;– Strukturen berechnet. Diese neu erlernten Strukturen ermöglichen es einem weiteren Algorithmus (dem auswertenden Algorithmus), einen neuen und bisher unbekannten Fall aufgrund der beobachteten Attribute und deren Ausprägungen einer der bekannten Zielklassen zuzuordnen.
Bei automatischen Verfahren findet die Klassizifierung mittels eines automatischen Prozesses durch [[Software]] statt. Der Prozess der ''maschinellen Klassifikation'' kann als formale Methode des ''Entscheidens in neuen Situationen aufgrund erlernter Strukturen'' bezeichnet werden. Die ''maschinelle Klassifikation'' ist ein Teilgebiet des [[Maschinelles Lernen|Maschinellen Lernens]].

Genauer ist dies die Erzeugung eines Algorithmus (der lernende Algorithmus), der - angewandt auf bekannte und schon klassifizierte Fälle (die Datenbasis) - Strukturen berechnet. Diese neu erlernten Strukturen ermöglichen es einem weiteren Algorithmus (der auswertende Algorithmus), einen neuen und bisher unbekannten Fall aufgrund der beobachteten Attribute und deren Ausprägungen einer der bekannten Ziel-Klassen zuzuordnen.


=== Statistische und verteilungsfreie Verfahren ===
=== Statistische und verteilungsfreie Verfahren ===
Statistische Verfahren basieren auf Dichteberechnungen und Wahrscheinlichkeiten, während sich bei verteilungsfreien Verfahren klare [[Trennfläche]]n angeben lassen.
Statistische Verfahren basieren auf Dichteberechnungen und Wahrscheinlichkeiten, während [[Parameterfreie Statistik|verteilungsfreie]] Verfahren klare Trennflächen zur Trennung der Klassen benutzen. Die Grenzen zwischen den einzelnen Klassen im [[Merkmalsraum]] können durch eine [[Diskriminanzfunktion]]en angegeben werden.

Beispiele für statistische Verfahren sind der [[Bayes-Klassifikator]], der [[Fuzzy-Klassifikation|Fuzzy-Pattern-Klassifikator]] und der [[Kerndichteschätzer]]. Die Berechnung von Trennflächen ist durch sogenannte [[Support-Vector-Maschine]]n möglich.


=== Überwachte und nicht überwachte Verfahren ===
=== Überwachte und nicht überwachte Verfahren ===
Das Erzeugen von Strukturen aus vorhandenen Daten wird auch als [[Mustererkennung]], Diskriminierung oder [[überwachtes Lernen]] bezeichnet. Dabei werden Klasseneinteilungen vorgegeben (dies kann auch durch Stichproben geschehen). Im Gegensatz dazu existiert [[unüberwachtes Lernen|nichtüberwachtes Lernen]], bei dem die Klassen der Daten nicht vorgegeben sind, sondern auch diese erlernt werden müssen. Dabei können allerdings beim [[reinforcement learning]] Informationen hinzukommen, ob eine Klasseneinteilung richtig oder falsch war. Ein Beispiel für unüberwachte Verfahren ist die [[Clusteranalyse]].
Das Erzeugen von Strukturen aus vorhandenen Daten wird auch als [[Mustererkennung]], Diskriminierung oder [[überwachtes Lernen]] bezeichnet. Dabei werden Klasseneinteilungen vorgegeben, was auch durch Stichproben geschehen kann. Im Gegensatz dazu existiert [[Unüberwachtes Lernen|nichtüberwachtes Lernen]], bei dem die Klassen der Daten nicht vorgegeben sind, sondern auch diese erlernt werden müssen. Dabei können allerdings beim [[Bestärkendes Lernen|bestärkenden Lernen]] ({{enS|reinforcement learning}}) Informationen darüber hinzukommen, ob eine Klasseneinteilung richtig oder falsch war. Ein Beispiel für unüberwachte Verfahren ist die [[Clusteranalyse]].


=== Parametrische und nicht-parametrische Verfahren ===
=== Parametrische und nichtparametrische Verfahren ===
Parametrische Verfahren beruhen auf parametrischen [[Wahrscheinlichkeitsdichte]]n, während bei nicht-parametrischen Verfahren (z.B. [[Nächster Nachbar Klassifikator]]) die Dichten meist aus einer Stichprobe geschätzt werden.
Parametrische Verfahren beruhen auf parametrischen [[Wahrscheinlichkeitsdichte]]n, während [[Parameterfreie Statistik|nichtparametrische]] Verfahren (z.&nbsp;B. [[Nächste-Nachbarn-Klassifikation]]) auf lokalen Dichteberechnungen basieren.


== Beispiele ==
== Beispiele ==
* [[Quader-Klassifikator]]
* [[Quader-Klassifikator]]
* [[Abstandsklassifikator]]
* [[Abstandsklassifikator]]
* [[Nächste-Nachbarn-Klassifikation]]
* [[Bayes-Klassifikator]]
* [[Polynomklassifikator]]
* [[Nächster Nachbar Klassifikator]]
* [[Fuzzy-Klassifikator]]
* [[Clusterverfahren]]
* [[Clusterverfahren]]
* [[Künstliches neuronales Netz]]
* [[Künstliches neuronales Netz]]
* [[Latente Klassenanalyse]]
* [[Support-Vector-Maschine|Support-Vector-Maschinen]]
* [[Entscheidungsbaum]]


== Siehe auch ==
Falls die Grenzen zwischen den einzelnen Klassen im Merkmalsraum bekannt sind, lassen sie sich durch eine [[Diskriminanzfunktion]] angeben.
* [[Kostenmatrix]]
* [[Hauptkomponentenanalyse]]
* [[Mahalanobis-Abstand]]
* [[Sacherschließung]]
* [[Merkmalsvektor]]
* [[Musteranalyse]]


== Literatur ==
''Siehe auch:'' [[Kostenmatrix]], [[Karhunen-Loève-Transformation]], [[Mahalanobis-Abstand]], [[Sacherschließung]]
* O. Oberhauser: ''Automatisches Klassifizieren. Entwicklungsstand – Methodik – Anwendungsbereiche.'' Peter Lang, Frankfurt/Main u. a. 2005. ISBN 3-631-53684-4.
* [[Andrew R. Webb]]: ''Statistical [[Mustererkennung|Pattern Recognition]].'' John Wiley & Sons, 2. Aufl., Juli 2002.
* [[Richard O. Duda]], P. E. Hart, D. G. Stork: ''Pattern Classification.'' John Wiley & Sons, 2. Aufl., 2000.
* C. M. Bishop: ''[[Künstliches neuronales Netz|Neural Networks]] for Pattern Recognition.'' Oxford University Press, 1996.
* D. Michie, D. J. Spiegelhalter, C. C. Taylor (Hrsg.): ''[[Machine Learning]], neural and statistical Classification.'' Elis Horwood, 1994.


== Einzelnachweise ==
== [[Sprachwissenschaft|Linguistik]] ==
<references />
Klassifikatoren gibt es auch in einigen [[Sprache]]n wie [[Thailändische Sprache|Thai]] oder [[Japanische Sprache|Japanisch]]. Dort müssen sie gemeinsam mit [[Zahl]]en auftauchen, um ein [[Zahlwort]] zu bilden und Mengen anzugeben. Genaueres siehe [[Zähleinheitspartikel]].

== Literatur ==
* O. Oberhauser: ''Automatisches Klassifizieren: Entwicklungsstand – Methodik – Anwendungsbereiche''. Frankfurt/Main [u.a.]: Peter Lang. ISBN 3-631-53684-4.
* A. R. Webb: ''Statistical Pattern Recognition''. John Wiley & Sons, 2 ed., Jul. 2002
* R. O. Duda, P. E. Hart, and D. G. Stork: ''Pattern Classification (2nd Edition)''. John Wiley & Sons, 2. ed., 2000
* C. M. Bishop: ''Neural Networks for Pattern Recognition''. Oxford University Press, 1996
* D. Michie, D. J. Spiegelhalter, C. C. Taylor (Ed.): ''Machine Learning, neural and statistical Classification''. Elis Horwood 1994


[[Kategorie:Klassifikation]]
[[Kategorie:Klassifikationsverfahren| ]]
[[Kategorie:Künstliche Intelligenz]]

Aktuelle Version vom 3. Februar 2023, 19:55 Uhr

Klassifikationsverfahren, auch Klassifizierungsverfahren, sind Methoden und Kriterien zur Einteilung (Klassierung) von Objekten oder Situationen in Klassen, das heißt zur Klassifizierung. Ein solches Verfahren wird auch als Klassifikator bezeichnet. Viele Verfahren lassen sich als Algorithmus implementieren; man spricht dabei auch von maschineller oder automatischer Klassifikation. Klassifikationsverfahren sind immer anwendungsbezogen, sodass viele verschiedene Methoden existieren.

Im engen Sinne stehen im Gegensatz zu den Klassifikationsverfahren die Klassierungsverfahren, die dem Einordnen von Objekten in bereits existierende Klassen dienen. Umgangssprachlich wird jedoch zwischen klassifizieren und klassieren kein Unterschied gemacht.[1]

Klassifikationsverfahren spielen unter anderem bei der Mustererkennung, in der künstlichen Intelligenz, in der Dokumentationswissenschaft und im Information Retrieval eine Rolle. Zur Beurteilung eines Klassifikators können verschiedene Kenngrößen ermittelt werden.

Arten von Klassifikationsverfahren

[Bearbeiten | Quelltext bearbeiten]

Da eine streng hierarchische Einteilung von Klassifikationsverfahren kaum möglich ist, lassen sie sich am besten anhand verschiedener Eigenschaften einteilen:

  • Manuelle und automatische Verfahren
  • Numerische und nichtnumerische Verfahren
  • Statistische und verteilungsfreie Verfahren
  • Überwachte und nichtüberwachte Verfahren
  • Fest dimensionierte und lernende Verfahren
  • Parametrische und nichtparametrische Verfahren

Manuelle und automatische Verfahren

[Bearbeiten | Quelltext bearbeiten]

Bei automatischen Verfahren findet die Klassifizierung mittels eines automatischen Prozesses durch Software statt. Der Prozess der maschinellen Klassifikation kann als formale Methode des Entscheidens in neuen Situationen aufgrund erlernter Strukturen bezeichnet werden. Die maschinelle Klassifikation ist ein Teilgebiet des maschinellen Lernens.

Genauer ist dies die Erzeugung eines Algorithmus (des lernenden Algorithmus), der – angewandt auf bekannte und schon klassifizierte Fälle (die Datenbasis) – Strukturen berechnet. Diese neu erlernten Strukturen ermöglichen es einem weiteren Algorithmus (dem auswertenden Algorithmus), einen neuen und bisher unbekannten Fall aufgrund der beobachteten Attribute und deren Ausprägungen einer der bekannten Zielklassen zuzuordnen.

Statistische und verteilungsfreie Verfahren

[Bearbeiten | Quelltext bearbeiten]

Statistische Verfahren basieren auf Dichteberechnungen und Wahrscheinlichkeiten, während verteilungsfreie Verfahren klare Trennflächen zur Trennung der Klassen benutzen. Die Grenzen zwischen den einzelnen Klassen im Merkmalsraum können durch eine Diskriminanzfunktionen angegeben werden.

Beispiele für statistische Verfahren sind der Bayes-Klassifikator, der Fuzzy-Pattern-Klassifikator und der Kerndichteschätzer. Die Berechnung von Trennflächen ist durch sogenannte Support-Vector-Maschinen möglich.

Überwachte und nicht überwachte Verfahren

[Bearbeiten | Quelltext bearbeiten]

Das Erzeugen von Strukturen aus vorhandenen Daten wird auch als Mustererkennung, Diskriminierung oder überwachtes Lernen bezeichnet. Dabei werden Klasseneinteilungen vorgegeben, was auch durch Stichproben geschehen kann. Im Gegensatz dazu existiert nichtüberwachtes Lernen, bei dem die Klassen der Daten nicht vorgegeben sind, sondern auch diese erlernt werden müssen. Dabei können allerdings beim bestärkenden Lernen (englisch reinforcement learning) Informationen darüber hinzukommen, ob eine Klasseneinteilung richtig oder falsch war. Ein Beispiel für unüberwachte Verfahren ist die Clusteranalyse.

Parametrische und nichtparametrische Verfahren

[Bearbeiten | Quelltext bearbeiten]

Parametrische Verfahren beruhen auf parametrischen Wahrscheinlichkeitsdichten, während nichtparametrische Verfahren (z. B. Nächste-Nachbarn-Klassifikation) auf lokalen Dichteberechnungen basieren.

  • O. Oberhauser: Automatisches Klassifizieren. Entwicklungsstand – Methodik – Anwendungsbereiche. Peter Lang, Frankfurt/Main u. a. 2005. ISBN 3-631-53684-4.
  • Andrew R. Webb: Statistical Pattern Recognition. John Wiley & Sons, 2. Aufl., Juli 2002.
  • Richard O. Duda, P. E. Hart, D. G. Stork: Pattern Classification. John Wiley & Sons, 2. Aufl., 2000.
  • C. M. Bishop: Neural Networks for Pattern Recognition. Oxford University Press, 1996.
  • D. Michie, D. J. Spiegelhalter, C. C. Taylor (Hrsg.): Machine Learning, neural and statistical Classification. Elis Horwood, 1994.

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. Hardwin Jungclaussen: Kausale Informatik. Einführung in die Lehre vom aktiven sprachlichen Modellieren durch Mensch und Computer. Springer Fachmedien Wiesbaden, 2013, ISBN 978-3-322-81220-9, S. 57.