Klassifikation und Clusteranalyse

(= Multivariate Statistik II)

Inhalt:

Die Vorlesung behandelt die mathematische und statistische Theorie von Klassifikation, Diskrimination und Clusteranalyse, die in der Praxis unter Schlagwörtern wie 'Mustererkennung', 'automatische Diagnose', 'numerische Taxonomie', 'pattern recognition', 'Typologie', 'Lernen mit und ohne Lehrer' vielfache Anwendung finden (u.a. auch im Information Retrieval). Grundsätzlich betrachtet man dabei eine Menge von ''Objekten'', die zu verschiedenen Klassen, Gruppen, Typen, Populationen o.ä. gehören, und es geht typischerweise darum, anhand von Daten solche homogenen Klassen ähnlicher Objekte zu rekonstruieren (Clusteranalyse) oder die Objekte aufgrund von Merkmalsvektoren ihrer zugehörigen Klasse zuzuordnen (Diskrimination).

Gliederung:

Problemstellung und Beispiele
Multivariate Verteilungen
Mehrentscheidungsprobleme
Lineare und nichtlineare Diskrimination
Bestimmung und Schätzung der Fehlerwahrscheinlichkeiten
Optimale Diskriminatoren Lernprozesse und Trainingsstichproben
ähnlichkeits- und Distanzmaße
Probabilistische Clustermodelle
Clusterkriterien
Optimale Partitionen
Clusteralgorithmen
Analyse von Verteilungsmischungen
Hierarchische Klassifikation und Dendrogramme
Ultrametriken
Pseudohierarchien.

Literatur:

BOCK, H.H.: Automatische Klassifikation. Vandenhoeck & Ruprecht, Göttingen, 1974.
FUKUNAGA, K.: Introduction to statistical pattern recognition. Acad. Press, New York, 1978.
HAND, D.J.: Discrimination and classification. Wiley, New York, 1986.
NIEMANN, H.: Klassifikation von Mustern. Springer, Heidelberg, 1983.
SEBER, G.A.F.: Multivariate observations. Wiley, New York, 1984.

Voraussetzungen: Grundkenntnisse in Stochastik/Statistik, teils auch in multivariater Statistik.

Zurück zur Lehrveranstaltungsseite