Klassifikation und Clusteranalyse
(= Multivariate Statistik II)
Inhalt:
Die Vorlesung behandelt die mathematische und statistische Theorie von
Klassifikation, Diskrimination und Clusteranalyse, die in der Praxis unter
Schlagwörtern wie 'Mustererkennung', 'automatische Diagnose', 'numerische
Taxonomie', 'pattern recognition', 'Typologie', 'Lernen mit und ohne Lehrer'
vielfache Anwendung finden (u.a. auch im Information Retrieval). Grundsätzlich
betrachtet man dabei eine Menge von ''Objekten'', die zu verschiedenen
Klassen, Gruppen, Typen, Populationen o.ä. gehören, und es geht
typischerweise darum, anhand von Daten solche homogenen Klassen ähnlicher
Objekte zu rekonstruieren (Clusteranalyse) oder die Objekte aufgrund von
Merkmalsvektoren ihrer zugehörigen Klasse zuzuordnen (Diskrimination).
Gliederung:
- Problemstellung und Beispiele
- Multivariate Verteilungen
- Mehrentscheidungsprobleme
- Lineare und nichtlineare Diskrimination
- Bestimmung und Schätzung der Fehlerwahrscheinlichkeiten
- Optimale Diskriminatoren Lernprozesse und Trainingsstichproben
- ähnlichkeits- und Distanzmaße
- Probabilistische Clustermodelle
- Clusterkriterien
- Optimale Partitionen
- Clusteralgorithmen
- Analyse von Verteilungsmischungen
- Hierarchische Klassifikation und Dendrogramme
- Ultrametriken
- Pseudohierarchien.
Literatur:
- BOCK, H.H.: Automatische Klassifikation. Vandenhoeck & Ruprecht,
Göttingen, 1974.
- FUKUNAGA, K.: Introduction to statistical pattern recognition. Acad.
Press, New York, 1978.
- HAND, D.J.: Discrimination and classification. Wiley, New York, 1986.
- NIEMANN, H.: Klassifikation von Mustern. Springer, Heidelberg, 1983.
- SEBER, G.A.F.: Multivariate observations. Wiley, New York, 1984.
Voraussetzungen: Grundkenntnisse in Stochastik/Statistik, teils
auch in multivariater Statistik.
Zurück
zur Lehrveranstaltungsseite