KOPS - Das Institutionelle Repositorium der Universität Konstanz

Aktives Lernen zur Klassifikation großer Datenmengen mittels Exploration und Spezialisierung

Aktives Lernen zur Klassifikation großer Datenmengen mittels Exploration und Spezialisierung

Zitieren

Dateien zu dieser Ressource

Prüfsumme: MD5:cb466459be71c2572cb8fa42d5e82311

CEBRON, Nicolas, 2008. Aktives Lernen zur Klassifikation großer Datenmengen mittels Exploration und Spezialisierung

@phdthesis{Cebron2008Aktiv-5461, title={Aktives Lernen zur Klassifikation großer Datenmengen mittels Exploration und Spezialisierung}, year={2008}, author={Cebron, Nicolas}, address={Konstanz}, school={Universität Konstanz} }

Aktives Lernen zur Klassifikation großer Datenmengen mittels Exploration und Spezialisierung 2011-03-24T15:55:36Z 2008 Das Paradigma des Aktiven Lernens wird häufig in praktischen Anwendungsszenarien angewendet, um große Datenmengen mit Hilfe eines menschlichen Experten zu klassifizieren. Durch eine gezielte Auswahl soll die Anzahl der Muster reduziert werden, die vom Experten klassifiziert werden müssen um ein stabiles Klassifikationsmodell zu lernen. Bei bisherigen Ansätzen im Bereich des Aktiven Lernens wird oft angenommen, dass ein stabiles Klassifikationsmodell bereits mit zufällig gezogenen Mustern gelernt wurde, welches mit ausgesuchten Beispielen verfeinert werden soll. In dieser Arbeit werden zwei Ansätze zum Aktiven Lernen vorgestellt, die vom ersten Beispiel an versuchen eine sinnvolle Auswahl aus den Daten zu treffen. Zunächst wird bei der Selektion von Mustern der Aspekt der Exploration betont. Nachdem ein stabiles Klassifikationsmodell gelernt wurde, konzentriert sich die Selektionsstrategie auf die Klassengrenzen.<br />Das erste Verfahren der "Aktiven Lernenden Vektor Quantisierung" exploriert den Datensatz mittels eines Fuzzy c-means Clusterings. Anschließend werden die vom Experten klassifizierten Cluster mit ausgesuchten Beispielen an den Klassifikationsgrenzen angepasst.<br />Das zweite Verfahren der "Aktiven Prototypen basierten Klassifikation" generiert in jeder Lerniteration einen Prototypen für eine k-nächste Nachbarn Klassifikation. Dieser Ansatz kombiniert die Aspekte der Exploration und der Verfeinerung der Klassengrenzen mittels einer neu entwickelten Unsicherheitsverteilung miteinander. Dabei findet mit zunehmender Anzahl von klassifizierten Mustern ein fließender Übergang zwischen Exploration und Verfeinerung der Klassengrenzen statt.<br />Anhand der spezifischen Anwendung der Verfahren für die Klassifikation von Zellbildern durch einen Biologen wird der praktische Nutzen aufgezeigt. Die beiden Ansätzen zugrunde liegende Strategie, die Daten zunächst zu explorieren und anschließend das Klassifikationsmodell zu verfeinern stellt sich als vorteilhat für die Performanz und Stabilität gegenüber bisher entwickelten aktiven Lernverfahren heraus. Active learning for classification of large datasets using exploration and exploitation Cebron, Nicolas 2011-03-24T15:55:36Z Cebron, Nicolas application/pdf deu deposit-license

Dateiabrufe seit 01.10.2014 (Informationen über die Zugriffsstatistik)

Diss_NCebron.pdf 226

Das Dokument erscheint in:

KOPS Suche


Stöbern

Mein Benutzerkonto