Publikation: Lernen in Parallelen Universen
Dateien
Datum
Autor:innen
Herausgeber:innen
ISSN der Zeitschrift
Electronic ISSN
ISBN
Bibliografische Daten
Verlag
Schriftenreihe
Auflagebezeichnung
URI (zitierfähiger Link)
Internationale Patentnummer
Link zur Lizenz
Angaben zur Forschungsförderung
Projekt
Open Access-Veröffentlichung
Core Facility der Universität Konstanz
Titel in einer weiteren Sprache
Publikationstyp
Publikationsstatus
Erschienen in
Zusammenfassung
Klassische Data Mining Verfahren beruhen praktisch immer auf einer eindeutigen Objektdarstellung, häufig in Form eines hochdimensionalen Attributvektors pro Objekt. In vielen Anwendungsbereichen zeigt sich jedoch, dass die zu analysierenden Objekte (Moleküle, 3D Modelle, Prozesse) auf vielfältige Weise beschrieben werden können, was zu einer Vielzahl von Darstellungsräumen, so genannten Parallelen Universen, führt.<br />
Im Rahmen dieser Arbeit wird das Lernen in Parallelen Universen als neues Lernkonzept vorgestellt, das die simultane Analyse der verschiedenen Universen umfasst. Ziel ist die Erzeugung eines verständlichen Modells, das interessante Strukturen in den Daten, verteilt auf verschiedene Universen darstellt. Das gefundene Modell besteht also aus Teilmodellen, die in jeweils unterschiedlichen Universen gültig sind und zusammen die den gesamten Objekten zugrunde liegende Struktur beschreiben. Dazu werden zwei Verfahren, die dieses neue Lernkonzept umsetzen, neu entwickelt und untersucht. Das erste Verfahren dient zur Lösung überwachter Lernprobleme. Es beruht auf der Erstellung lokaler Nachbarschaftsdiagramme, kurz Neighborgramme, für die Objekte einer oder mehrerer Zielklassen in allen Universen. Beruhend auf Kennwerten wie z. B. der Klassenverteilung oder -dichte in diesen Diagrammen werden so Neighborgramme aus unterschiedlichen Universen ausgewählt, um ein Klassifikationsmodell zu erstellen. Von praktischem Interesse ist dabei auch die Neighborgram-Visualisierung, die zum einen den Vergleich der Nachbarschaftsbeziehung in den Universen ermöglicht und zum anderen eine interaktive Modellerstellung erlaubt. Das zweite Verfahren beschreibt eine Erweiterung verschiedener unüberwachter unscharfer Clusterverfahren. Die Kernidee dabei ist die Modellierung der Zugehörigkeit zu Parallelen Universen durch neue Variablen in den klassischen Zielfunktionen, wobei die Optimierung dann auch in Bezug auf diese neuen Variablen stattfinden. Die Ausgabe der vorgestellten Verfahren beinhaltet u. a. die Clusterprototypen sowie Zugehörigkeitswerte der Cluster (bzw. oder der Objekte) zu Universen, so dass für jeden Cluster oder für jedes Objekt eine partielle Zuordnung zu den individuellen Universen vorgenommen werden kann.<br />
Die beschriebenen Verfahren werden auf verschiedenen Datensätzen evaluiert. Diese<br />
umfassen einen molekularen Datensatz, bei dem basierend auf vier Universen die Aktivität von Molekülen vorherzusagen ist, sowie einen Datensatz von 3D Objekten, die in<br />
16 Universen beschrieben sind.
Zusammenfassung in einer weiteren Sprache
Classical data mining techniques are almost always based on a unique object representation, which is often realized as a high-dimensional attribute vector per object. In many application domains, however, the objects to be analyzed (molecules, 3D models, processes) can be described easily in various ways, which leads to a variety of object representations: so called Parallel Universes. <br />
This thesis introduces Learning in Parallel Universes as a novel learning concept, which encompasses the simultaneous analysis of the various universes. The learning objective is the generation of an interpretable model, comprising interesting patterns in the data, potentially distributed among the available universes. The model consists of partial models, whereby each model respectively applies to a subset of the universes. When combined they altogether explain the nature of the underlying objects. Two novel techniques, which implement this new learning concept, are introduced and examined. The first technique solves supervised learning problems. It is based on<br />
the construction of local neighborhood diagrams, called Neighborgrams, for objects belonging to one or more target classes in all universes. Depending on characteristic values such as class distribution or the class density of such diagrams, neighborgrams from different universes are selected to build a classification model. Furthermore, the neighborgram visualization is of high practical interest as it allows for a visual comparison of neighborhood relationships and at the same time enables an interactive model construction.<br />
The second technique comprises an extension of different unsupervised fuzzy clustering methods. The basic idea is the extension of the classical objective function by membership values that encode memberships to Parallel Universes, whereby optimization is also carried out with respect to the newly introduced membership values. The output of these methods includes, for example, cluster prototypes as well as membership values for clusters (or objects) to universes, which allow a partial assignment of clusters or objects to individual universes.<br />
The methods are demonstrated and evaluated on different data sets, among others on a molecular data set described in four universes and a 3D model data set in 16 universes.
Fachgebiet (DDC)
Schlagwörter
Konferenz
Rezension
Zitieren
ISO 690
WISWEDEL, Bernd, 2008. Lernen in Parallelen Universen [Dissertation]. Konstanz: University of KonstanzBibTex
@phdthesis{Wiswedel2008Lerne-5755, year={2008}, title={Lernen in Parallelen Universen}, author={Wiswedel, Bernd}, address={Konstanz}, school={Universität Konstanz} }
RDF
<rdf:RDF xmlns:dcterms="http://purl.org/dc/terms/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:bibo="http://purl.org/ontology/bibo/" xmlns:dspace="http://digital-repositories.org/ontologies/dspace/0.1.0#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:void="http://rdfs.org/ns/void#" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" > <rdf:Description rdf:about="https://kops.uni-konstanz.de/server/rdf/resource/123456789/5755"> <dcterms:available rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-24T15:59:50Z</dcterms:available> <dc:contributor>Wiswedel, Bernd</dc:contributor> <dcterms:hasPart rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/5755/1/Diss_Wiswedel.pdf"/> <dspace:hasBitstream rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/5755/1/Diss_Wiswedel.pdf"/> <void:sparqlEndpoint rdf:resource="http://localhost/fuseki/dspace/sparql"/> <dcterms:abstract xml:lang="deu">Klassische Data Mining Verfahren beruhen praktisch immer auf einer eindeutigen Objektdarstellung, häufig in Form eines hochdimensionalen Attributvektors pro Objekt. In vielen Anwendungsbereichen zeigt sich jedoch, dass die zu analysierenden Objekte (Moleküle, 3D Modelle, Prozesse) auf vielfältige Weise beschrieben werden können, was zu einer Vielzahl von Darstellungsräumen, so genannten Parallelen Universen, führt.&lt;br /&gt;<br /><br /><br />Im Rahmen dieser Arbeit wird das Lernen in Parallelen Universen als neues Lernkonzept vorgestellt, das die simultane Analyse der verschiedenen Universen umfasst. Ziel ist die Erzeugung eines verständlichen Modells, das interessante Strukturen in den Daten, verteilt auf verschiedene Universen darstellt. Das gefundene Modell besteht also aus Teilmodellen, die in jeweils unterschiedlichen Universen gültig sind und zusammen die den gesamten Objekten zugrunde liegende Struktur beschreiben. Dazu werden zwei Verfahren, die dieses neue Lernkonzept umsetzen, neu entwickelt und untersucht. Das erste Verfahren dient zur Lösung überwachter Lernprobleme. Es beruht auf der Erstellung lokaler Nachbarschaftsdiagramme, kurz Neighborgramme, für die Objekte einer oder mehrerer Zielklassen in allen Universen. Beruhend auf Kennwerten wie z. B. der Klassenverteilung oder -dichte in diesen Diagrammen werden so Neighborgramme aus unterschiedlichen Universen ausgewählt, um ein Klassifikationsmodell zu erstellen. Von praktischem Interesse ist dabei auch die Neighborgram-Visualisierung, die zum einen den Vergleich der Nachbarschaftsbeziehung in den Universen ermöglicht und zum anderen eine interaktive Modellerstellung erlaubt. Das zweite Verfahren beschreibt eine Erweiterung verschiedener unüberwachter unscharfer Clusterverfahren. Die Kernidee dabei ist die Modellierung der Zugehörigkeit zu Parallelen Universen durch neue Variablen in den klassischen Zielfunktionen, wobei die Optimierung dann auch in Bezug auf diese neuen Variablen stattfinden. Die Ausgabe der vorgestellten Verfahren beinhaltet u. a. die Clusterprototypen sowie Zugehörigkeitswerte der Cluster (bzw. oder der Objekte) zu Universen, so dass für jeden Cluster oder für jedes Objekt eine partielle Zuordnung zu den individuellen Universen vorgenommen werden kann.&lt;br /&gt;<br /><br /><br />Die beschriebenen Verfahren werden auf verschiedenen Datensätzen evaluiert. Diese&lt;br /&gt;<br /><br /><br />umfassen einen molekularen Datensatz, bei dem basierend auf vier Universen die Aktivität von Molekülen vorherzusagen ist, sowie einen Datensatz von 3D Objekten, die in&lt;br /&gt;<br /><br /><br />16 Universen beschrieben sind.</dcterms:abstract> <bibo:uri rdf:resource="http://kops.uni-konstanz.de/handle/123456789/5755"/> <dcterms:isPartOf rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/> <dcterms:alternative>Learning in Parallel Universes</dcterms:alternative> <dcterms:rights rdf:resource="http://creativecommons.org/licenses/by-nc-nd/2.0/"/> <dc:format>application/pdf</dc:format> <dcterms:issued>2008</dcterms:issued> <dcterms:title>Lernen in Parallelen Universen</dcterms:title> <dc:creator>Wiswedel, Bernd</dc:creator> <foaf:homepage rdf:resource="http://localhost:8080/"/> <dc:rights>Attribution-NonCommercial-NoDerivs 2.0 Generic</dc:rights> <dc:date rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-24T15:59:50Z</dc:date> <dc:language>deu</dc:language> <dspace:isPartOfCollection rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/> </rdf:Description> </rdf:RDF>