Konzepterkennung in Informationsnetzwerken

Thumbnail Image
Date
2012
Editors
Contact
Journal ISSN
Electronic ISSN
ISBN
Bibliographical data
Publisher
Series
URI (citable link)
DOI (citable link)
ArXiv-ID
International patent number
Link to the license
EU project number
Project
BISON, RTD Forschungsprojekt
Open Access publication
Restricted until
Title in another language
Concept Detection in Information Networks
Research Projects
Organizational Units
Journal Issue
Publication type
Dissertation
Publication status
Published in
Abstract
Konzepte spielen in unserem täglichen Leben eine wichtige Rolle, wenn auch nur unbewusst.

So gruppieren Konzepte Objekte mit gemeinsamen Eigenschaften und ermöglichen uns das Abstrahieren und Kommunizieren von bestehendem Wissen sowie die Verarbeitung der pausenlos auf uns einströmenden Flut von Informationen.

Dabei agiert ein Konzept als Repräsentant seiner Mitglieder und ihrer gemeinsamen Eigenschaften.

Wenn wir an das Konzept der Transportmittel denken, fallen uns spontan einige Mitglieder und ihre Eigenschaften ein, die diese als Transportmittel auszeichnen.

Eine weitere Besonderheit der Konzepte ist, dass ein Objekt Mitglied in scheinbar unabhängigen Konzepten sein kann.

So gilt ein Auto sowohl als Transportmittel als auch als Luxusgegenstand.



Der in dieser Arbeit beschriebene Ansatz macht sich diese Leistungsfähigkeit und Flexibilität von Konzepten zunutze, um das kreative Denken zu fördern.

So ermöglicht der Ansatz das Finden von existierenden sowie unbekannten Konzepten in heterogenen Daten, welche das Verständnis für komplexe Systeme fördern sowie interessante und unerwartete Zusammenhänge aufdecken.



Da bei der Suche nach unerwarteten Zusammenhängen nicht von Anfang an feststeht, wonach man eigentlich sucht, sollte bei der Integration der zur Verfügung stehenden Daten möglichst keine Information verloren gehen.

Daher basiert der beschriebene Ansatz auf Informationsnetzwerken, welche dank ihrer flexiblen Datenstruktur die Integration von Daten unterschiedlichster Beschaffenheit und Qualität unterstützen.

So speichern Informationsnetzwerke die Informationen in Form von Beziehungen zwischen Objekten in einer Graphstruktur, wobei Objekte als Knoten und ihre Beziehungen als Kanten im Graphen repräsentiert werden.



Basierend auf dieser Datenrepräsentation beruht der beschriebene Ansatz auf der Annahme, dass Objekte durch ihre direkten Nachbarn im Netzwerk beschrieben werden.

Somit bilden ähnliche Objekte und ihre gemeinsamen Nachbarn einen quasi bipartiten Graphen.

Dieser aus den beiden Knotenpartitionen und ihren Verbindungen bestehende Teilgraph bildet die Basis des beschriebenen Ansatzes, den sogenannten Konzeptgraphen.

Die Güte der Verbindungen zwischen den beiden Knotenpartitionen wird mithilfe einer Gütefunktion bestimmt, welche das Fehlen einzelner Verbindungen bestraft.

Daher sollten sich die ähnlichen Objekte möglichst viele Nachbarn teilen.

Einen Spezialfall stellen dabei die vollständigen Konzeptgraphen dar, deren Knotenpartitionen vollständig verbunden sind.



Zum Klassifizieren der Knoten eines Konzeptgraphen werden ferner Heuristiken basierend auf der Graphstruktur vorgestellt, welche die Identifizierung der Mitglieder und Eigenschaften eines Konzeptes sowie des Konzeptrepräsentanten ermöglichen.

Dabei ist der Typ eines Knotens kontextabhängig und kann so in unterschiedlichen Konzeptgraphen variieren.

Die Heuristik zur Bestimmung des Konzeptrepräsentanten liefert darüber hinaus ein Maß für dessen Güte, welches zum Auffinden eines fehlenden Repräsentanten verwendet werden kann.

Ein fehlender Konzeptrepräsentant kann dabei ein Anzeichen für unvollständige und verrauschte Daten sein.

Er kann aber auch ein Hinweis auf eine Gruppe von Objekten mit gemeinsamen Eigenschaften sein, die bisher noch nicht entdeckt wurden und daher noch keinen Konzeptrepräsentanten besitzen.



Neben der Formalisierung von Konzeptgraphen werden Verfahren zum Finden von vollständigen Konzeptgraphen sowie Ansätze zum Finden von allgemeinen Konzeptgraphen beschrieben.

Die beschriebenen Verfahren und Ansätze basieren auf existierenden Verfahren zum Finden von Frequent Item Sets, welche sich durch die Konvertierung des Graphen in eine Transaktionsliste anwenden lassen.



Fallstudien demonstrieren schließlich die Existenz sowie die Flexibilität und Vielfältigkeit von Konzeptgraphen anhand von zwei unterschiedlichen Datensätzen aus der realen Welt.

So basiert der erste Datensatz auf einer Enzyklopädie mit Artikeln aus unterschiedlichen Wissensgebieten.

Der zweite Datensatz basiert hingegen auf strukturierten sowie unstrukturierten Informationen über Medikamente.



In beiden Datensätzen werden sinnvolle Konzeptgraphen mithilfe des beschriebenen Verfahrens zum Finden von vollständigen Konzeptgraphen gefunden und ihre Knoten unter Verwendung der vorgestellten Heuristiken in die unterschiedlichen Typen eingeteilt.

Basierend auf dem Gütewert für den Konzeptrepräsentanten werden ferner Konzeptgraphen ohne sinnvollen Repräsentanten identifiziert, welche unbekannte Zusammenhänge aufdecken.

Überlappende Konzeptgraphen demonstrieren schließlich die volle Flexibilität und Vielfältigkeit von Konzeptgraphen.

So können die Überlappungen sowohl zum Identifizieren von Hierarchien verwendet werden als auch zu einem besseren Verständnis komplexer Zusammenhänge führen.

Darüber hinaus ermöglichen sie auch das Auffinden fehlender Verbindungen, die zu neuen Erkenntnissen führen.



Durch die Verwendung von Informationsnetzwerken als Eingabedaten und dem Auffinden von existierenden sowie unbekannten Konzepten unterstützt das in dieser Arbeit vorgestellte Verfahren das kreative Denken, indem es sowohl das Verständnis komplexer Systeme fördert als auch interessante und unerwartete Zusammenhänge aufdeckt.
Summary in another language
Concepts play an important, even though unconscious, role in our daily lives.

They group objects with common properties and enable us to abstract and communicate existing knowledge and process the daily flood of information.

In this process, a concept represents its members and their common properties.

When we think of the concept of transportation, for example, a number of members and their properties come to mind, which distinguish them from objects that do not belong to the transportation concept.

Another feature of concepts is that an object can be a member of seemingly unrelated concepts.

A car, for example, can belong to the concept of transportation as well as the concept of luxury items.



The approach described in this paper utilizes the power and flexibility of concepts in order to support creative thinking.

By extracting existing as well as unknown concepts from heterogeneous data, the discussed approach advances the comprehension of complex systems and the discovery of interesting as well as unexpected connections.



When searching for unexpected connections, people are often unsure of the precise nature of what they are looking for.
It is therefore essential to ensure that no information gets lost during the data integration process.

For this reason, the proposed approach is based on information networks, which - thanks to their flexible structure - support the integration of data of varied structures and quality.

In the process, information networks store information in a graph structure as relations between units of information.
These units are represented by vertices and the relations between them are exemplified by the edges.



Based on this data representation the described approach builds on the assumption that units of information are described by their direct neighbours in the network.

Similar objects and their common properties therefore form a quasi-bipartite graph.

This subgraph, consisting of two distinct vertex sets and their connections, establishes the foundation of the described approach - the so-called concept graph.

The quality of the connections between the two vertex partitions is determined by a quality function, whereby missing connections between the two vertex sets are penalized.

Therefore, similar objects should share as many common neighbours as possible.

Perfect concept graphs are a special case that consist of two fully connected vertex partitions.



To classify the vertices of a concept graph into aspects and members, heuristics are discussed, based on the neighbourhood of a vertex.

The type of a node depends on the context, therefore the type of the same node can vary in different concept graphs.

The heuristic also identifies a concept representative and a measure of its quality, which can be used to identify missing representatives.

On the one hand, such a missing concept representative can be a sign of incomplete or noisy data, and on the other, an indication of a yet undiscovered relation among information units, and therefore not yet part of a concept.



In addition to formalising concept graphs, methods for finding perfect concept graphs and approaches to detect concept graphs in general are also discussed.

The described methods and approaches are based on existing algorithms to detect frequent item sets, which can be applied to the problem at hand by converting the graph into a transaction list.



Finally, case studies demonstrate the existence and flexibility as well as the diversity of concept graphs in reference to two different real world data sets.

The first data set is based on an encyclopaedia consisting of articles from different fields of knowledge, and the second data set concerns structured and unstructured information about drugs.



Meaningful concepts graphs are extracted from both data sets using the proposed method to find perfect concept graphs and their vertices are subsequently classified by the described heuristics.

Based on the quality value of their concept representatives, graphs that do not contain meaningful concepts are detected, revealing unknown relations.

Finally, overlapping concept graphs demonstrate the full flexibility and diversity of concept graphs.

Overlapping concept graphs can be used, for instance, to identify hierarchies leading to a better understanding of complex relationships.

In addition, they also support the identification of missing connections, which produce new insights.



By using information networks as input data and retrieving existing as well as unknown concepts from the integrated data, the discussed approach supports creative thinking by improving the understanding of complex systems and the discovery of interesting and unexpected relationships.
Subject (DDC)
004 Computer Science
Keywords
concept detection,creativity support
Conference
Review
undefined / . - undefined, undefined. - (undefined; undefined)
Cite This
ISO 690KÖTTER, Tobias, 2012. Konzepterkennung in Informationsnetzwerken [Dissertation]. Konstanz: University of Konstanz
BibTex
@phdthesis{Kotter2012Konze-19090,
  year={2012},
  title={Konzepterkennung in Informationsnetzwerken},
  author={Kötter, Tobias},
  address={Konstanz},
  school={Universität Konstanz}
}
RDF
<rdf:RDF
    xmlns:dcterms="http://purl.org/dc/terms/"
    xmlns:dc="http://purl.org/dc/elements/1.1/"
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:bibo="http://purl.org/ontology/bibo/"
    xmlns:dspace="http://digital-repositories.org/ontologies/dspace/0.1.0#"
    xmlns:foaf="http://xmlns.com/foaf/0.1/"
    xmlns:void="http://rdfs.org/ns/void#"
    xmlns:xsd="http://www.w3.org/2001/XMLSchema#" > 
  <rdf:Description rdf:about="https://kops.uni-konstanz.de/server/rdf/resource/123456789/19090">
    <dcterms:alternative>Concept Detection in Information Networks</dcterms:alternative>
    <dc:contributor>Kötter, Tobias</dc:contributor>
    <dcterms:available rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2012-04-23T07:06:03Z</dcterms:available>
    <dcterms:hasPart rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/19090/1/Dissertation_K%c3%b6tter.pdf"/>
    <dc:language>deu</dc:language>
    <dcterms:abstract xml:lang="deu">Konzepte spielen in unserem täglichen Leben eine wichtige Rolle, wenn auch nur unbewusst.&lt;br /&gt;&lt;br /&gt;So gruppieren Konzepte Objekte mit gemeinsamen Eigenschaften und ermöglichen uns das Abstrahieren und Kommunizieren von bestehendem Wissen sowie die Verarbeitung der pausenlos auf uns einströmenden Flut von Informationen.&lt;br /&gt;&lt;br /&gt;Dabei agiert ein Konzept als Repräsentant seiner Mitglieder und ihrer gemeinsamen Eigenschaften.&lt;br /&gt;&lt;br /&gt;Wenn wir an das Konzept der Transportmittel denken, fallen uns spontan einige Mitglieder und ihre Eigenschaften ein, die diese als Transportmittel auszeichnen.&lt;br /&gt;&lt;br /&gt;Eine weitere Besonderheit der Konzepte ist, dass ein Objekt Mitglied in scheinbar unabhängigen Konzepten sein kann.&lt;br /&gt;&lt;br /&gt;So gilt ein Auto sowohl als Transportmittel als auch als Luxusgegenstand.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Der in dieser Arbeit beschriebene Ansatz macht sich diese Leistungsfähigkeit und Flexibilität von Konzepten zunutze, um das kreative Denken zu fördern.&lt;br /&gt;&lt;br /&gt;So ermöglicht der Ansatz das Finden von existierenden sowie unbekannten Konzepten in heterogenen Daten, welche das Verständnis für komplexe Systeme fördern sowie interessante und unerwartete Zusammenhänge aufdecken.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Da bei der Suche nach unerwarteten Zusammenhängen nicht von Anfang an feststeht, wonach man eigentlich sucht, sollte bei der Integration der zur Verfügung stehenden Daten möglichst keine Information verloren gehen.&lt;br /&gt;&lt;br /&gt;Daher basiert der beschriebene Ansatz auf Informationsnetzwerken, welche dank ihrer flexiblen Datenstruktur die Integration von Daten unterschiedlichster Beschaffenheit und Qualität unterstützen.&lt;br /&gt;&lt;br /&gt;So speichern Informationsnetzwerke die Informationen in Form von Beziehungen zwischen Objekten in einer Graphstruktur, wobei Objekte als Knoten und ihre Beziehungen als Kanten im Graphen repräsentiert werden.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Basierend auf dieser Datenrepräsentation beruht der beschriebene Ansatz auf der Annahme, dass Objekte durch ihre direkten Nachbarn im Netzwerk beschrieben werden.&lt;br /&gt;&lt;br /&gt;Somit bilden ähnliche Objekte und ihre gemeinsamen Nachbarn einen quasi bipartiten Graphen.&lt;br /&gt;&lt;br /&gt;Dieser aus den beiden Knotenpartitionen und ihren Verbindungen bestehende Teilgraph bildet die Basis des beschriebenen Ansatzes, den sogenannten Konzeptgraphen.&lt;br /&gt;&lt;br /&gt;Die Güte der Verbindungen zwischen den beiden Knotenpartitionen wird mithilfe einer Gütefunktion bestimmt, welche das Fehlen einzelner Verbindungen bestraft.&lt;br /&gt;&lt;br /&gt;Daher sollten sich die ähnlichen Objekte möglichst viele Nachbarn teilen.&lt;br /&gt;&lt;br /&gt;Einen Spezialfall stellen dabei die vollständigen Konzeptgraphen dar, deren Knotenpartitionen vollständig verbunden sind.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Zum Klassifizieren der Knoten eines Konzeptgraphen werden ferner Heuristiken basierend auf der Graphstruktur vorgestellt, welche die Identifizierung der Mitglieder und Eigenschaften eines Konzeptes sowie des Konzeptrepräsentanten ermöglichen.&lt;br /&gt;&lt;br /&gt;Dabei ist der Typ eines Knotens kontextabhängig und kann so in unterschiedlichen Konzeptgraphen variieren.&lt;br /&gt;&lt;br /&gt;Die Heuristik zur Bestimmung des Konzeptrepräsentanten liefert darüber hinaus ein Maß für dessen Güte, welches zum Auffinden eines fehlenden Repräsentanten verwendet werden kann.&lt;br /&gt;&lt;br /&gt;Ein fehlender Konzeptrepräsentant kann dabei ein Anzeichen für unvollständige und verrauschte Daten sein.&lt;br /&gt;&lt;br /&gt;Er kann aber auch ein Hinweis auf eine Gruppe von Objekten mit gemeinsamen Eigenschaften sein, die bisher noch nicht entdeckt wurden und daher noch keinen Konzeptrepräsentanten besitzen.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Neben der Formalisierung von Konzeptgraphen werden Verfahren zum Finden von vollständigen Konzeptgraphen sowie Ansätze zum Finden von allgemeinen Konzeptgraphen beschrieben.&lt;br /&gt;&lt;br /&gt;Die beschriebenen Verfahren und Ansätze basieren auf existierenden Verfahren zum Finden von Frequent Item Sets, welche sich durch die Konvertierung des Graphen in eine Transaktionsliste anwenden lassen.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Fallstudien demonstrieren schließlich die Existenz sowie die Flexibilität und Vielfältigkeit von Konzeptgraphen anhand von zwei unterschiedlichen Datensätzen aus der realen Welt.&lt;br /&gt;&lt;br /&gt;So basiert der erste Datensatz auf einer Enzyklopädie mit Artikeln aus unterschiedlichen Wissensgebieten.&lt;br /&gt;&lt;br /&gt;Der zweite Datensatz basiert hingegen auf strukturierten sowie unstrukturierten Informationen über Medikamente.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;In beiden Datensätzen werden sinnvolle Konzeptgraphen mithilfe des beschriebenen Verfahrens zum Finden von vollständigen Konzeptgraphen gefunden und ihre Knoten unter Verwendung der vorgestellten Heuristiken in die unterschiedlichen Typen eingeteilt.&lt;br /&gt;&lt;br /&gt;Basierend auf dem Gütewert für den Konzeptrepräsentanten werden ferner Konzeptgraphen ohne sinnvollen Repräsentanten identifiziert, welche unbekannte Zusammenhänge aufdecken.&lt;br /&gt;&lt;br /&gt;Überlappende Konzeptgraphen demonstrieren schließlich die volle Flexibilität und Vielfältigkeit von Konzeptgraphen.&lt;br /&gt;&lt;br /&gt;So können die Überlappungen sowohl zum Identifizieren von Hierarchien verwendet werden als auch zu einem besseren Verständnis komplexer Zusammenhänge führen.&lt;br /&gt;&lt;br /&gt;Darüber hinaus ermöglichen sie auch das Auffinden fehlender Verbindungen, die zu neuen Erkenntnissen führen.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Durch die Verwendung von Informationsnetzwerken als Eingabedaten und dem Auffinden von existierenden sowie unbekannten Konzepten unterstützt das in dieser Arbeit vorgestellte Verfahren das kreative Denken, indem es sowohl das Verständnis komplexer Systeme fördert als auch interessante und unerwartete Zusammenhänge aufdeckt.</dcterms:abstract>
    <dcterms:isPartOf rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/>
    <dspace:isPartOfCollection rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/>
    <dcterms:issued>2012</dcterms:issued>
    <foaf:homepage rdf:resource="http://localhost:8080/"/>
    <dc:creator>Kötter, Tobias</dc:creator>
    <bibo:uri rdf:resource="http://kops.uni-konstanz.de/handle/123456789/19090"/>
    <dspace:hasBitstream rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/19090/1/Dissertation_K%c3%b6tter.pdf"/>
    <dcterms:rights rdf:resource="https://rightsstatements.org/page/InC/1.0/"/>
    <dcterms:title>Konzepterkennung in Informationsnetzwerken</dcterms:title>
    <dc:date rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2012-04-23T07:06:03Z</dc:date>
    <void:sparqlEndpoint rdf:resource="http://localhost/fuseki/dspace/sparql"/>
    <dc:rights>terms-of-use</dc:rights>
  </rdf:Description>
</rdf:RDF>
Internal note
xmlui.Submission.submit.DescribeStep.inputForms.label.kops_note_fromSubmitter
Contact
URL of original publication
Test date of URL
Examination date of dissertation
January 25, 2012
Method of financing
Comment on publication
Alliance license
Corresponding Authors der Uni Konstanz vorhanden
International Co-Authors
Bibliography of Konstanz
Yes
Refereed