Visuelle Datenanalyse mit Streudiagrammen : Problemlösungen für Ungleichverteilung und Überdeckung
Dateien
Datum
Autor:innen
Herausgeber:innen
ISSN der Zeitschrift
Electronic ISSN
ISBN
Bibliografische Daten
Verlag
Schriftenreihe
Auflagebezeichnung
URI (zitierfähiger Link)
Internationale Patentnummer
Link zur Lizenz
Angaben zur Forschungsförderung
Projekt
Open Access-Veröffentlichung
Sammlungen
Core Facility der Universität Konstanz
Titel in einer weiteren Sprache
Publikationstyp
Publikationsstatus
Erschienen in
Zusammenfassung
Scatter plots are one of the most powerful and most widely used techniques for visual data exploration in order to detect patterns and correlations. A well-known problem is that scatter plots often have a high degree of overlap, which may occlude a significant portion of the data values shown. Additionally, scatter plots suffer from unequal data distribution, because dense areas are not visualized as good as sparse areas. The research shown in this master s thesis will cope with these problems using a novel approach called Generalized Scatter Plot. This technique allows an overlap-free representation of large datasets to fit entirely into the display.
The basic idea is to allow the analyst to optimize the degree of overlap and distortion to generate the best possible view. To allow an effective usage, the capability to interpolate smoothly between the traditional and the generalized scatter plots is provided. In particular, an optimization function will be identified, which takes both overlap and distortion of the visualization into account. Furthermore, the generalized scatter plots will be applied to a number of realworld data sets from application domains, such as server performance monitoring, telephone service usage analysis, and geographical data, demonstrating the benefits of the generalized scatter plots over traditional techniques.
Zusammenfassung in einer weiteren Sprache
Streudiagramme gehören zu den mächtigsten und vielseitigsten Techniken, welche häufig im Bereich der visuellen Datenanalyse verwendet werden. Ein schon lange bekanntes Problem der Streudiagramme ist, dass diese häufig einen hohen Grad an Punktüberdeckungen enthalten. Dabei können signifikante Teile der Daten verdeckt werden, was die visuelle Datenanalyse erschwert. Zusätzlich behindert eine Ungleichverteilung der Daten die sinnvolle Darstellung mittels Streudiagrammen. Diese Masterarbeit befasst sich mit der Entwicklung eines neuen Ansatzes, den Generalized Scatter Plots, welche die überdeckungsfreie Visualisierung großer Datenmengen ermöglicht. Die grundlegende Idee ist es, dem Benutzer eine freie Wahl des Verzerrungsgrades und der Menge an erlaubter Überdeckung anzubieten, um die bestmögliche Ansicht zu generieren. Hierbei kann zwischen dem traditionellen Streudiagramm und der hier vorgestellten Technik kontinuierlich interpoliert werden. Zudem wird eine Optimierungsfunktion aufgestellt, welche sowohl Verzerrung als auch Überdeckung berücksichtigt. Außerdem werden die Generalized Scatter Plots auf einige Datensätze aus der realen Welt angewendet. Unter anderem werden dabei Daten aus den Anwendunsgebieten der Serverperformanz, der Telelefonnutzung und der geographisch bezogenen Einkommensstatistik verwendet. Der Vergleich mit anderen schon bestehenden Techniken zeigt abschließend die Vorteile der hier vorgestellten Technik.
Fachgebiet (DDC)
Schlagwörter
Konferenz
Rezension
Zitieren
ISO 690
JANETZKO, Halldor, 2010. Visuelle Datenanalyse mit Streudiagrammen : Problemlösungen für Ungleichverteilung und Überdeckung [Master thesis]BibTex
@mastersthesis{Janetzko2010Visue-6063, year={2010}, title={Visuelle Datenanalyse mit Streudiagrammen : Problemlösungen für Ungleichverteilung und Überdeckung}, author={Janetzko, Halldor} }
RDF
<rdf:RDF xmlns:dcterms="http://purl.org/dc/terms/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:bibo="http://purl.org/ontology/bibo/" xmlns:dspace="http://digital-repositories.org/ontologies/dspace/0.1.0#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:void="http://rdfs.org/ns/void#" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" > <rdf:Description rdf:about="https://kops.uni-konstanz.de/server/rdf/resource/123456789/6063"> <dcterms:issued>2010</dcterms:issued> <void:sparqlEndpoint rdf:resource="http://localhost/fuseki/dspace/sparql"/> <dcterms:alternative>Visual Analytics with Scatter Plots</dcterms:alternative> <dc:contributor>Janetzko, Halldor</dc:contributor> <dc:rights>Attribution-NonCommercial-NoDerivs 2.0 Generic</dc:rights> <dcterms:hasPart rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/6063/1/MA_Janetzko_H.pdf"/> <dcterms:available rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-24T16:09:07Z</dcterms:available> <dc:format>application/pdf</dc:format> <dspace:isPartOfCollection rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/> <dc:creator>Janetzko, Halldor</dc:creator> <dcterms:title>Visuelle Datenanalyse mit Streudiagrammen : Problemlösungen für Ungleichverteilung und Überdeckung</dcterms:title> <foaf:homepage rdf:resource="http://localhost:8080/"/> <dcterms:rights rdf:resource="http://creativecommons.org/licenses/by-nc-nd/2.0/"/> <dc:date rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-24T16:09:07Z</dc:date> <dspace:hasBitstream rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/6063/1/MA_Janetzko_H.pdf"/> <dcterms:alternative>Coping with Unequal Distribution and Overplotting</dcterms:alternative> <bibo:uri rdf:resource="http://kops.uni-konstanz.de/handle/123456789/6063"/> <dc:language>deu</dc:language> <dcterms:isPartOf rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/> <dcterms:abstract xml:lang="eng">Scatter plots are one of the most powerful and most widely used techniques for visual data exploration in order to detect patterns and correlations. A well-known problem is that scatter plots often have a high degree of overlap, which may occlude a significant portion of the data values shown. Additionally, scatter plots suffer from unequal data distribution, because dense areas are not visualized as good as sparse areas. The research shown in this master s thesis will cope with these problems using a novel approach called Generalized Scatter Plot. This technique allows an overlap-free representation of large datasets to fit entirely into the display.<br />The basic idea is to allow the analyst to optimize the degree of overlap and distortion to generate the best possible view. To allow an effective usage, the capability to interpolate smoothly between the traditional and the generalized scatter plots is provided. In particular, an optimization function will be identified, which takes both overlap and distortion of the visualization into account. Furthermore, the generalized scatter plots will be applied to a number of realworld data sets from application domains, such as server performance monitoring, telephone service usage analysis, and geographical data, demonstrating the benefits of the generalized scatter plots over traditional techniques.</dcterms:abstract> </rdf:Description> </rdf:RDF>