Visuelle Datenanalyse mit Streudiagrammen : Problemlösungen für Ungleichverteilung und Überdeckung

Lade...
Vorschaubild
Dateien
MA_Janetzko_H.pdf
MA_Janetzko_H.pdfGröße: 47.92 MBDownloads: 386
Datum
2010
Herausgeber:innen
Kontakt
ISSN der Zeitschrift
Electronic ISSN
ISBN
Bibliografische Daten
Verlag
Schriftenreihe
Auflagebezeichnung
DOI (zitierfähiger Link)
ArXiv-ID
Internationale Patentnummer
Angaben zur Forschungsförderung
Projekt
Open Access-Veröffentlichung
Open Access Green
Core Facility der Universität Konstanz
Gesperrt bis
Titel in einer weiteren Sprache
Visual Analytics with Scatter Plots,Coping with Unequal Distribution and Overplotting
Publikationstyp
Masterarbeit/Diplomarbeit
Publikationsstatus
Published
Erschienen in
Zusammenfassung

Scatter plots are one of the most powerful and most widely used techniques for visual data exploration in order to detect patterns and correlations. A well-known problem is that scatter plots often have a high degree of overlap, which may occlude a significant portion of the data values shown. Additionally, scatter plots suffer from unequal data distribution, because dense areas are not visualized as good as sparse areas. The research shown in this master s thesis will cope with these problems using a novel approach called Generalized Scatter Plot. This technique allows an overlap-free representation of large datasets to fit entirely into the display.
The basic idea is to allow the analyst to optimize the degree of overlap and distortion to generate the best possible view. To allow an effective usage, the capability to interpolate smoothly between the traditional and the generalized scatter plots is provided. In particular, an optimization function will be identified, which takes both overlap and distortion of the visualization into account. Furthermore, the generalized scatter plots will be applied to a number of realworld data sets from application domains, such as server performance monitoring, telephone service usage analysis, and geographical data, demonstrating the benefits of the generalized scatter plots over traditional techniques.

Zusammenfassung in einer weiteren Sprache

Streudiagramme gehören zu den mächtigsten und vielseitigsten Techniken, welche häufig im Bereich der visuellen Datenanalyse verwendet werden. Ein schon lange bekanntes Problem der Streudiagramme ist, dass diese häufig einen hohen Grad an Punktüberdeckungen enthalten. Dabei können signifikante Teile der Daten verdeckt werden, was die visuelle Datenanalyse erschwert. Zusätzlich behindert eine Ungleichverteilung der Daten die sinnvolle Darstellung mittels Streudiagrammen. Diese Masterarbeit befasst sich mit der Entwicklung eines neuen Ansatzes, den Generalized Scatter Plots, welche die überdeckungsfreie Visualisierung großer Datenmengen ermöglicht. Die grundlegende Idee ist es, dem Benutzer eine freie Wahl des Verzerrungsgrades und der Menge an erlaubter Überdeckung anzubieten, um die bestmögliche Ansicht zu generieren. Hierbei kann zwischen dem traditionellen Streudiagramm und der hier vorgestellten Technik kontinuierlich interpoliert werden. Zudem wird eine Optimierungsfunktion aufgestellt, welche sowohl Verzerrung als auch Überdeckung berücksichtigt. Außerdem werden die Generalized Scatter Plots auf einige Datensätze aus der realen Welt angewendet. Unter anderem werden dabei Daten aus den Anwendunsgebieten der Serverperformanz, der Telelefonnutzung und der geographisch bezogenen Einkommensstatistik verwendet. Der Vergleich mit anderen schon bestehenden Techniken zeigt abschließend die Vorteile der hier vorgestellten Technik.

Fachgebiet (DDC)
004 Informatik
Schlagwörter
Streudiagramm, Punktüberdeckung, scatter plot, distortion, overlapping points
Konferenz
Rezension
undefined / . - undefined, undefined
Forschungsvorhaben
Organisationseinheiten
Zeitschriftenheft
Datensätze
Zitieren
ISO 690JANETZKO, Halldor, 2010. Visuelle Datenanalyse mit Streudiagrammen : Problemlösungen für Ungleichverteilung und Überdeckung [Master thesis]
BibTex
@mastersthesis{Janetzko2010Visue-6063,
  year={2010},
  title={Visuelle Datenanalyse mit Streudiagrammen : Problemlösungen für Ungleichverteilung und Überdeckung},
  author={Janetzko, Halldor}
}
RDF
<rdf:RDF
    xmlns:dcterms="http://purl.org/dc/terms/"
    xmlns:dc="http://purl.org/dc/elements/1.1/"
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:bibo="http://purl.org/ontology/bibo/"
    xmlns:dspace="http://digital-repositories.org/ontologies/dspace/0.1.0#"
    xmlns:foaf="http://xmlns.com/foaf/0.1/"
    xmlns:void="http://rdfs.org/ns/void#"
    xmlns:xsd="http://www.w3.org/2001/XMLSchema#" > 
  <rdf:Description rdf:about="https://kops.uni-konstanz.de/server/rdf/resource/123456789/6063">
    <dcterms:issued>2010</dcterms:issued>
    <void:sparqlEndpoint rdf:resource="http://localhost/fuseki/dspace/sparql"/>
    <dcterms:alternative>Visual Analytics with Scatter Plots</dcterms:alternative>
    <dc:contributor>Janetzko, Halldor</dc:contributor>
    <dc:rights>Attribution-NonCommercial-NoDerivs 2.0 Generic</dc:rights>
    <dcterms:hasPart rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/6063/1/MA_Janetzko_H.pdf"/>
    <dcterms:available rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-24T16:09:07Z</dcterms:available>
    <dc:format>application/pdf</dc:format>
    <dspace:isPartOfCollection rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/>
    <dc:creator>Janetzko, Halldor</dc:creator>
    <dcterms:title>Visuelle Datenanalyse mit Streudiagrammen : Problemlösungen für Ungleichverteilung und Überdeckung</dcterms:title>
    <foaf:homepage rdf:resource="http://localhost:8080/"/>
    <dcterms:rights rdf:resource="http://creativecommons.org/licenses/by-nc-nd/2.0/"/>
    <dc:date rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-24T16:09:07Z</dc:date>
    <dspace:hasBitstream rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/6063/1/MA_Janetzko_H.pdf"/>
    <dcterms:alternative>Coping with Unequal Distribution and Overplotting</dcterms:alternative>
    <bibo:uri rdf:resource="http://kops.uni-konstanz.de/handle/123456789/6063"/>
    <dc:language>deu</dc:language>
    <dcterms:isPartOf rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/>
    <dcterms:abstract xml:lang="eng">Scatter plots are one of the most powerful and most widely used techniques for visual data exploration in order to detect patterns and correlations. A well-known problem is that scatter plots often have a high degree of overlap, which may occlude a significant portion of the data values shown. Additionally, scatter plots suffer from unequal data distribution, because dense areas are not visualized as good as sparse areas. The research shown in this master s thesis will cope with these problems using a novel approach called Generalized Scatter Plot. This technique allows an overlap-free representation of large datasets to fit entirely into the display.&lt;br /&gt;The basic idea is to allow the analyst to optimize the degree of overlap and distortion to generate the best possible view. To allow an effective usage, the capability to interpolate smoothly between the traditional and the generalized scatter plots is provided. In particular, an optimization function will be identified, which takes both overlap and distortion of the visualization into account. Furthermore, the generalized scatter plots will be applied to a number of realworld data sets from application domains, such as server performance monitoring, telephone service usage analysis, and geographical data, demonstrating the benefits of the generalized scatter plots over traditional techniques.</dcterms:abstract>
  </rdf:Description>
</rdf:RDF>
Interner Vermerk
xmlui.Submission.submit.DescribeStep.inputForms.label.kops_note_fromSubmitter
Kontakt
URL der Originalveröffentl.
Prüfdatum der URL
Prüfungsdatum der Dissertation
Finanzierungsart
Kommentar zur Publikation
Allianzlizenz
Corresponding Authors der Uni Konstanz vorhanden
Internationale Co-Autor:innen
Universitätsbibliographie
Ja
Begutachtet
Diese Publikation teilen