Publikation: Compact Storage for Efficient Management of XML Documents
Dateien
Datum
Autor:innen
Herausgeber:innen
ISSN der Zeitschrift
Electronic ISSN
ISBN
Bibliografische Daten
Verlag
Schriftenreihe
Auflagebezeichnung
URI (zitierfähiger Link)
Internationale Patentnummer
Link zur Lizenz
Angaben zur Forschungsförderung
Projekt
Open Access-Veröffentlichung
Core Facility der Universität Konstanz
Titel in einer weiteren Sprache
Publikationstyp
Publikationsstatus
Erschienen in
Zusammenfassung
XML wird mehr und mehr für Datenaustausch und -manipulation genutzt. Viele Ansätze verarbeiten XML-Daten im Hauptspeicher. Weil XML zunehmend häufig verwendet wird und die XML-Syntax zusätzlichen Speicher benötigt, können grössere XML-Dateien nicht im Hauptspeicher verarbeitet werden. Infolgedessen leiden diese Dateien unter den Begrenzungen aktueller Arbeitsspeicher.
Hingegen werden objektrelationale Datenbanktechnologien wegen ihrer Ausgereiftheit und weiten Verbreitung als Alternativen zum Speichern und Verwalten von XML-Daten genannt. Die dauerhafte Speicherung von XML in seinem ursprünglichen Format vermeidet Verluste durch Umwandlung und stellt die beste Alternative dar.
Daraus folgt ein steigender Bedarf an robusten, leistungsfähigen XML-Datenbanken, die XML-Daten nicht nur effizient abfragen und aktualisieren, sondern sie auch kompakt speichern können.
Es gibt viele Ansätze zur Verwaltung von XML-Dokumenten. Hingegen sind zwei gängige Strategien bekannt, die eine robuste Speicherung und effiziente Suche gewährleisten.
Die erste beruht auf einem Nummerierungsschema, das strukturelle Informationen aus XML-Dokumenten gewinnt. Diese Informationen werden auf eine Art gespeichert, die schnelle Identifikation zwischen den Knotenbeziehungen erlaubt. Diese Identifikation spielt eine entscheidende Rolle bei der effizienten Abfrageverarbeitung.
Die zweite Strategie verkleinert XML-Dateien mittels Komprimierungstechniken. Während eine naive Darstellung von XML-Dateien eine starke Redundanz erzeugt, reduziert die Komprimierung von XML-Dateien nicht nur den benötigten Speicherplatz, sondern erhöht auch die Abfragegeschwindigkeit.
Die vorliegende Arbeit präsentiert verschiedene Lösungsansätze für die effiziente Verwaltung von XML-Daten. Sie stellt Ansätze vor, die die Stärken von Kennzeichnungs- und Komprimierungs-Technologien verbinden und sowohl die Lücke zwischen diesen Technologien schließen als auch ihre Nachteile überwinden und eine bessere Leistung als bei separatem Einsatz dieser Technologien gewährleisten.
Eine ausführliche experimentelle Evaluation der vorgestellten Anätze zeigt, dass sie im Vergleich mit anderen Ansätzen auf diesem Gebiet deutliche Leistungsverbesserungen bei der XML-Verarbeitung erzielen.
XML is becoming widely used for data exchange and manipulation. As a consequence, an increasing number of XML documents need to be managed. There are many works that use main-memory to process XML data. Since XML usage is continuing to grow and the nature of XML is extremely verbose, large or even moderately large XML documents cannot be processed within the main memory. Consequently, these works will suffer from the limitations of current main-memory.
On the other hand, because of the maturity and widespread deployment of (object) relational database technologies, they have been suggested as an alternative to store and manage XML data. However, the persistent storage of XML in its native format will avoid transformation cost and present the best alternative.
Zusammenfassung in einer weiteren Sprache
This has generated an increasing need for robust, high performance XML database systems, which are able to not only query and update XML data efficiently, but also store it in a compact representation.
There have been many proposals to manage XML documents. However, two common strategies are available to provide robust storage and efficient query processing.
The first is based on numbering schemes for gathering structural information from XML documents and storing it in such a way that allows quick identification of structural relationships between nodes. This identification plays a crucial role in efficient XML query processing.
The second strategy tries to reduce the size of XML documents through compaction techniques. While a naive representation of XML documents leads to excessive redundancy, the compaction of XML documents not only reduces the amount of disk space occupied by the data, but also enhances query processing speed.
The thesis presents different solutions for the efficient management of XML data by proposing approaches that combine the strengths of labeling and compaction technologies and bridge the gaps between these technologies to exploit their benefits and avoid their drawbacks and produce a performance that is better when these technologies are used independently.
An extensive experimental evaluation of the approaches proposed shows that they yield considerable performance improvements for XML processing compared to other approaches in this field.
Fachgebiet (DDC)
Schlagwörter
Konferenz
Rezension
Zitieren
ISO 690
ALKHATIB, Ramez, 2010. Compact Storage for Efficient Management of XML Documents [Dissertation]. Konstanz: University of KonstanzBibTex
@phdthesis{Alkhatib2010Compa-6289, year={2010}, title={Compact Storage for Efficient Management of XML Documents}, author={Alkhatib, Ramez}, address={Konstanz}, school={Universität Konstanz} }
RDF
<rdf:RDF xmlns:dcterms="http://purl.org/dc/terms/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:bibo="http://purl.org/ontology/bibo/" xmlns:dspace="http://digital-repositories.org/ontologies/dspace/0.1.0#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:void="http://rdfs.org/ns/void#" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" > <rdf:Description rdf:about="https://kops.uni-konstanz.de/server/rdf/resource/123456789/6289"> <dcterms:available rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-24T16:11:11Z</dcterms:available> <dcterms:rights rdf:resource="https://rightsstatements.org/page/InC/1.0/"/> <dspace:hasBitstream rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/6289/1/Thesis_Alkhatib.pdf"/> <bibo:uri rdf:resource="http://kops.uni-konstanz.de/handle/123456789/6289"/> <dc:format>application/pdf</dc:format> <dcterms:issued>2010</dcterms:issued> <dc:language>eng</dc:language> <dc:date rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-24T16:11:11Z</dc:date> <dcterms:title>Compact Storage for Efficient Management of XML Documents</dcterms:title> <void:sparqlEndpoint rdf:resource="http://localhost/fuseki/dspace/sparql"/> <dcterms:hasPart rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/6289/1/Thesis_Alkhatib.pdf"/> <dcterms:abstract xml:lang="deu">XML wird mehr und mehr für Datenaustausch und -manipulation genutzt. Viele Ansätze verarbeiten XML-Daten im Hauptspeicher. Weil XML zunehmend häufig verwendet wird und die XML-Syntax zusätzlichen Speicher benötigt, können grössere XML-Dateien nicht im Hauptspeicher verarbeitet werden. Infolgedessen leiden diese Dateien unter den Begrenzungen aktueller Arbeitsspeicher.<br />Hingegen werden objektrelationale Datenbanktechnologien wegen ihrer Ausgereiftheit und weiten Verbreitung als Alternativen zum Speichern und Verwalten von XML-Daten genannt. Die dauerhafte Speicherung von XML in seinem ursprünglichen Format vermeidet Verluste durch Umwandlung und stellt die beste Alternative dar.<br />Daraus folgt ein steigender Bedarf an robusten, leistungsfähigen XML-Datenbanken, die XML-Daten nicht nur effizient abfragen und aktualisieren, sondern sie auch kompakt speichern können.<br />Es gibt viele Ansätze zur Verwaltung von XML-Dokumenten. Hingegen sind zwei gängige Strategien bekannt, die eine robuste Speicherung und effiziente Suche gewährleisten.<br />Die erste beruht auf einem Nummerierungsschema, das strukturelle Informationen aus XML-Dokumenten gewinnt. Diese Informationen werden auf eine Art gespeichert, die schnelle Identifikation zwischen den Knotenbeziehungen erlaubt. Diese Identifikation spielt eine entscheidende Rolle bei der effizienten Abfrageverarbeitung.<br />Die zweite Strategie verkleinert XML-Dateien mittels Komprimierungstechniken. Während eine naive Darstellung von XML-Dateien eine starke Redundanz erzeugt, reduziert die Komprimierung von XML-Dateien nicht nur den benötigten Speicherplatz, sondern erhöht auch die Abfragegeschwindigkeit.<br />Die vorliegende Arbeit präsentiert verschiedene Lösungsansätze für die effiziente Verwaltung von XML-Daten. Sie stellt Ansätze vor, die die Stärken von Kennzeichnungs- und Komprimierungs-Technologien verbinden und sowohl die Lücke zwischen diesen Technologien schließen als auch ihre Nachteile überwinden und eine bessere Leistung als bei separatem Einsatz dieser Technologien gewährleisten.<br />Eine ausführliche experimentelle Evaluation der vorgestellten Anätze zeigt, dass sie im Vergleich mit anderen Ansätzen auf diesem Gebiet deutliche Leistungsverbesserungen bei der XML-Verarbeitung erzielen.<br />XML is becoming widely used for data exchange and manipulation. As a consequence, an increasing number of XML documents need to be managed. There are many works that use main-memory to process XML data. Since XML usage is continuing to grow and the nature of XML is extremely verbose, large or even moderately large XML documents cannot be processed within the main memory. Consequently, these works will suffer from the limitations of current main-memory.<br />On the other hand, because of the maturity and widespread deployment of (object) relational database technologies, they have been suggested as an alternative to store and manage XML data. However, the persistent storage of XML in its native format will avoid transformation cost and present the best alternative.</dcterms:abstract> <dspace:isPartOfCollection rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/> <dcterms:alternative>Kompakte Speicherung für die effiziente Verwaltung von XML-Dokumenten</dcterms:alternative> <dc:creator>Alkhatib, Ramez</dc:creator> <dcterms:isPartOf rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/> <dc:contributor>Alkhatib, Ramez</dc:contributor> <foaf:homepage rdf:resource="http://localhost:8080/"/> <dc:rights>terms-of-use</dc:rights> </rdf:Description> </rdf:RDF>