Automatische Identifikation relevanter Domains zur Web-Archivierung
Automatische Identifikation relevanter Domains zur Web-Archivierung
Loading...
Date
2014
Authors
Editors
Journal ISSN
Electronic ISSN
ISBN
Bibliographical data
Publisher
Series
Distributed Systems Group Technical Report; KN-2014-DISY-01
URI (citable link)
International patent number
Link to the license
EU project number
Project
Open Access publication
Collections
Title in another language
Publication type
Working Paper/Technical Report
Publication status
Published
Published in
Abstract
Oftmals werden Organisationen und Forschungseinrichtungen wie Hochschulen und Universitäten durch viele verschiedene Domains repräsentiert, die auf mehreren Webservern gehostet werden. Dem Anwender sind diese oftmals nicht gänzlich bekannt, da Arbeitsgruppen, Institute, etc. ihre eigenen Domains und Webserver - unter Umständen auch extern gehostet - haben können. Für die Web- Archivierung in großen Organisationen stellt dies ein Problem dar, da a-priori nicht bekannt ist, welche Domains archiviert werden müssen. Diese sollten automatisch erkannt werden. Das Hauptproblem dabei besteht darin, eine Zugehörigkeit von Domains zur Organisation festzustellen. Wir stellen verschiedene Verfahren vor, die vor und während des Harvestens angewandt werden können, um dynamisch zu entscheiden, welche Domains dem Archiv hinzugefügt werden müssen.
Summary in another language
Subject (DDC)
004 Computer Science
Keywords
Web-Archivierung, harvesting, crawling, Web-Server, Domain
Conference
Review
undefined / . - undefined, undefined. - (undefined; undefined)
Cite This
ISO 690
ZINK, Thomas, Oliver HAASE, Marcel WALDVOGEL, 2014. Automatische Identifikation relevanter Domains zur Web-ArchivierungBibTex
@techreport{Zink2014Autom-43359, year={2014}, series={Distributed Systems Group Technical Report}, title={Automatische Identifikation relevanter Domains zur Web-Archivierung}, number={KN-2014-DISY-01}, author={Zink, Thomas and Haase, Oliver and Waldvogel, Marcel} }
RDF
<rdf:RDF xmlns:dcterms="http://purl.org/dc/terms/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:bibo="http://purl.org/ontology/bibo/" xmlns:dspace="http://digital-repositories.org/ontologies/dspace/0.1.0#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:void="http://rdfs.org/ns/void#" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" > <rdf:Description rdf:about="https://kops.uni-konstanz.de/server/rdf/resource/123456789/43359"> <bibo:uri rdf:resource="https://kops.uni-konstanz.de/handle/123456789/43359"/> <dc:contributor>Waldvogel, Marcel</dc:contributor> <dspace:isPartOfCollection rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/> <dc:rights>terms-of-use</dc:rights> <dc:creator>Zink, Thomas</dc:creator> <dc:contributor>Zink, Thomas</dc:contributor> <dcterms:hasPart rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/43359/3/Zink_2-cq48vlxjriyc5.pdf"/> <dcterms:title>Automatische Identifikation relevanter Domains zur Web-Archivierung</dcterms:title> <dcterms:isPartOf rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/> <dcterms:available rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2018-09-21T11:49:22Z</dcterms:available> <dc:language>deu</dc:language> <dc:contributor>Haase, Oliver</dc:contributor> <dspace:hasBitstream rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/43359/3/Zink_2-cq48vlxjriyc5.pdf"/> <void:sparqlEndpoint rdf:resource="http://localhost/fuseki/dspace/sparql"/> <dc:creator>Waldvogel, Marcel</dc:creator> <dcterms:issued>2014</dcterms:issued> <dcterms:abstract xml:lang="deu">Oftmals werden Organisationen und Forschungseinrichtungen wie Hochschulen und Universitäten durch viele verschiedene Domains repräsentiert, die auf mehreren Webservern gehostet werden. Dem Anwender sind diese oftmals nicht gänzlich bekannt, da Arbeitsgruppen, Institute, etc. ihre eigenen Domains und Webserver - unter Umständen auch extern gehostet - haben können. Für die Web- Archivierung in großen Organisationen stellt dies ein Problem dar, da a-priori nicht bekannt ist, welche Domains archiviert werden müssen. Diese sollten automatisch erkannt werden. Das Hauptproblem dabei besteht darin, eine Zugehörigkeit von Domains zur Organisation festzustellen. Wir stellen verschiedene Verfahren vor, die vor und während des Harvestens angewandt werden können, um dynamisch zu entscheiden, welche Domains dem Archiv hinzugefügt werden müssen.</dcterms:abstract> <dc:creator>Haase, Oliver</dc:creator> <foaf:homepage rdf:resource="http://localhost:8080/"/> <dc:date rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2018-09-21T11:49:22Z</dc:date> <dcterms:rights rdf:resource="https://rightsstatements.org/page/InC/1.0/"/> </rdf:Description> </rdf:RDF>
Internal note
xmlui.Submission.submit.DescribeStep.inputForms.label.kops_note_fromSubmitter
Examination date of dissertation
Method of financing
Comment on publication
Alliance license
Corresponding Authors der Uni Konstanz vorhanden
International Co-Authors
Bibliography of Konstanz
Yes