Automatische Identifikation relevanter Domains zur Web-Archivierung

Loading...
Thumbnail Image
Date
2014
Authors
Editors
Contact
Journal ISSN
Electronic ISSN
ISBN
Bibliographical data
Publisher
Series
Distributed Systems Group Technical Report; KN-2014-DISY-01
DOI (citable link)
ArXiv-ID
International patent number
Link to the license
EU project number
Project
Open Access publication
Restricted until
Title in another language
Research Projects
Organizational Units
Journal Issue
Publication type
Working Paper/Technical Report
Publication status
Published
Published in
Abstract
Oftmals werden Organisationen und Forschungseinrichtungen wie Hochschulen und Universitäten durch viele verschiedene Domains repräsentiert, die auf mehreren Webservern gehostet werden. Dem Anwender sind diese oftmals nicht gänzlich bekannt, da Arbeitsgruppen, Institute, etc. ihre eigenen Domains und Webserver - unter Umständen auch extern gehostet - haben können. Für die Web- Archivierung in großen Organisationen stellt dies ein Problem dar, da a-priori nicht bekannt ist, welche Domains archiviert werden müssen. Diese sollten automatisch erkannt werden. Das Hauptproblem dabei besteht darin, eine Zugehörigkeit von Domains zur Organisation festzustellen. Wir stellen verschiedene Verfahren vor, die vor und während des Harvestens angewandt werden können, um dynamisch zu entscheiden, welche Domains dem Archiv hinzugefügt werden müssen.
Summary in another language
Subject (DDC)
004 Computer Science
Keywords
Web-Archivierung, harvesting, crawling, Web-Server, Domain
Conference
Review
undefined / . - undefined, undefined. - (undefined; undefined)
Cite This
ISO 690ZINK, Thomas, Oliver HAASE, Marcel WALDVOGEL, 2014. Automatische Identifikation relevanter Domains zur Web-Archivierung
BibTex
@techreport{Zink2014Autom-43359,
  year={2014},
  series={Distributed Systems Group Technical Report},
  title={Automatische Identifikation relevanter Domains zur Web-Archivierung},
  number={KN-2014-DISY-01},
  author={Zink, Thomas and Haase, Oliver and Waldvogel, Marcel}
}
RDF
<rdf:RDF
    xmlns:dcterms="http://purl.org/dc/terms/"
    xmlns:dc="http://purl.org/dc/elements/1.1/"
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:bibo="http://purl.org/ontology/bibo/"
    xmlns:dspace="http://digital-repositories.org/ontologies/dspace/0.1.0#"
    xmlns:foaf="http://xmlns.com/foaf/0.1/"
    xmlns:void="http://rdfs.org/ns/void#"
    xmlns:xsd="http://www.w3.org/2001/XMLSchema#" > 
  <rdf:Description rdf:about="https://kops.uni-konstanz.de/server/rdf/resource/123456789/43359">
    <bibo:uri rdf:resource="https://kops.uni-konstanz.de/handle/123456789/43359"/>
    <dc:contributor>Waldvogel, Marcel</dc:contributor>
    <dspace:isPartOfCollection rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/>
    <dc:rights>terms-of-use</dc:rights>
    <dc:creator>Zink, Thomas</dc:creator>
    <dc:contributor>Zink, Thomas</dc:contributor>
    <dcterms:hasPart rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/43359/3/Zink_2-cq48vlxjriyc5.pdf"/>
    <dcterms:title>Automatische Identifikation relevanter Domains zur Web-Archivierung</dcterms:title>
    <dcterms:isPartOf rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/>
    <dcterms:available rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2018-09-21T11:49:22Z</dcterms:available>
    <dc:language>deu</dc:language>
    <dc:contributor>Haase, Oliver</dc:contributor>
    <dspace:hasBitstream rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/43359/3/Zink_2-cq48vlxjriyc5.pdf"/>
    <void:sparqlEndpoint rdf:resource="http://localhost/fuseki/dspace/sparql"/>
    <dc:creator>Waldvogel, Marcel</dc:creator>
    <dcterms:issued>2014</dcterms:issued>
    <dcterms:abstract xml:lang="deu">Oftmals werden Organisationen und Forschungseinrichtungen wie Hochschulen und Universitäten durch viele verschiedene Domains repräsentiert, die auf mehreren Webservern gehostet werden. Dem Anwender sind diese oftmals nicht gänzlich bekannt, da Arbeitsgruppen, Institute, etc. ihre eigenen Domains und Webserver - unter Umständen auch extern gehostet - haben können. Für die Web- Archivierung in großen Organisationen stellt dies ein Problem dar, da a-priori nicht bekannt ist, welche Domains archiviert werden müssen. Diese sollten automatisch erkannt werden. Das Hauptproblem dabei besteht darin, eine Zugehörigkeit von Domains zur Organisation festzustellen. Wir stellen verschiedene Verfahren vor, die vor und während des Harvestens angewandt werden können, um dynamisch zu entscheiden, welche Domains dem Archiv hinzugefügt werden müssen.</dcterms:abstract>
    <dc:creator>Haase, Oliver</dc:creator>
    <foaf:homepage rdf:resource="http://localhost:8080/"/>
    <dc:date rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2018-09-21T11:49:22Z</dc:date>
    <dcterms:rights rdf:resource="https://rightsstatements.org/page/InC/1.0/"/>
  </rdf:Description>
</rdf:RDF>
Internal note
xmlui.Submission.submit.DescribeStep.inputForms.label.kops_note_fromSubmitter
Contact
URL of original publication
Test date of URL
Examination date of dissertation
Method of financing
Comment on publication
Alliance license
Corresponding Authors der Uni Konstanz vorhanden
International Co-Authors
Bibliography of Konstanz
Yes
Refereed