Automatische Identifikation relevanter Domains zur Web-Archivierung

Lade...
Vorschaubild
Dateien
Zink_2-cq48vlxjriyc5.pdf
Zink_2-cq48vlxjriyc5.pdfGröße: 571.5 KBDownloads: 299
Datum
2014
Autor:innen
Herausgeber:innen
Kontakt
ISSN der Zeitschrift
Electronic ISSN
ISBN
Bibliografische Daten
Verlag
Schriftenreihe
Distributed Systems Group Technical Report
Auflagebezeichnung
DOI (zitierfähiger Link)
ArXiv-ID
Internationale Patentnummer
Angaben zur Forschungsförderung
Projekt
Open Access-Veröffentlichung
Open Access Green
Core Facility der Universität Konstanz
Gesperrt bis
Titel in einer weiteren Sprache
Forschungsvorhaben
Organisationseinheiten
Zeitschriftenheft
Publikationstyp
Working Paper/Technical Report
Publikationsstatus
Published
Erschienen in
Zusammenfassung

Oftmals werden Organisationen und Forschungseinrichtungen wie Hochschulen und Universitäten durch viele verschiedene Domains repräsentiert, die auf mehreren Webservern gehostet werden. Dem Anwender sind diese oftmals nicht gänzlich bekannt, da Arbeitsgruppen, Institute, etc. ihre eigenen Domains und Webserver - unter Umständen auch extern gehostet - haben können. Für die Web- Archivierung in großen Organisationen stellt dies ein Problem dar, da a-priori nicht bekannt ist, welche Domains archiviert werden müssen. Diese sollten automatisch erkannt werden. Das Hauptproblem dabei besteht darin, eine Zugehörigkeit von Domains zur Organisation festzustellen. Wir stellen verschiedene Verfahren vor, die vor und während des Harvestens angewandt werden können, um dynamisch zu entscheiden, welche Domains dem Archiv hinzugefügt werden müssen.

Zusammenfassung in einer weiteren Sprache
Fachgebiet (DDC)
004 Informatik
Schlagwörter
Web-Archivierung, harvesting, crawling, Web-Server, Domain
Konferenz
Rezension
undefined / . - undefined, undefined
Zitieren
ISO 690ZINK, Thomas, Oliver HAASE, Marcel WALDVOGEL, 2014. Automatische Identifikation relevanter Domains zur Web-Archivierung
BibTex
@techreport{Zink2014Autom-43359,
  year={2014},
  series={Distributed Systems Group Technical Report},
  title={Automatische Identifikation relevanter Domains zur Web-Archivierung},
  number={KN-2014-DISY-01},
  author={Zink, Thomas and Haase, Oliver and Waldvogel, Marcel}
}
RDF
<rdf:RDF
    xmlns:dcterms="http://purl.org/dc/terms/"
    xmlns:dc="http://purl.org/dc/elements/1.1/"
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:bibo="http://purl.org/ontology/bibo/"
    xmlns:dspace="http://digital-repositories.org/ontologies/dspace/0.1.0#"
    xmlns:foaf="http://xmlns.com/foaf/0.1/"
    xmlns:void="http://rdfs.org/ns/void#"
    xmlns:xsd="http://www.w3.org/2001/XMLSchema#" > 
  <rdf:Description rdf:about="https://kops.uni-konstanz.de/server/rdf/resource/123456789/43359">
    <bibo:uri rdf:resource="https://kops.uni-konstanz.de/handle/123456789/43359"/>
    <dc:contributor>Waldvogel, Marcel</dc:contributor>
    <dspace:isPartOfCollection rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/>
    <dc:rights>terms-of-use</dc:rights>
    <dc:creator>Zink, Thomas</dc:creator>
    <dc:contributor>Zink, Thomas</dc:contributor>
    <dcterms:hasPart rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/43359/3/Zink_2-cq48vlxjriyc5.pdf"/>
    <dcterms:title>Automatische Identifikation relevanter Domains zur Web-Archivierung</dcterms:title>
    <dcterms:isPartOf rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/36"/>
    <dcterms:available rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2018-09-21T11:49:22Z</dcterms:available>
    <dc:language>deu</dc:language>
    <dc:contributor>Haase, Oliver</dc:contributor>
    <dspace:hasBitstream rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/43359/3/Zink_2-cq48vlxjriyc5.pdf"/>
    <void:sparqlEndpoint rdf:resource="http://localhost/fuseki/dspace/sparql"/>
    <dc:creator>Waldvogel, Marcel</dc:creator>
    <dcterms:issued>2014</dcterms:issued>
    <dcterms:abstract xml:lang="deu">Oftmals werden Organisationen und Forschungseinrichtungen wie Hochschulen und Universitäten durch viele verschiedene Domains repräsentiert, die auf mehreren Webservern gehostet werden. Dem Anwender sind diese oftmals nicht gänzlich bekannt, da Arbeitsgruppen, Institute, etc. ihre eigenen Domains und Webserver - unter Umständen auch extern gehostet - haben können. Für die Web- Archivierung in großen Organisationen stellt dies ein Problem dar, da a-priori nicht bekannt ist, welche Domains archiviert werden müssen. Diese sollten automatisch erkannt werden. Das Hauptproblem dabei besteht darin, eine Zugehörigkeit von Domains zur Organisation festzustellen. Wir stellen verschiedene Verfahren vor, die vor und während des Harvestens angewandt werden können, um dynamisch zu entscheiden, welche Domains dem Archiv hinzugefügt werden müssen.</dcterms:abstract>
    <dc:creator>Haase, Oliver</dc:creator>
    <foaf:homepage rdf:resource="http://localhost:8080/"/>
    <dc:date rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2018-09-21T11:49:22Z</dc:date>
    <dcterms:rights rdf:resource="https://rightsstatements.org/page/InC/1.0/"/>
  </rdf:Description>
</rdf:RDF>
Interner Vermerk
xmlui.Submission.submit.DescribeStep.inputForms.label.kops_note_fromSubmitter
Kontakt
URL der Originalveröffentl.
Prüfdatum der URL
Prüfungsdatum der Dissertation
Finanzierungsart
Kommentar zur Publikation
Allianzlizenz
Corresponding Authors der Uni Konstanz vorhanden
Internationale Co-Autor:innen
Universitätsbibliographie
Ja
Begutachtet
Diese Publikation teilen