Aufgrund von Vorbereitungen auf eine neue Version von KOPS, können kommenden Montag und Dienstag keine Publikationen eingereicht werden. (Due to preparations for a new version of KOPS, no publications can be submitted next Monday and Tuesday.)
Type of Publication: | Bachelor thesis |
URI (citable link): | http://nbn-resolving.de/urn:nbn:de:bsz:352-200958 |
Author: | Zintgraf, Fabian |
Year of publication: | 2010 |
Summary: |
Tabellen finden sich in fast jedem Medium wieder. In Zeitungen, Büchern, Rechnungen oder in elektronischen Medien vermitteln sie dem Leser strukturierte Daten, die aus bloßem Text viel weniger ersichtlich wären. Wie die Tabellen präsentiert werden, ist für den Menschen irrelevant. Nahezu ohne Schwierigkeiten ist er in der Lage, die Strukturen zu erkennen und aufzunehmen. Automatische Computer-Prozesse müssen sich hier entgegen mühsam an verschiedenen Informationsquellen bedienen, um die Datenstruktur verstehen zu können. Die Menge an verschiedenen Dokumententypen und die verschiedenen Arten von Tabellenlayouts erschweren den Prozess der automatischen Tabellenerkennung zusätzlich. Ein formatübergreifender Austausch von tabellarischen Strukturen, selbst bei den gängigsten Dokumentarten, wird nicht unterstützt. Insbesondere der Transfer von Tabellen innerhalb pixelbasierter Dokumente fehlt. Eine besondere Herausforderung besteht also darin, Tabellen aus verschiedenen Dokumentarten einheitlich abzulegen. Diese Bachelorarbeit beschreibt die Entwicklung eines solchen Modells, in dem tabellenförmige Daten dokumentübergreifend repräsentiert werden können.
|
Summary in another language: |
Tables can be found in almost every medium. In newspapers, books, invoices or electronic media. They provide the reader with structured data, which would be by far less obvious from text only. Usually humans do not have great difficulties with recognizing structured data in table forms. Automatic computer processes have to collect these information arduously from various sources to understand the data structure. Both the amount of different document types and the different types of table layouts complicate the process of automatic table extraction. An exchange of tabular structures between the most common document types is not supported. In particular, the transfer of pixel-based tables within documents is missing. The challenge consists of storing collected table content from various types of documents uniformly. This thesis describes the development of such a model that represents tabular data across different document types.
|
Subject (DDC): | 004 Computer Science |
Controlled Keywords (GND): | Tabelle <Informatik> |
Keywords: | Tabellenmodell, Tabellenrepräsentation |
Link to License: | In Copyright |
ZINTGRAF, Fabian, 2010. Entwicklung eines Modells für die Repräsentation tabellenförmiger Daten aus Dokumenten [Bachelor thesis]
@mastersthesis{Zintgraf2010Entwi-20095, title={Entwicklung eines Modells für die Repräsentation tabellenförmiger Daten aus Dokumenten}, year={2010}, author={Zintgraf, Fabian} }
<rdf:RDF xmlns:dcterms="http://purl.org/dc/terms/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:bibo="http://purl.org/ontology/bibo/" xmlns:dspace="http://digital-repositories.org/ontologies/dspace/0.1.0#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:void="http://rdfs.org/ns/void#" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" > <rdf:Description rdf:about="https://kops.uni-konstanz.de/rdf/resource/123456789/20095"> <dc:creator>Zintgraf, Fabian</dc:creator> <dc:date rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2012-08-14T08:11:50Z</dc:date> <dspace:isPartOfCollection rdf:resource="https://kops.uni-konstanz.de/rdf/resource/123456789/36"/> <dcterms:rights rdf:resource="https://rightsstatements.org/page/InC/1.0/"/> <dc:contributor>Zintgraf, Fabian</dc:contributor> <void:sparqlEndpoint rdf:resource="http://localhost/fuseki/dspace/sparql"/> <dcterms:title>Entwicklung eines Modells für die Repräsentation tabellenförmiger Daten aus Dokumenten</dcterms:title> <bibo:uri rdf:resource="http://kops.uni-konstanz.de/handle/123456789/20095"/> <dcterms:hasPart rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/20095/1/Bachelor_F_Zintgraf.pdf"/> <dspace:hasBitstream rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/20095/1/Bachelor_F_Zintgraf.pdf"/> <dc:rights>terms-of-use</dc:rights> <foaf:homepage rdf:resource="http://localhost:8080/jspui"/> <dcterms:available rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2012-08-14T08:11:50Z</dcterms:available> <dcterms:abstract xml:lang="deu">Tabellen finden sich in fast jedem Medium wieder. In Zeitungen, Büchern, Rechnungen oder in elektronischen Medien vermitteln sie dem Leser strukturierte Daten, die aus bloßem Text viel weniger ersichtlich wären. Wie die Tabellen präsentiert werden, ist für den Menschen irrelevant. Nahezu ohne Schwierigkeiten ist er in der Lage, die Strukturen zu erkennen und aufzunehmen. Automatische Computer-Prozesse müssen sich hier entgegen mühsam an verschiedenen Informationsquellen bedienen, um die Datenstruktur verstehen zu können. Die Menge an verschiedenen Dokumententypen und die verschiedenen Arten von Tabellenlayouts erschweren den Prozess der automatischen Tabellenerkennung zusätzlich. Ein formatübergreifender Austausch von tabellarischen Strukturen, selbst bei den gängigsten Dokumentarten, wird nicht unterstützt. Insbesondere der Transfer von Tabellen innerhalb pixelbasierter Dokumente fehlt. Eine besondere Herausforderung besteht also darin, Tabellen aus verschiedenen Dokumentarten einheitlich abzulegen. Diese Bachelorarbeit beschreibt die Entwicklung eines solchen Modells, in dem tabellenförmige Daten dokumentübergreifend repräsentiert werden können.</dcterms:abstract> <dcterms:issued>2010</dcterms:issued> <dc:language>deu</dc:language> <dcterms:isPartOf rdf:resource="https://kops.uni-konstanz.de/rdf/resource/123456789/36"/> </rdf:Description> </rdf:RDF>
Bachelor_F_Zintgraf.pdf | 258 |