Urdu/Hindi Motion Verbs and Their Implementation in a Lexical Resource

Lade...
Vorschaubild
Dateien
Zu diesem Dokument gibt es keine Dateien.
Datum
2014
Herausgeber:innen
Kontakt
ISSN der Zeitschrift
Electronic ISSN
ISBN
Bibliografische Daten
Verlag
Schriftenreihe
Auflagebezeichnung
DOI (zitierfähiger Link)
ArXiv-ID
Internationale Patentnummer
Angaben zur Forschungsförderung
Projekt
Open Access-Veröffentlichung
Open Access Green
Sammlungen
Core Facility der Universität Konstanz
Gesperrt bis
Titel in einer weiteren Sprache
Urdu/Hindi Bewegungsverben und ihre Implementation in einer lexikalischen Ressource
Forschungsvorhaben
Organisationseinheiten
Zeitschriftenheft
Publikationstyp
Dissertation
Publikationsstatus
Published
Erschienen in
Zusammenfassung

A central task of natural language processing is to find a way of answering the question "Who did what to whom, how, when and where?" with automatic means. This requires insights on how a language realizes events and the participants that partake in them and how this information can be encoded in a human- as well as machine-readable way. In this thesis, I investigate the ways that the spatial notions of figure, ground, path and manner of motion are realized in Urdu/Hindi and I implement these insights in a computationally-usable lexical resource, namely Urdu/Hindi VerbNet. I show that in particular the encoding of complex predicates can serve as a guiding principle for the encoding of similar constructions in other VerbNets.

This enterprise involves a detailed investigation of the syntax-semantics interface of motion verb constructions in Urdu/Hindi, in particular the different syntactic alternation patterns that realize motion events. As it turns out, Urdu/Hindi employs complex predicates of motion that denote the manner of motion along a path with two verbal heads. This construction exhibits similar syntactic properties as aspectual complex predicates in the language (Butt 1995). The thesis shows that the combinatorial possibilities between main verb and light verb are driven by the manner/result complementarity established by Levin and Rappaport Hovav (2008, 2013), according to which verbs either lexicalize non-scalar manner of motion or denote a scalar result event. An analysis of the construction in Lexical-Functional Grammar (Bresnan and Kaplan 1982, Dalrymple 2001) shows that the two predicates merge their arguments at the level of argument structure, which in turn can be mapped onto the functional representation along the lines of Bresnan and Zaenen (1990). From a typological point of view, the combination of two verbal heads denoting manner of motion along a path in a monoclausal construction shows that Urdu/Hindi belongs to the group of equipollently-framed languages (Slobin 2004, 2005).

A key component of the syntax-semantics interface, in particular with respect to the combination of syntactic and semantic information in Urdu/Hindi VerbNet, is the notion of event structure. Here, I differ with respect to other VerbNets in following an approach which assumes that syntax has predictable meaning correlates. In particular, I analyze Urdu/Hindi motion verbs in the event-decompositional framework
of the first phase (Ramchand 2008) and show that the approach provides the right level of abstraction for encoding event-structural information on Urdu/Hindi verbs in a computational lexical resource. It makes the right design decisions as to the event structure of the different syntactic alternations that Urdu/Hindi motion verbs can appear in. In particular, it accounts for complex predicates of motion and allows for a consistent theoretical-linguistic treatment of the phenomena, which provides an optimal basis for encoding the construction in the lexical resource.

Urdu/Hindi VerbNet follows the general assumption of other VerbNets, e.g. English VerbNet (Kipper-Schuler 2005, Kipper et al. 2008) and Arabic VerbNet (Mousser 2011), in that semantically similar events are identified by a common syntactic structure. However, due to the multitude of syntactic patterns available in the class of motion verbs in Urdu/Hindi, this principle cannot be ported straightforwardly to Urdu/Hindi. In order to overcome this issue, I combine the theoretical linguistic insights gained in this thesis with those of a computational clustering approach: In particular, the subclasses arising out of the manner/result complementarity are further subclassified by employing an algorithmic visualization system that automatically clusters verbs according to their syntactic and semantic properties. The system offers an interactive way of investigating the resulting clusters and their coherency. This grouping of verbs is the basis for the implementation of the class of motion verbs in Urdu/Hindi VerbNet.

In conclusion, the factors that determine the syntax-semantics interface of Urdu/ Hindi motion verbs allow for a multitude of theoretical insights on motion verb expressions in the language. These insights are used in encoding the concept of motion in Urdu/Hindi VerbNet, a resource that explicitly encodes the relation between syntactic and semantic information and complements other computational lexical resources for the language. The theoretical as well as computational linguistic analyses of the syntax-semantics interface of Urdu/Hindi motion verbs yield insights into the concrete realization of spatial notions in the language, namely the ways of encoding the figure, the ground, the path and the manner of motion; concepts that are present in motion verb expressions across languages.

Zusammenfassung in einer weiteren Sprache

Eine zentrale Aufgabe der maschinellen Sprachverarbeitung ist die Beantwortung der Frage "Wer macht was mit wem, wie, wann und wo?" mit automatischen Mitteln. Um dieses Problem zu lösen, wird Wissen darüber benötigt, wie Sprachen Ereignisse und deren Mitwirkende realisieren und wie diese Information in eine vom Menschen als auch vom Computer lesbare Repräsentation transferiert werden kann. In dieser Dissertation werden die verschiedenen Arten des sprachlichen Ausdrucks von Bewegung in Urdu/Hindi analysiert und die auf theoretisch-linguistischer Basis erworbenen Einsichten werden in eine computationelle lexikalische Ressource für die Sprache, Urdu/Hindi VerbNet, implementiert. Die Einbettung zeigt insbesondere, dass die Art der Einbettung von komplexen Prädikaten in Urdu/Hindi VerbNet als ein Anhaltspunkt für deren Analyse in anderen VerbNets dienen kann.

Dieses Vorhaben beinhaltet eine detaillierte Untersuchung der Syntax-Semantik- Schnittstelle von Ausdrücken der Bewegung, insbesondere der verschiedenen syntaktischen Alternationen von konzeptuell ähnlichen Ereignissen. Wie sich herausstellt, macht Urdu/Hindi Gebrauch von komplexen Prädikaten der Bewegung, die mithilfe zweier Verben die Art der Bewegung entlang eines Pfades ausdrücken. Diese Konstruktion hat aus syntaktischer Sicht Ähnlichkeit mit aspektuellen komplexen Prädikaten in der Sprache (Butt 1995). Die Dissertation zeigt, dass die Kombinationsmöglichkeiten zwischen Vollverb und schwachem Verb unterliegen der “manner/result” Komplementarität (Levin and Rapport Hovav 2008, 2013), gemäß derer Verben entweder die Art oder das Ergebnis eines Ereignisses lexikalisieren. Eine Analyse der Konstruktion im Formalismus der Lexikalisch-Funktionalen Grammatik (Bresnan and Kaplan 1982, Dalrymple 2001) zeigt, dass die zwei Prädikate ihre Argumente auf der Ebene der A-Struktur verschmelzen, die dann mit der Ebene der funktionalen Repräsentation im Stil von Bresnan and Zaenen (1990) verknüpft werden kann. Aus typologischer Sicht zeigt diese Kombination, dass Urdu/Hindi zur Gruppe der “equipollently-framed languages” (Slobin 2004, 2005) gehört.

Eine Schlüsselkomponente der Syntax-Semantik-Schnittstelle, insbesondere im Bezug auf die Verbindung von syntaktischer und semantischer Information in Urdu/Hindi VerbNet, stellt die Analyse der Ereignisstruktur eines Verbes dar. Hierbei unterscheide ich mich von anderen VerbNets, indem ich einen Ansatz verfolge der annimmt, dass Syntax vorhersagbare Interpretationskorrelate hat. Genauer gesagt werden Bewegungsverben auf der Basis des “first phase”-Ansatzes von Ramchand (2008) untersucht. Dabei zeigt sich, dass diese Art der Eventstrukturanalyse eine Ebene der Abstraktion liefert, die bei der Kodierung von ereignisstruktureller Information in der computationellen lexikalischen Ressource bestens geeignet ist. Darüber hinaus trifft der Ansatz die richtigen Annahmen zur Analyse der verschiedenen grammatischen Alternationen, in denen Bewegungsverben in Urdu/Hindi realisiert werden können. Dies trifft insbesondere auf die komplexen Prädikate der Bewegung zu und erlaubt eine konsistente, theoretisch-linguistische Behandlung der Konstruktion, die gleichzeitig eine optimale Basis für deren Einbettung in der computationellen lexikalischen Ressource liefert.

Urdu/Hindi VerbNet folgt den grundlegenden Annahmen anderer VerbNets, so zum Beispiel English VerbNet (Kipper et al. 2008) und Arabic VerbNet (Mousser 2011), indem semantisch ähnliche Events durch gemeinsame syntaktische Alternationen identifiziert werden. Jedoch zeigt die Vielzahl der Alternationsmuster in denen Bewegungsverben in Urdu/Hindi vorkommen können, dass dieses Prinzip nicht ohne Probleme für Urdu/Hindi angewendet werden kann. Um dieses zu überwinden, kombiniere ich die theoretisch-linguistischen Einsichten mit denen eines computationellen Clusteringansatzes: Die Subklassen auf der Basis der “manner/result complementarity” werden mithilfe eines algorithmischen Visualisierungssystems weiter unterteilt. Dadurch werden automatisch Cluster von Verben identifiziert, die sich aufgrund ihrer syntaktischen und semantischen Eigenschaften ähnlich sind. Zudem erlaubt das System einen interaktiven Einblick in die generierten Cluster und deren Zusammensetzung. Die daraus resultierende Verbgruppierung dient als Basis für die Klassifizierung der Bewegungsverben in Urdu/Hindi VerbNet.

Zusammenfassend kann gesagt werden, dass die Faktoren, die die Syntax-Semantik-Schnittstelle bestimmen, eine Vielzahl an thereotisch-linguistischen Einsichten in die Arten des Ausdrucks von Bewegung in Urdu/Hindi geben. Diese Einsichten fließen in die Entwicklung von Urdu/Hindi VerbNet mit ein, eine Ressource, die explizit die Relation von syntaktischer und semantischer Information kodiert.Die theoretischen wie auch computerlinguistischen Analysen der Syntax-Semantik-Schnittstelle von Bewegungsverben in Urdu/Hindi zeigen, wie Räumlichkeit in der Sprache realisiert wird, insbesondere in Bezug auf das sich bewegende Wesen, den Ort, seinen Pfad und die Art der Bewegung; Konzepte, die sprachübergreifend realisiert werden.

Fachgebiet (DDC)
400 Sprachwissenschaft, Linguistik
Schlagwörter
Konferenz
Rezension
undefined / . - undefined, undefined
Zitieren
ISO 690HAUTLI-JANISZ, Annette, 2014. Urdu/Hindi Motion Verbs and Their Implementation in a Lexical Resource [Dissertation]. Konstanz: University of Konstanz
BibTex
@phdthesis{HautliJanisz2014UrduH-28820,
  year={2014},
  title={Urdu/Hindi Motion Verbs and Their Implementation in a Lexical Resource},
  author={Hautli-Janisz, Annette},
  address={Konstanz},
  school={Universität Konstanz}
}
RDF
<rdf:RDF
    xmlns:dcterms="http://purl.org/dc/terms/"
    xmlns:dc="http://purl.org/dc/elements/1.1/"
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:bibo="http://purl.org/ontology/bibo/"
    xmlns:dspace="http://digital-repositories.org/ontologies/dspace/0.1.0#"
    xmlns:foaf="http://xmlns.com/foaf/0.1/"
    xmlns:void="http://rdfs.org/ns/void#"
    xmlns:xsd="http://www.w3.org/2001/XMLSchema#" > 
  <rdf:Description rdf:about="https://kops.uni-konstanz.de/server/rdf/resource/123456789/28820">
    <dc:contributor>Hautli-Janisz, Annette</dc:contributor>
    <dspace:isPartOfCollection rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/45"/>
    <foaf:homepage rdf:resource="http://localhost:8080/"/>
    <dspace:hasBitstream rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/28820/1/Hautli_288203.pdf"/>
    <dc:creator>Hautli-Janisz, Annette</dc:creator>
    <dcterms:title>Urdu/Hindi Motion Verbs and Their Implementation in a Lexical Resource</dcterms:title>
    <dc:date rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2014-08-19T08:59:35Z</dc:date>
    <dcterms:alternative>Urdu/Hindi Bewegungsverben und ihre Implementation in einer lexikalischen Ressource</dcterms:alternative>
    <dcterms:issued>2014</dcterms:issued>
    <dcterms:abstract xml:lang="eng">A central task of natural language processing is to find a way of answering the question "Who did what to whom, how, when and where?" with automatic means. This requires insights on how a language realizes events and the participants that partake in them and how this information can be encoded in a human- as well as machine-readable way. In this thesis, I investigate the ways that the spatial notions of figure, ground, path and manner of motion are realized in Urdu/Hindi and I implement these insights in a computationally-usable lexical resource, namely Urdu/Hindi VerbNet. I show that in particular the encoding of complex predicates can serve as a guiding principle for the encoding of similar constructions in other VerbNets.&lt;br /&gt;&lt;br /&gt;This enterprise involves a detailed investigation of the syntax-semantics interface of motion verb constructions in Urdu/Hindi, in particular the different syntactic alternation patterns that realize motion events. As it turns out, Urdu/Hindi employs complex predicates of motion that denote the manner of motion along a path with two verbal heads. This construction exhibits similar syntactic properties as aspectual complex predicates in the language (Butt 1995). The thesis shows that the combinatorial possibilities between main verb and light verb are driven by the manner/result complementarity established by Levin and Rappaport Hovav (2008, 2013), according to which verbs either lexicalize non-scalar manner of motion or denote a scalar result event. An analysis of the construction in Lexical-Functional Grammar (Bresnan and Kaplan 1982, Dalrymple 2001) shows that the two predicates merge their arguments at the level of argument structure, which in turn can be mapped onto the functional representation along the lines of Bresnan and Zaenen (1990). From a typological point of view, the combination of two verbal heads denoting manner of motion along a path in a monoclausal construction shows that Urdu/Hindi belongs to the group of equipollently-framed languages (Slobin 2004, 2005).&lt;br /&gt;&lt;br /&gt;A key component of the syntax-semantics interface, in particular with respect to the combination of syntactic and semantic information in Urdu/Hindi VerbNet, is the notion of event structure. Here, I differ with respect to other VerbNets in following an approach which assumes that syntax has predictable meaning correlates. In particular, I analyze Urdu/Hindi motion verbs in the event-decompositional framework&lt;br /&gt;of the first phase (Ramchand 2008) and show that the approach provides the right level of abstraction for encoding event-structural information on Urdu/Hindi verbs in a computational lexical resource. It makes the right design decisions as to the event structure of the different syntactic alternations that Urdu/Hindi motion verbs can appear in. In particular, it accounts for complex predicates of motion and allows for a consistent theoretical-linguistic treatment of the phenomena, which provides an optimal basis for encoding the construction in the lexical resource.&lt;br /&gt;&lt;br /&gt;Urdu/Hindi VerbNet follows the general assumption of other VerbNets, e.g. English VerbNet (Kipper-Schuler 2005, Kipper et al. 2008) and Arabic VerbNet (Mousser 2011), in that semantically similar events are identified by a common syntactic structure. However, due to the multitude of syntactic patterns available in the class of motion verbs in Urdu/Hindi, this principle cannot be ported straightforwardly to Urdu/Hindi. In order to overcome this issue, I combine the theoretical linguistic insights gained in this thesis with those of a computational clustering approach: In particular, the subclasses arising out of the manner/result complementarity are further subclassified by employing an algorithmic visualization system that automatically clusters verbs according to their syntactic and semantic properties. The system offers an interactive way of investigating the resulting clusters and their coherency. This grouping of verbs is the basis for the implementation of the class of motion verbs in Urdu/Hindi VerbNet.&lt;br /&gt;&lt;br /&gt;In conclusion, the factors that determine the syntax-semantics interface of Urdu/ Hindi motion verbs allow for a multitude of theoretical insights on motion verb expressions in the language. These insights are used in encoding the concept of motion in Urdu/Hindi VerbNet, a resource that explicitly encodes the relation between syntactic and semantic information and complements other computational lexical resources for the language. The theoretical as well as computational linguistic analyses of the syntax-semantics interface of Urdu/Hindi motion verbs yield insights into the concrete realization of spatial notions in the language, namely the ways of encoding the figure, the ground, the path and the manner of motion; concepts that are present in motion verb expressions across languages.</dcterms:abstract>
    <dcterms:available rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2014-08-19T08:59:35Z</dcterms:available>
    <dcterms:isPartOf rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/45"/>
    <dc:rights>terms-of-use</dc:rights>
    <dcterms:rights rdf:resource="https://rightsstatements.org/page/InC/1.0/"/>
    <dc:language>eng</dc:language>
    <void:sparqlEndpoint rdf:resource="http://localhost/fuseki/dspace/sparql"/>
    <bibo:uri rdf:resource="http://kops.uni-konstanz.de/handle/123456789/28820"/>
    <dcterms:hasPart rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/28820/1/Hautli_288203.pdf"/>
  </rdf:Description>
</rdf:RDF>
Interner Vermerk
xmlui.Submission.submit.DescribeStep.inputForms.label.kops_note_fromSubmitter
Kontakt
URL der Originalveröffentl.
Prüfdatum der URL
Prüfungsdatum der Dissertation
July 4, 2014
Finanzierungsart
Kommentar zur Publikation
Allianzlizenz
Corresponding Authors der Uni Konstanz vorhanden
Internationale Co-Autor:innen
Universitätsbibliographie
Ja
Begutachtet
Diese Publikation teilen