Bandwidth Selection for Local Linear Quantile Regression with Applications to Financial Market Data
Dateien
Datum
Autor:innen
Herausgeber:innen
ISSN der Zeitschrift
Electronic ISSN
ISBN
Bibliografische Daten
Verlag
Schriftenreihe
Auflagebezeichnung
URI (zitierfähiger Link)
Internationale Patentnummer
Link zur Lizenz
Angaben zur Forschungsförderung
Projekt
Open Access-Veröffentlichung
Sammlungen
Core Facility der Universität Konstanz
Titel in einer weiteren Sprache
Publikationstyp
Publikationsstatus
Erschienen in
Zusammenfassung
Quantile regression was originally introduced to the statistical community by Koenker and Basset ( [46], 1978). Estimating the influence of a regressor vector x on a variable y in evaluating the conditional mean estimated by least squares is only one possible aspect. To learn more about its influence on other features of the distribution of several estimated conditional quantile surfaces may be very valuable. More about this rapidly growing field of quantile regression may be found in Koenker s book (2005). Nonparametric regression with mean models started with two papers by Nadaraya ( [56], 1964) and Watson ( [82], 1964). In the meantime, we observe a vast and rapidly growing literature on local polynomial regression. However, as in the parametric world, these procedures are usually combined with nonparametric estimation of conditional quantile functions. Also, in this area we observe an extensive literature. Like in nonparametric regression, the selection of a bandwidth plays an important role in the estimation procedure for the local neighborhood. The paper intends to give a certain review of this subject and gives few examples for financial time series. There arose also another idea of a nonparametric approach to the quantile regression, similar to that for the nonparametric regression. While within the latter field a large number of contributions to the choice of the bandwidth with the local polynomial regression appeared over the past time, the development ran somewhat differently in the field of the local quantile regression. Abberger ( [1], 1996) improved the cross-validation criterion, which was very popular in early approaches to nonparametric regression. His improvement consists in replacing the squared loss criterion by a check-function as introduced by Koenker and Basset ( [46], 1978). He used the criterion (1.17), introduced and examined it as a weighting function to be a possible approach to the bandwidth choice in the local quantile regression. Whereas Yu and Jones ( [87], 1998) studied the bandwidth selection extensively for the local linear quantile estimation. They treated the local linear check-function minimization according to (1.15) with p = 1 and the local linear double kernel smoothing according to (1.9). They showed how an MSE (mean squared error) optimal bandwidth looks like. The topic of iterative plug-in method to obtain the optimal bandwidth for the local linear regression was studied by Gasser, Kneip, Köhler ( [18], 1991). This method turned out to be very successful in practice. As in local linear regression, bandwidth selection plays a very important role also in local quantile estimation. Many papers treating bandwidth choice in nonparametric regression reappeared in the literature. This topic is less frequently touched in local quantile estimation. Therefore, we have modified this plug-in method to be suitable for the local linear quantile estimation.
Our aim was to apply the iterative-plug-in method to the local quantile regression using the R-program to suitable applications in Financial Market data. The plug-in method estimates the Mean Integrated Squared error (MISE), where the unknown terms of the optimal global bandwidth are estimated in several steps. The basic idea of plug-in estimation is to obtain a large sample approximation of MISE, then to minimize the resulting analytical expression with respect to hopt in (4.50) in order to obtain the asymptotically optimal bandwidth ^h, and finally to replace the unknown terms in h^opt in (4.53) by estimators. The study was extended to compare our method with other ones which were employed by Yu and Jones ( [87], 1998) and Abberger [1], 1998).
In chapter 1, an overview of the work is presented.
In chapter 2, the nonparametric regression is described. We describe the estimation of the conditional density and its first derivatives in the section (2.4). In order to receive an estimation for the conditional distribution function of the quantile regression, we need the theoretical background of Fan, Yao and Tong ( [16],1996). With these tools from chapter 4, we can apply the bandwidth choice to quantile regression. Firstly, we introduce the cross-validation as a possibility of the bandwidth choice for the quantile regression. Thereafter, we present the suggestions of Yu and Jones ( [87], 1998) to apply them to the local linear quantile regression. The authors suggest a rule-of-thumb bandwidth with a double kernel approach, which we try to improve in section (4.3) by deducing a plug-in method for the bandwidth choice by the means of the local linear quantile regression with a double kernel. We obtain the theoretically optimal global bandwidth in the sections (4.4), (4.5) and (4.6). In section (2.4), we present an estimation of the conditional density and its derivative according to Fan, Yao and Tong ( [16], 1996). In sections (2.5) and (2.6), we treat the bandwidth choice for the local linear regression. Firstly, we deduce the MSE-optimal global bandwidth with cross-validation and the plug-in method for local linear polynomial regression according to Härdle ( [25], 1990), Fan and Gijbels ( [13], 1996), Gasser, Kneip and Köhler ( [18], 1991).
In chapter 3, we describe the quantile regression. Firstly we explicitly present their problems and introduce the notion of a solution to the quantile regression problem. Then we deal with the asymptotics in the non-parametric general case. The theoretical bases of this chapter have been taken from the article of Koenker and Basset ( [46], 1978), Abberger ( [1], 1996), Koenker [45], Yu and Jones ( [87], 1998). The original work of Koenker and Basset ( [46], 1978) is treated in chapter 3. In section (3.2), we introduce the local linear quantile as the quantile of the conditional distribution function. The asymptotic results are presented in the section (3.4). The local linear check-function and the local linear estimation with double kernel approach are presented in sections (3.5) and (3.6), respectively.
The bandwidth selection for the quantile regression is treated in chapter 4. Firstly, the cross-validation method of Abberger ( [1], 1996) is examined and briefly presented. Then the rule-of-thumb is applied with the double exponential distribution replacing the normal distribution. We generalize the iterative Plug-in algorithm for local linear quantile regression with double kernel smoothing in section (4.5). In section (4.6), we present an iterative-Plug-in algorithm for the local linear quantile regression. In section (4.7), we discuss the consistency and the asymptotic normality of the plug-in algorithm.
In chapter 5, we apply the algorithm to five-year returns of CASE30 (Cairo and Alexandria stock Exchange), twelve-year returns of DAX100 (DAX100-stock index) and ten-year of SP500-returns (American stock index) in sections (5.1), (5.2) and (5.3), respectively.
Zusammenfassung in einer weiteren Sprache
Die Quantilsregression im Rahmen eines linearen Modells wurde erstmals 1978 von Koenker und Basset eingeführt. Seitdem hat dieses Gebiet einen großen Aufschwung
erfahren. Bald kam auch die Idee zu einem nichtparametrischen Zugang zur Quantilsregession auf, ähnlich wie bei der nichtparametrischen Regression. Während im letzteren Bereich im Laufe der Zeit eine große Anzahl von Beiträgen zur Wahl der Bandweite bei der lokal polynomialen Regression erschienen ist, verlief im Bereich der lokalen Quantilsregression die Entwicklung etwas anders. So wurde von Abberger ( [1], 1996) die Kreuzvalidierung mit der von Koenker und Basset ( [46], 1978) eingeführten Checkfunktion als Gewichtsfunktion als ein möglicher Zugang zur Bandweitenwahl in der lokalen Qunatilsregression eingeführt und untersucht. Von Yu und Jones ( [87], 1998) wurde die lokal lineare Quantilsregression vorgestellt. Sie zeigen, wie eine MSE-optimale (mean squared error) Bandweite aussieht. Im Bereich der lokal linearen Regression wurde von Gasser, Kneip und Köhler ( [18], 1991) zur Bandweitenwahl eine sogenannte iterative Plug-in-Methode vorgeschlagen, die sich als sehr erfolgreich in der Praxis herausgestellt hat. Deshalb kamen wir auf die Idee, diese Plug-in-Methode geeignet auf die lokal lineare Quantilsschätzung zu übertragen. Unsere Aufgabe war gestellt, die iterative Plug-in Methode geeignet auf die lokale Quantilsregression zu übertragen, mit R-Programm zu programmieren, auf geeignete Finanzmarktdatensätze anzuwenden und Vergleiche mit den Daumenregelmethoden von Yu und Jones ( [87], 1998) anzustellen.
Im Kapitel 1 wird ein Überblick über die Arbeit vorgestellt.
Im Kapitel 2 wird die nichtparametrische Regression beschrieben. Dabei werden wir zunächt im Abschnitt (2.4) die Schätzung der bedingten Dichte und ihrer Ableitungen beschreiben. Diese benötigen wir, um eine Abschätzung für die bedingte Verteilungsfunktion der Quantilsregression zu erhalten, wofür Fan, Yao und Tong ( [16], 1996) theoretischen Hintergrund liefern. Mit diesen Grundlagen können wir uns mit dem zentralen Kapitel 4, das die Bandweitenwahl bei der Quantilsregression beschreibt, bechäftigen. Darin wird zunächst die Kreuzvaliderung als eine Möglichkeit der Bandweitenwahl bei der Quantilsregression eingeführt. Danach werden wir uns mit den Vorschlägen von Yu und Jones ( [87], 1998) zur lokal linearen Quantilsregression bechäftigen. Dabei erarbeiten die Autoren eine Daumenregelbandweite zum Doppelkernzugang, die wir im Abschnitt (4.3) zu verbessern versuchen, indem wir eine Plug-in Methode für die Bandweitenwahl bei lokal linearer Quantilsregression mit Doppelkernzugang herleiten. Die theoretisch optimale globale Bandweite haben wir in den Abschnitten (4.4), (4.5) und (4.6) hergeleitet.Im Bereich der linearen (nichtparametrischen) Regression bezieht sich dabei unser Zugang insbesondere auf die Orginalarbeit von Gasser, Kneip und Köhler ( [18], 1991) bis auf den Abschnitt über nichtparametrische Schätzung von Gasser and Müller (GM estimator) ( [19], 1979). Im Abschnitt (2.4) wird die Schätzung der bedingten Dichte und ihrer Ableitung von Fan, Yao und Tong ( [16], 1996) vorgestellt. In Abschnitten (2.5), (2.6) behandeln wir die Bandweitenwahl bei der lokal linearen Regression. Zunächst werden Näherungsausdrücke für die MASE-optimalen globalen Bandweiten, Kreuzvalidierung und Plug-in Methode über lokal lineare (polynomiale) Regresion von Härdle ( [25], 1990), Fan und Gijbels ( [13], 1996), Gasser, Kneip und Köhler ( [18], 1991) hergeleitet.
Im Kapitel 3 wird die Quantilsregression beschrieben. Dabei werden wir zunächst explizit ihre Aufgaben, einen Lösungsbegriff und das Problem der Quantilsregression einführen. Danach werden wir die nichtparametrische Quantilsregression vorstellen und auf die Asymptotik im nichtparametrischen Fall eingehen. Die theoretischen Grundlagen dieses Kapitels entnehmen wir dem Artikel von Koenker und Basset ( [46], 1978), Abberger ( [1], 1996), Koenker ( [45], 2005), und Yu und Jones ( [87], 1998). Wir stellen die Quantilsregression allgemein vor. Im Falle der linearen Quantilsregression beziehen wir uns dabei insbesondere auf die Originalarbeit von Koenker und Basset ( [46], 1978) bis auf den Abschnitt über Quantilskreuzung, die dem Buch von Koenker ( [45], 2005) entlehnt ist. Hier gehen wir auch in den folgenden Abschnitten zum Teil eigene Wege. Im Abschnitt (3.2) wird die nichtparametrische Quantilsregression über einen lokal linearen Ansatz und als Quantil der bedingten Verteilungsfunktion vorgestellt. Die Asymptotik im Abschnitt (3.4) entnehmen wir der Arbeit von Abberger ( [1], 1996). In den Abschnitten (3.5), (3.6) wird die lokal lineare Checkfunktion und lokal lineare Schätzung nach Doppelkernzugang von Yu und Jones ( [87], 1998) vorgestellt.
In Kapitel 4 behandeln wir die Hauptfragestellung der Arbeit, nämlich die Bandweitenwahl bei der Quantilsregression. Als erstes wird die Kreuzvalidierungmethode von Abberger ( [1], 1996) untersucht und kurz vorgestellt. Das schließt sich dann an die Diskussion der beiden Daumenregelvorgschläge von Yu und Jones ( [87], 1998) an. Dazu gehören insbesondere vereinfachende Annahmen über die Parallelität der Verläufe gewisser Ableitungen der bedingten Dichten einer Normalverteilung. Diese führen zu einem vereinfachenden Zusammenhang zwischen der Bandweite für einen bedingten Mittelwert und der Bandweite für einen bedingten Median. Für den Fall der Doppelglättung wird übrigens aus technischen Gründen für die Verteilungsfunktion vereinfachend eine Doppelexponentialverteilung anstelle der Normalverteilung genommen. Im Abschnitt (4.5) wird eine Verallgemeinerung des Algorithmus von Gasser, Kneip und Köhler ( [18], 1991) auf iterative Plug-in Doppelkernglättung vorgeschlagen. Im Abschnitt (4.6) wird eine iterative Plug-in Methode für die lokal lineare Qunantilsregression präsentiert. Im Abschnitt (4.7) wird die Konsistenz und asymptotische Normalität des Plug-in Algorithmus untersucht.
Im Kapitel 5 werden wir diesen Algorithmus auf fünfjährige Log-Renditen von CASE30 (Cairo and Alexandria Stock Exchange) und auf zwölfjährige Log-Renditen von DAX100 (Deutscher Aktien Index) bzw. zehnjährige Log-Renditen von S&P500 (Amerikanischerher Aktien Index) in den Abschniten (5.1), (5.2) und (5.3) anwenden. Die Kreuzvalidierungsmethode und die Daumenregelmethode liefern eher etwas zu kleine Bandweiten, während die aus dem direkten Zugang abgeleiteten Bandweiten zu einem eher etwas zu glatten Verlauf führen. Im Folgenden wird nur noch die Daumenregel in den Tabellen berücksichtigt. Schließlich haben wir drei verschiedene Methoden zur Bandweitenwahl bei lokal linearer Quantilsregression kennen gelernt, nämlich: die Kreuzvalidierungsmethode (KV), den Daumenregelansatz, die Plug-in Methode. Die Kreuzvalidierungsmethode liefert uns die Bandweite, die im Durchschnitt die beste Prognose ergibt. Die Daumenregelsbandweite berechnet unter sehr vereinfachten Annahmen eine Bandweite für den Mittelwert. Dann lassen sich alle anderen Bandweiten berechnen. Die Plug-in Methode schätzt ausgehend vor der Bandweite, die den Mean-Integrated-Squared-Error (MISE) minimiert, die unbekannten Terme der optimalen globalen Bandweite durch elf Iterationsschritte.
Fachgebiet (DDC)
Schlagwörter
Konferenz
Rezension
Zitieren
ISO 690
ATTAR, Hoda E. El-, 2008. Bandwidth Selection for Local Linear Quantile Regression with Applications to Financial Market Data [Dissertation]. Konstanz: University of KonstanzBibTex
@phdthesis{Attar2008Bandw-11845, year={2008}, title={Bandwidth Selection for Local Linear Quantile Regression with Applications to Financial Market Data}, author={Attar, Hoda E. El-}, address={Konstanz}, school={Universität Konstanz} }
RDF
<rdf:RDF xmlns:dcterms="http://purl.org/dc/terms/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:bibo="http://purl.org/ontology/bibo/" xmlns:dspace="http://digital-repositories.org/ontologies/dspace/0.1.0#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:void="http://rdfs.org/ns/void#" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" > <rdf:Description rdf:about="https://kops.uni-konstanz.de/server/rdf/resource/123456789/11845"> <dspace:isPartOfCollection rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/46"/> <dspace:hasBitstream rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/11845/1/Bandwidth_Selection_for_Local_Linear_Quantile_Regression_with_Applications_to_Financial_Market_Data.pdf"/> <dcterms:isPartOf rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/46"/> <dc:language>eng</dc:language> <dcterms:issued>2008</dcterms:issued> <bibo:uri rdf:resource="http://kops.uni-konstanz.de/handle/123456789/11845"/> <dcterms:abstract xml:lang="eng">Quantile regression was originally introduced to the statistical community by Koenker and Basset ( [46], 1978). Estimating the influence of a regressor vector x on a variable y in evaluating the conditional mean estimated by least squares is only one possible aspect. To learn more about its influence on other features of the distribution of several estimated conditional quantile surfaces may be very valuable. More about this rapidly growing field of quantile regression may be found in Koenker s book (2005). Nonparametric regression with mean models started with two papers by Nadaraya ( [56], 1964) and Watson ( [82], 1964). In the meantime, we observe a vast and rapidly growing literature on local polynomial regression. However, as in the parametric world, these procedures are usually combined with nonparametric estimation of conditional quantile functions. Also, in this area we observe an extensive literature. Like in nonparametric regression, the selection of a bandwidth plays an important role in the estimation procedure for the local neighborhood. The paper intends to give a certain review of this subject and gives few examples for financial time series. There arose also another idea of a nonparametric approach to the quantile regression, similar to that for the nonparametric regression. While within the latter field a large number of contributions to the choice of the bandwidth with the local polynomial regression appeared over the past time, the development ran somewhat differently in the field of the local quantile regression. Abberger ( [1], 1996) improved the cross-validation criterion, which was very popular in early approaches to nonparametric regression. His improvement consists in replacing the squared loss criterion by a check-function as introduced by Koenker and Basset ( [46], 1978). He used the criterion (1.17), introduced and examined it as a weighting function to be a possible approach to the bandwidth choice in the local quantile regression. Whereas Yu and Jones ( [87], 1998) studied the bandwidth selection extensively for the local linear quantile estimation. They treated the local linear check-function minimization according to (1.15) with p = 1 and the local linear double kernel smoothing according to (1.9). They showed how an MSE (mean squared error) optimal bandwidth looks like. The topic of iterative plug-in method to obtain the optimal bandwidth for the local linear regression was studied by Gasser, Kneip, Köhler ( [18], 1991). This method turned out to be very successful in practice. As in local linear regression, bandwidth selection plays a very important role also in local quantile estimation. Many papers treating bandwidth choice in nonparametric regression reappeared in the literature. This topic is less frequently touched in local quantile estimation. Therefore, we have modified this plug-in method to be suitable for the local linear quantile estimation.<br />Our aim was to apply the iterative-plug-in method to the local quantile regression using the R-program to suitable applications in Financial Market data. The plug-in method estimates the Mean Integrated Squared error (MISE), where the unknown terms of the optimal global bandwidth are estimated in several steps. The basic idea of plug-in estimation is to obtain a large sample approximation of MISE, then to minimize the resulting analytical expression with respect to hopt in (4.50) in order to obtain the asymptotically optimal bandwidth ^h, and finally to replace the unknown terms in h^opt in (4.53) by estimators. The study was extended to compare our method with other ones which were employed by Yu and Jones ( [87], 1998) and Abberger [1], 1998).<br /><br /><br /><br />In chapter 1, an overview of the work is presented.<br /><br /><br /><br />In chapter 2, the nonparametric regression is described. We describe the estimation of the conditional density and its first derivatives in the section (2.4). In order to receive an estimation for the conditional distribution function of the quantile regression, we need the theoretical background of Fan, Yao and Tong ( [16],1996). With these tools from chapter 4, we can apply the bandwidth choice to quantile regression. Firstly, we introduce the cross-validation as a possibility of the bandwidth choice for the quantile regression. Thereafter, we present the suggestions of Yu and Jones ( [87], 1998) to apply them to the local linear quantile regression. The authors suggest a rule-of-thumb bandwidth with a double kernel approach, which we try to improve in section (4.3) by deducing a plug-in method for the bandwidth choice by the means of the local linear quantile regression with a double kernel. We obtain the theoretically optimal global bandwidth in the sections (4.4), (4.5) and (4.6). In section (2.4), we present an estimation of the conditional density and its derivative according to Fan, Yao and Tong ( [16], 1996). In sections (2.5) and (2.6), we treat the bandwidth choice for the local linear regression. Firstly, we deduce the MSE-optimal global bandwidth with cross-validation and the plug-in method for local linear polynomial regression according to Härdle ( [25], 1990), Fan and Gijbels ( [13], 1996), Gasser, Kneip and Köhler ( [18], 1991).<br /><br /><br /><br />In chapter 3, we describe the quantile regression. Firstly we explicitly present their problems and introduce the notion of a solution to the quantile regression problem. Then we deal with the asymptotics in the non-parametric general case. The theoretical bases of this chapter have been taken from the article of Koenker and Basset ( [46], 1978), Abberger ( [1], 1996), Koenker [45], Yu and Jones ( [87], 1998). The original work of Koenker and Basset ( [46], 1978) is treated in chapter 3. In section (3.2), we introduce the local linear quantile as the quantile of the conditional distribution function. The asymptotic results are presented in the section (3.4). The local linear check-function and the local linear estimation with double kernel approach are presented in sections (3.5) and (3.6), respectively.<br /><br /><br /><br />The bandwidth selection for the quantile regression is treated in chapter 4. Firstly, the cross-validation method of Abberger ( [1], 1996) is examined and briefly presented. Then the rule-of-thumb is applied with the double exponential distribution replacing the normal distribution. We generalize the iterative Plug-in algorithm for local linear quantile regression with double kernel smoothing in section (4.5). In section (4.6), we present an iterative-Plug-in algorithm for the local linear quantile regression. In section (4.7), we discuss the consistency and the asymptotic normality of the plug-in algorithm.<br /><br /><br /><br />In chapter 5, we apply the algorithm to five-year returns of CASE30 (Cairo and Alexandria stock Exchange), twelve-year returns of DAX100 (DAX100-stock index) and ten-year of SP500-returns (American stock index) in sections (5.1), (5.2) and (5.3), respectively.</dcterms:abstract> <dc:date rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-25T09:40:38Z</dc:date> <dcterms:rights rdf:resource="http://creativecommons.org/licenses/by-nc-nd/2.0/"/> <void:sparqlEndpoint rdf:resource="http://localhost/fuseki/dspace/sparql"/> <dcterms:alternative>Bandweitenwahl bei der lokal linearen Quantilsregression mit Anwendungen auf Finanzmarktdaten</dcterms:alternative> <dcterms:available rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-25T09:40:38Z</dcterms:available> <dcterms:hasPart rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/11845/1/Bandwidth_Selection_for_Local_Linear_Quantile_Regression_with_Applications_to_Financial_Market_Data.pdf"/> <dcterms:title>Bandwidth Selection for Local Linear Quantile Regression with Applications to Financial Market Data</dcterms:title> <dc:format>application/pdf</dc:format> <dc:rights>Attribution-NonCommercial-NoDerivs 2.0 Generic</dc:rights> <dc:contributor>Attar, Hoda E. El-</dc:contributor> <foaf:homepage rdf:resource="http://localhost:8080/"/> <dc:creator>Attar, Hoda E. El-</dc:creator> </rdf:Description> </rdf:RDF>