Régression quantile
Les régressions quantiles sont des outils statistiques dont l’objet est de décrire l’impact de variables explicatives sur une variable d’intérêt. Elles permettent une description plus riche que les régressions linéaires classiques, puisqu’elles s’intéressent à l’ensemble de la distribution conditionnelle de la variable d’intérêt et non seulement à la moyenne de celle-ci. En outre, elles peuvent être plus adaptées pour certains types de données (variables censurées ou tronquées, présence de valeurs extrêmes, modèles non linéaires...)[1]
Type | |
---|---|
Inventeur | |
Formule |
Historique
modifierRoger Koenker et George Bassett ont développé le modèle de régression quantile en 1978. Dans leur approche, ils font l'hypothèse que les quantiles conditionnels ont une forme linéaire[2],[3].
En 1986, James Powell généralise la régression quantile aux variables censurées[4],[5],[Note 1].
Applications
modifierEn économie, Moshe Buchinsky utilise les régressions quantiles pour étudier l'évolution des inégalités salariales aux États-Unis[6].
Le modèle
modifierOn définit la fonction quantile conditionnelle de la variable aléatoire y conditionnellement au vecteur de variables explicatives x pour le quantile τ comme
- la plus petite valeur de y telle que la fonction de distribution de y conditionnellement à x soit au moins égale à τ.
Formellement, on adopte la notation suivante[7] :
Si on se restreint au cas où les quantiles conditionnels sont des fonctions linéaires du vecteur de variables explicatives x, on définit[8] :
avec[Note 2]
L'estimateur des paramètres de la régression quantile est alors obtenu en minimisant l'équivalent empirique de la fonction objectif[9] :
Notes et références
modifierNotes
modifier- En statistiques et en économétrie, une variable censurée est une variable pour laquelle on n'observe pas les valeurs en dessous ou au-dessus d'un certain seuil. Par exemple, dans certaines enquêtes pour des raisons de confidentialité, on ne demande pas aux individus gagnant plus d'un certain seuil de revenu le montant exact de leur revenu. Dans ce cas, la variable obtenue est une variable censurée : on a la valeur du revenu pour tous les individus gagnant moins que le seuil et pour les autres, on sait simplement que leur revenu est supérieur à ce seuil (Buchinsky 1998).
- On note la fonction indicatrice qui vaut 1 ou 0 selon que l'expression à l'intérieur des parenthèses est vraie ou fausse
Références
modifier- Pauline Givord, Xavier D’Haultfœuille, « La régression quantile en pratique »
- (en) Roger Koenker et G. Bassett, « Regression quantiles », Econometrica, , p. 33-50
- Angrist et Pischke 2008, p. 272
- (en) James Powell, « Censored quantile regression », Journal of Econometrics, vol. 32, no 1, , p. 143-155 (lire en ligne, consulté le )
- (en) Moshe Buchinsky, « Recent Advances in Quantile Regression Models : A Practical Guideline for Empirical Research », The Journal of Human Resources, vol. 33, no 1, , p. 88-126 (lire en ligne, consulté le )
- (en) Moshe Buchinsky, « Changes in the U.S. Wage Structure 1963-1987: Application of Quantile Regression », Econometrica, vol. 62, no 2, , p. 405-458 (lire en ligne, consulté le )
- (en) Joshua Angrist et Jörn-Steffen Pischke, Mostly Harmless Econometrics : An Empiricist's Companion, Princeton University Press, , 1re éd., 392 p. (ISBN 978-0-691-12035-5), p. 270
- Angrist et Pischke 2008, p. 271, équation 7.1.2
- Angrist et Pischke 2008, p. 271-272
Voir aussi
modifierBibliographie
modifier- (en) Roger Koenker, Quantile Regression, Cambridge University Press,
Articles connexes
modifierLiens externes
modifier- (en) Roger Koenker, « Quantile Regression », sur Econometrics at the University of Illinois (consulté le )