[BHK10] Sur l’utilisation conjointe de la régression sur composantes principales et des ondelettes
Revue Nationale avec comité de lecture :
Journal MODULAD,
pp. 38-58,
2010
motcle:
Résumé:
La régression sur composantes principales (RCP) est une régression sur les facteurs d’une
ACP préalablement effectuée sur des variables initialement corrélées. L’utilisation de l’ACP
permet de remplacer les variables initiales, par des composantes principales qui conservent la
quasi-totalité de l’information, et qui présentent l’avantage d’être non corrélées. Ces
composantes, sont prises comme variables explicatives pour une régression linéaire multiple.
La qualité de la modélisation par RCP reste affectée par l’existence de bruit dans les variables
initiales. Nous proposons dans ce travail un débruitage des données par ondelettes (wavelets)
permettant de séparer le signal du bruit sans perte d’information. Nous montrons, sur des
données boursières françaises, que l’élimination du bruit sur les composantes principales par
un seuillage doux à base d’ondelettes améliore la qualité d’ajustement du modèle de
régression ainsi que la qualité des prévisions. Nous confirmons le résultat par simulation.
Mots clés: Ondelettes, Seuillage, RCP, ACP, débruitage, simulation