Revision econometrics ml Économétrie Machine Learning Arthur Charpentier Emmanuel Flachaire Antoine Ly To cite this version Arthur Charpentier Emmanuel Flachaire Antoine Ly Économétrie Machine Learning HAL Id hal- https hal archives-ouvertes fr hal- v Sub

Économétrie Machine Learning Arthur Charpentier Emmanuel Flachaire Antoine Ly To cite this version Arthur Charpentier Emmanuel Flachaire Antoine Ly Économétrie Machine Learning HAL Id hal- https hal archives-ouvertes fr hal- v Submitted on Mar v last revised May v HAL is a multi-disciplinary open access archive for the deposit and dissemination of scienti ?c research documents whether they are published or not The documents may come from teaching and research institutions in France or abroad or from public or private research centers L ? archive ouverte pluridisciplinaire HAL est destinée au dépôt et à la di ?usion de documents scienti ?ques de niveau recherche publiés ou non émanant des établissements d ? enseignement et de recherche français ou étrangers des laboratoires publics ou privés CÉconométrie Machine Learning Arthur Charpentier Université de Rennes CREM Place Hoche Rennes Cedex France arthur charpentier univ-rennes fr Emmanuel Flachaire Aix-Marseille Université AMSE CNRS EHESS bd Maurice Bourdet CS Marseille Cedex France emmanuel achaire univ-amu fr et Antoine Ly Université Paris-Est boulevard Descartes Marne-la-Vallée cedex France antoine ly gmail com Résumé L ? économétrie et l ? apprentissage machine semblent avoir une ?nalité en commun construire un modèle prédictif pour une variable d ? intérêt à l ? aide de variables explicatives ou features Pourtant ces deux champs se sont développés en parallèle créant ainsi deux cultures di ?érentes pour paraphraser Breiman a Le premier visait à construire des modèles probabilistes permettant de décrire des phénomèmes économiques Le second utilise des algorithmes qui vont apprendre de leurs erreurs dans le but le plus souvent de classer des sons des images etc Or récemment les modèles d ? apprentissage se sont montrés plus e ?caces que les techniques économétriques traditionnelles avec comme prix à payer un moindre pouvoir explicatif et surtout ils arrivent à gérer des données beaucoup plus volumineuses Dans ce contexte il devient nécessaire que les économètres comprennent ce que sont ces deux cultures ce qui les oppose et surtout ce qui les rapproche a ?n de s ? approprier des outils développés par la communauté de l ? apprentissage statistique pour les intégrer dans des modèles économétriques JEL Code C C C Key- words apprentissage données massives économétrie modélisation moindres carrés Mars CContents Introduction La Modélisation économétrique Applications De la grande dimension aux données massives Statistique computationnelle et non-paramétrique Plan de l ? article Économétrie et modèle probabiliste Fondements de la statistique mathématique Lois conditionnelles et vraisemblance Les résidus Géométrie du modèle linéaire gaussien Du paramétrique au non-paramétrique Famille exponentielle et modèles linéaires Régression logistique Régression en grande dimension Qualité d ? un ajustement et choix de modèle Économétrie et tests statistiques Quitter la corrélation pour quanti ?er un e ?et causal Philosophie des méthodes de machine learning Apprentissage par une machine Le tournant des années et le formalisme probabiliste Le choix de l ? objectif et la fonction de perte Boosting et apprentissage séquentiel Pénalisation et choix de variables Optimisation et aspects algorithmiques In-sample out-of-sample et validation croisée Quelques outils de machine learning

  • 35
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise
Partager