L’UTILISATION DU MODÈLE DE COX-PLS DANS LA PRÉVISION DE DÉFAILLANCE DES ENTREPR

L’UTILISATION DU MODÈLE DE COX-PLS DANS LA PRÉVISION DE DÉFAILLANCE DES ENTREPRISES Sami Ben Jabeur IPAG Business School, 184 Boulevard Saint-Germain, 75006 Paris sbenjabeur@gmail.com Résumé. L’objectif de cet article est d'appliquer le modèle Cox-PLS (Partial Least Squares) à la prévision de la détresse financière d'entreprises françaises afin d'estimer leur risque de défaut et d'élaborer un indicateur du risque de faillite. Cette recherche est motivée par les insuffisances des modèles de prévision traditionnels. L'échantillon est composé de 800 petites et moyennes entreprises françaises pour lesquelles des données comptables et financières ont été collectées et une batterie de 33 ratios financiers a été calculée sur la période 2006-2008. Les prévisions issues de l’analyse Cox-PLS sont comparées à celui de modèle de Cox ; les probabilités de défaut estimées constituent un bon indicateur en termes de prévision du risque de faillite de un à trois ans avant le dépôt de bilan. Mots-clés. Modèle de Cox, régression PLS, défaillance d’entreprises Abstract. The objective of this paper is to apply the Cox-PLS model (partial least squares) to the prediction of financial distress of French firms to estimate the risk of corporate default and develop a bankruptcy risk indicator. This research is motivated by the inadequacies of traditional forecasting models. The sample consists of 800 small and medium-sized French companies where accounting and financial data was collected and a battery of 33 financial ratios were calculated over the period 2006-2008. The forecast from the Cox-PLS analysis are compared to that of the Cox model; the estimated default probabilities are a good indicator in terms of forecasting bankruptcy risk of one to three years before filing for bankruptcy. Keywords. Cox model, PLS regression, business failure 1 Introduction L’objet commun des modèles de prévision de faillite est de tenter, grâce aux ratios comptables et financiers sélectionnés, d’affecter une entreprise quelconque à l’un des deux groupes suivants : les entreprises défaillantes et les entreprises non défaillantes. Les études peuvent être catégorisées en différentes familles, selon la méthode de classification utilisée. Les plus nombreuses recourent aux méthodes de discrimination statistiques paramétriques : les analyses discriminantes d'une part et les techniques économétriques sur données qualitatives (logit, probit) d'autre part. Dans ce papier, nous essayons d’appliquer une nouvelle approche : la régression Cox-PLS, qui trouve son succès dans plusieurs domaines, notamment la finance. 2 Le modèle de Cox-PLS La régression PLS univariée est un modèle non linéaire reliant une seule variable dépendante Y à un ensemble de variables quantitatives ou qualitatives X1,…, Xk (Wold 1983). Elle peut être obtenue par une suite de régressions simples et multiples. En exploitant les tests statistiques associés au cadre de la régression linéaire classique, il est possible de sélectionner les variables explicatives significatives à conserver dans la régression PLS et de choisir le nombre de composantes PLS à retenir. On cherche de plus à fournir des coefficients de régression interprétables, c’est-à-dire que l’on puisse mesurer la contribution de la variable Xj, 1 ≤ j ≤ k, à l’explication de la variable Y. Il existe plusieurs versions de l’algorithme de régression PLS univariée. Elles diffèrent au niveau des normalisations et des calculs intermédiaires. Selon Bastien et al. (2005), Fisher (2004), l’algorithme de la régression PLS peut se décomposer comme suit. On construit tout d’abord une composante PLS T1 avec : k k 1 1 11 1 X w ... X w T + + = où : ∑ = = k 1 j 2 j j j 1 ) X , Y cov( ) X , Y cov( w , 1 ≤ j ≤ k Ces coefficients sont ensuite normalisés : ∑ = = k 1 j 2 j 1 j 1 * j 1 ) w ( w w , 1 ≤ j ≤ k Puis on effectue une régression simple de Y sur 1 T : 1 1 1 ε T c Y + = où 1 c est le coefficient de régression et ε1 le vecteur des résidus. Toutefois, si l’on estime que le pouvoir explicatif de ce modèle n'est pas suffisant, on cherche une deuxième composante 2 T , combinaison linéaire des Xj, non corrélée à 1 T et expliquant bien le résidu ε1. Cette composante 2 T est combinaison linéaire des résidus j 1 χ des régressions des variables Xj sur la composante 1 T : avec 1 j 1 j j 1 T p X χ − = , 1 ≤ j ≤ k et ) T var( ) T , X cov( p 1 1 j j 1 = , 1 ≤ j ≤ k On obtient alors 2 T : k 1 k 2 11 21 2 χ w ... χ w T + + = On procède ensuite à une régression multiple de Y sur 1 T et 2 T : 2 2 2 1 1 ε T c T c Y + + = où c1 et c2 sont les coefficients de régression et ε2 le vecteur des résidus. On peut itérer ce processus en utilisant de la même manière les résidus ε2, χ21, …, χ2k des régressions de Y, X1 , ..., Xk sur T1 et T2 . Le nombre de composantes Th à retenir est habituellement déterminé par validation croisée. Pour chaque valeur h, on calcule des prédictions de la variable d’intérêt Y. Plus précisément, pour un échantillon de n individus, on calcule les prédictions hi Y ˆ de Yi, 1 ≤ i ≤ n, en utilisant tous les individus, puis ) i ( h Y ˆ −sans utiliser l’individu i. Puis on calcule les critères h RSS (Residual Sum of Squares) et h PRESS (Prediction Error Sum of Squares) définis par : 2 hi n 1 i i h ) Y ˆ Y ( RSS − = ∑ = et 2 ) i ( h n 1 i i h ) Y ˆ Y ( PRESS − = − = ∑ Selon Umetri (1996), la composante h T sera retenue si : 1 95 . 0 − ≤ ≤ h h RSS PRESS Une fois que l’on a retenu le nombre des composantes, la prédiction de la fonction de risque de défaillance s’effectue ensuite en ajustant le modèle de Cox sur les composantes, non pas sur les variables d’origine. Le principe de l'approche Cox-PLS étant maintenant introduit, nous allons présenter les caractéristiques de l’échantillon utilisé puis les résultats de l’étude. 3 Données Une batterie de trente trois ratios financiers (R01, …, R33) a été calculée (voir annexe 1). Ces ratios ont été choisis parmi ceux qui sont couramment utilisés dans la littérature financière (Altman 1968, Deakin 1972, Ohlson 1980, Hamer 1983, Liou et Smith 2007) ou qui présentent un contenu informationnel significatif dans l’analyse de la situation financière des entreprises. La construction des modèles de prévision est faite sur la base d’un échantillon de 800 PME françaises appartenant à différents secteurs d’activité issu de la base des données DIANE (l’accès instantané aux données des entreprises françaises pour l’analyse économique), divisé en deux groupes de 400 entreprises chacun, le groupe des entreprises saines et le groupe des entreprises défaillantes. Une entreprise sera considérée défaillante dès lors qu’elle aura fait l’objet d’une liquidation judiciaire auprès du tribunal de commerce durant l’année 2009. Les données étudiées sont organisées de telle sorte que l’exercice comptable est disponible pour les années 2008, 2007 et 2006. Pour la construction du modèle de prévision, la variable explicative Y est la durée de vie de l’entreprise calculée à partir de la base des données DIANE. 4 Résultats Les corrélations entre les variables potentiellement explicatives sont données dans le tableau suivant. Table 1: Tableau de corrélation Variables explicatives Coefficient de Pearson (R01,R21) (R06, R22) 0.806 -0.954 (R07,R08) (R07, R17) (R07,R18) (R07,R19) (R12,R13) (R14, R18) (R17,R18) (R18, R08) (R18,R19) 0.983 0.950 0.884 0.611 0.508 0.760 0.922 0.855 0.760 Afin d’estimer les paramètres des modèles, nous avons utilisé l’ensemble de l’échantillon. Ces données posent problème en régression de Cox, à cause des fortes corrélations entre les variables explicatives, ce qui peut conduire à exclure à tort du modèle plusieurs ratios pourtant jugés pertinents dans l’explication de la défaillance. En régression PLS, on remplace ce bloc de variables par la(es) composante(s) PLS et toutes les variables importantes sont conservées. Les résultats de notre étude montrent que les modèles de régression Cox-PLS sont un outil intéressant pour la prédiction du risque de défaillance des entreprises. Ce constat nous a permis d’affirmer qu’il est plus réaliste et plus intéressant de prévoir la défaillance par un modèle de régression Cox-PLS, plutôt que par le modèle de Cox classique. La plupart des travaux empiriques sont réalisés à partir d’échantillons de grande taille qui ne sont pas équilibrés puisqu’ils ne font pas la distinction entre entreprises saines et défaillantes, et portent sur des prédictions à moyen terme effectuées avec un nombre réduit d’indicateurs comptables. La régression Cox-PLS permet de pallier ce dernier problème en intégrant un grand nombre de ratios dans le modèle ; en outre, elle permet de résoudre le problème de corrélation, tel que la prise en compte des uploads/Finance/ submission-19.pdf

  • 26
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Apv 25, 2022
  • Catégorie Business / Finance
  • Langue French
  • Taille du fichier 0.0658MB