Faire la lumière sur la boîte noire de l’apprentissage automatique
MaisonMaison > Blog > Faire la lumière sur la boîte noire de l’apprentissage automatique

Faire la lumière sur la boîte noire de l’apprentissage automatique

Jun 14, 2024

Gestionnaire de portefeuille principal, Man Numeric

Peu de progrès ont été réalisés à ce jour pour exploiter les modèles d’apprentissage automatique pour l’attribution de portefeuilles de facteurs. Nous expliquons où et comment les investisseurs systématiques peuvent trouver des explications granulaires et locales de la performance.

août 2023

Bien que les modèles d’apprentissage automatique puissent avoir amélioré les rendements, les investisseurs sont actuellement quelque peu aveugles quant à la provenance de ces rendements.

La gestion de portefeuille moderne a de plus en plus adopté les modèles d'apprentissage automatique (ML) pour prédire les rendements en raison de leur capacité à capturer les interactions complexes entre les facteurs. L’inconvénient est que le résultat final est souvent proche d’un modèle de boîte noire avec des sorties hautement optimisées. Cela signifie qu'il est souvent difficile de comprendre les prédictions et la prise de décision d'un modèle. Pour contrer cela, des techniques d’interprétation ou d’attribution de modèles sont utilisées pour tenter d’expliquer la justification des prédictions du modèle et découvrir les caractéristiques qui contribuent le plus au résultat. Cependant, peu de progrès ont été réalisés jusqu'à présent pour exploiter les modèles ML pour l'attribution de portefeuille factoriel, qui est un élément essentiel de l'investissement de portefeuille systématique. Sans cette évolution, il est difficile de comprendre avec précision quels facteurs affectent les rendements des portefeuilles. Bien que les modèles ML puissent avoir amélioré les rendements, les investisseurs sont actuellement quelque peu aveugles quant à la provenance de ces rendements.

Les méthodologies d’attribution factorielle linéaire existantes souffrent de limites telles que le manque de capacité à capturer les effets d’interaction locale et l’hypothèse implicite d’un bêta global unique. Nous pensons plutôt que les investisseurs systématiques doivent regarder au-delà des modèles d’attribution linéaire existants pour trouver des explications granulaires et locales de la performance.

Une solution consiste à utiliser la valeur de Shapley. Dans cet article, nous examinons ce qu'est la valeur de Shapley, comment elle peut être appliquée pour expliquer les sorties du modèle et comment nous calculons les valeurs de Shapley à l'aide de SHapley Additive exPlanations (SHAP) – une implémentation spécifique de la valeur de Shapley. Nous expliquons également comment un cadre d'attribution de performance basé sur SHAP peut être utilisé pour l'attribution de portefeuille local et mondial et introduisons un système d'attribution de portefeuille innovant qui utilise la valeur Shapley et SHAP pour expliquer à la fois le processus de prise de décision et la variation transversale du rendement au niveau local et niveau mondial. Nous démontrons également le pouvoir explicatif amélioré de l'attribution SHAP en incorporant des modèles ML non linéaires tels que XGBoost.

Si les modèles ML continuent de fournir des rendements raisonnables, pourquoi s’inquiéter d’affiner les méthodologies d’attribution ? Bref, parce qu'ils sont insuffisants. Les méthodologies d'attribution factorielle existantes telles que la régression de séries chronologiques, l'attribution transversale des rendements et l'attribution basée sur les avoirs sont basées sur des modèles linéaires, ce qui les rend incapables de capturer les effets d'interaction locaux avec l'hypothèse d'un bêta linéaire global.

Par exemple, la régression des séries chronologiques est limitée par le problème de dimensionnalité et l’hypothèse d’un bêta constant dans le temps, ce qui la rend moins utile pour la gestion dynamique de portefeuille. À l’inverse, l’attribution transversale du rendement avec un ensemble de facteurs de risque, couramment utilisée par les fournisseurs de modèles de risque, suppose que la génération de rendement peut être attribuée à un modèle factoriel global linéaire. Son cousin proche, l'attribution basée sur les avoirs, estime l'exposition des avoirs du portefeuille à un ensemble de portefeuilles factoriels personnalisés. Bien que les trois méthodologies soient basées sur la même structure linéaire de rendement des facteurs, elles diffèrent en termes de sophistication et de flexibilité de personnalisation. Cependant, ces méthodologies ne sont pas capables de capturer les effets d’interaction en raison de la relation non linéaire entre ces variables indépendantes.

La valeur de Shapley est un concept issu de la théorie des jeux coopératifs qui mesure la contribution de chaque joueur aux gains d'un jeu de coalition.

La valeur de Shapley est un concept issu de la théorie des jeux coopératifs qui mesure la contribution de chaque joueur aux gains d'un jeu de coalition. Les quatre axiomes de la valeur de Shapley1 garantissent que la répartition des paiements est équitable lorsque les joueurs peuvent former des coalitions et que les paiements dépendent de la performance de la coalition. La valeur Shapley est la seule méthode de paiement qui satisfait à ces quatre axiomes. La distribution des gains est calculée sur la base de la contribution marginale d'un joueur en permutant toutes les combinaisons de joueurs.