Les modèles d’analyse de risque : construction et application

12 juillet 2021

La crise sanitaire du Covid-19 a vu apparaître deux phénomènes :

Une augmentation du nombre de demandes de prêts lié à la mise en place des garanties de l’État
Un accroissement des incertitudes sur les probabilités de défaut.

Pour pallier au risque, les banques et organismes de crédit doivent accélérer leur transformation et s’outiller d’un modèle d’analyse de risque fiable et rapide. Chez October, nous avons développé nos propres modèles d’analyse de risque. Ils sont désormais accessibles aux tiers grâce au lancement d’October Connect, notre technologie de neolending pour le financement d’entreprises.

Pour parler de nos modèles d’analyse du risque, nous sommes allés à la rencontre de Tejas Sherkar notre Head of Data chez October. Découvrez dès à présent son interview.

Qu’est-ce qu’un modèle d’analyse de risque ? Quel est l’objectif de ce modèle ?

Un modèle de d’analyse de risque ou risk scoring model est un ensemble de règles permettant de quantifier le risque lié à l’octroi d’un crédit à un emprunteur. Ces règles et les données qui les alimentent déterminent la nature, la complexité et les performances du modèle.

Les modèles de rating se concentrent principalement sur la prédiction de la solvabilité de l’emprunteur. Alors que les modèles de scoring peuvent prédire la solvabilité et le défaut de paiement potentiel.

Comment construire un modèle d’analyse du risque ?

Après avoir défini clairement le problème à résoudre, nous pouvons commencer à construire un modèle. Dans le cas d’October, le problème est le suivant : comment traiter les demandes de prêt de manière rapide, industrielle et sécurisée afin d’aider le plus grand nombre d’emprunteurs possible tout en maintenant notre risque de défaut à un niveau acceptable ?

Nous avons affaire ici à un problème de classification binaire (défaut vs. pas de défaut).

Pour commencer, nous collectons les données de notre data lake (un centre de données construit en interne avec des propriétés ACID* renforcées) comprenant les entreprises existantes de notre portefeuille et leur comportement en matière de remboursement, toutes les demandes de prêt effectuées et leurs données financières associées, les données de transaction bancaire et les indicateurs de défaut.

Cette étape est généralement suivie d’un nettoyage des données où nous examinons la distribution de tous les points de données liés aux demandes de prêt historiques, afin de traiter les anomalies et les valeurs manquantes. Le but de cet exercice est de comprendre notre population et de construire une base de données représentative sur laquelle nous pouvons exercer notre modèle.

Chez October, nous utilisons à la fois des modèles linéaires et non-linéaires testés sur cette base de données représentative. Les modèles non-linéaires sont souvent considérés comme une boîte noire mais nous utilisons l’approche SHAP (« SHapley Additive exPlanations ») pour rendre ces modèles totalement explicables.

Quel est le cycle de vie d’un modèle d’analyse du risque ?

Une fois le modèle testé et déployé en production, nous surveillons les points de données – ceux utilisés par le modèle pour effectuer le scoring – sur une période donnée allant généralement de 3 à 6 mois.

Si les propriétés statistiques de ces nouveaux points de données ont changé de manière significative par rapport au dernier training du modèle, il est probable que nous le testions à nouveau et que nous déployions en production une version améliorée de celui-ci. Mais ce n’est pas systématique : il faut comprendre pourquoi la population a changé et les biais que cela introduit.

Nous sommes également à l’affût de nouveaux points de données qui pourraient améliorer les performances de notre modèle. Ils peuvent être soit nouvellement conçus à partir de données existantes, soit provenir de tiers.

Kea a été lancé avec le partenariat Qonto x October. Quelle est la différence entre le scoring Kea et Magpie ?

Deux modèles de scoring sont utilisés chez October Magpie et Kea. Nous avons construit Magpie et Kea en utilisant le même type d’algorithme de machine learning. Ils diffèrent toutefois par le type d’informations analysées et la catégorie d’entreprises visées.

Magpie est un modèle de notation instantanée qui examine les informations financières (bilan + compte de résultat) et comportementales des PMEs et attribue une note de 1 à 5 relative à la probabilité de défaut.

Kea, quant à lui, analyse les transactions bancaires et les données comportementales pour calculer la probabilité de défaut de l’emprunteur.

Qu’est-ce que Kea analyse dans les transactions bancaires de l’entreprise ?

Les transactions bancaires fournissent un aperçu unique des opérations quotidiennes d’une entreprise. Kea étudie de nombreux indicateurs pour analyser la capacité et la volonté de l’emprunteur à rembourser le potentiel crédit.

Ces indicateurs vont du paiement régulier des charges aux calendriers de remboursement des prêts existants, en passant par les retards de paiement et l’évolution du solde bancaire dans le temps.

Quel a été l’impact de la nouvelle réglementation DSP2 (open banking) sur la création de ce nouveau modèle de notation ?

Le règlement DSP2 permet au client de partager en toute sécurité les données bancaires de son entreprise avec un prêteur (comme October) via une API en quelques secondes.

Un modèle comme Kea (entièrement basé sur les transactions bancaires) peut donc analyser ces données instantanément, permettant un traitement plus sûr et plus rapide d’une demande de prêt.

Quel impact ce modèle de notation a-t-il sur le processus de crédit ?

Les modèles de notation comme Magpie et Kea réduisent le temps nécessaire pour prendre une décision de crédit. Ils aident également à faire des économies d’échelle et apportent un certain cadre à notre offre de produits. Nous pouvons ainsi informer nos partenaires et nos emprunteurs en amont, des étapes à suivre ou des documents à avoir sous la main.

À quels types d’entreprises s’adresse le scoring Kea ?

Pour l’instant, Kea score les TPE-PME en France et en Italie. Le montant du prêt peut atteindre 30 000 euros avec ou sans garantie de l’État. Une extension vers l’Espagne est en cours.

Derrière ces modèles automatiques, quelle place pour l’humain ?

Bien que le scoring de crédit soit effectué de manière automatique, l’expertise de notre équipe opérationnelle est précieuse. Elle continue a procéder à l’identification du client et à effectuer certains contrôles anti-fraude et de conformité avant le financement de l’emprunteur.

*ACID pour Atomicité, Cohérence, Isolation et Durabilité : les propriétés élémentaires garantissant la fiabilité d’une transaction.