Les développeurs de Be2bill misent sur le Machine Learning pour lutter contre la fraude

Be2bill, la 1ère Fintech française*,  lance un programme novateur utilisant le Machine Learning pour accompagner toujours plus efficacement les marchands dans la prévention de la fraude à la carte bancaire. Le programme vise à diminuer le taux de déclenchement du 3D Secure ; le tout en limitant le nombre d’impayés et en maximisant la conversion.

Retour sur la mise en place de ce projet proposé par 3 développeurs, et conçu lors d’ateliers R&D avec Jérémy Cohen Solal, Chief Development Officer de Be2bill.

Dans quel cadre avez-vous développé ce projet ?

Jérémy : L’entreprise dédie depuis toujours la journée du vendredi à des présentations, formations et ateliers pour les développeurs. Un temps appelé « Freedev » qui met de côté la roadmap habituelle pour permettre aux équipes de prendre du recul et rester à la pointe de l’innovation. Depuis un an, des sessions appelées « Ultimate Friday Coding » ont été ajoutées à ce programme : par équipe de 2 ou 3, chacun peut alors proposer et réaliser une expérimentation qui vise à améliorer la plateforme ou le service rendu aux clients.

C’est l’une de ces équipes, composée initialement de 3 développeurs, qui a choisi de tester le Machine Learning sur un sujet clé pour les marchands : la fraude online et offline.

Et qu’est-ce que le Machine Learning exactement ?

Jérémy : Voici quelques notions pour bien comprendre de quoi il s’agit :

  • Un modèle est une fonction mathématique permettant de prendre des décisions en toute autonomie (c’est-à-dire sans intervention humaine dans la version finale du modèle), en se basant sur différents paramètres fournis.
  • Un paramètre est une information fournie au réseau de neurones. Le choix des paramètres pertinents à fournir au réseau de neurones est crucial et a un impact majeur sur son efficacité finale. Tout l’intérêt du réseau est de mettre en avant des corrélations entre ces paramètres fournis en entrée.
  • L’apprentissage ou entraînement du réseau est une phase où l’on va confronter le réseau à des données historiques afin de lui permettre d’ajuster les différents éléments de pondérations des neurones jusqu’à de converger vers un résultat optimal.

Quelle a été la démarche utilisée ?

Jérémy : Après un état de l’art des technologies et connaissances existantes sur le sujet, l’équipe a choisi d’explorer cette piste des réseaux de neurones.  Puis elle a procédé à la définition de la méthode scientifique utilisée, qui s’appuie sur plusieurs étapes clés :

  • Cadrage du Proof of Concept

De nombreuses librairies ont été envisagées et testées, mais dans une optique pédagogique (et aussi ludique, il faut le reconnaître !), l’équipe a décidé de développer elle-même à partir de diverses publications sa propre implémentation en C++ et OpenCL pour exploiter les GPU (Graphics Processing Unit).

Une fois les jeux de données constitués, l’équipe s’est penchée sur les paramètres les plus intéressants pour le réseau de neurones : une trentaine a ainsi été sélectionnée pour le Proof of Concept, sur la centaine à disposition. Un nombre plus élevé de paramètres aurait rendu encore plus complexe l’analyse sans pour autant en augmenter la pertinence.

  • Implémentation du premier réseau de neurones

Les développeurs ont effectué les implémentations en plusieurs itérations.

  • Phase d’apprentissage du réseau de neurones sur un échantillonnage de 6 mois d’activité

Le code a été ajusté de nombreuses fois. A plusieurs reprises, l’apprentissage a dû être recommencé à partir de zéro pour arriver à des résultats satisfaisants (meilleur échantillonnage, ajout ou retrait des paramètres en input…).

  • Confrontation du réseau de neurones aux 6 mois de trafic suivants

Sur cette période de 6 mois, nous connaissions les cas de fraudes avérées ou théoriques, ce qui nous a permis de valider la pertinence des décisions du réseau de neurones.

Les premiers résultats ont alors été analysés, puis un jeu final de résultats… Le projet était alors suffisamment mûr pour être présenté au reste de l’équipe.

citation-jerem

Comment cette initiative est-elle devenue un véritable projet transverse pour l’entreprise ?

Jérémy : Lors de cette présentation le CIO – Chief Information Officer – de Be2bill, Romain Pera, a immédiatement décelé la pertinence de la proposition, et l’opportunité pour les marchands. Avec ce programme de Machine Learning, une étape supplémentaire est franchie dans la lutte contre la fraude : l’automatisation de l’analyse des transactions sans définition préalable de règles. La décision a donc rapidement été prise d’élargir le projet : l’équipe a proposé d’intégrer le pôle « data » pour affiner les process (paramètres, jeu de données…), et définir une procédure de comparaison et de validation des résultats obtenus par le réseau de neurones. La stratégie adoptée par la team data pour évaluer la pertinence des résultats reposait majoritairement sur les 3D Secure déclenchés et les impayés reçus.

Machine Learning Be2bill : les principaux résultats du Proof of concept

zabjkfdgaezfdhzaf

Sur ce test, l’utilisation du 3D Secure a été divisée par 4, tout en réduisant de près d’un quart le volume d’impayés sur certaines typologies de trafic.

Quelle suite à donner à cette initiative ?

Jérémy : Grâce à ces excellents résultats et pour pouvoir continuer sur cette lancée, un projet de test grandeur nature du réseau de neurones est désormais positionné dans la roadmap de Be2bill afin d’industrialiser un service et de pouvoir le proposer à tous les marchands qui nous font confiance. D’un projet porté initialement par 3 développeurs, nous sommes passés à un programme soutenu par toute l’entreprise, avec des résultats impressionnants. Le « Ultimate Friday Coding » a été l’élément déclencheur, et nous allons bien sûr le reproduire !
Autre enseignement : nous, les développeurs, avons cruellement besoin sur ce type de projets innovants et majoritairement « data centric » pour défricher et être créatifs, de nous confronter à des « data scientists » dont la culture scientifique et statistique ainsi que les méthodes de travail sont de vraies sources d’inspiration.

machine-learning-dev

L’Ultimate Friday Coding, est-ce une véritable rupture dans vos procédés, ou plutôt une continuité ?

Jérémy: Une continuité bien sûr ! L’innovation est au cœur de l’ADN de Be2bill, depuis sa création. Nous avions déjà, dès 2012, été la 1ere solution de paiement à industrialiser un outil permettant un usage sélectif du 3DS (« Smart 3DS ») à nos marchands. Au sein d’un moteur de règles, données bancaires et marchandes sont analysées de manière combinée : contenu du panier, segmentation client, vélocité d’achat ou bien encore utilisation de plusieurs cartes avec le même email… Cette approche par les risques a fait ses preuves, avec en moyenne un taux de déclenchement du 3D Secure de 15%, et un taux de fraude de 0,2% !

Be2bill optimise donc depuis toujours le ratio entre prévention de la fraude et conversion, pour améliorer la profitabilité des marchands.

Pour en savoir plus sur le 3D Secure, découvrez également notre article : 5 idées reçues sur la lutte contre la fraude et le 3D Secure

*classements Frenchweb 2016 et 2017