Data Intelligence

"Analyse prédictive : pourquoi, pour qui et comment tout simplement" par Mounir Rochdi


Mounir Rochdi


Agé de 12 ans à peine, MogAI avait prédit l’élection de Donald Trump en tant que 45ème Président des Etats-Unis et cela deux semaines avant l’annonce même des résultats officiels. Plus fort encore, MogAI avait aussi correctement prédit les gagnants des trois précédentes élections américaines. C’est-à-dire celles de Barak Obama et Georges W. Bush. Comment a-t-on pu réussir quatre fois de suite ces prédictions ? Cela pourrait faire rougir de jalousie les plus grands voyants de la planète. Les sondeurs quant à eux auraient surement aimé rencontrer MogAI avant l’annonce des résultats.



... Mais MogAI n’est ni un enfant ni même un être humain. C’est une intelligence artificielle développée en 2004 par la start-up indienne Genic.ai.

Sanjiv Rai, créateur de cette intelligence artificielle, a expliqué que la prédiction a été possible grâce à l’analyse de plus de 20 millions de données sur les engagements des électeurs pour leurs candidats. Ces données proviennent des plates formes des réseaux sociaux telles que FaceBook (y compris Facebook live), Youtube, Twitter ou encore les requêtes de recherche. La machine avait détecté que les engagements pour Trump dépassaient largement ceux d’Obama observés en 2008 au pic de sa popularité.

Sanjiv Rai a expliqué que sa machine pouvait prédire le gagnant seulement en observant les données des engagements pour les candidats même si les sondages prétendent l’inverse. Cependant l’entrepreneur avoue tout de même qu’il y avait moins d’utilisateurs sur les réseaux sociaux lors des trois précédentes élections que l’ors de l’élection de Donald Trump. Le risque de mauvaise interprétation de la tonalité des engagements est donc plus élevé.

En effet, un engagement négatif pour un candidat pourrait être mal interprété par MogAI lorsqu’il s’agit d’un jeu de mots ou d’ironie. Par exemple si un électeur rédige « J’adore le candidat Y. Il a dit au revoir à 650 de ses salariés lorsqu’il était chef d’entreprise », la machine pourrait considérer cela comme positif pour le candidat Y puisque le texte ne fait apparaitre aucun élément négatif. Mais le cerveau humain comprendra le sens ironique de ce texte qui veut dire que le candidat avait licencié 650 personnes. Heureusement l’analyse prédictive ne se base pas uniquement sur l’interprétation des tonalités mais principalement sur l’analyse statistique et les corrélations.

_analyse_predictive __pourquoi,_pour_qui_et_comment_tout_simplement__par_mounir_rochdi.pdf "Analyse prédictive : pourquoi, pour qui et comment tout simplement" par Mounir Rochdi.pdf  (536.63 Ko)

Par Mounir Rochdi
Par Mounir Rochdi

Cause à effet et corrélation au cœur de l’analyse prédictive

Manger de la crème glacée augmente le risque de noyade. Les statistiques démontrent aussi que manger de la crème glacée augmente le risque d’incendie de forêt. Plus étrange encore, les overdoses augmentent les chances de survies. Ces trois conclusions vous paraissent totalement absurdes n’est-ce pas ?

Analysons d’abord les deux premières affirmations glacées. Lorsqu’il fait très chaud, les ventes de crèmes glacés augmentent. Tous les vendeurs le confirmeront. Aussi, lorsqu’il fait très chaud, l’herbe des forêts est plus sec et cela augmente le risque d’incendie. Enfin lorsqu’il fait très chaud, le nombre de baigneurs augmentent. Il existe donc un effet de causalité entre chaleur, consommation de glace, incendie de forêt et baignade. Par ailleurs, nous savons que le nombre de noyades risque d’augmenter si le nombre de baigneurs est très élevé. Il n’y a donc aucun lien de cause à effet entre crème glacée et incendie de forêt. Mais plutôt un élément commun qu’on désigne comme corrélation : c’est la chaleur.

Si on fournit à un logiciel d’analyse automatique toutes les statistiques sur la crème glacée, les baignades, les noyades et les incendies des 10 dernières années, il risque d’aboutir à des affirmations drôles comme « consommer de la crème glacée augmente le risque d’incendie de forêt ». Afin de réduire ces interprétations erronées, les développeurs intègrent dans l’analyse prédictive d’autres algorithmiques plus complexes d’analyses des données. C’est pour cela aussi que c’est toujours un être humain qui devra consulter et valider en dernier lieu les résultats obtenus par l’Intelligence Artificielle.

Maintenant que nous avons compris le niveau basique de l’analyse prédictive, revenons à la confirmation « les overdoses augmentent les chances de survies. ». Quel est, selon vous, la corrélation dissimulée, entre ces deux sujets ? C’est le don d’organe !

Récemment au Canada et plus particulièrement en Colombie-Britanique, le Fentanyl, un analgésique 100 fois plus puissant que la Morphine, fait des ravages parmi les toxicomanes. Cette région du Canada a déploré 914 décès par overdose en 2016. Soit 80% de plus qu'en 2015. Le Fentanyl était en cause dans deux tiers de ces décès. Cette vague de décès par overdose bénéficie de manière significative aux dons d'organes depuis la fin 2016. Cette situation inquiète bien évidement les autorités sanitaires canadiennes qui mettent en place des nouvelles mesures pour endiguer cette crise de santé publique en débloquant 54 millions d'euros.

Ce dernier exemple montre l’apport qu’aurait pu fournir l’analyse prédictive dans le cadre de l’anticipation de crises sanitaires publiques. Ceci nous amène donc à identifier les domaines d’application potentiels.


A qui peut profiter l’analyse prédictive ?

Les domaines d’applications sont divers et variés tels que l’assurance, la banque, la santé, la publicité ou encore la justice. Les premières applications sont déjà visibles dans les domaines de la publicité et les voyages. Amazon utilise l’Intelligence Artificielle pour prédire les futurs besoins de ses clients. Sa base de plusieurs millions de produits commandés par plusieurs millions de clients dans plusieurs pays lui permet de procéder à des analyses avancées pour identifier les prochaines tendances. Le géant du commerce en ligne utilise aussi l’intelligence artificielle pour afficher des publicités ciblées.

Au niveau du voyage, le comparateur en ligne Kayak utilise l’analyse prédictive pour évaluer le prix des billets et conseiller les voyageurs sur le bon moment pour acheter son billet par rapport à la hausse ou à la baisse probable de son prix.

Dans le domaine de la banque, la meilleure utilisation de l’analyse prédictive est sans doute dans l’octroi de financements. Mieux qu’un dossier de demande de crédit ou qu’un calcul du taux d’endettement, l’analyse prédictive permettra d’évaluer plus précisément les risques relatifs à un client surtout si ce dernier possède son compte bancaire dans le même établissement où il demande son crédit.

Au niveau de la santé, l’analyse prédictive peut intervenir à plusieurs niveaux. Par exemple pour détecter à l’avance les maladies chroniques telles que le diabète, les maladies cardio-vasculaires, la polyarthrite, etc. Diagnostiquer une personne atteinte par une maladie chronique n’est pas évident. Pourtant, selon l’Organisation Mondiale de la Santé, ce type de maladie est responsable de 17 millions de décès dans le monde chaque année.

Détecter ce type de maladies bien à l’avance aura un impact positif sur la vie professionnelle et sociale du patient puisqu’il pourra être pris en charge à temps. Disons-le aussi, cela aura un impact positif sur les coûts de santé publique. Les hôpitaux peuvent eux aussi utiliser l’analyse prédictive par exemple au niveau des réadmissions pour évaluer s’il est plus prudent de garder un patient plutôt que de le laisser partir au risque de le voir revenir rapidement pour une autre pathologie ou pour se faire soigner à nouveau pour le même diagnostic. L’analyse prédictive pourrait permettre aux hôpitaux de mieux anticiper sur les investissements à réaliser par rapport à une population, à une région et à une pathologie. En termes d’entreprise spécialisée nous pouvons, à titre d’exemple, citer l’entreprise indienne Genic.ai (MogAI) qui travaille elle-même dans la santé prédictive ou encore la startup française en biotechnologie Oricore.

Au niveau des mutuelles, des institutions de prévoyance (IP) et des groupes de protection sociales (GPS), nous pouvons citer AXA qui avait déjà lancé en 2014 des projets sur l’analyse prédictive à travers son incubateur de Smart Data. FM Global a déployé des outils d’analyse prédictive dédiés au domaine du risque. Le groupe MGEN avait lancé en 2015 une enquête avec Opinion Way sur la perception de la « médecine prédictive » par les Français. 75% avaient déclarés être prêts à effectuer des tests génétiques. Harmonie Mutuelle, Malakoff Médéric et Pro BTP s’intéressent aux systèmes de lutte contre la fraude qui se basent, entre autres, sur l’analyse prédictive.

En effet, selon l'Agence pour la lutte contre la fraude à l’assurance (Alfa) et l'Argus de l'assurance, les fraudes à l’assurance ont représenté un coût d’environ 2,5 Milliards d'Euros en 2015 en dommages soit 5% des primes. Dans le domaine de la santé, la lutte antifraude et la relation client sont deux sujets dans lesquels les systèmes d’analyse prédictive sont de plus en plus appliqués et améliorés.

Enfin au niveau de la lutte contre la criminalité, la police de Los Angeles (LAPD) utilise déjà l’analyse prédictive à travers le programme PredPol (Predictive Policing) qui a été développé par l’Université de Californie. Le programme identifie les zones où il y a plus de chance qu’un crime soit commis en compilant les données des infractions passées et les quartiers à risques. En 6 mois les agressions ont diminué de 33% et les crimes violents de 21%.

La gendarmerie française travail depuis deux ans sur des méthodes prédictives au sein du Service Central du Renseignement Criminel (SCRC). Ils analysent des données interne (Atteintes aux biens, aux personnes, vols d’automobiles, cambriolages) et des données issues de l’Open Data. Les gendarmes prennent également en compte des données socio-économiques. Le SCRC va désormais tester des outils comme IBM Watson afin de continuer sur leur expérimentation de l’analyse prédictive.


Quels sont les outils de l’analyse prédictive ?

Contrairement à ce que l’on pourrait croire, l’analyse prédictive existe depuis plus de dix ans. On parlait plus de Data Mining. C’est l’avènement du big et de l’open data qui l’a remis au goût du jour. Il existe des plates formes connues et incontournable comme la fameuse intelligence artificielle d’IBM Watson ou encore SAP et SAS avec Rapid Predictive Modeler.

Il existe aussi des outils et des algorithmes à portée de clic mais qui nécessitent, pour certains d’entre eux, des connaissances techniques très avancées. Nous citerons à titre d’exemple Weka 3, scikit-learn et RapidMiner.

Il n’est pas possible de parler d’analyse prédictive sans citer l’application ludique Predictive World. Il s’agit d'une expérience en ligne qui prédit votre avenir en se basant sur votre profil FaceBook. La plateforme a été développée par le "Psychometrics Center de l'Université de Cambridge" et a été améliorée par le célèbre éditeur de jeux vidéo UBISOFT. A tester sans attendre.


Alors pour ou contre l’analyse prédictive ?

Devons-nous être pour ou contre l’analyse prédictive ? À la vue de la complexité et la sophistication des processus et des algorithmes, il serait utopique de croire que l’on pourrait répondre par un simple oui ou un non à la question posée.

Il est vrai que ce domaine suscite beaucoup de questions principalement liées à la vie privée. En effet dès que l’on parle santé, profil, dossier judiciaire, on rentre dans le vif du sujet de la protection des données personnelles. Certains ont peur des dérives que le système peut avoir, d’autres pensent plutôt aux avantages qu’ils profèrent. Ce qui est sûr c’est que les voyants devraient bientôt se mettre à l’analyse prédictive au risque de perdre leurs clients. A charge pour ce dernier de donner accès à son profil complet afin qu’on puisse lui lire son avenir.

Il n’existe pas de solution miracle. Même si l’analyse prédictive se développe de plus en plus, la décision finale doit revenir à l’être humain.


 

Mounir Rochdi
Président de ThinkTankers
Vice-Président du GCIC









Partager ce site