Big data et Pôle Emploi – Comment Paul Duan compte régler la question du chômage en France ?

Big data et problèmes sociétaux ? Cette apposition peut sembler paradoxale et c’est pourtant le défi que s’est lancé Paul Duan co-fondateur de l’ONG Bayes Impact à San Francisco en 2014. Au travers d’un rapide tableau du big data et d’un portrait de ce jeune génie des algorithmes de 23 ans, DigitalCorner vous propose de vous pencher sur les possibilités que représentent l’analyse et le traitement des données de masse face aux problèmes de chômage en France.

Retour sur la notion de Big data

Avant toute chose, une définition et présentation du big data et de ses opérateurs, les « data scientists » ou « data analysts », semble de rigueur. Le big data, c’est « l’ensemble des données générées par les nouvelles technologies, caractérisées par leur volume colossal. » (Le Robert). Pour décrire plus en détail les grands principes de cette notion de big data, il est assez courant de s’appuyer sur « les 3V » ; représentant les 3 caractéristiques majeures de cet ensemble :

« V » pour Volume

On ne le dira jamais assez, le 21ème siècle est le siècle de l’information. Les entreprises comme les particuliers en génèrent sans cesse. Les données se comptent en téraoctets, voir même en pétaoctets. Selon Eric Schmidt, ancien PDG de Google, environ 5 exaoctets de données étaient créés tous les 2 jours en 2012. De même, une enquête mené par EMC  montrent que le volume de données créées double tous les ans depuis 2013 et atteindra les 44 milliards de gigaoctets d’ici 2020. Le big data surfe sur cette explosion de création de données et repose sur le volume considérable d’information à traiter.

« V » pour Vitesse

Dans un monde interconnecté, la donnée circule vite, se crée vite et sa valeur se perd tout aussi rapidement. Une utilisation rapide est donc cruciale pour conserver la valeur ajoutée qu’apporte l’analyse de ces données. Il faut donc une puissance de calcul et d’analyse importante, permettant de traiter la donnée à mesure qu’elle est créée.

« V » pour Variété

Le big data doit pouvoir s’intéresser à tout type de données. De la géolocalisation en passant par le texte, la vidéo ou l’image, les outils d’analyse doivent être capables de traiter une masse de données hétérogène et de lui donner du sens.

Voilà pour les 3 premiers V qui caractérisent le big data. Cependant, deux nouveaux V font peu à peu leur apparition :

« V » pour Véracité

La notion de véracité vient d’un besoin de fiabilité de l’information traitée. Avec potentiellement de nombreuses sources d’informations, il est important de s’assurer de la qualité et de la véracité de l’information collectée. Une masse de fausse information générée par des robots ou de faux profils peut amener à une mauvaise prise de décision.

« V » pour Valeur

Ce « V » est le pourquoi, le but recherché avec la mise en place d’outils big data. Car la mise en place de ces outils est bien souvent onéreuse, et la valeur représente alors le retour sur investissement attendu. Toute stratégie de big data est mise en place dans l’optique d’acquérir un avantage, économique, stratégique, décisionnel.

Maintenant que le big data est défini, passons au rôle du data scientist ou data analyst. Une fois les données collectées, il faut pouvoir les trier, les analyser pour leur donner du sens et en tirer une plus-value. C’est le rôle du data scientist, aussi appelé data analyst. De formation souvent technique axée sur la fouille de données et sur l’algorithmique, il doit conserver un intérêt certain pour les fonctions supports de l’entreprise avec lesquelles il travaille en étroite collaboration. Car le data scientist a une mission : il ne parcourt pas les méandres du big data sans objectif, bien au contraire, il analyse les données pour répondre à un besoin formulé par une de ces fonctions support. Le profil classique d’un data scientist est donc souvent assez technique pour être à l’aise avec les quantités de données, mais également  ouvert aux métiers. Il doit en outre avoir des capacités de management pour gérer des échanges constant  avec d’autre spécialistes du big data et les différents acteurs de l’entreprise.

Et si le big data pouvait faire plus ? Et si le V de valeur pouvait s’appliquer à notre société et nos problèmes actuels ? C’est la vision de Paul Duan et de son ONG, Bayes Impact, qui pense que les algorithmes peuvent, plutôt que d’enrichir les grands groupes, résoudre des problèmes plus graves et avoir un impact social bénéfique.

Paul Duan et Bayes Impact

Paul Duan, 23 ans, considéré comme le « super héros de la data science » ou encore le « chevalier blanc de la Sillicon Valley », est un jeune entrepreneur français ayant grandi à Trappes. Il a commencé par étudier à Sciences Po tout en suivant en parallèle une licence de mathématiques, économie et informatique. A 21 ans, il s’envole pour la Californie direction l’université de Berkeley pour y finir ses études. Il intègre ensuite Eventbrite, start-up de billetterie et d’organisation évènementielle et devient leur premier data scientist. En moins de 2 ans, il parvient à mettre en place des algorithmes ayant pour objectif la détection de transactions frauduleuses, ce qui permet à la start up d’atteindre un taux de réussite transactionnel de 99,8%.  Paul Duan a alors un bel avenir en tant que data scientist dans la Sillicon Valley. Seulement voilà, ce n’est pas à quoi il aspire.

Mr Duan voit dans le big data un outil surpuissant. Outil pour l’instant appliqué seulement à l’amélioration des profits de grands groupes mais qui, appliqué à des problèmes de société, pourrait permettre une nette amélioration dans la vie d’un grand nombre de personnes. C’est donc dans cette optique-là, que Paul Duan et Eric Liu fondent Bayes Impact en 2014, une ONG / start-up ayant pour objectif de « rendre le monde un peu meilleur, algorithme par algorithme ». Parmi les projets clefs de Bayes Impact, on peut noter l’optimisation de temps de réponse des véhicules de services des pompiers de San Francisco en s’appuyant sur des algorithmes similaires à ceux d’Uber, les suggestions de répartitions des ressources policières du département de police de San Francisco ou encore la détection de transactions frauduleuses dans des startups de microcrédit, permettant à ces fameuses startups d’économiser de l’argent et donc proposer des taux encore plus avantageux à leurs clients. Ces projets, Paul Duan était venus nous les présenter lors de l’événement L’échappée Volée en Juin 2015 au château de Chambord (voir notre article à ce sujet).

Paul Duan à l'échappée volée 2015
Paul Duan à l’Echappée Volée 2015

Vous l’aurez compris, Bayes Impact et tous ses collaborateurs cherchent à utiliser un outil d’une puissance incroyable pour améliorer la qualité de vie de tout un chacun. Ils se qualifient d’ailleurs parfois de « l’OMS du data ». Cependant un problème persiste. Bayes Impact est à San Francisco, et le chômage français est en France. Paul Duan a donc décidé de quitter les États-Unis pour venir ouvrir l’antenne de son ONG en France.

Et le chômage Français? Quel « plan d’attaque » ?

Pôle Emploi recensait en mars  2016 plus de 3,5 millions de chômeurs de catégorie A, soit 10,5% de la population active (n’ayant pas travaillé le mois passé) et environ 5,5 millions de chômeurs catégories A, B et C confondues.

D’autre part, il semblerait qu’environ 1,5 millions d’offres d’emploi soient à pourvoir à France. Ce chiffre est à prendre avec des pincettes puisqu’il comprend les emplois vacants, les intentions d’embauches et les offres non pourvues, comme l’explique bien cet article du Monde .  On peut cependant voir que malgré un énorme travail de Pôle Emploi, plus de 30 milliards de prestations en 2015, un réel décalage subsiste entre le chômage en France et l’état du marché du travail puisqu’en ne considérant que les offres non pourvues, on arrive à environ 400 000 emplois possibles.

C’est à la réduction de ce décalage que Bayes Impact et Paul Duan proposent d’apporter un petit coup de pouce version big data. Le 21 janvier, Bayes Impact et Pôle Emploi ont donc signé un contrat permettant l’exploitation de ses données anonymisées sur l’état du marché du travail. « Mon Plan d’Attaque » est le nom du projet qui découle de ce partenariat. Il s’agit d’une plateforme sur laquelle les inscrits chez Pôle Emploi pourront renseigner leurs profils, leurs formations et leurs parcours. Des algorithmes de matching professionnels tenteront ensuite d’aider ces utilisateurs dans la recherche d’offres correspondantes, présentes dans les données de Pôle Emploi ou sur d’autres sites internet, ou bien encore proposeront des formations ou réorientations professionnelles. Il ne s’agit pas de remplacer les conseillers Pôle Emploi, mais de fournir un outil supplémentaire. Comme le dit Paul Duan, il s’agit de complémentarité et de collaboration plutôt que de concurrence.

Beaucoup de média ont repris les propos de Paul Duan lors de sa conférence à l’Échappée Volée et ont avancé que l’objectif était de réduire le chômage de 10%. Cependant, comme il le souligne lui-même dans une réponse à un de nos mails, « je n’ai utilisé ce chiffre qu’une seule fois dans un TED talk avant de commencer le projet, il a juste été réutilisé par les médias depuis ». Il avance toutefois qu’en se basant sur les offres non pourvues, qui sont estimées entre 200 000 et 500 000 propositions d’emplois en 2015, 10% de chômage pourrait en effet disparaître en trouvant pour chaque poste le candidat correspondant. De plus il ne s’agit pas seulement de répondre à ces offres mais aussi de proposer des formations plus adéquates et d’apporter un soutien supplémentaire dans la recherche d’emploi. Même si ces 10% ne sont pas une certitude, ils semblent bien être l’objectif que Paul Duan se soit fixé dans ce partenariat entre Bayes Impact et Pôle Emploi. Le lancement de cette plateforme est prévu pour fin 2016 et une première version « beta » du site devrait voir le jour au printemps.

Bayes_motto

Le challenge semble donc être de taille pour une ONG aussi récente et de taille modeste comme Bayes Impact, d’autant plus que la branche française voit à peine le jour. Cependant, les collaborateurs idéalistes mais pragmatiques de cette « nonprofit », comme on appelle les ONG à San Francisco, n’en sont pas à leur coup d’essai, comme on a pu le voir. Ces 10% tant relayés par les médias ne seront potentiellement pas atteint en 2017 mais restent une estimation de ce que Paul veut réaliser, et traduisent bien la volonté qui anime les acteurs de Bayes Impact : la science des données peut être utilisée pour résoudre les problèmes les plus sérieux de ce monde.

 

 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *