Aller directement au contenu

    Qu’est-ce qui se cache derrière «M», l’intelligence artificielle de Facebook?

    En tout cas, ce ne sont pas seulement des gens qui se font passer pour un robot.

    L’autre jour, on m’a livré un café latte goût citrouille au bureau. J’ai trouvé ça bizarre, n’ayant rien commandé de tel. Mais ce qui l’est encore plus, c’est que mon bienfaiteur est l’une des technologies les plus sophistiquées au monde: il s’agit de M, l’intelligence artificielle-assistant virtuel que Facebook souhaite intégrer à son application Messenger. Je pensais que l’intelligence artificielle (IA) était censée devenir encore plus maligne que les humains et finir tous nous tuer, pas nous envoyer des boissons chaudes. Alors comprenez que je me méfie du gobelet rouge posé sur mon bureau.

    Ça fait environ un mois que j’utilise M. Et même s’il est toujours en phase de test, vous aussi pourriez bientôt en profiter. Avant qu'il se répande, j’ai voulu comprendre comment tout ça fonctionnait, alors je l’ai mis à l’épreuve. Je lui ai demandé de me trouver et réserver un vol, réduire ma facture télé, acheter des places pour Star Wars, m’envoyer des cafés gratuits, écrire une chanson et même faire des dessins. Des tas de dessins.

    Mais voilà: si j’avais compris l’art —littéralement— j’ignorais toujours la manière. Je ne savais rien non plus des intentions de Facebook et des implications éthiques liées à l’utilisation de M. A chaque fois que je lui demandais à qui ou à quoi je m’adressais, M restait vague: «Je suis une IA, mais je suis éduqué par des humains.» Frustration. Si M était surtout de l’IA, alors Facebook tenait là une fantastique innovation technologique, capable de révolutionner le commerce en ligne. Les enjeux économiques sont faramineux pour celui qui parvient à attirer tous les gens qui veulent acheter quelque chose (comme Google, par exemple).

    Si M était, en fait, un être humain lambda assis derrière un ordinateur, alors j’étais un pigeon doublé d’un connard pour avoir obligé des gens à faire tous ces trucs pour moi. Aussi, après des semaines passées à m’interroger sur la vraie nature de M, il était temps pour moi de rencontrer le magicien.

    Il était dans les 13 heures quand David Marcus, l’homme qui connaît tous les secrets de M, m’a rejoint dans une salle de conférence de Menlo Park, au siège de Facebook, en Californie. Je savais déjà à quoi ressemblait le vice-président en charge des produits de messagerie, ayant demandé à M de me le dessiner.

    Il est tout de suite entré dans le vif du sujet concernant la part d’IA et la capacité à évoluer de M —chose sur laquelle il a insisté à plusieurs reprises au cours de notre entretien: oui, M peut évoluer. Et d’ajouter que la présence d’«instructeurs» humains n’empêche pas M d’être déjà largement automatisé. Quant à la rumeur selon laquelle il s’agirait d’un Turc mécanique ou d’une personne se faisant passer pour un robot, David Marcus nie «farouchement».

    Voilà ce qui se passe, d’après David Marcus, lorsqu’un utilisateur sollicite M: après l’envoi d’une requête via Messenger, «une ou plusieurs réponses sont immédiatement formulées par le moteur d’intelligence artificielle, que les instructeurs peuvent valider, réécrire ou autre». Curieusement, l’IA essaie toujours de trouver une réponse.

    Les instructeurs, plusieurs dizaines de sous-traitants qui travaillent au siège, vérifient la pertinence de chacune des réponses de M et décident de les valider ou bien les corriger. S’ils les corrigent, l’IA apprend de ses erreurs: «A chacune de ces interactions, les données sont renvoyées vers l’IA, qui va s’en servir pour améliorer ou automatiser davantage ses réponses», explique David Marcus.

    Il raconte que six semaines avant notre interview, M ne parvenait pas à répondre à une requête pour faire livrer des fleurs. C’est désormais résolu: «Aujourd’hui, il est capable de mener à bien la quasi-totalité du processus. Tout n’est pas encore automatique, puisque ses instructeurs vont continuer à valider les réponses formulées par M, mais ses suggestions sont très, très pertinentes».

    L’intelligence artificielle de M devrait apprendre à automatiser de plus en plus de processus en observant les différents scénarios validés par ses instructeurs, pour ensuite les imiter. Les fleurs d’aujourd’hui sont peut-être les voitures de location de demain. «Avec cette approche verticale, on s’améliore progressivement. Et on est capables d’estimer s’il nous faut encore 10,000, 50,000 ou bien un million de requêtes pour être à l’aise d’un point de vue automatisation. A nous de décider ensuite si ça vaut le coup de continuer dans telle ou telle autre voie», précise-t-il. Je n’en saurai pas plus quant aux outils mis à disposition des instructeurs, une «recette maison», sourit-il.

    J’ai demandé son avis à Oren Etzioni, PDG de l’institut Allen pour l’intelligence artificielle, qui trouve la méthode décrite par David Marcus plutôt convaincante. «Est-ce que ça me semble plausible? La réponse est oui. C’est une approche très rationnelle et très intéressante.»

    GoButler, un autre assistant virtuel combinant lui aussi IA et humains n’a plus besoin que de 40 instructeurs, contre 60 auparavant, grâce à l’automatisation des processus, selon son PDG Navid Hadzaad.

    Marcus, lui, pense pouvoir rendre M accessible au plus grand nombre, mais ça ne se fera pas du jour au lendemain: «En terme [d’extensibilité], on est plutôt bien partis; autrement, on aurait déjà arrêté. Mais ça va nous demander beaucoup de travail, et de temps.»

    Une image vaut mille mots

    Faire livrer des fleurs, d’accord, mais dessiner, écrire une chanson ou envoyer des cafés sont autant de choses qui paraissent impossible à automatiser. «Ce qui est sûr, c’est qu’avec le temps, on va devoir faire le tri», reconnaît-il. «Mais à ce stade relativement précoce, on cherche d’abord à comprendre ce que les gens vont bien pouvoir demander.» Pour Marcus, rester ouvert à toutes les possibilités permet à Facebook de connaître les désirs de ses utilisateurs et d’évaluer le temps nécessaire à l’accomplissement d’une tâche. Et conserver les plus loufoques si la demande est forte —et la rentabilité aussi.

    Alex Lebrun est l’ex-PDG de la société Wit.ai, rachetée par Facebook. Il dirige aujourd’hui l’équipe de spécialistes en IA qui ont créé M. Je l’ai interrogé sur les limites de l’assistant virtuel —en particulier les dessins qu’il est capable de réaliser. J’avais en effet demandé à M de dessiner un portrait de mon frère et je voulais savoir si cette aptitude finirait par être écartée. Après tout, on parle bien d’un robot qui se lance dans une activité artistique —ou tout du moins d’une personne qui apprend à un robot à dessiner.

    «Personne n’avait jamais demandé ça à M, donc il n’y a aucune chance que l’IA sache le faire», m’a-t-il assuré. Le dessin de mon frère est donc l’œuvre d’un humain, mais ça ne veut pas dire qu’un jour, M n’en sera pas capable, précise Lebrun en souriant. «Si on fournit quelques centaines d’exemples de ce genre à nos chercheurs en IA, ils pourront créer un réseau capable de dessiner.» Cela prendrait un temps considérable, mais ce n’est pas impossible. (Le réseau de neurones artificiels de Google maîtrise déjà ce genre de choses.)

    «Tout est possible», affirme Lebrun. «On regarde ce qui se passe, et quand quelque chose revient souvent, l’IA apprend à le faire, et ça nous permet de l’adapter à plus grande échelle.»

    Tout cela, bien sûr, repose sur la bonne foi de Facebook et reste invérifiable sans avoir vu les coulisses de l’IA ou ses instructeurs en action.

    Qu’en pense Etzioni? S’il estime que livrer des fleurs relève du possible, il conçoit mal que dans un futur proche, une IA puisse remplacer un assistant personnel en chair et en os. «Certes, les IA possèdent déjà toute une gamme de compétences similaires et, avec le temps —et de nombreux exemples— elles vont de plus en plus l’étoffer. Mais je ne pense pas me tromper en disant que si l’on se projette dans un an, et malgré les moyens mis à disposition par Facebook, M ne sera pas capable de rivaliser avec un vrai assistant personnel. C’est une tâche bien trop complexe, trop nuancée, trop ouverte.» Autrement dit: pas question de se débarrasser des instructeurs dans les mois qui viennent.

    Marcus et Lebrun ont beau insister sur le temps considérable qu’il faudra pour rendre M opérationnel, ils ont néanmoins toute confiance en la technologie pour y parvenir. «Il y a eu énormément de progrès dans le domaine de l’IA ces dix dernières années, et nous avons la chance de travailler avec une équipe qui est à l’origine de ces avancées», indique Marcus. «Nous avons élaboré un réseau neuronal profond capable d’apprendre, et ça fonctionne.»

    Marcus a raison: le champ de l’IA a connu plus d’une période de vaches maigres, surnommées «hivers de l’IA», le pire de tous remontant au début des années 2000. Quand la fascination fait place à la déception et que la confiance est durablement érodée entre scientifiques et investisseurs, ce sont des années de recherche et d’investissement perdues à tout jamais. Mais la décennie passée a vu le grand retour de l’IA , ce qui explique pourquoi un projet tel que M nous semble, pour la toute première fois, réaliste. De même que la réalité virtuelle, qui a également connu des hauts et des bas et nous paraissait hors de portée il y a encore quelques années, commence à se matérialiser.

    Derrière M se cache un système d’automation basique couplé à une technologie de «deep learning», c’est-à-dire une intelligence artificielle suffisamment nourrie d’exemples qu’elle devient capable de déduire les intentions d’un être humain et d’y répondre, en formulant des suggestions ou en lançant des actions. Sans oublier le rôle essentiel que jouent ses instructeurs, mi-service client, mi-dresseurs d’IA, détaille Lebrun. La plupart d’entre eux possèdent un diplôme universitaire et aucun ne se vexe lorsque l’IA parvient à accomplir une tâche dont eux-mêmes se chargeaient jusqu’à lors. «Il y a tellement de travail avant de rendre M entièrement évolutif, que personne ne le prend mal quand l’IA apprend quelque chose. Au contraire, c’est du travail en moins!», poursuit-il.

    Bien que la situation professionnelle à long terme de ces instructeurs puisse paraître légèrement précaire, Facebook n’est pas près de leur dire au revoir. «Je ne vois pas comment ça pourrait fonctionner sans humains», lâche Marcus. «Même en imaginant que dans quelques années, la plupart des requêtes seront automatisées, l’intervention humaine sera toujours nécessaire dans certains cas.» Malgré tout, M est déjà en train de réduire son champ des possibles: il ne dessine plus à partir de photos, ne signe plus ses dessins «par M» et les latte gratuits, c’est terminé.

    On se connaît?

    Les limites de M ne sont pas seulement techniques. Elles semblent aussi liées à une certaine réticence de la part de Facebook de mettre leur outil dans des situations inconfortables. Outre qu’il refuse d’accomplir quoi que ce soit d’illégal, ce qui est parfaitement compréhensible, M ne vous indiquera pas non plus les coordonnées de cliniques pratiquant l’IVG, ni même celles d’ophtalmologistes référencés dans Yelp. Ne lui demandez pas non plus de vous dessiner des gens connus, ni qui que ce soit «en particulier». On dirait même qu’il a arrêté de m’envoyer l’image la mieux notée sur Imgur chaque jour, lui préférant l’une des plus populaires. Après avoir demandé à M de me trouver du porno à base de tentacules, sur les conseils d’un collègue, il a disparu pendant plusieurs jours, invoquant des problèmes techniques. Lui ai-je grillé les neurones?

    «Si vous êtes une startup et que certaines choses sont problématiques, il est probable que personne ne s’en aperçoive. Mais à notre échelle, c’est impossible, donc il nous faut être un peu plus prudent», explique Marcus.

    M se souvient de tout. Je lui ai demandé d’enregistrer les adresses mail de mes amis, et il est capable d’envoyer une invitation à quelqu’un dès que je mentionne son prénom. Comme il a mémorisé mes coordonnées bancaires, tout ce que j’ai à faire quand je veux effectuer un achat, c’est appuyer sur «acheter» et «payer». M connaît l’adresse de mon domicile et celle de mon travail, donc quand je lui dis «fais-le livrer chez moi», il sait exactement où envoyer le paquet. Il connaît les prénoms de mes frères, mes équipes préférées… la liste est longue.

    En réalité, M est en train de constituer une véritable base de données me concernant: je n’ai jamais donné autant d’infos personnelles à quelque société que ce soit —et ce n’est que le début. Dans une vingtaine d’années, M pourrait bien me connaître encore mieux que mes propres amis. D’ailleurs, si on jouait aux Z’amours tous les deux, je crois que M m’impressionnerait. Mais s’il connaît mes goûts et pas mal d’informations factuelles sur ma vie, il ne me connaît pas. Par exemple, il sait qui sont mes amis, mais il ne sait pas pourquoi nous sommes si proches, ni ne pourrait me suggérer un nouvel ami.

    «Je rejette l’idée qu’une IA puisse vraiment connaître quelqu’un», prévient Etzioni. «Si vous allez sur Amazon ou Netflix, ce genre de sites avec des systèmes de recommandations peu sophistiqués, souvent les suggestions sont totalement à côté de la plaque.»

    Marcus, lui, réfléchit plutôt en terme d’échange: «Pour moi, l’équation est la suivante: si vous estimez qu’un service a plus de valeur que les données que vous lui confiez, alors tout le monde est content. OK, je lui donne mon adresse, mais grâce à elle, il me fera des recommandations sur-mesure. Je vois ça comme un échange de bons procédés.»

    «Je sais bien que c’est un sujet qui excite les foules, poursuit-il, mais la vérité c’est qu’ici, les gens sont bien intentionnés et vraiment attachés au respect de la vie privée.»

    Et après?

    Pour développer son IA, Facebook a mis le paquet. En embauchant, par exemple, plus de 50 chercheurs qui travaillent sous la direction de Yann Lecun et gagneraient, selon certaines sources, des salaires à sept chiffres. Ou encore en s’offrant la start-up Wit.ai en janvier dernier, dont tous les employés et sous-traitants travaillent désormais à temps plein sur M. C’est aujourd’hui l’une des priorités de Marcus et des cadres dirigeants de Facebook —y compris Mark Zuckerberg, qui a eu l’idée de M.

    Pour mieux comprendre cet intérêt pour l’IA et les enjeux économiques sous-jacents, il faut imaginer qu’un jour, M pourrait remplacer Google. Aujourd’hui, ce dernier gagne de l’argent en suggérant des commerces aux internautes. Si vous tapez «fleurs», par exemple, Google vous affichera des pubs pour des fleuristes. Mais si vous faites une recherche via M, c’est Facebook qui rafle la mise.

    Des dizaines de milliards de dollars par an sont donc en jeu pour qui saura le mieux identifier nos «intentions d’achat». Et ça, Google, qui domine aujourd’hui le marché, l’a bien compris; lui non plus ne regarde pas à la dépense pour financer son propre projet d’IA. L’année dernière, il a acheté la start-up londonienne DeepMind pour 400 millions de dollars.

    Alors, Facebook cherche-t-il à marcher sur les plates-bandes de Google? Sans trop s’avancer, Marcus admet néanmoins que M pourrait orienter ses utilisateurs vers des commerces lorsqu’ils recherchent un produit vendu par ceux-ci (le principe même de la proposition de valeur de Google). «Si vous souhaitez acheter des fleurs, on va chercher un fleuriste qui utiliserait notre API pour que lui réponde directement à votre requête», imagine Marcus, suggérant ainsi de «brancher» directement des commerces sur M. «C’est aussi un bon moyen de trouver de nouveaux clients, et peut-être que certains voudront payer pour cela.»

    La mainmise de Google repose essentiellement sur le web, ce qui peut constituer un frein potentiel dans un monde où les gens passent de plus en plus de temps les yeux rivés sur les applis de leur téléphone. Une bonne nouvelle pour M et Messenger, installée et active sur plus de 700 millions d’appareils.

    «Nous avons réussi à prouver que les commerçants ont tout intérêt à communiquer directement avec leurs clients via Messenger», se félicite Marcus. En effet, Facebook a récemment ouvert son appli à quelques commerces, notamment pour leur SAV. A l’image de l’enseigne de prêt-à-porter Everlane, qui envoie après chaque commande un reçu via Messenger, ainsi qu’une photo de l’article commandé et une info-bulle qui affiche les informations de livraison, grâce à des partenariats avec la poste américaine ou encore UPS et FedEx. Si vous répondez que vous souhaitez un autre t-shirt, mais cette fois en noir, Everlane sait de quoi vous parlez.

    «Si j’écris ‘le même en noir’, ils savent que je parle d’un t-shirt, ils connaissent le modèle, ma taille et l’adresse de livraison. Et ils ont aussi mes coordonnées bancaires», se réjouit Marcus. «C’est le bon vieux commerce tel qu’on le pratiquait il y a encore un demi-siècle, et qui a disparu avec l’arrivée d’internet.»

    La compagnie aérienne KLM collabore également avec Facebook pour proposer ses services via Messenger. Imaginez: vous recevez une notification sur votre téléphone, et tout ce que vous avez à faire, c’est appuyer sur le bouton «check-in» et votre carte d’embarquement s’affiche. «Pas d’authentification, jamais hors-contexte, des informations toujours pertinentes à portée de main», résume Marcus.

    Avec tous ces exemples, on imagine aisément Facebook Messenger remplacer tout un tas d’applications. «Nous sommes convaincus qu’aujourd’hui, il y a des situations où un service de [messagerie] est bien plus adapté qu’une appli.»

    Là où ça peut devenir encore plus intéressant, c’est si Facebook ouvre sa technologie pour permettre aux entreprises de créer leur propre M. Une raison supplémentaire pour eux de s’associer à Messenger. Car pour 89% d’entre elles, d’ici 2016, le nouveau champ de bataille sera le service client. Alors si M leur permet de l’améliorer, c’est l’occasion ou jamais de faire la différence. Ce qui ferait de Messenger la principale plate-forme du commerce en ligne, avec plein de petits M intégrés un peu partout. Une stratégie qui devrait rapporter très gros.

    Pour David Marcus, les possibilités de cette IA sont infinies: «Tout ce qu’on en train de faire avec M nous permet d’apprendre à extraire l’intention à partir d’un langage naturel. Si on peut aider nos partenaires à faire de même et en tirer quelque chose, on ne s’en privera pas.»

    Si —et quand— ce jour viendra, M jouera déjà un rôle crucial. Et Facebook a bien l’intention d’en faire profiter tout le monde.

    Traduit par Nora Bouazzouni

    Suivez-nous sur Facebook et Twitter: