Une raffinerie pétrolière ressemble à une cathédrale industrielle, un lieu de pouvoir, avec ses tours argentées, ses procédés complexes de craquage, de distillation, ses odeurs prenantes... Un centre de données, par contre, offre un spectacle bien moins dramatique : des bâtiments gris, sans fenêtres, sans hauteur et qui s'étendent à l'infini. Pourtant, les deux ont beaucoup en commun.
...

Une raffinerie pétrolière ressemble à une cathédrale industrielle, un lieu de pouvoir, avec ses tours argentées, ses procédés complexes de craquage, de distillation, ses odeurs prenantes... Un centre de données, par contre, offre un spectacle bien moins dramatique : des bâtiments gris, sans fenêtres, sans hauteur et qui s'étendent à l'infini. Pourtant, les deux ont beaucoup en commun. Pour commencer, ils sont remplis de tuyaux. Dans les raffineries, ils collectent de l'essence, du propane et d'autres composants du pétrole brut qui ont été séparés par la chaleur. Dans les grands centres de données, ils transportent de l'air pour refroidir des dizaines de milliers d'ordinateurs qui extraient des modèles de valeur, des prédictions et d'autres idées, à partir d'informations numériques brutes. Ensuite, tous deux remplissent en quelque sorte le même rôle : produire des matières premières fondamentales pour l'économie mondiale. Qu'il s'agisse de voitures, de plastiques ou de nombreuses matières, une grande partie de la vie moderne n'existerait pas sans le pétrole. Les centres de données, quant à eux, alimentent toutes sortes de nouveaux services en ligne et, de plus en plus souvent, le monde réel à mesure que l'on connecte toujours plus d'objets physiques. Les données sont à ce siècle ce que le pétrole était au siècle dernier : un moteur de croissance et de changement. Les flux de données ont créé de nouvelles infrastructures, de nouvelles entreprises, de nouveaux monopoles, de nouvelles politiques et des économies d'une importance cruciale. L'information numérique est toutefois différente de toute ressource précédente ; elle est extraite, raffinée, valorisée, achetée et vendue de différentes façons. Cela modifie les règles des marchés et exige de nouvelles approches des régulateurs. Et la lutte pour posséder la donnée deviendra de plus en plus acharnée dans les mois et années à venir alors qu'elle devient toujours mieux exploitée et valorisée. Car la tendance n'est pas près de s'arrêter et le nombre de données va continuer à exploser. Le cabinet IDC, une firme de recherche de marchés, prédit que l'univers numérique représentera 180 zettabytes de données (180 suivi de 21 zéros !) d'ici 2025. Selon une récente étude Visual Networking Index de Cisco, le trafic sur le Web sera trois fois plus important d'ici 2021. Et l'on dénombrera trois fois plus d'objets reliés au Web que de personnes sur Terre générant toujours plus de données. C'est qu'il est loin le temps où les principales données étaient vos informations personnelles comme l'âge, le sexe, le revenu, etc. Désormais, la nouvelle économie se base de plus en plus sur l'analyse en temps réel des flux de données rapides, souvent non structurées : les photos et vidéos générés par les utilisateurs des réseaux sociaux, les flux d'informations produits par les voyageurs sur le chemin du travail, les données provenant de centaines de capteurs dans un moteur à réaction, dans les villes ou les usines etc. Des trains aux métros, des éoliennes aux sièges de toilette en passant par les grille-pain, toutes sortes de dispositifs deviennent des sources de données. Le monde va grésiller de capteurs connectés contribuant à cette explosion prévisible du nombre de données. Paul Sonderegger, big data strategist chez l'éditeur de logiciels Oracle, estime d'ailleurs que " les données seront l'ultime externalité : nous les générerons dans tout ce que nous ferons ". Ce n'est pas pour rien que les géants du Net déploient et perfectionnent leurs " raffineries " de données. En 2016, Amazon, Alphabet (holding de Google) et Microsoft ont déboursé près de 32 milliards de dollars à cet effet, soit 22 % de plus que l'année précédente, d'après le Wall Street Journal. Ces gros investissements, les grands acteurs du numérique peuvent se le permettre car ils savent qu'ils les rentabiliseront rapidement. Aujourd'hui, les GAFA (Google, Amazon, Facebook et Apple) atteignent des records d'activités, de revenus nets et de réserves de cash. Ce qui attise, d'ailleurs, la convoitise des investisseurs. Pour s'en convaincre, il suffit de voir que les valorisations des GAFA dépassent de loin celles des principaux acteurs du pétrole (voir infographie " Pétrole numérique vs or noir"). Les quatre principaux géants du Web atteignent, ensemble, une capitalisation boursière de 2.430 milliards de dollars. Tandis que les cinq principaux acteurs du pétrole (Exxon, Shell, Chevron, Total et BP) eux n'atteignent, ensemble même pas la moitié de cette valorisation combinée : leur capitalisation boursière ne grimpe " qu'à " 1.036 milliards de dollars. Plus parlant encore : un acteur comme Facebook a réalisé sur l'année 2016 pas moins de 10,22 milliards de dollars de bénéfices sur un chiffre d'affaires de 27,63 milliards. Soit un niveau de rentabilité de presque 37 % ! Autant dire que Total avec ses 4 % de rentabilité et Exxon Mobile avec ses 3,8 % ont de quoi jalouser les juteuses affaires des GAFA. La valeur de la donnée, ce pétrole de l'économie numérique, semble ne pas cesser d'augmenter. En tout cas, elle alimente une certaine forme de spéculation, y compris pour les entreprises non cotées. Prenons Uber que l'on connaît surtout pour ses transports bon marché de personnes. La réalité, c'est que si l'entreprise vaut environ 68 milliards de dollars, c'est aussi, voire surtout, parce qu'elle possède le plus grand nombre de données sur l'offre (les conducteurs) et la demande (les passagers) pour le transport personnel. C'est ce trésor en devenir auquel les investisseurs attribuent le plus de valeur. Surtout quand on sait que la bête noire de l'univers des taxis a enregistré en 2016 une perte de 2,8 milliards de dollars sur un chiffre d'affaires de 6,5 milliards... De même, pour la plupart des gens, Tesla dont le cours de Bourse dépasse certaines attentes, est un fabricant de voitures électriques. Mais ses derniers modèles collectent des montagnes de données permettant à l'entreprise d'optimiser ses algorithmes de conduite autonome, puis de mettre à jour le logiciel en conséquence. A la fin de l'année dernière, l'entreprise avait recueilli les données de 1,3 milliard de kilomètres de trajets, soit beaucoup plus que Waymo, la division de voitures autonomes d'Alphabet, le holding qui chapeaute Google. Bien que les signes de cette économie de la donnée soient absolument partout, on ne commence à vraiment bien la comprendre que maintenant. Et l'on constate qu'elle profite avant tout aux gros acteurs mondiaux - pour la plupart américains - les fameux GAFA auxquels s'ajoutent un cercle restreint d'entreprises comme Microsoft ou IBM, et les ambitieux géants chinois, les BATX pour Baidu, Alibaba, Tencent et Xiaomi. Ces géants profitent de l'effet de réseau, c'est-à-dire que plus ils attirent d'utilisateurs qui génèrent des données, plus ils peuvent améliorer et affiner leurs services. Ce qui attire encore plus d'utilisateurs. Un cercle vertueux pour eux. Ce n'est pas pour rien qu'en reprenant WhatsApp pour 22 milliards de dollars, Mark Zuckerberg a annoncé vouloir arriver au milliard d'utilisateurs avant de véritablement évoquer ses plans de monétisation : la taille est devenue critique pour ces géants. Plus les utilisateurs laissent des commentaires, des likes, des messages et s'engagent avec Facebook, plus le réseau social apprend à connaître ses utilisateurs et plus Facebook peut améliorer ses fonctionnalités et, bien sûr, adapter ses publicités. De même, plus il y a de recherches sur Google, meilleurs sont les résultats de la recherche. De quoi propulser les plus gros acteurs dans la stratosphère numérique. Au départ, Facebook et Google utilisaient les données collectées auprès de leurs utilisateurs pour mieux cibler les publicités. Le credo était bien sûr qu'en affichant des publicités mieux ciblées, les utilisateurs allaient non seulement se sentir moins " agressés ", et qu'ils se montreraient plus enclins à cliquer sur les pubs. De quoi satisfaire les annonceurs bien sûr, mais aussi les géants du Net qui pouvaient leur facturer des emplacements plus chers. Mais ces dernières années, Google et consorts ont découvert que les données que nous acceptons tous plus ou moins volontairement de partager en ligne pouvaient aussi être transformées en un certain nombre de services d'intelligence artificielle (IA). Certains de ces services augmentent encore l'attrait et l'usage des plateformes comme Facebook ou Google. D'autres deviendront des services à part entière qui généreront de nouvelles sources de revenus. Ces services comprennent la traduction, la reconnaissance visuelle ou l'évaluation de la personnalité de quelqu'un sur la base de ses écrits... Google, par exemple, commence à proposer aux entreprises de greffer leurs idées de services d'intelligence artificielle sur son propre module Tensorflow, tout comme IBM commercialise son intelligence Watson. Certains experts voient d'ailleurs dans l'IA le plus gros marché du 21e siècle. Or, l'IA a besoin d'un nombre colossal de données pour apprendre, car à l'inverse d'un programme informatique qui se code, l'IA s'éduque sur la base des données. Aussi lorsque les internautes intègrent volontairement des photos, les taguent ou les commentent, ils permettent à l'intelligence artificielle de se perfectionner. Quand ils utilisent le majordome virtuel de Google, appelé Assistant, ils le perfectionnent. Tout comme quand ils parlent à la borne intelligente Amazon Echo, ils aident la firme de Jeff Bezos à affiner ses algorithmes intelligents. Cela fait d'ailleurs dire à Laurent Alexandre, observateur spécialisé du monde de l'IA, que " nous sommes les idiots utiles de l'intelligence artificielle. Avec nos photos sur les réseaux sociaux, nous éduquons gratuitement, jour et nuit, l'IA qui va devenir de plus en plus forte et de plus en plus indispensable. " Et donc renforcer et enrichir les grands acteurs du Net qui possèdent les données et savent les utiliser. Géants du Net et start-up orientés données sont devenus les explorateurs pétroliers des temps nouveaux : ils partent à la recherche de ce pétrole numérique, l'extraient (ou le récoltent) et le transforment en nouveaux services malins allant de l'analyse des rayons X aux balises CAT pour déterminer où pulvériser un herbicide sur un champ. Nexar, une start-up israélienne a conçu une manière intelligente d'utiliser les conducteurs comme sources de données. Une fois l'appli téléchargée sur le smartphone, celui-ci se transforme en caméra de surveillance de la route et enregistre les obstacles, les comportements dangereux des autres automobilistes et va même jusqu'à stocker les données qui peuvent servir en cas de litige. L'objectif de l'entreprise est d'offrir aux conducteurs toutes sortes de services susceptibles d'éviter les accidents et qu'ils sont prêts, ou leur assureur, à payer. En Belgique, Real Impact Analytics, une start-up qui a levé 12 millions en juin 2016 et emploie déjà une petite centaine de personnes, a construit son business model sur les données de ses clients, les opérateurs télécoms. Sa promesse ? " Capturer la valeur parmi l'ensemble des données télécoms ". L'un de ses nouveaux produits, baptisé Smart Capex, est destiné aux opérateurs des pays développés et veut les aider à investir intelligemment dans les réseaux qu'ils sont obligés de développer (pour supporter et profiter de l'explosion de données), alors que leurs revenus sont plutôt à la baisse. " Pour faire simple, nous croisons une multitude de données différentes, provenant des opérateurs mais aussi des données socio-démographiques, des données d'infrastructure, etc., détaille le CEO Sébastien Deletaille. Cela nous permet d'aider nos clients à déterminer où et comment établir les priorités de leurs investissements en réseaux. " Et de promettre une optimisation de leurs dépenses d'investissement (capex) de 10 %. Les acteurs du numérique sont désormais loin d'être les seuls à s'intéresser aux données. Depuis longtemps déjà, les acteurs traditionnels veulent aussi capter la valeur de ce nouvel or noir. Le géant General Electric, par exemple, a développé un " système d'exploitation pour l'Internet industriel ", appelé Predix. Ce dernier doit aider les clients de GE à contrôler leurs machines, mais c'est aussi un puissant système de collecte de données : il remonte les infos des machines qui lui sont connectées, les mélange à d'autres données, ce qui lui permet d'alimenter des algorithmes qui peuvent aider à améliorer les process d'une centrale électrique ou à faire de la maintenance prédictive. Un vrai bouleversement dans les industries traditionnelles qui tendent toutes vers ce qu'on appelle aujourd'hui " l'industrie 4.0 ", c'est-à-dire une industrie qui tire le meilleur parti du numérique et, donc, des données. De plus en plus d'acteurs industriels connectent certaines machines pour capturer plus de données pertinentes, ce qui va leur permettre de booster leurs activités de manière exponentielle : traçabilité de biens et de personnes, contrôle à distance, amélioration des informations transmises aux clients et sous-traitants, amélioration des processus de fabrication, etc. Cela fait des années que les unités de production prennent en compte les données pour les faire parler. Sauf qu'aujourd'hui, la différence, c'est qu'elles tentent d'aller vers de l'analyse prévisionnelle et de l'anticipation. Reste que cette transformation numérique ne se fait pas toujours aussi simplement, ni sans peine. Dans un autre domaine, Mastercard fait aussi le pari d'aller extraire de la valeur dans les innombrables données qui transitent sur ses serveurs : soit 65.000 transactions Mastercard par minute à travers le monde. Aussi le groupe vient-il de lancer en Belgique un nouveau service de conseil à destination des commerçants. " Nous avons développé depuis des années une expertise par rapport aux data grâce aux 56 milliards de données traitées chaque année, détaille Henri Dewaerheijd, general manager Mastercard Belux. Nous les utilisions jusqu'ici essentiellement pour anticiper les fraudes : des algorithmes attribuent des scores aux transactions en fonction des comportements des utilisateurs et alertent sur des opérations jugées suspectes. Désormais, nous voulons aller plus loin et proposer aux commerçants de leur apporter du conseil grâce à ces compétences et ces données qui sont très spécifiques et que personne d'autre ne possède. Cela peut les aider à déterminer si leur politique de prix est correcte. De même, des villes ou des régions pourraient découvrir quels touristes dépensent le plus dans leur zone et établir un positionnement spécifique en fonction de cela. " Mastercard entend ainsi séduire les grandes chaînes du retail, de l'hôtellerie, des banques et des collectivités locales. Comme sur le marché du pétrole, les entreprises de données les plus importantes prennent le pas sur les petits acteurs. Par contre, un aspect bien spécifique a de quoi étonner les acteurs du pétrole : si l'or noir constitue l'un des produits les plus négociés au monde, il en va différemment pour les données. Celles-ci ne sont quasi par échangées. En tout cas pas pour de l'argent : il n'y a pas vraiment de marché mondial de la donnée. Le plus souvent, les entreprises les gardent précieusement et réalisent indépendamment la plupart des opérations pour les traiter et en dégager de la valeur. Il est, en effet, souvent plus rentable de générer et d'utiliser des données au sein de son entreprise que d'en acheter et de les vendre sur un marché ouvert. Malgré leur abondance, les flux de données ne sont pas une marchandise si simple : chaque flux d'informations est différent. Il est dès lors difficile pour les acheteurs de trouver un ensemble de données spécifiques qui lui convient exactement et de lui attribuer un prix : la valeur de chaque type de données est difficile à comparer avec celle d'autres données. Les chercheurs ne commencent que doucement à développer des méthodologies de tarification, ce que le cabinet Gartner appelle " l'infonomie ". L'un de ses pionniers, Jim Short de l'Université de Californie à San Diego, étudie les cas où une valeur a bien été attribuée à des données. Par exemple, lorsque l'une des filiales du groupe de jeux de hasard américain Caesars Entertainement a fait faillite en 2015, son principal actif - valorisé à 1 milliard de dollars - était les données des 45 millions de clients inscrits à son programme de fidélité depuis 17 ans. Face à cette difficulté d'établir un prix à la donnée et au manque de marché de la donnée, on observe deux stratégies. Certaines entreprises décident carrément d'acheter d'autres acteurs pour mettre la main sur cet or noir numérique. Ce fut le cas en 2015, lorsqu'IBM a dépensé quelque 2 milliards de dollars (prix estimé) pour mettre la main sur la société Weather Company, ses montagnes de données météo et ses mécanismes de collecte de data. Dans d'autres cas, les entreprises en arrivent à faire du troc : ce fut le cas entre Deep Mind, propriété de Google Alphabet et spécialisée dans l'IA, et le Britain's National Health Service, qui ont convenu de s'échanger l'accès aux données médicales anonymisées des patients. Cette économie en pleine croissance basée sur les données alimente les convoitises et l'intérêt de tous les acteurs du business. Mais elle pose également un nombre grandissant de questions, d'abord sur la vie privée, qui n'ont pas encore été réellement tranchées. Sachant qu'à l'inverse du pétrole, la donnée peut être copiée et utilisée plus d'une fois, la question de sa propriété se pose. Qui possède la donnée ? Prenons le cas d'une voiture autonome : cela pourrait être le constructeur automobile, le fournisseur des capteurs, le passager, voire, à terme, le véhicule lui-même. Dans le cas des données personnelles, les choses sont encore plus compliquées. Et certains imaginent un marché de l'information réglementé qui pourrait permettre d'acheter et de vendre des informations personnelles. Ou, comme l'évoquait le World Economic Forum, un concept de " compte bancaire de données ". Les données d'une personne pourraient " résider dans un compte où il serait contrôlé, géré, échangé et comptabilisé ". Du côté du particulier, le problème est encore différent : les internautes donnent trop facilement des données personnelles en échange de services " gratuits ". Après l'éclatement de la bulle Internet, en 2000, les entreprises du Net étaient à la recherche d'un moyen de gagner de l'argent. La collecte de données pour permettre la publicité ciblée s'est imposée comme la solution la plus rapide. Mais dans la plupart des cas, les internautes n'ont nullement pris conscience que se nouait, entre eux et les acteurs du Net, un véritable contrat sur leurs données : en échange du service gratuit qu'ils reçoivent, les utilisateurs leur donnent accès à ces précieuses informations. Le surfeur " accepte " via les interminables lignes des terms and conditions que les acteurs du Web exploitent leurs données. A l'heure actuelle, les consommateurs et les géants en ligne sont bloqués dans un compromis forcé. D'un côté, les gens ne savent pas combien valent réellement leurs données (quand ils ont conscience de les céder). Et d'ailleurs, ils ne veulent pas vraiment se tracasser de savoir ce qui en est fait, ce qu'ils cèdent et dans quelles conditions. Le plus souvent, les utilisateurs se sentent impuissants face aux terms and conditions que les services en lignes font " signer " au moment de l'utilisation de leurs outils. Et ils n'ont pas vraiment d'autre choix que de les accepter : la plupart des applications mobiles se ferment automatiquement si vous ne cliquez pas sur " j'accepte " et aucun service web n'est utilisable sans que vous n'ayez marqué votre accord sur ces conditions d'utilisation... De l'autre côté, les entreprises du numérique n'ont pas franchement intérêt à changer le " deal " implicite qui se noue avec les surfeurs : elles sont droguées à la donnée qui fait leur fortune. Or, comme se le demandait Dorothée Barba, animatrice du débat du midi sur France Inter, " puisque c'est moi que les acteurs du Net veulent mieux connaître, pourquoi ça ne me rapporterait pas de l'argent à moi ? Imaginez : je publie des photos de mes vacances sur Facebook, je touche 10 euros. Je confie à Uber mes trajets quotidiens ? 50 euros. Sarenza connaît ma pointure et mon goût pour telle marque de basket ? Paf, 200 euros. Bref, avant de vendre des infos me concernant, on me les achète ". Un questionnement loin d'être idiot et qui nourrit d'ailleurs de nombreuses réflexions. Certaines start-up tentent d'ailleurs de s'engouffrer dans le filon et espèrent donner aux consommateurs une plus grande participation face à l'utilisation de leurs données. Citizenme permet aux utilisateurs de rassembler toutes leurs informations en ligne en un seul endroit et de gagner des petits montants s'ils les partagent avec des marques. Datacoup, une autre start-up, vend des informations sur les données personnelles et transmet une partie du produit de cette vente à ses utilisateurs. Toutefois, jusqu'à présent, aucune de ces initiatives n'a vraiment décollé ; et cela risque de ne jamais prendre étant donné la règle de l'effet d'échelle qui donne un net avantage aux mastodontes. Lesquels ne risquent pas de prendre cette direction : s'ils devaient payer pour obtenir les informations de leurs utilisateurs ou développer des mécanismes coûteux pour les collecter, cela rendrait leur business beaucoup moins rentable. Et plus question aujourd'hui de faire payer les utilisateurs pour mener une recherche en ligne ou utiliser son webmail. Car, en marge de de cette nouvelle économie du Web basée sur la donnée, s'est installée l'idée qu'une multitude de services ne doivent plus être payants et que, d'ailleurs, plus personne n'est prêt à ouvrir son portefeuille. Il suffirait de partager nos précieuses données.The Economist, avec Christophe CharlotLes données sont à ce siècle ce que le pétrole était au siècle dernier : un moteur de croissance et de changement. Le cabinet IDC prédit que l'univers numérique représentera 180 zettabytes de données (180 suivi de 21 zéros ! ) d'ici 2025. Certains experts voient dans l'intelligence artificielle le plus gros marché du 21e siècle. Géants du Net et start-up orientés données sont devenus les explorateurs pétroliers des temps nouveaux.