Aller au contenu | Aller au menu | Aller à la recherche

La donnée n'est pas donnée : le livre !

L'an dernier (mars 2015), EchoRadar avait organisé un colloque sur "La donnée n'est pas donnée", en partenariat avec Keyrus. Après un long travail de recueil des différents textes (la plupart des intervenants plus des contributions extérieures), voici les actes enfin publiés, sous la direction de Philippe Davadie, Bruno Teboul et moi-même. Vous trouverez ci-dessous l'avant-propos qui présente les thèmes et les auuteurs traités. Bonne lecture ! OK

donnee_pas_donnee.jpg

La donnée n'est pas donnée, Ph. Davadie, O.Kempf, B. Teboul (direction), Kawa éditions.

 

 

 

Le monde et son économie ont tourné autour d'axes successifs. À la fin du XX° siècle et à l'aube du XXI°, les autoroutes de l'information ont constitué un axe majeur de leur transformation. Des travaux d'infrastructure ont été nécessaires pour construire les réseaux par lesquels transiteraient l'abondance d'information que chaque personne allait émettre, sans oublier celles qu'elle allait devoir assimiler et analyser afin de prendre la décision la plus pertinente.

Puis, de même que les sciences du vivant se sont tournées vers les nanotechnologies, les sciences de l'information et de la communication se sont tournées vers leur nano-élément : la donnée, tant il est vrai qu'une information ne peut se construire que sur des données, quelle que soit la valeur de chacun de ces nano-constituants.

Petit à petit, l'infrastructure, bien qu'en perpétuelle amélioration avec l'augmentation des capacités de calcul des ordinateurs et des débits des réseaux, a laissé la place à la donnée comme axe de développement de l'économie.

Or noir du XXI° siècle, carburant des entreprises, Big Data, la donnée a pris une place centrale dans les termes du débat.

En poursuivant la comparaison entre le cyberespace et les sciences du vivant, nous constatons qu'à l'instar du monde réel, le cyberespace est lui aussi guetté par des pathologies modernes : l'infobésité en est la plus emblématique. Allons-nous pouvoir digérer toutes les données produites ou sommes-nous condamnés à les stocker de manière disgracieuse jusqu'à ce que nous sachions quoi en faire ou comment les éliminer ?

 

Évoquer ces questions nous amène à prendre en compte la place centrale de la donnée dans le monde qui se construit. Est-elle une ressource que l'on peut traiter comme on le veut ? Le gisement de données est-il, contrairement aux richesses fossiles de notre planète, inépuisable ? À qui appartiennent les données produites en quantité de plus en plus importante chaque jour ?

Nous le remarquons, ces questions sont proches de celles qui sont évoquées lorsqu'on aborde l'avenir de notre planète.

Allons-nous donc assister prochainement à un développement de l'écologie des données ? À la naissance de droit à émettre des données pour éviter la data-pollution ? À la mise en place d'une bourse d'échange des données ? À un recyclage des données ?

Il est important de ne pas perdre de vue ces questions, sachant qu'un marché noir des données fait déjà florès dans la partie obscure de l'internet.

 

Toutes ces questions ne peuvent avoir de réponse que si l'on se penche, au préalable, sur la définition précise de la donnée. Qu'est-ce qu'une donnée ? Un économiste considère-t-il une donnée comme le fait un informaticien ? Comment s'effectue la transition de la donnée (émise) aux données (traitées) ? La donnée, ou les données, influencent-elles nos stratégies, étatiques et privées ?

Il est indispensable de répondre, ou de tenter de le faire, à ces questions, car on ne peut travailler correctement un objet que si l'on connaît bien ses caractéristiques. Travailler (sur) les données sans savoir précisément ce qu'elles sont peut conduire à des impasses.

Et d'ailleurs, peut-on travailler (sur) les données ? Sont-elles des choses dont chacun peut disposer comme il veut ou sont-elles le reflet d'un ensemble plus important qu'elles qui mérite qu'on s'y arrête avant de lancer tout type de travaux ?

 

Toutes ces questions, qui demeurent sans réponse univoque, ont poussé à l'organisation du colloque la donnée n'est pas donnée à l’École Militaire en mars 2015. Son titre était sciemment un jeu de mots, car il se voulait une interpellation de ce qui est considéré comme acquis : actuellement, la data est donnée, car soit on ne paye pas pour l'acquérir afin de la travailler, soit sa valeur vénale (déclarée) est fort peu élevée[1]. Les travaux en cours pour estimer la valeur d'une donnée ne parviennent d'ailleurs pas encore à résoudre cette question de façon univoque.

 

C'est à partir de ces questions fondamentales que l'architecture du colloque a été conçue. Il semblait indispensable d'interroger d'abord la donnée, de tenter de la définir avant de considérer divers ensembles de données, puis d'étudier leur influence sur les stratégies privées et publiques. Ces interrogations ont tout naturellement construit les quatre tables rondes du colloque.

 

La première, qu'est-ce qu'une donnée ?, ne pouvait qu'être le socle du colloque. Nous l'avons dit, on ne peut travailler un objet que si l'on connaît ses propriétés et qu'on sait qu'il peut être façonné. Esquiver cette question ne peut mener qu'à des déconvenues.

Les données changent la donne comme l'expose Jean-Paul Pinte, car l'environnement des données ne cesse de croître, rendant nos vies de plus en plus numériques. Puisque la donnée, or noir du XXI° siècle, a manifesté son importance dans un monde informatisé, il était logique d'interroger tout d'abord un informaticien et un économiste, afin qu'ils expliquent ce que représentait une donnée. Comme l'a expliqué Christian Schmidt, la donnée est au cœur de l'économie qui en produit et en consomme, l'un des défis de cette science étant de transformer des données immatérielles en éléments matériels ; Jean Rohmer rappelant quant à lui que les données précèdent l'informatique et qu'elles sont partout sauf dans l'ordinateur. Ainsi, la donnée était immédiatement observée sous les deux angles les plus en vue actuellement. Mais une vision de la donnée que l'on pourrait qualifier d'utilitariste ne peut suffire. Parce qu'elle est émise par l'Homme ou par un artefact conçu par celui-ci, il est fondamental de passer la donnée au tamis de la philosophie. Que nous apprend la donnée sur l'Homme qui en est son principal émetteur et utilisateur ? Emmanuel Brochier, estime que la donnée est une perte d'information et que considérer l'Homme comme une somme de données revient à le mathématiser. Mais mathématiser la nature conduit à son épuisement.

 

La deuxième de la donnée aux données, avait pour objet de préciser les conséquences d'un passage du singulier au pluriel. Une fois un certain regard posé sur la donnée, en la considérant d'une certaine manière, puis-je encore la considérer de la même façon si je l'appréhende comme élément d'un groupe de données ? Le vrai problème du Big Data n'est-il pas de travailler sur des cibles a priori inconnues, sans aucune hypothèse de départ ?

Jean-François Soupizet a passé ce questionnement au crible de la ville intelligente (ou connectée, ou encore smart), mise en perspective avec la désertification numérique de nos territoires. Dans la mesure où une ville connectée ne peut fonctionner que si ses habitants lui fournissent chaque jour leur lot de données, Éric Hazane a évoqué la multiplication des données via les objets connectés qui ne cessent de se développer et soulevé la question de la pertinence des chiffres pour rendre compte de leur volume. Tous ces travaux, toutes ces questions, présupposent que la donnée, vue comme une matière première, est fiable. Thierry Berthier et Bruno Teboul ont justement posé les questions pertinentes de la valeur et la véracité de la donnée, expliquant qu'une des tâches du data scientist de demain sera d'évaluer la probabilité de la véracité de la donnée. Enfin, Gérard Haas a évoqué la protection juridique des données, faisant remarquer qu'un droit de propriété entièrement confié à l'émetteur des données pourrait le placer dans une situation inconfortable, car il serait alors seul responsable de leur protection.

 

Ces indispensables éclairages ont alors permis d'envisager la place de la donnée (ou des données) au sein de stratégies, qu'elles soient privées ou publiques.

 

La stratégie d'entreprise a été le premier sujet de débat. Yannick Harrel a invité l'assistance à considérer la donnée comme une nouvelle devise. À la différence notable que si l'entrepreneur allait auparavant au devant de l'information, actuellement c'est elle qui vient à lui, modifiant ainsi les rapports entre une potentielle devise et ses utilisateurs. L'introduction du Big Data vient également défier les pratiques d'intelligence économique adoptées par les entreprises. Jean-Pierre Vuillerme nous détaille ces impacts, se demandant si l'on peut parler d'innovation disruptive à son sujet. L'observation du Big Data nous montre que la majorité des acteurs de ce phénomène sont majoritairement étasuniens. Il convient alors de se poser la question, avec Laurent Bloch, de l'émergence d'une industrie nationale du Big Data afin de réfuter les propos selon lesquels l'Europe serait une colonie du monde numérique.

 

Une réflexion sur les stratégies induites par le Big Data n'aurait pas été complète sans l'évocation des stratégies publiques. En évoquant les relations entre le Big Data et le renseignement, Axel Dyèvre soulève la question des métadonnées, sous-famille de données inséparables des données produites et émises au sein du cyberespace. Du renseignement aux  opérations militaires, il n'y a qu'un pas qu'Olivier Kempf franchit en exposant ce que le cyber, et la multitude de données induite, peut changer dans la façon de faire la guerre et de mener des batailles. Le passage du front extérieur à l'éventuel front intérieur est assuré par Patrick Perrot. Si l'utilisation du Big Data dans la lutte contre la criminalité apporte des pistes nouvelles, il ne faut pas pour autant faire abstraction de ses limites. Sinon, nous risquons de glisser dans une société où, comme l'écrit Philippe Davadie, nos données risquent de se trouver en garde à vue perpétuelle. Ces potentialités conjuguées aux interrogations amènent alors à évoquer avec Thibault Lamidel une éventuelle régulation internationale du Big Data qui pourrait conduire à une redistribution de la puissance des États dans un avenir assez proche.

 

Vous tenez entre vos mains les actes de notre colloque. Si nous n'avons pu retranscrire les échanges avec la salle, nous ne nous sommes pas restreints aux verbatim des participations. Chaque intervenant a pu en effet mettre l'accent sur des points que son temps de parole lui interdisait. En sus des contributions de chaque orateur et afin d'enrichir encore les débats, vous trouverez le mot introductif du général Watin-Augouard ainsi que les contributions de modérateurs de tables rondes.

 

Puisse cet ouvrage vous aider dans votre réflexion sur la donnée et le Big Data, c'est ce que tous les contributeurs de ce colloque vous souhaitent.

 

Bonne lecture !

 


[1]Sa valeur au marché noir pouvant cependant atteindre des sommets.

 

Ajouter un commentaire

Le code HTML est affiché comme du texte et les adresses web sont automatiquement transformées.

La discussion continue ailleurs

URL de rétrolien : http://www.egeablog.net/index.php?trackback/2110

Fil des commentaires de ce billet