AXOPEN

Big data et l’apothéose du vide

Le big data occupe de plus en plus d’espace dans l’actualité, et grâce au lobbying des grands acteurs de l’informatique, plus aucun client n’est épargné par ces campagnes d’évangélisation.

Tout naturellement, une sorte de honte (virtuelle, d’ailleurs, car presque personne ne fait du big data aujourd’hui) s’est inscrite dans la tête des dirigeants, tous plus persuadés que des concurrents sont très avancés sur le sujet, et que donc ils bénéficient de l’exploitation du pétrole du 21e siècle (on remarque que l’utilisation du terme « pétrole » ramène aux idéaux du 20e siècle, ce qui accentue l’idée que l’exploitation de cette ressource sera le nouvel oligopole de quelques nababs).

big data apothéose du vide

Bigdata : confusion entre envie et besoin

Dès lors, on se retrouve avec des clients déjà embarqués dans une transformation digitale que personne n’est vraiment capable de définir, mais qui permet à chacun de projeter tous ses fantasmes dans un nouvel objectif, derrière lequel il se met à courir.
Et c’est dans ces conditions que nous voyons débarquer nos clients avec des budgets confortables pour faire du BigData. Et pour la première fois, le client ne vient pas avec une problématique à résoudre avec les technologies du bigdata, mais avec l’envie de faire du bigdata. La majorité du temps, le questionnement nécessaire à tout projet – à savoir à quelle problématique je réponds – est donc passé sous silence. Dans la logique du client, c’est normal, car le bigdata est le pétrole à exploiter, et il suffit donc de l’exploiter… en tant que prestataire informatique, c’est nécessairement très simple :).

Bon soit, passons sur l’absence de besoin pour attaquer fraîchement notre projet bigdata. Après tout, on peut penser que dans le giron du bigdata se trouvent le datamining et autres modèles de recherche, donc on pourrait imaginer que nous allons trouver des réponses à nos non-questions.

Projet Bigdata : comment ça se passe ?

Donc en bonne SSII (pardon, ESN) que nous sommes, on lance ce projet de SI (pardon, de transformation digitale) par l’angle outils. Et c’est parti pour l’installation d’une base noSQL de formation map reduce, avec un peu de logiciel R. On met en place une équipe agile avec des data scientists (comprendre un gars qui a fait un peu de stats dans sa vie).

Accumulation de données ou comment combler le vide

Et c’est parti ! Donc on commence par accumuler les données (le fameux pétrole) avec des sondes ou des extracts de BDD classiques pour les regrouper dans des gros centres de données. Comme la majorité des données du SI sont éparses et pas vraiment complètes, on comble les trous avec des fausses données – mais en même temps c’est pas bien grave, parce que personne ne comprend vraiment les modèles mathématiques utilisés, donc de là à comprendre les erreurs induites…

Dans les meilleurs des cas, on se retrouve avec des données à peu près propres dans un entrepôt à peu près à jour et globalement correctement structuré.

Analyse de données ou comment exposer sa propre vérité

Arrêtons-nous ici un instant, car un point important vient d’être mis sous silence. Les données accumulées ici viennent du SI, ce qui implique que in fine l’entreprise a décidé ce qu’elle mesurait. Donc toute l’analyse que vous ferez par la suite sera basée sur ce que l’entreprise a jugé important de mesurer. L’entreprise a donc discrétisé le monde de manière arbitraire. Néanmoins, le bigdata entend répondre à des questions que vous n’avez pas posées, et vous lui fournissez déjà un échantillon très précis de ce qu’il a le droit de penser…

Deuxième problème évident, vous allez analyser vos données et pas les données du secteur dans lequel vous vous trouvez. En effet, vous n’avez pas les données de vos concurrents, et encore moins les données des clients potentiels qui ne sont pas encore clients.

En résumé des deux derniers points, vous allez tenter de dire une vérité non pas générale mais bien particulière et morcelée, basée sur ce qui vous a paru bon de mesurer. Ceci rabat un peu l’ambition de notre projet bigdata, car finalement, on se rend compte qu’on ne sera capable de comprendre que des petites vérités sur nos clients, et ceci ne nous apprendra en rien comment en gagner d’autres. Vous serez donc, dans le meilleur des cas, en mesure d’améliorer vos process / produits, et non pas de découvrir des vérités qui vous auraient été masquées depuis si longtemps.

BigData : et si on se tournait plutôt vers d’autres priorités ?

On peut donc raisonnablement se poser la question de l’intérêt de faire du bigdata pour optimiser quand il y a tant à faire dans les entreprises avant ceci. Ne devrait-on pas rediriger ses budgets vers de l’amélioration (vraiment) opérationnelle du travail ? Opter pour un meilleur usage des applications, et se concentrer sur les besoins du client final au lieu de se faire plaisir ? Et pourquoi pas à la place de se demander ce que veut le client, tout simplement lui demander ?