Bengs Lab

La donnée, nouvel épicentre de l’innovation

3 Maximiser la valeur nette de la donnée ?

Vers un modèle transversal agile

Pourquoi certaines entreprises réussissent économiquement grâce à l’exploitation très poussée de la data ? Amazon, Facebook, Google diffèrent de sociétés comme Orange, Renault ou General Motors. Les Gafa ont explosé en misant sur leur capacité à exploiter très finement les données numériques. Celles-ci aident à piloter l’activité, à mesurer, à avoir un retour sur tout ce qui est réalisé dans l’entreprise, permettant de réajuster en permanence la conduite de l’entreprise. Et ce, dans tous les domaines : la production, le service commercial comme les RH. Nous détaillerons ici les spécificités d’un modèle organisationnel qui permet d’atteindre l’agilité nécessaire pour  maximiser l’utilisation de la donnée. Une organisation agile permet de mieux maîtriser le temps, qui devient une denrée de plus en plus importante. Le modèle proposé a pour objectif de déployer un fonctionnement fluide et ouvert, tant en interne de l’entreprise que vers l’externe. Il se fonde sur un système de clusters, en perpétuel mouvement pour répondre aux besoins prioritaires.

 

L’ORGANISATION RETICULAIRE

LES PRINCIPES D’UNE ORGANISATION RETICULAIRE

La composition d’une organisation agile ne pouvant être figée, c’est évidemment son mode de fonctionnement qui importe. Il se décline suivant trois dimensions : la cohésion du réseau, le potentiel combinatoire, le mode d’activation.

  • La cohésion du réseau : un réseau est caractérisé par l’intensité de sa cohésion, celle-ci peut être plus ou moins forte suivant la nature objective ou affective des échanges entre les différents nœuds du réseau, leur hétérogénéité, leur multiplicité et leur densité.
  • Le potentiel combinatoire : un réseau est caractérisé par le nombre de connexions qui peuvent être réalisées par chacun des nœuds avec les autres nœuds qui le composent. Ce potentiel combinatoire est lié au degré d’agrégation des nœuds (taille et diversité). Une amélioration des synergies au sein d’un grand groupe implique une augmentation du nombre de connexions ainsi qu’une amélioration de la communication entre les nœuds.
  • Le mode d’activation : c’est l’initialisation de nouveaux échanges entre les nœuds ainsi que les nouvelles connexions créées de ce fait qui modifient le morphotype et la stratégie de l’organisation. Cette capacité d’activation de nouveaux échanges peut être extrêmement concentrée ou largement répartie au sein du réseau comme un réseau neuronal artificiel (largement utilisé dans le machine learning par exemple). Une certaine forme de gouvernance réside dans un pouvoir d’activation centralisé alors qu’au contraire, c’est une forme plus empirique qui prédomine lorsque chaque nœud a la possibilité d’initialiser de nouvelles connexions à l’intérieur comme à l’extérieur du réseau initial.

La déclaration récente d’Elon Musk auprès des employés de Tesla rappelant à chacun d’entre eux la liberté qu’ils ont de contacter n’importe quelle personne de l’entreprise, sans aucune considération ni pour les titres, ni pour l’ancienneté, afin de maximiser les émergences d’opportunités bénéfiques à l’entreprise, illustre cette approche organisationnelle.

 

L’ORGANISATION RETICULAIRE DATA CENTRIC

L’avènement du Big Data et sa généralisation à partir de 2010 ont fait naître une multitude d’entreprises axées autour de l’utilisation de la donnée. La dénomination marketing de Data Driven Company est alors utilisée pour désigner ces entreprises, structurellement dépendante et/ou ayant une forte sensibilité pour la donnée. Cependant, si elles ont en commun une grande utilisation de la donnée, elles n’ont pas nécessairement mis en place une nouvelle organisation d’entreprise.

Associé à une organisation réticulaire, un modèle plaçant la donnée au cœur du système permet la recherche en continue de l’amélioration des processus de l’entreprise via une utilisation massive mais aussi qualitative des données. Une vision d’ensemble des différentes fonctions constitutives de l’entreprise est nécessaire, celles-ci étant aussi bien consommatrices que productrices de données dans le modèle.

Afin de placer la donnée au cœur de l’organisation, les membres du Bengs Lab ont choisi d’utiliser les possibilités techniques d’un data lake, un support de stockage universel pour des traitements complexes sur des grands volumes de données hétérogènes. L’exploitation des données non structurées ainsi que la disparition des silos d’informations en font la solution à privilégier pour le stockage et l’accessibilité des données. Le stockage de la data est enrichi en continu par des données produites et acquises par l’entreprise. Cet enrichissement peut se faire automatiquement (c’est le cas avec les objets connectés – IoT) ou de manière ponctuelle via les équipes dédiées au data lake ou par une identification des équipes métiers. Il est possible de garder les entités actuelles de l’entreprise tout en plaçant la data au cœur du système. C’est ce que les membres du Bengs Lab ont représenté sous forme de Data Donut (figure 4). La donnée, en rose, symboliquement au cœur du donut est utilisable par tous (l’accès à tous reste néanmoins un enjeu crucial qui est traité dans la gouvernance de la donnée). Les différentes flèches représentent l’enrichissement et l’apport de la donnée au data lake.

Figure 3 – Le data donut : représentation graphique d’un modèle data-centric par le Bengs Lab

 

Les différentes entités opérationnelles (les différentes couleurs) représentées avec leurs fonctions métiers (les différentes formes) gravitent autour du noyau data de l’organisation. La donnée vit à travers l’organisation de l’entreprise, elle n’appartient ni à un département ni à une fonction en particulier. Nous l’avons démontré précédemment, la valeur de la donnée est maximisée par l’usage. Dès lors, il est essentiel que l’organisation facilite l’accès à la donnée à ses collaborateurs grâce à un système d’étiquetage simple, tout en prenant en compte les problématiques de confidentialité et de conformité.

Afin de faciliter une utilisation de façon qualitative par le plus grand nombre, les interactions entre les équipes métiers ont été repensées.

 

UNE COMMUNICATION PERMANENTE ENTRE LES EQUIPES DATA & METIER

Du fait d’une communication permanente entre les équipes spécialisées sur la data et les équipes métiers des différents services de l’entreprise, des compétences spécifiques liées aux nouveaux enjeux de la data sont requises. Afin d’optimiser le fonctionnement de cette nouvelle organisation, certains collaborateurs devront se former et faire évoluer leur façon d’appréhender leur métier. L’implémentation des compétences clés dans l’organisation ainsi que les canaux d’échanges seront à définir.

L’organisation de l’entreprise et sa gouvernance doivent devenir plus agiles et moins centralisées. S’inspirant du modèle d’entreprise libérée, où chaque collaborateur gagne en responsabilité, nous pouvons proposer un modèle managérial reposant sur une communauté d’acteurs internes. Pour cela, nous présenterons ci-après les 10 métiers essentiels de l’entreprise data-centric.

 

DES COMPETENCES DEDIEES ET SPECIFIQUES POUR LA DATA

Plusieurs fonctions et compétences sont nécessaires et sont spécifiques à la gestion des données afin de pouvoir assurer la continuité de la chaîne de valeur. Ces nouvelles compétences sont principalement présentes au sein de l’équipe Data, mais l’impact du Big Data et de son utilisation dans l’entreprise est plus globale et fait émerger des besoins connexes. Les objectifs du data catalog sont multiples. Fondamentalement, il rassemble les metadata. Pour être efficace, il doit :

  • Centraliser toutes les informations des données au même endroit – en termes de structure, qualité, définitions – et son usage dit être facilement accessible ;
  • Permettre à tous les utilisateurs de puiser les informations ;
  • S’auto-développer pour garantir la cohérence et la pertinence (ce qui est permis par le Machine Learning).

Le premier maillon de la chaîne de valeur est au cœur de la responsabilité du Chief Data Officer. Le CDO, nouveau métier émergent, se trouve au croisement de la valorisation des données et des impacts business et stratégiques. Le CDO est le garant du bon fonctionnement des différentes étapes de la chaîne de valeur de la Data. Il coordonne les équipes data et assure une représentation de celles-ci auprès de la direction de l’entreprise. Il a, à ce titre, un impact réel sur la stratégie et la culture de l’entreprise grâce à l’apport de nouveaux outils et de nouvelles méthodes de travail. La gouvernance de la donnée peut être rattachée aux prérogatives du CDO dans certaines organisations. Celle-ci associe un ensemble de personnes, de processus et de technologies pour garantir la qualité et la valeur des informations dans une entreprise. La Data Governance dans le cadre d’un projet Big Data implique de prendre en considération les impacts liés à l’explosion des données. Cette explosion des flux et des données collectées créé de nouvelles menaces qui obligent les Directions informatiques à revoir leur sécurité.

La fonction de Data Architect intervient à plusieurs étapes de la chaîne de valeur, il est notamment présent dès la phase de sourcing et de collecte de la donnée.

Le Data Architect est en charge de la construction de l’infrastructure fonctionnelle qui permet à l’entreprise d’exploiter la donnée. C’est lui qui détermine l’ossature de l’infrastructure physique et du réseau, qui organise la manière dont l’organisation connecte ses sources de données internes et externes, qui paramètre le datalake et le système d’information. En plus d’exiger des compétences techniques pointues, le data architect est sensible aux problématiques des métiers afin de bâtir une infrastructure data efficace.

En tout premier lieu, il est nécessaire de garantir la fiabilité des données rassemblées dans le data lake, situé symboliquement au centre de l’organisation de l’entreprise. C’est la fonction du Data Steward, premier niveau de la hiérarchie des gestionnaires de la donnée. Celui-ci s’assure que chaque élément du data lake est correctement étiqueté pour pouvoir être réutilisé, il vérifie qu’il n’existe pas de doublons et que les données ne sont pas obsolètes. C’est le garant des cinq axes (Stratégie – Stockage et collecte – Nettoyage – Traitement – Recyclage) du cycle de vie de la donnée ainsi que des trois règles (Intelligibilité – Obsolescence – Conformité) constitutifs de la fiabilité des données qui vont circuler dans l’organisation.

La fiabilité des données n’étant plus en cause, plusieurs fonctions vont travailler conjointement aux étapes d’enrichissement, compréhension et analyse des usages ainsi qu’au recyclage. Parmi ces fonctions, on trouve le Data Miner, spécialiste de l’exploration de données et de l’extraction de connaissances à partir de bases de données. A partir d’analyses statistiques et d’intelligence artificielle, il recherche les règles d’associations, les motifs fréquents ou les tendances permettant la compréhension d’un modèle et la prise de décision. Le Data miner formule aux requêtes et y répond en puisant les données pertinentes dans le data lake.

Le Data Analyst utilise lui aussi les techniques statistiques et outils informatiques spécialisés afin d’organiser, de synthétiser et de traduire les informations nécessaires aux managers pour faciliter les prises de décision. Il est capable de traiter un grand volume de données ainsi que de maîtriser les outils spécifiques au Big Data.

Le Data Engineer a pour mission de s’assurer que les infrastructures conçues par le data architect fonctionnent correctement et y effectue les opérations de maintenance nécessaires. Il est garant de l’accessibilité permanente aux données et contribue de manière régulière à l’amélioration de l’infrastructure pour faciliter le travail du Data Scientist. Celui-ci est spécialiste en sciences des données, ayant des expertises à l’intersection de l’informatique (manipulation, vérification, visualisation des données, programmation distribuée), du machine learning (analyse des données, modèles prédictifs) et du métier (compréhension de l’utilisation des données pour satisfaire les enjeux et objectifs métiers des utilisateurs). De manière plus pragmatique, son métier est de faire parler les données et d’en sortir des indicateurs concrets au service des différentes directions métiers.

Le Data Visualizer est en charge de mettre en forme les données afin de les rendre visuellement accessibles et compréhensibles. Il utilise des outils numériques et logiciels qui permettent d’optimiser la représentation visuelle de l’analyse des données.

Cette équipe Data élargie ne doit pas être considérée comme une équipe d’experts et donc comme une fonction support supplémentaire, mais bien comme une fonction technique centrale travaillant sur un pied d’égalité avec les différentes entités métiers dans la création de valeur autour de la donnée.

Le respect de cette chaîne de valeur nécessite la création (ou la redéfinition) de certaines fonctions de l’entreprise impactant l’organisation dans son ensemble.

Rattaché principalement à la direction juridique, le (Chief) Data Protection Officer, dont la présence sera obligatoire à partir de mai 2018 pour un grand nombre d’entreprise (Cf encart GDPR) est un véritable chef d’orchestre de la conformité en matière de protection des données au sein de l’organisation. Plusieurs scandales – les fameuses data leaks – ont mis en exergue l’importance de la protection des données, notamment personnelles. En 2018, des milliards de comptes ont été hackés, comme par exemple ceux de la société Saks, Lord & Taylor (5 millions de comptes clients), Sacramento Bee (19,5 millions), ou encore Facebook en mai 2018. Dans ce dernier cas, une firme exploitant les données politiques nommée Cambridge Analytica avait collecté les informations personnelles d’au moins 87,5 millions d’utilisateurs de Facebook grâce à une app effectuant du scrapping de données.

Le Data Protection Officer est chargé d’informer et conseiller le responsable de traitement des données, de contrôler le respect du règlement et du droit national en matière de protection des données ainsi que de coordonner des analyses d’impact si nécessaire. Enfin, c’est l’interlocuteur premier de l’autorité de contrôle (propre à chaque pays) avec laquelle il doit coopérer. Les missions du DPO couvrent l’ensemble des traitements mis en œuvre par l’organisme qui l’a désigné. Il n’est pas tenu personnellement responsable des manquements de l’organisation en termes de protection des données si celle-ci est non conforme au règlement territorial.

Sans être exhaustif, la nouvelle fonction d’acheteur de la donnée, le Data Buyer est à définir. Elle va plus loin que la fonction d’acheteur traditionnel. Le Data buyer est spécifique de l’entreprise Data Centric, comme l’acheteur d’art l’est dans une agence de communication. Celui-ci analyse et collecte les besoins de l’organisation en termes de donnée. Il identifie et sélectionne les prestataires ou partenaires. Il est responsable de la contractualisation de la prestation qui peut être de l’achat/vente ou de l’échange. Enfin il s’assure du bon déroulement de la prestation avec l’aide des équipes métiers.

La présence de l’ensemble des compétences décrites ci-dessus au sein de l’organisation est importante car elles sont les fondements et les pièces indispensables à l’agilité de l’organisation. D’un côté, aucune de ces fonctions n’a vocation à perdurer et de l’autre, un nombre inimaginable de fonctions nouvelles seront probablement envisagées au fur et à mesure des nouveaux usages. Véritable usine à inventer des usages en venant manipuler-assembler-transformer des données, nul ne pourrait prédire ce qu’il en sortira. Néanmoins, pour maximiser la création de nouveaux usages il sera nécessaire de cultiver les échanges entre les métiers et la donné

 

Dans une optique d’agilité, il est tout aussi important de garantir un décloisonnement du Data Lake et de l’ouvrir au reste de l’organisation. Plus précisément, faire en sorte que les équipes Data et les équipes métiers échangent, collaborent, et s’enrichissent mutuellement. Cela se traduit par la possibilité de faire du Data Analyst un acteur clef de cette transmission d’informations. Ce dernier sera l’intermédiaire, l’interface humaine entre les experts Data et les opérationnels métier. Ce rôle précis est représenté dans par le cercle bleu sur la figure 2. Plus concrètement, un Data Analyst sera support dans une entité/équipe métier. Ainsi, il pourra s’imprégner des problématiques métiers, détecter de nouvelles opportunités business jusqu’alors non identifiées par manque de connaissance du sujet Data par les équipes métier, et initier de nouveaux projets. Il porte le rôle sensible et essentiel de traducteur des besoins métiers en termes de requêtes de données et inversement, vulgarise l’utilisation des données auprès des services de l’entreprise.

En parallèle, la mise en place d’un Data Guru au sein des équipes opérationnelles pour former un binôme avec le Data Scientist est identifié comme étant indispensable. Ce Data Guru n’est autre qu’un opérationnel qui témoigne d’une appétence pour la manipulation des données et qui sera donc formé aux problématiques Data. Par ailleurs, il est nécessaire que les Managers d’équipe ainsi que les différents responsables soient aussi sensibilisés aux problématiques Data. Dès lors, de nouvelles opportunités pourront aussi être identifiées de la part des équipes métiers qui, principalement par méconnaissance du sujet, avaient jusqu’alors sous-estimé le potentiel de valeur de la donnée. Les rôles de Manager et de Data Guru sont symboliquement représentés au sein des fonctions métiers par des losanges & étoiles sur la figure 2.

Cette initiative permet de créer un véritable dialogue entre les équipes Data, représentées par les Data Scientist, et les équipes opérationnelles. Le premier point d’interaction entre les deux équipes n’est autre que le Data Guru, son binôme. In fine, l’équipe data ainsi que les Data Gurus sont là pour animer une dynamique collective d’utilisation de la donnée au sein de l’organisation.

 

UNE CULTURE D’ENTREPRISE QUI POUSSE A LA COLLABORATION POUR INNOVER PAR LES USAGES

Au-delà du challenge technique que représente l’intégration de la donnée dans une organisation, l’incorporation de celle-ci suppose aussi une redéfinition des rôles et des champs d’action des machines, des hommes et du management. La culture data-centric doit faire partie de la stratégie et de la vision de l’entreprise à son plus haut niveau. Elle doit être insufflée par la direction et déployée tout au long de la chaîne de valeur interne, comme indiqué sur la figure 2 (collaborateurs) et externe (partenaires, fournisseurs) de l’entreprise. Ce dernier point est primordial pour permettre l’émergence d’innovation au sein de l’organisation. Il requiert des changements de mentalités, de pratiques de travail, d’organisation et d’usages.

Les machines ne se limitant plus seulement à l’application de règles définies, la frontière entre les analyses humaines et les résultats issus des machines devenant plus mince, les organisations peuvent alors revoir la manière dont les décisions sont prises et redéfinir le rôle des managers. Les décisionnaires pourront accepter de limiter l’importance de leur intuition dans la prise de décision, au profit d’actions basées sur les informations fournies par les données. L’esprit critique doit cependant être entretenu afin de toujours s’interroger sur les sources et la fiabilité des résultats présentés. Il est extrêmement important de retenir que les données doivent servir à prendre des décisions et non à supporter des décisions déjà prises en amont. La position du manager évolue, et l’expertise humaine reste indispensable pour garantir la pertinence des données, repérer les opportunités, générer de nouvelles requêtes, supporter une vision et des objectifs de long-terme. Brynjolfsson et MacAfee, deux chercheurs du MIT expliquent que les managers les plus performants parviendront à faire adopter le data-driven mindset par tous les collaborateurs et créeront des organisations plus flexibles qui favoriseront la collaboration en transverse :

People who understand the problems need to be brought together with the right data, but also with the people who have problem solving techniques that can effectively exploit them.

La posture du manager se trouve changée avec l’aide des modèles prédictifs et l’ensemble des zones d’influences dans l’entreprise s’en trouve bouleversée.