Découvrez la liste Ensemble pour agir

Découvrez la liste Ensemble pour agir

CONSTRUIRE une véritable indépendance numérique

Sous titre

CONSTRUIRE une véritable indépendance numérique

L’exploitation de la data est-elle un mythe ou une réalité possible pour la profession ?

Nous entendons beaucoup parler de la data, l’or de demain pour nous, experts-comptables. Nous disposons en effet de nombreuses informations, elles sont stockées dans la comptabilité, dans les dossiers de paramétrage, dans les outils de facturation… Ces informations, nous les stockons depuis longtemps et ce qui est nouveau avec ce concept de data, c’est la mise en relation pour en obtenir un espace commun de stockage et de partage : le datalake !

L’objectif est d’y déposer tout : des données en vrac comme des documents, d’autres structurées comme les FEC, des données privées et des données publiques, tout ce que l’on stocke. L’intelligence consiste à savoir les mettre en relation pour en obtenir des informations utiles à nos clients. Des données, qui isolées, apportent peu, mais qui lorsqu’elle sont reliées sont riches d’enseignements.
Lorsqu’on y pense, la data existe finalement depuis longtemps et ce sont les techniques et outils de mise en relation et d’interprétations qui sont nouveaux. En effet, la richesse provient de l’analyse des données, de ses interprétations, de ce que nous en faisons. Un peu à l’image du pétrole, il faut raffiner ces données pour en obtenir des informations utiles, car si le principe est de tout stocker en vrac, il faut passer par une phase de préparation préalable à toute exploitation.
La profession peut s’organiser pour mutualiser cette première étape de stockage et de raffinage des données avec pour principal objectif de diminuer les coûts pour tout l’écosystème, et donc finalement les utilisateurs que sont les cabinets. Il existe et il existera plusieurs initiatives autour de la Data et ce sera bénéfique pour la profession ! Penser que ce domaine ne doit être exploré que par l’Ordre et vouloir couper toutes les initiatives revient à vouloir brider l’innovation. L’exploitation des données est une science nouvelle et c’est en multipliant les expérimentations que nous trouverons les voies utiles pour la profession.
Mais avant de prévoir comment organiser la data, quels peuvent être les usages pour la profession ?
Le premier usage, rapide à mettre en place et apportant des bénéfices immédiats pour nos clients et nos cabinets c’est le benchmark : le comparatif sectoriel. Nous avons tous la question des clients : comment je me situe par rapport à mes concurrents ? Le marché est calme ou c’est mon entreprise qui ne signe pas de devis en ce moment ? Mettre en place un usage de benchmark nous permettra de donner les tendances du marché à nos clients mais aussi de trouver des pistes de progression ou d’identifier des bonnes pratiques. Grâce aux méthodes statistiques, les études ont fixé à 500 000 entreprises la volumétrie nécessaire à cette étape de benchmark. C’est à la fois important et peu lorsque l’on sait que les cabinets réalisent environ 3,8 millions de télédéclarations d’entreprises.
L’analyse des télédéclarations de TVA et de liasses fiscales permet une première analyse via Image-PME, mais elle n’est pas assez intégrée dans nos outils et demande un effort d’interprétation qui peut en réduire l’usage.
Si nous ajoutons les FEC à ces déclarations, nous pouvons obtenir des analyses plus fines sur le détail des frais généraux ou les charges de personnel par exemple. C’est l’étape actuelle que nous avons lancée lors de notre première mandature.
En développant cet usage de benchmark, nous sommes en mesure de comparer les variations d’activité de nos clients avec leur marché, d’identifier les ratios de productivité ou le poids des frais généraux en les comparant à leurs concurrents. C’est utile lors de la vie de l’entreprise ou lors d’une analyse de valorisation.
Avec la mise en place de la facture électronique nous obtiendrons un niveau encore plus fin pour nos analyses nous permettant d’accéder aux quantités, aux détails des achats et de pouvoir proposer des indicateurs complémentaires à nos clients comme le prix moyen des matières premières, les consommations énergétiques etc….

LA DATA , MATIÈRE PREMIÈRE DE L’IA

Nous parlons beaucoup d’Intelligence Artificielle. L’IA se nourrit de données pour créer des modèles mathématiques et faire des propositions en fonction de probabilités statistiques. Il faut énormément de données pour alimenter une IA et en obtenir des modèles de projection. C’est là l’usage futur de la data de la profession.
Nous avons vu que les IA comme ChatGPT sont capables de restitutions intéressantes mais elles ont été entraînées sur un volume de données immenses. Pour le modèle GPT-3 il a fallu des centaines de milliards de Token (unité de mesure de l’IA correspondant environ à 0,75 mot en anglais). Le volume nécessaire aux modèles plus récents est resté confidentiel mais est encore plus important.
Par ailleurs, c’est un modèle de création de phrase, et non un modèle mathématique comptable. Il faut des données et des règles spécifiques pour obtenir des modèles de projections sophistiqués. Il est possible aujourd’hui de faire une projection de chiffre d’affaires avec peu de données (le volume nécessaire aux benchmarks, soit 500 000 entreprises) en utilisant des techniques mathématiques (la régression linéaire par exemple), mais si nous souhaitons aller au-delà d’une simple probabilité mathématique il nous faudra beaucoup plus de données.
Si nous souhaitons créer un modèle pour détecter des difficultés d’entreprise dès les signaux faibles comme c’est le cas pour les prévisions météo, nous devons alimenter les moteurs d’IA de données adaptées en masse.
De même, pour imaginer la comptabilité prédictive, le besoin en données est très important et varié. Le chiffre d’affaires ne se reproduit pas selon une formule mathématique mais peut être influencé par des facteurs internes comme des embauches ou des facteurs externes comme les conditions météo. Ces règles sont à intégrer dans les algorithmes.
Pour atteindre ces objectifs, bénéficier de ces outils demain nous devons organiser un datalake au niveau de la profession, car aucun cabinet, aucun groupement, aucun éditeur n’aura le volume nécessaire à l’entrainement de ces modèles.

COMMENT EN FAIRE UNE RÉALITÉ POSSIBLE POUR LA PROFESSION ?

Nous sommes persuadés que la clé de la réussite repose sur le collectif. Nous devons, ensemble, nous organiser pour partager et exploiter nos données. Si chacun commence à apercevoir quels seront les avantages, il peut exister des craintes créant un frein à ce partage. Il est naturel de se questionner : où seront stockées les informations concernant mes clients, est-ce un risque pour le cabinet ? Vais-je perdre en indépendance en mélangeant les informations de mes clients avec mes confrères ?
Le datalake de la profession est sécurisé et toutes ces données sont anonymisées. Il n’est pas possible de retrouver la source des données. C’est une règle élémentaire et une protection complémentaire en cas d’incident cyber. Certes les données sont stockées avec toutes les sécurités mais puisque personne n’est à l’abri d’une attaque, autant conserver des données dont les informations privées ne sont pas exploitables. Ces étapes préalables permettent d’apporter les conditions de sécurité nécessaires au partage collectif. Les données confiées ne sont utilisées que pour servir les cabinets. Les pouvoirs publics l’ont identifié en confiant lors du congrès de Montpellier au Conseil National la création du datalake de la profession.
Nous l’avons organisé durant cette première mandature pour les confères et les éditeurs qui souhaitent partager leurs données. La règle est simple : celui qui contribue a accès aux données. Ainsi, les confrères qui alimentent peuvent accéder aux données et créer leurs propres outils. Cela demande certaines compétences et probablement un peu de passion mais la donnée est un bien commun que nous souhaitons accessible à tous les confrères, afin que chacun puisse exprimer sa créativité. Ce seront des occasions de mémoire exploratoires, de travaux de recherches utiles à la profession.
Pour d’autres parmi nous, la donnée n’est utile que si elle est intégrée dans les outils de conseil ou de production et c’est la raison de l’ouverture du datalake de la profession aux éditeurs qui l’alimentent pour que chaque cabinet puisse tirer les bénéfices de l’exploitation des données quel que soit son niveau d’appétence technique. Nous favorisons ainsi la créativité de nos partenaires au service des cabinets.

La détention des données sans intelligence ne sert à rien. De même, il n’est pas possible d’entrainer, de modéliser des IA sans données. C’est la combinaison de l’utilisation et de la data qui crée de la valeur pour nos cabinets et nos clients, c’est pourquoi nous devons oeuvrer à une contribution et permettre un accès de tout notre écosystème à nos données.
Il n’existe pas un seul datalake de données financières et extra-financières, il y a d’autres initiatives et c’est une source d’innovation. En explorant à plusieurs cette science de la data, nous irons plus vite pour la profession.
Pour répondre aux enjeux de l’IA nous souhaitons proposer un Hub des datalake, un espace de partage des datalake pour la Profession. Nous intégrons dans la Profession les cabinets mais aussi les éditeurs partenaires. Cela nous permettra de disposer de volumes plus importants pour entrainer des modèles d’IA. L’Ordre doit jouer un rôle de facilitateur et proposer un cadre de collaboration sain et sécurisant pour tous les acteurs. C’est un rôle régalien plus important que de se lancer dans une compétition de mesure de la taille de chaque datalake .
Si nous regardons les autres professions comme le secteur médical, la mise en place de leur hub data favorise l’innovation, réduit les barrières à l’entrée de nouveaux acteurs tout en garantissant la confidentialité des données de santé. Ce partage est une richesse et nous pouvons nous organiser sur un modèle proche. Cependant, dans le domaine de la santé ce rôle a été confié à un groupement d’intérêt public. Nous souhaitons que ce rôle soit assumé par le Conseil National car la détention, l’accès et l’utilisation de la data est un enjeu de souveraineté numérique de notre profession.
L’exploitation de la data est une réalité possible pour la profession, si nous réussissons à faire passer l’intérêt collectif de la profession avant les intérêts individuels.
Nous souhaitons un datalake de la profession collaboratif, ouvert aux cabinets et aux partenaires, éditeurs.
Nous souhaitons organiser une collaboration des initiatives data autour d’un hub dont la souveraineté sera assurée par le Conseil National au nom de la profession pour tout notre écosystème et alimenter toutes les initiatives d’IA dédiées à la comptabilité et aux indicateurs financiers et extra-financiers.

Ces articles pourront vous intéresser