Salon Transfodroit - Innovation juridique : face au potentiel de la donnée, la France doit encore faire un « saut technologique »


lundi 13 décembre 2021 à 00:0011 min

Écouter l'article

 

Les Rendez-vous des transformations du droit ont accueilli 2 800 participants, les 18 et 19 novembre derniers. Au programme, deux jours de rencontres avec les acteurs de l’innovation juridique. Alors que le secteur des legaltech s’est emparé de la data depuis quelques années, l’État veut se mettre au diapason et instaurer une vraie politique publique des données. S’il affiche ses ambitions et mise sur les partenariats, les ressources s’avèrent, pour l’heure, insuffisantes, ont constaté plusieurs spécialistes lors de la plénière d’ouverture.

 



Lors de cette plénière d’ouverture, le 18 novembre, Renaud Vedel, coordonnateur de la stratégie nationale pour l’intelligence artificielle (IA) au ministère de l’Économie, des Finances et de la Relance, le souligne : bien qu’il y ait un peu d’exagération autour de l’intelligence artificielle, « l’un des mots du moment », « ce n’est pas un effet de mode, mais une technologie d’usage général qui peut changer beaucoup de modes de production ». En 2019, un rapport commandité par la Direction générale des entreprises dressait ainsi une liste des 15 secteurs les plus prometteurs pour l’économie française en lien avec l’IA, parmi lesquels le marché des legaltech. Rien d’étonnant : ces dernières années, de nouveaux algorithmes (appelés « Transformers ») ont énormément progressé sur le traitement automatisé du langage, et affichent un gros potentiel en matière d’aide à la lecture, d’analyse de document et d’aide à la production sémantique, particulièrement utiles pour le monde juridique. « Il ne faut pas exagérer leurs capacités – nous sommes loin du juge prédictif –, mais il y a beaucoup de choses qui peuvent être faites pour aider les professions du droit, et il faut capitaliser là-dessus. D’autres écosystèmes internationaux s’organisent, et nous devons conserver notre autonomie juridique de production de conception et en faire un secteur économique florissant », assure Renaud Vedel. Oui mais voilà, pour faire de l’IA en droit, encore faut-il de la donnée juridique. Une nécessité dont la France semble de plus en plus consciente, tout en prenant acte de la quantité de data détenue par les juridictions et des possibilités qui lui sont attachées. En parallèle de la montée progressive des start-up spécialisées sur ce créneau, le gouvernement cherche aujourd’hui à cultiver une « forte dimension du commun numérique ». Désormais, estime le coordonnateur de la stratégie nationale pour l’IA au ministère de l’Économie, le capital immatériel des données, des procédures, des processus, devient la richesse de toutes les organisations, et elles ne peuvent plus l’ignorer. 

 






 


Vers une politique publique des données

Vice-présidente « Communs » de l'association Open Law, Marie Bernard rappelle qu’après la présentation à Jean Castex, il y a tout juste un an, du rapport du député LRM Éric Bothorel sur la politique publique de la donnée, le Premier ministre a adressé courant avril à tous les ministres une circulaire reprenant une partie des recommandations émises. Le texte les enjoignait à définir une politique publique des données et à travailler sur des codes sources et des algorithmes publics, le tout en respectant trois piliers : l’ouverture des données à tous, leur circulation entre les administrations, et une meilleure exploitation, synthétise Paul-Antoine Chevalier. Responsable du pôle données à Etalab, l’un des départements de la Direction interministérielle du numérique (DINUM), ce dernier encadre les différents ministères et opérateurs de l’État sur l’utilisation de l’IA. Il rapporte qu’en réponse à la circulaire, chaque ministère a présenté une feuille de route, actant ainsi une « institutionnalisation du sujet », approuve-t-il. 

Au ministère de la Justice, c’est Anne-Florence Canton, cheffe du service numérique et administratrice ministérielle de la donnée, qui a été chargée de proposer une feuille de route : « une véritable opportunité pour exploiter notre patrimoine », se réjouit-elle. Au sein de ce document librement accessible sur data.gouv.fr, le ministère s’engage à faire de la donnée un levier de transformation de la justice à travers une trentaine d’actions : cartographie des acteurs de la donnée, renforcement de l’open data, partage des informations via un hub des données de justice, industrialisation de projets innovants, constitution de référentiels partagés de l’administration pénitentiaire ou encore sécurisation du partage des informations pour faciliter les enquêtes terroristes et les agressions sexuelles.

Au titre des enjeux, selon Anne-Florence Canton, l’acculturation, mais aussi la démythification, en premier lieu. « Il faut commencer par expliquer et par montrer les usages que l’on fait de la data dans d’autres secteurs, en vue de libérer ce potentiel au ministère », assure-t-elle. 

L’ouverture des données est d'ailleurs l’occasion pour le ministère de la Justice de repenser certaines politiques publiques au regard des données mises à disposition par d’autres administrations. À l’instar, par exemple, des informations fiscales émises par la Direction générale des finances publiques, lesquelles se sont avérées fortement utiles dans le cadre du calcul de l’aide juridictionnelle : « le fait de réaliser qu’il y avait une interface de programmation permettant de récupérer automatiquement le revenu fiscal de référence nous a amenés à nous fonder sur ces données », raconte la cheffe du service numérique. Objectif : une demande d’AJ pré-remplie, dématérialisée, pour un temps de traitement réduit. 

Anne-Florence Canton revient également sur l’une des premières réalisations concrètes au ministère de la Justice pour ouvrir les données : l’open data des décisions de justice. Une première étape importante « pour redonner confiance dans la justice » via plus de transparence, affirme-t-elle. Paul-Antoine Chevalier accompagne justement, à ce titre, la Cour de cassation pour la justice judiciaire et le Conseil d’État pour la justice administrative. Il explique que des algorithmes d’IA, développés en partenariat avec Etalab, sont chargés d’y détecter des éléments à occulter dans le cadre de la pseudonymisation (rendant impossible l’identification directe), pour pouvoir ensuite diffuser massivement ces décisions et « rendre le droit accessible à tous ».

 

 


Optimisation informatique, aide à la décision : quelques cas d’usage 

Cependant, la data dont dispose pour l’heure le ministère de la Justice a beau être considérable, il s’agit de données textuelles, trouvées dans les procédures, dans les décisions de justice, et produites dans des systèmes d’information plus tout jeunes. Sans nouveaux outils, impossible de véritablement en tirer parti, estime Anne-Florence Canton.

Si la priorité affichée par la cheffe du service numérique est de développer des produits numériques datacentriques, car « pour que les données soient réutilisables par des algorithmes, elles doivent être structurées », c’est-à-dire organisées et formatées ; en attendant, l’objectif est de mieux exploiter les données existantes (et non structurées) contenues dans les systèmes d’information historiques. « Aujourd’hui, nous avons une opportunité de réexploiter les décisions de justice et d’aller détecter automatiquement des dates, des lieux, des montants d’indemnisation, etc. Les fins auxquelles nous allons les mettre à profit ne relèvent pas de la justice prédictive, mais plus de la jurimétrie, de l’aide à la décision et surtout de l’aide au travail au quotidien, pour ne pas être obligé de ressaisir des données, mais être capable de les sortir automatiquement dans les textes », explique la cheffe du service numérique. Cette dernière nuance : la méthode ne sera pas parfaite, cependant, l’algorithme devrait être « à 90 % » capable de reconnaître correctement les informations et d’aider le greffier. 

Exemple avec les décisions de divorce. Il s’agit de textes qui ne contiennent pas, de manière formatée, des informations telles que le montant des pensions alimentaires. Pour autant, ces données doivent être transmises à la Caisse d’allocations familiales. Aujourd’hui, la CAF a mis à disposition du ministère de la Justice une interface dans laquelle les greffiers doivent re-saisir ces données après avoir lu la décision. Une « perte de temps sans valeur ajoutée pour le greffier », estime Anne-Florence Canton. « L’algorithme sera capable de lire la décision, et d’extraire des informations assez simples à reconnaître. Certes il y aura toujours un contrôle humain, mais on va soulager le greffier dans cette tâche. Ici, on est plus sur de l'optimisation informatique. » 

Pour sa part, Paul-Antoine Chevalier revient sur deux tests menés par Etalab. Le département a notamment expérimenté, auprès du Conseil d’État, un algorithme qui détecterait des contentieux portant sur les mêmes questions de droit. « Les résultats préliminaires ont montré que ce n’était pas toujours facile à identifier, mais cela prouve au moins que c'est possible. Reste à voir ce que le Conseil d’État voudra en faire et comment il souhaitera l’utiliser, mais cela pourrait constituer une véritable aide à la décision », souligne le responsable du pôle données. Une expérience similaire a eu lieu à la Cour de cassation, sur les décisions de justice cette fois. « La Cour de cassation a pour mission de faire en sorte qu’il n’y ait pas de divergences dans l'interprétation du droit, et la question de savoir si deux décisions sont divergentes n’est pas si facile à identifier », indique Paul-Antoine Chevalier. Etalab a donc entamé des travaux avec l’Inria (Institut national de recherche en informatique et en automatique). Afin de détecter ces divergences, il s’agit de passer par des étapes intermédiaires, notamment savoir de quoi parle la décision, et donner des « titres » à celle-ci, à partir du résumé, du sommaire. Une étape préalable pour pouvoir ensuite regrouper les décisions parlant des mêmes questions. « Puis à partir du moment où des décisions “proches” ont pu être rassemblées, la question va être de se demander si elles disent la même chose. » Paul-Antoine Chevalier voit là une possibilité sérieuse pour aider les métiers du droit. 

 

 







Des ressources encore trop limitées

Les possibilités d’utilisation ne manquent donc pas. D’autre part, note Anne-Florence Canton, « nous sommes entrés dans une ère et nous ne ferons pas demi-tour ». Toutefois, la cheffe du service numérique au ministère de la Justice pointe le manque de ressources en France, en particulier en termes d’infrastructures informatiques. « Nous devons absolument archiver cette donnée. Le paradigme s’est inversé : le numériquement natif, voilà ce qui va faire foi demain, et des systèmes doivent garantir la conservation de ce patrimoine. » Pour Renaud Vedel, la France doit donc accomplir « un saut technologique ». D’autant que toutes les normes juridiques ne sont pas présentées dans un format calculable, et que tout n’est pas encore suffisamment dématérialisé. Il y a donc « un gros effort à faire », affirme-t-il. « Depuis 20 ans, nous avons assisté à une succession d'innovations numériques, et nous ne les avons pas toutes digérées, alors même que de nouvelles arrivent », alerte le coordonnateur de la stratégie nationale pour l’intelligence artificielle au ministère de l’Économie. 

Pour endiguer ce flux, des ressources en capital humain sont également indispensables. Sur ce point, Renaud Vedel mise sur la formation. « On a un problème, chez nous : d’un côté, le droit reste dans les facultés de droit, de l’autre, l’informatique reste dans les écoles d’ingénieurs – même si c’est un peu moins vrai actuellement. L’enjeu, aujourd’hui, est de créer une nouvelle génération de juristes informaticiens. C’est absolument nécessaire. Il faut créer des filières, des licences, des masters, des doctorats dans ces domaines », martèle-t-il. Et cela tombe bien : Frédérique Vidal, ministre de l’Enseignement supérieur, de la Recherche et de l’Innovation, a justement annoncé, le 8 novembre, que 776 millions d’euros seraient dévolus aux formations dans l’intelligence artificielle et l’informatique en général. 

Il faut dire que le besoin en experts de la donnée, déjà fortement courtisés, devrait exploser dans les prochaines années, pointe Paul-Antoine Chevalier. Et ce n’est pas Anne-Florence Canton qui dit le contraire : « Au ministère de la Justice, on cherche à recruter des data engineers, capables de nettoyer la donnée, de la présenter et de l’exploiter en déroulant dessus les algorithmes qui existent. » Ces ingénieurs de la donnée interviennent donc en amont des fameux « data scientists », pour « préparer le terrain ». « On se rend compte que l’on a besoin de ces profils-là », confie la cheffe du service numérique au ministère de la Justice. Car d’ici 2025, en matière d’open data des décisions de justice, le ministère mise sur « une montée en puissance progressive mais rapide ». Objectif : passer de 20 000 décisions annuelles aujourd’hui à 2 millions d’ici 2025. D’où la nécessité de mettre en place « une vraie politique pour rendre l’État plus attractif », souligne Paul-Antoine Chevalier. 

 

 


« Hybrider les cultures » et mettre en commun

Pour « monter en puissance », le responsable du pôle données chez Etalab plaide pour la mise en commun des ressources, ces dernières étant, pour l’heure, limitées : le département fait en sorte que ce qu’il développe « soit le plus possible utilisable par d’autres et le plus documenté ». Par exemple, sur la pseudonymisation des décisions de justice, le service a mis au point un algorithme dont le code est ouvert, et a réalisé un guide détaillant le concept de la pseudonymisation et la méthode utilisée. « Les retours sont les bienvenus ! », ajoute Paul-Antoine Chevalier.

Par ailleurs, constatant qu’il existe beaucoup de cas d’usage relevant du traitement automatique du langage naturel et peu de ressources nativement francophones, Etalab a crowdsourcé (comprendre : délégué au public) un jeu de données de questions/réponses en français et ouvert à tous, lequel permet ainsi d’entraîner les algorithmes pour faire des moteurs de recherche intelligents. Au total, le projet PIAF (Pour des IA Francophones) recense 9 500 annotations proposées par 700 contributeurs. Le défi pour les administrations consiste désormais à s’approprier ce jeu de données.

Renaud Vedel approuve lui aussi le partage d’expérience. Le coordonnateur de la stratégie nationale pour l’IA au ministère de l’Économie n’hésite pas à se rapprocher des legaltech et des grands groupes d’édition juridique. « J'interagis également avec des centres interdisciplinaires de l’intelligence artificielle, notamment à Nice, avec la chaire Droit économique et Intelligence artificielle portée par Marina Teller », projet qui ambitionne d’explorer, analyser et critiquer la deep tech – autrement dit, les start-up misant sur l’innovation de rupture sous l’angle juridique. Dans le même sens, Renaud Vedel témoigne mener un rôle de veille concurrentielle : « Je regarde par exemple ce qui se fait en Californie, au Stanford Center for Legal Informatics (CodeX), et je me dis que l’on aurait bien besoin en France de créer ou de renforcer ce type de plateforme où se rejoignent à la fois des praticiens du droit, des universitaires, des informaticiens et des praticiens administratifs. »

En plus d’apprendre des autres, l’homme entend « bousculer les décideurs publics ». Actuellement, le Conseil d’État rédige une étude à laquelle Renaud Vedel participe, au même titre que Paul-Antoine Chevalier. « On peut espérer que cette institution prescriptrice aura une certaine influence sur les décideurs publics, ainsi que sur les professions du droit et les juridictions, qui interagissent elles-mêmes avec de nombreux acteurs privés. »

À son sens, ce n’est que dans le cadre d’une coopération public/privé qu’on pourra faire émerger « un secteur de la legaltech puissant, riche, créateur de valeur ».

Anne-Florence Canton rejoint cette idée de travail collaboratif. Au ministère de la Justice, des partenariats ont commencé à se mettre en place. La Cour de cassation, par exemple, s’entoure d’instituts de recherche, de Polytechnique, etc., pour aller plus loin en matière d’intelligence artificielle. « Nous avons besoin de ce soutien pour être plus efficaces. Nous avons besoin de scientifiques pour ouvrir nos chakras ! » Et Paul-Antoine Chevalier d’abonder : « Il faut que l’on hybride les cultures et que l’on travaille tous davantage ensemble. » Les espoirs placés dans la collaboration et le « team work » sont donc nombreux, reste à savoir s’ils seront suivis d’effet.

 

Bérengère Margaritelli

 

 

Partager l'article


0 Commentaire

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Abonnez-vous à la Newsletter !

Recevez gratuitement un concentré d’actualité chaque semaine.