Article précédent


Les Rendez-vous des transformations du droit ont accueilli
2 800 participants, les 18 et 19 novembre derniers. Au programme, deux
jours de rencontres avec les acteurs de l’innovation juridique. Alors que le
secteur des legaltech s’est emparé de la data depuis quelques années, l’État
veut se mettre au diapason et instaurer une vraie politique publique des
données. S’il affiche ses ambitions et mise sur les partenariats, les ressources
s’avèrent, pour l’heure, insuffisantes, ont constaté plusieurs spécialistes
lors de la plénière d’ouverture.
Lors de cette plénière d’ouverture, le 18 novembre, Renaud Vedel,
coordonnateur de la stratégie nationale pour l’intelligence artificielle (IA) au
ministère de l’Économie, des Finances et de la Relance, le souligne : bien
qu’il y ait un peu d’exagération autour de l’intelligence artificielle, « l’un
des mots du moment », « ce n’est pas un effet de mode, mais
une technologie d’usage général qui peut changer beaucoup de modes de
production ». En 2019, un rapport commandité par la Direction générale
des entreprises dressait ainsi une liste des 15 secteurs les plus prometteurs
pour l’économie française en lien avec l’IA, parmi lesquels le marché des legaltech.
Rien d’étonnant : ces dernières années, de nouveaux algorithmes (appelés
« Transformers ») ont énormément progressé sur le traitement
automatisé du langage, et affichent un gros potentiel en matière d’aide à la
lecture, d’analyse de document et d’aide à la production sémantique,
particulièrement utiles pour le monde juridique. « Il ne faut pas
exagérer leurs capacités – nous sommes loin du juge prédictif –, mais il y a
beaucoup de choses qui peuvent être faites pour aider les professions du droit,
et il faut capitaliser là-dessus. D’autres écosystèmes internationaux
s’organisent, et nous devons conserver notre autonomie juridique de production
de conception et en faire un secteur économique florissant », assure
Renaud Vedel. Oui mais voilà, pour faire de l’IA en droit, encore faut-il de la
donnée juridique. Une nécessité dont la France semble de plus en plus
consciente, tout en prenant acte de la quantité de data détenue par les
juridictions et des possibilités qui lui sont attachées. En parallèle de la
montée progressive des start-up spécialisées sur ce créneau, le gouvernement
cherche aujourd’hui à cultiver une « forte dimension du commun
numérique ». Désormais, estime le coordonnateur de la stratégie
nationale pour l’IA au ministère de l’Économie, le capital immatériel des
données, des procédures, des processus, devient la richesse de toutes les
organisations, et elles ne peuvent plus l’ignorer.
Vers une politique publique des données
Vice-présidente
« Communs » de l'association Open Law, Marie Bernard rappelle
qu’après la présentation à Jean Castex, il y a tout juste un an, du rapport du
député LRM Éric Bothorel sur la politique publique de la donnée, le Premier
ministre a adressé courant avril à tous les ministres une circulaire reprenant
une partie des recommandations émises. Le texte les enjoignait à définir une
politique publique des données et à travailler sur des codes sources et des
algorithmes publics, le tout en respectant trois piliers : l’ouverture des
données à tous, leur circulation entre les administrations, et une meilleure
exploitation, synthétise Paul-Antoine Chevalier. Responsable du pôle données à
Etalab, l’un des départements de la Direction interministérielle du numérique
(DINUM), ce dernier encadre les différents ministères et opérateurs de l’État
sur l’utilisation de l’IA. Il rapporte qu’en réponse à la circulaire, chaque
ministère a présenté une feuille de route, actant ainsi une « institutionnalisation
du sujet », approuve-t-il.
Au ministère de la Justice, c’est
Anne-Florence Canton, cheffe du service numérique et administratrice
ministérielle de la donnée, qui a été chargée de proposer une feuille de
route : « une véritable opportunité pour exploiter notre
patrimoine », se réjouit-elle. Au sein de ce document librement accessible
sur data.gouv.fr, le ministère s’engage à faire de la donnée un levier
de transformation de la justice à travers une trentaine d’actions :
cartographie des acteurs de la donnée, renforcement de l’open data, partage des
informations via un hub des données de justice, industrialisation de projets
innovants, constitution de référentiels partagés de l’administration
pénitentiaire ou encore sécurisation du partage des informations pour faciliter
les enquêtes terroristes et les agressions sexuelles.
Au titre des enjeux, selon
Anne-Florence Canton, l’acculturation, mais aussi la démythification, en
premier lieu. « Il faut commencer par expliquer et par montrer les
usages que l’on fait de la data dans d’autres secteurs, en vue de libérer ce
potentiel au ministère », assure-t-elle.
L’ouverture des données est
d'ailleurs l’occasion pour le ministère de la Justice de repenser certaines
politiques publiques au regard des données mises à disposition par d’autres
administrations. À l’instar, par exemple, des informations fiscales émises par
la Direction générale des finances publiques, lesquelles se sont avérées
fortement utiles dans le cadre du calcul de l’aide juridictionnelle :
« le fait de réaliser qu’il y avait une interface de programmation
permettant de récupérer automatiquement le revenu fiscal de référence nous a
amenés à nous fonder sur ces données », raconte la cheffe du service
numérique. Objectif : une demande d’AJ pré-remplie, dématérialisée, pour
un temps de traitement réduit.
Anne-Florence Canton revient
également sur l’une des premières réalisations concrètes au ministère de la
Justice pour ouvrir les données : l’open data des décisions de justice. Une première étape importante « pour
redonner confiance dans la justice » via plus de transparence,
affirme-t-elle. Paul-Antoine Chevalier accompagne justement, à ce titre, la
Cour de cassation pour la justice judiciaire et le Conseil d’État pour la
justice administrative. Il explique que des algorithmes d’IA, développés en
partenariat avec Etalab, sont chargés d’y détecter des éléments à occulter dans
le cadre de la pseudonymisation (rendant impossible l’identification directe),
pour pouvoir ensuite diffuser massivement ces décisions et « rendre le
droit accessible à tous ».
Optimisation informatique, aide à la décision : quelques
cas d’usage
Cependant,
la data dont dispose pour l’heure le ministère de la Justice a beau être
considérable, il s’agit de données textuelles, trouvées dans les procédures,
dans les décisions de justice, et produites dans des systèmes d’information
plus tout jeunes. Sans nouveaux outils, impossible de véritablement en tirer
parti, estime Anne-Florence Canton.
Si la
priorité affichée par la cheffe du service numérique est de développer des produits
numériques datacentriques, car « pour que les données soient
réutilisables par des algorithmes, elles doivent être structurées »,
c’est-à-dire organisées et formatées ; en attendant, l’objectif est de
mieux exploiter les données existantes (et non structurées) contenues dans les
systèmes d’information historiques. « Aujourd’hui, nous avons une
opportunité de réexploiter les décisions de justice et d’aller détecter
automatiquement des dates, des lieux, des montants d’indemnisation, etc. Les
fins auxquelles nous allons les mettre à profit ne relèvent pas de la justice
prédictive, mais plus de la jurimétrie, de l’aide à la décision et surtout de
l’aide au travail au quotidien, pour ne pas être obligé de ressaisir des
données, mais être capable de les sortir automatiquement dans les textes »,
explique la cheffe du service numérique. Cette dernière nuance : la
méthode ne sera pas parfaite, cependant, l’algorithme devrait être « à
90 % » capable de reconnaître correctement les informations et
d’aider le greffier.
Exemple
avec les décisions de divorce. Il s’agit de textes qui ne contiennent pas, de
manière formatée, des informations telles que le montant des pensions
alimentaires. Pour autant, ces données doivent être transmises à la Caisse
d’allocations familiales. Aujourd’hui, la CAF a mis à disposition du ministère
de la Justice une interface dans laquelle les greffiers doivent re-saisir ces
données après avoir lu la décision. Une « perte de temps sans valeur
ajoutée pour le greffier », estime Anne-Florence Canton. « L’algorithme
sera capable de lire la décision, et d’extraire des informations assez simples
à reconnaître. Certes il y aura toujours un contrôle humain, mais on va
soulager le greffier dans cette tâche. Ici, on est plus sur de
l'optimisation informatique. »
Pour sa part, Paul-Antoine Chevalier revient sur deux tests menés par
Etalab. Le département a notamment expérimenté, auprès du Conseil d’État, un
algorithme qui détecterait des contentieux portant sur les mêmes questions de
droit. « Les résultats préliminaires ont montré que ce n’était pas
toujours facile à identifier, mais cela prouve au moins que c'est possible.
Reste à voir ce que le Conseil d’État voudra en faire et comment il souhaitera
l’utiliser, mais cela pourrait constituer une véritable aide à la décision »,
souligne le responsable du pôle données. Une expérience similaire a eu lieu à
la Cour de cassation, sur les décisions de justice cette fois. « La
Cour de cassation a pour mission de faire en sorte qu’il n’y ait pas de
divergences dans l'interprétation du droit, et la question de savoir si deux
décisions sont divergentes n’est pas si facile à identifier », indique
Paul-Antoine Chevalier. Etalab a donc entamé des travaux avec l’Inria (Institut
national de recherche en informatique et en automatique). Afin de détecter ces
divergences, il s’agit de passer par des étapes intermédiaires, notamment
savoir de quoi parle la décision, et donner des « titres » à
celle-ci, à partir du résumé, du sommaire. Une étape préalable pour pouvoir ensuite
regrouper les décisions parlant des mêmes questions. « Puis à partir du
moment où des décisions “proches” ont pu être rassemblées, la question
va être de se demander si elles disent la même chose. » Paul-Antoine
Chevalier voit là une possibilité sérieuse pour aider les métiers du
droit.
Des ressources encore trop limitées
Les possibilités d’utilisation ne
manquent donc pas. D’autre part, note Anne-Florence Canton, « nous
sommes entrés dans une ère et nous ne ferons pas demi-tour ».
Toutefois, la cheffe du service numérique au ministère de la Justice pointe le
manque de ressources en France, en particulier en termes d’infrastructures
informatiques. « Nous devons absolument archiver cette donnée. Le
paradigme s’est inversé : le numériquement natif, voilà ce qui va faire
foi demain, et des systèmes doivent garantir la conservation de ce patrimoine. »
Pour Renaud Vedel, la France doit donc accomplir « un saut
technologique ». D’autant que toutes les normes juridiques ne sont pas
présentées dans un format calculable, et que tout n’est pas encore suffisamment
dématérialisé. Il y a donc « un gros effort à faire »,
affirme-t-il. « Depuis 20 ans, nous avons assisté à une succession
d'innovations numériques, et nous ne les avons pas toutes digérées, alors même
que de nouvelles arrivent », alerte le coordonnateur de la stratégie
nationale pour l’intelligence artificielle au ministère de l’Économie.
Pour
endiguer ce flux, des ressources en capital humain sont également
indispensables. Sur ce point, Renaud Vedel mise sur la formation. « On
a un problème, chez nous : d’un côté, le droit reste dans les facultés de
droit, de l’autre, l’informatique reste dans les écoles d’ingénieurs – même si
c’est un peu moins vrai actuellement. L’enjeu, aujourd’hui, est de créer une nouvelle
génération de juristes informaticiens. C’est absolument nécessaire. Il faut
créer des filières, des licences, des masters, des doctorats dans ces
domaines », martèle-t-il. Et cela tombe bien :
Frédérique Vidal, ministre de l’Enseignement supérieur, de la Recherche et de
l’Innovation, a justement annoncé, le 8 novembre, que 776 millions d’euros
seraient dévolus aux formations dans l’intelligence artificielle et
l’informatique en général.
Il faut dire que le besoin en
experts de la donnée, déjà fortement courtisés, devrait exploser dans les
prochaines années, pointe Paul-Antoine Chevalier. Et ce n’est pas Anne-Florence
Canton qui dit le contraire : « Au ministère de la Justice, on
cherche à recruter des data engineers, capables de nettoyer la donnée,
de la présenter et de l’exploiter en déroulant dessus les algorithmes qui
existent. » Ces ingénieurs de la donnée interviennent donc en amont
des fameux « data scientists », pour « préparer le
terrain ». « On se rend compte que l’on a besoin de ces profils-là »,
confie la cheffe du service numérique au ministère de la Justice. Car d’ici
2025, en matière d’open data des décisions de justice, le ministère mise sur
« une montée en puissance progressive mais rapide ».
Objectif : passer de 20 000 décisions annuelles aujourd’hui à
2 millions d’ici 2025. D’où la nécessité de mettre en place « une
vraie politique pour rendre l’État plus attractif », souligne
Paul-Antoine Chevalier.
« Hybrider les cultures » et mettre en commun
Pour
« monter en puissance », le responsable du pôle données chez Etalab plaide pour la mise en commun des ressources, ces dernières étant, pour
l’heure, limitées : le département fait en sorte que ce qu’il développe
« soit le plus possible utilisable par d’autres et le plus documenté ».
Par exemple, sur la pseudonymisation des décisions de justice, le service a mis
au point un algorithme dont le code est ouvert, et a réalisé un guide
détaillant le concept de la pseudonymisation et la méthode utilisée. « Les
retours sont les bienvenus ! », ajoute Paul-Antoine Chevalier.
Par
ailleurs, constatant qu’il existe beaucoup de cas d’usage relevant du
traitement automatique du langage naturel et peu de ressources nativement
francophones, Etalab a crowdsourcé (comprendre : délégué au public) un jeu
de données de questions/réponses en français et ouvert à tous, lequel permet
ainsi d’entraîner les algorithmes pour faire des moteurs de recherche
intelligents. Au total, le projet PIAF (Pour des IA Francophones) recense
9 500 annotations proposées par 700 contributeurs. Le défi pour les
administrations consiste désormais à s’approprier ce jeu de données.
Renaud
Vedel approuve lui aussi le partage d’expérience. Le coordonnateur de la
stratégie nationale pour l’IA au ministère de l’Économie n’hésite pas à se rapprocher
des legaltech et des grands groupes d’édition juridique. « J'interagis
également avec des centres interdisciplinaires de l’intelligence artificielle,
notamment à Nice, avec la chaire Droit économique et Intelligence artificielle
portée par Marina Teller », projet qui ambitionne d’explorer, analyser
et critiquer la deep tech – autrement dit, les start-up misant sur
l’innovation de rupture – sous l’angle juridique. Dans le même sens,
Renaud Vedel témoigne mener un rôle de veille concurrentielle : « Je
regarde par exemple ce qui se fait en Californie, au Stanford Center for Legal
Informatics (CodeX), et je me dis que l’on aurait bien besoin en France
de créer ou de renforcer ce type de plateforme où se rejoignent à la fois des
praticiens du droit, des universitaires, des informaticiens et des praticiens
administratifs. »
En plus
d’apprendre des autres, l’homme entend « bousculer les décideurs
publics ». Actuellement, le Conseil d’État rédige une étude à laquelle
Renaud Vedel participe, au même titre que Paul-Antoine Chevalier. « On
peut espérer que cette institution prescriptrice aura une certaine influence
sur les décideurs publics, ainsi que sur les professions du droit et les
juridictions, qui interagissent elles-mêmes avec de nombreux acteurs privés. »
À son sens,
ce n’est que dans le cadre d’une coopération public/privé qu’on pourra faire
émerger « un secteur de la legaltech puissant, riche, créateur
de valeur ».
Anne-Florence
Canton rejoint cette idée de travail collaboratif. Au ministère de la
Justice, des partenariats ont commencé à se mettre en place. La Cour de
cassation, par exemple, s’entoure d’instituts de recherche, de Polytechnique,
etc., pour aller plus loin en matière d’intelligence artificielle. « Nous
avons besoin de ce soutien pour être plus efficaces. Nous avons besoin de
scientifiques pour ouvrir nos chakras ! » Et Paul-Antoine
Chevalier d’abonder : « Il faut que l’on hybride les cultures et
que l’on travaille tous davantage ensemble. » Les espoirs placés dans
la collaboration et le « team work » sont donc nombreux, reste à
savoir s’ils seront suivis d’effet.
Bérengère
Margaritelli
THÉMATIQUES ASSOCIÉES
Infos locales, analyses et enquêtes : restez informé(e) sans limite.
Recevez gratuitement un concentré d’actualité chaque semaine.
0 Commentaire
Laisser un commentaire
Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *