Open data des décisions de justice : où en est-on ? Estelle Jond-Necand, directrice du projet Open Data à la Cour de cassation, fait le point


mardi 14 décembre 2021 à 17:129 min

Écouter l'article

Depuis le 1er octobre, environ 480 000 décisions rendues publiquement par la Cour de cassation sont accessibles gratuitement sur le nouveau site de l’institution. La Cour de cassation est en effet responsable de la mise à disposition du public des décisions judiciaires. Quels en sont les enjeux ? Quels sont les principaux défis à relever ? Et quelles pourraient être les conséquences de cette ouverture des données sur la justice elle-même ? Réponses avec la magistrate Estelle Jond-Necand, directrice du projet Open Data à la Cour de cassation.

 

 

Pour commencer, pouvez-vous revenir sur les motivations de l’open data des décisions de justice ? Quelles décisions sont spécifiquement concernées ?

Le régime de l’open data a été posé par l’article 21 de la loi n° 2016-1321 du 7 octobre 2016 pour une République numérique, puis précisé par l’article 33 de la loi n° 2019-222?du 23 mars 2019 de programmation 2018-2022 et de réforme pour la justice, et enfin par le décret n° 2020-797 du 29 juin 2020 relatif à la mise à la disposition du public des décisions des juridictions judiciaires et administratives.

Le premier volet de la loi pour une République numérique d’octobre 2016, dite « loi Lemaire », vise à favoriser la « circulation des données et du savoir ». Le premier objectif annoncé lors de l’adoption de l’amendement est un objectif de transparence de la vie publique. Dans un souci d’intérêt général, garantir l’accès aux décisions de justice par les citoyens permet de participer à l’accroissement de leur confiance en la justice.

Le second objectif est d’ordre économique : ouvrir et permettre la circulation des données crée inévitablement de la valeur.

Pour ce qui est des décisions concernées par cette mise à disposition par le public, vous avez raison de poser la question, car il est important de savoir de quoi on parle. Seules les décisions rendues publiquement sont concernées par la mise en open data. C’est-à-dire que les décisions rendues non publiquement, comme les décisions du juge des affaires familiales concernant la garde d’enfant, par exemple, ne seront pas accessibles en open data, et ce par souci de protection des mineurs. Ces décisions n’étaient déjà pas ouvertes au public, et ne le seront donc toujours pas, même avec l’ouverture des données.



Dans le prolongement de sa mission de diffusion de la jurisprudence, la Cour de cassation est responsable de la mise à disposition du public des décisions judiciaires. À ce titre, quel est clairement son rôle ? Et quels sont les principaux défis à relever ?

La Cour de cassation est en effet responsable de la diffusion et de la mise à disposition des décisions rendues par l’ordre judiciaire et est, à ce titre, également responsable du traitement automatisé des décisions de justice de l’ordre judiciaire. De son côté, le Conseil d’État est responsable de la diffusion et de la mise à disposition des décisions rendues par l’ordre administratif.

 

 

« 15 000 décisions publiques sont rendues par an par la Cour de cassation, ce qui fait donc 15 000 décisions 

à pseudonyminiser et à mettre à disposition du public. »

 

 

Le premier défi à relever est purement juridique, et concerne la sécurité et le respect de la vie privée des personnes physiques. En effet, avant d’être publiées sur notre site, les décisions sont pseudonymisées, une tâche qui peut s’avérer plus ou moins complexe en fonction des indications du juge (voir réponse suivante, ndlr).

Environ 15 000 décisions publiques sont rendues chaque année par la Cour de cassation, ce qui fait donc 15 000 décisions à pseudonymiser et à mettre à disposition du public. Sachant que ce chiffre est amené à s’accroître, puisque, dès avril 2022, s’ajouteront les 230 000 décisions rendues par an par les cours d’appel en matière civile, sociale et commerciale. Au total, la Cour de cassation sera amenée dès décembre 2025 à traiter pas moins de 3 millions de décisions rendues chaque année par l’ensemble de l’ordre judiciaire. Vous l’aurez compris, le second défi est donc naturellement d’ordre technologique !

Avec deux data scientists et deux développeurs notamment, nous avons ainsi conçu et mis en place un certain nombre d’outils venant automatiser ce travail de pseudonymisation et faciliter l’accès aux données via la création d’un moteur de recherche performant : un travail colossal mais passionnant.

 

 

Comment procédez-vous à la pseudonymisation les décisions mises à la disposition du public sur votre site ?

Notre plus grande difficulté réside dans les différents degrés de pseudonymisation. On l’a vu, pour protéger la vie privée des personnes, et conformément à l’article L. 111-13 du Code de l'organisation judiciaire, chaque décision est pseudonymisée avant d’être mise en ligne. Cela concerne les noms et prénoms des parties, mais aussi des témoins. Nous disposons donc d’un dispositif qui permet l’occultation systématique de ces données, que nous appelons « socles ». Toutefois, d’autres informations considérées comme réidentifiantes peuvent également être concernées, et ce, dans un souci de protection des personnes physiques. Ces occultations dites « complémentaires » ont été prévues par le décret du 29 juin 2020, sans en préciser la nature. La Cour de cassation a alors mis en place des groupes de travail pour identifier ces données : il s’agit notamment des adresses et localités, des dates civiles (naissances, mariages, décès), des plaques d’immatriculation, des comptes bancaires, des numéros de Sécurité sociale, ou encore des adresses mail et des numéros de téléphone. En réalité, tout ce qui permet d’identifier une personne. C’est au magistrat ayant rendu  ladite décision de les identifier. Ce travail sur mesure complexifie immanquablement notre procédure, dans le sens où c’est du cas par cas.

Les noms et prénoms des magistrats, du personnel de greffe et des avocats ne sont pas occultés, sauf si cela porte atteinte à la vie privée de ces personnes, par exemple dans le cas de procès terroriste. En ce cas, la décision d’occultation revient au chef de juridiction.

 

 

Quelles sont aujourd’hui les différentes étapes de traitement des décisions de justice avant leur mise à disposition ?

Pour ce qui est de la pseudonymisation, un moteur d’intelligence artificielle a été développé pour pseudonymiser automatiquement des éléments de ré-identification (dont les noms et prénoms des personnes physiques) dans les décisions de justice. Un contrôle est ensuite opéré par un agent et une interface recréée récemment vérifie la bonne exécution, en fonction des instructions des magistrats. En fonction des décisions, la relecture est plus ou moins exhaustive.

Puis, les décisions sont mises sur une API (Application programming interface ou Interface de programmation d’application) pour permettre aux personnes individuelles de retrouver les informations via un moteur de recherche, ou via une interface de téléchargement utilisée par les legaltechs et les éditeurs juridiques, permettant alors de télécharger en lot.

Les décisions de la Cour de cassation publiées au bulletin sont mises en ligne le jour même, à 14h, sur le site de l’institution. Les autres sont publiées dans la semaine.

Pour ce qui est des cours d’appel – qui correspondent à un traitement de volume plus important –, l’objectif serait de les mettre en ligne dans la semaine, ou dans les 10?jours maximum. Officiellement, dans le texte, la mise en open data doit être faite dans les six mois.

 

 

Auparavant, comment le justiciable pouvait-il accéder à une décision de justice ?

Avant la mise en open data, certaines données étaient directement accessibles sur Légifrance, mais pour la majorité des décisions, le justiciable devait faire une demande identifiée au greffe. La décision devait ainsi être connue, ce qui pouvait largement complexifier la recherche.

Aujourd’hui, la Cour a mis à disposition sur son site 480 000 décisions rendues publiquement par la Cour de cassation. Cependant, nous procédons à une mise à disposition progressive, ce fonds est donc amené à s’enrichir. Dès juin 2023, par exemple, les décisions de justice des conseils de prud’hommes seront également mises en open data, et accessibles sur le site de la Cour de cassation.

En ce qui concerne les recherches professionnelles, les magistrats utilisent les bases de données jurisprudentielles JuriNet et JuriCA, gérées par la Cour de cassation. Ils pourront aussi,  utiliser ce nouveau moteur de recherche développé par la Cour de cassation.

 

 

Pouvez-vous nous parler plus spécifiquement de ce moteur de recherche ? Des enrichissements peuvent-ils être apportés aux décisions de justice ?

Ces enrichissements tendent à fournir des informations supplémentaires en établissant des liens. Par exemple, pour les décisions publiées, des liens vers les bulletins seront ajoutés. Concernant les décisions des formations plénières et mixtes, les rapports du rapporteur et les avis de l’avocat général sont également accessibles. Des liens avec les lettres de chambre ou les communiqués sont faits. Enfin, au début de l’année 2022, un chaînage avec les décisions frappées de pourvoi, rendues publiquement, sera effectué.  Des enrichissements existent aussi pour établir des rapprochements entre les jurisprudences et les textes cités. Ces fonctionnalités permettront aux visiteurs d’avoir accès à une information enrichie sur la jurisprudence.

 

 

Comment la Cour de cassation entend-elle travailler avec l’ensemble des juridictions judiciaires ?

Pour élaborer des doctrines d’occultation complémentaires, la Cour de cassation a travaillé, entre janvier et juillet 2021, avec les cours d’appel – qui sont concernées par la mise en open data dès avril 2022 –, via la mise en place d’un comité stratégique et de cinq groupes de travail thématiques. La Première présidente de la Cour de cassation, Chantal Arens, ainsi que le président Jean-Michel Sommer, président de chambre et directeur du service de documentation, des études et du rapport (SDER) rencontrent aussi régulièrement les chefs de Cour ainsi que les correspondants des CA et évoquent ces questions. Nous élaborons par ailleurs  un dispositif d’accompagnement du changement, afin d’assister les CA dans les transformations à venir. Ce travail est utile pour la suite, le retour d’expériences pourra bien sûr être décliné pour les autres juridictions concernées par la mise en open data des décisions de justice. Enfin, pour préparer ces modifications, et former les futurs professionnels, le SDER intervient aussi à l’ENM et à l’EFB.

 

 

Enfin, quels pourraient être les impacts de cette mise à disposition des décisions de justice sur les décisions futures ?

Il est encore trop tôt pour se prononcer, personne n’est capable de dire, aujourd’hui, quels impacts l’open data aura sur la justice. Mais nous nous interrogeons bien sûr déjà dessus et avons identifié plusieurs types d’enjeux.

D’abord, dans la façon dont les décisions seront utilisées par les réutilisateurs. À ce titre, avec le ministère de la Justice et le Conseil d’État, nous avons créé un groupe de travail début 2021 et menons une réflexion sur la réutilisation des décisions. Nous avons organisé cinq réunions avec les acteurs du monde de la recherche, les barreaux, les éditeurs ou encore les legaltech, et un rapport devrait être rendu bientôt, afin d’exposer les réflexions sur la réutilisation éthique de ces données. Nous réfléchissons aussi à des éventuels outils de régulation, dans le prolongement des réflexions menées par la Commission européenne. En effet, mettre à disposition des outils présentés comme étant des outils de justice prédictive peut avoir une influence sur le déroulement du procès. Nous devons à ce titre veiller au respect des droits fondamentaux.

Notre deuxième axe de réflexion concerne la notion de jurisprudence. Les décisions de la Cour de cassation ont en effet un rôle normatif et un rôle de régulation du droit. À la Cour de cassation, les décisions font jurisprudence. La question est de savoir si l’ouverture en open data risque de faire évoluer la notion même de jurisprudence. Aussi, un autre groupe de travail, animé par Loïc Cadiet, professeur à l’École de droit de la Sorbonne (Université Paris-1)*, Cécile Chainais, professeur à l’Université Paris-2 et par le président Sommer a été constitué à l’initiative de la première présidente de la Cour. Il remettra le fruit de ses réflexions en juin 2022.

Enfin, notre troisième axe de réflexion concerne la rédaction des décisions. Il faut savoir qu’en tant que juges, nous motivons nos décisions pour nous-même (afin de vérifier la pertinence de notre raisonnement), pour les parties (pour expliquer les raisons de nos décisions) et pour la juridiction supérieure qui pourra connaître de recours en appel ou en cassation. Demain, nous rédigerons aussi les décisions en ayant conscience que la décision sera mise en open data et donc lue par un plus grand nombre de destinataires. Cela oblige à considérer un peu autrement la façon dont la décision elle-même sera rédigée.

En conclusion, on pouvait se demander de prime abord pourquoi la direction de ce projet, qui constitue un défi technologique majeur, a été confié à une magistrate, et non à un ingénieur ou à un administrateur. Parce que, vous l’aurez compris, ce projet titanesque, bien plus qu’un projet purement technique, est un projet qui peut assurément transformer la justice toute entière.

 

*Et auteur du rapport sur l'open data des décisions de Justice remis en janvier 2017 au garde des Sceaux.

 

 

Propos recueillis par Constance Périn

 

Partager l'article


0 Commentaire

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Abonnez-vous à la Newsletter !

Recevez gratuitement un concentré d’actualité chaque semaine.