L’IA doit permettre d’analyser des millions de documents de justice et d’extraire des éléments qui font sens avec ce que l’utilisateur recherche. En revanche, l’IA ne devra pas inciter les juristes à suivre des modèles judiciaires au prétexte que les résultats sortis d’une machine vont dans un sens ou un autre. C’est ce que défend Warren Azoulay, directeur délégué chez Juri’Predis, une startup qui propose un moteur de recherche de décisions de justice.
La Revue du digital : les startups de la legaltech ont-elles facilement accès aux décisions de justice ?
Warren Azoulay, directeur délégué chez Juri’Predis : l’accès aux décisions de justice n’est pas si simple contrairement à ce que l’on pourrait penser. Pour cette raison, les citoyens n’en connaissent qu’une partie infime, de l’ordre de 3% ou 4%. Ces décisions devaient pourtant être accessibles depuis 2016 puisque la loi pour une République numérique prévoyait une ouverture des décisions par défaut, et reste inappliquée jusqu’à aujourd’hui. Même les sociétés privées, qu’il s’agisse d’éditeurs juridiques ou de startups du droit n’y ont pas accès sur simple demande, bien au contraire. Il est certes possible d’en acheter certaines, mais il faut aussi démontrer que l’on est en mesure d’opérer tout un traitement des décisions pour pouvoir les publier comme les pseudonymiser, c’est-à-dire occulter les éléments d’identification des personnes dans les documents. Cette monétisation de l’accès au droit pose de vraies difficultés, ne serait-ce que parce qu’il devrait être accessible à tous sans distinction.
La Revue du Digital : quelles données devraient être libérées en priorité ?
Warren Azoulay : il faudrait débuter par publier les décisions de premier degré. Le droit du quotidien concerne et intéresse directement les justiciables. C’est celui des tribunaux de première instance. Il s’agit des conseils de prud’hommes, des tribunaux d’instance et de grande instance (que l’on appelle désormais les tribunaux judiciaires) ou des tribunaux de commerce. Ce sont ces juridictions-là qui appliquent le droit au quotidien, et qui représentent 95% de l’interprétation de la loi.
Le choix a été fait de publier les décisions de la Cour de Cassation et du Conseil d’Etat car c’était plus facile
La Revue du Digital : la justice française parait elle-même faiblement informatisée. Quels services devraient être informatisés ?
Warren Azoulay : c’est une affirmation plus ou moins vraie. La Chancellerie a investi de façon significative en matière d’informatique depuis quelques années maintenant. Je pense que ces efforts vont être poursuivis. Nous sommes surtout dans une période de transition qui, en plus de moyens matériels et humains, demande du temps d’adaptation. À la lecture du budget 2021, on constate que la question du numérique est l’une des priorités du ministère de la Justice et que le plan de transformation numérique augmentera encore cette année de 30 millions d’euros, pour un total de 207 millions d’euros. De nouveaux projets informatiques doivent voir le jour, et d’autres poursuivent leur mise en œuvre comme le projet Portalis, la constitution de partie civile en ligne, l’intermédiation du paiement des pensions alimentaires, etc. Le développement du numérique progresse de façon visible. Outre les moyens humains et financiers, il faudra donc du temps.
La Revue du Digital : quels enseignements les plus utiles pourra-t-on tirer des données de justice ?
Warren Azoulay : nous ne tirerons pas de véritables « nouvelles » informations des décisions de justice à court terme. L’intelligence artificielle n’est pas un microscope permettant de révéler une réalité plus réelle que celle que nous connaissons déjà.
La diffusion des décisions de justice permet d’avoir une vision exhaustive du droit et de l’interprétation des textes, et non un échantillon filtré
La Revue du Digital : est-ce que l’intelligence artificielle pourrait apporter des bénéfices ?
Warren Azoulay : l’intelligence artificielle devient particulièrement intéressante lorsqu’il s’agit de sonder des millions de documents. Nous avons besoin d’avoir le plus de décisions possibles. Mais il est beaucoup plus difficile de chercher dans dix millions de documents que dans 50 000. Au plus nous avons de jurisprudences au plus nous avons de chance de trouver une décision se rapprochant de notre cas particulier. Mais diffuser de façon massive la jurisprudence ne peut pas avoir comme conséquence immédiate d’améliorer la connaissance qu’a le justiciable de la justice.
Il y a presque un effet pervers qui est celui de plonger les gens dans un état de saturation en raison de la quantité de données, lequel est quasiment insurmontable pour l’humain.
L’intelligence artificielle permet de dépasser cette difficulté grâce à sa façon de traiter les données. Les algorithmes sont en réalité des sortes d’interface entre la donnée brute et l’utilisateur. Ils permettent d’extraire des éléments des données qui font sens avec ce qu’il recherche. L’intérêt de l’intelligence artificielle est de ne pas être en concurrence avec l’humain, mais d’être complémentaire à celui-ci. L’autre bénéfice de l’intelligence artificielle est de pouvoir débloquer la situation actuelle qui est cristallisée autour de la pseudonymisation des décisions de justice. Traiter le stock disponible de décisions à l’échelle humaine est impossible, et une simple automatisation informatique n’est pas concluante non plus puisque les données sont presque toutes différentes. Utiliser de l’apprentissage automatisé pour simuler ce que ferait un humain est une piste beaucoup plus fertile. Il serait illusoire de penser solutionner la pseudonymisation sans intelligence artificielle. Beaucoup ont essayé.
Les cas strictement identiques n’existent pas, et c’est la raison pour laquelle je ne désire pas voir de « convergence » dans les jugements, mais plutôt une certaine « cohérence »
Warren Azoulay : il faut toujours garder à l’esprit que la loi, et les textes juridiques de façon générale, sont rédigés dans des termes généraux et abstraits devant s’appliquer à des cas particuliers qui sont tous uniques. Le juge a donc un rôle fondamental. Il exerce la qualification juridique et il applique un texte passé au prisme de son interprétation. Les cas strictement identiques n’existent pas, et c’est la raison pour laquelle je ne désire pas voir de « convergence » dans les jugements, mais plutôt une certaine « cohérence ».
L’objectif est de ne pas renvoyer une image morcelée de la justice d’une part, et d’autre part que les cas semblables soient traités de manière semblable. Une infime différence dans un dossier, tout élément d’information confondu, doit entraîner une infime différence de traitement par le juge afin de ne pas faire naître d’imprévisibilité dans le traitement des cas. Selon moi, il n’y a pas vraiment de « roulette russe », mais je comprends la métaphore dans le sens où les justiciables, et même les professionnels du droit, expriment eux-mêmes certaines incompréhensions quant à des délibérés qui les surprennent.
Cependant il faut se garder de toute tentative de standardisation du droit et de la réponse judiciaire. L’intelligence artificielle ne devra pas servir à barémiser la Justice, standardiser la réponse judiciaire, ou inciter les juristes à suivre des modèles judiciaires au prétexte que les résultats sortis d’une machine vont dans un sens ou un autre. Le droit est une matière malléable et vivante, il ne faut pas chercher à ce qu’il soit rigide et figé en exigeant des magistrats qu’ils suivent des « tendances » statistiques.
En revanche, puisqu’il sera possible de trouver des affaires au plus proche de celle que l’on a à traiter, cela imposera aux magistrats de motiver davantage leurs décisions lorsque dans deux dossiers très similaires une décision radicalement différente doit être prononcée. Logiquement, la jurisprudence sera plus claire et mieux comprise, faisant disparaître ce côté « roulette russe » dont certains parlent.
Les avocats eux-mêmes n’ont pas accès à plus de décisions que les autres. Pour les magistrats, c’est peu ou prou la même chose
Warren Azoulay : hormis certaines affaires qui sont toujours en cours, dont les éléments du dossier sont couverts par le secret professionnel, il n’y a à ma connaissance aucun contentieux particulier entre les startups et les acteurs du droit, qu’ils soient magistrats ou avocat, concernant l’accès aux décisions de justice.
Pour tout vous dire, ce problème concerne tout le monde. Les avocats eux-mêmes n’ont pas accès à plus de décisions que les autres. Pour les magistrats, c’est peu ou prou la même chose. Ils ont accès à JURINET et peuvent interroger JURICA, c’est-à-dire consulter les décisions de Cour d’Appel, mais pas plus, d’autant qu’ils n’ont pas réellement de moteur de recherche performant pour fouiller à l’intérieur. Eux-mêmes rencontrent plusieurs difficultés pour pouvoir accéder aux décisions de première instance par exemple et ce, car le problème est double. D’abord, tout n’est pas numérisé, stocké et structuré comme ce serait le cas avec les décisions de la Cour de cassation, et dans une moindre mesure celles de cours d’appel. Ensuite, car le problème est aussi celui de la pseudonymisation sur lequel la Cour de cassation travaille et avance. Il y a un stock conséquent à traiter.
La Revue du Digital : l’accès aux décisions de justice est-il gratuit et informatisé ?
Warren Azoulay : le seul accès gratuit et informatisé aux décisions de justice qui existe à ce jour est Légifrance. Mais ce site gouvernemental ne donne accès qu’à quelques décisions, surtout des juridictions suprêmes, la Cour de cassation et le Conseil d’État. Les décisions d’appel sont résiduelles, et celles de premières instances quasiment absentes puisqu’il n’y a environ que dix mille décisions de disponibles, sur des millions qui devraient l’être.
Viennent ensuite les solutions privées, comme Juri’Predis. Mais un accès gratuit ne serait pas possible, car le développement d’un moteur de recherche qui fonctionne sur de l’intelligence artificielle nécessite, entre autres, une grande quantité de données. Or, celles-ci restent payantes à ce jour selon des tarifs fixés par un arrêté du 23 mars 2009. Ce budget-là s’envole très rapidement et représente plusieurs centaines de milliers d’euros si l’on veut avoir une base de données intéressante ne serait-ce que pour les Cours d’Appel. L’accès gratuit au droit n’est pas pour tout de suite.