Elémentaire mon cher... Bayes !

Le raisonnement sur les indices est-il mathématique ? Peut-on donner une valeur chiffrée à un indice, même partiel ?

La réponse à ces questions est affirmative, et même plus précise : il s’agit d’un raisonnement et d’une évaluation probabilistes. Ce bref article expose la méthodologie s’appuyant sur le théorème de BAYES, dont la mise en application permet une interprétation rigoureuse des indices en respectant le principe fondamental du débat contradictoire.

L'approche bayésienne consiste à évaluer la force probante des résultats  observés, à travers au moins deux hypothèses de travail alternatives explicites : celle à charge, et celle de la défense.

L’objectif consiste à assigner la probabilité d'observer les résultats analytiques obtenus sur les éléments matériels recueillis, à travers respectivement le cas de figure allégué par chacune des parties au procès. Ceci donne alors deux probabilités, lorsque les données sont quantifiables :

     - la probabilité d’observer ces résultats, lorsque l’hypothèse à charge est supposée vraie, notée Pr(E|Hp) ;

     - la probabilité d’observer ces résultats lorsque l’hypothèse à décharge, est supposée vraie, notée Pr(E|Hd).

  

La seconde étape consiste à évaluer le rapport relatif de l'une par rapport à l'autre, à travers un simple quotient nommé le rapport de vraisemblance (LR pour Likelihood Ratio), puis enfin de l’exprimer à travers une échelle verbale susceptible de s’appliquer à tout domaine forensique.

Ainsi, par exemple, si Pr(E|Hp) vaut 0.7 (soit 70%) et Pr(E|Hd) vaut 0.1 (10%), alors le LR vaut Pr(E|Hp) / Pr(E|Hd) = 0.7/0.1 = 7 ; cela signifie que les résultats observés soutiennent 7 fois plus la proposition Hp que la proposition Hd. Une échelle verbale graduée existe pour donner un qualificatif adapté à chaque valeur de LR. 

Avant d’aller plus loin, il est très important de souligner ici que le terme approche bayésienne illustre bien qu’il ne s’agit pas de se restreindre à une simple application des probabilités : la méthodologie sous-jacente vise au-delà, à éviter des erreurs judiciaires.

Au premier plan, le principe du contradictoire se trouve bafoué par le simple fait de ne pas évaluer explicitement la probabilité d’observer les résultats sous la proposition à décharge. Ceci constitue non seulement un traitement inéquitable dans le processus de construction de la preuve (Article 427 du Code de Procédure Pénale) mais également une erreur de logique - et donc une erreur scientifique – très importante

Pour illustrer la démarche à travers une situation concrète, prenons une trace biologique prélevée sur une scène de crime, supposée pertinente et que cette trace permet de définir un profil génétique partiel. Lorsqu'un suspect est interpellé, comparé et non discriminé de la trace, l'approche bayésienne consistera à évaluer les deux probabilités suivantes :

     -la probabilité d' observer ce profil génétique partiel, si le suspect est la source de la trace (Hp supposée vraie) ;

     -la probabilité d'observer ce profil génétique partiel, dans le cas où une personne inconnue, autre que le suspect , est la source de la trace (Hd supposée vraie).

  

Comment évaluer la force probante d'une trace partielle ?

Dans l'exemple du profil génétique partiel, prenons le cas du profil d’un suspect qui correspondrait avec celui prélevé sur la scène de crime, sur un marqueur avec deux allèles, et sur un marqueur avec un allèle, renseignés de la manière suivante :

  

ALLELE 1

ALLELE 2

Fréquence ALLELE 1

Fréquence ALLELE 2

D3

15

/

0.2665

/

VWA

16

17

0.211

0.192

 

En approche classique, la conclusion serait que le profil est insuffisant pour permettre l’identification d’un individu, puisque le seuil demandé pour l’enregistrement d’une trace dans la base du FNAEG est de 6 marqueurs renseignés, en vue d’une comparaison avec un individu qui serait à son tour prélevé car suspecté au cours de l’enquête.

Une lecture restrictive mais courante de ces fréquences alléliques conduit à ne retenir, qu’en ADN (les probabilités de coïncidence fortuite étant souvent si minces) qu’implicitement elles correspondent à une identification, et que formulées de telle manière en conclusion de rapport, il s’agit d’un euphémisme d’expert pour désigner l’individu. Cette lecture est fausse et constitue ce qui a été nommé le saut de croyance, et de surcroit elle empêche de lire la réelle fonction de ces outils et de ces probabilités qui demeurent de quantifier un degré de rapprochement.

La probabilité d’observer les résultats sous Hd est à évaluer : en l’occurrence, ici, elle se calcule à l’aide des données de fréquence dans la population de référence et vaut, dans le cas d’un individu pris aléatoirement dans la population, le résultat de la multiplication des valeurs des trois histogrammes rouge, correspondant à la fréquence de chacun des allèles dans sa population de référence :

 

 

Pr (E | Hd)

= Pr(« 15 » sur allèle 1, locus D3) * Pr(« 16 » sur allèle 1, locus VWA) * Pr(« 17 » sur allèle 2, locus VWA)

= 0,2665*0,211*0,192

= 0.108

 

Cela signifie que la probabilité d’observer un profil génétique avec ces trois données, dans le cas où la source serait une personne inconnue prise aléatoirement dans la population, est de 0.108 (soit 10,8%).

 

Le rapport de vraisemblance vaut alors le quotient des deux probabilités :

LR = Pr(E| Hp) / Pr(E| Hd) = 1 / 0,108 ≈ 10

Ce chiffre signifie qu'il y a 10 fois plus de chances d'observer le profil génétique collecté sur la scène de crime si le suspect est la source de la trace, que si une personne inconnue est la source de la trace.

 

Peut-on évaluer la force probante d'une trace latente ?

Dans la même affaire, une trace de pneumatique est relevée et une comparaison est effectuée auprès du véhicule du suspect, il est observé l’identité de caractéristiques groupales, la sculpture des pneus issue de la fabrication industrielle. Par contre, le pneumatique du véhicule du suspect possède une caractéristique dite acquise (i.e. particulière, telle une coupure) non retrouvée pas sur la trace.

Un biais consisterait à penser que cette absence de caractéristique acquise montre que le pneu du véhicule du suspect ne pourrait pas être la source de la trace, car sinon on observerait la trace de la caractéristique acquise. En approche classique, la conclusion pourrait être que la trace peut avoir pour source le véhicule du suspect ou tout autre véhicule équipé du même système de pneumatique.

 

Or, cette absence de caractéristique acquise sur la trace peut très bien s’expliquer, et même être évaluée. Un moulage mesure environ 30 – 40 centimètres, alors que la circonférence moyenne d’un pneu est de 2 mètres.

Après une modélisation mathématique des données sur un nombre significatif de cas, la probabilité de ne pas observer cette caractéristique acquise, quand bien même elle figure bien sur la source, est évaluée à 0.79 (79 %).

Ainsi, la probabilité d’observer ces résultats, la similitude de caractéristiques groupales et l’absence de la caractéristique particulière, sous la proposition à charge, est de 0,79.

Sous la proposition a décharge, la source de la trace serait un véhicule inconnu, mais équipé du même système de pneumatique que le véhicule du suspect. La probabilité d’observer la similitude de caractéristiques groupales et l’absence de la caractéristique particulière, est alors de 1.

Le rapport de vraisemblance vaut alors le quotient des deux probabilités :

LR = Pr(E| Hp) / Pr(E| Hd) = 0,79 / 1 =0,79

Chacun de ces résultats peut être mis sous forme de graphe avec les probabilités associées : ces graphes se nomment des réseaux bayésiens, et nous disposons alors ici de deux réseaux bayésiens élémentaires, un pour chaque trace (adn et pneumatique). Un réseau bayésien élémentaire est constitué d’un nœud de causes, d’un nœud d’observations, et d’une flèche indiquant le sens de la cause vers les effets. En criminalistique, les causes sont les hypothèses d’enquête et les observations sont les résultats des analyses.

 

Peut-on évaluer un faisceau d'indices ?

Ces deux résultats, bien que deux domaines distincts, sont évalués sous un même jeu d’hypothèses et semblent respectivement ne pas soutenir la même proposition. Il est alors possible, de coordonner des résultats sur divers indices. Les résultats se trouvent sous un même réseau bayésien, dans lequel toutes les probabilités conditionnelles utiles sont renseignées.

Sous la proposition Hp, on retrouve à la fois que la source de la trace biologique provient du suspect, et que la source de la trace pneumatique provient de son véhicule.

Sous la proposition Hd, on retrouve conjointement que la source de la trace biologique est une personne inconnue, et que la source de la trace pneumatique est un véhicule inconnu, équipé du même système de pneumatique que le véhicule du suspect.

Le graphe combiné donne les résultats suivants :

Ce réseau bayésien permet d’évaluer un rapport de vraisemblance global de (0,88/0,12) ≈ 7.3, ce qui signifie que les résultats observés conjointement en matière adn et pneumatique soutiennent sept fois plus la proposition à charge Hp que la proposition Hd.

En approche classique, chacun des deux domaines pris de manière isolée et séquentielle aurait conclu à l’impossibilité d’identifier formellement, et le véhicule et l’individu ; ce qui est interprété abusivement comme l’impossibilité de dresser un quelconque lien. Avec cette approche et cet outil, ce lien est non seulement possible mais évalué.

Il s’agit d’un outil d’aide à la décision judiciaire plus fin pour apprécier la pertinence de tous les actes coercitifs envers un justiciable (pertinence d’entendre, poursuivre, surveiller, renvoyer devant une Cour ou un tribunal). Il permet une pédagogie graphique pour appréhender les cas complexes.

 

Pour conclure... Cette approche est-elle plus scientifique et plus éthique ?

L'approche bayésienne permet l'instauration de standards d'interprétation (le LR) et d'un cadre harmonisé de lecture des expertises criminalistiques. Ce cadre logique, robuste et équilibré peut s’appliquer sur l’ensemble des disciplines, et même des pays, et favoriser ainsi la circulation d’indices dans le cadre de la coopération internationale.

L'approche bayésienne permet également de délimiter nettement les frontières entre les rôles du juge/enquêteur et de l'expert. Ce dernier évalue la force probante d'observer les éléments matériels constatés mais ne donne aucune évaluation sur les hypothèses d'enquête en soi, celles-ci introduisant l'élément moral et d’autres indices, champs hors du ressort de l’expert.

Cette introduction des sciences du raisonnement dans le champ des sciences forensiques consolide ainsi les expertises criminalistiques, en y greffant les apports de la transversalité, et en y garantissant l’équité au procès par le respect strict du principe du contradictoire.

Actualités


Les experts du PJGN à Satory pour l’Edition spéciale du 14 juillet sur France2

VU SUR FRANCE 2 : " Reconstitution d'une scène de crime en direct"

Le PJGN impliqué lors de contrôles coordonnés d'envergure

Le 9 juin 2021 était organisée une vaste opération de contrôle...

Des travaux de recherche universitaires co-financés par la Gendarmerie : pourquoi pas le vôtre ?

La Gendarmerie a décidé de co-financer des travaux de recherche universitaires...

24/01/2018

Module 1 : Trace, indice, preuve

Les notions fondamentales de la criminalistique, la trace, l’indice et la preuve judiciaire, portent des concepts souvent galvaudés. Ce premier...
24/01/2018

Module 2 : les 3 principes fondamentaux de l'approche bayésienne

Une erreur judiciaire peut parfois provenir d’un biais de raisonnement sur un indice. L’approche bayésienne permet de contourner ce...
24/01/2018

Module 3 : la hiérarchie des propositions

Interpréter un indice nécessite de le réaliser à travers les hypothèses d’enquête qui s’opposent,...
24/01/2018

Module 4: le rôle du contexte dans l'évaluation de la force probante des indices

La connaissance du contexte d’une affaire, de la même manière que les hypothèses d’enquête, a un impact sur l’interprétation...
24/01/2018

Module 5 : quantifier la force probante

Evaluer la force probante d’un indice nécessite d’évaluer la probabilité d’observer les résultats lorsque...
24/01/2018

Module 6 : communiquer la force probante

L’évaluation de la force probante d’un indice pose la difficulté de communiquer avec des chiffres et ouvre également...
24/01/2018

Module 7 : évaluer la force probante d'un faisceau d'indices

Outil de calcul comme de représentation graphique, les réseaux bayésiens sont utilisés pour relier l’ensemble des hypothèses...
24/01/2018

Module 8 : cas complexe; LR sur résidus de tir

Outil de calcul comme de représentation graphique, les réseaux bayésiens sont utilisés pour relier l’ensemble des hypothèses...
24/01/2018

Module 9 : quelques réseaux bayésiens

Outil de calcul comme de représentation graphique, les réseaux bayésiens sont utilisés pour relier l’ensemble des hypothèses...