Les voix des saigneurs sont-elles impénétrables ?

La comparaison de voix, ou plutôt de parole, est une discipline qui vise à confronter la voix d’un locuteur inconnu à celle d’un locuteur dont l’identité est connue, en vue d’établir ou non un rapprochement. Le problème sous-jacent est celui de l'inférence de l'identité à partir de la voix. Malgré un pouvoir discriminant à priori moindre, la voix constitue, au même titre que les empreintes digitales et l’ADN, une modalité dite "biométrique" qui trouve toute sa place et sa pertinence dans le domaine de la criminalistique.

La voix comme signe distinctif

La parole constitue indéniablement un des principaux vecteurs de communication. En tant que tel, elle est utilisée au travers de nombreux outils qui ont vocation à en faciliter la transmission et dont l’utilisation est devenue presque indispensable à des groupes d’individus (téléphone, réseaux sociaux, etc.). En outre, chacun a pu faire l’expérience du phénomène de « reconnaissance » d'une personne familière par sa voix. Bien que cette faculté repose en partie sur des aspects contextuels de la communication, elle révèle néanmoins l’existence de traits distinctifs, propres au locuteur, dont les indices se trouvent à différents niveaux et dont nous ne donnons ci-après qu’un aperçu fragmentaire: l’accent, les habitudes langagières, l’intonation de la voix, le vocabulaire employé, la respiration associée à la production de la parole, le débit de parole, etc.

   

La problématique de l'expert

Toute la difficulté qui entoure la prise en compte de la parole à des fins de rapprochement d’individus peut être résumée par le terme de « variabilité ». En effet, la parole, avant d’apparaître sur un support qui servira à son exploitation, subit de nombreuses modifications, à différents niveaux. La nature même de la parole - une onde représentant les variations de la pression acoustique – explique l’effet indésirable que peut exercer l’environnement sur le signal qui sera enregistré et exploité in fine. Par ailleurs, la diversité des supports de transmission, au-delà de conforter le besoin criminalistique de la discipline, est à l’origine d’une diversité des traitements numériques qui sont appliqués au signal de parole : codage, compression, transmission, etc. L’ensemble de ces facteurs de variabilité - auquel s’ajoute une intra-variabilité de la voix liée au contexte d’énonciation et à l’état de santé du locuteur - concourt ipso facto à rendre l’exploitation de la parole à des fins de comparaison, sinon insurmontable, du moins complexe.

Au regard de cette complexité, il est nécessaire, si l’on souhaite procéder à un travail rigoureux de comparaison, de recourir à des méthodes s’appuyant d’une part sur l’utilisation de modèles statistiques relatifs aux descripteurs de la voix et, d’autre part, sur un cadre adapté en vue de l’interprétation des résultats, c’est à dire tenant compte des incertitudes résultant d’une inférence.

Dans le domaine judiciaire, les cas d’usage sont nombreux et montrent à quel point l’appariement d’une identité à des paroles prononcées peut avoir une importance capitale afin d’établir les responsabilités pénales.

A titre d’exemple, il n'est pas toujours possible d'associer aveuglément un individu à un numéro de téléphone, notamment lorsqu’il existe une pluralité de lignes téléphoniques utilisées ;  cette situation peut être une source de difficultés lorsqu’il s’agit de remonter et démanteler des réseaux.

   

Quelles solutions pour l'expert ?

Les approches classiques de la comparaison de voix abordent l'analyse sous l'angle de la phonétique qui vise à décrire et mesurer, à partir de la réalisation des sons, des indices acoustiques parmi les plus discriminants [1] (défaut de prononciation, vocabulaire employés, harmoniques de la voix, fréquence de la respiration, rythme de la parole, ...). Travaillant au plus près de la matière vocale, elles présentent l'avantage d'une certaine exhaustivité de l’étude.

Analyse d'indices acoustiques en phonétique

   

Par ailleurs, depuis une vingtaine d'année, l'approche dite « automatique » a connu des développements très importants [2], [3]. Le vocable « automatique » se réfère aux tâches d'extraction des descripteurs d'un locuteur, reflétant les caractéristiques physiques de son conduit vocal, et de leur modélisation statistique. Concurremment au développement de ces outils automatiques et à l’accroissement régulier de leur niveau de performance, un formalisme propre à l'évaluation de la force probante des éléments issus d'une telle comparaison a été développé et est désormais employé afin de rendre compte des résultats [4]. Ainsi, sous réserve de disposer de données adaptées au cas d’étude, les systèmes actuels fournissent une information consolidée par la connaissance du niveau de performance de celui-ci.

Exemple de représentation de la performance d'un système

     

Pour répondre aux différentes demandes qui lui sont adressées, l’IRCGN dispose d’outils automatiques (dont le logiciel Gendvox, développé en interne) dont les algorithmes sont conformes à l’état de l’art [3], [5], [6] et met en œuvre des méthodes évaluatives visant à rendre compte de leur fiabilité. Les échantillons qui lui sont soumis doivent faire l’objet d’une analyse préalable afin de déterminer s’ils sont compatibles ou non avec les logiciels disponibles.

Logo du logiciel GendVox, développé en interne à l'IRCGN

       

Enfin, les résultats obtenus sont explicités sous la forme d’un appui donné à l’une ou l’autre des hypothèses envisagées au cours de l’examen.

Modélisation des hypothèses

    

Pour conclure …

Bien que la voix, ou la parole, se présente naturellement à l’esprit comme un élément d’identification à part entière, l’analyse nécessaire en vue d’une comparaison est bien plus complexe qu’il n’y parait. Tout examen doit en effet tenir compte des facteurs de variabilité qui affectent un enregistrement de parole. Au-delà de l’intérêt suscité par les défis scientifiques propres à la discipline, la pratique de la comparaison de voix nécessite le développement de compétences spécifiques, la pratique d’un haut niveau de technicité et la mise en œuvre d’outils dotés des algorithmes issus des derniers travaux de recherche. Aussi, est-il permis de répondre que, dans certaines conditions, les « voix des  saigneurs » peuvent être exploitées et concourir utilement à la manifestation de la vérité.

     

Sources

[1] P. Rose, Forensic speaker identification. Taylor and Francis, 2002.

[2] F. Bimbot, J. Bonastre, C. Fredouille, G. Gravier, I. Magrin-Chagnolleau, S. Meignier, T. Merlin, J. Ortega-García, D. Petrovska-Delacrétaz, and D. Reynolds, “A tutorial on text-independent speaker verification,” EURASIP Journal on Applied Signal Processing, vol. 2004, pp. 430–451, 2004.

[3] J. P. Campbell, W. Shen, W. M. Campbell, R. Schwartz, J.-F. Bonastre, and D. Matrouf, “Forensic speaker recognition,” Signal Processing Magazine, IEEE, vol. 26, no. 2, pp. 95–103, 2009.

[4] C. Champod and D. Meuwly, “The inference of identity in forensic speaker recognition,” Speech Communication, vol. 31, no. 2, pp. 193–203, 2000.

[5] P. Kenny, G. Boulianne, P. Ouellet, and P. Dumouchel, “Speaker and Session Variability in GMM-Based Speaker Verification,” Audio, Speech, and Language Processing, IEEE Transactions on, vol. 15, no. 4, pp. 1448–1460, 2007.

[6] N. Dehak, P. Kenny, R. Dehak, P. Dumouchel, and P. Ouellet, “Front-End Factor Analysis for Speaker Verification,” Audio, Speech, and Language Processing, IEEE Transactions on, vol. 19, no. 4, pp. 788–798, 2011.

Actualités


Le saviez-vous ? Des enquêteurs du SCRCGN sont spécialisés en objet d'art..

Depuis une vingtaine d'années, le Département ''atteintes aux biens''...

Journée mondiale de la protection des données : le SCRC garant de l'accès aux données personnelles

Le saviez-vous ? Chaque 28 janvier, c’est la journée mondiale de la...

Général d'Armée 2S David Galtier : Rencontre dédicace

Mardi 26 janvier 2021, à partir de 10h30 au Mess, le Général...