6 clés pour connaître votre humeur à travers votre voix

Comment l’intelligence artificielle (IA) peut-elle connaître votre humeur en n’écoutant que votre voix ? Sur quoi est-il basé ? Des experts d’Eb2 et de l’Université Carlos III, une entreprise spécialisée dans les applications numériques pour aider à traiter la santé mentale, ont expliqué les mécanismes. Et ce que vous dites et la manière dont vous le dites n’ont pas la même importance. Ce sont les six techniques avec lesquelles vous révélez vos émotions à travers l’audio

Aller à la source : les ficelles du métier

Tout d’abord, l’air passe par les cordes vocales. On y observe si les périodes pendant lesquelles l’air sort, dans chaque phonème, sont égales, régulières ou non. Ou si la largeur de l’ouverture des ficelles est régulière. Chez les personnes souffrant de problèmes psychologiques, les harmoniques sont irrégulières et ne sont pas périodiques, indique Ascensión Gallardo, professeur à l’Université Carlos III de Madrid. Si la personne ne va pas bien, la voix peut paraître plus tremblante, plus rauque et plus dure. Tout est mesuré, avec l’IA. Aussi le temps pendant lequel les cordes vocales sont ouvertes et l’onde qui émet ce son.

La table d’harmonie

La bouche et le nez sont une caisse de résonance. Si la bouche s’ouvre davantage, cela indique une relaxation. Une bouche plus fermée peut indiquer plus de tension. La position de la langue est également un indicateur. Cela peut rendre la voix plus claire ou plus monotone, sourde. Le manque de vocalisation est également pris en compte.

La prosodie

C’est le rythme, l’intonation. Chaque personne a sa propre fréquence. Les variations sur cette fréquence peuvent donner des indices sur votre état psychologique. Et la voix peut paraître monotone, apathique si la fréquence est basse. Ou tendu s’il est très variable. L’intensité – le volume – est également déterminante.

Les personnes souffrant de dépression ont tendance à prononcer davantage de pronoms à la première personne, elles sont très concentrées sur elles-mêmes.

Ascension Gallardo

— Chercheur de l’Université Carlos III

Selon Gallardo, les personnes souffrant de dépression ont généralement une faible intensité. Les gens au rythme rapide parlent plus fort. Enfin, la rapidité avec laquelle la personne parle est également valorisée. Et les pauses : si elles sont très longues, elles peuvent indiquer une détérioration cognitive, si elles sont fréquentes et courtes, cela peut indiquer de la nervosité. S’ils sont longs et irréguliers, cela peut être le signe d’une tension cognitive.

Intelligence artificielle / SOPRA STERIA – Archives

Le contenu

Une fois le message audio retranscrit, les informations sont également très utiles – même au-delà du sens des phrases. Par exemple, si vous possédez ou non un vocabulaire étendu. L’utilisation d’une palette de mots limitée peut indiquer un déficit cognitif. Le nombre de pronoms à la première personne est également mesuré, car ils peuvent indiquer que la personne est anxieuse. « Les personnes souffrant de dépression ont tendance à prononcer davantage de pronoms à la première personne, elles sont très concentrées sur elles-mêmes », explique le chercheur.

Le plus important est la façon dont vous le dites, car la voix est un indicateur très difficile à tromper.

David Martin

— Data Scientist chez Eb2 Company

De plus, les « pauses remplies » et les phrases courtes et peu complexes peuvent également indiquer des difficultés cognitives. L’IA mesure aussi la cohérence sémantique, la capacité à tisser un discours de manière cohérente jusqu’au bout. Si ce paramètre est faible, l’IA peut indiquer des troubles cognitifs. La répétition des concepts peut entraîner, si elle est élevée, des difficultés à s’exprimer.

Comment les informations sont-elles traduites ?

Toutes ces informations sont traitées par des algorithmes personnalisés pour créer un « phénotype numérique », c’est-à-dire un profil pour chaque personne qui, au fur et à mesure qu’elle écoute des messages vocaux, indique les changements d’humeur significatifs. L’enseignant de Carlos III résume que, dans le cas de dépression, on détecte des phrases simples, des difficultés à trouver les mots, des pauses, des répétitions lexicales, une intensité de la voix plus faible, une intonation plus monotone, des troubles de la vocalisation et une voix chuchotée et cassée. Tout cela est traduit par l’IA en différents indicateurs mesurables. Pour l’anxiété, le ton est plus élevé, avec beaucoup de variations et une voix plus tendue et des troubles de l’articulation.

difficile de tromper

En mathématiques de l’IA, la façon dont vous parlez pèse plus que ce que vous dites. C’est ce qu’affirme David Martín, data scientist de l’entreprise Eb2 (qui a introduit son application dans des centres privés de santé mentale et collabore scientifiquement avec des centres publics), pour qui « le plus important est la façon dont on le dit, car la voix est un indicateur très difficile à tromper ». « On peut dire ‘je suis content’ mais le ton de la voix ne correspond pas, il y a une incohérence », ajoute-t-il. L’IA détecte, dans ces cas-là, des données incohérentes.

Abonnez-vous pour continuer la lecture