Dolphins et humains, plus près de parler et de comprendre

Dolphingemma, un modèle d’intelligence artificielle développé par Google, analyse et prédit les modèles vocaux complexes des dauphins, qui ouvre la porte à la communication interspécifique et marque avant et après dans l’étude de la cognition animale.

Pendant des décennies, la communication des dauphins a fasciné les scientifiques et les amateurs dans le monde naturel. Ses systèmes de clics complexes, les sifflets et les légumineuses ont été soumis à l’étude, mais jusqu’à présent, déchiffrer sa signification et sa structure ont été un défi monumental.

Pour faire avancer cette recherche, Google, en collaboration avec le Wild Dolphin Project (WDP) et le Georgia Institute of Technology, a développé Dolphingemmaun modèle d’intelligence artificielle conçu pour analyser et générer des séquences de sons similaires à ceux des dauphins, ouvrant la porte à une éventuelle communication d’intérêt.

Le projet Wild Dolphin étudie une communauté de tachés de l’Atlantique aux Bahamas depuis près de 40 ans, accumulant une archive sans précédent d’enregistrements audio et vidéo sous-marins, méticuleusement associés aux individus, aux histoires de vie et aux comportements observés.

Cette approche non invasive a permis à la corrélation des types de sons avec des contextes comportementaux spécifiques: des sifflets fermes pour la réunification entre la mère et l’élevage, les « crawks » des impulsions explosives pendant les combats et les clics pendant les par cour ou les poursuites de proie.

Sifflets de signature

L’une des découvertes les plus notables dans la communication des dauphins est l’utilisation des «sifflets de signature» ainsi appelés. Chaque dauphin développe un coup de sifflet unique, qui fonctionne comme un nom propre et permet aux membres du groupe d’identifier individuellement.

Ces sifflets facilitent non seulement l’emplacement et le contact entre la mère et l’élevage, mais renforcent également la cohésion sociale et l’interaction au sein du groupe. De plus, les dauphins peuvent imiter les sifflets des autres, une capacité qui, en dehors de l’homme, est extrêmement rare et suggère un niveau notable de sophistication communicative.

Le défi d’analyser et de comprendre la structure de ces sons a été énorme, en raison de la complexité et de la variabilité des vocalisations. C’est là que Dolphingemma entre. Ce modèle d’IA, basé sur la technologie Light Gemma Model of Google, utilise le jeton audio SoundStream pour représenter efficacement les sons des dauphins. Avec environ 400 millions de paramètres, Dolphingemma est suffisamment compact pour fonctionner directement sur des téléphones à pixels, permettant aux chercheurs d’analyser les vocalisations en temps réel pendant le travail sur le terrain, sans avoir besoin de matériel spécialisé ou de connexion au cloud.

Motifs et structures

DolphingEmma fonctionne comme un modèle « audio-in, audio-out »: reçoit des séquences de sons naturels, identifie les modèles et les structures, et prédit les sons les plus probables qui continueraient dans la séquence, de manière analogue à la façon dont les modèles de langue prédisent le mot suivant dans une phrase humaine. Cette capacité permet de découvrir des modèles récurrents et des significations cachées possibles dans la communication naturelle des dauphins, accélérant un processus qui nécessitait auparavant des années d’analyse manuelle.

Le potentiel de Dolphingemma ne se limite pas à l’interprétation passive. En combinaison avec le système de chat (Télémétrie d’audience auditive des cétacés), développés par Georgia Tech et WDP, les chercheurs peuvent générer des sifflets synthétiques associés à des objets spécifiques, tels que des algues ou des jouets. Si les dauphins apprennent à imiter ces sons pour demander des objets, un Vocabulaire partagé Basic, une première étape vers la communication bidirectionnelle entre les humains et les dauphins.

Le chat, installé sur des téléphones à pixels submersibles, reconnaît en temps réel les sifflets des dauphins et permet aux chercheurs de réagir immédiatement, facilitant une interaction plus fluide et naturelle.

Cognition animale

Bien qu’il y ait encore un long chemin à parcourir avant d’atteindre une véritable « conversation » entre les humains et les dauphins, la combinaison de décennies d’observation méticuleuse et les capacités prédictives de l’intelligence artificielle marque Avant et après dans l’étude de la cognition animale.

Dolphingemma et le chat promettent non seulement de déchiffrer les secrets de la communication des dauphins, mais également d’ouvrir la possibilité d’une relation plus profonde et plus respectueuse entre notre espèce et l’une des créatures les plus intelligentes de l’océan.