Des chercheurs de l'Université de Washington affirment qu'ils peuvent désormais réduire au silence différentes parties d'une pièce bruyante ou isoler une conversation dans un environnement encombré, grâce à un essaim de petits robots audio capables de localiser, d'identifier et de suivre de manière autonome plusieurs sources sonores en mouvement.

Nous, les humains, pouvons localiser les sources sonores les yeux fermés, grâce au réseau de deux microphones légèrement répartis et au blindage audio fourni par nos oreilles. Mais lorsque l'environnement audio devient complexe, les choses peuvent devenir très confuses - ce qui va à l'encontre de notre tendance idiosyncrasique à rechercher des espaces bruyants, bondés et à haute énergie (comme un café du dimanche matin) et à essayer ensuite d'y tenir une conversation.

Dans ces espaces audio plus encombrés, la seule façon d’isoler les sources sonores individuelles et de couper les autres est de déployer des réseaux de microphones plus grands, puis de traiter tous les flux audio ensemble pour créer une carte de l’espace qui triangule l’emplacement de chaque son et mesure les infimes différences temporelles dans le temps nécessaire au son pour voyager dans l’air et atteindre chaque microphone. Vous pouvez ensuite utiliser des algorithmes d'apprentissage profond insaisissables pour retraiter tous les flux audio, en créant des flux audio indépendants pour chaque source sonore et en supprimant tout le bruit des autres sources sonores.

En localisant et en suivant plusieurs sources sonores dans une pièce, les réseaux de microphones robotisés peuvent isoler et couper le son de différentes zones audio. Image / Université de Washington

L'idée en elle-même n'est pas nouvelle, mais des chercheurs de l'Université de Washington ont donné une nouvelle tournure au concept, en utilisant un essaim de sept petits robots microphones à roues, chacun de la taille d'une truffe au chocolat, qui se déploient de manière autonome à partir d'une station de recharge et créent un réseau auto-optimisant dans l'espace disponible.

Les robots utilisent des microphones et des haut-parleurs intégrés pour naviguer sur la surface de la table via un sonar, en évitant les obstacles et en s'étendant le plus largement possible pour maximiser la différence de temps entre les microphones. Malheureusement, cela signifie qu'ils doivent être déplacés un par un, mais une fois en place, ils fonctionnent de manière assez étonnante, comme vous pouvez le voir dans la vidéo ci-dessous.

Alors, quel est le but ultime ? L’équipe de recherche estime que des réseaux robotiques comme celui-ci pourraient être utilisés comme réseaux de microphones portables, déployés automatiquement et insonorisants pour les diffusions en direct dans les salles de conférence, etc., dispersant théoriquement mieux leur propre voix que les humains.

L'équipe affirme que cela ne sera pas d'une grande utilité dans les appels vidéo bidirectionnels, car même si cela fonctionne efficacement, il faut actuellement environ 1,82 seconde pour traiter chaque bloc de son de trois secondes. La latence signifie également qu'il ne sera pas en mesure de diffuser rapidement un son clair d'un interlocuteur vers des écouteurs dans un café bruyant - bien que les deux applications soient possibles à mesure que la puissance et la vitesse de calcul s'améliorent.

Bien entendu, il peut également devenir un outil de surveillance très pratique, éliminant l’effet de masquage du bruit de la foule et enregistrant les conversations privées. Il est intéressant de noter que l’équipe de recherche de l’Université de Washington affirme qu’elle pourrait produire exactement le contraire.

"Cela a le potentiel d'améliorer réellement la vie privée au-delà de ce que permettent les haut-parleurs intelligents actuels", a déclaré le doctorant Malek Itani, co-premier auteur de l'étude. "Je pourrais dire 'N'enregistrez rien autour de mon bureau', et notre système enregistrerait tout ce qui se passe autour de moi." pieds (0,9 mètres). Tout ce qui se trouve dans cette bulle ne sera pas enregistré. Ou, s'il y a deux groupes de personnes qui parlent à proximité, un groupe a une conversation privée pendant que l'autre groupe enregistre, la conversation d'un groupe peut être placée dans une zone muette et rester privée.

Après avoir été libéré de la station de recharge, le robot utilise un sonar pour se répartir sur une surface afin d'obtenir une isolation spatiale maximale.

En réalité, les réseaux de microphones distribués statiques peuvent commencer à être utilisés dans les conceptions de salles ou de maisons intelligentes, où ils peuvent facilement isoler les commandes de commande vocale dans différentes zones. Par exemple, vous pouvez contrôler la télévision simplement en écoutant les sons provenant du canapé, ou même choisir les commandes de boissons de la personne qui se tient au bar dans un lieu bruyant.

L'article a été publié dans la revue Nature Communications.