Une équipe de recherche du Laboratoire d'algorithmes et de systèmes d'apprentissage (LASA) de la Faculté d'ingénierie de l'EPFL, en Suisse, a récemment proposé une nouvelle méthode d'apprentissage « d'intelligence cinématique » qui permet à des robots de structures différentes de maîtriser les mêmes tâches grâce au même ensemble d'algorithmes d'apprentissage sans avoir besoin de réécrire ou de personnaliser le code de contrôle pour chaque type de robot. Cette réalisation devrait réduire considérablement le temps et les coûts de déploiement de nouvelles compétences robotiques dans des scénarios de recherche industrielle et scientifique.

Dans le monde humain, nous acquérons de nouvelles compétences en observant, en imitant et en ajustant le comportement des autres depuis environ 300 000 ans, ce qui est relativement facile à réaliser entre paires similaires. Mais lorsque l’objet est remplacé par d’autres animaux dotés de structures corporelles et de méthodes cognitives complètement différentes, la simple imitation devient difficile ; pour les plantes, les champignons, les protistes et même les bactéries, les humains ne peuvent même pas parler d'« apprentissage » des capacités motrices grâce à eux. Dans le domaine de la robotique, même si nous pouvons amener des robots à effectuer des actions selon des démonstrations humaines et même à accomplir des tâches à une vitesse beaucoup plus rapide que celle des humains, comment faire en sorte que des robots dotés de structures et de systèmes complètement différents partagent le même ensemble de compétences acquises reste un problème à long terme.
Dans le dernier article publié dans Science Robotics, Stithhpragya Gupta, Aude Billard et d'autres ont proposé qu'en utilisant l'intelligence cinématique dans le cadre de « l'apprentissage par démonstration (LfD) », des robots aux formes aussi différentes que R2D2 et un lave-vaisselle puissent apprendre de nouvelles actions qui peuvent être effectuées séparément à partir de la même démonstration humaine. Différent de la pratique précédente consistant à transférer uniquement des compétences entre robots du même modèle, ce système modélise mathématiquement les actions de démonstration et les transforme en stratégies universelles qui peuvent être adaptées aux différentes configurations d'articulations, amplitudes de mouvement et contraintes de stabilité des robots.
L’équipe de recherche a d’abord utilisé la capture de mouvement pour enregistrer une série d’opérations telles que placer, pousser et lancer des objets dans des scénarios d’assemblage industriel. Par la suite, ils ont établi un système de classification pour décrire les contraintes physiques du robot, notamment les limites d’équilibre, l’amplitude de mouvement des articulations, etc., et ont combiné ces informations avec des données de capture de mouvement pour former un modèle d’observation et d’apprentissage adaptatif pouvant être appelé par différentes plateformes. Dans l'expérience, trois robots commerciaux avec des formes et des mécanismes complètement différents ont été capables d'effectuer de manière stable un ensemble d'opérations telles que pousser des blocs de bois du tapis roulant jusqu'au poste de travail, puis les transporter jusqu'à la table et enfin les jeter dans des conteneurs désignés simplement en observant des démonstrations humaines.

L'une des technologies de base est ce que l'on appelle le « système dynamique globalement stable », qui permet au robot d'assurer la prévisibilité et la sécurité du processus de mouvement dans l'espace d'action appris. Les chercheurs ont déclaré que les étapes dont chaque robot est responsable lors de l'exécution d'une tâche peuvent être ajustées de manière interchangeable et que le système peut toujours fonctionner normalement ; différents robots comprendront et reconstruiront la même compétence d'une manière cohérente avec leurs propres conditions physiques, mais toujours dans une plage sûre et réalisable. Aude Billard, responsable du laboratoire LASA, a noté que ces travaux résolvent un défi de longue date en robotique : comment transférer les compétences acquises entre des robots dotés de structures mécaniques différentes tout en garantissant un comportement prévisible et sûr.
D'un point de vue applicatif, ce cadre d'intelligence cinématique signifie que lors de l'ajout ou du remplacement de robots dans des lignes de production industrielle ou des scénarios de service, il n'est pas nécessaire de réécrire le code d'action pour chaque nouvel élément matériel. L'injection de compétences peut être réalisée en fournissant un nombre limité ou même une démonstration humaine. Cela réduit non seulement le recours à des connaissances professionnelles en matière de programmation et de théorie du contrôle, mais abaisse également le seuil permettant aux petites et moyennes entreprises d'utiliser des équipements robotiques diversifiés. Gupta, le co-premier auteur de l'article, a souligné que dans l'expérience, la façon dont chaque robot répartissait les étapes de la tâche pouvait être ajustée à tout moment, et que l'ensemble du système pouvait toujours mener à bien le processus opérationnel, faisant preuve d'un haut degré de flexibilité.
La prochaine étape du projet consiste à permettre aux opérateurs humains de générer et d'exécuter les comportements correspondants via des descriptions en langage naturel sans même avoir à effectuer eux-mêmes des actions de démonstration. Durgesh Haribhau Salunkhe, un autre co-premier auteur, a déclaré que l'équipe espère éliminer complètement l'exigence d'une formation technique : les utilisateurs n'ont qu'à apporter des idées et des comportements souhaités, et le robot fera le reste. Si les recherches pertinentes continuent de progresser, cette méthode d'apprentissage de « partage intermodal de compétences » devrait devenir la capacité de base des futurs systèmes robotiques, accélérant ainsi le déploiement de robots dans des scénarios plus réels.