L’intelligence artificielle a fait des progrès révolutionnaires dans la compréhension du comportement humain. Des chercheurs de la Texas A&M University ont récemment développé un nouveau système d'intelligence artificielle appelé « OmniPredict ». Le système a démontré des capacités de « lecture mentale » sans précédent : il peut non seulement voir les mouvements humains, mais également prédire les prochaines intentions humaines en temps réel en interprétant des indices visuels et environnementaux.

Ce résultat de recherche marque une avancée majeure dans la technologie de conduite autonome, passant de la « réaction passive » à « l'intuition active ». Les systèmes de conduite autonome traditionnels ne peuvent généralement identifier que l'emplacement actuel et la trajectoire de mouvement des piétons, tandis qu'OmniPredict introduit la technologie multimodale de modèle de langage étendu (MLLM), lui conférant des capacités de raisonnement semblables à celles d'un être humain. Le système peut capturer avec précision des signaux subtils tels que les changements de posture du piéton, les moments d'hésitation, l'orientation du corps et même la pression oculaire, déduire ainsi si le piéton se prépare à traverser la route, attend simplement sur le bord de la route ou a d'autres comportements soudains.
L'équipe de recherche a souligné que le principal avantage d'OmniPredict est qu'il ne se contente plus de « regarder » différents pixels, mais essaie de comprendre le « pourquoi » derrière ce comportement. En analysant des informations d'entrée mixtes complexes, le modèle catégorise avec précision le comportement humain en catégories clés telles que traverser la route, l'occlusion de la vue, les actions spécifiques et la direction du regard. Lors des tests, OmniPredict a démontré une précision de prédiction allant jusqu'à 67 %, soit 10 points de pourcentage de plus que les modèles les plus avancés actuellement sur le marché. Ce qui est encore plus impressionnant, c'est que même dans des scénarios complexes où les piétons sont partiellement masqués ou n'interagissent avec le véhicule qu'à travers leurs yeux, le système maintient toujours une stabilité de jugement extrêmement élevée.

Le chef du projet, le Dr Srikanth Saripalli, a déclaré qu'OmniPredict confère à la machine un nouveau type de « Street Smarts ». Si les voitures autonomes peuvent lire le langage corporel des passants et prédire leurs prochaines actions, tout comme les conducteurs humains, la sécurité routière fera un bond qualitatif. Outre le domaine de la conduite autonome, cette technologie capable d’interpréter le langage corporel et l’état psychologique devrait également jouer à l’avenir un rôle clé dans des scénarios à haut risque tels que les opérations militaires et les sauvetages d’urgence. En donnant de l'« intuition » aux machines, cela changera complètement le modèle de collaboration homme-machine.
Compilé à partir de /ScitechDaily