Selon "Business Insider", Tesla insiste sur l'utilisation de la technologie de conduite autonomeSolution visuelle pure, il a désormais utilisé cet ensemble de stratégies matures dansFormation du robot humanoïde Optimus. Des initiés proches du dossier ont déclaré à Business Insider que Tesla avait informé ses employés fin juin que l'entreprise se concentrerait davantage sur l'avancement de la formation du robot humanoïde Optimus grâce à des solutions purement visuelles à l'avenir.

Musk change la stratégie de formation d'Optimus
Auparavant, Tesla utilisaitCombinaisons de capture de mouvement et casques de réalité virtuelle (VR)pour enregistrer les données des opérateurs humains et contrôler à distance les robots. Désormais, Tesla passera principalementEnregistrez des vidéos des employés effectuant des tâchespour entraîner le robot à apprendre à faire, par ex.Ramasser des objetsOu des actions comme plier un T-shirt.
Tesla a déclaré que l'abandon des combinaisons de capture de mouvement et des opérations à distance permettrait à l'équipe d'augmenter la collecte de données plus rapidement, ont déclaré des initiés.
Cet ajustement marqueUn changement majeur dans la stratégie robotique de Tesla, alignera les méthodes de formation d’Optimus sur la philosophie de longue date d’Elon Musk :L'IA peut maîtriser des tâches complexes grâce aux caméras. Pendant longtemps,Tesla utilise une approche similaire pour entraîner son système de conduite autonome.
Brisez les règles
Le fonctionnement à distance et la capture de mouvements sont des pratiques standard dans l'industrie lors de la formation des robots. Par exemple, des entreprises de robotique bien connuesDynamique de Bostonavoir utiliséopération à distancepour entraîner son robot Atlas. Pendant la formation, les employés enfilent des combinaisons de capture de mouvement pour effectuer diverses tâches. Ces données sont ensuite transmises au robot. Les combinaisons de capture de mouvement peuvent également être utilisées pour contrôler les robots à distance.
Il n'est pas clair si Tesla donnera à nouveau la priorité à l'utilisation de combinaisons de capture de mouvement et aux opérations à distance à l'avenir, ou si elle utilisera des données vidéo pour s'appuyer sur les informations précédemment collectées pour une formation ultérieure.
Robert Griffin, chercheur principal à l'Institut pour la cognition humaine et machine, a déclaré à Business Insider que de grandes quantités de données de téléopération permettent aux robots d'apprendre grâce à des interactions réelles avec leur environnement. Apprendre aux robots à traduire des données vidéo en actions réelles n’est pas une tâche facile, a-t-il déclaré.
"Si vous utilisez uniquement des données vidéo, vous n'avez pas cette expérience interactive directe", a-t-il déclaré.
En mai de cette année, Tesla a publié une vidéo montrant le robot Optimus accomplissant diverses tâches basées sur des séquences vidéo.

Optimus
Konstantinos Laskaris, directeur du développement matériel Optimus chez Tesla, semble avoir reconnu la nouvelle stratégie. En mai de cette année, il a posté sur LinkedIn : « Cela peut paraître incroyable, mais nos robots apprennent de nouvelles tâches directement à partir de vidéos humaines ! »
Musk a également déclaré en mai :Optimus pourra éventuellement apprendre à effectuer des tâches en regardant des vidéos YouTube.
Des initiés proches du dossier ont déclaré que Tesla avait brièvement arrêté de recruter pour l'équipe Optimus pendant la période de transformation technologique. Fin août, la page d'emploi de Tesla répertoriait encore plus de 50 postes liés à Optimus.
transformation technologique
Des personnes proches du dossier ont déclaré que jusqu'à fin juin, Tesla utilisait toujours Optimus à distance et entraînait le robot via une combinaison de capture de mouvement. Les employés devaient passer du temps à résoudre les problèmes liés aux combinaisons de capture de mouvement et à Optimus, ce qui limitait la quantité de données que l'équipe pouvait collecter.
Depuis le changement de formation, les employés se sont concentrés sur l'utilisation5 caméras maison faites maisonEnregistrez vos propres actions. Les caméras sont montées sur des casques et des sacs à dos lourds portés par les employés. La caméra filme dans toutes les directions pour fournir au modèle IA des données de positionnement environnemental précises.
Christian Hubicki, directeur du laboratoire de robotique du FAMU-FSU College of Engineering de l'université d'État de Floride, a déclaré que la prise de vue multi-angle pourrait aider Tesla à collecter des détails plus fins « tels que la position des articulations et des doigts » et à obtenir un positionnement spatial précis du robot. Il a noté que les vidéos pourraient également être utilisées pour améliorer les ensembles de données précédemment collectées lors d'opérations à distance.
Le personnel effectuant des tâches de formation reçoit des instructions spécifiques, notamment concernant les mouvements des mains, afin que les mouvements soient les plus proches possible de la forme humaine. Une personne a déclaré que certains travailleurs pouvaient passer des mois à effectuer la même action simple, encore et encore.
Jonathan Aitken, expert en robotique à l'Université de Sheffield, a déclaré à Business Insider que Tesla devra probablement trouver un moyen d'apprendre à Optimus à utiliser des mouvements pouvant être appliqués à diverses tâches.
"Dans une opération de cette taille, ils doivent construire une bibliothèque commune de mouvements, sinon cela prendrait un temps infini pour les entraîner tous un par un", a déclaré Aitken.
Il a ajouté que Tesla pourrait adopter une stratégie similaire à celle de l'intelligence physique, qui alimente les robots en quantités massives de données de démonstration afin qu'ils puissent acquérir des compétences transférables et les appliquer de manière flexible, plutôt que de simplement mémoriser mécaniquement comment effectuer une seule tâche.
Plus difficile que la conduite autonome
La nouvelle stratégie est conforme à l'approche de Tesla en matière de formation de son système de conduite autonome. Alors que d'autres entreprises de conduite autonome utilisent des capteurs lidar et radar pour former des logiciels, Tesla s'appuie principalement sur plusieurs caméras.
Tesla utilise les données collectées auprès de millions de propriétaires de Tesla, dont les véhicules sont équipés de huit à neuf caméras. Musk a dit :Tesla a pu lancer son système de conduite assistée en Chine parce que l'entreprise a utilisé des vidéos publiques des rues asiatiques pour entraîner son système d'IA.
Cependant, Musk a admis lors d'une conférence téléphonique en janvier que "les exigences de formation pour le robot humanoïde Optimus pourraient finir par être au moins 10 fois supérieures à celles requises pour la voiture".
"Il s'agit d'une approche très Tesla pour développer des robots", a déclaré Aitken. "Aucune autre entreprise n'essaie de faire cela à la même échelle. La quantité de données dont elles ont besoin sera comparable à la quantité de données utilisée pour entraîner la voiture."
Alan Fern, expert en IA et en robotique à l'Oregon State University, a déclaré que la formation d'Optimus sera plus ardue pour Tesla que le développement d'une voiture autonome.
"Conduire est une tâche unique", a déclaré Fein. Il a déclaré que l'apprentissage vidéo nécessite principalement que les robots comprennent ce qui se passe dans la vidéo et possèdent ensuite les compétences nécessaires pour accomplir la tâche. "Certaines compétences peuvent être acquises par l'observation, et d'autres nécessitent une pratique physique dans des simulateurs ou dans la réalité."
Au moment de mettre sous presse, Tesla n’a fait aucun commentaire à ce sujet.