OpenAI lance l'API de traitement Flex pour des tâches d'IA moins chères et plus lentes

Dans le but de rivaliser de manière plus agressive avec les sociétés d'IA rivales comme Google, OpenAI a introduit Flex Processing, une option API qui propose des prix plus bas pour l'utilisation de modèles d'IA, mais avec des temps de réponse plus lents et une « indisponibilité occasionnelle des ressources ».

Le traitement Flex est une version bêta des modèles d'inférence o3 et o4-mini récemment publiés par OpenAI et est conçu pour gérer des tâches peu prioritaires et « hors production » telles que l'évaluation de modèles, l'enrichissement des données et les charges de travail asynchrones, a déclaré OpenAI.

Cela réduit les coûts des API de moitié. Pour o3, les prix de traitement Flex sont de 5 $ par million de jetons d'entrée (~ 750 000 mots) et de 20 $ par million de jetons de sortie, par rapport aux prix standard de 10 $ par million de jetons d'entrée et de 40 $ par million de jetons de sortie. Pour o4-mini, Flex a baissé le prix de 1,10 $ par million de mots d'entrée et 4,40 $ par million de mots de sortie à 0,55 $ par million de mots d'entrée et 2,20 $ par million de mots de sortie.

L'introduction des processeurs Flex intervient alors que les prix de l'intelligence artificielle de pointe continuent d'augmenter et que les concurrents lancent des modèles moins chers, plus efficaces et plus économiques. Jeudi, Google a lancé Gemini 2.5 Flash. Les performances de ce modèle d'inférence sont équivalentes, voire meilleures, à celles de DeepSeek R1, et le coût des mots d'entrée est inférieur.

Dans un e-mail adressé aux clients annonçant les tarifs Flex, OpenAI a également noté que les développeurs aux niveaux 1 à 3 de ses niveaux d'utilisation doivent suivre un processus d'authentification nouvellement introduit pour accéder à o3. (Les niveaux sont déterminés par le montant dépensé pour les services OpenAI.) Le résumé d’inférence et la prise en charge de l’API de streaming d’O3 nécessitent également une authentification.

OpenAI a déjà déclaré que l'authentification visait à dissuader les mauvais acteurs de violer ses politiques d'utilisation.

apprendre encore plus:

https://platform.openai.com/docs/guides/flex-processing