Il y a quelques semaines, OpenAI a publié son dernier modèle de langage à grande échelle pour les services d'intelligence artificielle générative, GPT-4Turbo, lors de son premier événement pour les développeurs. Par la suite, Microsoft a annoncé qu'il ajouterait le modèle GPT-4Turbo à son service Azure OpenAI. Aujourd'hui, Microsoft a annoncé des améliorations de son service Azure OpenAI, avec le modèle GPT-4 Turbo avec Vision désormais disponible pour les clients en avant-première publique.

Microsoft a déclaré dans un article de blog :

Ce modèle d'IA multimodal avancé conserve toutes les fonctionnalités puissantes de GPT-4Turbo tout en introduisant la possibilité de traiter et d'analyser l'entrée d'image. Cela ouvre la possibilité d'exploiter GPT-4 pour un plus large éventail de tâches, notamment l'amélioration de l'accessibilité, l'interprétation et l'analyse visuelles des données et la réponse visuelle aux questions (VQA).

De plus, Microsoft a ajouté davantage de fonctionnalités pour les clients Azure OpenAI via la version préliminaire de GPT-4 Turbo with Vision. L'un d'eux est la reconnaissance optique de caractères (OCR), qui examine une image et extrait tout texte de l'image afin qu'il puisse être intégré aux invites de l'utilisateur.

Une autre fonctionnalité de GPT-4 TurbowithVision est la mise à la terre des objets, qui permet à l'IA d'inspecter une image et d'afficher les objets clés dans l'image en fonction des invites textuelles de l'utilisateur. De même, l’IA peut également analyser des images spécifiques d’une vidéo.

Microsoft a ajouté :

En combinant GPT-4 Turbo avec Vision, Azure AI Search et Azure AI Vision, il est désormais possible d'ajouter des images et des données textuelles pour développer des solutions qui se connectent aux données utilisateur à l'aide de la recherche vectorielle pour améliorer l'expérience du chatbot.

Le prix du service est de 0,01 $ pour 1 000 mots d'entrée et de 0,03 $ pour 1 000 mots de sortie, le prix des fonctionnalités améliorées étant variable.

Actuellement, GPT-4Turbo avec Vision est disponible dans les régions Australie Est, Suède Centre, Suisse Nord et Ouest des États-Unis d'AzureOpenAI. Les clients accédant à l'aperçu public de GPT-4Turbo avec des capacités de vision seront automatiquement mis à jour vers une « version stable et prête pour la production dans les semaines à venir ».