OpenAI publie une boîte à outils open source sur la sécurité des jeunes pour aider les développeurs à créer des applications d'IA plus sûres

OpenAI a annoncé mardi le lancement d'une boîte à outils d'incitation à la politique de sécurité destinée aux développeurs, destinée aux jeunes, visant à aider les applications tierces à intégrer des règles de sécurité pour protéger les mineurs dès le début de leur conception. La boîte à outils est disponible sous la forme d'un ensemble d'invites « Politique de sécurité des jeunes » directement appelables et peut être utilisée avec le modèle de sécurité pondéré open source gpt-oss-safeguard d'OpenAI.

OpenAI a déclaré que les développeurs n'ont pas besoin de repartir de zéro sur la façon de concevoir des mécanismes de sécurité pour les mineurs et peuvent directement utiliser cet ensemble de mots d'invite pour « renforcer » les applications d'IA existantes ou nouvellement développées. Ces politiques se concentrent sur des domaines sensibles tels que la violence graphique et le contenu pornographique, l'image corporelle et les comportements préjudiciables, les activités et défis à risque, les jeux de rôle romantiques ou violents et les biens et services soumis à une limite d'âge. La société souligne que ces politiques de sécurité sont fournies sous forme de mots d'invite, de sorte qu'elles peuvent être facilement adaptées à d'autres modèles que gpt-oss-safeguard, mais que l'effet devrait être meilleur lorsqu'elles sont utilisées au sein du propre écosystème d'OpenAI.

Pour élaborer cette politique, OpenAI travaille avec des tiers dans le domaine de la sécurité des jeunes et des contenus, notamment Common Sense Media, organisme de surveillance de la sécurité de l'IA, et Everyone.ai. Robbie Torney, responsable de l'IA et de l'évaluation numérique chez Common Sense Media, a déclaré dans un communiqué que ces politiques rapides basées sur des mots aident à établir un résultat de sécurité significatif pour l'ensemble de l'écosystème, et que la méthode de publication open source permet également à toutes les parties de s'ajuster et de s'améliorer en permanence au fil du temps.

OpenAI souligne dans un blog complémentaire que même les équipes expérimentées ont souvent du mal à traduire des objectifs de sécurité abstraits en règles concrètes et applicables. L'entreprise estime que cet écart peut entraîner des failles dans les mesures de protection, des normes de mise en œuvre incohérentes et même un blocage excessif. Des politiques claires et bien définies constituent donc une base essentielle pour la construction d'un système de sécurité efficace.

OpenAI reconnaît également que cet ensemble de politiques ne peut pas résoudre fondamentalement tous les défis complexes liés à la sécurité de l’IA. Mais la société a souligné que le nouvel outil constitue une nouvelle extension de ses mesures de sécurité existantes, notamment le contrôle parental au niveau du produit, la prédiction de l'âge et d'autres fonctions. En 2025, OpenAI a mis à jour la spécification de comportement (Model Spec) de son grand modèle de langage pour clarifier la façon dont le modèle doit réagir et limiter face aux utilisateurs de moins de 18 ans.

Pourtant, OpenAI est confronté à des questions sur son propre bilan de sécurité. La société fait actuellement face à plusieurs poursuites intentées par des membres de la famille d'utilisateurs qui se sont suicidés après une utilisation extrême de ChatGPT. Le procès allègue que certaines des relations dangereuses formées après que les utilisateurs ont contourné la sécurité du chatbot, et qu'aucun modèle de défense actuel n'est véritablement « impénétrable ». Dans ce contexte, l’industrie estime généralement que même si cette politique open source sur la sécurité des jeunes ne constitue pas la solution ultime, elle offre un chemin de conformité relativement facile à utiliser pour les développeurs indépendants et les petites équipes, et est considérée comme une nouvelle étape dans la promotion des pratiques de sécurité de l’IA pour les mineurs.

apprendre encore plus:

https://github.com/openai/teen-safety-policy-pack