Anthropic a introduit Bloom, un cadre open-source conçu pour automatiser l'évaluation des comportements d'IA. Cet outil innovant génère de nouveaux scénarios d'évaluation à chaque exécution, mesurant le même comportement sous-jacent tout en fournissant des métriques de sécurité quantifiables
Caractéristiques clés de Bloom
Évaluation automatisée*: Bloom automatise la génération d'évaluations comportementales pour des modèles d'IA avancés, réduisant le besoin de tests manuels.
Personnalisable*: Les chercheurs peuvent définir des comportements spécifiques et adapter le système à leurs besoins.
Reproductibilité*: Bloom maintient la reproductibilité grâce à un fichier de semence qui définit les paramètres d'évaluation.
Évolutivité*: Le cadre prend en charge l'expérimentation à grande échelle et s'intègre à Weights & Biases.
*Comment fonctionne Bloom:*
1. *Compréhension*: Analyse les descriptions de comportement et les transcriptions d'exemples pour établir des critères de mesure.
2. *Idéation*: Génère des scénarios sur mesure pour inciter le comportement cible.
3. *Déploiement*: Exécute des scénarios en parallèle, simulant les actions des utilisateurs et les réponses des outils.
4. *Jugement*: Évalue les interactions pour la présence de comportements et d'attributs supplémentaires.
Bloom a démontré une forte précision dans la distinction des modèles de comportement d'IA et s'aligne étroitement avec les évaluations humaines. Il est disponible sur GitHub sous la licence MIT, le rendant accessible aux chercheurs et aux développeurs
#BloomFramework #AIEvaluation #OpenSourceAI #ArtificialIntelligence #MachineLearning $BNB $SOL $BTC