Anthropic представила Bloom, відкриту платформу, призначену для автоматизації оцінки поведінкових патернів ШІ. Цей інноваційний інструмент генерує нові сценарії оцінки при кожному запуску, вимірюючи ту ж саму базову поведінку, надаючи при цьому кількісні показники безпеки
Ключові особливості Bloom
Автоматизована оцінка*: Bloom автоматизує створення поведінкових оцінок для просунутих моделей ШІ, зменшуючи потребу в ручному тестуванні.
Налаштовуваний*: Дослідники можуть визначати конкретні поведінки і налаштовувати систему під свої потреби.
Відтворюваність*: Bloom підтримує відтворюваність за допомогою seed-файлу, який визначає параметри оцінки.
Масштабованість*: Платформа підтримує експерименти великого масштабу і інтегрується з Weights & Biases.
*Як працює Bloom:*
1. *Розуміння*: Аналізує описи поведінки та приклади транскриптів для встановлення критеріїв вимірювання.
2. *Ідея*: Генерує спеціально розроблені сценарії для стимулювання цільової поведінки.
3. *Розгортання*: Виконує сценарії паралельно, імітуючи дії користувача та реакції інструментів.
4. *Оцінка*: Оцінює взаємодії на наявність поведінки та додаткових атрибутів.
Bloom продемонстрував високу точність у розрізненні поведінкових патернів ШІ і тісно співвідноситься з оцінками людей. Він доступний на GitHub під ліцензією MIT, що робить його доступним для дослідників і розробників
#BloomFramework #AIEvaluation #OpenSourceAI #ArtificialIntelligence #MachineLearning $BNB $SOL $BTC