A Anthropic apresentou o Bloom, uma estrutura de código aberto projetada para automatizar a avaliação de padrões comportamentais de IA. Esta ferramenta inovadora gera novos cenários de avaliação a cada execução, medindo o mesmo comportamento subjacente enquanto fornece métricas de segurança quantificáveis
Características principais do Bloom
Avaliação Automatizada*: O Bloom automatiza a geração de avaliações comportamentais para modelos de IA avançados, reduzindo a necessidade de testes manuais.
Personalizável*: Pesquisadores podem definir comportamentos específicos e adaptar o sistema às suas necessidades.
Reproduzibilidade*: O Bloom mantém a reproduzibilidade por meio de um arquivo semente que define os parâmetros de avaliação.
Escalabilidade*: A estrutura suporta experimentação em larga escala e se integra com Weights & Biases.
*Como o Bloom Funciona:*
1. *Compreensão*: Analisa descrições de comportamento e transcrições de exemplo para estabelecer critérios de medição.
2. *Ideação*: Gera cenários personalizados para induzir o comportamento-alvo.
3. *Implementação*: Executa cenários em paralelo, simulando ações do usuário e respostas da ferramenta.
4. *Avaliação*: Avalia interações para presença de comportamento e atributos adicionais.
O Bloom demonstrou forte precisão em distinguir padrões comportamentais de IA e se alinha de perto com as avaliações humanas. Está disponível no GitHub sob a licença MIT, tornando-o acessível para pesquisadores e desenvolvedores
#BloomFramework #AIEvaluation #OpenSourceAI #ArtificialIntelligence #MachineLearning $BNB $SOL $BTC