Você provavelmente suspeitou que os modelos têm seu próprio hub, um local onde as pessoas carregam modelos treinados e outras pessoas podem baixá-los e usá-los a partir daí. Agora, o padrão do setor para modelos de código aberto é o HuggingFace Hub.

HuggingFace Hub é uma plataforma que permite que pesquisadores e desenvolvedores compartilhem e colaborem em modelos de processamento de linguagem natural, conjuntos de dados e outros recursos. Ele também fornece uma interface fácil de usar para localizar e baixar modelos pré-treinados para várias tarefas de PNL.

Este artigo sugere permitir que o ChatGPT acesse modelos existentes (existem milhares deles e resolvem centenas de problemas diferentes) por meio do HuggingGPT. Isso tornaria o treinamento do ChatGPT muito mais fácil: em vez de ensiná-lo a desenhar imagens ou traduzir texto em fala, poderíamos dar-lhe a oportunidade de usar ferramentas externas. Esta abordagem permite maior flexibilidade e eficiência na utilização de modelos de linguagem baseados em GPT, uma vez que podem aceder a uma vasta gama de modelos especializados sem receber qualquer formação prévia. Além disso, abre novas possibilidades para o desenvolvimento de aplicações de IA mais avançadas e complexas.

No total, obtemos algo assim:

  • O ChatGPT recebe um comando em linguagem humana.

  • O ChatGPT traduz o comando em um conjunto de “tarefas” a serem executadas.

  • Para cada tarefa, entre os milhares de modelos disponíveis, é selecionado o necessário (de acordo com a descrição fornecida).

  • O ChatGPT lê a descrição dos argumentos a serem fornecidos ao modelo e os prepara.

  • Após concluir a tarefa, o ChatGPT analisa o resultado e segue de acordo com o plano, repetindo as etapas 3 a 5.

Para um melhor entendimento, considere a captura de tela do artigo com a seguinte solicitação: “Crie uma imagem de uma garota lendo um livro, e sua pose seja a mesma do garoto na imagem. E então descreva a nova imagem em sua voz.” O modelo identifica até seis tarefas e lida com sucesso com sua execução sequencial.

O código está disponível em um repositório com o nome muito interessante “JARVIS”, provavelmente uma referência ao assistente de IA do filme “Homem de Ferro”.

Leia mais artigos relacionados:

  • Pesquisadores da Microsoft propõem combinar ChatGPT e outros 15 modelos de IA

  • Universidades são acusadas de dar permissão aos alunos para trapacear com IA

  • A revolução da IA ​​está apenas começando: o GPT-5 alcançará a inteligência artificial geral?

A postagem HuggingGPT: Dando aos modelos do ChatGPT a capacidade de usar ferramentas externas apareceu primeiro em Metaverse Post.