A Microsoft anunciou o código aberto do Deep Speed Chat para ajudar os usuários a treinar grandes modelos de linguagem como o ChatGPT, para que todos possam ter seu próprio ChatGPT.
É relatado que o Deep Speed Chat é desenvolvido com base na biblioteca de otimização de aprendizado profundo Deep Speed da Microsoft. Possui funções como treinamento e raciocínio aprimorado. Ele também usa a tecnologia RLHF (aprendizado por reforço com mecanismo de feedback artificial) para aumentar o treinamento. velocidade para 15 vezes mais rápida do que a do sistema existente Mais de vezes, o custo é significativamente reduzido. Por exemplo, um modelo semelhante ao ChatGPT com 13 bilhões de parâmetros pode ser treinado em apenas 1,25 horas. (Planeta diário)
