Microsoft anunció el código abierto de Deep Speed Chat para ayudar a los usuarios a entrenar modelos de lenguaje grandes como ChatGPT, para que todos puedan tener su propio ChatGPT.
Se informa que Deep Speed Chat está desarrollado en base a la biblioteca de optimización de aprendizaje profundo Deep Speed de Microsoft. Tiene funciones como capacitación y razonamiento mejorado. También utiliza tecnología RLHF (aprendizaje por refuerzo con mecanismo de retroalimentación artificial) para aumentar la capacitación. velocidad a 15 veces más rápido que el del sistema existente Más que veces, el costo se reduce significativamente. Por ejemplo, un modelo similar a ChatGPT con 13 mil millones de parámetros se puede entrenar en solo 1,25 horas. (Daily Planet)
