Microsoft anunció Deep Speed Chat de código abierto para ayudar a los usuarios a entrenar modelos de lenguaje grandes como ChatGPT

Microsoft anunció el código abierto de Deep Speed ​​​​Chat para ayudar a los usuarios a entrenar modelos de lenguaje grandes como ChatGPT, para que todos puedan tener su propio ChatGPT.
Se informa que Deep Speed ​​​​Chat está desarrollado en base a la biblioteca de optimización de aprendizaje profundo Deep Speed ​​​​de Microsoft. Tiene funciones como capacitación y razonamiento mejorado. También utiliza tecnología RLHF (aprendizaje por refuerzo con mecanismo de retroalimentación artificial) para aumentar la capacitación. velocidad a 15 veces más rápido que el del sistema existente Más que veces, el costo se reduce significativamente. Por ejemplo, un modelo similar a ChatGPT con 13 mil millones de parámetros se puede entrenar en solo 1,25 horas. (Daily Planet)