Firma Microsoft ogłosiła udostępnienie oprogramowania Deep Speed Chat o otwartym kodzie źródłowym, aby pomóc użytkownikom w szkoleniu dużych modeli językowych, takich jak ChatGPT, dzięki czemu każdy może mieć swój własny ChatGPT.
Poinformowano, że Deep Speed Chat został opracowany w oparciu o bibliotekę optymalizacji głębokiego uczenia się Microsoft Deep Speed. Posiada funkcje takie jak szkolenie i ulepszone rozumowanie. Wykorzystuje również technologię RLHF (uczenie się ze wzmocnieniem z mechanizmem sztucznego sprzężenia zwrotnego) w celu zwiększenia treningu prędkość do 15 razy większą niż w przypadku istniejącego systemu. Więcej niż razy, koszty są znacznie obniżone. Na przykład model podobny do ChatGPT z 13 miliardami parametrów można wytrenować w zaledwie 1,25 godziny. (Codzienna planeta)
