Model językowy „LLaMA”, który został niedawno zaprezentowany przez zespół badawczy Facebooka zajmujący się sztuczną inteligencją, wykazał zachęcające wyniki w porównaniu z innymi modelami pod względem wydajności i skuteczności. Model, którego nazwa oznacza „agnostyczny model lekkiego i językowego”, ma na celu obniżenie kosztów obliczeniowych uczenia dużych modeli językowych, przy jednoczesnym uzyskiwaniu konkurencyjnych wyników.
Wraz z wypuszczeniem pod koniec 2022 r. rozwiązania ChatGPT firmy OpenAI, finansowanego przez firmę Microsoft, rozpoczął się pęd do przejęcia kontroli w sektorze technologii sztucznej inteligencji. Debiut skłonił cyfrowe giganty, w tym chińskie Baidu Inc (9888.HK) i Alphabet Inc (GOOGL.O), do wprowadzenia własnych modeli językowych AI.
Fakt, że LLaMA może pracować w wielu językach, co znacznie zwiększa jej zdolność dostosowywania się do różnych sytuacji i okoliczności, jest jedną z jego ważnych mocnych stron. Dodatkowo LLaMA posiada najnowocześniejszy algorytm szkoleniowy, który może efektywnie obsługiwać ogromne ilości danych. Za pomocą tej metody modele językowe można trenować szybciej i skuteczniej oraz wykorzystywać do różnych zadań związanych z przetwarzaniem języka naturalnego.
Wykorzystując różnorodne zbiory danych porównawczych, w tym dobrze znane wzorce GLUE i SuperGLUE, badacze przeprowadzili badania z wykorzystaniem modelu LLaMA i osiągnęli nowatorskie wyniki w przypadku szeregu zadań. Wyniki pokazały, że przy zachowaniu stosunkowo skromnego rozmiaru modelu i krótkich czasów wnioskowania, LLaMA jest niezwykle skuteczna w radzeniu sobie ze skomplikowanymi zadaniami językowymi.
LLaMA może przewyższyć konkurencję, która ocenia więcej parametrów, w tym ChatGPT OpenAI wspieranego przez Microsoft. Według doniesień wersja zawierająca 13 miliardów parametrów przekracza GPT-3, niedawnego poprzednika modelu, na którym zbudowano ChatGPT.

Ten nowy przełom stanowi kolejny krok w trwającym konflikcie między firmami takimi jak Alphabet Inc. i chińskim Baidu Inc. o dominację w dziedzinie technologii sztucznej inteligencji. Dzięki dużej wydajności i znacznej liczbie parametrów LLaMA może dać Meta przewagę w tym konflikcie. Ciekawie będzie obserwować, jak inne firmy reagują na to najnowsze osiągnięcie.