Izraelski startup i firma zajmująca się głębokim uczeniem się Deci ogłosiła współpracę z Qualcomm Technologies w celu opracowania zaawansowanych modeli generatywnej sztucznej inteligencji dla Qualcomm Cloud AI 100. Współpraca ma na celu zwiększenie dostępności sztucznej inteligencji dla szerszego zakresu zastosowań i demokratyzację mocy generatywnej sztucznej inteligencji dla programistów.
Dostosowując modele specjalnie do rozwiązania Qualcomm Cloud AI 100, firmy zamierzają odblokować opłacalne przetwarzanie AI w czasie rzeczywistym. Cloud AI 100 to rozwiązanie Qualcomm stworzone w celu optymalizacji wydajności na potrzeby generatywnego wnioskowania AI, w tym modeli dużych języków (LLM).
„Niektóre z głównych wyzwań w obecnym krajobrazie generatywnej AI dotyczą dostępności mocy obliczeniowej do przetwarzania tych ogromnych modeli i ogromnych kosztów ich uruchomienia” — powiedział Yonatan Geifman, CEO i współzałożyciel Deci w wywiadzie dla Metaverse Post. „Wykorzystując modele Deci, użytkownicy Qualcomm mogą w pełni wykorzystać swoją inwestycję w sprzęt dzięki modelom, które zapewniają maksymalne wykorzystanie sprzętu, zapewniając jednocześnie wysoką prędkość i dokładność”.
Deci będzie współpracować z Qualcomm Technologies przy wprowadzaniu na rynek dwóch modeli: DeciCoder-6B i DeciDiffusion 2.0.
Zgodnie z zapowiedzią DeciCoder-6B to 6-miliardowy model parametrów do generowania kodu, obsługujący osiem języków programowania, który przewyższa powszechnie stosowane modele, a jednocześnie zapewnia odpowiednią pamięć i wydajność obliczeniową.
Z drugiej strony DeciDiffusion 2.0 to model przekształcający tekst w obraz, składający się z 732 milionów parametrów. Wyznacza on nowe standardy, zapewniając wysokiej jakości obrazy przy zwiększonej szybkości i wydajności.
Co wyróżnia modele AI firmy Deci
Podczas korzystania z LLM w rzeczywistych aplikacjach, kluczowe jest efektywne organizowanie danych na serwerach, które tworzą prognozy. Głównym celem jest obsługa jak największej liczby żądań użytkowników w tym samym czasie. Znalezienie właściwej równowagi między ilością przetwarzanych danych na raz (rozmiar partii) a czasem potrzebnym na uzyskanie odpowiedzi (opóźnienie) zależy od dwóch kluczowych rzeczy: projektu modelu i możliwości sprzętu używanego do tworzenia prognoz.
„DeciCoder-6B ma mniejszą liczbę parametrów niż jego odpowiedniki, co skutkuje mniejszym wykorzystaniem pamięci i zwalnia dodatkowe 2 GB pamięci w porównaniu do modeli CodeGen 2.5 7B i 7 miliardów parametrów. Model ten wyróżnia się pamięcią i wydajnością obliczeniową, umożliwiając efektywne skalowanie przetwarzania wsadowego bez znacznego zużycia pamięci lub zauważalnego wzrostu opóźnienia” — powiedział dyrektor generalny Deci, Yonatan Geifman.
Wyjaśnił dalej: „DeciDiffusion 2.0 dostarcza wysokiej jakości obrazy przy 40% mniejszej liczbie iteracji i wykorzystuje mniejszy i szybszy komponent U-Net w porównaniu do Stable Diffusion 1.5. Może on wytwarzać wysokiej jakości obrazy przy mniejszej liczbie kroków czasowych dyfuzji podczas procesu wnioskowania”.
Model ten skutecznie redukuje liczbę kroków potrzebnych do wygenerowania obrazu wysokiej jakości z 16 do zaledwie 10.
Technologia wyszukiwania Neural Architecture Search Technology – AutoNAC – firmy Deci odegrała kluczową rolę w wydajności i skalowalności modeli. Automatyzuje proces wyszukiwania w sposób wydajny obliczeniowo, odróżniając go od tradycyjnych metod. Technologia ta umożliwiła firmie Deci wydanie serii najnowocześniejszych modeli w krótkim czasie, przy niższych wydatkach na obliczenia do szkolenia w porównaniu z innymi dużymi twórcami modeli językowych.
DeciCoder-6B: dostosowana precyzja dla doskonałości przemysłowej
Możliwość obsługi ośmiu języków programowania przez DeciCoder-6B sprawia, że jest to model do szerokiej gamy zastosowań. Geifman podzielił się kilkoma różnymi sposobami wykorzystania tego modelu.
„W dziedzinie rozwoju oprogramowania może pomóc w generowaniu i uzupełnianiu kodu, znacznie skracając czas rozwoju i zwiększając produktywność. Ponadto DeciCoder-6B może być używany do nauczania programowania, obsługując różne języki i poziomy trudności. Uczniowie mogą go używać do sprawdzania swojej pracy i jako podręcznika rozwiązań” — powiedział Geifman z Deci w wywiadzie dla Metaverse Post.
„Ponadto w dziedzinie cyberbezpieczeństwa model ten można dostosować do wspomagania pisania i analizowania skryptów w celu skanowania pod kątem luk w zabezpieczeniach, z możliwością automatyzacji kontroli bezpieczeństwa w różnych środowiskach programistycznych” – dodał.
Współpraca między Deci i Qualcomm Technologies oznacza znaczący krok w kierunku demokratyzacji mocy Generative AI. Dzięki zoptymalizowanym modelom, wydajnej technologii i zaangażowaniu w otwartość partnerstwo ma na celu zapewnienie programistom i branżom na całym świecie dostępnych i opłacalnych rozwiązań AI.
Artykuł Deci i Qualcomm łączą siły, aby upowszechnić generatywną sztuczną inteligencję we wszystkich branżach ukazał się po raz pierwszy w serwisie Metaverse Post.
