Chiński DeepSeek uruchomił nowe modele AI, DeepSeek-V3.2 i DeepSeek-V3.2-Speciale, które rywalizują lub dorównują wydajności Google'a Gemini 3 Pro i GPT-5 OpenAI w różnych testach. Te nowe modele z chińskiego startupu są otwartoźródłowe i wywołały znaczną dyskusję w społeczności AI.
DeepSeek-V3.2-Speciale wykazał zdolności rozumowania równe Google'owi Gemini 3 Pro. Model bazowy, DeepSeek-V3.2, osiągnął wyniki porównywalne z GPT-5 OpenAI. Co ważne, DeepSeek-V3.2-Speciale zdobył złoty medal na teście Międzynarodowej Olimpiady Matematycznej, osiągnięcie, które wcześniej było dostępne tylko dla wewnętrznych, niepublicznych modeli OpenAI i Google DeepMind.
Pomimo ograniczonego dostępu do zaawansowanych chipów półprzewodnikowych, DeepSeek osiągnął te postępy dzięki skoncentrowaniu się na inteligentniejszym rozwoju, a nie tylko na masowej mocy obliczeniowej. DeepSeek wykorzystuje architekturę Mieszanki Ekspertów (MoE), która pozwala na aktywację tylko niezbędnych części modelu do konkretnych zadań, co czyni go efektywnym obliczeniowo. To podejście pozwala DeepSeek osiągnąć możliwości AI na granicy technologii przy ułamku budżetu obliczeniowego w porównaniu z niektórymi z jego konkurentów.
Susan Zhang, główny inżynier badań w Google DeepMind, uznała pracę DeepSeek, szczególnie chwaląc ich szczegółowe raporty techniczne oraz wysiłki na rzecz stabilizacji modeli i zwiększenia zdolności agentów. Chociaż najnowsze modele DeepSeek wykazują imponującą wydajność, firma przyznaje, że zamknięte modele własnościowe rozwijają się szybciej i że wciąż stają przed wyzwaniami w zakresie efektywności tokenów i zakresu wiedzy o świecie w porównaniu do wiodących modeli własnościowych.
#CryptoNewss #DeepSeek #Aİ #DeepMind #CryptoMarket