Modré srdíčko V z řady VivoX100 je „nejvhodnější“ velký jazykový model, jaký jsem kdy použil.

Zdroj dotisku článku: AIGC
Původní zdroj: Silicon Stand
Autor: Luo Yihang
Zdroj obrázku: Generated by Unbounded AI‌
Toto je první velký jazykový model, který jsem zažil nezávisle vyvinutý výrobcem chytrých telefonů – „Blue Heart Little V“ spuštěný společností vivo na základě velkého modelu Blue Heart. Jako "velký model Shennong" si připomenu, abych "snížil svá očekávání", než v poslední době otestuji jakoukoli modelovou službu, zejména u dema, jejichž videa jsou příliš cool. Ale z modelu velkého modrého srdce mám pocit: je v souladu s očekáváním. Není to cool, ale je to funkční.
Jako velký jazykový model, který výrobci chytrých telefonů spustili, si lidé většinou myslí, že nebude příliš velký, nebude mít nízké parametry, efekt emergence nemusí být příliš dobrý a budou se vyskytovat chyby v porozumění některým složitým textům a záměrům. Moje zkušenost z Blue Heart Model je ale opačná: vykazuje silnou uvažovací schopnost při tvorbě a shrnutí, která může dosáhnout více než 80 bodů, naopak její výkon v základním vyhledávání obrázků a běžném psaní je průměrný.
Musíte vědět, že model modrého srdce, který je aktuálně nainstalován na mobilních telefonech řady vivo X100, je model pro dvojí použití pro scénáře na straně zařízení a cloudy speciálně vytvořené pro mobilní telefony. Je mnohem méně „velký“ než velký model se stovkami miliardy parametrů. Ale když jsem mu dal článek o tom, zda fenomén vzniku velkých modelů skutečně existuje, velmi přesně v něm našel nejkritičtější a nejzásadnější argument: vznik schopností vzniku velkých modelů je metrikou zvolenou výzkumníky spíše než výsledkem rozšíření schopností modelu, takže se nejedná o skutečný „inteligence emergence“.
Tohle mě vlastně trochu vyvedlo z hlavy. Protože „čtení dokumentů“ je pro velké jazykové modely poněkud obtížný úkol, ne všechny modely jej umí dobře číst. Například schopnost ChatGPT číst složité a dlouhé soubory PDF v poslední době zaznamenala alarmující degradaci, zejména pokud jde o její schopnost sumarizovat. Ale Blue Heart Little V z Blue Heart Big Model dokáže najít nejkritičtější argument najednou. Za zmínku stojí, že během testu jsem konkrétně zkontroloval funkci „místní shrnutí“, která plně využívala vlastní výpočetní sílu stroje vivo X100 (MediaTek Dimensity 9300) a možnosti uvažování, abych to shrnul "velké modely musí být velké".
Pak jsem objevil zajímavější jev: když do Modelu modrého srdce nahrajete delší článek, stále dokáže extrahovat nejkritičtější a nejdůležitější myšlenky a zjištění, ale rozšířené vyprávění je často několik nedbalých vět, to je ono dobré číst, aniž bych žádal hluboké vysvětlení." Je v kontrastu s některými jinými velkými modelovými chatovacími roboty, pokud jde o schopnosti porozumění čtení: mnoho modelů je silných v rozebírání informací, ale nestačí je zdokonalovat a sumarizovat. Model velkého modrého srdce je shrnut a vylepšován extrémně přesně, ale nechce se rozebírat a pečlivě číst a není ochoten plýtvat žetony na problémy s vysvětlením. To by mělo úzce souviset s velikostí modelu.
Pokud jde o místní vyhledávání fotografií a vyhledávání obrázků v mobilním telefonu, rychlost odezvy modelu Blue Heart je hladká jako hedvábí Například všechny „fotky o Zakázaném městě“ uložené lokálně v mobilním telefonu najdete v jedné druhý. Z hlediska psaní cestovního průvodce a dalších aspektů je jeho výkon vcelku uspokojivý. Pokud jde o tvorbu obrazu, jeho obrazy Zakázané město, Beef Ramen a Spicy Hotpot jsou všechny blízké úrovni DALL-E ChatGPT, ale není tak bohaté na představivost jako ChatGPT a neumí kreslit zvlášť bláznivě a nápaditě. obrázky. Když jsem jej však požádal, aby nakreslil „AI, která hluboce přemýšlí o budoucnosti lidstva“, ve skutečnosti mi to poskytlo obrázek s takovým uměleckým pojetím.
Kromě toho je pozoruhodná schopnost modelu modrého srdce ovládat APP prostřednictvím přirozeného dialogu. Řeknu mu, že si chci objednat jídlo s sebou Mala Xiangguo, a řekne vám, že Meituan není nainstalovaný v tomto novém telefonu. Poté, co souhlasíte s jeho instalací, si automaticky stáhne aplikaci Meituan z obchodu s aplikacemi. Pak vám pomůžu otevřít stránku plnou "Spicy Hotpot". Samozřejmě si můžete myslet, že to umí i Siri od Applu, protože jako aplikace na úrovni asistenta ve spodní části systému je snadné na tomto telefonu vyvolat oprávnění. Rozdíl je však v tom, že Siri může přijímat pouze velmi jasné pokyny k otevření které aplikace Je bezmocné čelit obecnému požadavku přirozeného jazyka, ale Lanxin Xiao V je v modelu Lanxin Big požehnání, je to již druhý pilot se schopnostmi porozumění přirozenému jazyku.
Stručně řečeno, po úpravě několika klíčových funkcí budete mít jistější směr a úsudek, to znamená, že koncový velký model je zavedený a spolehlivý. Navíc, aby byl rozsáhlý model na straně klienta nebo dokonce celý rozsáhlý jazykový model implementován do tisíců domácností a všech živých bytostí, možná se budete muset stále spolehnout na výrobce mobilních telefonů, ať se vám to líbí nebo ne.
Velký model uzpůsobený pro mobilní telefony se vlastně do jisté míry blíží „malému jazykovému modelu“, který Microsoft v poslední době zdůrazňoval, jeho parametry většinou nemohou přesáhnout 10 miliard, jinak nemůže běžet paměť mobilu, což také znamená, že ano provádět pouze specifické aspekty nebo trénovat model na určitou výstupní úroveň a poté zastavit. Většině lidí to stačí. Mistral AI, pařížský startup, který se v poslední době stal populárním, je taková malá modelová společnost.
Soudě podle parametrů oznámených Velkým modelem modrého srdce se velký model založený na cloudu se 170 miliardami parametrů používá k destilaci a trénování modelů na nízké úrovni parametrů, což vede k modelu se 7 miliardami parametrů jak na straně cloudu, tak na straně mobilního telefonu Výpočet a zdůvodnění modelu s 1 miliardou parametrů jsou pouze na straně zařízení. To je to, co Qualcomm, MediaTek, Intel a AMD neustále zkouší a vrtají, aby se zbavili prokletí Nvidie. Pokud modely nejsou zapojeny do mobilních telefonů a PC, nemají šanci. Modely, které lze vložit do mobilních telefonů a PC, však často nejsou dostatečně velké a jedná se o malé modely.
Malé modely mají výhody malých modelů: zaměřují se pouze na to, aby dělaly dobře pár věcí, nevydávají zdlouhavé informace a kód, mají několik předností, ale v jiných ohledech jsou průměrné. Například psaní kódu Mistral AI je lepší než ChatGPT. Dalším příkladem je model Blue Heart, který je přesnější než jiné modely při zpřesňování a zpracování místních dokumentů a je efektivnější při správě dokumentů a rozvrhů na osobních mobilních telefonech. Jiné kreslení, psaní a vyhledávání jsou také k dispozici, ale nejsou výjimečné. Ale tak co?
Když Čína v současné době diskutuje o budoucnosti generativní umělé inteligence, dochází k podivnému jevu: ti, kteří ji drží vysoko a udeří do ní, se nedostanou k zemi a ti, kteří se rozhodnou žít, nemají o AI zájem. Většina lidí nikdy nepoužila ChatGPT Možná slyšeli o Wenxinyiyan, Tongyi Qianwen a ChatGLM a používali je příležitostně, ale nevidí pro ně žádné zásadní změny. Pokud jde o tyto hráče, kteří jsou posedlí velkými parametry modelu, měřítkem a výsledky hodnocení benchmarků, všechny jejich výsledky jsou umístěny na Hugging Face a GitHub. Téměř nikdy nepropagují běžným lidem a o obyčejné lidi se nezajímají. Vývojáři a uživatelé AI jsou vzájemně lhostejní a tato situace se v krátkodobém horizontu nemusí změnit.
Pokud ale výrobci smartphonů vyrábějí větší jazykové modely, může to být jinak. Hlavním důvodem je: uživatelé mají pocity. Když je velký model zabudován do spodní vrstvy operačního systému, může kdykoli vyvolávat, asistovat a vyvolávat funkce, stejně jako velký model modré srdce na Origin OS4, uživatelé jej budou nedobrovolně potřebovat, potřebovat jeho asistenci a testovat její potenciál dokonce potřebuje svou společnost. Nemusí to být univerzální velký model, může to být malý model, ale rozumí svým uživatelům, zná data v zařízení, rozumí uživatelským zvyklostem, chrání soukromí uživatelů a může pomoci naplánovat, otevřít nabídky s sebou, shrnout dokumenty. , atd. Stačí vybrat fotografie a dokončit základní psaní a bude to AI, která je pro většinu lidí „dostatečná“ a „důvěryhodná“.
Podpory popularizace velkých jazykových modelů jistě nebude dosaženo prostřednictvím programování AI, ani pouze technologické průlomy, které osvěží hodnocení SOTA, budou moci být přínosem pro většinu lidstva. Stejně jako nevíte, zda bota sedí nebo ne, dokud si ji neobujete, nevíte, zda model sedí nebo ne, dokud ji nepoužíváte. V těchto dnech jsem vědomě „de-ChatGPTing“: spoléhám na Kimi Chat při čtení dokumentů a dokumentů, spoléhám na Wen Xinyiyan a ChatGLM při práci na stole a spoléhám na vivo Blue Heart Model jako na svého osobního asistenta, pro žádný jiný důvod. než „fit“. Neočekáváte, že to dožene ChatGPT komplexně, ale já opravdu potřebuji „velký model“ nebo „malý model“, který lze použít na mobilních telefonech, chrání osobní soukromí a bezpečnost dat a má slušné průměrné skóre.
Velké jazykové modely jsou pro lidi, aby je používali, ne pro vychloubání.