Riflessione profonda: perché si dice che ChatGPT sia un'immagine sfocata di tutto il testo su Internet?

Come tutti sapete, sono un appassionato di GPT e l'ho integrato in tutti gli aspetti del lavoro e della vita. Ma GPT non è onnipotente. Dobbiamo comprenderne l'essenza per sfruttare meglio le sue capacità. Consiglio vivamente l'articolo penetrante di Ted Jiang "ChatGPT è un'immagine sfocata di tutto il testo su Internet". Gli approfondimenti unici sono stimolanti. Ho riassunto 3 punti, benvenuto a leggere.
Ted Jiang è uno scrittore di fantascienza cinese laureato presso il Dipartimento di Informatica della Brown University. Il suo racconto "The Story of Your Life" è stato adattato nel film "Arrival" nel 2016. Il suo duplice background in tecnologia e fantascienza ha dato. lui una prospettiva unica su ChatGPT.
TL;DR
 ChatGPT è una compressione con perdita di tutto il testo su Internet. Fai attenzione alla "bella sfocatura" e alla "scarsa espressione di idee originali" piuttosto che alla "chiara espressione di idee non originali" 1. ChatGPT è una compressione con perdita di tutto il testo su Internet.
Se tutti i testi su Internet sono considerati originali, tenendo conto della velocità di elaborazione e della precisione, ChatGPT è in realtà un'interfaccia interattiva in linguaggio naturale dopo la compressione con perdita di questi testi. Poiché si tratta di una compressione con perdita, alcuni dettagli e persino le informazioni chiave verranno scartati.
Per quanto riguarda i problemi che la compressione con perdita può causare, l'autore ha fornito un vivido esempio: nel 2013, un'impresa di costruzioni tedesca ha copiato la pianta di una casa e le tre stanze avevano un'etichetta per indicarne l'area: 14,13, 21,11 e 17,42 metri quadrati. Quindi nella copia tutte e tre le stanze sono contrassegnate come 14,13 m2.
Dopo un'indagine, si è scoperto che la fotocopiatrice Xerox funziona scansionando i documenti in immagini digitali e quindi stampandoli. Per risparmiare spazio, la scansione su immagini digitali utilizza un formato di compressione con perdita chiamato jbig2. La fotocopiatrice determina che le etichette di area per le 3 stanze sono molto simili, quindi ne memorizza solo una e quindi riutilizza quell'etichetta per tutte e 3 le stanze durante la stampa.
Le fotocopiatrici Xerox utilizzano un formato di compressione con perdita invece di un formato senza perdita, il che non è un problema in sé. Il problema è che se stampa solo una foto sfocata, tutti sapranno che non è una replica esatta dell'originale, ma la fotocopiatrice stampa. Immagini chiare ma imprecise potrebbero essere fuorvianti per gli utenti
Gli autori ritengono che questo esempio debba essere tenuto presente poiché utilizziamo ChatGPT di OpenAI e altri modelli linguistici di grandi dimensioni simili. ChatGPT conserva la maggior parte delle informazioni sul World Wide Web, proprio come JPEG conserva la maggior parte delle informazioni sulle immagini ad alta risoluzione. Ma se cerchi l'esatta sequenza di bit, non riesci a trovarla, tutto ciò che ottieni è un'approssimazione.
Si può vedere che nell'ultima valutazione di autenticità del documento OpenAI, sebbene GPT-4 sia molto più alto rispetto ai modelli precedenti, c'è ancora un'alta probabilità di generare risposte sbagliate (specialmente nei campi della tecnologia, del codice e del business), e dobbiamo stare attenti.
 2. Diffidare della “bella sfocatura”
La nostra comprensione del mondo è essenzialmente la ricezione e la compressione delle informazioni. Identifichiamo e scartiamo le informazioni non importanti, lasciando dietro di noi informazioni importanti, e allo stesso tempo esercitiamo e utilizziamo le nostre capacità decisionali nel processo. Sono entrambi compressione con perdita di informazioni. In cosa siamo diversi da ChatGPT? - La nostra compressione delle informazioni si basa sulla comprensione dei fatti e ciò che rimane alla fine è "correttezza fuzzy" - ChatGPT non "comprende" realmente le informazioni e restituisce "bellissimo fuzzy" basato su leggi statistiche. Diamo un’occhiata ad altri 2 esempi grafici:
 Se chiedi a ChatGPT di calcolare 3457 * 43216, darà la risposta sbagliata 149299312 (la risposta corretta è 149397712 L'ultima cifra è corretta perché ci sono molte moltiplicazioni di numeri che terminano con 6 e 7 che ChatGPT può imparare). non capisce veramente i principi dell'aritmetica, quindi alla fine è stata data la risposta sbagliata. Qualsiasi analisi del testo rivelerà che frasi come “scarsità di offerta” compaiono spesso accanto a frasi come “aumento dei prezzi”. Alla domanda sulla mancanza di offerta, l’intelligenza artificiale può dare una risposta che include un aumento dei prezzi. Se un’intelligenza artificiale ha compilato un gran numero di correlazioni tra termini economici, così tante da poter fornire risposte ragionevoli a una varietà di domande, dovremmo dire che comprende effettivamente la teoria economica? Apparentemente no.
ChatGPT è bravo a produrre belle risposte, ma belle ≠ corrette. Dobbiamo sempre tenerlo presente, i risultati emessi da ChatGPT possono essere belli e chiari ma imprecisi, e per identificarli è necessario confrontarli con gli originali, altrimenti si corre il rischio di prendere decisioni sbagliate basate su contenuti inventati. La risposta generata da Bing di seguito è una tipica "bella sfocatura".
 3. "Scarsa espressione di idee originali" è meglio di "chiara espressione di idee non originali"
È fattibile lasciare che il testo generato da ChatGPT serva come punto di partenza per gli scrittori quando creano lavori originali, consentendo agli autori di concentrarsi sulle parti veramente creative? L'autore ritiene che iniziare con un'opera vaga e non originale non sia un buon modo per creare un'opera originale.
Se sei uno scrittore, scriverai molti lavori non originali prima di scrivere lavori originali. Il tempo e l'energia spesi per lavori non originali non saranno sprecati. Piuttosto, è ciò che ti consente di creare un lavoro originale. Il tempo che dedichi alla scelta delle parole giuste e alla riorganizzazione delle frasi ti insegna come trasmettere il significato che desideri esprimere attraverso la tua scrittura.
Chiedere agli studenti di scrivere saggi è più di un semplice modo per testare la loro padronanza del materiale, dà loro l'esperienza di esprimere le proprie idee. Se gli studenti non dovessero mai scrivere su cose che tutti leggiamo, non acquisiranno mai le competenze di cui hanno bisogno per scrivere su cose che non abbiamo mai letto.
Sarà possibile utilizzare in sicurezza i modelli forniti da grandi modelli linguistici come ChatGPT dopo aver lasciato lo status di studente? Ma no. La lotta per esprimere la tua opinione non scompare dopo la laurea. Questa lotta si presenta ogni volta che inizi a redigere un nuovo articolo. A volte è solo durante il processo di scrittura che scopri i tuoi pensieri originali, e questo è fondamentale.
Alcuni potrebbero dire che l'output di un modello linguistico ampio non sembra molto diverso dalla prima bozza di uno scrittore umano, ma questa è solo una somiglianza superficiale. La tua prima bozza non è "una chiara espressione di un'idea non originale"; un misero tentativo di idea originale." espressione", ti accompagna con un'insoddisfazione amorfa, e ti accorgi della distanza tra ciò che dice e ciò che vuoi dire.
Questo è qualcosa che può guidarti durante la riscrittura, qualcosa che ti manca quando inizi a lavorare con testo generato dall'intelligenza artificiale. Basandosi su "idee non originali chiaramente espresse", è facile per le persone perdere le proprie idee; partendo da "una scarsa espressione di idee originali" e gradualmente perfezionandole, alla fine si otterrà "un'espressione accurata delle idee originali". la giada, se non lo è, l'originalità diventerà solo diffusa.
Riepilogo 2 punti Take Away:
 ChatGPT è una compressione con perdita di tutto il testo su Internet Dobbiamo sempre tenerlo presente ed essere cauti nel trattare la "bella sfocatura" come informazione accurata, che influenza il giudizio e il processo decisionale 2. Scopri "idee originali" nelle lotte e espressioni povere e allo stesso tempo migliorare le proprie capacità di espressione, lucidate nella giada, allenare l'immaginazione, le capacità decisionali e di comunicazione e creare competitività che le macchine non possono avere