Odaily Planet Daily News Meta ha rilasciato il modello linguistico multimodale CM3leon. CM3leon è un modello linguistico multimodale con recupero potenziato, basato su token e solo decodificatore, in grado di generare e popolare testo e immagini. CM3leon è il primo modello multimodale addestrato utilizzando una ricetta adattata da un modello linguistico di solo testo, che comprende una fase di pre-addestramento potenziata dal recupero su larga scala e una seconda fase di messa a punto supervisionata multi-task (SFT). Come modello generale, può eseguire la generazione di testo in immagine e di immagine in testo, consentendo l'introduzione di metodi di decodifica contrastiva indipendenti che producono output di alta qualità.