ĪSUMĀ

  • Stabilitātes mākslīgais intelekts ir izlaidis savu jaunāko produktu SDXL 1.0 — teksta pārveides attēlu ģenerēšanas rīku ar uzlabotu attēla kvalitāti un lietotājam draudzīgu saskarni.

  • Ar 3,5 miljardiem parametru tas var radīt 1 megapikseļa attēlus dažādās proporcijās.

  • Modelis ir izstrādāts, lai racionalizētu teksta pārveides attēlu ģenerēšanas procesu, un tajā ir iekļauti precizēšanas līdzekļi, piemēram, ControlNet, kas iegūts no Stenfordas universitātes pētījumiem.

  • SDXL 1.0 ir optimizēts patērētāju GPU ar 8 GB VRAM ietilpību un ir vienlīdz efektīvs mākoņdatošanas gadījumos par saprātīgu cenu.

  • Programmatūra piedāvā uzlabotu precizēšanu, ļaujot ģenerēt pielāgotu LoRA vai kontrolpunktus ar samazinātu datu apjomu.

  • AI kopiena var sagaidīt atjauninājumus tuvākajā nākotnē, un SDXL 1.0 var ģenerēt uzlabotas koncepcijas, piemēram, sarežģītas detaļas vai sarežģītas telpiskas kompozīcijas.

  • Šis rīks ir pieejams atvērtā koda vietnē GitHub, veicinot pārredzamību un sadarbību kopienā.

Stable Diffusion XL 1.0 (SDXL 1.0), jaunākais Stability AI produkts, beidzot ir izlaists. Šis rīks, kas tiek pozicionēts kā jaunākais teksta pārveides rīks, izceļas ar uzlabotu attēla kvalitāti un lietotājam draudzīgu saskarni.

Lai gan daudzi AI nozares pārstāvji turpina uzlabot savas platformas, Stabilitātes AI nesenais SDXL 1.0 izlaidums liecina par daudzsološu progresu. Modeļa iespaidīgie 3,5 miljardi parametru ļauj ātri izveidot 1 megapikseļa attēlus dažādās proporcijās. Džo Penna, Stabilitātes AI lietišķās mašīnmācības direktors, sarunā ar TechCrunch uzsvēra modeļa iespējas. Viņš uzsvēra, kā to var pielāgot un kā jūs varat pielāgot attēlu koncepcijas un stilus, izmantojot pamata dabiskās valodas apstrādes norādes. Izmantojot šīs funkcijas, lietotāju uzdevumus var atvieglot, vienlaikus ievērojot skaidrus norādījumus, lai izveidotu sarežģītus dizainus.

Šķiet, ka AI ir risinājusi problēmas, kas izplatītas AI nozarē, jo īpaši saistībā ar teksta ģenerēšanu. Konkrēti, daudzi jaunākie teksta pārveides modeļi bieži nedarbojas, ja tiem tiek uzdots ģenerēt salasāmu tekstu, īpaši sarežģītos stilos, piemēram, kaligrāfijā. Tomēr SDXL 1.0 ir parādījis prasmes uzlabotā teksta ģenerēšanā.

Tas, kas vēl vairāk atšķir SDXL 1.0, ir tā konkurētspējīgā pozīcija pret citiem galvenajiem pretendentiem, piemēram, Midjourney un Adobe Firefly pakalpojumu. Jaunajā modelī ir uzsvērti uzlaboti attēla uzlabošanas procesi, kas nodrošina bagātīgākas krāsas, izcilu apgaismojumu un uzlabotu kontrastu. Turklāt precīzas regulēšanas funkcijas iekļaušana atvieglo īpaši pielāgotu attēlu ģenerēšanu.

SDXL 1.0 izstrāde izmantoja racionalizētu apmācības pieeju, gūstot labumu no tā lielās parametru bāzes, pozicionējot to kā ideālu pamatu dažādiem rīkiem un iespējām. Izstrādājot tā atribūtus, Emad Mostaque, Stabilitātes AI izpilddirektors, paziņoja, ka SDXL 1.0 tika rūpīgi izstrādāts, lai racionalizētu teksta pārveidošanas procesu. Tas ir vēl vairāk bagātināts ar ControlNet, kas iegūts no Stenfordas universitātes pētījumiem, atvieglojot uzlabotas precizēšanas un kompozīcijas iespējas.

Ievērības cienīga SDXL 1.0 modeļa iezīme ir tā uz lietotāju orientētais dizains. Pretēji ilgām uzvednēm, lai iegūtu vēlamos rezultātus, modelis ļauj lietotājiem izdot sarežģītas daudzdaļīgas direktīvas, īsi tverot nodomu ar mazāk vārdu nekā iepriekšējie modeļi. Šobrīd šim novatoriskajam modelim var piekļūt, izmantojot vairākas platformas, tostarp Amazon Bedrock un Amazon SageMaker Jumpstart pakalpojumus.

Uzlabota patērētāju GPU veiktspēja un uzlabotas precizēšanas funkcijas

SDXL 1.0 ģenerēts attēls

Izstrādāts, ņemot vērā saderību, SDXL 1.0 ir optimizēts patērētāju GPU ar 8 GB VRAM ietilpību un ir vienlīdz efektīvs mākoņdatošanas gadījumos par saprātīgu cenu.

Funkcijas un saderība:

SDXL 1.0 palaišana parāda Stabilitātes apņemšanos nodrošināt lietotājiem efektīvus un pieejamus AI risinājumus. Viens no galvenajiem paziņojuma aspektiem ir programmatūras spēja nevainojami darboties standarta patērētāju GPU. Lietotājiem tas nozīmē optimālas veiktspējas potenciālu, neizmantojot augstākās klases vai specializētu aparatūru.

Uzlabojumi precizēšanā:

Stabilitāte ir iekļāvusi funkcijas SDXL 1.0, kas vienkāršo modeļu pārkvalificēšanas procesu unikālām datu kopām. Pašreizējais modelis ļauj ģenerēt pielāgotus LoRA vai kontrolpunktus ar samazinātu datu apjomu, kas paver ceļu efektīvākai un ātrākai modeļa pielāgošanai īpašām vajadzībām. Turklāt ir mājiens uz nākotni, jo Stabilitātes AI komanda pašlaik izstrādā uzlabotas vadīklas uzdevumiem raksturīgām struktūrām, stiliem un kompozīcijām. Konkrēti, T2I/ControlNet, kas ir specializējies SDXL, ir pie apvāršņa. Lai gan šie sasniegumi joprojām ir pirmsbeta fāzē, AI kopiena un lietotāji var paredzēt atjauninājumus tuvākajā nākotnē.

Uzlabotas renderēšanas koncepcijas:

SDXL 1.0 demonstrē savu spēju ģenerēt koncepcijas, kas iepriekš bija sarežģītas attēlu modeļiem. Tas ietver sarežģītu detaļu, piemēram, roku un teksta, vai pat sarežģītāku telpisku kompozīciju atveidošanu, piemēram, ainas, kurās attēlota sieviete fonā, kas priekšplānā vajā suni. Šī funkcija ir īpaši nozīmīga, jo tā norāda uz lēcienu programmatūras spējā interpretēt un atveidot niansētus un daudzpusīgus scenārijus.

Atvērtā pirmkoda pieejamība:

Izstrādātājiem un entuziastiem, kuri vēlas iedziļināties, Stabilitāte ir padarījusi SDXL 1.0 svarus un kodu pieejamus GitHub. Šis solis ne tikai veicina caurskatāmību, bet arī veicina sadarbības attīstību un inovācijas sabiedrībā.

Izmēģini:

Tiem, kas vēlas pārbaudīt SDXL 1.0 iespējas, Stabilitāte ir integrējusi to tādās platformās kā DreamStudio un ClipDrop. Turklāt, izmantojot Discord, ir pieejamas interaktīvas sesijas un iespējamās demonstrācijas, ļaujot lietotājiem pašiem izjust rīka funkcijas.