SECARA SINGKAT

  • Stability AI telah merilis produk terbarunya, SDXL 1.0, alat pembuat teks-ke-gambar dengan kualitas gambar yang ditingkatkan dan antarmuka yang ramah pengguna.

  • Dengan 3,5 miliar parameter, kamera ini dapat menghasilkan gambar 1 megapiksel dalam rasio aspek berbeda.

  • Model ini dirancang untuk menyederhanakan proses pembuatan teks-ke-gambar dan menyertakan fitur penyesuaian, seperti ControlNet, yang berasal dari penelitian Universitas Stanford.

  • SDXL 1.0 dioptimalkan untuk GPU konsumen dengan kapasitas VRAM 8 GB dan sama efisiennya pada instance cloud dengan harga terjangkau.

  • Perangkat lunak ini menawarkan penyempurnaan yang ditingkatkan, memungkinkan pembuatan LoRA Kustom atau pos pemeriksaan dengan pengurangan overhead data.

  • Komunitas AI dapat mengharapkan pembaruan dalam waktu dekat, dan SDXL 1.0 dapat menghasilkan konsep-konsep tingkat lanjut, seperti detail yang rumit atau komposisi spasial yang kompleks.

  • Alat ini bersifat open-source dan dapat diakses di GitHub, sehingga mendorong transparansi dan kolaborasi dalam komunitas.

Stable Diffusion XL 1.0 (SDXL 1.0), produk terbaru dari Stability AI, akhirnya dirilis. Alat ini, yang diposisikan sebagai perkembangan terkini dalam pembuatan teks-ke-gambar, menonjol karena peningkatan kualitas gambar dan antarmuka yang ramah pengguna.

Sementara banyak orang di industri AI terus meningkatkan platform mereka, rilis SDXL 1.0 Stability AI baru-baru ini menunjukkan kemajuan yang menjanjikan. 3,5 miliar parameter model yang mengesankan memungkinkannya menghasilkan gambar 1 megapiksel dengan cepat dalam rasio aspek berbeda. Joe Penna, direktur pembelajaran mesin terapan di Stability AI, menekankan kemampuan model tersebut dalam percakapan dengan TechCrunch. Dia menekankan bagaimana hal itu dapat dikustomisasi dan bagaimana Anda dapat menyesuaikan konsep dan gaya gambar dengan menggunakan isyarat dasar pemrosesan bahasa alami. Dengan bantuan fitur-fitur tersebut, tugas pengguna dapat dipermudah dengan tetap mengikuti instruksi yang jelas untuk membuat desain yang rumit.

Stabilitas AI tampaknya telah mengatasi tantangan yang lazim di sektor AI, khususnya terkait pembuatan teks. Khususnya, banyak model teks-ke-gambar mutakhir sering kali gagal ketika ditugaskan untuk menghasilkan teks yang dapat dibaca, terutama dalam gaya rumit seperti kaligrafi. Namun, SDXL 1.0 telah menunjukkan kemahiran dalam pembuatan teks tingkat lanjut.

Apa yang membedakan SDXL 1.0 lebih lanjut adalah posisi kompetitifnya terhadap pesaing utama lainnya seperti layanan Midjourney dan Firefly dari Adobe. Model baru ini menggarisbawahi peningkatan proses penyempurnaan gambar, menghasilkan warna yang lebih kaya, pencahayaan superior, dan kontras yang ditingkatkan. Selain itu, penyertaan fitur penyesuaian memfasilitasi pembuatan gambar yang dibuat khusus.

Pengembangan SDXL 1.0 memanfaatkan pendekatan pelatihan yang disederhanakan, memanfaatkan basis parameternya yang besar, memposisikannya sebagai landasan ideal untuk berbagai alat dan kemampuan. Menguraikan atributnya, Emad Mostaque, CEO Stability AI, menyatakan bahwa SDXL 1.0 dibuat dengan cermat untuk menyederhanakan proses pembuatan teks-ke-gambar. Hal ini semakin diperkaya dengan ControlNet, yang berasal dari penelitian Universitas Stanford, memfasilitasi peningkatan kemampuan penyesuaian dan komposisi.

Fitur penting dari model SDXL 1.0 adalah desainnya yang berpusat pada pengguna. Berlawanan dengan memerlukan perintah yang panjang untuk mendapatkan hasil yang diinginkan, model ini memungkinkan pengguna untuk mengeluarkan arahan multi-bagian yang kompleks, secara ringkas menangkap maksud dengan kata-kata yang lebih sedikit dibandingkan model sebelumnya. Saat ini, model inovatif ini dapat diakses melalui berbagai platform, termasuk layanan Amazon Bedrock dan Amazon SageMaker Jumpstart.

Peningkatan Kinerja pada GPU Konsumen dan Fitur Penyempurnaan Tingkat Lanjut

Gambar yang Dihasilkan SDXL 1.0

Didesain dengan mempertimbangkan kompatibilitas, SDXL 1.0 dioptimalkan untuk GPU konsumen dengan kapasitas VRAM 8 GB dan sama efisiennya pada instance cloud dengan harga terjangkau.

Fitur dan Kompatibilitas:

Peluncuran SDXL 1.0 menunjukkan komitmen Stability untuk memastikan solusi AI yang efisien dan dapat diakses oleh pengguna. Salah satu poin penting dari pengumuman ini adalah kemampuan perangkat lunak untuk beroperasi dengan lancar pada GPU konsumen standar. Bagi pengguna, ini berarti potensi kinerja optimal tanpa memerlukan perangkat keras kelas atas atau khusus.

Peningkatan dalam Penyempurnaan:

Stabilitas telah memasukkan fitur dalam SDXL 1.0 yang menyederhanakan proses pelatihan ulang model untuk kumpulan data unik. Model saat ini memungkinkan pembuatan LoRA Kustom atau pos pemeriksaan dengan pengurangan overhead data, sehingga membuka jalan bagi adaptasi model yang lebih efisien dan lebih cepat terhadap kebutuhan spesifik. Selain itu, terdapat petunjuk mengenai masa depan karena tim Stability AI sedang mengembangkan kontrol tingkat lanjut untuk struktur, gaya, dan komposisi tugas tertentu. Secara khusus, T2I/ControlNet, yang dikhususkan untuk SDXL, akan segera hadir. Meskipun kemajuan ini masih dalam tahap pra-beta, komunitas AI dan pengguna dapat mengantisipasi pembaruan dalam waktu dekat.

Merender Konsep Tingkat Lanjut:

SDXL 1.0 menunjukkan kemampuannya untuk menghasilkan konsep yang sebelumnya menantang untuk model gambar. Hal ini mencakup rendering detail yang rumit seperti tangan dan teks, atau bahkan komposisi spasial yang lebih kompleks, seperti adegan yang menggambarkan seorang wanita di latar belakang sedang mengejar seekor anjing di latar depan. Fitur ini sangat penting karena menunjukkan lompatan dalam kemampuan perangkat lunak untuk menafsirkan dan membuat skenario yang berbeda dan beragam.

Aksesibilitas Sumber Terbuka:

Bagi pengembang dan penggemar yang tertarik untuk mempelajari lebih dalam, Stability telah membuat bobot dan kode untuk SDXL 1.0 tersedia di GitHub. Langkah ini tidak hanya mendorong transparansi tetapi juga mendorong pengembangan kolaboratif dan inovasi dalam masyarakat.

Cobalah:

Bagi mereka yang ingin menguji kemampuan SDXL 1.0, Stability telah mengintegrasikannya ke dalam platform seperti DreamStudio dan ClipDrop. Selain itu, sesi interaktif dan demonstrasi potensial tersedia melalui Discord, memungkinkan pengguna untuk merasakan fitur alat secara langsung.