Meta open source nová technologie AI image watermarking, ale je opravdu spolehlivá?

Zdroj dotisku článku: Kyle
Zdroj obrázku: Generated by Unbounded AI
Generování obrázků řízené umělou inteligencí zažívá boom, a to z dobrého důvodu: je zábavné, zajímavé a snadno se používá. I když tyto modely přinášejí nové kreativní možnosti, mohou vyvolávat obavy z možného zneužití špatnými herci, kteří mohou záměrně vytvářet obrázky, aby oklamali lidi. I obrázky vytvořené pro zábavu se mohou stát virálními a potenciálně uvádět lidi v omyl. Začátkem tohoto roku se například rozšířily obrázky papeže Františka v honosné bílé bundě a fotografie zatčení Trumpa vyvolaly vzrušenou debatu. Obrázky nebyly skutečné fotografie, ale mnoho lidí bylo oklamáno, protože neexistoval žádný jasný indikátor, který by odlišil, že obsah byl vytvořen generativní AI.
Výzkumníci z Meta nedávno zveřejnili nový výzkumný dokument a technický kód podrobně popisující techniku ​​přidávání neviditelných vodoznaků do obrázků AI, aby bylo možné rozlišit, kdy byly obrázky vytvořeny generativními modely AI s otevřeným zdrojovým kódem. Neviditelné vodoznaky začleňují informace do digitálního obsahu. Tyto vodoznaky jsou neviditelné pouhým okem, ale mohou být detekovány algoritmy – i když lidé obrázek znovu upravují. I když existují další výzkumné směry týkající se vodoznaků, mnoho existujících metod vytváří vodoznaky po generování obrázků AI.
Podle Everypixel Journal uživatelé vytvořili více než 11 miliard obrázků pomocí modelů ze tří open source úložišť. V tomto případě lze neviditelný vodoznak odstranit jednoduchým odstraněním řádku, který vodoznak vytvořil. Stable Signature navrhuje způsob, jak se vyhnout odstranění vodoznaku.
Jak funguje metoda Stable Signature
Adresa papíru: https://arxiv.org/abs/2303.15435
Adresa Github: https://github.com/facebookresearch/stable_signature
Stable Signature eliminuje možnost odstranění vodoznaku jeho zakořeněním v modelu a použitím vodoznaku, který lze vysledovat zpět k místu, kde byl obrázek vytvořen.
Podívejme se, jak tento proces funguje pomocí níže uvedeného diagramu.
Alice trénuje mistrovský generativní model. Před distribucí doladí malou část modelu (nazývanou dekodér), aby vygeneroval daný vodoznak pro Boba. Vodoznak může identifikovat verzi modelu, společnost, uživatele atd.
Bob obdrží svou verzi modelu a vygeneruje obrázek. Výsledný obrázek bude mít Bobův vodoznak. Alice nebo třetí strana je mohou analyzovat, aby zjistili, zda obrázek vygeneroval Bob pomocí generativního modelu umělé inteligence.
Toho je dosaženo ve dvou krocích:
1. Společně trénujte dvě konvoluční neuronové sítě. Jeden zakóduje obrázek a náhodnou zprávu do obrázku s vodoznakem a druhý extrahuje zprávu z rozšířené verze obrázku s vodoznakem. Cílem je, aby se zakódované a extrahované zprávy shodovaly. Po tréninku zůstane zachován pouze extraktor vodoznaku.
2. Jemně dolaďte latentní dekodér generativního modelu pro generování obrázků obsahujících pevné signatury. Během tohoto procesu jemného ladění jsou dávky obrázků kódovány, dekódovány a optimalizovány tak, aby se minimalizovaly rozdíly mezi extrahovanými a cílovými zprávami a aby byla zachována vnímaná kvalita obrazu. Tento proces optimalizace je rychlý a efektivní, vyžaduje pouze malé dávky a krátký čas k dosažení vysoce kvalitních výsledků.
Vyhodnoťte výkon Stable Signature
Víme, že lidé rádi sdílejí a retweetují obrázky. Co se stane, když Bob sdílí obrázek, který vytvořil, s 10 přáteli a každý přítel pak sdílí obrázek s 10 dalšími přáteli? Během této doby mohl někdo provést změny na obrázku, například oříznutí, kompresi nebo změnu barev. Výzkumníci vytvořili Stable Signature, aby se s těmito změnami vyrovnali. Bez ohledu na to, jak člověk transformuje obrázek, původní vodoznak pravděpodobně zůstane v digitálních datech a lze jej vysledovat zpět ke generativnímu modelu, který jej vytvořil.
Výzkumníci zjistili dvě hlavní výhody Stable Signature oproti pasivním metodám detekce:
Za prvé, schopnost kontrolovat a omezovat generování falešných poplachů, ke kterým dochází, když je obraz vytvořený člověkem zaměněn za obraz vytvořený AI. To je zásadní vzhledem k převládajícímu výskytu obrázků nevygenerovaných umělou inteligencí sdílených online. Například nejúčinnější existující detekční metody dokážou zaznamenat asi 50 % upravených generovaných snímků, ale stále produkují falešně pozitivní míru asi 1/100. Jinými slovy, na platformě obsahu vytvářeného uživateli, která přijímá 1 miliardu obrázků denně, by bylo chybně označeno přibližně 10 milionů obrázků, což by vedlo k tomu, že by byla detekována pouze polovina obrázků generovaných umělou inteligencí.
Stable Signature na druhé straně detekuje obrazy se stejnou přesností s mírou falešných pozitivních nálezů 1e-10 (kterou lze nastavit na konkrétní požadovanou hodnotu). Tento přístup k vodoznaku navíc umožňuje sledování obrázků různých verzí stejného modelu – tato možnost není u pasivních technik možná.
Pokud je doladěn velký model, jak Stable Signature detekuje obrázky generované jemně vyladěnou verzí?
Běžným přístupem k velkým modelům umělé inteligence je vzít základní model a doladit jej tak, aby zvládl konkrétní případ použití, který je někdy dokonce ušitý na míru člověku. Modelce lze například ukázat obrázek Aliceina psa a Alice pak může modelku požádat, aby vytvořila obrázek jejího psa na pláži. Toho je dosaženo pomocí metod, jako je DreamBooth, Textual Inversion a ControlNet. Tyto metody působí na úrovni základního modelu a nemění dekodér. To znamená, že naše metoda vodoznaku není těmito doladěními ovlivněna.
Celkově Stable Signature funguje dobře s vektorovým kvantovaným modelováním obrazu (jako je VQGAN) a modely latentní difúze (jako je Stable Diffusion). Vzhledem k tomu, že tento přístup nemodifikuje proces generování difúze, je kompatibilní s populárními modely zmíněnými výše. S určitými úpravami lze stabilní signatury aplikovat i na jiné metody modelování.
Jsou AI vodoznaky opravdu spolehlivé?
Technologie identifikace obrázků generovaných umělou inteligencí přidáním neviditelných vodoznaků je v poslední době předmětem mnoha kontroverzí. Google DeepMind nedávno oznámil spuštění SynthID, nástroje pro přidávání vodoznaků do generování obrázků a identifikaci obrázků generovaných AI. Skenováním digitálních vodoznaků v obrázcích může SynthID vyhodnotit pravděpodobnost, že obrázek byl vygenerován modelem Imagen.
Lze ale AI vodoznaky snadno odstranit? Podle zpráv zahraničních médií, jako je Engadget a Wired, výzkumný tým z University of Maryland ve Spojených státech studoval spolehlivost technologie „digitálního vodoznaku“ pro obsah generovaný AI a zjistil, že tuto technologii lze snadno prolomit.
Soheil Feizi, profesor informatiky na škole, byl neomalený, když čelil současnému stavu vodoznaků v obrázcích generovaných umělou inteligencí: "V současné době nemáme žádnou spolehlivou technologii vodoznaků a všechny vodoznaky jsme prolomili."
Během testování byli vědci schopni snadno obejít stávající metody vodoznaku a zjistili, že je snazší přidávat „falešné vodoznaky“ do obrázků, které nejsou vygenerovány AI. Zároveň tým také vyvinul technologii vodoznaku, kterou je „téměř nemožné“ odstranit z obrázků, aniž by bylo zcela ohroženo duševní vlastnictví obrázku.
AI vodoznak je stále nevyzrálý a nemůže být 100% účinným nástrojem. Musíme se těšit na to, že se v budoucnu objeví nové technologie na ochranu generativních obrázků AI, zabránění šíření falešných obrázků a porušování autorských práv.
Reference:
https://ai.meta.com/blog/stable-signature-watermarking-generative-ai/