Công nghệ tạo hình mờ hình ảnh AI mới mã nguồn mở Meta, nhưng liệu nó có thực sự đáng tin cậy?

Nguồn in lại bài viết: Kyle
Nguồn hình ảnh: Được tạo bởi AI không giới hạn
Việc tạo hình ảnh được hỗ trợ bởi AI đang bùng nổ và vì lý do chính đáng: nó thú vị, thú vị và dễ sử dụng. Mặc dù những mô hình này mang đến những khả năng sáng tạo mới nhưng chúng có thể gây lo ngại về khả năng bị lạm dụng bởi những kẻ xấu cố tình tạo ra hình ảnh để đánh lừa mọi người. Ngay cả những hình ảnh được tạo ra để giải trí cũng có thể lan truyền và có khả năng gây hiểu lầm cho mọi người. Ví dụ, đầu năm nay, hình ảnh Giáo hoàng Francis mặc áo khoác phồng màu trắng lòe loẹt đã lan truyền rộng rãi và những bức ảnh Trump bị bắt đã làm dấy lên cuộc tranh luận sôi nổi. Những hình ảnh này không phải là ảnh thật nhưng nhiều người đã bị lừa vì không có bất kỳ dấu hiệu rõ ràng nào để phân biệt nội dung được tạo ra bởi AI tổng hợp.
Các nhà nghiên cứu Meta gần đây đã phát hành một tài liệu nghiên cứu mới và mã kỹ thuật mô tả chi tiết kỹ thuật thêm hình mờ vô hình vào hình ảnh AI để phân biệt thời điểm hình ảnh được tạo bởi các mô hình AI tạo nguồn mở. Hình mờ vô hình kết hợp thông tin vào nội dung số. Những hình mờ này không thể nhìn thấy bằng mắt thường nhưng có thể được phát hiện bằng thuật toán - ngay cả khi người ta chỉnh sửa lại hình ảnh. Mặc dù có các hướng nghiên cứu khác xung quanh hình mờ, nhưng nhiều phương pháp hiện có tạo hình mờ sau khi tạo hình ảnh AI.
Theo Everypixel Journal, người dùng đã tạo ra hơn 11 tỷ hình ảnh bằng cách sử dụng các mô hình từ ba kho lưu trữ nguồn mở. Trong trường hợp này, hình mờ vô hình có thể được loại bỏ bằng cách xóa dòng tạo ra hình mờ. Chữ ký ổn định đề xuất một cách để tránh loại bỏ hình mờ.
Cách thức hoạt động của phương pháp Chữ ký ổn định
Địa chỉ giấy: https://arxiv.org/abs/2303.15435
Địa chỉ Github: https://github.com/facebookresearch/stable_signature
Chữ ký ổn định loại bỏ khả năng loại bỏ hình mờ bằng cách root nó trong mô hình và sử dụng hình mờ có thể truy ngược lại nơi hình ảnh được tạo.
Hãy cùng xem quá trình này diễn ra như thế nào qua sơ đồ bên dưới.
Alice đào tạo một mô hình sáng tạo bậc thầy. Trước khi phân phối, cô tinh chỉnh một phần nhỏ của mô hình (được gọi là bộ giải mã) để tạo hình mờ nhất định cho Bob. Hình mờ có thể xác định phiên bản mô hình, công ty, người dùng, v.v.
Bob nhận được phiên bản mô hình của mình và tạo ra hình ảnh. Hình ảnh thu được sẽ có hình mờ của Bob trên đó. Alice hoặc bên thứ ba có thể phân tích chúng để xem liệu hình ảnh có phải do Bob tạo ra bằng mô hình AI tổng hợp hay không.
Điều này đạt được trong hai bước:
1. Cùng huấn luyện hai mạng lưới thần kinh tích chập. Một phương pháp mã hóa một hình ảnh và một thông điệp ngẫu nhiên thành một hình ảnh có hình mờ, còn phương pháp kia trích xuất thông điệp từ một phiên bản nâng cao của hình ảnh có hình mờ. Mục đích là làm cho các tin nhắn được mã hóa và trích xuất khớp nhau. Sau khi đào tạo, chỉ có trình trích xuất hình mờ được giữ lại.
2. Tinh chỉnh bộ giải mã tiềm ẩn của mô hình tổng quát để tạo ra hình ảnh chứa chữ ký cố định. Trong quá trình tinh chỉnh này, hàng loạt hình ảnh được mã hóa, giải mã và tối ưu hóa để giảm thiểu sự khác biệt giữa thông điệp được trích xuất và thông điệp đích, đồng thời duy trì chất lượng hình ảnh được cảm nhận. Quá trình tối ưu hóa này diễn ra nhanh chóng và hiệu quả, chỉ cần thực hiện các đợt nhỏ và thời gian ngắn để đạt được kết quả chất lượng cao.
Đánh giá hiệu năng của Stable Signature
Chúng tôi biết mọi người thích chia sẻ và đăng lại hình ảnh. Điều gì xảy ra nếu Bob chia sẻ hình ảnh anh ấy đã tạo với 10 người bạn và sau đó mỗi người bạn chia sẻ hình ảnh đó với 10 người bạn khác? Trong thời gian này, ai đó có thể đã thực hiện các thay đổi đối với hình ảnh, chẳng hạn như cắt, nén hoặc thay đổi màu sắc. Các nhà nghiên cứu đã xây dựng Stable Signature để đối phó với những thay đổi này. Bất kể người ta biến đổi hình ảnh như thế nào, hình mờ ban đầu có thể vẫn còn trong dữ liệu số và có thể được truy ngược về mô hình tổng quát đã tạo ra nó.
Các nhà nghiên cứu đã tìm thấy hai ưu điểm chính của Chữ ký ổn định so với các phương pháp phát hiện thụ động:
Đầu tiên, khả năng kiểm soát và giảm thiểu việc tạo ra các kết quả dương tính giả, xảy ra khi hình ảnh do con người tạo ra bị nhầm lẫn với hình ảnh do AI tạo ra. Điều này rất quan trọng vì sự phổ biến của các hình ảnh không do AI tạo ra được chia sẻ trực tuyến. Ví dụ: các phương pháp phát hiện hiệu quả nhất hiện có có thể phát hiện khoảng 50% hình ảnh được tạo đã chỉnh sửa nhưng vẫn tạo ra tỷ lệ dương tính giả khoảng 1/100. Nói cách khác, trên nền tảng nội dung do người dùng tạo nhận được 1 tỷ hình ảnh mỗi ngày, khoảng 10 triệu hình ảnh sẽ bị gắn nhãn sai, dẫn đến chỉ một nửa số hình ảnh do AI tạo ra được phát hiện.
Mặt khác, Stable Signature phát hiện hình ảnh có độ chính xác tương tự với tỷ lệ dương tính giả là 1e-10 (có thể được đặt thành giá trị mong muốn cụ thể). Ngoài ra, phương pháp tạo hình mờ này cho phép theo dõi hình ảnh của các phiên bản khác nhau của cùng một mô hình - một khả năng không thể thực hiện được với các kỹ thuật thụ động.
Nếu một mô hình lớn được tinh chỉnh, Stable Signature sẽ phát hiện các hình ảnh do phiên bản tinh chỉnh tạo ra như thế nào?
Một cách tiếp cận phổ biến đối với các mô hình AI lớn là lấy một mô hình cơ sở và tinh chỉnh nó để xử lý một trường hợp sử dụng cụ thể mà đôi khi còn được điều chỉnh cho phù hợp với một người. Ví dụ: mô hình có thể được hiển thị hình ảnh con chó của Alice và sau đó Alice có thể yêu cầu mô hình tạo ra hình ảnh con chó của cô ấy ở bãi biển. Điều này được thực hiện thông qua các phương pháp như DreamBooth, Textual Inversion và ControlNet. Các phương thức này hoạt động ở cấp độ mô hình cơ bản và không thay đổi bộ giải mã. Điều này có nghĩa là phương pháp tạo hình chìm mờ của chúng tôi không bị ảnh hưởng bởi những tinh chỉnh này.
Nhìn chung, Chữ ký ổn định hoạt động tốt với mô hình hình ảnh lượng tử hóa vectơ (chẳng hạn như VQGAN) và các mô hình khuếch tán tiềm ẩn (chẳng hạn như Khuếch tán ổn định). Vì cách tiếp cận này không làm thay đổi quá trình tạo khuếch tán nên nó tương thích với các mô hình phổ biến được đề cập ở trên. Với một số điều chỉnh, chữ ký ổn định cũng có thể được áp dụng cho các phương pháp lập mô hình khác.
Hình mờ AI có thực sự đáng tin cậy?
Công nghệ nhận dạng hình ảnh do AI tạo ra bằng cách thêm hình mờ vô hình đang gây ra rất nhiều tranh cãi trong thời gian gần đây. Google DeepMind gần đây đã công bố ra mắt SynthID, một công cụ để thêm hình mờ vào quá trình tạo hình ảnh và xác định hình ảnh do AI tạo ra. Bằng cách quét hình mờ kỹ thuật số trong hình ảnh, SynthID có thể đánh giá khả năng hình ảnh được tạo bởi mô hình Imagen.
Nhưng hình mờ AI có thể dễ dàng xóa được không? Theo báo cáo của các phương tiện truyền thông nước ngoài như Engadget và Wired, một nhóm nghiên cứu tại Đại học Maryland ở Hoa Kỳ đã nghiên cứu độ tin cậy của công nghệ "hình mờ kỹ thuật số" đối với nội dung do AI tạo ra và nhận thấy rằng công nghệ này có thể dễ dàng bị bẻ khóa.
Soheil Feizi, giáo sư khoa học máy tính của trường, đã thẳng thắn khi đối mặt với tình trạng hiện tại về hình mờ trong hình ảnh do AI tạo ra: "Hiện tại chúng tôi không có công nghệ hình mờ nào đáng tin cậy và chúng tôi đã bẻ khóa được tất cả các hình mờ".
Trong quá trình thử nghiệm, các nhà nghiên cứu có thể dễ dàng phá vỡ các phương pháp tạo hình mờ hiện có và nhận thấy việc thêm "hình mờ giả" vào hình ảnh không do AI tạo ra sẽ dễ dàng hơn. Đồng thời, nhóm cũng đã phát triển một công nghệ hình mờ “gần như không thể” xóa khỏi hình ảnh mà không ảnh hưởng hoàn toàn đến quyền sở hữu trí tuệ của hình ảnh.
Hình mờ AI vẫn còn non nớt và không thể là công cụ hiệu quả 100%. Chúng ta cần mong đợi sự xuất hiện của các công nghệ mới trong tương lai để bảo vệ hình ảnh AI tổng hợp, tránh sự phổ biến của hình ảnh sai lệch và tránh vi phạm bản quyền.
Người giới thiệu:
https://ai.meta.com/blog/stable-signature-watermarking-generative-ai/