Uniwersytet Stanforda ogłosił potężną sztuczną inteligencję przekształcającą muzykę w taniec, która generuje taniec z wejścia audio o nazwie EDGE. EDGE to skuteczna metoda dostosowywania tworzenia tańca, która może tworzyć fizycznie wiarygodne, realistyczne tańce, stosując się do dowolnej dostarczonej muzyki. Dzięki Jukebox, potężnemu ekstraktorowi funkcji muzycznych i modelowi dyfuzji opartemu na transformatorze, EDGE oferuje potężne możliwości edycji, idealne do tańca, takie jak kondycjonowanie stawów, ruch pomiędzy i kontynuacja tańca. Odkrywa, że osoby oceniające zdecydowanie preferują tańce generowane przez EDGE w porównaniu z najnowszymi podejściami, takimi jak Bailando i FACT.
Od muzyki do choreografii: jak EDGE tworzy swoje tańce
Nawet w przypadku próbek muzycznych znalezionych w środowisku naturalnym EDGE może tworzyć wysokiej jakości tańce, wykorzystując osadzenia muzyczne z solidnego modelu Jukebox. Zamrożony model Jukebox jest używany przez EDGE do włączania muzyki wejściowej. Seria pięciosekundowych klipów tanecznych jest używana do nauczania modelu dyfuzji warunkowej, jak mapować muzykę osadzoną w klipach. Przed połączeniem partii wielu klipów w celu utworzenia dowolnego, pełnego wideo o dowolnej długości, stosowane są ograniczenia czasowe, aby zapewnić spójność czasową.
EDGE jest trenowany na 5-sekundowych klipach tanecznych, ale poprzez nakładanie ograniczeń czasowych na partie sekwencji, jest w stanie tworzyć tańce o dowolnej długości. Na ilustracji EDGE wymusza, aby pierwsza połowa każdej sekwencji pasowała do drugiej połowy poprzedniej. Świeżo wygenerowane wyjścia muzyki do tańca
EDGE obsługuje dowolne ograniczenia czasowe i przestrzenne. Istnieje wiele aplikacji dla użytkowników końcowych, które mogą być obsługiwane przez tę technologię, w tym:
Wymagając ciągłości czasowej pomiędzy partiami licznych sekwencji, można tworzyć tańce o dowolnej długości.
Tańce, które wiążą się z ograniczeniami stawów, np. ruch dolnej części ciała powodujący generowanie ruchu górnej części ciała, lub odwrotnie.
Tańce, których ruchy początkowe i końcowe są z góry ustalone.
Tańce, które zaczynają się od ustalonego ruchu, nazywane są kontynuacjami tańca.
Złożony, celowy, ślizgowy kontakt stopy z podłożem jest powszechny w tańcu. Nowa metoda Contact Consistency Loss, która znacznie zwiększa realizm fizyczny, utrzymując jednocześnie ślizg, umożliwia EDGE uczenie się, kiedy stopy powinny się ślizgać, a kiedy nie.
Naukowcy odkryli, że ludzcy obserwatorzy zdecydowanie preferowali tańce generowane przez algorytm EDGE od tych generowanych przez inne algorytmy. Autorzy badania twierdzą, że algorytm EDGE stanowi duży postęp w dziedzinie tańców generowanych komputerowo. Uważają, że algorytm ten może być używany do tworzenia tańców na wydarzenia w świecie rzeczywistym i wirtualnym, takie jak trendy społecznościowe i TikTok, wesela, imprezy lub funkcje korporacyjne.

Przeczytaj więcej o sztucznej inteligencji:
Google AI ogłosiło pierwszy na świecie generator tekstu na muzykę AudioLM
StabilityAI ogłosiło generator muzyki AI Harmonai oparty na modelu dyfuzji tańca
Stabilna dyfuzyjna sztuczna inteligencja tworzy światy snów dla VR i metawersum
Artykuł „Muzyka do tańca: EDGE AI generuje nieskończoną liczbę pomysłów na taniec dla TikToka na podstawie danych audio” ukazał się po raz pierwszy w serwisie Metaverse Post.
