A16Z: Möglichkeiten für generative KI im Gaming

Autor: James Gwertzman und Jack Soslow
Zusammengestellt von: Alpha Rabbit
 
A16Z hat kürzlich einen sehr interessanten Artikel geschrieben, in dem es um die Möglichkeiten geht, generative KI und Spiele zu kombinieren. Der Autor hat einen Teil des Inhalts übersetzt und kommentiert. Der Artikel besteht aus zwei Hauptteilen: Der erste Teil enthält die Beobachtungen und Vorhersagen von A16Z zur generativen KI im Spielbereich. Der zweite Teil enthält die Beurteilung von A16Z zur Marktökologie im Bereich Spiel und generative KI.
Vorwort
Welcher Zusammenhang besteht zwischen dem Bereich Gaming und generativer künstlicher Intelligenz? Im Bereich des Spieledesigns gibt es ein unmögliches Dreieck: Normalerweise können nur zwei der drei Punkte, Kosten, Qualität oder Geschwindigkeit, ausgewählt werden. Jetzt können Designer diese AIGC-Tools verwenden, um einen hohen manuellen Produktionsaufwand zu vermeiden Das wirklich Umwälzende an der Erstellung hochwertiger Bilder ist, dass jeder diese kreative Fähigkeit erwerben kann, indem er ein paar einfache Werkzeuge erlernt. Mit diesen Tools können in einer schnellen iterativen Weise endlose Variationen erstellt werden, und sobald sie trainiert sind, läuft der gesamte Prozess in Echtzeit ab, was bedeutet, dass die Ergebnisse fast sofort verfügbar sind. Seit dem Aufkommen der Echtzeit-3D-Technologie gab es keine Technologie, die Spiele so stark verändern könnte (mit Echtzeit-3D-Software kann die gesamte virtuelle Welt schneller digital gerendert werden, was den Benutzern mehr bietet). Anziehungskraft und immersives Erlebnis) Wohin entwickelt sich die generative KI? Wie wird es das Spiel verändern? Schauen wir uns zunächst das Konzept der generativen KI an. Was ist generative KI? Generative KI ist eine Kategorie des maschinellen Lernens, bei der Computer auf der Grundlage von Benutzereingaben/-aufforderungen originelle neue Inhalte generieren können. Derzeit sind die ausgereiftesten Anwendungen dieser Technologie hauptsächlich in den Bereichen Text und Bilder zu finden, aber es gibt ähnliche Fortschritte in fast allen kreativen Bereichen (technische Anwendungen generativer KI), einschließlich Animation, Soundeffekten, Musik und sogar für Menschen mit vollständigen Persönlichkeiten werden erstellt. Künstliche Intelligenz ist im Gaming-Bereich natürlich nichts Neues. Schon in frühen Spielen wie Ataris Pong kämpften computergesteuerte Gegner gegen den Spieler. (Anmerkung des Autors: Atari, ein Spieleentwickler, wurde kurz nach der Geburt des Mikroprozessors gegründet. Das Unternehmen brachte 1972 den ersten Arcade-Automaten Pong auf den Markt und etablierte sich damit als Erfinder von Arcade-Automaten. 1974 kam Apples Steve Jobs zu Atari und war Die virtuellen Gegner in diesen Computern sind jedoch nicht die gleichen wie die generative künstliche Intelligenz, von der wir heute sprechen. Diese Computergegner sind nur Skripte, die von Spieleentwicklern sorgfältig entworfen wurden. aber sie können nicht so gut lernen und iterieren wie die Ingenieure, die sie geschrieben haben. Welche Änderungen ergeben sich also in der zugrunde liegenden Technologie der Kombination aus generativer KI und Spielen? Mikroprozessoren sind schneller, Cloud Computing und verschiedene Rechenfunktionen sind stärker und haben das Potenzial, groß angelegte neuronale Netze aufzubauen, die Muster und Darstellungen in hochkomplexen Bereichen identifizieren können. (Dank schnellerer Mikroprozessoren und der Cloud. Mit dieser Leistung ist es möglich, große neuronale Netzwerke aufzubauen, die Muster und Darstellungen in hochkomplexen Bereichen identifizieren können. Anmerkung des Autors: Dies bedeutet, dass die Fähigkeiten eines einzelnen Mikroprozessors um ein Vielfaches schneller und schneller werden schnellere Mikroprozessoren. Der Skalierungsfaktor des Cloud Computing ermöglicht es der Einrichtung, komplexe Mustererkennung zu unterstützen. Was ist Mustererkennung? Mustererkennung bezieht sich auf die Verarbeitung verschiedener Formen von Informationen (numerische, textuelle und logische Beziehungen), die Dinge oder Phänomene darstellen. und Analyse (Der Prozess des Beschreibens, Identifizierens, Klassifizierens und Erklärens von Dingen oder Phänomenen ist ein wichtiger Teil der Informationswissenschaft und der künstlichen Intelligenz.) Teil 1: Einige Annahmen und Branchenbeobachtungen
 
Einige Annahmen: Lassen Sie uns zunächst einige Annahmen diskutieren, auf denen der Rest des Artikels basiert: 1. Die Zahl der (erfolgreichen) Studien zur allgemeinen künstlichen Intelligenz wird weiter zunehmen und es werden immer effektivere Technologien entstehen. Die obige Zahl zeigt die Anzahl der monatlich in arXiv veröffentlichten wissenschaftlichen Arbeiten zu maschinellem Lernen oder künstlicher Intelligenz. Wie in der Abbildung gezeigt, wächst die Zahl der Arbeiten exponentiell und zeigt keine Anzeichen einer Verlangsamung. Dieser Teil der Daten umfasst nur veröffentlichte Arbeiten. Es gibt auch viele Studien, die nicht öffentlich veröffentlicht werden, sondern direkt auf Open-Source-Modelle angewendet werden Produktforschung und -entwicklung, diese Open-Source-Modelle und -Produkte, haben explosive Innovationen hervorgebracht. 2. Unter allen Unterhaltungskategorien wird Gaming der Bereich sein, der den größten Einfluss von generativer künstlicher Intelligenz haben wird. In Bezug auf die derzeit beteiligten Arten von Assets (2D-Kunst, 3D-Kunst, Soundeffekte, Musik usw.) sind Spiele die komplexeste Unterhaltungskategorie. Gleichzeitig sind Spiele auch die interaktivste, mit einem starken Schwerpunkt auf Echtzeiterfahrung. Dies stellt eine sehr hohe Eintrittsbarriere für neue Spieleentwickler dar und verursacht auch hohe Kosten für die Entwicklung eines echten AAA-Meisterwerks. Diese bestehenden Barrieren und Kostenprobleme haben die Voraussetzungen für die Zerstörung generativer künstlicher Intelligenz im Gaming-Bereich geschaffen riesige Chancen (wie unten gezeigt): Ein Spiel wie „Red Dead Redemption 2“ ist beispielsweise eines der teuersten Spiele, die jemals gemacht wurden. Die Kosten betragen fast 500 Millionen US-Dollar. Red Dead Redemption ist auch ein Spiel mit einem der besten visuellen Effekte auf dem Markt. Die Produktion dauerte fast 8 Jahre und es gibt mehr als 1.000 Spielcharaktere (und jeder Charakter hat seine eigene Persönlichkeit und exklusive Sprachausgabe). Mit einer Spielwelt von fast 30 Quadratmeilen Größe, über 100 Missionen in 6 Kapiteln und fast 60 Stunden Musik, die von über 100 Musikern komponiert wurde, ist die Produktion bei allem, was dieses Spiel beinhaltet, enorm. Nun, wenn wir Red Dead Redemption 2 mit Microsoft Flight Simulator vergleichen, ist Microsoft Flight Simulator ein viel größeres Spiel ... weil Spieler von Microsoft Flight Simulator im Spiel den gesamten Planeten umrunden können, alle 197 Millionen Quadratmeilen.Wie schafft Microsoft also ein so umfangreiches Spiel? Dies geschieht hauptsächlich durch künstliche Intelligenz. Microsoft arbeitet mit blackshark.ai zusammen, um künstliche Intelligenz zu trainieren, um aus zweidimensionalen Satellitenbildern unendlich realistische dreidimensionale Welten zu generieren. Was für ein Unternehmen ist blackshark.ai? blackshark.ai ist ein Unternehmen, das die globale Erdinfrastruktur durch maschinelle Lerntechnologie extrahiert. Es extrahiert Daten aus Satelliten- und Luftbildern auf der ganzen Welt und erstellt mithilfe künstlicher Intelligenz digitale Zwillingsszenarien auf der Grundlage aktueller geografischer Daten Simulation, Mapping, Mixed-Reality-Umgebungen und andere Unternehmenslösungen sowie die Cloud-Computing-Aktualisierungsfunktionen der Technologie selbst können diese Daten in Echtzeit aktualisieren. Dies ist nur ein Beispiel. Ohne den Einsatz künstlicher Intelligenz wäre das Spiel „Microsoft Flight Simulator“ eigentlich nicht realisierbar. Darüber hinaus ist der Erfolg des Spiels darauf zurückzuführen, dass diese Modelle im Laufe der Zeit kontinuierlich verbessert werden können. Beispielsweise kann das Modell „Autobahnkleeblattüberführung“ verbessert werden, wobei künstliche Intelligenz den gesamten Bauprozess steuert Der gesamte Planet im Spiel der Autobahnüberführungen könnte sofort verbessert werden. 3. Jedes Asset, das an der Spieleproduktion beteiligt ist, verfügt über ein generiertes KI-Modell. Bisher sind 2D-Bildgeneratoren wie Stable Diffusion oder MidJourney aufgrund der auffälligen Bilder, die sie generieren können, am beliebtesten Aufregung. Mittlerweile gibt es generative KI-Modelle, die für fast alle Assets in einem Spiel verwendet werden, von 3D-Modellen über Charakteranimationen bis hin zu Dialogen und Musik. (Im nächsten Artikel geht es um die marktökologische Marktkarte bestimmter Unternehmen.) 4. Die Content-Kosten werden weiter sinken, und in einigen Fällen werden die Content-Kosten auf Null sinken, wenn wir versuchen, generative KI-künstliche Intelligenz in die Produktion zu integrieren Szene Wenn man mit Spieleentwicklern spricht, ist die größte Aufregung, dass der Zeit- und Kostenaufwand für die Erstellung von Spielen erheblich reduziert wird. Ein Entwickler erzählte uns, dass die Zeit zum Erstellen einer Konzeptkarte für ein Bild von drei Wochen auf eine Stunde gesunken sei. Wir glauben, dass eine ähnliche „Kostensenkung und Effizienzsteigerung“ im gesamten Spieleproduktionsprozess erreicht werden kann. Es ist erwähnenswert, dass für Künstler keine Gefahr besteht, ersetzt zu werden, was bedeutet, dass Künstler nicht mehr die gesamte Arbeit selbst erledigen müssen: Künstler und Designer können die anfängliche kreative Richtung festlegen und dann den größten Teil der Zeit und Technologie auf die Ausführung verwenden künstliche Intelligenz. Zu diesem Zeitpunkt zeichnen hochqualifizierte „Malexperten“ genau wie die Maler der frühen handgezeichneten Animationen die Umrisse der Animation, und dann erledigen relativ kostengünstige Maler die zeitaufwändige Arbeit des Ausmalens und Füllens des Animationsfilms , aber wir sprechen über Anwendungen im Bereich der Spieleerstellung. 5. Wir befinden uns noch in den Anfängen dieses branchenverändernden Bereichs und es gibt viele Teile, die perfektioniert werden müssen. Trotz der Aufregung vieler Menschen in letzter Zeit stehen wir noch am Anfang. Es gibt noch viel zu tun, bevor wir herausfinden, wie wir diese neue Technologie tatsächlich auf die Gaming-Welt anwenden können, und es werden riesige Chancen für Unternehmen entstehen, die diesen neuen Bereich schon früher und schnell betreten haben. Teil 2: Vorhersagen für die Zukunft Angesichts der oben genannten Annahmen prognostiziert und leitet dieser Artikel ab, wie sich die Spielebranche verändern wird.
1. Das Erlernen der effektiven Anwendung generativer KI kann zu einer marktfähigen Fähigkeit werden.
 Es gibt bereits Pioniere, die generative KI effektiver einsetzen als alle anderen. Um diese neue Technologie optimal nutzen zu können, müssen Sie auch die verschiedenen Werkzeuge und Techniken verstehen und wissen, wie man sie kombiniert. Wir gehen davon aus, dass die effektive Anwendung generativer KI zu einer eigenständigen, vielversprechenden Fähigkeit werden wird, da sie die kreative Vision eines Künstlers mit den technischen Fähigkeiten eines Programmierers verbinden kann. Chris Anderson hat ein berühmtes Sprichwort: „Jeder Überfluss schafft eine neue Knappheit.“ Da die Inhalte immer umfangreicher werden, werden Künstler, die wissen, wie man mit KI-Tools am effektivsten arbeitet, am gefragtesten sein. Zum Beispiel: Der Einsatz generativer künstlicher Intelligenz zur Generierung von Kunstwerken wird auch einige Herausforderungen mit sich bringen, darunter:
Kontinuität wahren: Sie müssen in der Lage sein, verschiedene Assets im Spiel zu ändern oder zu bearbeiten. Für KI-Tools bedeutet dies, dass Sie das (digitale) Asset mit demselben Signal replizieren können, damit wir es ändern und herausfordern können. Dies kann schwierig sein, da dieselbe Eingabeaufforderung zu sehr unterschiedlichen Ergebnissen führen kann.
Behalten Sie einen konsistenten Stil bei: Alle Kunstwerke innerhalb eines einzelnen Spiels müssen einen konsistenten Stil beibehalten, was bedeutet, dass die KI-Tools trainiert oder an den etablierten Stil des Künstlers/Designers gebunden werden müssen.
2. Die Senkung der Hürden bei der Spieleentwicklung wird zu mehr Abenteuern und kreativer Erkundung führen. Wir könnten bald in ein neues „goldenes Zeitalter“ der Spieleentwicklung eintreten, und das liegt nicht nur daran Niedrigere Produktionskosten führen zu geringeren Risiken für Spielehersteller, aber auch, weil diese Tools die Möglichkeit bieten, qualitativ hochwertige Inhalte für ein größeres Publikum zu erstellen. 3. Der allmähliche Aufstieg von „Mikrospielstudios“ mit Unterstützung der künstlichen Intelligenz wird möglicherweise von kleinen „Mikrostudios“ mit nur 1 oder 2 Mitarbeitern rentablere kommerzielle Spiele produzieren. Natürlich sind kleine unabhängige Spielestudios bereits weit verbreitet. Das beliebte Spiel „Among Us“ (Anmerkung des Autors: Among Us ist ein von Innersloth produziertes und veröffentlichtes Strategie-Casual-Game, das von 4-10 Personen online gespielt werden kann. Es wurde veröffentlicht am 17. November 2018. Veröffentlicht am 23. März 2020) wird von Innersloth produziert, einem Studio mit nur 5 Mitarbeitern, und der Umfang der Spiele, die diese kleinen Studios erstellen können, wird nur noch zunehmen.
4. Die Anzahl der jedes Jahr veröffentlichten Spiele wird zunehmen
 Der Erfolg von Unity und Roblox zeigt, dass die Bereitstellung leistungsstarker kreativer Tools dazu führt, dass mehr Spiele entwickelt werden. Generative KI wird die Eintrittsbarrieren weiter senken und mehr Spiele entwickeln. Die Branche leidet bereits unter Entdeckungsherausforderungen – allein im letzten Jahr wurden mehr als 10.000 Spiele zu Steam hinzugefügt – und das wird den Druck auf die Entdeckung noch weiter erhöhen. Allerdings werden wir auch sehen... 5. Es werden neue Spieltypen erstellt. Es werden neue Spieltypen erfunden, wie der oben erwähnte Microsoft Flight Simulator, aber auch völlig neue Spieltypen, die mit der Echtzeitgenerierung neuer Inhalte kombiniert werden. Das RPG-Spiel Arrowmancer von Spellbrush beispielsweise verfügt über Charaktere, die durch künstliche Intelligenz erstellt wurden, was nahezu unbegrenzte neue Spielmöglichkeiten ermöglicht. Einige Spieleentwickler nutzen künstliche Intelligenz, um Spielern die Erstellung eigener Avatare im Spiel zu ermöglichen: Avatar-Bilder werden automatisch basierend auf der Beschreibung des Spielers generiert. Beachten Sie, dass aus Sicht der Benutzererfahrung die Möglichkeit für Spieler, Inhalte mithilfe künstlicher Intelligenz zu generieren, dazu führen kann, dass Spieler eine größere Eigenverantwortung wahrnehmen. 6. Der Wert wird branchenspezifischen KI-Tools zugeschrieben, nicht nur Basismodellen. Die Begeisterung für Basismodelle wie Stable Diffusion und Midjourney führt zu extrem überzogenen Bewertungen, aber da weiterhin neue Forschungsergebnisse auftauchen, werden neue Modelle auftauchen Iteration neuer Technologien. Gemessen am Website-Suchverkehr der drei derzeit beliebten generativen künstlichen Intelligenzmodelle (Dall-E, Midjourney und Stable Diffusion) sind mit jedem neuen Modell spezifische Bedenken verbunden. Ein anderer Ansatz besteht darin, branchenspezifische (vertikale) Tool-Suiten zu erstellen, die sich auf branchenspezifische generative KI-Anforderungen konzentrieren, bestimmte Zielgruppen genau verstehen und sich in bestehende Produktionsszenarien (Unity oder Unreal) integrieren lassen. Ein typisches Beispiel ist Runway, das Videokünstlern mit künstlicher Intelligenz unterstützte Tools wie Videobearbeitung, Greenscreen-Entfernung, In-Painting und Bewegungsverfolgung bereitstellt. Solche Tools können im Laufe der Zeit neue Anwendungsszenarien hinzufügen. Wir haben noch kein Gaming-Tool wie Runway gesehen, aber es ist ein Bereich mit Potenzial. 7. Kommende rechtliche Herausforderungen Allen diesen generativen KI-Modellen ist gemeinsam, dass diese KI-Modelle anhand großer Inhaltsdatensätze trainiert werden, die normalerweise aus Datensätzen im Internet erstellt werden.„Stable Diffusion“ wird beispielsweise anhand von mehr als 5 Milliarden Bildern/Untertiteln trainiert, die aus dem Internet gesammelt wurden. Derzeit behaupten diese Modelle, dass sie nach der Urheberrechtsdoktrin der „fairen Nutzung“ operieren, dieses Argument wurde jedoch nicht ausdrücklich gesetzlich geprüft. Es stehen eindeutig rechtliche Herausforderungen bevor, die die Landschaft der generativen KI verändern könnten. Für große Filmunternehmen ist es möglich, proprietäre Modelle zu etablieren und durch die Vorteile ihrer eigenen Urheberrechte Wettbewerbsvorteile zu erzielen. Microsoft hat beispielsweise viele Studios unter seinem Dach, insbesondere die Übernahme von Activision Blizzard. 8. Wird generative KI im Gegensatz zum Kunstbereich zumindest vorerst große Veränderungen im Programmierbereich mit sich bringen? Software-Engineering ist eine weitere große Kostenquelle bei der Spieleentwicklung, aber die Codegenerierung mit KI-Modellen erfordert mehr Tests und Validierung, sodass die Codegenerierung weniger produktiv ist als die Generierung kreativer Assets. Wir glauben, dass Codierungstools wie Copilot Ingenieuren möglicherweise geringfügige Leistungsverbesserungen bieten, jedoch kurzfristig nicht so stark, da sich Inhaltsbereiche ändern. Teil drei: Einige Empfehlungen 1. Beginnen Sie mit der Erforschung generativer KI: Es wird eine Weile dauern, bis wir herausfinden, wie wir die Leistungsfähigkeit dieser kommenden generativen KI-Revolution voll ausschöpfen können. Unternehmen, die frühzeitig mit dem Ausbau ihres Geschäfts beginnen, werden in Zukunft einen Vorteil haben, und mehrere Studios führen interne experimentelle Projekte durch, um zu untersuchen, wie sich diese Technologien auf die Spieleproduktion auswirken können. 2. Suchen Sie nach Möglichkeiten in Marktlücken. Derzeit sind viele Teile des gesamten Tracks bereits sehr überfüllt, z. B. Animation, Stimme und Dialoge, aber es gibt immer noch viele Bereiche, die weitgehend offen sind. Wir ermutigen Unternehmer, die sich für diesen Bereich interessieren, sich auf Bereiche zu konzentrieren, die noch unerforscht sind, wie zum Beispiel den „Game + Generative AI Track“.