Eine der vielversprechendsten Technologien, die in den letzten Jahren entstanden ist, ist die generative künstliche Intelligenz (KI). Mit der Fähigkeit, Bilder und 3D-Modelle zu erstellen, hat diese Technologie viele Anwendungen und wird in einer Vielzahl von Branchen immer häufiger eingesetzt. In diesem Artikel stellen wir die Welt der generativen KI im Bereich der Bild- und 3D-Modellierung vor und beschreiben die wichtigsten weit verbreiteten Ansätze.

Ein Zweig der künstlichen Intelligenz, der als „generative KI“ bekannt ist, befasst sich mit der Erzeugung neuer Daten aus zuvor gesammelten Informationen. Im Bereich der Bilderzeugung werden generative KIs häufig eingesetzt, um realistische Bilder von Objekten oder Landschaften zu erzeugen. Im Bereich der 3D-Modellierung können sie verwendet werden, um komplizierte Modelle von Strukturen, Maschinen und anderen Objekten zu erstellen.

"AI-assisted Artistry"

Es gibt verschiedene Methoden, mit denen generative KIs bei der 3D-Modellierung und Bilderzeugung arbeiten können. Einer der bekanntesten Ansätze ist das sogenannte „Generative Adversarial Network“ (GAN). Es ist dabei wichtig zu wissen, dass GANs eine Art neuronales Netz sind, das aus zwei konkurrierenden Netzen besteht. Ein Netz erstellt Bilder oder 3D-Modelle, während ein anderes Netz versucht, diese Bilder oder Modelle zu identifizieren und festzustellen, ob sie echt oder künstlich sind. Anschließend wird das Generierungsnetz so trainiert, dass es immer besser wird und versucht, das Trennungsnetz zu übertreffen. GANs haben sich als recht effektiv erwiesen und werden in der Industrie häufig eingesetzt.

Verschiedene Ansätze zur Inhaltsgenerierung

Der „Variational Autoencoder“-Ansatz (VAE) ist eine weitere Strategie. Neuronale Netze, die versuchen zu lernen, wie Daten in einem bestimmten Raum zu verteilen sind, bilden VAEs. Diese Methode wird häufig bei der Bilderzeugung eingesetzt, da sie aus einer kleinen Anzahl von Beispielbildern ein Modell erstellt, das neue, verwandte Bilder erzeugen kann. Der VAE-Ansatz ist sehr hilfreich, wenn nur wenige Daten zur Verfügung stehen.

Der „Neural Style Transfer“ (NST)-Ansatz ist eine weitere Methode zur Bilderzeugung. Dabei handelt es sich um eine Technik, mit der der Stil eines Bildes auf ein anderes übertragen werden kann. Diese Methode wird häufig bei der Erstellung von Kunstwerken angewandt, indem der Stil bekannter Künstler wie Van Gogh oder Picasso auf ein beliebiges Bild übertragen wird.

Selbst die Erzeugung von 3D-Modellen ist möglich

Auch im Bereich der 3D-Modellierung gibt es verschiedene Ansätze. Der Ansatz der Punktwolkenvervollständigung (PCC) ist eine gängige Technik. Das Ziel von PCC ist es, fehlende Teile automatisch zu 3D-Modellen hinzuzufügen, indem das Modell auf der Grundlage bereits vorhandener Daten erweitert wird. Ein weiterer Ansatz ist der „Mesh Generation“ (MG)-An-Ansatz, der ein Netz von Dreiecken zur Beschreibung des 3D-Modells erstellt. Der MG-An-Ansatz wird bereits heute schon bei der Erstellung von 3D-Modellen für Computerspiele oder Simulationen verwendet, auch wenn er noch in den Kinderschuhen steckt.

Der Einsatz von generativen KIs im Bereich der 3D-Modellierung ist auch in der Architektur möglich. Sie können beispielsweise zur automatischen Erstellung realistischer 3D-Modelle von Gebäuden verwendet werden, die dann für die Planung und Visualisierung von Architekturprojekten genutzt werden können. Dies spart Zeit und Geld bei der manuellen Erstellung von 3D-Modellen.

Bilderquellen: Midjourney, https://skybox.blockadelabs.com/

"A 3D model of a cat" as imagined by Midjourney

Fazit

Insgesamt bieten generative KIs in den Bereichen Bilderzeugung und 3D-Modellierung ein breites Spektrum an Vorteilen und Anwendungsmöglichkeiten. Die verschiedenen Ansätze, die wir in diesem Artikel diskutiert haben, zeigen, wie diese Technologie zur Erstellung hochwertiger Bilder und 3D-Modelle eingesetzt werden kann. Daraus lässt sich ableiten, dass generative KIs in Zukunft eine immer größere Rolle in der Industrie spielen werden.

Dabei vermuten wir, dass trotzdem klassische Artists weiter ihren Job behalten werden. KI wird keine Jobs zerstören, sondern neue Jobs für die Anwender*innen schaffen, die sie wissen sinnvoll als Werkzeug einzusetzen.

Ebenfalls noch offen ist die rechtliche Komponente: Viele Algorithmen wurden auf Inhalten trainiert, die deren Autoren nicht freiwillig zur Verarbeitung freigegeben haben. Wie sich die Rechtssprechung in diesem Bereich weiter entwickelt wird sich noch zeigen.