Aktuelles

Beeindruckende Bilder aus Skizzen und Text - eine neue Meta-KI macht's möglich

Make-A-Scene generiert fotorealistische Bilder aus Text und SkizzenMeta Platforms Inc. hat ein neues "generatives System der künstlichen Intelligenz" vorgestellt, welches  Digitalkünstlern (und nicht nur denen) helfen soll, ihre Visionen umzusetzen und ihre Kreativität besser zu präsentieren.

Das System mit dem Namen "Make-A-Scene" soll zeigen, wie künstliche Intelligenz jeden in die Lage versetzen kann, künstlerische Fantasien zum Leben zu erwecken. Der Benutzer kann seine Vision einfach durch eine Kombination aus Textbeschreibungen und Freiformskizzen beschreiben und illustrieren - die KI generiert aus diesen Angaben eine beeindruckende, fotorealistische Darstellung.

Wie das Unternehmen in einem Blogbeitrag erklärt, wird generative KI bereits von einer Reihe von Künstlern eingesetzt, um ihre Kreativität zu steigern. Beispiele dafür sind ausdrucksstarke Avatare, die Animation von Kinderzeichnungen, die Schaffung virtueller Welten im Metaversum und die Produktion digitaler Kunstwerke, die nur textbasierte Beschreibungen verwenden. Die bestehenden Systeme sind jedoch noch recht einfach und geben den Künstlern kaum Kontrolle über das Endergebnis.

Das Problem ist, dass sie hauptsächlich textbasiert sind. Eine Textaufforderung wie "ein Bild von einem Zebra auf einem Fahrrad" kann auf viele Arten interpretiert werden. Die KI könnte das Zebra auf die linke oder rechte Seite des Bildes setzen, oder es könnte viel größer oder kleiner als das Fahrrad sein. Es könnte der Kamera zugewandt oder seitlich sein. Ein Großteil der bisher verwendeten generative Prozesse ist rein zufällig.

"Es reicht jedoch nicht aus, dass ein KI-System einfach nur Inhalte generiert", erklärt das Forschungsteam von Meta AI. "Um das Potenzial der KI zur Förderung des kreativen Ausdrucks auszuschöpfen, sollten die Menschen in der Lage sein, die von einem System generierten Inhalte zu gestalten und zu kontrollieren. Zudem sollte es intuitiv und einfach zu bedienen sein, damit die Menschen die für sie am besten geeigneten Ausdrucksformen nutzen können, sei es Sprache, Text, Gesten, Augenbewegungen oder sogar Skizzen, um ihre Visionen in den für sie am besten geeigneten Medien zum Leben zu erwecken, einschließlich Audio, Bilder, Animationen, Video und 3D."

An diesem Punkt setzt Make-A-Scene an und ermöglicht es Künstlern, sowohl Textbefehle als auch einfache Skizzen zu verwenden, um ihre Visionen genauer an die KI zu vermitteln. Das System arbeitet wie andere generative KI-Modelle und lernt die Beziehung zwischen Bildern und Text durch Training an Millionen von Beispielbildern.

Nach dem Training verwendet Make-A-Scene eine neuartige Zwischendarstellung, um das Layout der Szene in einer groben Skizze zu erfassen, und konzentriert sich dann auf das Ausfüllen der Details auf der Grundlage der Texteingabeaufforderungen. Das Programm wurde außerdem so trainiert, dass es sich auf Schlüsselaspekte des Bildmaterials konzentriert, die für den Ersteller wahrscheinlich wichtiger sind, wie z. B. Tiere, Menschen oder Objekte. Das Ergebnis ist, dass die Benutzer eine viel größere Kontrolle über das Bild haben, welches von der künstlichen Intelligenz erstellt wird.

Make-A-Scene wurde bereits von einer Reihe bekannter KI-Künstler ausgiebig getestet, darunter Sofia Crespo, Scott Eaton und Alexander Reben.

Laut Meta ist Make-A-Scene Teil eines umfassenderen Forschungsprojekts, das darauf abzielt, verschiedene Möglichkeiten zu erforschen, wie KI die Kreativität fördern kann, z. B. indem 2D-Skizzen zum Leben erweckt oder natürliche Sprache verwendet wird, um 3D-Objekte oder sogar einen ganzen virtuellen Raum zu erstellen.

"Es könnte eines Tages völlig neue Formen des KI-gestützten Ausdrucks ermöglichen und dabei die Schöpfer und ihre Visionen in den Mittelpunkt des Prozesses stellen - sei es ein Art Director, der Ideen für seine nächste kreative Kampagne entwickelt, ein Social-Media-Influencer, der personalisierte Inhalte erstellt, ein Autor, der einzigartige Illustrationen für seine Bücher und Geschichten entwickelt, oder jemand, der einen lustigen, einzigartigen Gruß zum Geburtstag eines Freundes mitteilt", so die Forscher von Meta AI. "Tools wie dieses werden für Kreative großartig sein, wenn sie immersive 3D-Welten entwickeln." ist auch Meta Chief Executive Mark Zuckerberg überzeugt.

Foto: Meta AI

16.07.2022

RSS Newsfeed
Alle News vom TAGWORX.NET Neue Medien können Sie auch als RSS Newsfeed abonnieren, klicken Sie einfach auf das XML-Symbol und tragen Sie die Adresse in Ihren Newsreader ein!