Die Inhalte, die OpenAIs neuer KI-Videogenerator generiert, muss man gesehen haben, um sie zu glauben. Hier ist alles, was wir bisher wissen.
Wieder einmal hat OpenAI das Internet mit einer weltbewegenden KI-Ankündigung aufgemischt – ein KI-Videogenerator namens Sora, der unheimlich lebensechte Videos erstellen kann. Einige der bereits veröffentlichten Beispiele sind kaum von echten Kameraaufnahmen zu unterscheiden.
Sora ist ein Diffusionsmodell mit Transformer-Architektur, was bedeutet, dass sein neuronales Netzwerk ähnlich wie ChatGPT funktioniert . OpenAI hat sich über sein offizielles Veröffentlichungsdatum bedeckt gehalten, sagt aber, dass es den Leuten zeigen möchte, was „am Horizont“ für künstliche Intelligenz zu erwarten ist.
Hier ist alles, was wir bisher über Sora wissen, und warum es bis zur Veröffentlichung des Videogenerators für die breite Öffentlichkeit möglicherweise noch eine Weile dauern wird.
Was ist Sora?
Sora ist ein Text-zu-Video-KI-Modell, das von den ChatGPT-Entwicklern OpenAI entwickelt wurde. „Text-zu-Video“ bedeutet, dass Sora Textansagen entgegennimmt und sie in kurze Videoclips umwandelt. Die von OpenAI diese Woche veröffentlichte Serie ist wirklich atemberaubend. Schauen Sie sich dieses komplett KI-generierte Video eines Oktopus an:
„Sora ist in der Lage, komplexe Szenen mit mehreren Charakteren, bestimmten Bewegungsarten und genauen Details des Motivs und des Hintergrunds zu generieren“, erklärt OpenAI in einem diese Woche veröffentlichten Blogbeitrag , in dem weitere Videos veröffentlicht wurden. „Das Modell versteht nicht nur, wonach der Benutzer in der Eingabeaufforderung gefragt hat, sondern auch, wie diese Dinge in der physischen Welt existieren.“
Wer kann jetzt auf Sora zugreifen?
Sora wird derzeit von Sicherheitsforschern auf Herz und Nieren geprüft. Ihre Aufgabe ist es, vor der Veröffentlichung die Sicherheit der Software zu gewährleisten und „kritische Risiken“ zu bewerten.
OpenAI gibt jedoch an, dass auch eine kleine Gruppe bildender Künstler, Filmemacher und Designer Zugriff auf Sora erhalten hat. Die Namen der an der Testphase teilnehmenden Künstler oder Designer werden nicht genannt.
Einige Insider-Accounts im OpenAI-Forum scheinen anzudeuten, dass irgendwann eine Warteliste eingerichtet wird, auf der man als Erster die Chance hat, darauf zuzugreifen.
Leider gibt es keinen Hinweis darauf, wann wir uns für die Nutzung von Sora anmelden können.
Wann wird Sora der Öffentlichkeit zugänglich sein?
Leider gibt es derzeit noch keinen Veröffentlichungstermin für Sora. Alle Inhalte, die in den letzten 24 Stunden im Internet viral gegangen sind, stammen aus dem von OpenAI veröffentlichten Ankündigungsblog-Beitrag.
Interessanterweise scheint es, als hätte OpenAI nicht einmal einen vagen Hinweis darauf gegeben, wann es allgemein verfügbar sein könnte. Es gibt nicht einmal einen Hinweis darauf, dass es dieses Jahr veröffentlicht wird.
Das ist für eine so große Ankündigung ziemlich ungewöhnlich und könnte darauf hindeuten, dass es noch lange dauert, bis die Veröffentlichung öffentlich wird – aber andererseits gibt OpenAI zu, dass es seine Forschungsergebnisse frühzeitig veröffentlicht. Angesichts der Geschwindigkeit, mit der sich die künstliche Intelligenzbranche in den letzten zwei Jahren entwickelt hat, kann jeder nur raten, wann das tatsächliche Startdatum sein wird.
Was ist das Problem mit Sora?
Wie wir bereits berichtet haben, ist OpenAI noch nicht bereit, Sora der Öffentlichkeit zugänglich zu machen, da man nicht davon überzeugt ist, dass die Videogenerierungstechnologie ausreichend auf Sicherheit getestet wurde. Das ist gut, wenn man die unzähligen ethischen Probleme bedenkt, die mit der Erstellung solch lebensechter Videos verbunden sind – ganz zu schweigen von einem Jahr mit so vielen Wahlen .
„Wir werden mehrere wichtige Sicherheitsschritte unternehmen, bevor wir Sora in den Produkten von OpenAI verfügbar machen.“ „Wir arbeiten mit Red Teamern zusammen – Fachexperten in Bereichen wie Fehlinformationen, hasserfüllte Inhalte und Voreingenommenheit – die das Modell einem Konkurrenztest unterziehen werden“, hieß es weiter.
OpenAI gibt außerdem an, an einem KI-Videoerkennungsklassifizierer zu arbeiten, der identifizieren kann, ob ein Video von Sora produziert wurde oder nicht.
Dies scheint ein ähnlicher Schritt zu sein wie der, der nach der Einführung von ChatGPT unternommen wurde, woraufhin das KI-Unternehmen einen Textklassifizierer auf den Markt brachte . Dieser wurde jedoch später aufgrund seiner Unzuverlässigkeit abgeschaltet. Als wir ihn testeten, um zu sehen, ob er ChatGPT-Plagiate aufdecken konnte , war er nicht einmal in der Lage, von ihm selbst generierte Inhalte zu erkennen.
Wie funktioniert Sora?
„Sora ist ein Diffusionsmodell, das ein Video generiert, indem es mit einem Video beginnt, das wie statisches Rauschen aussieht, und es schrittweise transformiert, indem es das Rauschen in vielen Schritten entfernt“, sagte OpenAI diese Woche.
Die Technologie funktioniert ähnlich wie die GPT-Familie von Sprachmodellen , die dem Chatbot des Unternehmens, ChatGPT, zugrunde liegen. Sie alle verwenden eine „Transformer“-Architektur – eine Art neuronales Netzwerk, das Eingaben entgegennimmt und sie in Ausgaben „umwandelt“. Sie haben auch Elemente von DALLE-3 integriert , wie etwa das System zur Neuuntertitelung.
Mehr lesen: Twitters TweetDeck wird zu einer exklusiven kostenpflichtigen Funktion
OpenAI hat Sora mit Videos und Bildern als Dateneinheiten – oder „Patches“ – gefüttert. „Indem wir die Art und Weise vereinheitlichen, wie wir Daten darstellen“, so OpenAI-Tage, „können wir Diffusionstransformatoren an einem größeren Spektrum visueller Daten trainieren, als dies bisher möglich war, und zwar mit unterschiedlichen Dauern, Auflösungen und Seitenverhältnissen.“
In diesem Blogbeitrag im Forschungsportal des Unternehmens können Sie etwas mehr darüber lesen, wie die KI-Videogenerierungstechnologie von OpenAI funktioniert.