Aufrufe
vor 9 Monaten

DIE FURCHE 28.03.2024

  • Text
  • Menschen
  • Furche
  • Kirche
  • Welt
  • Foto
  • Theologie
  • Zeit
  • Assange
  • Wien
  • Papst

DIE

DIE FURCHE · 13 22 Film/Wissen 28. März 2024 Was ist noch real? Das Kameraauge muss die Realität nicht mehr einfangen, weil diese von der KI synthetisiert wird. So könnten zum Beispiel Fake- Dokumentationen produziert werden, ohne dafür Ausrüstung in entlegene Regionen schleppen zu müssen. Von Adrian Lobe Als die Schauspieler und Drehbuchautoren in Hollywood im vergangenen Jahr in den Streik traten, schwante ihnen bereits, dass mit der Künstlichen Intelligenz (KI) eine Entwicklung auf sie zurast, die sich nicht mehr stoppen lässt. Sie sollten recht behalten. Denn das, woran in den Software-Schmieden der Tech-Konzerne gewerkelt wird, stellt ChatGPT und alles andere in den Schatten. Unlängst öffnete die Entwicklerorganisation Open AI den Vorhang ihres geheimnisumwitterten Labors – und präsentierte einen Text-zu-Videogenerator namens Sora: Ein Werkzeug, das Texteingaben in bis zu 60-sekündige Videoclips verarbeitet (siehe auch S. 23). Die Demo-Videos, die Open AI auf seiner Webseite veröffentlicht hat, sind spektakulär: Eine Frau, die im Neonlicht leuchtender Werbetafeln über eine Einkaufsmeile in Tokio flaniert. Historische Aufnahmen des Goldrauschs in Kalifornien. Oder eine rasante Kamerafahrt hinter einem Jeep, der über die Serpentinen eines staubigen Gebirgspasses düst. Ein Prompt genügt, und der Computer bastelt daraus einen fotorealistischen Clip. Wer braucht da noch Regisseure, wenn es KI gibt? 3D-Welten ohne Filmstudio Im Handumdrehen animiert Sora den Inhalt einer Kaffeetasse zu einem wogenden Meer, in dem Piratenschiffe schippern. Oder erstellt eine Luftaufnahme von der griechischen Insel Santorin, die so echt aussieht, als hätte jemand eine Drohne über dem Touristenort aufsteigen lassen. Der Videogenerator vermag sogar virtuelle Spielwelten (etwa von „Minecraft“) zu simulieren, wofür Entwickler mehrere Wochen benötigten. Die Fachwelt ist verblüfft. Gewiss, KI ist in der Filmbranche nichts Neues. Schon vor 20 Jahren griffen die Macher von „Herr der Ringe“ auf eine Animationssoftware zurück, um detailgetreue Landschaften und Massenkampfszenen, bei denen zehntausende künstliche Agenten aufeinander losgingen, auf die Leinwand zu projizieren. Der neue Videogenerator Sora öffnet das Fenster in eine Zukunft, in der jeder zum Filmemacher wird. Führt das zum Abgesang auf eine alte Welt, die man einst Kino nannte? Wenn die KI die Regie übernimmt Doch der Videogenerator, den Open AI nun aus dem Hut gezaubert hat, ist etwas völlig Neues, weil sich auf Knopfdruck dreidimensionale Welten simulieren lassen – ohne, dass man dafür ein Film- oder Entwicklerstudio bräuchte. „ Auf Knopfdruck erstellt Sora eine Luftaufnahme von der griechischen Insel Santorin, die so echt aussieht, als hätte jemand eine Drohne über dem Touristenort aufsteigen lassen. “ Sora basiert auf einem Diffusionsmodell, wie man es von Bildgeneratoren wie DALL-E kennt: Diese Modelle „verrauschen“ ein Originalbild, bis ein Algorithmus lernt, dieses Rauschen Schritt für Schritt zu entfernen und dabei ein neues Bild erzeugt. So entsteht eine Cut-up-ähnliche Schnitttechnik, bei der Fotos neu abgemischt werden. Im Gegensatz zu statischen, zweidimensionalen Bildern gestaltet sich die Darstellung von Videos aber deutlich komplexer, weil hier Gegenstände auch in der dritten Dimension aus verschiedenen Perspektiven repräsentiert werden müssen. Jeder „Frame“ muss einzeln bearbeitet werden. Der Autor Dan Shipper hat die digitale Schnitttechnik mit dem Ausrollen einer Filmrolle verglichen, bei der man mit einem Spezialmesser „Frame“ für „Frame“ ein kleines Stück in der Form einer Amöbe herausschneidet – und dieses feinsäuberlich mit einer Pinzette herauslöst, bis man einen Stapel von hundert mehrfarbigen Amöben-Schnipseln vor sich hat. Diesen Zellophan-Turm würde man durch einen Filmprojektor laufen lassen, der nur einen winzigen Ausschnitt des Films zeigt – als würde jemand seine Hand vor die Linse halten. Dieser Stapel würde schließlich zu einem Videoschnipsel, einem sogenannten „Patch“, komprimiert. Ganz ähnlich sind die Entwickler von Open AI vorgegangen: Nur, dass sie keine Filmrollen ausgeschnitten haben, sondern digitale Videosequenzen. Und zwar sehr viele. Sora wurde mit Millionen von Videoschnipseln gefüttert. Was die Bildquellen sind, ist Spekulation und könnte Gegenstand urheberechtlicher Streitigkeiten werden. So wie bei ChatGPT, wo Open Foto: iStock/fredmantel AI von prominenten Schriftstellern wie Jonathan Franzen und John Grisham verklagt wurde. Fürs Erste durften nur ausgewählte Künstler und Entwickler mit dem Tool experimentieren; Open AI hält seine Schöpfung wegen des Missbrauchspotenzials noch für zu gefährlich, um es der breiten Öffentlichkeit zur Verfügung zu stellen. Oder ist es nur ein Bluff, weil das Werkzeug doch nicht so mächtig ist, wie es von den Entwicklern und ihren Spindoktoren in sozialen Medien gemacht wird? In der Tat gibt es noch einige Limitationen. So hat Sora Schwierigkeiten damit, physikalische Zusammenhänge korrekt darzustellen. Da tritt etwa bei einem umfallenden Wasserglas die Flüssigkeit aus, bevor das Glas gekippt ist. Diese Unzulänglichkeiten haben auch damit zu tun, dass die KI noch keine physikalischen Gesetze kennt und kein Raumverständnis hat. Der Videogenerator sei „noch nicht bereit für die ‚Primetime‘“, so das Urteil von Bloomberg. Doch die Modelle werden mit der Zeit immer besser. Und wenn die KI in der Lage ist, Bilder nicht nur zu Kurzclips, sondern zu Filmen zu verkleben, könnten die Grenzen von Realität und Fiktion endgültig verschwimmen: Cyber-Agitatoren könnten mit dem Werkzeug täuschend echte „Deepfakes“ produzieren und die öffentliche Meinung manipulieren, und Möchtegern- Filmemacher könnten Fake-Dokumentationen produzieren, für die sie schon gar keine schwere Kamera-Ausrüstung mehr in entlegene Regionen der Welt schleppen müssten. Das Kameraauge muss die Realität nicht mehr einfangen, weil diese von der KI einfach synthetisiert wird. Propheten der Digitalmoderne „Wir haben die reale Welt abgeschafft“, unkte bereits der französische Philosoph Jean Baudrillard in seinem Werk „Die Intelligenz des Bösen“ (2004). In der „integralen Realität“ von Bildschirmen, Internet und virtueller Realität sei das Original von der Kopie nicht mehr unterscheidbar. Der 2007 verstorbene Prophet der Digitalmoderne hat die Entwicklungen der Künstlichen Intelligenz nicht mehr miterlebt. Doch für seine postmodernen Schüler ist Sora der untrügliche Beweis dafür, dass wir in einer Simulation leben. Nur: Wer schreibt das Drehbuch? Hat das Kino noch eine Zukunft, wenn bald jeder selbst Filme machen kann? Das Ende des Kinos wurde ja schon oft herbeigeraunt, und neue Technologien haben in der Geschichte immer Ängste, manchmal sogar Panik ausgelöst. Als die Brüder Lumière 1895 im Grand Café in Paris ihren Kurzfilm „L‘Arrivée d‘un Train en gare de La Ciotat“ vorstellten – die Vorführung gilt als Geburtsstunde des Kinos – rannten die Zuschauer in der ersten Reihe nach hinten, weil die übergroß erscheinende Lokomotive auf der Leinwand auf sie zuraste. Das Publikum musste sich erst an die neuen Dimensionen gewöhnen. Der französische Filmtheoretiker Jean Epstein beschrieb in seinem Werk „L‘Intelligence d‘une machine“ (1946) den Cinematographen als einen – technisch noch unvollendeten – „intelligenten Roboter“, der im Gegensatz zu Apparaturen wie dem Teleskop menschliche Sinne nicht nur erweitert, sondern eine eigene Form des Denkens schafft. Sind KI-basierte Videogeneratoren die Vollendung dieser Bildaufzeichnungsmaschinen? Wenn man auf der Webseite, auf der Open AI seine Demo-Videos vorstellt, herunterscrollt, findet sich dort ein Abspann mit den beteiligten Protagonisten – so wie man es von Kinovorstellungen kennt. Es liest sich wie der Abgesang auf eine alte Welt.

DIE FURCHE · 13 28. März 2024 Wissen 23 Technologien zur Manipulation von Bildern und Videos wirken immer realistischer – und sind heute schon leicht zugänglich. Was bedeutet die Einführung von Sora, der bislang bekanntesten KI-Videosoftware? Eine Erkundigung beim Technikfolgen-Experten Stefan Strauß. „Prompts“ in polarisierter Zeit Von Sebastian Rosenauer Zuletzt geriet ein Video von Prinz William und Prinzessin Kate beim Einkauf nahe Schloss Windsor in die Schlagzeilen: Ist es echt? Die Frage war berechtigt, denn Videoinhalte sind mittlerweile leicht zu manipulieren. Nachdem das amerikanische Software-Unternehmen OpenAI 2022 mit dem Sprachprogramm ChatGPT weltweit für Aufsehen gesorgt hatte, folgte heuer im Februar der nächste Streich: Öffentlichkeitswirksam stellte der KI- Entwickler Sora vor, ein Programm zur Generierung realistischer Videos auf Basis von Texteingaben, sogenannter „Prompts“. Labradore, die im Schnee spielen, ein Astronaut mit roter Strickhaube oder eine Frau, die im gleißenden Neonlicht einer futuristischen Großstadt die Straße entlang spaziert. Die Qualität der Videos ist beeindruckend; die neue Technologie wirkt faszinierend und beängstigend zugleich (siehe auch Seite 22). Für Stefan Strauß, Senior Scientist am Institut für Technikfolgenabschätzung der Österreichischen Akademie der Wissenschaften (ÖAW), ist der Hype um Sora jedoch vor allem auf die Medienstrategie des Herstellers zurückzuführen: „Ich würde die vorsichtige These aufstellen, dass OpenAI vordergründig eher eine Marketing- Firma als ein KI-Unternehmen ist“. OpenAI sei nicht der einzige Anbieter auf dem Markt, sondern schlicht der sichtbarste. Enormes Missbrauchspotenzial Der Zeitpunkt der Veröffentlichung gibt jedenfalls zu denken: im Herbst steht mit der Präsidentschaftswahl in den USA ein besonders heikler politischer Akt bevor. Schon bei ChatGPT warnten Experten vor dem enormen Missbrauchspotential. Video-Inhalte ermöglichen jedoch eine ganz andere Dimension der Wahrheitsverzerrung. Zwar hat OpenAI technische Hürden eingebaut, um Missbrauch vorzubeugen, „aber es gibt Mechanismen diese zu umgehen“, weiß Stefan Strauß. OpenAI könne nicht garantieren, dass ihre Technologie nicht missbräuchlich genutzt wird. Sinnvolle Anwendungsgebiete für KI-generierte Videos sind jedenfalls vielseitig. Werbeagenturen können sich viel Geld sparen, Künstler und Künstlerinnen neue Ausdrucksformen finden und konventionelle Medien können nach Bedarf Archiv- und Symbolmaterial generieren. Diese harmlosen Anwendungen führen nicht zwangsläufig zu einer neuen Realität alternativer Fakten. Strauß ruft zur Nüchternheit auf: „Wir leben noch nicht in der Desinformationsapokalypse“. Sora ist ein weiteres Werkzeug, um artifizielle Videos zu generieren, aber die Probleme sind nicht unbedingt neu. Die Sora-Videos wirken beeindruckend, aber bei genauerem Hinsehen erkennt man die gleichen Fehler wie auch bei KI-generierten Bildern: zum Beispiel Hände mit Foto: iStock / Tero Vesalainen sechs Fingern, verzerrte Gesichter und physikalische Ungenauigkeiten. „Videomanipulation ist nicht neu, jetzt nur einfacher. Wichtiger als das Tool ist aber der Umgang mit der Problematik an sich“, erklärt Strauß. Zwischen apokalyptischen Visionen und transhumanistischer Heilsvorstellung müsse es Raum für einen Mittelweg geben: „Wir müssen besser verstehen, wie diese Technologien funktionieren und was KI eigentlich bedeutet“, so Strauß, „Extrempositionen helfen niemandem“. Für den Technikfolgen-Forscher sind sie auch ein Zeitgeistphänomen: „Wir leben in einer stark polarisierenden Zeit und deswegen wäre es umso wichtiger, mehr Differenziertheit zu entwickeln“. Gesetzliche Herkulesaufgabe Um diese Technologie aber verantwortungsvoll zu nutzen, braucht es laut Strauß eine gesellschaftliche Debatte, „etwa eine Diskussion über eine Kennzeichnungspflicht von KI-generierten Inhalten“. OpenAI versieht zwar jedes Video mit einem kleinen Wasserzeichen, dieses sei aber unzureichend. „KI-generierte Inhalte sollten nicht nur von Profis, sondern für jeden einfach erkennbar sein. Das trägt zu mehr Klarheit bei der Informationsvalidierung bei“, erklärt Strauß. Mit dem AI-Act bringt die Europäischen Union (EU) gerade den ersten umfassenden KI-Rechtsakt weltweit auf den Weg, eine Herkulesaufgabe. Der risikobasierte Ansatz, wonach KI-Technologien nach ihrem Gefahrenpotential reguliert werden sollen, verspricht Schutz für Konsumenten und Rechtssicherheit für Unternehmen. Doch die Kategorisierung einzelner Anwendungen entpuppt sich als schwierig. „ Ich würde die vorsichtige These aufstellen, dass OpenAI vordergründig eher eine Marketing-Firma als ein KI-Unternehmen ist. “ Technikforscher Stefan Strauß Generative KI wie Sora, ChatGPT oder andere Tools, die Inhalte erzeugen können, werden im Gesetz bisher nicht klar thematisiert. „Es sind genau jene Technologien, die in der Öffentlichkeit am meisten Aufregung und Angst auslösen. Aber man weiß nicht, in welche Risikoklasse man sie zuordnen will“, sagt der Wiener Experte. Eine Erklärung für das zögerliche Vorgehen könnte die Sorge der EU sein, mit neuen Gesetzen innovationshemmend in den Markt einzugreifen. Der Hype um KI scheint weiter zuzunehmen. Doch Stefan Strauß bleibt zurückhaltend: „Es gab immer wieder ‚KI-Winter‘ und es ist nicht ausgeschlossen, dass nächstes Jahr wieder eine Stagnation kommt.“ Kultur in der FURCHE Ob in Rauris bei den Literaturtagen oder in Graz bei der Diagonale – DIE FURCHE liefert Ihnen einen ausführlichen Blick und informiert über kulturelle Highlights. Mit einem FURCHE-Abo erhalten Sie regelmäßige Updates zu Literatur, Film, Geschichte, Ausstellungen sowie Theater, Architektur und Kunst. Gratis bestellen unter www.furche.at/abo/gratis +43 1 512 52 61 -52 aboservice@furche.at „Deep Fakes“ sind täuschend echt wirkende, manipulierte Bild-, Audio- oder Videoaufnahmen, die mit Hilfe von Künstlicher Intelligenz erzeugt werden. Unter Leitung des Austrian Institute of Technology (AIT) wurde ein neues Forschungsprojekt zu ihrer Erkennung gestartet. Im FURCHE-Essay „Das Leben ein Metaverse“ (14.6.2022) reflektiert Martin Tauss über das Zeitalter der virtuellen Realität und die Geschichte der Sinnestäuschung durch Bewusstseinstechnologien, auf furche.at. Jetzt 4 Wochen gratis lesen online im Navigator seit 1945

DIE FURCHE 2024

DIE FURCHE 2023