🌉 KI-Bilder im Unterricht: DALL-E 2, Midjourney & Co. im Test
Aktualisiert am 08.05.2023
Künstliche Intelligenz (KI) macht auch vor der Erstellung von Bildern keinen Halt. Für Schule und Unterricht ergeben sich hieraus Anwendungsmöglichkeiten, zum Beispiel um Unterrichtsmaterialien aufzupeppen und Sachverhalte anschaulicher darzustellen.
Doch wie gut sind diese KI-Tools? In diesem Blog-Artikel werfe ich einen genauen Blick auf 4 KI-Bildgeneratoren und ihre Einsatzmöglichkeiten im Unterricht.
Von DALL-E 2, Midjourney und Stable Diffusion über Canva Image Generator - ich zeige, welche Tools am besten geeignet sind und wo ihre Grenzen liegen.
⚙️ Kurz und knapp: Was sind Bild-KIs?
Bild-KIs sind Tools, die automatisch Bilder generieren oder verändern können. Sie lernen aus einer Datenbank von Millionen von Bildern, um neue Bilder mit ähnlichem Stil und Merkmalen zu erstellen. Die meisten KI-Bildgeneratoren verwenden Deep-Learning-Modelle, um komplexe Zusammenhänge zwischen den Bildern zu erkennen und zu reproduzieren.
Bild-KIs können realistisch aussehende Bilder erstellen, ohne fortgeschrittene Kenntnisse in der Bildbearbeitung zu haben.
🧑🏫 KI-Bilder im Unterricht einsetzen
KI-Bilder und KI-Bildgeneratoren können im Unterricht auf verschiedene Arten eingesetzt werden.
Damit lassen sich natürlich Unterrichtsmaterialien aufhübschen und Sachverhalte anschaulicher darzustellen. Es können beispielsweise realistisch aussehende Bilder von Situationen, Ereignissen oder Orten erstellt werden, um den Unterrichtsstoff für die Schülerinnen und Schüler greifbarer zu machen. In diesem Zuge können auch fiktive Figuren oder Gegenstände kreiert werden.
Abbildungen können dann im Rahmen von Bildbeschreibungen und Interpretationen verwendet werden, als Gedankenstütze dienen oder zur Anregung der Kreativität für die Schüler:innen herangezogen werden. Weiter is es denkbar, mit den Schüler:innen Szenen, etwa für Rollenspiele oder Drehbücher zu erstellen.
Je nach Unterrichtsfach sind natürlich noch viele weitere Einsatzmöglichkeiten denkbar. Vor allem im allgemeinbildenden Bereich sehe ich hier viel Potenzial in den Fächern Deutsch, Geschichte oder Kunst.
🌌 DALL-E 2, Midjourney, Stable Diffusion und Canva Image Generator im Test
Für den Test möchte ich Abbildungen zur Veranschaulichung von betrieblichen Handlungssituationen erstellen lassen.
Dazu lasse ich also mit den Bild-KIs DALL-E 2, Midjourney, Stable Diffusion und Canva Text to Image jeweils Ergebnisse mit genau diesem Prompt erzeugen:
“Erstelle ein Bild mit zwei Personen in förmlicher Kleidung (Anzug, Hemd, Blazer), die sich in einem Büro die Hand geben. Stil: realistisch”
🎆 DALL-E 2
Zunächst ziehe ich DALL-E 2 heran, die Bild-KI vom ChatGPT-Erfinder OpenAI. Es wird wie bei ChatGPT eine Anmeldung mit E-Mail-Adresse und Telefonnummer vorausgesetzt. Danach werden dann über das Chat-Fenster die Befehle zur Bilderstellung eingegeben. Pro Monat erhält man 15 kostenlose Credits für die Generierung von Bildern, was für 60 Bilder ausreicht. Weitere Credits können zugekauft werden.
Nun lasse ich DALL-E 2 das Bild mit dem vorgestellten Prompt erstellen.
Was ist zu erkennen? Auf allen Bildern tragen die Personen förmliche Kleidung und es ist auch eine Büro-Umgebung zu erkennen. Auf vielen Bildern ist jedoch leider kein eindeutiges Händeschütteln zu ersichtlich.
Auch bei den Händen selbst und bei den Gesichtern der Personen sind Fehler zu ersichtlich. Mal sitzt die Hand nicht an der richtigen Stelle, mal sind die Finger unsauber dargestellt.
Die Ergebnisse sind für mich dennoch brauchbar, sofern ich die Bilder nur zur Veranschaulichung einer beruflichen Handlungssituation heranziehe und die Abbildung nicht zentraler Bestandteil meiner Unterrichtseinheit ist.
Bing, die Suchmaschine von Microsoft, bietet nun mit Bing Image Creator auch eine Bild-KI an. Es handelt sich dabei um eine erweiterte Version des von OpenAI entwickelten DALL-E-2-Modells. Für die Nutzung ist ebenfalls eine Anmeldung erforderlich. Bing Image Generator versteht zur Zeit nur Englisch. Die Ergebnisse sind mit denen von DALL-E 2 vergleichbar.
🌅 Midjourney
Um die Bild-KI Midjourney zu nutzen braucht man zunächst eine Konto bei Discord. Discord ist eigentlich eine Chat-App aus dem Gaming-Bereich. Man nutzt für Midjourney dann einen Discord-Channel von Midjourney, um dort Abbildungen erstellen zu lassen.
Mit dem Befehl “/imagine” kann man dann in dem Chatfenster den Prompt formulieren.
Midjourney lässt sich mittlerweile leider nicht mehr kostenlos nutzen. es ist direkt Abo notwendig. Mit dem Abo erhält man dann auch Zugriff auf die neueste Version 5.
Die Ergebnisse haben den typischen, künstlichen Look von Midjourney Version 4. Bei den Ergebnissen ist überall deutlich die Büro-Umgebung und Personen in förmlicher Kleidung zu erkennen.
Leider war es auch nach mehreren Versuchen nicht möglich, Abbildungen zu erzeugen, in denen sich die Personen die Hände schütteln.
Daraufhin habe ich den Befehl dann in Englisch formuliert und Ergebnisse erhalten, bei denen die Personen sich tatsächlich die Hand geben. Die Ergebnisse haben weiterhin den typischen Look, sind aber auf den ersten Blick fehlerfrei.
Die Ergebnisse lassen sich nun für den Unterricht super nutzen, sofern man mit dem speziellen Look von Midjourney kein Problem hat.
Es empfiehlt sich, die Befehle in Englisch zu formulieren, um so nochmal treffsicherere Ergebnisse zu bekommen.
Leider wirkt die Anmeldung und Anwendung über den Discord-Channel insgesamt etwas umständlich.
Version 5 von Midjourney liefert nochmal wesentlich bessere Ergebnisse als die Version 4 und gilt allgemein als die beste Bild-KI. Es lassen sich damit auch richtig gute, nahezu fotorealistische Abbildungen erstellen (siehe Bild unten rechts). Hände und Gesichter werden öfter richtig dargestellt und auch die Büroumgebung ist gut getroffen.
Die Version 5 lässt sich nur mit dem Abo für monatlich 10 Dollar nutzen. Damit lassen sich dann 200 Abbildungen pro Monat erstellen.
🎇 Stable Diffusion
Der KI-Bildgenerator Stable Diffusion ist ein Open-Source-Programm. Es ist ist ohne Anmeldung und kostenlos nutzbar. Die Befehle werden in dem Bereich “Playground” eingegeben.
Auch bei diesen Ergebnissen sind wieder deutlich eine Büroumgebung und Personen in förmlicher Kleidung zu erkennen. Bei Fingern und Gesichtern sind jedoch deutliche Fehler zu sehen.
Nach mehrmaligem Testen habe ich herausgefunden, dass auch bei Stable Diffusion Befehle in englischer Sprache die besseren Ergebnisse liefern.
In Summe sind die Bilder von Stable Diffusion jedoch weiterhin fehleranfälliger als bei den anderen Bild-KIs.
Was mir ebenfalls aufgefallen ist: Stable Diffusion scheint zumindest bei meinem Bild-Befehl anfällig für Stereotype und Vorurteile zu sein. Ich habe den Befehl insgesamt 10 Mal eingegeben und Bilder generieren lassen. Nur auf 5 von 40 Bildern waren Frauen abgebildet.
🌄 Canva Image Generator
Der Canva Image Generator ist die Bild-KI von Canva. Wer Canva nicht kennt: Canva ist ein Online-Grafikdesign-Tool, mit sich schnell und einfach Designs für verschiedene Zwecke erstellen lassen, wie z.B. Präsentationen, Plakate, Unterrichtmaterial und vieles mehr.
Auch für Canva ist eine Anmeldung erforderlich, die Nutzung ist jedoch kostenlos.
Zur Nutzung muss man in der Seitenleiste unter Apps den Bereich “Text to Image” auswählen.
Dort kann man dann den Befehl für das zu erstellende Bild eingeben. Die Ergebnisse:
Die Ergebnisse können sich in meinen Augen sehen lassen.
Förmliche Kleidung und eine Büroumgebung sind gut getroffen. Die Gesichter und Hände sind gut gelungen. In jedem Bild ist ein Handschlag zu sehen. Die Erstellung dauerte jeweils weniger als 10 Sekunden.
Die Bilderstellung direkt in Canva ist ein zusätzlicher Vorteil für alle, die ihr Unterrichtsmaterial sowieso schon direkt in Canva erstellen.
⭐️ Fazit.
Beeindruckend, aber nicht ohne Schwächen
Die getesteten Bild-KIs beeindrucken, haben aber noch Schwächen. Dieser Test ist natürlich nicht repräsentativ, eine gewisse Fehleranfälligkeit war aber bei fast allen Bild-KIs zu erkennen.
Vor allem bei Händen und Gesichtern treten noch viele Fehler auf, was besonders bei DALL-E 2 und Stable Diffusion deutlich wurde.
Zu beachten ist auch, dass Stereotype und Vorurteile reproduziert werden können, was vor allem bei Stable Diffusion auffällig war.
Die vorgestellten Tools lassen sich größtenteils kostenlos nutzen, einige Tools wie Midjourney oder DALL-E 2 beschränken jedoch die Anzahl der Ergebnisse, die erzeugt werden können. Wenn man die Tools häufiger nutzen möchte, muss das bedacht werden.
Die Bild-KIs liefern insgesamt bessere Ergebnisse, wenn man die Befehle auf Englisch formuliert.
Werde ich Bild-KIs für Schule und Unterricht nutzen?
Ja, durchaus! Ich kann mit den Fehlern für meine Einsatzzwecke leben, weil ich die Bilder aktuell hauptsächlich zur Veranschaulichung meiner Unterrichtsmaterialien nutze.
Sind die erzeugten Abbildungen zentraler Bestandteil einer Unterrichtseinheit, können die Bildfehler natürlich mehr ins Gewicht fallen.
Und welche Bild-KI ist nun die Beste für den Unterricht?
Die besten Ergebnisse für meine Einsatzzwecke liefert eindeutig der Canva Image Generator. Bei dieser Bild-KI sind die wenigsten Fehler aufgetreten und ich könnte ein Großteil der Abbildungen direkt für den Unterricht nutzen.
DALL-E 2 fällt für mich vor allem wegen der Einschränkung von 15 Bildern pro Monat etwas ab, auch wenn ich die Ergebnisse grundsätzlich zufriedenstellend finde.
Ähnlich verhält es sich mit Midjourney und der Begrenzung auf 25 Bilder. Erst mit einem Abo kann man das volle Potenzial der Bild-KI ausschöpfen - dann allerdings auch mit Zugriff auf die Version 5, der wohl zur Zeit besten Bild-KI auf dem Markt.
Für Stable Diffusion spricht bei aller Kritik an den Ergebnissen die Nutzung ohne vorherige Anmeldung. Hieraus ergeben sich mitunter Einsatzmöglichkeiten für den Unterricht. Auch die Anfälligkeit für Stereotype und Vorurteile lässt sich im Unterricht aufgreifen und diskutieren.