Test KI: Visuell, weil ich dachte, Bilder seien einfacher als Texte

Test: BING IMAGE CREATOR (online mit Microsoft Edge, unter Mac OS 10.15)
Meine Annahme: „Visuelles“ ist einfacher (für mich und die KI) als Text.
Also zuerst Bilder, ab dafür, dann Text.

Spoiler 1: Das ist wie in Twilight Zone: The Movie dt.: Unheimliche Schattenlichter (USA 1983), letzte Szene, Dan Aykroyd als Paramedic dreht sich zum Patienten um und fragt: „Wollen Sie mal was wirklich Gruseliges sehen?“

Achtet auf die Körper und vor allen Dingen Extremitäten. Mitunter fehlt ein Fuß, eine Hand, die Gesichter rauben mir mind. eine Nacht den Schlaf, manche Humanoide sehen aus wie nach 60° und 1.400 U/m.

Spoiler 2: Prinzipiell geht nichts, wo evtl. ein Streifen nackter Haut zu sehen ist, wo ein Toter rumliegt, und irgendwas mit Religion, und Todesstrafe, selbst (s.u.) Badeanzug ist strafbewehrt u.v.m.
Aber Kids, die in Waffengeschäften spielen – das geht! Eben USA …

Aufgabe 1: (ab hier immer der org. Text meiner Eingabe): 1956, Diner, Wüste, Parkplatz mit einem Cabrio
Ergebnis: :astonished: hmm …diese Palmen … diese Typo … und bitte wo sitzt man in diesem Cabrio ?

Aufgabe 2: 1956, Diner, Wüste, Parkplatz mit einer Leiche –>
Ergebnis: ALARM, BÖSER FEHLER (s. Screenshot)
Bildschirmfoto 2023-06-05 um 02.11.27

Aufgabe 3: Tasse Café, Sandwich, auf einem Tisch aus Holz
Ergebnis: :face_vomiting: so wünschen wir uns das: Sandwich in den Kaffee

Aufgabe 4: Tisch in Diner, vor dem Fenster Regen, im Diner Bedienung in Badeanzug –>
Ergebnis: ALARM, BÖSER FEHLER (s. Screenshot)
Bildschirmfoto 2023-06-05 um 02.11.27

Aufgabe 5: Mann wechselt Glühbirne, im Wohnzimmer mit Familie
Ergebnis: :face_with_peeking_eye: abgetrennte Gliedmaßen, vom SUV überrollte Gesichter – aber immerhin lächelnd!

Aufgabe 6: Drei Kinder spielen auf der Straße, im Hintergrund stürzt ein Flugzeug ab –>
Ergebnis: ALARM, BÖSER FEHLER (s. Screenshot s.o.)

Aufgabe 7: Drei Kinder spielen in einem Waffengeschäft –>
Ergebnis: WHAT? Das geht, ja?

Ich habe noch mehr gemacht, aber die Sachen sind noch gruseliger.
Die KI-Ergebnisse erinnern mich an die Stephen King-Verfilmung „Langoliers“ (1995).
Bereits ohne genaues Hinsehen merkt man, dass nichts richtig ist.
Kurz: Da will man nicht sein, niemals.

So, nächster Test: TEXT.

4 „Gefällt mir“

Ich hatte letztens ne Woche Urlaub und hab mir mal einen Monat Midjourney für nen Zehner gegönnt.

Der Held in meiner Fantasystory ist ein neunzehnjähriger Seemann und kakaobraun. Auf Midjourney bin ich gekommen, nachdem ich stundenlang Adobe Stock durchsucht habe (und andere Portale). Hatte einfach mal Lust, zwischendurch an einem Cover rumzuschrauben.

Die Beispielbilder sind noch Midjourney 4. Jedes davon ist besser als alles, was die Stockportale so zu bieten haben. Und selbst für meine Echsenmenschen (Band 2) hatte Midjouney nen Vorschlag, der besser als alles war, was ich mir so selbst ausgemalt habe.

Auch dort kann mal jemand 6 Finger haben. Aber die Ergebnisse sind saugut. Und seit Midjourney 5 und 5.1 brauchst du eigentlich gar keine Stockportale mehr zu durchsuchen. Das Ding erstellt dir ein Bild genau nach deinen Wünschen. Meistens wird es anders, als du es dir dachtest, aber fast immer besser.

Hier ein paar Beispiele aus dem alten Midjourney 4. Nach deren Nutzungsbedingungen hab ich durch mein einmonatiges Abo die Nutzungsrechte an den Bildern erworben. Ich könnte sie also für ein Cover nutzen.



4 „Gefällt mir“

Die beiden habe ich auch ausprobiert. Aktuell schaue ich mir Leonardo.ai an. Ich liebe diesen ganzen KI/AI-Hype. Letzte Woche hatten wir Vorlesungen zu KI und sollten Definitionen zu KI finden. Ich habe die Frage an ChatGPT weitergegeben :joy:

Kein Interesse, selber zu denken.

3 „Gefällt mir“

Halb so wild, der Prof wollte, dass wir uns in einem Forum ein wenig mit dem Thema auseinander setzen. Er selber hält das Ganze für überbewertet.

Liegt durch die Veröffentlichung von KI Bilder eine Urheberrechtsverletzung durch Nutzung von KI-Erzeugnissen vor?. Es werden auch Personen umverfremdet abgebildet, bei denen unklar ist, ob eine Zustimmung zur Vervielfältigung vorliegt.
Ich vermeide strikt die Veröffentlichung von KI oder AI generierten Bildern.

Ich hab das Gefühl, dass Midjourney zumindest alles verfremdet.

Ich hab eine Karte meiner Welt hochgeladen und ihm gesagt „make a roll“. Er hat eine Sushi-Rolle draus gemacht :slight_smile: Darin war aber zu erkennen, dass diese Sushi-Rolle aus einer Landkarte gemacht war. Ich dachte mehr an eine Schriftrolle.

Komm, was solls. Hier sind die Ergebnisse:

Du siehst, dass meine Ursprungskarte, die ich als Basis hochgeladen habe, als Landkarte erkannt und völlig verfremdet wurde. Ich glaube daher nicht, dass dort echte Personen zu sehen sind. Außer du fragst explizit nach Personen des öffentlichen Lebens.


Adobe experimentiert gerade auch mit einem Produkt, das (glaube ich) Firefly heißen wird. Eine Reihe Beta-User hat darauf bereits Zugriff. Ich werde KI-Bilder verwenden. Die Nutzungsbedingungen erlauben das.

ich finde, dass diese KI Bilder eine großartige Möglichkeit sind, eine bildliche Darstellung davon zu bekommen, wie ich Dinge mit Sprache beschrieben habe. Sieht das am Ende so aus, wie ich es gemeint habe? Nein? Dann habe ich es womöglich schlecht beschrieben - zumindest gilt das für midjourney so.

Ich gerate hier häufiger auch in die „Falle“, die notwendige englische Übersetzung nicht genau genug gemacht zu haben - so wie Beispiel von @tomP „roll“ ist für die gemeinte Schriftrolle vermutlich nicht konkret genug und wird schlimmstenfalls mit Brötchen interpretiert;)

Das würde ich so nicht unterschreiben. Aber ich hatte bei meinen vielen Versuchen die Erfahrung machen können, dass ich mir Dinge plötzlich vorstellen konnte. Weil ich keine blöden Orks verwenden wollte, waren meine Bösen zunächst Echenmenschen. Ich stellte sie mir so vor wie die Jem-Hadar von DS9.

Die Bilder, die aber Midjourney daraus gemacht hat, gehen in eine Richtung, in die ich weiterdenken werde. So sehen sie weniger so aus wie verkleidete Menschen. Der Typ unten links könnte mit etwas Arbeit daran zum Covergirl von Band 2 werden.

Nach einer Weile denkst du gar nicht mehr über dein Englisch nach. Denn selbst wenn du etwas falsch ausdrückst, kommt manchmal etwas besseres heraus, als du dir selbst vorgestellt hast. Aber das Ergebnis von „make a roll“ war schon funny :slight_smile:

Und wenn du dir oben die Bilder von meinen „Helden“ ansiehst – da hat sich ein Testleser, der mir auf Facebook folgt „beschwert“, dass er ihn sich gar nicht so hübsch vorgestellt hatte. Richtig. Ich auch nicht :slight_smile:

Ich finde die malerische Darstellung aus Midjourney 4 außerordentlich gelungen für ein paar Versuche. Es wird noch ein paar Monate dauern, bis ich mich ans Cover mache. Aber ich könnte mir vorstellen, dass ich bei v4 bleibe und noch nicht mal v5 nehmen werde.

Wenn ich überlege, dass ich mir einfach nur einen 19-jährigen Seemann, kakaobraun vor nem mittelalterlichen Segelboot als full body gewünscht habe, finde ich es fast schon erschreckend, was Midjourney daraus gemacht hat. Für mich ist jetzt keins der Bilder die Endfassung. Aber ich finde, man könnte trotzdem fast alle verwenden.

1 „Gefällt mir“

Ich hab eine Karte meiner Welt hochgeladen und ihm gesagt „make a roll“. Er hat eine Sushi-Rolle draus gemacht :slight_smile: Darin war aber zu erkennen, dass diese Sushi-Rolle aus einer Landkarte gemacht war. Ich dachte mehr an eine Schriftrolle.

Nun, das dürfte daran liegen, dass Schriftrolle im Englischen „scroll“ und nicht „roll“ heißt :wink:

Aber das Ergebnis ist um einiges witziger, keine Frage :nerd_face:

3 „Gefällt mir“

Die Midjourney Ergebnisse gefallen mir. Das man die Nutzungsrechte an den Bildern erwirbt ist eine gute Lösung.
Der Bing Image Creator erlaubt die Nutzung und Verbreitung zu nicht kommerziellen Zwecken.

Bei Bing Image Creator Bildern mit Personen ist mir aufgefallen, dass diese oft schielen. Die Augen schauen manchmal in unterschiedliche Richtungen.

Irgendwann denkt man über sein Englisch gar nicht mehr nach und tippt einfach irgendwas ein.

Ohne kommerzielle Nutzungsrechte bringt es ja wenig für uns.

Das ist noch das „alte“ Midjourney 4. Mit v5 und v5.1 hat das Ding einen großen Sprung nach vorn gemacht und die Ergebnisse sind wie fotografiert. Aber mein Monatsabo ist ausgelaufen.

Ich weiß aber jetzt, dass ich damit problemlos was hinkriege. Adobe probiert ja auch an was rum, das dann auch Texte besser integrieren kann. Dort hat Midjourney eine Schwäche. Kann also sein, dass die Welt in ein paar Monaten noch ein bisschen bunter aussieht.

1 „Gefällt mir“

Ja die Beta von Firefly läuft. Die Ergebnisse sind gut, aber man muss in der Beschr4eibung sehr ausführlich und genau sein. Aber ist ja auch nur eine Beta und ich bin mir sicher das die Qualität noch steigen wird. Kann gerade keine Bilder zeigen weil ich auf der Arbeit bin.

Es gibt ja Videos in Youtube darüber.

Auf jeden Fall ist das Benutzerinterface einfacher zu bedienen. Ich empfand die Orientierung in Discord für Midjourney schon etwas lästig.

Wenn man überlegt, dass die meisten von uns vor einem Jahr davon noch nie etwas gehört hatten, finde ich die Entwicklung erschreckend schnell. Wenn ich Adobe wäre, würde ich allerdings auch jede Menge Kohle dafür locker machen, denn Adobe Stock ist damit zumindest angezählt.

2 „Gefällt mir“

… dass Midjourney die Nutzungsrechte an den Bildern so großzügig an die User weitergibt, ist sicher erfreulich.

Die eigentliche Frage ist aber doch: HAT man die Nutzungsrechte dann wirklich?

Ich meine, Midjourney und andere Kandidaten aus diesem Bereich erstellen diese Bilder ja aufgrund einer Datenbasis - und neuerdings sogar aufgrund von Echtzeit-Daten aus dem Netz.

Heißt: Irgendwo hat die KI die Informationen oder Bestandteile, die zur Erzeugung eines Bilds benutzt wurden, ja zusammengesucht - oder zusammengeklaut - oder, wie auch immer man das nennen will.

Da ist die Frage nach dem Urheber und nach Copyrights wohl noch ziemlich ungeklärt.

Es gab ja schon Fälle, wo solche KI-erzeugten Bilder zurückgewiesen wurden, weil der Einreicher eben NICHT die Rechte daran hält.

Es ist sicher nur eine Frage der Zeit, bis es zu vielen vielen Rechtsstreitigkeiten kommen wird, weil ein Künstler oder eine Agentur seine bzw. ihre Rechte durch so ein Bild verletzt sieht.

Ein spannendes (und lohnendes) Aufgabenfeld für die (Abmahn-) Anwälte dieser Welt :thinking:

3 „Gefällt mir“

Ich kenne die Diskussion, aber ich teile die Bedenken nicht.

Wenn wir beide Künstler wären und ich würde deinen Stil kopieren, könntest du kaum etwas dagegen tun. Anders wäre es, wenn du eine Marke hättest – z. B. für eine Comicfigur. Die dürfte ich natürlich nicht kopieren.

Ich hatte ja schon mal ein wirklich cooles Video zum Sound von Modern Talking gepostet, das sich keiner angesehen hat :slight_smile: Hier hat jemand einen Song geschrieben, der genauso klingt wie Modern Talking. Das darf er. Und genauso sehe ich es auch bei von KI erstellten Bildern.

Dass das für die betroffenen Künstler ärgerlich ist, ist eine andere Sache.

Nein. Es ist nur eine Frage der Zeit, bis auch Adobe ihr neues Produkt Firefly anbietet, um Bilder über KI zu erstellen. Wenn ein so fetter Player auf dem Markt auftritt, wird sich sicher schnell Sicherheit einstellen.

Wofür willst du genau abmahnen? Dafür, dass jemand ein Männchen stilistisch genauso malt wie du? Müsste man dann nicht auch Marillion abmahnen, weil man sie früher als billige Genesis-Kopie bezeichnet hat? Ganz Amazon ist voll von kopierten Artikeln. Das ist solange kein Problem, wie kein Patent auf einen Artikel besteht.

… an „Männchen“ denke ich dabei natürlich nicht. Es gilt ja zu beachten, dass eine gewisse „Schöpfungshöhe“ (heißt wirklich so) vorhanden ist, um so etwas wie ein Urheberrecht daran zu halten. Dazu muss man das auch nicht patentieren. Es reicht, etwas zu kreieren, das eine ausreichende Schöpfungshöhe hat, und ist damit automatisch der Urheber, der seine Rechte auch einklagen kann.

Es geht dabei auch nicht um Kreationen „im Stil von …“, sondern um Situationen, in denen ein Künstler etwas, das er geschaffen hat, mehr oder weniger (Anwälte!) in so einem KI-Bild wiedererkennt.

Weil - wie gesagt - irgendwo hat die KI die Informationen ja her. Und da niemand weiß, ob sie das intern einfach zusammenkopiert, oder ob da irgendwas anderes passiert, wird es viel Raum für Diskussionen geben.

Es ist einfach ein sehr spannendes Thema, zu dem wir in nächster Zukunft sicher noch richtig viel erleben werden.

3 „Gefällt mir“

Der Clip ist :rofl: :joy:

Nimmt man z.B. das Hundertwasserhaus Wien als KI Befehl gerät man eventuell in einen urheberrechtlichen Konflikt, da die konkrete Ausformung des Bauwerkes aufgrund der Planverfassung des Architekten geschützt ist.