am besten gefiel mir "Der Veitstanz"....ist aber ewig her...lief immer im Darkflower....
am besten gefiel mir "Der Veitstanz"....ist aber ewig her...lief immer im Darkflower....
Hier lang, bittesehr: https://www.civforum.de/showthread.p...ier-ein-Schuss
Seit einiger Zeit sind KI-Song-Generatoren erschreckend wenig scheiße. Als jemand, der zwar Spaß am Liedermachen hat, die Lust daran aber meist verliert, bevor sie fertig sind eigentlich genau richtig. Die letzten Wochen hab ich immer wieder mit https://suno.com/ herumgespielt, um herauszufinden, was geht und was nicht.
Ein Ergebnis davon war dieses seinerzeit nicht näher kommentierte Siegeslied meiner Karlsruhe Cannoneers in der CiFo Feldball Liga (https://www.civforum.de/forumdisplay...eldball-Liga):
Im Grunde ist das sehr einfach: man gibt einen Prompt ein (200 Zeichen) und die KI generiert Lyrics samt Song. Beim Herumspielen habe ich aber schon mehr herausgefunden:
- Die Songs sind eher kurz (~2min); man kann zwar Lieder "erweitern", diese aber nicht sinnvoll miteinander kombinieren
- Damit ein Song über 2min einigermaßen gut funktioniert, braucht es mehrere Versuche. Häufig...
- ...verkackt die KI den Einstieg (und ignoriert beispielsweise die ersten 1-2 Zeilen)
- ...verliert sie sich in instrumentalem Gedudel und hat dann nicht mehr genug Zeit für den ganzen Songtext
- ...sind die Strukturen sehr repetitiv (Verse, Verse, Chorus)
- ...rafft sie nicht, dass z.B. zwei Strophen den gleichen Rhythmus haben
- Mit deutschen Lyrics kommt sie nicht sonderlich gut klar. Sie hat manchmal durch Zufall interessante Ideen, aber kein "Gefühl" für die Sprache. Ein Beispiel aus einem Lied, das ich für ne P&P Runde generieren wollte: Lebkuchen und Tod / Blut spritzt wie Fluss / Narvik / Held - steht auf / Ohne Verlust / Mit Axt hoch gehoben / Milch spritzt weit / Stutenkerle fallen / Nie bereit -- man weiß nicht, ob man weinen oder lachen soll.
- Das Ende verliert sich meist im musikalischen Nirvana und dann endet das Lied halt abrupt.
- Wenn man den Song mit "german" taggt, kriegt er die deutsche Sprache besser hin. Andererseits klingt dann immer ein bisschen Ballermann durch.
Bewaffnet mit diesem Wissen war mein Plan für diesen Storybeitrag nun, ausschließlich mithilfe von KI ein Musikvideo zu erstellen, wie man es aus den ~2000ern kennt. Sprich: irgendein Lied und wahllos aus dem Internet zusammengeklaute Bilder, die mehr oder weniger - also eher weniger - dazu passen. Koordinieren und die Lyrics schreiben wollte ich mit ChatGPT. Den Song generieren mit Suno. Und die Bilder mit Stable Diffusion.
Der erste Prompt lautete folglich:
Nach etwas hin und her - was bei ChatGPT etwas dauern kann, weil der immer so ausschweifend antwortet - standen Thema und Genre: Ein Lied über Quantencomputer, elektronisch mit futuristischen Themen. Wie originell, die KI "denkt" sich was elektronisches zu IT-Hype-Themen ausHallo ChatGPT. Ich möchte ein Musikvideo mit Hilfe von KI erstellen. Das Lied soll dein Freund Suno AI erstellen, die Bilder will ich mit deinem Freund Stable Diffusion erstellen. Du musst mir helfen, alles zu koordinieren und vielleicht auch beim Text. Zuerst brauche ich aber eine Idee und ein Genre. Welches würdest du mir empfehlen?
ChatGPT einen Prompt für Suno abzuverlangen, verlangte auch mir einiges ab - das Geschwafel, das ChatGPT ausgespuckt hat, passte nie richtig in die Zeichenbegrenzung von Suno. Irgendwann stand folgender Prompt:
Und die von Suno erstellten Lyrics waren...Beschreibung: "Quantum Dawn" ist ein futuristischer Song über die Entdeckung eines Quantencomputers und seine Auswirkungen auf die Menschheit. Elektronische Musik auf Deutsch.
...gespickt mit göttlichen Reimen Es war auch ein spannender Neologismus dabei: "Quasenstrahlen".[...]
Eine neue Ära bricht an
Quantum Tag und quantum Nacht
Der Quantencomputer erwacht
Bringt die Wissenschaft in Tracht
[...]
Ich bat ChatGPT zum einen, mir zu erklären, was Quasenstrahlen seien - eine "künstlerische Neuschöpfung oder ein fiktives Konzept. Es könnte als eine Art fiktive Technologie oder Phänomen in der Geschichte des Songs dienen." - und dann die Lyrics zu überarbeiten. ChatGPT hat sie einfach ins Englische übersetzt
Es ging wieder etwas hin und her, wobei stellenweise sowas rauskam:
Fühlt ihr euch auch bereit für die Klarheit?[...]
Quasenstrahlen strahlen grell und weit
In dieser neuen Ära der Zeit
Durchbrechen wir die Grenzen der Realität
Ein neuer Raum, eine neue Dimension, bereit für die Klarheit
[...]
Inzwischen mehr als genervt von der KI hab ich die Textfragmente von Suno und ChatGPT halbherzig zu einem funktionalen Text zusammengeschraubt, der - bis auf Details - so aussah:
Achtung Spoiler:
Sidenote: Die "interessante" Songstruktur, die ChatGPT vorgeschlagen hat, hab ich ignoriert. Sie lautete:
[Verse 1] [Break] [Verse 2] [Drop] [Chorus]. Interessant
Aber wenigstens stand der Text. Den anstehenden Workflow kannte ich schon. Der sah - zumindest bei mir - immer wie folgt aus: mit 1-2 Prompts kommt ein Ergebnis bei raus, das zu 80-90% ganz cool ist. Dann drückt man so lang auf generate (und passt stellenweise die Lyrics an, damit man sich nicht so taten- und hilflos fühlt), bis was dabei ist, das zumindest zu 95-98% passt. Das macht besonders viel Spaß, wenn die ersten 60s echt gut klingen - um dann völlig zusammenzuglitchen. Das hat ungefähr den Charme von Lootboxen öffnen, denn natürlich muss man mit einer fiktiven Währung zahlen. Die heißt "Credits" und ein Credit ist irgendwas zwischen 0.008$ und 0.0024$ wert. Natürlich kostet es aber 5 Credits, ein Lied zu generieren. Weil ist halt so. Und es wird nie nur ein Song generiert, sondern immer 2. Mich kostet 1x Generieren 0.04$. Bis ein passables Ergebnis dabei ist, brauchte ich recht zuverlässig zwischen 60 und 100 Songs (also 30 - 50x Generieren). Ein "Song" kostet damit grob 1-2$.
Fehlte noch Teil zwei: passende Bilder. Zuerst hatte ich sogar überlegt, kurze Videolips KI generieren zu lassen. Den Gedanken verwarf ich aber, nachdem ich mich unter falschem Namen () bei 4 shady wirkenden KI-Seiten angemeldet hatte und die Ergebnisse alle Rot waren. Außerdem war ich so genervt, von diesem "KI-Workflow", dass ich schneller Ergebnisse wollte
Ich beuftragte also ChatGPT...
Und da kann ich über das Ergebnis ausnahmsweise nicht meckern. Es hat in einer Antwort für jede Zeile sowas geliefert wie "Humankind in awe, staring at a futuristic phenomenon, digital background". Stable Diffusion macht daraus dann sowas...Tut mir leid, dass ich mich so lange nicht gemeldet habe! Ich wollte noch Bilder für ein Musikvideo zu unserem Song generieren. Die Idee ist, dass zu jeder Songzeile ein passendes Bild zu sehen ist. Leider spricht dein Freund, Stable Diffusion, den ich dafür benutzen will, nur Englisch. Du musst mir also helfen, prompts für ihn zu generieren. Kannst du das?
...und manchmal auch sowas...
...oder sowas:
Bewundernswerte Kreativität
Das galt es jetzt nur noch hinreichend oft zu wiederholen, bis ich zufrieden war. Das dauert. Also nicht zwangsläufig, bis ich zufrieden bin - aber bis die Bilder all erstellt wurden. Apropos Erstellen: Das Erstellen des Videos blieb noch an mir hängen, das war aber zu erwarten (und da es nur darum ging, Bilder auf den Beat zu klatschen, auch nicht so aufwändig).
Das fertige Ergebnis:
Da ich keine Ahnung von EDM habe, hab ich mal die 5 Ergebnisse ins Video aufgenommen, die mir am besten erschienen. Mein Favorit ist das mit den Bildern am Anfang - auch wenn "Quasen" da leider nicht so schön ausgesprochen wird. Der zerglitchte "Null und Eins vereinen sich" bei der zweiten Wiederholung hat aber wiederum was Aber vielleicht seid ihr da anderer Meinung?
Kommen wir zu einem kleinen Fazit
Als weiteres Tool im kreativen Werkzeugkasten ist Suno echt stark. Gerade für so Gehirnfürze, die mir ab und an durch den Kopf spuken, werde ich davon wohl noch häufiger Gebrauch machen. Ich bin beeindruckt davon, was für eine Qualität in relativ kurzer Zeit damit erreichbar ist (Zeitinvest: ~1-2h bis das Lied fertig war, dann nochmal ~1-2h bis das Video fertig war) - und wie generisch das Resultat aussieht.
Gleichzeitig kann die Arbeit damit unglaublich frustrierend sein - genau, wie bei anderen KI Tools, mit denen ich schon zu tun hatte. Es passt zwar immer gut, aber es sind immer so 1-2 Stellen dabei, die mies sind. Bei KI generierten Texten ist es recht einfach, die Stellen manuell zu beheben. Bei Bildern so halb (wenn man sich ein wenig mit Bildbearbeitung auskennt). Bei den Liedern geht es gar nicht. Dafür müsste man die einzelnen Elemente irgendwie aus dem Mix ziehen können. Aber vielleicht gibt es dafür ja auch eine KI
Mongke, da gibts noch einiges mehr zu automatisieren! Ich hab dieses Video schon vor einem Jahr oder so gesehen
Ich fand den Song jetzt doch unerwartet zusammenhangsvoll (noch ein neues Wort - Fimi ist KI-generiert ) Aber natürlich pickt man sich auch nur die Rosinen aus Stunden an Rohmaterial heraus, sonst merkt man doch sehr schnell, dass KI da noch lange nicht gegen richtige Songs anstinken kann.
Also "Null und Eins vereinen sich" ist ja mal eine hammer Zeile
Verstand op nul, frituur op 180.
Das Leder durch die Nacht ziehen
Den Werdegang der Lyrics kann ich nicht mehr genau nachvollziehen. Ein paar Fragmente waren von Suno, ein paar von ChatGPT, ein paar von mir und ich hab so lange rumgepuzzlet, bis es sich gereimt hat. Ich weiß z.B. nicht mehr, von wem "Null und Eins vereinen sich" kommt. Ich glaub, das kam von Suno...? Hab gerade aber nicht die Muse, den ganzen produzierten Textmüll zu durchforsten.
Irgendwann müssen Schulklassen den Rotz interpretieren, den eine KI da zusammengetextet hat.
Verstand op nul, frituur op 180.
Die schicken das doch genauso durch ChatGPT
KI interpretiert dann KI.
Geil.
"Ziehen wir das Leder durch die Nacht"
"Ziehen wir das Leder":
- Leder: Im Fußballjargon steht "Leder" oft synonym für den Fußball. Dies betont die zentrale Rolle des Balls im Spiel.
- Ziehen: Diese Formulierung kann mehrere Bedeutungen haben. Es kann sich auf das physische Schießen des Balls (zum Beispiel bei einem Elfmeter) beziehen, aber auch auf die gemeinsame Anstrengung und den Teamgeist, der notwendig ist, um im Spiel erfolgreich zu sein.
"durch die Nacht":
- Nacht: Die Nacht kann eine Metapher für schwierige Zeiten, Unsicherheit oder Spannung sein. Im Kontext eines Fußballspiels könnte dies die Anspannung und Nervosität beschreiben, die sowohl Spieler als auch Fans während eines entscheidenden Moments, wie einem Elfmeter im Finale, empfinden.
- Diese Zeile könnte also darauf hinweisen, dass das deutsche Team in einem Moment großer Unsicherheit und Anspannung gemeinsam (als Einheit) agiert hat, um den Sieg zu erringen.
"Ein ganzes Land in höchster Pracht"
"Ein ganzes Land":
- Dies bezieht sich auf die kollektive Identität und den Stolz der Nation. Fußball, und insbesondere ein Weltmeisterschaftsfinale, hat die Fähigkeit, Menschen über soziale, politische und kulturelle Grenzen hinweg zu vereinen.
- Der Sieg im Finale wird als ein Moment wahrgenommen, der das ganze Land betrifft und dessen Bürger zusammenschweißt.
"in höchster Pracht":
- Höchste Pracht: Diese Formulierung deutet auf ein Gefühl von großem Stolz und nationalem Glanz hin. Es beschreibt einen Moment, in dem das Land in seiner besten Form, seiner höchsten Ehre und seinem größten Stolz erscheint.
- Der Sieg bei der Weltmeisterschaft wird als ein Höhepunkt des nationalen Stolzes und der Ehre dargestellt, ein Moment, in dem die Nation in ihrer „höchsten Pracht“ erstrahlt.
Gesamtinterpretation
Die zitierten Zeilen beschreiben einen Moment der nationalen Einigkeit und des Stolzes, der durch den entscheidenden Elfmeter im Finale der Weltmeisterschaft 1990 hervorgerufen wurde. Das „Ziehen des Leders durch die Nacht“ symbolisiert den entscheidenden und spannungsgeladenen Moment des Elfmeterschusses, der das Team und die Nation durch eine Phase großer Unsicherheit führte. Im Anschluss daran steht „ein ganzes Land in höchster Pracht“, was den kollektiven Jubel und die nationale Einheit beschreibt, die durch den Sieg ausgelöst wurden. Dieser Moment des Triumphs wird als einer der glanzvollsten in der Geschichte der Nation dargestellt.
Diese lyrischen Zeilen fangen die Emotionen, die Spannung und den Stolz eines ganzen Landes ein, das durch den Fußball vereint wird und in einem Moment des Sieges erstrahlt.
Verstand op nul, frituur op 180.
Die erste Variante könnte von Frozen Plasma sein.
Die zweite ist sehr 90er. Cascada?
3 kann ich nicht so ganz fassen, irgendwo zwischen Blümchen und Zeraphine?
4 könnte von Unheilig x Electric Callboy sein.
'Quantum Dawn' klang für mich wie 'Quantum Gott', hab da mit nix Englischem gerechnet und erst später alles durchgelesen. Fand ich sogar besser.