
Die Musikwelt hat sich in den vergangenen Jahren drastisch verändert. Musik ist heute ein allgegenwärtiger, fast ununterbrochener Soundtrack unseres Lebens – und der wird gespielt von einer global agierenden Musikindustrie, die weltweit pro Jahr 70 bis 80 Milliarden Dollar umsetzt. In diesem System triumphiert das massenkompatible Produkt, die gut verkäufliche Massenmusik. Es ist eine fundamentale Wahrheit unserer Zeit, dass der wirtschaftliche Erfolg eines Songs absolut nichts mit seiner künstlerischen Wertigkeit zu tun hat. Ein kommerziell erfolgreicher Hit muss weder inspiriert noch kreativ noch im tieferen Sinne „gute“ Musik sein.
Musik ist aus den Kirchen und aus den Konzertsälen ausgebrochen und nun überall im Alltag angekommen: Sie ist Hintergrund-Musik geworden, eine ständige Begleiterin. Ganz normale Menschen, meist Laien ohne musikalische Bildung, hören sie nicht fachkundig und voll konzentriert, sondern genießen sie nebenbei to go. Das bedeutet keineswegs, dass die Musik ihnen nichts bedeutet, im Gegenteil: Musik ist Teil ihres Lebens, sie wertet es auf und gibt ihm den entscheidenden Kick.
Mir stellt sich deshalb die Frage, ob Musik wirklich etwas so Unnahbares darstellt, wie es das Abwenden der Musikindustrierepräsentantinnen und -repräsentanten vermuten lässt, wenn diese bei KI-Musik die Nase rümpfen.
Gleichzeitig erleben wir eine beispiellose Demokratisierung des Musizierens. Der Einstieg ist so niederschwellig wie nie zuvor. Dank erschwinglicher elektronischer Instrumente und mächtiger Musiksoftware (DAWs wie FL Studio) kann heute jede und jeder mit geringem finanziellem Aufwand Musik in professioneller akustischer Qualität erstellen. Moderne Instrumente erfordern keinen jahrzehntelangen Marathon angestrengten Übens mehr: Wenn Sie mit einer verzerrten E-Gitarre Heavy Metal spielen wollen, können Sie das innerhalb weniger Jahre lernen. Eine DAW lässt sich in wenigen Monaten so weit beherrschen, dass vorzeigbare, gut hörbare Songs erstellt werden können – auch wenn ein Menschenleben wohl zu kurz wäre, um alle technischen Möglichkeiten jemals voll auszureizen.
Viele DAWs bieten bereits intelligente Hilfen und KI-Unterstützung an: Mit einem Chord-Progression-Tool können Sie in FL Studio zur Inspiration Akkordfolgen oder Arpeggios automatisch generieren lassen und mit Plugins wie iZotopes Ozone Ihre Lieder KI-gestützt vollautomatisch mastern lassen … Das gilt in der Szene nicht als KI-Musik, kommt aber doch verdammt nahe an sie heran.
Jedes traditionelle Instrument schränkt uns physikalisch ein, um überhaupt spielbar zu sein, damit Sie sich als Musikerin oder Musiker nicht im unendlichen Frequenzraum verlieren: Ein Klavier bietet feste Tasten (C, Cis, D...) und schließt die Töne dazwischen bewusst aus; ebenso verhält es sich bei einer Gitarre mit den Bünden am Hals oder bei einer Flöte. Exakt das gleiche Prinzip nutzt auch Suno: Ein Computer könnte jede erdenkliche Musik machen – aber Suno schaltet sich zwischen Sie und den unendlich großen Möglichkeitsraum und engt die generierte Musik präzise auf das ein, was zu Ihren Vorgaben passt.
Alle können heute Musik machen, die nicht mehr auf der Virtuosität der Instrumentenbeherrschung, sondern auf neuen, zugänglichen Instrumenten basiert.
In diese veränderte Musikwelt bricht nun die Musik-KI Suno.com. Sie hat mich völlig unvorbereitet getroffen und von der ersten Sekunde an absolut umgehauen: Ich habe schon so lange auf ein Instrument gewartet, das singen kann – und plötzlich war es tatsächlich da!
Auf den ersten Blick erzeugt Suno Musik vollautomatisch – ja, diese KI kann das. Doch wenn Sie Suno im Custom-Mode spielen, drücken Sie nicht einfach nur ein paar Knöpfchen für den schnellen Hit. Über verschiedene Einstellungen und zwei mächtige Textfelder – die Lyrics-Box (bis zu 5.000 Zeichen) und die Style-Box (bis zu 1.000 Zeichen) – findet ein hochgradig steuerbarer Prozess statt, den ich unumwunden „Musizieren“ nennen möchte.
Dabei entscheiden Sie als User grundlegend über den von Suno erstellten Song: Entweder verzichten Sie völlig auf Gesang, um Suno ein reines Instrumentalwerk erschaffen zu lassen, oder Sie lassen die KI einen Liedtext ohne eigenes Zutun vollautomatisch erstellen … oder – und jetzt wird es künstlerisch – Sie füttern Suno mit einem selbst verfassten Text.
Diesen Text können Sie nun gezielt strukturieren: Suno reagiert auf Zeilenumbrüche, Leerstellen, das Setzen von Klammern … und es verarbeitet in eckige Klammern gesetzte Auszeichnungen (Tags) wie [Chorus], [Verse 1] oder [Outro]. Durch dieses gezielte Verschachteln von Tags, das sogenannte „Meta-Tag-Stacking“ direkt im Textfeld, greifen Sie tief in das Arrangement ein:
Vocal- & Voice-Tags diktieren Geschlecht, Besetzung (Duett, Chor) und Stilistik (Sprechtext, Rap, Flüstern, Schreien).
Instrument- & Mix-Tags dirigieren die gewaltige Palette an Instrumenten und Effekten.
Mood- & Energy-Tags modulieren die emotionale Spannungskurve im Zeitverlauf.
Suno bietet ein fast grenzenloses Spektrum an Möglichkeiten. Die Kunst der Suno-Spielerinnen und -Spieler besteht darin, diese unendliche Vielfalt durch intelligente, präzise Befehle im Zaum zu halten und gezielt einzuschränken, um sie der eigenen kreativen Vision zugänglich zu machen.
Wenn Sie den Create-Button betätigen, erstellt Suno zwei Versionen des von Ihnen näher spezifizierten Songs – und diese beiden Versionen können trotz exakt gleicher Einstellungen sehr unterschiedlich ausfallen. Wenn Sie den Vorgang wiederholen, erhalten Sie nochmals zwei neue Versionen Ihres Songs. Mal sind sie nur wenige Sekunden lang, mal dauern sie fast acht Minuten. Mal singt ein Mann, mal ein Frauen-Duo … Suno interpretiert Ihre Vorgaben: Es basiert auf einem Fundus von Tonfolgen sowie Arrangements und verwendet komplexe Wahrscheinlichkeits-Marker, die dafür sorgen, dass ein Song eine konsistente Einheit bleibt – jedenfalls dann, wenn Sie den Weirdness-Regler (unterhalb des Chaos-Mode) unter 80% belassen.
Suno kann nicht immer alle Zeichen in den Boxen richtig auswerten, und es verwirft sogar manche expliziten Vorgaben, wenn diese den erfolgreichen Abschluss der Komposition innerhalb seiner internen Logik behindern. Suno besitzt insofern ein mächtiges Eigenleben und handelt bisweilen eigensinnig – und Ihre Kunst als User ist es, dieses Eigenleben so zu lenken, als gäbe es keine Widerstände. Eine Künstlerin oder ein Künstler bedient Suno so, dass der Song am Ende exakt so klingt, wie sie oder er sich das vorgestellt hat. Manchmal gleicht dieser Prozess dem Film „Edge of Tomorrow“: Sie müssen unzählige Versuche unternehmen und die Zeitschleife immer wieder neu starten, bis ein Song endlich perfekt ist – manchmal ist das Ergebnis dann sogar noch besser, als Sie es geplant hatten. Suno kann wirklich fantastisch sein!
Im Premier-Tarif haben Sie Zugriff auf das interne Studio von Suno und verfügen dort über erweiterte Bearbeitungsmöglichkeiten: Sie können einen Song in Stems aufteilen – also beispielsweise Gesang, Drums, Piano und Strings auf eigene Tonspuren legen – und diese separat bearbeiten. Sie können Sequenzen löschen, kopieren, verschieben, lauter oder leiser drehen, faden, Spuren via Chat-Befehl ersetzen oder ergänzen und den Song insgesamt beschleunigen oder verlangsamen. Zudem können Sie für jede Spur einen Equalizer einstellen, die Lautstärken sowie die Stereo-Ausrichtung anpassen oder externes Tonmaterial einspielen.
Nach meinem Empfinden ist dieses Studio allerdings noch nicht ganz ausgereift und leidet an Kinderkrankheiten: Durch die Studio-Eingriffe scheint Suno die organische Kontrolle über den Song aufzugeben und die schlüssigen Wahrscheinlichkeits-Marker zu verlieren. Zudem erhalten Sie keine Piano-Roll mit echtem, direktem Zugriff auf die einzelnen Noten oder MIDI-Daten. Suno bleibt ein störrischer Interpret Ihrer Vorgaben. Wenn Sie ein ganz bestimmtes Musikstück im Kopf haben, dann müssen Sie es Suno mit passenden Tags, cleveren Workarounds, viel Geduld und ständigen Wiederholungen regelrecht herauskitzeln.
Natürlich lässt sich Suno auch minimalistisch missbrauchen. Wer den Text schlampig von der KI schreiben lässt und in der Style-Box lediglich den Würfel für zufällige Stilvorgaben betätigt, investiert keinerlei eigene Kreativität. Das Ergebnis ist das, was zu Recht als „KI-Slop“ bezeichnet wird: pure Beliebigkeit. Da Suno mathematisch hervorragend darin ist, gefällige Muster zu erzeugen, klingt dieser Slop oft sogar täuschend gut. Doch im Grunde handelt es sich dabei um genau dieselbe seelenlose Zweck-, Fahrstuhl- oder Kaufhausmusik, die Menschen auch ohne KI seit Jahrzehnten produzieren. Es ist genau jene Klangkulisse, die es Musikliebhabern wie mir so schwer macht, das normale Radioprogramm zu ertragen – auf dem wohlgemerkt im Moment gewöhnlich noch gar keine KI-Musik läuft.
Sie brauchen keine künstliche Intelligenz, um schlechte, uninspirierte und seelenlose Musik zu produzieren. Die Gefahr besteht aber darin, dass es mithilfe von KI noch leichter wird, diese Masse an Slop-Musik zu potenzieren. Die Technologie kann sich dagegen so wenig wehren wie ein Instrument gegen einen unmusikalischen Benutzer. Mit KI kann schlechte Musik gemacht werden: viel in kürzester Zeit, billig und austauschbar.
Wenn die gewaltige algorithmische Kompetenz von Suno auf einen menschlichen „Regisseur“ trifft, der sie mit tiefgründigen eigenen Texten, präzisen Tags und einer klaren künstlerischen Vision lenkt, dann ist es in meinen Augen hochgradig wahrscheinlich, dass eine KI im Zusammenspiel mit dem schöpfenden Menschen am Ende wirklich gute, beseelte Musik hervorbringt.
Früher galt das Fotografieren nicht als kunstvoll, sondern als mechanisch-optisch-chemisches Handwerk. Fotografinnen und Fotografen galten als Handwerker, die dumpf die Realität lediglich reproduzierten, und ihre Werke wurden als seelenloser Output von Fotoapparaten geringgeachtet.
1902 gründete der von Deutschland in die USA ausgewanderte Fotokünstler Alfred Stieglitz in New York die Photo-Secession. Das war eine Fotografenvereinigung, die das Fotografieren als eigenständige Kunstform etablieren wollte. Die Mitglieder waren meist Piktorialisten, welche anstrebten, dass Fotos wie Gemälde aussehen sollten – es lohnt sich, den Begriff Piktorialismus einmal zu recherchieren. Mir persönlich hat besonders das Werk „Camera Work: Winter - Fifth Avenue" (https://www.clevelandart.org/art/1995.199.12.b) von Stieglitz sehr gut gefallen, das heute im The Cleveland Museum of Art neben Meisterwerken von Berthe Morisot hängt.
Ich sehe deutliche Parallelen zwischen dem historischen Weg der Fotografie und der heutigen Emanzipation der Suno-Musik hin zu einer anerkannten Kunstform. Es wird bestimmt noch eine Weile dauern, bis auch KI-Musik in der Breite als echte Kunst anerkannt sein wird.
CLΔUDISM
Claudius Mühlhäusler
Reginusstraße 4
76764 Rheinzabern
Deutschland