WIEN. Künstliche Intelligenz verändert derzeit die Arbeitsrealität von Tonstudios grundlegend – von der Aufnahme über Editing und Sounddesign bis hin zu neuen Geschäftsmodellen. Wie sich Workflow, Kundenanforderungen und die Rolle des Tonstudios zwischen Technologie und kreativer Beratung neu definieren, erläutert Stephan Kolber, Geschäftsführer der gosh! Audio Agentur, im medianet-Interview.
medianet: Wie verändert Künstliche Intelligenz aktuell den klassischen Tätigkeitsbereich von Tonstudios – von Aufnahme und Editing bis hin zu Sounddesign und Postproduktion?
Stephan Kolber: KI verändert den Arbeitsworkflow bei uns in der gosh! Audio Agentur sehr. Das fängt bei kreativen Prozessen an, geht dann in der Produktion über z.B. eine Sprachgenerierung bei diversen Produkten und hört letztlich bei der Vermarktung oder der Implementierung am Touchpoint auf. Seitdem wir uns intensiv mit KI im Audiobereich beschäftigen, haben wir für unsere Kunden zahlreiche neue Produkte, wie zum Beispiel den KI Agenten für Arztpraxen, entwickelt und setzen die Möglichkeiten die uns KI bietet auch ständig in Alltagsprozessen ein. KI hilft uns, Prozesse zu beschleunigen, kann uns da und dort in kreativen Prozessen einen interessanten, alternativen Zugang liefern und ermöglicht uns neue Produkte und Dienstleistungen anzubieten.
Was die KI in der Musik-Produktion (noch) nicht zufriedenstellend lösen kann ist, gewünschte Emotionen in unserem hohen Qualitätsanspruch am Punkt zu liefern. So setzen wir die KI bei unserer Leistung Audio Branding zum Beispiel nur ganz am Anfang, im kreativen Findungs-Prozess ein. KI kann dann interessante Varianten liefern, die man später eventuell berücksichtigen kann. Ein zufriedenstellendes Endergebnis mit hoher emotionaler Wirkung kann man (noch) nicht erwarten.
Außerdem stellt sich, im professionellen Marketing, natürlich die grundlegende Frage nach der rechtlichen Sicherheit. Diese ist derzeit nicht gegeben. Deshalb wird bei uns bei einem Audio Branding oder bei Werbespots die Musik im letzten Schritt immer handwerklich produziert.
medianet: Welche konkreten KI-Tools oder -Anwendungen (z. B. für Voice-Cloning, automatisiertes Editing, Mastering oder Musikgenerierung) kommen bei Ihnen bereits zum Einsatz – und wo sehen Sie deren größte praktische Relevanz?
Kolber: Wir verwenden derzeit primär ElevenLabs für textbasierte Audio-Anwendungen, wie zum Beispiel bei unserem KI Telefonassistenten oder beim Mobilbox Manager. Wichtig für uns ist aber stets, dass die Rechte von Sprechern und Künstlern gewahrt bleiben und unsere Anwendungen DSVGO-konform sind. Weitere KI Tools, die bei uns zum Einsatz kommen, sind z.B. Kits-AI für eine bessere Vocal-Performance und Suno, das uns bei Bedarf im musikalischen Bereich kreativen Input und Ideen liefert. Der Output ist teilweise sehr interessant und inspirierend – fließt aber letztlich immer nur auszugsweise in das Endergebnis ein. Mit Suno erstellen wir u.a. Hintergrundmusik und spezielle, auf Image und Zielpublikum abgestimmte Playlisten für Hotels, Handel & Gastronomie.
medianet: Verschiebt KI die Rolle des Tonstudios eher in Richtung technologische Dienstleistung oder kreative Beratungsinstanz – und wie verändert das die Erwartungen Ihrer Kunden aus Marketing und Medien?
Kolber: Wir haben die Transformation vom reinen Tonstudio zur Audio Agentur schon vor Jahren vollzogen. Die Beratungsleistung nimmt mittlerweile sicher 50% unserer Dienstleistung ein. Dazu kommen noch die technologischen Möglichkeiten, die sich mit rasanter Geschwindigkeit entwickeln. Das Entwickeln von APPs gehört mittlerweile zu unserem Tagesgeschäft. Wir bleiben am Ball. Umgekehrt denke ich schon, dass das analoge Musik- bzw. Tonstudiogeschäft eine wichtige Nische finden wird. Ähnlich wie bei Vinyl. Wir haben in unserem A-Studio immer noch das analoge 60-Kanal Mischpult stehen – und werden uns auch nicht (solange es funktionstüchtig ist) davon trennen.
medianet: Welche Herausforderungen bringt der Einsatz von KI im Studioalltag mit sich – etwa in Bezug auf Qualitätssicherung, Urheberrecht, Ethik oder Akzeptanz bei Sprecher und Kreativen?
Kolber: Unser Credo ist mit und nicht gegen die Sprecherinnen und Sprecher oder andere Kreativbereiche zu arbeiten, und sie in den Prozess mit einzubeziehen – wir kommen ja als Musiker und Komponisten selbst aus dem Kreativbereich. Und da es gosh! seit 35 Jahren gibt, kennen wir die meisten Sprecher und deren Bedürfnisse sehr gut. Gute Stimmen haben jetzt die Möglichkeit – sofern die Umsetzung fair und rechtskonform gemacht wurde – gemütlich auf einer Insel zu sitzen und durch ihre lizensierte Stimme Einnahmen zu generieren. Und dabei versuchen wir die Sprecher bestmöglich zu unterstützen und sie mit ins Boot zu holen.
medianet: Wo sehen Sie langfristig die größten Wettbewerbsvorteile durch KI für ein etabliertes Tonstudio – und wo bleibt der Mensch Ihrer Meinung nach unersetzlich?
Kolber: Wir vorher schon erwähnt: Pure Emotion – die absolute Stärke von Musik und auch Sprache – kann die KI noch nicht zufriedenstellend liefern. Ich bin gar nicht sicher, ob das jemals gelingen wird. Letztlich hat es sicher auch mit unseren Hörgewohnheiten zu tun. Für Tonstudios tun sich neue Märkte und Chancen auf. Das Hören und Audio bleibt Bestandteil unserer Gesellschaft. Man muss beweglich bleiben – und das immer schneller. Andererseits – dort, wo Anwendungen und Ergebnisse immer technischer werden, wächst auch das Bedürfnis der Menschen nach dem Analogen – also werden diese Dienstleistungen und Produkte weiterhin seine wichtige Berechtigung haben. (esc)
