Bei Leinhäuser haben wir eine realistische Sicht auf künstliche Intelligenz. Anstatt der Illusion zu unterliegen, dass die Maschine professionelle Linguistinnen und Linguisten überflüssig macht, erkennen und nutzen wir das große Potenzial, das die KI bei bestimmten Projekten für einzelne Prozessschritte bietet.
Seit vielen Jahren betreut unser AudioVideo-Team verschiedene VoiceOver-Projekte für unsere Kunden und erlebt dabei, wie sich die Abläufe im Zuge des technologischen Fortschritts verändern. Während die Aufnahmen beispielsweise vor nicht allzu langer Zeit noch ausschließlich im Studio stattfanden, ist die Remote-Abwicklung mittlerweile eher die Regel als die Ausnahme – und auch die KI hält Einzug in die Vertonungswelt. Von welcher Bedeutung diese Entwicklung ist, zeigte sich kürzlich in einer Anfrage unseres langjährigen Kunden Saia Burgess Controls. Zum Auftragsumfang zählten bisher Übersetzungen, Copywritings, Editings, DTP, Untertitelungen und VoiceOver-Projekte in Humanqualität. Nun ging es jedoch speziell um einen KI-Ansatz für die Vertonung einer Videoreihe – und wir freuten uns, diesen Weg gemeinsam mit unserem Kunden zu beschreiten.
Linguistische Expertise und technisches Know-how gehen bei Leinhäuser Hand in Hand
Als Sprachprofis sind uns die kreativen Grenzen der KI sehr bewusst. Die Maschine ist zwar in der Lage, innerhalb weniger Minuten eine Vertonung in der gewünschten Sprache anzufertigen – ob die Qualität der Übersetzung und der künstlich generierten Stimme dem jeweiligen Zweck angemessen ist, steht jedoch auf einem anderen Blatt. Für eine VoiceOver-Lösung, die nicht nur das Budget schont, sondern auch sprachlich überzeugt, brauchen Sie einen Sprachdienstleister an Ihrer Seite, der neben der linguistischen Expertise auch über das erforderliche technische Know-how verfügt.
Die Herausforderung
Saia Burgess Controls benötigte eine kosteneffektive Lösung für das KI-gestützte VoiceOver von 16 englischen Schulungsvideos mit einer Gesamtlänge von 62 Minuten, um seinen Projektpartnern jeweils eine Variante in ihrer Muttersprache zur Verfügung zu stellen (Deutsch, Spanisch, Französisch und Italienisch). Da die Videos keine vertraulichen Informationen enthielten (hier erfahren Sie mehr über KI und Informationssicherheit) und nicht für Werbezwecke genutzt wurden, konnten wir in diesem Fall guten Gewissens die KI einbinden.
Unser Ansatz
Bei unserer Herangehensweise entschieden wir uns für einen KI-gestützten Ansatz unter menschlicher Regie. Dabei überließen wir die Vorarbeit der Maschine: Ein modernes KI-Tool übernahm die Transkription der englischen Originalspur und erstellte eine erste Übersetzung in die Zielsprachen. Bei der Überprüfung der Ergebnisse waren wir nicht allzu überrascht, dass an einigen Stellen noch Optimierungsbedarf bestand.
Ob Copywriting, Editing, Untertitelung oder wie in diesem Fall die Übersetzung zu Vertonungszwecken – professionelle mehrsprachige Kommunikation umfasst mehr, als auf den ersten Blick zu erkennen ist. Während der Bearbeitung eines Textes treffen Sprachprofis zahlreiche bewusste und unbewusste Entscheidungen, die für LLMs (Large Language Models) noch zu abstrakt sind. Wie der Autor Ted Chiang in seinem Artikel „Why A.I. Isn’t Going to Make Art“ (Warum die KI keine Kunst erschafft) für das Magazin The New Yorker erläutert, sei ein Large Language Model keine schreibende Instanz. Es wende Sprache noch nicht einmal im klassischen Sinne an. Denn diese sei per Definition ein Kommunikationssystem und erfordere daher eine Kommunikationsabsicht.
Vor diesem Hintergrund erscheint es nur logisch, dass die KI-generierten Skripte nicht in ihrer ursprünglichen Form übernommen werden konnten. Vor allem bezüglich der folgenden Aspekte war eine Nachbearbeitung erforderlich:
- Terminologie: Wie bereits erwähnt, bezogen sich alle Videos auf dasselbe Programm, enthielten also auch oft dieselbe Terminologie. Die KI lieferte (wenig überraschend) kein einheitliches Ergebnis, sodass sich große Unterschiede zwischen den verwendeten Begrifflichkeiten ergaben. Darüber hinaus wurde auch die Einleitung nicht konsistent übersetzt, obwohl diese in allen englischen Videos den gleichen Wortlaut hatte.
- Lesbarkeit: Bei einer VoiceOver-Übersetzung geht es sowohl um das geschriebene als auch um das gesprochene Wort, weswegen die Lesbarkeit des Textes eine wesentliche Rolle spielt. Die KI schien diese Tatsache zu übergehen und generierte oft Formulierungen, die weder schriftlich noch mündlich einen natürlichen Klang hatten.
- Textlänge: Die unbearbeiteten KI-Texte hätten sich spätestens bei der Vertonung als eher ungeeignet herausgestellt. Generell gilt eine Übersetzung zu VoiceOver-Zwecken als eine Art „untergeordnete Übersetzung“, da sie vielen Einschränkungen unterliegt, die über linguistische Anforderungen weit hinausgehen. Dazu zählt beispielsweise das richtige Timing, was sich in diesem Zusammenhang auf die Lesedauer bezieht, die das Originalvideo vorgibt. Da eine deutsche Übersetzung durchschnittlich um bis zu 40 Prozent länger ausfällt als ihre englische Vorlage, ist ein präziser und knapper Stil hier besonders wichtig, um die zeitlichen Vorgaben einhalten zu können.
Bei der Überarbeitung der Skripte berücksichtigten unsere Linguistinnen und Linguisten weit mehr als nur die oben genannten Punkte und erzielten ein Ergebnis, das alle Inhalte korrekt und ansprechend wiedergab, ohne die Lesedauer auszureizen – die ideale Grundlage für die anschließende KI-Vertonung.
Der Erfolg spricht für sich
Das Ergebnis war ein voller Erfolg. Leinhäuser steht gleichermaßen für linguistische Expertise und technisches Know-how. Unser Team verfolgt jede technologische Entwicklung in der Sprachbranche mit größter Aufmerksamkeit, um umfassende und kompetente Beratung zu KI-gestützten Kommunikationsprojekten zu bieten und höchste linguistische Integrität zu gewährleisten.
Im Rahmen des oben beschriebenen Projekts schlugen wir mit unserem Kunden eine neue Richtung ein. Dennoch wurde sehr deutlich, dass die menschliche Expertise nicht nur ein unverzichtbarer, sondern auch ein unnachahmlicher Bestandteil linguistischer Prozesse bleibt. Obwohl KI derzeit in aller Munde ist, dürfte es äußerst unwahrscheinlich sein, dass solche und ähnliche Projekte in absehbarer Zukunft allein von der Maschine abgewickelt werden – Sprache ist schließlich etwas zutiefst Menschliches. Für eine VoiceOver-Lösung, die sich schnell umsetzen lässt, das Budget schont und zudem skalierbar ist, bietet KI wertvolle Unterstützung bei einzelnen Prozessschritten. Wenn allerdings Authentizität an erster Stelle steht, empfehlen wir einen reinen Human-Ansatz.
Wir stehen Ihnen bei Ihren VoiceOver-Projekten mit Rat und Tat zur Seite – sowohl beim humanen Ansatz als auch bei der Einbindung von KI. Unsere erfahrenen Account Manager arbeiten eng mit Ihnen zusammen, um all Ihre Erwartungen zu erfüllen und die Workflows auf Ihre individuellen Anforderungen abzustimmen.
Redaktionsteam Leinhäuser
Sprachen sind unsere Leidenschaft. Deswegen nehmen wir regelmäßig auch aktuelle Entwicklungen und neue Tools unter die Lupe, die sich auf die Welt der Kommunikation auswirken. In verschiedenen Blogbeiträgen teilen unsere internen Expertinnen und Experten ihr Wissen und ihre Erkenntnisse zu spezifischen Bereichen unseres Portfolios und beleuchten wichtige Zukunftstrends für unsere Branche. Von kreativem Schreiben über Nachhaltigkeitsberichte bis hin zur Programmierung – jedes Mitglied unseres Teams zeichnet sich durch ein einzigartiges Profil aus und trägt so einem vielfältigen Gesamtbild bei.