Text-To-Speech

Ich habe mal mit TTS gespielt. Unten ist das Ergebnis von 1 1/2 bis 2 Stunden, inklusive Einarbeit. Perfekt ist es natürlich nicht, vor allem die ersten beiden Sätze. Es war ja nur ein Test. Ich musste die Szene teilen, da es eine 4MB Beschränkung beim Hochladen gab.


Da gibt es viel bessere Tools, aber eines haben alle gemein.
Der Stimme fehlt die Seele.
Ich hab mir vor einem halben Jahr eine App gebaut, die so natürlich, wie nur irgend möglich vorliest. Mit Luft holen, räuspern. Betonung und und und. Der letzte Funke konnte nicht zünden.
Mein Gedanke war, dass viele Leser sich das e book vorlesen lassen.
Und genau da liegt das Problem.
Amazon, Google Play bücher und und und haben ihre eigenen tts.
Ich bin zu der Erkenntnis gekommen, dass ich so schreibe, dass es für den Hörer und den Leser gleichermaßen passt.
Das heißt, so wenig Fremdwörter und komplizierte Eigennamen, wie möglich.
Und darauf hoffen, dass die tts Modelle besser werden.
Ein KI generiertes hörbuch geht zur Zeit nur bei Spotify und nur mit einem Anbieter (elevenlabs) und es klingt einfach nicht echt. Gut aber zu glatt, zu … Hmmm … Es fehlt halt das gewisse etwas.
Da muss der Text schon so unglaublich stark, spannend oder ergreifend sein, dass das Medium im Grunde egal ist.
Und das ist mir nicht gegeben.

Es ist ein langer Fred aber wenn du da die hörproben aus checkst siehst du, was möglich ist und was nicht .
Besonders bommels beiträge sind gut.

Wie soll es auch?– Es ist doch nur eine Maschine!
… aber zur Kontrolle des Textes außerordentlich gut geeignet. Jedenfalls habe ich in meinen Texten Fehler gefunden, die ich wenigstens dreimal überlesen habe.

2 „Gefällt mir“