Ich höre sehr oft und sehr viel. Wegstrecken und Hausarbeit sind dann wesentlich kurzweiliger. Dieses Beispiel gefällt mir gar nicht. Und es liegt nicht an den Stimmen. Es sind die Pausen. Nach jedem Wort, teilweise innerhalb des Wortes, nach den Silben. Ich habe wirklich versucht, mich darauf einzulassen. Die Stimmfarben (nennt man das so?) finde ich recht gut, aber die Pausen machen mich schon ein wenig kirre. Es klingt halt so abgehackt.
Ich mächte es noch einmal näher erklären. Es klingt ein wenig wie Leseanfänger. Die lesen ja nicht flüssig den ganzen Satz, sondern langsam Wort für Wort. Und lange Worte Silbe für Silbe.
Das ist richtig und deine Einschätzung ist korrekt.
Das liegt an System und wird ich nicht viel besser darstellen lassen. Die Pausen bei der weiblichen Stimme sind eingebaut, ( Drama) aber die Maschine versteht das Konzept nicht wirklich.
Die ersten ist die einzige Stimme, die ich für meinen zweck kreiert habe , der Vorleser. Er spricht schon Recht flüssig, vergleiche das mal mit einer herkömmlichen Vorlesefunktion bei Microsoft oder Kindle.
Ich werde wohl nicht um hinkommen, immerwieder zu erklären, ich möchte kein hörbuchsprecher imitieren.
Ich möchte vorlesen erträglich machen.
Mir gefällt es nicht, aber ich habe auch nur noch ~50% meines Hörvermögens, vor allem in den Frequenzbereichen um 3.500 - 4.500 Hertz
Und ich dachte, du wolltest wissen, ob dieser Plan bisher funktioniert. Nun, war wohl ein Irrtum meinerseits. Für mich, als Endkunde sozusagen, funktioniert es bisher nämlich noch nicht. Ich verstehe deinen Wunsch, und bei einer Vorlesefunktion erwarten Menschen wie ich natürlich keinen professionellen Sprecher, das können wir schon unterscheiden und machen selbstverständlich Abstriche. Aber nerven soll es halt auch nicht.
Ja genau. Das ist aber nicht unbedingt KI Problem.
Mich persönlich stören echte weibliche Hörbuchstimmen schonmal. Da kann ich gleich meiner Frau zuhören.
Ich verwende hier nur Beispiele.
Mei richtiges Projekt ist von nur einer Stimme und besser balancierte. Es ist und bleibt aber KI.
Ich probiere auch mal mein Glück. Der Anfang von Projekt „Zerspaltene Welt“ vorgelesen von GPT 5.1 ![]()
Man kann geringfügig Einfluss darauf nehmen (7 verschiedene Sprecher und Anweisungen etwas langsamer zu lesen etc. (in wie weit das wirklich etwas bringt, unklar)
Hört sich gut an
Hast du das in einem Rutsch gemacht? Es sind verschiedene Nuancen zu hören.
Chat cpt ist nicht mein Werkzeug.versuch mal vor dem Text einen Befehl zu Beispiel;
Sprich mit trauriger Stimme:
Einzugeben.
Ja, in einem Rutsch. In der „Voice Dialog“ Funktion. Im Sinne.
„Kannst du mir folgenden Text vorlesen? Ich lege ihn dir in den chat“
„Klar, gib her“
Ich glaube er versucht die nuancen aus dem Text zu interpretieren. Ich war jedenfalls schon etwas beeindruckt. Und ich glaube, dahin wird die „Vorlesefunktion“ wandern. Eine enorm stromhungrige Serverfarm wird den Text interpretieren und vorlesen. Vermutlich wird das ‚Amazon‘ einmal offline für seine Bücher erledigen und dann für viel weniger Strom, nur die Audiodateien anbieten.
Die Voicechat funktion ist je Tag auf glaube ich 60 Minuten begrenzt. (ich benutze GPT Plus)
Wäre man jetzt daran interessiert, könnte man jeden Tag 45 Minuten ein, zwei Kapitel einlesen (vorlesen?
) und wäre nach einem Monat mit seinem Buch fertig. Ohne weitere Kosten. hm
(nur ein Gedankenspiel)
Und ich arbeite kostenfrei, mit Gemini 2.5
Da Problem ist die Menge.
Kleinere Happen gehen besser.
Denn jeder Versuch bringt ein anderes Ergebnis, ähnlich dem Bildgenerator.
Zum besonderen Amüsement noch der Anfang von Schwerter der Ordnung mit einer weiblichen Stimme.
Ja, auch hier varriiert ein erneutes Vorlesen. Manchmal werden Sachen besser vertont, als bei einer Wiederholung.
(Auch wenn ichs witzig finde, möchte ich immernoch das Uve Teschner das vorliest.
)
Ja da sind schon ein paar gute sätze bei.
Finde ich nicht schlecht, nur einen Tic zu schnell.
Wie überall auf der Welt lagen auch bei uns Freud und Leid im vergehenden Jahr wie Erdnüsse in einer Samenkapsel dicht beieinander. So überschattete noch kurz vor Heiligabend ein familiärer Trauerfall die frohe Stimmung – meine allerletzte verwandschaftliche Verbindungsschnur in eine Zeit VOR mir wurde gekappt. Anlass für Erinnerungen und Nachdenklichkeit bezüglich unser aller Endlichkeit.
Was vor einigen Jahren noch als kleiner Weihnachtsgruß gedacht war, nämlich eine von mir vorgelesene eigene kleine Erzählung für eine erblindete Tante, hatte mein Mann in diesem Jahr weitergeführt und schenkte mir eine meiner Kurzgeschichten auf CD, die er mühevoll mit Google Gemini AI vertont hatte. Ich habe sie zusätzlich zur Textversion auf meiner Website für Besucher integriert, die lieber hören als lesen. Über die sicherlich noch sehr ausbaufähige Qualität brauchen wir nicht diskutieren, aber ich halte das Ergebnis schon für sehr erstaunlich, die Stimme um Längen angenehmer als meine eigene und für Menschen mit Leseschwäche (dafür gibt es etliche Gründe) eine hilfreiche Ergänzung. Das war ja auch mal die Vorstellung von @Ho.Ro , wenn ich mich recht erinnere. Für ein ganzes Hörbuch würde ich es jedoch (noch) nicht einsetzen wollen. Ich werde die Entwicklung dennoch in Zukunft im Auge – oder besser im Ohr – behalten.
Wer selbst mal lauschen möchte: Hörversion Kurzgeschichte „Anyway“
Mein herzliches Beileid für den Verlust eines Familienmitglieds.
Die Hörversion gefällt mir gut. Von mir auch ein herzliches Beileid.