Speech to text — suche Spracherkennungssoftware für iMac Mojave

Ich bin des Tippens müde, ich möchte nur noch (im Wald auf einer Bank) diktieren und das zu Hause geschrieben kriegen (!).
Habe einen iMac mit Mojave.
Welches Spracherkennungsprogramm inklusive mobilem Aufnahmegerät ist zu empfehlen?

Hallo Johann Johannson,
über die Mac-Welt kann ich wenig aussagen, denn ich schreibe unter Windows, aber aus meiner Erfahrung kann ich Dragon sehr empfehlen. Es gibt da zum Beispiel Dragon Anywhere für iOs (zu verwenden mit iPhones und iPads).
Ich arbeite mit Dragon Professional Individual 15 (beruflich und privat) und diktiere damit Fachtexte, Briefe, Mails und Sachbuchtexte. Natürlich ist nötig, das Vokabular immer wieder zu ergänzen, aber das geht sehr flott und die Erkennungsraten sind erstaunlich gut.
Ich diktiere meist am Schreibtisch, da kann ich Fehler gleich sehen und korrigieren. Es geht aber auch, unterwegs zu diktieren. Da verwende ich den Zoom H2n, die Aufnahmen werden meist recht gut erkannt (das kommt aber auf die Hintergrundgeräusche an).

Liebe Grüße
Seshat

2 „Gefällt mir“

Hast du die eingebaute Spracherkennung schon probiert? Siehe Apfel > Systemeinstellungen > Tastatur > Diktat
In Papyrus fehlen zwar die Menübefehle zum Start des Diktats, aber die übliche Tastenkombination 2 x fn funktioniert und öffnet das macOS-Diktierfenster.

1 „Gefällt mir“

Vorausgesetzt, dass die Vögel verstummen und der Wind nicht in den Wipfeln rauscht.
Dragon z.B. reagierte teilweise empfindlich auf Hintergrundgeräusche. In meinem Büro, das an einer befahrenen Straße lag, konnte ich nur mit geschlossenen Fenstern diktieren. Das ist allerdings zehn Jahre her und die Technik ist wieder ein paar Schritte weiter.

1 „Gefällt mir“

Seit Oktober dieses Jahres hat Nuance (Hersteller von Dragon) die Weiterentwicklung und den Verkauf von Dragon für MacOS eingestellt. Wollte ich nur zu bedenken geben.
Mit aktiver Internet-Verbindung kann man aber auch gut die Diktatfunktion im iOS-Gerät verwenden. Das habe ich schon erfolgreich mit einem längeren Text gemacht. Erkennungsrate war erstaunlich gut. Selbiges gilt auch für die Diktatfunktion in MacOS. Man sollte aber einmalig die nötigen Dateien herunterladen (unter Systemeinstellungen → Tastatur → Diktat → Erweiterte Diktierfunktionen verwenden), dann benötigt man auch keine Internet-Verbindung und die Erkennung geht meiner Erfahrung nach schneller. Inwieweit sich das eignet, um z.B. einen auf einem Diktiergerät aufgezeichneten Text zu erfassen, habe ich allerdings nicht ausprobiert.

1 „Gefällt mir“

Ich habe mit der Apple-eigenen Diktierfunktion gute Erfahrungen gemacht, was das Erkennen betrifft. Gewöhnungsbedürftig ist jedoch das Diktieren selbst inklusive Formatierungen. Man ist leicht immer wieder vom Inhalt weg und schaut nach der Erkennung. Wenn man nur Fließtext roh einlesen möchte, ist das allerdings gut brauchbar.

1 „Gefällt mir“

Danke soweit. Hilfreiche Beiträge. Die Diktierfunktion von Mac ist mir bekannt. Die nutze ich schon. Die Frage ist: kann ich auch Dateien von einem Diktiergerät überspielen und schreiben lassen. Wenn jemand auf Mac da Erfahrung hat, wäre ich für die Auskunft sehr dankbar.

3 „Gefällt mir“

Habe es jetzt mal ausprobiert, versteht mich schlechter als Siri auf dem Handy…

Ich habe ein iPhone SE und habe die Firmware eigene Diktierfunktion getestet. Um diese nutzen zu können, benötigt man eine Internetverbindung. Ich war echt erstaunt, wie präzise die Spracherkennung arbeitet. Insofern Du über ein iPhone verfügst und einen Wald mit einem guten Mobilfunknetz bevorzugst, dann dürfte Dir Dein Vorhaben gut gelingen.

Als wenn noch irgendjemand über haupt noch in einen Wald gehen würde. Und dann noch ohne Mobilfunknetz? Ich arbeite mehr mit Notizzetteln, einer Kladde und Trello auf dem Handy. Schreiben tue ich eigentlich manuell. Ich war nur über den Fred hier gestolert und dachte mir, kann man ja mal ausprobieren wen man sonst gerade keine geistigen Ergüsse hat.

1 „Gefällt mir“

Spracherkennungssoftware und ich werden in diesem Leben wohl keine Freunde mehr. Wann immer ich mal Gelegenheit hatte, so ein Programm auszuprobieren, konnte ich mich stets schließlich nur erschauernd abwenden und denken: :scream:Das soll eine Arbeitserleichterung sein?? Wenn Kerzen zu Katzen werden und ganze Satzteile einfach verschwinden? Nee, nee, weg damit – Datei schließen, nicht speichern. Note to self: Vergiss. Es.“

4 „Gefällt mir“

Hilfreicher als Spracherkennung wäre mir eine gute Sprachsynthese.

Wenn ich eigenen Text höre, fallen mir regelmäßig üble Holprigkeiten in der Satzmelodie auf. Lese ich selbst laut, kann ich mich nicht zeitgleich gut genug auf die Beurteilung konzentrieren (Klischee: Mann == single tasking). Deswegen zeichne ich es auf und höre es in einem zweiten Schritt an.

“Text-to-Speech” ist eigentlich eine gute Idee, mit der ich mich bestmöglich auf das Gehörte konzentrieren könnte… doch leider empfinde ich die Ausgabequalität der Text-to-Speech-Funktion für deutsche Sprache, wie sie in MacOS oder Windows “dabei” ist, als unbrauchbar. Sehr schade.

Wahrscheinlich ist beides, Spracherkennung und Sprachsynthese, für den englischsprachigen Raum optimiert.

Dem kann ich nur zustimmen. Allerdings sollte die generierte Sprache einigermaßen natürlich klingen. Das ist beim “Linguatec Voice Reader 15” der Fall. Vergiss dabei aber nicht, dass das auch nur eine Maschine ist und dass sie nicht ein Bisschen davon versteht, was sie da vorliest! Insofern sind falsche Betonungen im Satzaufbau eigentlich “vorprogrammiert”. Es fehlt schlicht und ergreifend die “Seele”!
Die Home-Version kostet ca. 50 €, die Profi-Version das zehnfache. https://www.linguatec.de/shop-tts/
Aber aus Erfahrung ist die 50-Euro-Version in Deutsch sehr gut brauchbar. Sie läuft aber nur unter Windows!
Herzliche Grüße
Berti
PS:

Die Frauen können es auch nicht besser, meinen Psychologen! Ich finde, sie haben recht.

1 „Gefällt mir“

Frauen sind eben auch nur Menschen und Männer Psychologen . (X)

Die Google-WaveNet-Stimmen sind sensationell (auch die einstellbaren deutschen):

Cloud Text-to-Speech - Google Cloudhttps://cloud.google.com/text-to-speech/?hl=de

Ich habe noch keine andere auch nur ansatzweise so gute Sprachausgabe entdeckt als diese hier. Das Problem: Leider ist es (zumindest für mich) wahnsinnig kompliziert, die WaveNet-API quasi für die Aufnahme von Audiobooks der eigenen Texte zu nutzen – es gibt keine App, in die man einfach seinen Text reinkopieren und dann ausgeben lassen könnte o.ä. (Das Test-Eingabefeld auf der oben verlinkten Seite wird auch mit mehr als nur paar Sätzen streiken.) Ich war schon mal so weit, dass ich mir mit viel Googeln und Anleitung-Erfragen einen Google Developer Account angelegt habe, die API aktiviert, die nötigen „Werkzeuge“ über Terminal installiert und dann per Skript die Ausgabe als mp3 speichern wollte – für mich, der zwar sehr computeraffin ist, aber rein gar nichts mit Programmieren o.ä. zu tun hat, war das eine wirklich große Herausforderung, und ich wäre nicht drangeblieben, wenn ich diese Sprachausgabe nicht wirklich extrem gerne genutzt hätte. Das Ende vom Lied war, dass längere Texte dann auch nicht funktionierten und/oder nicht richtig als mp3 abgespeichert wurden, da habe ich es dann endgültig aufgegeben. Ich kann’s schon gar nicht mehr wirklich rekonstruieren. Sehr schade, und ich hoffe, Google bietet die WaveNet-Technologie irgendwann als einfachen Sprachausgaben-Service per App o.ä. an. Das Nutzen von WaveNet – z.B. als Sprachausgabe auf Homepages, wofür es momentan wohl primär gedacht ist – kostet aktuell Geld, irgendeinen Centbetrag pro ausgegebenes Wort. Ich wäre gerne bereit gewesen, dies für eine solch konkurrenzlose Sprachausgabe zu zahlen, da auch mir das „Vorlesen“ meiner Texte sehr geholfen hätten, den Flow manchen Satzes noch zu verbessern. Mit den üblichen Roboter-Stimmausgaben kann man das aber natürlich knicken.

1 „Gefällt mir“

Liebe Community

Für mich ist eine Spracherkennungssoftware keine Hilfe. Die Ergebnisse waren für mich nicht gut und das Überprüfen, was die Software da schreibt, bringt mich aus dem Fluss.

Für mich ist das 10-Fingersystem min. genauso schnell und ich kann mich besser konzentieren. Das 10-Fingersystem habe ich mir schon vor 25 Jahren beigebracht und kann es jedem wärmstens empfehlen. Gelernt habe ich das deutsche Layout.
Letztes Jahr bin ich auf das NEO2 Tastaturlayout gestoßen. Dieses optimiert die Position der Tasten und bietet dadurch ein noch schnelleres schreiben. Seit 6 Monaten nutze ich es und bin schon schneller als mit dem deutschen Layout.
Wer Interesse hat, hier der Link (alles kostenfrei und es gibt auch mehrereTipptrainer; TIPP10 habe ich genutzt) → https://neo-layout.org

Herzliche Grüsse
Pasch

1 „Gefällt mir“

Das ist wirklich viel besser, als befürchtet. :thumbsup:

Das Preismodell ist für mich allerdings „nicht ok“. Ich zahl’ gern für gute Leistung, aber ein „pay per use“ auf Wortbasis ist mir zu umständlich. Muss ich wirklich selbst zuvor über die Anzahl der Worte meine Kosten berechnen?

Zudem werde ich sicher nicht meinen Text „irgendwohin“ schicken, nur damit ich ihn mir anhören darf. (Neuronale Netze und Machine Learning sind kein hinreichender Grund, die Sprachsynthese auf externen Servern zu berechnen)

Danke, ich werde die Entwicklung im Auge behalten.:thumbsup:

1 „Gefällt mir“