Sprachsynthese
Erscheinungsbild
Sprachsynthese, genauer: Stimmsynthese, hat zum Anliegen, eine künstlich sprechende Stimme zu erzeugen.
Es gibt verschiedene Ansätze, wobei die häufigste Variante zweistufig ist:
- Wandlung des in Schriftform vorliegenden Textes in eine Phonemrepräsentation
- Ausgabe dieser Phoneme über simulierte Sprechwerkzeuge bzw. die Nachbildung des Vokaltrakts, wobei auch gespeicherte Stimmklänge (Samples) zum Einsatz kommen können
Interessante Aspekte
- Nicht alle Phoneme (Sprachklänge) sind in allen Sprachen vorhanden (z.B. der Ü-Laut ist im Englischen nicht präsent)
- Die Übersetzung von Schriftsprache in Sprache ist nicht trivial (z.B. wegen Betonungen)
- Die Übersetzung von Schriftsprache in Phoneme ist für die Landessprachen sehr unterschiedlich. Brat-he-ring (deutsch gelesen) <-> Bräth-er-ing (englische Aussprache)
Software
- Txt2Pho wandelt deutschsprachige Texte in Phonemrepräsentation
- MBrola Projekt zur Synthese von Sprache
- FreeTTS, ein in Java implementierts, quelloffenes TTS-System (Text-To-Speech)
- Festvox, ein Open Source Projekt zur Sprachsynthese
Siehe auch: Computerlinguistik, Voder, Vocoder, Formant, Diphon, Stimmverschlüsselung, Prosodie, Intonation, Spracherkennung, Baron_Wolfgang_von_Kempelen