Zum Inhalt springen

Sprachsynthese

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 25. Februar 2004 um 00:08 Uhr durch Karl-Henner (Diskussion | Beiträge). Sie kann sich erheblich von der aktuellen Version unterscheiden.


Sprachsynthese, genauer: Stimmsynthese, hat zum Anliegen, eine künstlich sprechende Stimme zu erzeugen.

Es gibt verschiedene Ansätze, wobei die häufigste Variante zweistufig ist:

  1. Wandlung des in Schriftform vorliegenden Textes in eine Phonemrepräsentation
  2. Ausgabe dieser Phoneme über simulierte Sprechwerkzeuge bzw. die Nachbildung des Vokaltrakts, wobei auch gespeicherte Stimmklänge (Samples) zum Einsatz kommen können

Interessante Aspekte:

  • Nicht alle Phoneme (Sprachklänge) sind in allen Sprachen vorhanden (z.B. der Ü-Laut ist im Englischen nicht präsent)
  • Die Übersetzung von Schriftsprache in Sprache ist nicht trivial (z.B. wegen Betonungen)
  • Die Übersetzung von Schriftsprache in Phoneme ist für die Landessprachen sehr unterschiedlich. Brat-he-ring (deutsch gelesen) <-> Bräth-er-ing (englische Aussprache)

Siehe auch: Vocoder, Formant, Stimmverschlüsselung