Java Speech API

Die Java Speech API (JSAPI) spezifiziert eine plattformunabhängige Java Programmierschnittstelle für den Zugriff auf verschiedene Sprachtechnologien. Damit wird der Zugriff auf Sprachsteuerungs-, Spracherkennungs- und Sprachausgabeausgabesysteme aus Java Programmen heraus ermöglicht.

Die Java Speech API ist kein Bestandteil der JSE, sondern eine optionale Erweiterung. Die API selbst bestimmt nur die Schnittstelle zu Sprachtechnologien welche die Java Speech API implementieren. Implementierungen der Java Speech API sind beispielsweise "FreeTTS", IBM "Speech for Java", "The Cloud Garden", Lernout & Hauspies "TTS for Java Speech API", "Conversa Web 3.0", "Festival" und "Elan Speech Cube". ^[1]

Geschichte

Die erste Version der Java Speech API erschien am 26. Oktober 1998. Als Formate dienten nur das Java Speech Markup Language (JSML) und das Java Speech Grammar Format (JSGF). Die zweite Version wurde am 7. Mai 2009 als JSR 113 finalisiert. Die neue Version setzt auf aktuelle Standards der Sprachtechnologie auf, wie sie auch im Rahmen von VoiceXML verwendet werden auf. Mit der zweiten Version wurde der Schwerpunkt auf mobile Geräte gesetzt. Der Specification Lead Conversay konnte vor seinem Verschwinden leider weder eine Referenzimplementierung noch ein Technology Compatibility Kit zur Verfügung stellen. Am Lehrstuhl Telekkoperation der Technischen Universität Darmstadt werden die Bestrebungen einer Basisimplementierung unabhängig vom Java Community Process fortgesetzt und als Open Source Projekt auf http://jsapi.sourceforge.net zur Verfügung gestellt

Weblinks

Homepage der Java Speech API
Java Speech API, Artikel auf it-republic.de
Benutzeroberflächen durch Sprachfunktionen aufwerten

Einzelnachweise

↑ Java Speech API Frequently Asked Questions

[1] Java Speech API Frequently Asked Questions

[1]