Zum Inhalt springen

Linear Predictive Coding

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 28. April 2011 um 20:47 Uhr durch Natr (Diskussion | Beiträge). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Linear Predictive Coding (LPC) ist ein in der Audio-Signalverarbeitung und Sprachverarbeitung unter anderem für die Audiodatenkompression und Sprachanalyse verwendetes Verfahren, das mittels Audiosynthese arbeitet. Dabei wird der Stimmtrakt (des Menschen) modellhaft vereinfacht (in Software) nachgebildet. Damit kann ein Sprachsignal im Vergleich zur PCM-Repräsentation extrem datenreduziert in akzeptabler Qualität beschrieben werden, indem das Signal im Wesentlichen durch Parameter und Erregungsmuster für diesen Synthesizer beschrieben werden kann. Üblicherweise wird dazu noch ein zusätzliches Restsignal gespeichert. Das Modell des Stimmtraktes besteht oft aus einem Schwingungsgenerator, um die Stimmbänder beziehungsweise den Kehlkopf nachzubilden, und einer einfachen Röhre als Repräsentation des nachgelagerten Vokaltrakts beziehungsweise Artikulationsraums (Rachen, Mundraum). Der Schwingungsgenerator erzeugt eine regelmäßige Schwingung, die in ihrer Lautstärke und Tonhöhe moduliert werden kann. Die Röhre stellt den Resonanzraum von Rachen und Mundraum dar und dient im Falle einfacher Vokale üblicherweise als hinreichende Repräsentation, wogegen die Darstellung von Nasallauten Abzweigungen von der Röhre (Nasenhöhle) erfordern würden, die mathematisch weitaus aufwändiger darzustellen wären. Daher werden diese Klanganteile teils verworfen und teils mit Hilfe eines Restsignales beschrieben.[1]

Bekanntes Beispiel für die Nutzung von LPC für Audiodatenkompression ist CELP, welches das Restsignal mittels Codebüchern komprimiert. Das standardisierte Verfahren LPC-10e arbeitet ohne Codebücher und führt zu einer geringeren Bitrate auf Kosten von Klangqualität.

Siehe auch

Quellen

  1. http://otolith.com/otolith/olt/lpc.html