Zum Inhalt springen

„Linear Predictive Coding“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
K zus. Link
K webarchiv geprüft
Zeile 1: Zeile 1:
'''Linear Predictive Coding''' ('''LPC''') ist ein Verfahren der Audio[[Signalverarbeitung|signal-]] und Sprachverarbeitung, das u. a. für die [[Audiodatenkompression]] und [[Spracherkennung]] verwendet wird. Dabei wird ein vereinfachtes Modell des menschlichen [[Stimmtrakt]]s gebildet, mit dem die [[Sprachsynthese|Sprache synthetisiert]] werden kann. Damit kann ein Sprachsignal nur durch die Modellparameter und Erregungsmuster beschrieben werden. So fallen erheblich weniger Daten an als bei einer [[Puls-Code-Modulation|PCM]]-Repräsentation. Üblicherweise wird zusätzlich noch ein [[Fehlersignal]] übertragen, das die Differenz zwischen Modellvorhersage und Originalsignal beschreibt.
{{lang|en|'''Linear Predictive Coding'''}} (engl., '''LPC''') ist ein Verfahren der Audio[[Signalverarbeitung|signal-]] und Sprachverarbeitung, das u. a. für die [[Audiodatenkompression]] und [[Spracherkennung]] verwendet wird. Dabei wird ein vereinfachtes Modell des menschlichen [[Stimmtrakt]]s gebildet, mit dem die [[Sprachsynthese|Sprache synthetisiert]] werden kann. Damit kann ein Sprachsignal nur durch die Modellparameter und Erregungsmuster beschrieben werden. So fallen erheblich weniger Daten an als bei einer [[Puls-Code-Modulation|PCM]]-Repräsentation. Üblicherweise wird zusätzlich noch ein [[Fehlersignal]] übertragen, das die Differenz zwischen Modellvorhersage und Originalsignal beschreibt.


Das Modell des Stimmtraktes besteht oft aus einem [[Signalgenerator|Schwingungsgenerator]], um die [[Stimmbänder]] bzw. den [[Kehlkopf]] nachzubilden, und einer einfachen Röhre als Repräsentation des nachgelagerten [[Vokaltrakt]]s bzw. Artikulationsraums ([[Rachen]], Mundraum). Der Schwingungsgenerator erzeugt eine regelmäßige Schwingung, die in ihrer Lautstärke und Tonhöhe [[Modulation (Technik)|moduliert]] werden kann. Die Röhre stellt den [[Resonanzraum]] von Rachen und Mundraum dar und dient im Falle einfacher [[Vokal]]e üblicherweise als hinreichende Repräsentation. Dagegen würde die Darstellung von [[Nasalvokal|Nasallauten]] Abzweigungen von der Röhre ([[Nasenhöhle]]) erfordern, die mathematisch weitaus aufwändiger darzustellen wären. Daher werden diese Klanganteile teils verworfen, teils mit Hilfe eines Restsignales beschrieben.<ref>{{Webarchiv|url=http://otolith.com/otolith/olt/lpc.html |wayback=20110624005456 |text=otolith.com |archiv-bot=2019-04-25 22:15:12 InternetArchiveBot }}</ref>
Das Modell des Stimmtraktes besteht oft aus einem [[Signalgenerator|Schwingungsgenerator]], um die [[Stimmbänder]] bzw. den [[Kehlkopf]] nachzubilden, und einer einfachen Röhre als Repräsentation des nachgelagerten [[Vokaltrakt]]s bzw. Artikulationsraums ([[Rachen]], Mundraum). Der Schwingungsgenerator erzeugt eine regelmäßige Schwingung, die in ihrer Lautstärke und Tonhöhe [[Modulation (Technik)|moduliert]] werden kann. Die Röhre stellt den [[Resonanzraum]] von Rachen und Mundraum dar und dient im Falle einfacher [[Vokal]]e üblicherweise als hinreichende Repräsentation. Dagegen würde die Darstellung von [[Nasalvokal|Nasallauten]] Abzweigungen von der Röhre ([[Nasenhöhle]]) erfordern, die mathematisch weitaus aufwändiger darzustellen wären. Daher werden diese Klanganteile teils verworfen, teils mit Hilfe eines Restsignales beschrieben.<ref>{{Webarchiv |url=http://otolith.com/otolith/olt/lpc.html |text=Linear Predictive Coding (LPC) |wayback=20110624005456}}. otolith.com.</ref>


Ein bekanntes Beispiel für die Nutzung von LPC für Audiodatenkompression ist [[Code Excited Linear Prediction|CELP]], welches das Restsignal mittels [[Codebuch|Codebüchern]] komprimiert. Das standardisierte Verfahren ''LPC-10e'' arbeitet ohne Codebücher und führt zu einer geringeren [[Bitrate]] auf Kosten der Klangqualität.
Ein bekanntes Beispiel für die Nutzung von LPC für Audiodatenkompression ist [[Code Excited Linear Prediction|CELP]], welches das Restsignal mittels [[Codebuch|Codebüchern]] komprimiert. Das standardisierte Verfahren ''LPC-10e'' arbeitet ohne Codebücher und führt zu einer geringeren [[Bitrate]] auf Kosten der Klangqualität.
Zeile 8: Zeile 8:
* [[Digitales Filter]]
* [[Digitales Filter]]
* [[Adaptive Filter]]
* [[Adaptive Filter]]
* [[ARMA-Modell|ARMA]]
* [[ARMA-Modell]]
* [[Merkmalsvektor]]
* [[Merkmalsvektor]]


== Weblinks ==
== Weblinks ==
* [http://soundlab.cs.princeton.edu/software/rt_lpc/ Real-time LPC analysis/synthesis learning software] princeton.edu (englisch)
* [http://soundlab.cs.princeton.edu/software/rt_lpc/ ''Real-time LPC analysis/synthesis learning software.''] princeton.edu (englisch)
* [http://www.hawksoft.com/hawkvoice/ HawkVoice] Open-source LPC software and API (englisch)
* [http://www.hawksoft.com/hawkvoice/ HawkVoice] Open-Source-LPC-software und -API (englisch)
* Robert M. Gray: [http://www-ee.stanford.edu/~gray/dl.html Distinguished Lecturer Program.] IEEE Signal Processing Society (englisch)
* Robert M. Gray: [http://www-ee.stanford.edu/~gray/dl.html ''Distinguished Lecturer Program.''] IEEE Signal Processing Society (englisch)


== Einzelnachweise ==
== Einzelnachweise ==

Version vom 8. Oktober 2021, 11:06 Uhr

Linear Predictive Coding (engl., LPC) ist ein Verfahren der Audiosignal- und Sprachverarbeitung, das u. a. für die Audiodatenkompression und Spracherkennung verwendet wird. Dabei wird ein vereinfachtes Modell des menschlichen Stimmtrakts gebildet, mit dem die Sprache synthetisiert werden kann. Damit kann ein Sprachsignal nur durch die Modellparameter und Erregungsmuster beschrieben werden. So fallen erheblich weniger Daten an als bei einer PCM-Repräsentation. Üblicherweise wird zusätzlich noch ein Fehlersignal übertragen, das die Differenz zwischen Modellvorhersage und Originalsignal beschreibt.

Das Modell des Stimmtraktes besteht oft aus einem Schwingungsgenerator, um die Stimmbänder bzw. den Kehlkopf nachzubilden, und einer einfachen Röhre als Repräsentation des nachgelagerten Vokaltrakts bzw. Artikulationsraums (Rachen, Mundraum). Der Schwingungsgenerator erzeugt eine regelmäßige Schwingung, die in ihrer Lautstärke und Tonhöhe moduliert werden kann. Die Röhre stellt den Resonanzraum von Rachen und Mundraum dar und dient im Falle einfacher Vokale üblicherweise als hinreichende Repräsentation. Dagegen würde die Darstellung von Nasallauten Abzweigungen von der Röhre (Nasenhöhle) erfordern, die mathematisch weitaus aufwändiger darzustellen wären. Daher werden diese Klanganteile teils verworfen, teils mit Hilfe eines Restsignales beschrieben.[1]

Ein bekanntes Beispiel für die Nutzung von LPC für Audiodatenkompression ist CELP, welches das Restsignal mittels Codebüchern komprimiert. Das standardisierte Verfahren LPC-10e arbeitet ohne Codebücher und führt zu einer geringeren Bitrate auf Kosten der Klangqualität.

Siehe auch

Einzelnachweise

  1. Linear Predictive Coding (LPC) (Memento vom 24. Juni 2011 im Internet Archive). otolith.com.