Zum Inhalt springen

„Unified Speech and Audio Coding“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
[ungesichtete Version][ungesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
+{{Importartikel}}
Übersetzung
Zeile 1: Zeile 1:
'''Unified Speech and Audio Coding''' (USAC) ist ein [[Audiodatenkompression]]sformat und [[Codec]] für sowohl Musik und Sprache oder jegliche Mischungen von Sprache und Audio unter Verwendung sehr niedriger Bitraten zwischen 12 und 64&nbsp;kbit/s.<ref>{{cite web |url=http://www.iis.fraunhofer.de/en/bf/amm/forschundentw/forschaudiomulti/usac/index.jsp |title=Unified Speech and Audio Coding |author=Fraunhofer Institute for Integrated Circuits |accessdate=2011-07-18}}</ref> Es ist derzeit unter Entwicklung in der [[Moving Picture Experts Group|MPEG]] und wird als ein internationaler Standard [[International Organization for Standardization|ISO]]/[[International Electrotechnical Commission|IEC]] 23003-3 (auch bekannt als [[MPEG-D]] Part 3)<ref>{{cite web |url=http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=57464|title=ISO/IEC DIS 23003-3 - Information technology -- MPEG audio technologies -- Part 3: Unified speech and audio coding |date=2011-02-15 | accessdate=2011-07-18}}</ref> und auch als ein [[MPEG-4-Audio]]-Objekttyp in ISO/IEC 14496-3:2009/Amd 3 definiert.<ref>{{cite web |url=http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=59635 |title=ISO/IEC 14496-3:2009/PDAM 3 - Transport of unified speech and audio coding (USAC) |date=2011-06-30 | accessdate=2011-07-18}}</ref>
{{Importartikel}}
'''Unified Speech and Audio Coding''' (USAC) is an [[audio compression]] format and [[audio codec|codec]] for both music and speech or any mix of speech and audio using very low bit rates between 12 and 64&nbsp;kbit/s.<ref>{{cite web |url=http://www.iis.fraunhofer.de/en/bf/amm/forschundentw/forschaudiomulti/usac/index.jsp |title=Unified Speech and Audio Coding |author=Fraunhofer Institute for Integrated Circuits |accessdate=2011-07-18}}</ref> It is currently under the development in [[MPEG]] and will be defined as an international standard [[International Organization for Standardization|ISO]]/[[International Electrotechnical Commission|IEC]] 23003-3 (a.k.a. [[MPEG-D]] Part 3)<ref>{{cite web |url=http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=57464|title=ISO/IEC DIS 23003-3 - Information technology -- MPEG audio technologies -- Part 3: Unified speech and audio coding |date=2011-02-15 | accessdate=2011-07-18}}</ref> and also as an [[MPEG-4 Audio]] Object Type in ISO/IEC 14496-3:2009/Amd 3.<ref>{{cite web |url=http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=59635 |title=ISO/IEC 14496-3:2009/PDAM 3 - Transport of unified speech and audio coding (USAC) |date=2011-06-30 | accessdate=2011-07-18}}</ref>


It uses time-domain linear prediction and residual coding tools ([[ACELP]]-like techniques) for speech signal segments and transform coding tools ([[Modified discrete cosine transform|MDCT]]-based techniques) for music signal segments and it is able to switch between the tool sets dynamically in a signal-responsive manner. It is being developed with the aim of a single, unified coder with performance that equals or surpasses that of dedicated speech coders and dedicated music coders over a broad range of bitrates. Enhanced variations of the MPEG-4 [[Spectral Band Replication]] (SBR) and MPEG-D [[MPEG Surround]] parametric coding tools are integrated into the USAC codec.<ref>{{cite web |url=http://mpeg.chiariglione.org/workplan.htm#_Toc288682500 |title=Work Plan and Time Line |author=MPEG |accessdate=2011-07-18}}</ref><ref>{{cite web |url=http://mpeg.chiariglione.org/technologies/mpeg-d/mpd-usac/refsoft.htm |title=Unified Speech and Audio Coder Common Encoder Reference Software |year=2011 |month=March |accessdate=2011-07-18}}</ref>
Es verwendet lineare Vorhersage in der Zeitdomäne und Werkzeuge zur Kodierung des Restsignals ([[Algebraic Code Excited Linear Prediction|ACELP]]-ähnliche Techniken) für Sprachsignal-Abschnitte und [[Transformationskodierung]]swerkzeuge ([[Modifizierte diskrete Kosinustransformation|MDCT]]-basierte Techniken) für Musik-Signalabschnitte und es kann abhängig vom Signalinhalt zwischen beiden Ansätzen dynamisch umschalten. Es wird entwickelt mit dem Ziel eines einzigen, einheitlichen Kodierers mit einer Leistung, die die spezialisierter Sprach- und Musikkodierer über einen weiten Bitratenbereich überbietet. Verbesserte Varianten der MPEG-4-[[Spektralbandreplikation]] (SBR) und Techniken zur [[parametrische Audiokodierung|parametrischen Audiokodierung]] aus MPEG-D [[MPEG Surround]] sind in den USAC-Codec integriert.<ref>{{cite web |url=http://mpeg.chiariglione.org/workplan.htm#_Toc288682500 |title=Work Plan and Time Line |author=MPEG |accessdate=2011-07-18}}</ref><ref>{{cite web |url=http://mpeg.chiariglione.org/technologies/mpeg-d/mpd-usac/refsoft.htm |title=Unified Speech and Audio Coder Common Encoder Reference Software |year=2011 |month=March |accessdate=2011-07-18}}</ref>


== See also ==
== Siehe auch ==
[[Opus (codec)]] – a patent free alternative, low latency codec for a similar usage
[[Opus (Audioformat)]] – einer patentfreier alternativer, latenzarmer Codec für ähnliche Nutzung


== Quellen ==
<pre>
<references />
== References ==
{{reflist}}


{{Compression Formats}}
{{MPEG}}
{{Software-stub}}


[[Kategorie:Audiokompression]]
[[Category:Audio codecs]]
[[Category:MPEG]]
[[Kategorie:Codec]]
[[Kategorie:VoIP]]
[[Kategorie:Audiosignalformat]]


[[en:Unified Speech and Audio Coding]]
</pre>

Version vom 15. Januar 2012, 16:06 Uhr

Unified Speech and Audio Coding (USAC) ist ein Audiodatenkompressionsformat und Codec für sowohl Musik und Sprache oder jegliche Mischungen von Sprache und Audio unter Verwendung sehr niedriger Bitraten zwischen 12 und 64 kbit/s.[1] Es ist derzeit unter Entwicklung in der MPEG und wird als ein internationaler Standard ISO/IEC 23003-3 (auch bekannt als MPEG-D Part 3)[2] und auch als ein MPEG-4-Audio-Objekttyp in ISO/IEC 14496-3:2009/Amd 3 definiert.[3]

Es verwendet lineare Vorhersage in der Zeitdomäne und Werkzeuge zur Kodierung des Restsignals (ACELP-ähnliche Techniken) für Sprachsignal-Abschnitte und Transformationskodierungswerkzeuge (MDCT-basierte Techniken) für Musik-Signalabschnitte und es kann abhängig vom Signalinhalt zwischen beiden Ansätzen dynamisch umschalten. Es wird entwickelt mit dem Ziel eines einzigen, einheitlichen Kodierers mit einer Leistung, die die spezialisierter Sprach- und Musikkodierer über einen weiten Bitratenbereich überbietet. Verbesserte Varianten der MPEG-4-Spektralbandreplikation (SBR) und Techniken zur parametrischen Audiokodierung aus MPEG-D MPEG Surround sind in den USAC-Codec integriert.[4][5]

Siehe auch

Opus (Audioformat) – einer patentfreier alternativer, latenzarmer Codec für ähnliche Nutzung

Quellen

  1. Fraunhofer Institute for Integrated Circuits: Unified Speech and Audio Coding. Abgerufen am 18. Juli 2011.
  2. ISO/IEC DIS 23003-3 - Information technology -- MPEG audio technologies -- Part 3: Unified speech and audio coding. 15. Februar 2011, abgerufen am 18. Juli 2011.
  3. ISO/IEC 14496-3:2009/PDAM 3 - Transport of unified speech and audio coding (USAC). 30. Juni 2011, abgerufen am 18. Juli 2011.
  4. MPEG: Work Plan and Time Line. Abgerufen am 18. Juli 2011.
  5. Unified Speech and Audio Coder Common Encoder Reference Software. März 2011, abgerufen am 18. Juli 2011.