MP3: diferència entre les revisions

Contingut suprimit Contingut afegit
m Revertides les edicions de: Dofusloko (discussió) fins l'última edició de: EVA (bot)
Línia 22:
L'objectiu de l'algoritme de compressió d'aquest format és poder comprimir qualsevol senyal que estigui destinat a ser escoltat i explotar al màxim les limitacions del [[Sistema auditiu|Sistema Auditiu Humà]] o ''SAH''.
 
== Codificador ==
HAHAHAHAHAHAHAHA NO SABREIS LO QUE ES MP3 COMO QUE ME LLAMO ...
Les tècniques emprades en la codificació MPEG són:
MP3 ES UN VIBRADOR GIGANTE QUE TE DA PLAZER INFINITO
* Models perceptuals
* Assignació dinàmica de bits
* Commutació de finestres
 
Els blocs del codificador són:
* Anàlisis per filtres
* Transformada MDCT amb [[enfinestrament]].
* [[FFT]]
* [[Emmascarament temporal]] i [[Emmascarament freqüencial|freqüencial]]
* Escalabilitat i [[Quantificació (processament d'àudio)|quantificació]]
* [[Algorisme d'Huffman|Codificació de Huffman]]
 
=== Banc de Filtres ===
'''MP3''' utilitza 32 banc de filtres híbrids col·locats en cascada. Aquest filtres són [[polifàsics]], és a dir, amb un retard baix i incorporen una transformada [[Transformada de Discreta de Cosinus Modificada]] amb un número màxim de punts de 576. Degut a l'aplicació de la MDCT és pot eliminar informació redundant.
 
=== Transformació en freqüència ===
La transformada utilitzada en la codificació és la [[Transformada de Discreta de Cosinus Modificada]] (MDCT). Aquesta transformació incorpora un [[enfinestrament]] per tal d'evitar pre-ecos produits per un número de mostres de la transformada elevat en les zones de silenci-percussió. Aquest [[enfinestrament]] es realitza mitjantçant quatre tipus de finestres segons sigui el senyal:
* Finestra normal o llarga
** 576 mostres
** Simètrica
** Zona homogènia
* Finestra d'inici
** 480 mostres
** Asimètrica
** Zona de transició
* Finestra de parada
** 480 mostres
** Asimètrica
** Zona de transició
* Finestra curta
** 196 mostres
** Simètrica
** Zona homogènia
 
Per passar de finestra normal o llarga a finestra curta sempre s'ha de passar per les finestres de transició.
 
=== Emmascarament temporal i freqüencial ===
Degut a les limitacions del [[Sistema auditiu|SAH]] es pot definir un model [[Psicoacústica|psicoacústic]]. Aquest model parteix de descompondre el senyal com les[[bandes crítiques]] de l'[[oïda]] humana.
Per tal de poder eliminar informació per emmascarament s'utilitza una [[transformada de Fourier]] (FFT) de 576 punts.
 
En aquest bloc es defineix l'umbral per tal de saber quins tons es consideren emmascarats, i per tant no audibles, i així utilitzar aquest informació per tal de fer la quantificatzió.
Aquesta senyal emmascarada pot ser debut a senyals de baix nivell, soroll de quantificació, distorsió de solapament o errors de transmissió.
 
==== Emmascarament freqüencial ====
Un [[so]] pot ser emmascarat degut a que dins la mateixa banda crítica hi hagi un altre so amb un nivell més elevat.
Existeixen quatre tipus de fenòmens en que es produeix aquest emmascarament:
* To – To
* Soroll – To
* To – Soroll
* Soroll – Soroll
 
==== Emmascarament temporal ====
El [[Sistema auditiu|SAH]] té memoria auditiva per aquest motiu apareix el fenomen d'emmascarament temporal.
Aquest fenomen apareix quant dos tons apareixen distanciats per un interval de temps molt petit i un dels tons té un nivell molt més elevat que l'altre.
L'emmascarament anterior és més breu que el posterior.
 
=== Escalabilitat i Quantificació ===
Els llindars d'emmascarament són utilitzats per determinar quina assignació de bits correspon a cada banda crítica. El codificador el que busca es trobar un assignació de bits el més constant possible.
 
=== Codificació de Huffmann ===
Els [[bits]] quantificats són codificats amb Huffman i emmagatzemades a la cadena de bits amb els seus factors d'escala i la seva informació lateral.
Aquesta informació lateral incorpora els paràmetres que necessita el descodificador com poden ser la taula de Huffman, la commutació de finestres i el control de guany.
 
== Descodificador ==
El [[descodificador]] ha de recuperar un senyal sintetitzat del senyal d'àudio [[PCM]] d'entrada al [[codificador]].
 
El seus blocs són:
* Descodificador de Huffman.
* Desquantificador.
* MDCT inversa amb enfinestrament.
* Filtre de síntesi.
 
== Estructura MP3 ==