Codificador de veu: diferència entre les revisions

Contingut suprimit Contingut afegit
m bot: - com '''codificadors + com a '''codificadors
m robot estandarditzant mida de les imatges, localitzant i simplificant codi
Línia 13:
 
== ''Vocoders'' ==
[[Fitxer:vocoder.png|thumbminiatura|Model de funcionament d'un vocoder. L'excitació de la font pot ser periòdica (so sonor) o de soroll (sorda).]]
A diferència dels '''codificadors de forma d'ona''', que no tenen en compte la naturalesa del senyal a codificar, els vocoders n'aprofiten les característiques intrínseques perquè la codificació sigui més eficient. Intenten produir un senyal que soni com la veu original, independentment de si la forma d'ona s'hi assembla o no. Al transmissor s'analitza la veu i s'extreuen els paràmetres del model i l'excitació, i aquesta informació s'envia al receptor, on a través d'un model simplificat de producció de veu aquesta és sintetitzada. El resultat obtingut és un senyal de veu intel·ligible amb una [[taxa de bits]] molt baixa, però té el problema que sona bastant sintètic (poc natural).
 
Línia 78:
Aquest tipus de codificadors utilitzen un model basat en la percepció del [[sistema auditiu]], i intenten explotar les seves imperfeccions analitzant aquelles freqüències que el sistema auditiu no percep, eliminant-les o reduint-ne la seva energia. Aquesta tècnica permet disminuir les taxes de bit dels senyals de veu sense que l'oient percebi cap diferència notable respecte al senyal original. El seu funcionament es basa en el concepte d'[[emmascarament freqüencial]].
 
[[Fitxer:codificador_psicoacustic.png|thumbminiatura|Model de funcionament d'un codificador psicoacústic]]
 
L'anàlisi freqüencial es pot fer amb un banc de filtres o amb transformades discretes ([[FFT]], [[DCT]], etc.). El llindar d'emmascarament proporciona els bits per a cada banda de freqüències. L'assignació de bits per banda pot fer-se amb quantificadors escalars o amb mètodes d'anàlisi i síntesi.