Espectrograma

(S'ha redirigit des de: Sonograma)

L'espectrograma o sonograma és una eina bàsica de representació que s’utilitza per a l’anàlisi dels senyals elèctrics, de comunicacions, i qualsevol senyal audiovisual en el seu contingut freqüencial. És una representació en tres dimensions, temps freqüencial i amplitud de la distribució d’energia d’un senyal. La representació de l'espectre d'un senyal en el domini freqüencial, pot ajudar a entendre millor el seu contingut, que amb una representació en el domini temporal. L'espectrograma es pot interpretar com una projecció en dues dimensions d’una successió de Transformades de Fourier de trames consecutives, on l'energia i el contingut freqüencial del senyal va variant al llarg del temps.

És una gràfica tridimensional que objectiva la variació de la freqüència d'un senyal en funció de la intensitat i del temps.[1] És una representació d'un senyal mostrat en una gràfica x-y. En el gràfic, l'eix vertical (y) representa la freqüència o to del soroll, expressat en kilohertz (kHz). Els sonogrames és representen en colors, l'arc de sant martí dels colors mostra quan de fort està sent produïda una freqüència. Com més alt és el senyal, més proper a la zona vermella és. Els senyals molt baixos són propers a la zona blava. Els còdis de colors per la intensitat dels senyals són molt útils per entendre com la intensitat varia dins d'un sonograma. Però tot i això, és necessari recordar que la intensitat disminueix quan ens allunyam de l'origen d'aquest. Com que els sonogrames es creen a partir de gravacions realitzades a distàncies variables des de la font, la intensitat representat en dos sonogrames diferents no pot comparar-se de manera directa.[2]

Definició modifica

 
Un espectrograma de so de violí. Les línies més brillants de la part de baix són els harmònics fonamentals de cada nota i les altres línies més fosques són els sobretons, en conjunt formen l'espectre de freqüències.

La construcció d'un espectrograma es basa en agafar un determinat nombre de mostres per mitjà d'una finestra temporal, amb una mida concreta. Segons el tipus d’anàlisi que es faci del senyal, harmònic o ressonant, la finestra haurà de tenir una mida determinada. A continuació es fa el càlcul del contingut freqüencial de les mostres enfinestrades, i es representen en una gràfica en tres dimensions.

Seguidament es desplaça temporalment la finestra al llarg del senyal, per agafar un altre nombre de mostres diferents, es torna a calcular el contingut freqüencial i es torna a representar en la mateixa gràfica que l'anterior. Aquesta operació es va repetint successivament.

La suma de la representació de les transformades de Fourier de les finestres consecutives, aporta informació de la variació de l'energia i la freqüència en funció del temps.

La gràfica en tres dimensions pot ser representada de formes diferents, però la manera habitual de trobar-la és representant el temps en l'eix d'abscisses, representant les freqüències en l'eix d’ordenades i una representació de l'energia en dB en el pla tridimensional, aquesta acompanyada amb una gamma de colors que indiquen la variació en l'energia.

Creació modifica

L’anàlisi per trames és el primer pas a seguir en la creació d’un espectrograma, a causa de la naturalesa variant d’un senyal d’àudio, s’aplica una finestra per escollir un nombre limitat de mostres a processar.

L'elecció de la finestra és un compromís entre la mida de la trama, el processat i l’anàlisi del senyal.

Existeixen dos grans blocs de finestres anomenades de banda ampla Wideband i de banda estreta Narrowband. L’amplada de la finestra es considera en el domini freqüencial i fa referència a la resolució espectral del lòbul principal de la Transformada de Fourier de la finestra. És possible aplicar diferents tipus de finestra al senyal: Rectangular, Hanning, Bartlett, Blackman, Gaussiana, Kaiser, en són alguns exemples. Finestres amb amplada de banda grans en el domini temporal, suposen amplada de banda reduït en el domini freqüencial i finestres amb amplada de banda reduït en domini temporal, suposen amplada de banda gran en domini freqüencial. És per això que, segons el tipus de finestra escollida, serà possible aconseguir més o menys resolució en els lòbuls principals i secundaris de la Transformada de Fourier.

STFT modifica

 
Short Time Fourier Transform

Un cop enfinestrat el senyal, es calcula de la Transformada de Fourier en Temps Discret (STFT) del conjunt de mostres enfinestrades. Sift és un mètode de processament de senyals no estacionàries en què les característiques estadístiques varien en funció del temps. Sift extreu diverses trames d'un senyal que són analitzades en cada un dels desplaçaments de la finestra al llarg del temps.

El desplaçament de la finestra pot ser encavalcat per assegurar que les discontinuïtats que es produeixen entre trames no passin per alt i s’analitzin en el desplaçament de la trama següent, a aquest encavalcament de trames també se'l coneix com a overlap

Representació modifica

Cada una de les trames que s’obtenen del càlcul del Sift s’indexen en una matriu.

 
time, frequency, Amplitud

Aquesta matriu representa la variació en l'espectre i l'energia del senyal per cada una de la successió de trames al llarg del temps. A mesura que es van obtenint noves trames, es van indexant de forma consecutiva en la primera posició de la matriu, empenyent la trama anterior a la segona posició, i la segona a la tercera, i així successivament. D’aquesta manera es pot representar la variació de l'espectre del senyal i l'energia en funció del temps.

Una manera de representació de l'espectrograma és: el temps en l'eix abscisses, successions consecutives de transformades de Fourier, en l'eix d’ordenades la freqüència expressada en Hz i representada com la meitat de l'espectre, ja que la transformada de fourier és periòdica i el seu espectre es repeteix al llarg del temps. I per últim, la representació de l'energia expressada en db com el mòdul de l'amplitud de la Transformada de Fourier [20*log10(abs(X(f))] i representada amb una paleta de colors, o amb nivells de gris, en el cas concret en l'escala de grisos, amb valors on l'energia és més gran representats amb uns nivells més foscos, i aquells valors on l'energia és més petita amb uns nivells més clars.

Característiques modifica

L'elecció de la finestra dependrà del senyal a analitzar. A continuació es mostren les característiques de cadascuna.

Narrow Band (Banda estreta) modifica

En fer l’anàlisi d'un senyal de música a través del seu espectre de la Transformada de Fourier s'observa que té un harmònic en la freqüència fonamental (fo), seguit d’uns quants harmònics secundaris que es troben distanciats a múltiples de la freqüència fonamental (2fo, 3fo…) l’amplada de banda que hi ha entre dos harmònics consecutius té, una mida a tenir en compte per calcular la mida de la finestra. En escala logarítmica els harmònics s’observen equidistants, i en escala lineal a la mateixa distància.

En ser enfinestrat aquest senyal amb una longitud de trama petita, és a dir, agafant un nombre de mostres reduïdes per calcular la Sift, l’amplada de banda de la finestra serà prou reduïda, com perquè sigui més petit que l’amplada de banda que hi ha entre dos harmònics consecutius del senyal. D’aquesta manera, en fer la successió de transformades a cada desplaçament de la finestra, és possible visualitzar més detalladament l'estructura harmònica del senyal, quedant els harmònics més espaiats en la seva representació, i permetent així diferenciar millor entre cadascun d’ells.

Per aquesta raó l'elecció d'una finestra de banda estreta serà més adequada per l’anàlisi de l'estructura harmònica d'un senyal.

 
Espectre de la Transformada de Fourier amb amplada de banda estreta
 
Espectre: d'un senyal harmònic

Wideband (banda Ampla) modifica

Els espectrogrames de banda ampla són adequats per a una millor representació de l'estructura ressonant d'un senyal. Per exemple en un senyal de veu.

L'elecció d'una finestra de banda ampla en l’anàlisi d'un senyal de veu en el seu contingut freqüencial, és pel fet que la seva estructura ressonant de la parla és més important que no pas el seu contingut harmònic, ja que la formació en les paraules per exemple una vocal, està relacionada amb la formació de les ones estacionàries que es provoquen en la cavitat ressonant d'una persona, que no pas en la informació de la seva estructura harmònica.

El fet d'escollir una banda ampla comporta una representació més detallada en el contingut de l'estructura ressonant del senyal pel fet que el tracte vocal és més representatiu en la seva envolvent. Això té a veure amb què l’amplada de banda del lòbul principal de la finestra és prou gran per a encabir dos o més harmònics consecutius del senyal. D’aquesta manera la successió de Transformades de Fourier queda representada per l’amplitud de l'envolvent de la successió harmònica del senyal de veu.

Per aquesta raó els espectrogrames calculats amb una banda ampla de finestra queden representats amb unes línies verticals corresponents a les ràpides variacions en l’amplitud del senyal

 
Espectre de la Transformada de Fourer d'un senyal de veu amb banda ampla
 
Espectre de un senyal resonant

Aplicacions modifica

  • Alguns espectrogrames analògics es van aplicar a l'estudi dels cants dels ocells, amb la recerca actual segueix amb l'ordinador digital modern i s'aplica a tots els sons d'animals. És especialment útil per a l'estudi de la modulació de freqüència a les trucades dels animals.
  • Els espectrogrames són útils per ajudar en la superació de defectes de la parla i en la formació de la parla per a la part de la població que és profundament sorda.
  • Els estudis de la fonètica i síntesi de veu s'han facilitat a través de l'ús d'espectrograma.
  • En invertir el procés d'elaboració d'un espectrograma, és possible crear un senyal on l'espectrograma és una imatge arbitrària. Aquesta tècnica es pot utilitzar per amagar una imatge en un tros d'àudio i ha estat emprat per diversos artistes de la música electrònica.
  • Alguns tipus de música moderna es crea utilitzant espectrograma com a mitjà d'intermediaris, de canviar la intensitat de diferents freqüències a través del temps, o fins i tot crear-ne de nous, mitjançant l'elaboració i després la transformació inversa.
  • l'Espectrograma es pot utilitzar per analitzar els resultats de passar un senyal de prova a través d'un processador de senyals, com un filtre per tal de comprovar el seu rendiment.
  • Anàlisi freqüencial de qualsevol senyal audiovisual
  • Visualització de senyals elèctrics i de comunicacions.
  • Anàlisi musical.
  • Aplicacions acústiques.
  • Aplicacions sismològiques.
  • Anàlisi en senyals biomèdics.
  • Extracció de característiques.

Referències modifica

  1. «¿Qué es sonograma?». [Consulta: 1r desembre 2019].
  2. kazilek. «Sonogramas» (en anglès), 31-05-2017. [Consulta: 1r desembre 2019].
  1. Illustration of an electro-mechanical spectrograph
  2. Spectrogram definition
  3. Praat - doing phonetics by computer
  4. Example of using spectrograms to check filter responses

Enllaços externs modifica

A Wikimedia Commons hi ha contingut multimèdia relatiu a: Espectrograma