Relació pic de senyal a soroll

La relació de senyal de pic a soroll (PSNR per les seves sigles en anglès) és un terme que designa la relació entre el màxima potència possible d'un senyal i la potència del soroll que el corromp i que afecta la fidelitat de la seva representació. Donat que molts senyals tenen un rang dinàmic molt ampli, la PSNR se sol expressar en una escala logarítmica, i s'expressa en decibels.

Un dels usos de la PSNR és la quantificació de la qualitat de la reconstrucció d'imatge i vídeo sotmesos en el cas de compressió amb pèrdua.

DefinicióModifica

La PSNR es pot definit utilitzant l'error quadràtic mig (MSE). Donada una imatge lliure de soroll I de m×n pixels, i la seva aproximació amb soroll K, el MSE es defineix com:

 

La PSNR (en dB) es defineix com:

 

on, MAXI és el màxim valor possible per un píxel de la imatge. Quan els valors dels píxels de la imatge es representen amb nombres enters de 8 bits, aquest valor és 255. De forma més genèrica, quan les mostres es representen utilitzant PCM lineal amb B bits per píxel, MAXI és 2B − 1.

Ús en imatges en colorModifica

Per a imatges en color en RGB, la definició de la PSNR és la mateixa excepte que el MSE és la suma de totes les diferències de valor al quadrat (ara per a cada color, és a dir, tres vegades més diferències que en una imatge monocroma) dividida per la mida de la imatge i per tres. Alternativament, per a les imatges en color en altres models de color ( per exemple, YCbCr o HSV), s'informa de la PSNR en cada canal d'aquest espai de color.[1][2]

Estimació de la qualitat amb PSNRModifica

La PSNR s'utilitza habitualment per mesurar la qualitat de la reconstrucció dels algorismes de compressió amb pèrdua (p. ex., per a compressió d'imatges). El senyal en aquest context són les dades originals, i el soroll és l'error introduït per la compressió. En aquest cas, la PSNR és una "aproximació" a la percepció humana de la qualitat de la reconstrucció.

Els valors típics del PSNR en compressió amb pèrdua d'imatge o de vídeo estan entre 30 i 50 dB, sempre que la profunditat de bits sigui de 8 bits, on valors més alts indiquen millor qualitat. La qualitat de les imatges de 12 bits es considera alta quan el valor de la PSNR és de 60 dB o més.[3][4] For 16-bit data typical values for the PSNR are between 60 and 80 dB.[5][6] Es consideren valors acceptables per transmissió sense fils els que van entre 20 dB i 25 dB.[7][8]

En absència de soroll, les dues imatges I i K són idèntiques, i per tant el MSE és zero. En aquest cas, la PSNR és infinita.[9]

Imatge original sense comprimir
Q=90, PSNR 45.53dB
Q=30, PSNR 36.81dB
Q=10, PSNR 31.45dB
Exemple: valors de la PSNR de la component de luma per una imatge comprimida amb JPEG a diferents nivells de qualitat.

Comparació de rendimentModifica

Tot i que una PSNR més alt en general indica que la reconstrucció és de millor qualitat, en alguns casos pot ser que no sigui així. S'ha de tenir molta cura amb el rang de validesa d'aquesta mètrica; només és vàlid de manera concloent quan s'utilitza per comparar resultats del mateix còdec (o tipus de còdec) i el mateix contingut.[10]

En general, s'ha demostrat que la PSNR té un rendiment baix en comparació amb altres mètriques de qualitat quan es tracta d'estimar la qualitat de les imatges i especialment dels dels vídeos tal i com la perceben els humans.[10][11]

VariantsModifica

La PSNR-HVS[12] és una extensió de la PSNR que incorpora propietats del sistema visual humà com ara la percepció del contrast.

La PSNR-HVS-M millora el PSNR-HVS tenint en compte addicionalment l'emmascarament visual[13] En un estudi de 2007, va oferir millors aproximacions dels judicis de qualitat visual humana que PSNR i que l'SSIM per un gran marge. També es va demostrar que tenia un avantatge sobre DCTune i PSNR-HVS.[14]

Vegeu tambéModifica

ReferènciesModifica

  1. Oriani, Emanuele. «qpsnr: A quick PSNR/SSIM analyzer for Linux».
  2. «pnmpsnr User Manual».
  3. Faragallah, Osama S.; El-Hoseny, Heba; El-Shafai, Walid; El-Rahman, Wael Abd; El-Sayed, Hala S.; El-Rabaie, El-Sayed M.; El-Samie, Fathi E. Abd; Geweid, Gamal G. N. «A Comprehensive Survey Analysis for Present Solutions of Medical Image Fusion and Future Directions». IEEE Access, 9, 2021, pàg. 11358–11371. DOI: 10.1109/ACCESS.2020.3048315. ISSN: 2169-3536. «This paper presents a survey study of medical imaging modalities and their characteristics. In addition, different medical image fusion approaches and their appropriate quality metrics are presented.»
  4. Chervyakov, Nikolay; Lyakhov, Pavel; Nagornov, Nikolay «Analysis of the Quantization Noise in Discrete Wavelet Transform Filters for 3D Medical Imaging» (en anglès). Applied Sciences, 10, 4, 11-02-2020, pàg. 1223. DOI: 10.3390/app10041223. ISSN: 2076-3417. «The image processing quality is considered high if PSNR value is greater than 60 dB for images with 12 bits per color.»
  5. Welstead, Stephen T. Fractal and wavelet image compression techniques. SPIE Publication, 1999, p. 155–156. ISBN 978-0-8194-3503-3. 
  6. Raouf Hamzaoui, Dietmar Saupe. Fractal Image Compression. 968. CRC Press, maig 2006, p. 168–169. ISBN 9780849335563. 
  7. Thomos, N., Boulgouris, N. V., & Strintzis, M. G. (2006, January). Optimized Transmission of JPEG2000 Streams Over Wireless Channels. IEEE Transactions on Image Processing , 15 (1).
  8. Xiangjun, L., & Jianfei, C. Robust transmission of JPEG2000 encoded images over packet loss channels. ICME 2007 (pp. 947-950). School of Computer Engineering, Nanyang Technological University.
  9. Salomon, David. Data Compression: The Complete Reference. 4. Springer, 2007, p. 281. ISBN 978-1846286025. 
  10. 10,0 10,1 Huynh-Thu, Q.; Ghanbari, M. «Scope of validity of PSNR in image/video quality assessment». Electronics Letters, 44, 13, 2008, pàg. 800. Bibcode: 2008ElL....44..800H. DOI: 10.1049/el:20080522.
  11. Huynh-Thu, Quan; Ghanbari, Mohammed «The accuracy of PSNR in predicting video quality for different video scenes and frame rates» (en anglès). Telecommunication Systems, 49, 1, 01-01-2012, pàg. 35–48. DOI: 10.1007/s11235-010-9351-x. ISSN: 1018-4864.
  12. Egiazarian, Karen, Jaakko Astola, Nikolay Ponomarenko, Vladimir Lukin, Federica Battisti, and Marco Carli (2006). "New full-reference quality metrics based on HVS." In Proceedings of the Second International Workshop on Video Processing and Quality Metrics, vol. 4.
  13. Ponomarenko, N.; Ieremeiev, O.; Lukin, V.; Egiazarian, K.; Carli, M. «Modified image visual quality metrics for contrast change and mean shift accounting». 2011 11th International Conference the Experience of Designing and Application of CAD Systems in Microelectronics (CADSM), febrer 2011, pàg. 305–311.
  14. «On between-coefficient contrast masking of DCT basis functions» (en alemany). CD-ROM Proceedings of the Third International Workshop on Video Processing and Quality Metrics for Consumer Electronics VPQM-07, 25.–26. Januar 2007 [Scottsdale AZ].