Representació no-lineal de les imatges per a codificació perceptiva
Albà Cantero, Xènia
Figueras i Ventura, Rosa M.
Universitat Autònoma de Barcelona. Escola Tècnica Superior d'Enginyeria
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Data: 2009
Descripció: 97 p.
Resum: JPEG2000 és un estàndard de compressió d'imatges que utilitza la transformada wavelet i, posteriorment, una quantificació uniforme dels coeficients amb dead-zone. Els coeficients wavelet presenten certes dependències tant estadístiques com visuals. Les dependències estadístiques es tenen en compte a l'esquema JPEG2000, no obstant, no passa el mateix amb les dependències visuals. En aquest treball, es pretén trobar una representació més adaptada al sistema visual que la que proporciona JPEG2000 directament. Per trobar-la utilitzarem la normalització divisiva dels coeficients, tècnica que ja ha demostrat resultats tant en decorrelació estadística de coeficients com perceptiva. Idealment, el que es voldria fer és reconvertir els coeficients a un espai de valors en els quals un valor més elevat dels coeficients impliqui un valor més elevat d'aportació visual, i utilitzar aquest espai de valors per a codificar. A la pràctica, però, volem que el nostre sistema de codificació estigui integrat a un estàndard. És per això que utilitzarem JPEG2000, estàndard de la ITU que permet una elecció de les distorsions en la codificació, i utilitzarem la distorsió en el domini de coeficients normalitzats com a mesura de distorsió per a escollir quines dades s'envien abans.
Resum: JPEG2000 es un estándar de compresión de imágenes que utiliza la transformada wavelet y, posteriormente, una cuantificación uniforme de los coeficientes con dead-zone. Los coeficientes wavelets presenta ciertas dependencias tanto estadísticas como visuales. Las dependencias estadísticas se tienen en cuenta en el esquema de JPEG2000, no obstante, no ocurre lo mismo en el caso de las visuales. En este trabajo se pretende encontrar una representación más adaptada al sistema visual humano que la que proporciona JPEG2000 directamente. Para hallarla utilizaremos la normalización divisiva de los coeficientes, técnica que ya ha demostrado resultados tanto en descorrelación estadística de coeficientes como perceptiva. Idealmente, se quiere reconvertir los coeficientes a un espacio de valores en los cuales un valor elevado de los coeficientes implique un valor más elevado de aportación visual, y utilizar este espacio de valores para codificar. A la práctica, no obstante, queremos que nuestro sistema de codificación este integrado en un estándar. Es por eso que utilizaremos JPEG2000, estándar de la ITU que permite una elección de las distorsiones en la codificación, y utilizaremos la distorsión en el dominio de los coeficientes normalizados como medida de distorsión para escoger que datos se envían antes.
Resum: JPEG2000 is a wavelet-based image compression standard. After the wavelet transform, the coefficients are scalar-quantized using a dead-zone quantizer. Wavelet coefficients present both statistical and perceptual dependencies. JPEG2000 takes into account coefficient statistical dependencies in its entropy coding scheme, but not the visual ones. In this work, we aim at finding a representation that is more adapted to visual perception than that of the JPEG200 standard. Given the great statistical and perceptual redundancy reduction rates shown by divisive normalization. We propose to introduce the use of divisive coefficient normalization into the JPEG2000 encoding scheme. Ideally, we would like to reconvert the coefficients in a space of values in which higher value of the coefficients implies higher value of visual contribution, and use this space of values to encode. In practice, we want our coding system to be integrated into a standard, so we will use JPEG2000, an ITU standard that allows a choice of the distortions in the coding, and we will use the distortion in the normalized domain as a measure to choose which data have to be sent before.
Resum: Nota: Aquest document conté originàriament altre material i/o programari només consultable a la Biblioteca de Ciència i Tecnologia.
Drets: Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l'autor original, la universitat i l'escola i no se'n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús Creative Commons
Llengua: Català
Titulació: Enginyeria de Telecomunicació / Telecommunication Engineering [4313797]
Col·lecció: Escola d'Enginyeria. Projectes i treballs de final de carrera. Enginyeria de Telecomunicació
Document: Treball final de grau
Matèria: Imatges ; Compressió (Informàtica)



97 p, 3.3 MB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de recerca i projectes de final de carrera > Enginyeria. TFM

 Registre creat el 2009-07-15, darrera modificació el 2022-07-16



   Favorit i Compartir