• LA COMPRESSION D'IMAGE INDUSTRIELLE
    Compression sans perte | Valeur probante | Traçabilité

(Dossier) Evaluation de la qualité des images

WaavesDossiers > Evaluation de la qualité des images

 
En imagerie, il est important de pouvoir décrire précisément la nature et l'amplitude des dégradations liées à la compression et la reconstruction des images.

De nombreuses métriques qui se veulent objectives ont été développées pour remplir cette mission mais leur corrélation à une évaluation subjective humaine n'est pas toujours avérée.

D'autre part, de nombreux secteurs industriels et scientifiques se soucient plus de l'interchangeabilité des images, c'est à dire la capacité à reconstruire (après compression) une image très fidèle à l'originale, que de la qualité perceptuelle. Et d'autres familles de mesures existent pour quantifier ce second aspect de la qualité d'image.

métriques mse et ssim d'évaluation de qualité d'image
 
Ce dossier décrit ces 2 types de métriques et clarifie leur usage et leur signification concrète lors de l'évaluation des performances d'un codec ou d'une librairie de compression d'image.


Mean squared error

Le MSE (Mean squared error) mesure la moyenne des carrés des erreurs entre une image référence (l'image d'origine) et une image dégradée (l'image reconstituée après compression). Il est calculé pixel par pixel en ajoutant les carrés des différences de valeur entre pixels et en divisant le résultat par le nombre total de pixels.



Pour les images en couleur, une moyenne des MSE par canal est réalisée.

Un MSE nul (=0) indique une parfaite identité entre l'image d'origine et l'image reconstituée (aucune perte d'information). 

Le MSE souffre d'un problème important : sa sensibilité importante à la profondeur du codage de l'image. Une image avec un MSE du 100 peut paraitre (subjectivement) très dégradée si elle est codée en 8 bits mais presque parfaite si elle l'est sur 16, par exemple. C'est pourquoi le PSNR (ci-dessous), qui introduit la profondeur dans son calcul, lui est souvent préféré.
 
 

Peak signal-to-noise ratio

Le PSNR (Peak signal-to-noise ratio) exprime le rapport entre la puissance d'un signal et celle du bruit affectant la fidélité de sa représentation. Il est utilisé pour exprimer la qualité de reconstruction d'un algorithme de compression d'image avec perte (sa valeur étant indéfinie lorsque les deux images comparées sont identiques) : l'image originale constitue le signal et les erreurs introduites par la compression représentent le bruit.



Le PSNR vise à permettre une approximation de la perception de la qualité de reconstruction, évaluée par un humain.

Son avantage par rapport au MSE est d'intégrer dans son calcul la profondeur de l'image (R indiquant la valeur maximale d'un pixel).

Mais son calcul ne permet malgré tout pas la comparaison de qualité de reconstruction entre codecs et ne fournit toujours pas une bonne corrélation avec l'analyse humaine, puisque son calcul, comme celui du MSE se préoccupe uniquement de différences pixel par pixel sans tenir compte d'informations structutelles importantes dans la vision humaine.

 

Similarité structurelle

SSIM, l'indice de similarité structurelle, permet de mesurer la similarité entre 2 images d'une manière plus proche de la perception subjective humaine que les 2 métriques précédentes. Il se base sur le constat que la vision humaine est fortement adaptée à l'analyse d'information strcuturelle et a donc pour vocation de mesurer efficacement les altérations de cette information entre l'image source et l'image reconstituée.

Il est le produit de 3 composantes : un terme de luminance (variations diverses de luminance, normalisation, ), un terme de contraste (changements de contraste, distortion de gamma), et un terme de structure (flou, bruit, postérisation, accentuation ..).


 
Rajouter un flou gaussien a, par exemple, très peu d'effet sur le MSE (et donc le PSNR) puisque les variations de luminance de pixel à pixel s'annulent mutuellement. En revanche, le score SSIM sera sévèrement affecté, tout comme l'évaluation humaine. Les images de haut de page ont toute un MSE de 144 mais des scores SSIM très différents.

MS-SSIM (Multi-Scale Structural SIMilarity) est une extension de SSIM qui simule la qualité perceptuelle de l'image à plusieurs distances de visualisation plutôt qu'une seule. L'algorithme calcule plusierus valeurs de SSIM à des résolutions d'images croissantes, et accorde moins d'importance au terme de luminance qu'qu'à ceux de contraste et de structure. Cette modification conduit à une corrélation accrue avec l'analyse subjective, au prix d'un temps de calcul significativement plus élevé.  
 

Découvrir l'offre Waaves