Subscribe RSS

Posts Tagged ‘soumissions’

Évaluation de la qualité d’images compressées avec des dissimilarités locales et globales

septembre 17th, 2009 by fmn | 1 Comment | Filed in Recherche

    Le contenu de ce billet est issu d’une communication au colloque GRETSI en 2009 :

    • [2009,inproceedings] bibtex Go to document
      F. Morain-Nicolier, J. Landré, and S. Ruan, "Dissimilarités locales et globales pour évaluer la qualité d’images médicales compressées avec pertes," in XXIIe Colloque GRETSI, Dijon, 2009.
      @INPROCEEDINGS {Nicolier2009b,
        author = {Morain-Nicolier, F. and Landré, J. and Ruan, S.},
        title = {Dissimilarit{\'e}s locales et globales pour {\'e}valuer la qualit{\'e} d'images m{\'e}dicales compress{\'e}es avec pertes},
        booktitle = {XXIIe Colloque GRETSI},
        address = {Dijon},
        month = {sep},
        year = {2009},
        url = {http://pixel-shaker.fr/wp-content/uploads/publications/Nicolier2009b.pdf}
      }


    Mise en situation

    Lorsque l’on compare deux images, il est parfois essentiel de pouvoir localiser les zones où les deux images se ressemblent et celles où elles diffèrent. Cependant, la plupart des méthodes fournissant une mesure de similarité (au sens le plus général possible) produisent un nombre unique. Ce scalaire est censé renseigner sur la qualité de la ressemblance entre les deux images considérées. Cette mesure, globale, est incapable de rendre compte finement des écarts :

    Exemple de deux images localement différentes
    Exemple de deux images localement différentes (images libres de droit obtenues sur Wikimedia Commons)

    Seule une mesure locale, peut permettre d’extraire l’information suivante : les deux images sont identiques par rapport à leurs moitiés supérieures et différentes par rapport à leurs moitiés inférieures.

    En dehors de ce cas un peu artificiel, de nombreuses applications nécessitent de localiser les similarités. Par exemple, dans le domaine de l’imagerie médicale, le volume de données généré en une année peut se mesurer en tera-octets1. L’utilisation de méthodes de compression est donc indispensable. Pour obtenir des taux de compression véritablement utiles, les compressions avec pertes sont actuellement à l’étude. Cependant, des problèmes peuvent se poser en termes de diagnostic. En effet, le principal écueil avec ce type de codage (avec pertes) est la potentielle disparition ou application de détails important. Quelle peut-être l’utilité de compresser des images, si leur archivage empêche toute analyse ultérieure?

    Wang et al. 2 ont récemment proposé d’évaluer la qualité d’une image en mesurant un indice global de similarité structurelle (structural similarity indexSSIM). Cet indice possède de nombreuse propriétés intéressantes, et est donc de plus en plus largement employé. Mais il reste une mesure globale. Dans leur article, les auteurs proposent de rendre locale la mesure en réalisant le calcul de l’indice dans une fenêtre glissante. Cela est une approche très classique. Le gros reproche de cette “localisation” porte sur le choix de la taille de la fenêtre glissante.

    Précédemment3, nous avons introduit une mesure de dissimilarité locale permettant la comparaison d’images binaires. Une carte de dissimilarités locales (CDL) est ainsi construite en utilisant une une fenêtre glissante de taille auto-adaptative (voir le billet précédent par exemple).


    Carte de dissimilarités locales pour images en niveaux de gris

    Initialement, la CDL a été mise au point pour comparer des images binaires. La formule suivante est une expression de la CDL qui permet un calcul rapide (voir 3 pour les détails) :

     \mathrm{CDL}_{A, B} (x, y) = |A (x, y) - B (x, y) | \max (\mathrm{dt}_A (p), \mathrm{dt}_B (p))

    \mathrm{dt}_X est la transformée en distance de l’image X. Bien qu’initialement mise au point pour des images binaires, nous transposons cette définition dans le cas d’images en niveaux de gris. Ce passage est immédiat puisqu’il suffit d’utiliser la définition d’une transformée en distance d’une image en niveaux de gris. Il existe actuellement (à notre connaissance) plusieurs alternatives. Le choix portant sur la distance sous-jacente entre deux pixels :

    • GWDT (Gray Weighted Distance Transform) : la distance est l’intégrale des niveaux de gris entre les deux pixels 6. :

     d_{GWD}(a, b) = \frac{1}{2} (I(a) + I(b)) \times || a - b ||

    ||a-b|| est la distance spatiale entre les deux pixels a et b, I(a) est le niveau de gris du pixel a.

    • WDTOCS (Weighted Distance Transform On Curved Space) : la distance est la longueur du chemin géodésique entre les deux pixels 4 :

     d_{WDOCS}(a, b) = \sqrt{\left(I(a) + I(b)\right)^2 + || a - b ||^2}.

    Ces deux transformées peuvent être calculées rapidement, avec une très bonne approximation, par un algorithme ne parcourant l’image que deux fois. La formule de la CDLng est donc la même que la CDL binaire :

     \mathrm{CDLng}_{A, B} (x, y) = |A (x, y) - B (x, y) | \max (\mathrm{dt}_A (p), \mathrm{dt}_B (p))

    Appliquons cette CDLng à l’évaluation locale puis globale de la qualité d’images compressées.


    Estimation locale de la qualité de compression :

    Une image CT (Computed Tomography) est choisie comme référence et compressée par JPEG2000 à 0,16bpp (bits par pixels) :

    La compression introduit des perturbations, notamment au niveau de certaines structures. Calculons l’indice SSIM (pour deux tailles de fenêtre) entre la référence et l’image reconstruite :

    Images comparées avec SSIM local (taille 7 et 15)
    Images comparées avec SSIM local (taille 7 et 15)

    Même comparaison mais avec deux CDLng (avec GWD et WTDOCS) :

    Image SSIM local (taille 7 et 15)
    Image SSIM local (taille 7 et 15)

    Commentaires :

    • Aucune localisation de distorsions n’est satisfaisante avec l’indice SSIM . Seule une grande taille de fenêtre (15 x 15) permet d’obtenir des informations. Cependant, la grande taille de fenêtre induit un effet de lissage qui interdit toute localisation précise.
    • Pour les deux cartes CDL, les structures distordues sont clairement mises en évidence. Le compromis inhérent à l’indice SSIM local (lié au choix de la taille de la fenêtre glissante) n’existe pas.


    Estimation globale

    Nous construisons un indice de dissimilarité globale (IDG) en agrégeant les mesures de la CDLng :

     IDG(A, B) = \sqrt{\sum_{p \in A}CDL_{A, B}(p)^2}.

    L’indice SSIM est calculé entre la référence et une gamme de versions compressées de cette référence. Trois algorithmes de compression sont comparés : JPEG, JPEG2000 et SPIHT :

    La même évaluation est réalisée avec l’indice IDG (avec WDOCS) :

    • Les courbes indiquent un comportement parfaitement cohérent de l’indice global IDG proposé. Ainsi, la qualité de la compression JPG est reconnue plus faible que JPEG2000 et SPIHT.
    • Les courbes IDG permettent de retrouver le résultat d’une autre étude 4 : la compression JPEG2000 n’est plus performante que JPEG qu’avec des taux de compression élevé (i.e. faibles bpp, sur la droite des abcisses) : zoomer sur l’image pour améliorer la lecture de ce comportement. Ce résultat n’est pas observable avec SSIM.


    Conclusion

    Les deux mesures proposées (locale et globale) ont donc de très bonnes performances. Selon moi, l’explication est que la carte de dissimilarité sont bien définie localement, contrairement aux indices globaux calculés localement. Pour ces indices globaux, aucun choix de taille de fenêtre n’est satisfaisant. Si une petite fenêtre est choisie, les valeurs de variances ou de moyennes (a la base du SSIM) ne signifie que peu de chose. Si une grande fenêtre est retenue, les (fines) structures ne sont pas observables. Dans les deux cas, le SSIM ne peut attraper les différences locales.

    Du bon comportement local de la CDL nous tirons une mesure globale qui finalement, possède également un bon comportement. Il me semble plus cohérent de déduire une information globale d’un ensemble d’informations locale, que le contraire.

    FMN.

    1. Thèse de doctorat de Yann Gaudeau : Contributions en compression d’images médicales 3D et d’images naturelles 2D, soutenue en 2006.

    2.

    • [2004,article] bibtex Go to document
      Z. Wang, A. C. Bovik, H. R. Sheikh, and E. P. Simoncelli, "Image quality assessment: from error visibility to structural similarity," Image Processing, IEEE Transactions on, vol. 13, iss. 4, pp. 600-612, 2004.
      @article{Wang2004,
        author = {Wang, Zhou and Bovik, A. C. and Sheikh, H. R. and Simoncelli, E. P.},
        journal = {Image Processing, IEEE Transactions on},
        keywords = {ssim, sync},
        number = {4},
        pages = {600--612},
        title = {Image quality assessment: from error visibility to structural similarity},
        url = {http://dx.doi.org/10.1109/TIP.2003.819861},
        volume = {13},
        year = {2004}
      }

    3.

    • [2009,inproceedings] bibtex Go to document
      F. Morain-Nicolier, J. Landré, and S. Ruan, "Binary Symbol Recognition from Local Dissimilarity Map," in 8th International Workshop on Graphic Recognition (GREC2009), La Rochelle, France, 2009, pp. 143-148.
      @INPROCEEDINGS{Nicolier2009,
        author = {F. Morain-Nicolier and J. Landr\'e and S. Ruan},
        title = {Binary Symbol Recognition from Local Dissimilarity Map},
        booktitle = {8th International Workshop on Graphic Recognition (GREC2009)},
        year = {2009},
        pages = {143--148},
        address = {La Rochelle, France},
        month = {jul},
        url = {http://pixel-shaker.fr/wp-content/uploads/publications/Nicolier2009.pdf}
      }

    4.

    • [2007,article] bibtex
      Y. H. Shiao, T. J. Chen, K. S. Chuang, C. H. Lin, and C. C. Chuang, "Quality of compressed medical images," Journal of Digital Imaging, vol. 20, iss. 2, pp. 149-159, 2007.
      @article{Shiao2007,
        author = {Shiao, Y.H. and Chen, T.J. and Chuang, K.S. and Lin, C.H. and Chuang, C.C.},
        journal = {Journal of Digital Imaging},
        number = {2},
        pages = {149--159},
        title = {Quality of compressed medical images},
        volume = {20},
        year = {2007}
      }

    Tags: , , , , ,

    Envoi de soumissions de communications

    février 25th, 2009 by fmn | No Comments | Filed in Recherche

      Ces dernières semaines furent assez intenses. Une saison de soumission à des conférences se termine. Plusieurs conférences proposaient un deadline fin janvier – début février. Comme plusieurs idées et résultats personnels et/ou collectifs n’avaient encore pas été publiés, avec des collègues nous avons soumis des communications aux conférences suivantes :

      • ICDAR. Une soumission avec le groupe CALYPOD portant sur une vue d’ensemble de moyens permettant de faire de la recherche par le contenu d’images ornementales. Une seconde soumission avec J. Landré sur un essai de segmentation/reconnaissance de lettre dans des images de lettrines.
      • MCBMS. Une proposition portant sur l’évaluation de performance de techniques de compression d’images médicales. Avec J. Landré nous montrons comment utiliser la carte de dissimilarité locale pour estimer localement et globalement les erreurs dues à l’application de compression avec pertes. La méthode est intéressante car permet de localiser ces erreurs. Nous utilisons dans ce papier une extension de la carte de dissimilariré locale aux images en niveaux de gris.
      • GRETSI. Deux soumissions dont une décrivant comment construire un détecteur d’objet à partir de la carte de dissimilarité locale. Le détecteur proposé possède plusieurs bonnes propriétés : rapide à calculer, moins de risque de “faux positifs” que le chamfer matching. Une interprétation du fonctionnement de ce détecteur est liée à la notion de similarité chez Tversky. En particulier sur l’aspect asymétrique de ce concept.

      Reste a attendre le résultat de ces soumissions.

      FMN.

      Tags: , ,