Subscribe RSS

Posts Tagged ‘similarité’

Similarité ou ressemblance?

mars 5th, 2010 by fmn | No Comments | Filed in Recherche

    L’asymétrie est une propriété essentielle du jugement humain de la similarité entre deux concepts ou stimuli, comme l’a illustré et modélisé Amos Tversky 1. Dans un exemple, maintenant classique, Tversky compare politiquement la Corée du Nord et la Chine. Deux propositions sont possibles :

    (Exemple 1)

    (a) La Chine est similaire à la Corée du Nord.
    (b) La Corée du Nord est similaire à la Chine.

    Ces deux propositions ne sont pas équivalentes, la même importance ne leur est pas attachée. Cette asymétrie est observée pour nombreux exemples, y compris pour des stimuli visuels 2.

    Si l’existence de cette asymétrie n’est pas contestable, il n’est pas forcément immédiat de la sentir dans les propositions (a) et (b). Mon avis est que le terme similarité ne permet pas, en français, de bien sentir cette directivité. Je propose d’utiliser à la place le terme ressemblance (ou le verbe ressembler):

    (Exemple 2)

    (a) La Chine ressemble à la Corée du Nord.
    (b) La Corée du Nord ressemble à la Chine.

    Je trouve ainsi beaucoup plus clair dans l’exemple (2) que la proposition (b) semble plus conforme à la réalité que la proposition (a). La similarité de la Chine à la Corée du Nord est plus grande que la similarité de la Corée du Nord à la Chine.

    L’interprétation de Tversky est que la ressemblance (similarity) entre la variante et le prototype est plus faible qu’entre le prototype à la variante. Je ferai de cette interprétation l’objet de mon prochain billet.

    FMN.

    1.

    • [1977,article] bibtex
      A. Tversky, "Features of similarity," Psychological Review, vol. 84, pp. 327-352, 1977.
      @article{Tversky77,
        author = {A. Tversky},
        title = {Features of similarity},
        journal = {Psychological Review},
        volume = {84},
        pages = {327--352},
        year = {1977}
      }

    2.

    • [1975,article] bibtex Go to document
      E. Rosch, "Cognitive reference points," Cognitive Psychology, vol. 7, iss. 4, pp. 532-547, 1975.
      @article{Rosch75,
        author = {Rosch, Eleanor},
        citeulike-article-id = {1116906},
        citeulike-linkout-0 = {http://dx.doi.org/10.1016/0010-0285(75)90021-3},
        doi = {10.1016/0010-0285(75)90021-3},
        journal = {Cognitive Psychology},
        keywords = {\_d\_cognitive-biases, \_d\_deep-concepts, category-learning-use, empirical},
        month = {October},
        number = {4},
        pages = {532--547},
        posted-at = {2007-02-21 19:54:24},
        priority = {2},
        title = {Cognitive reference points},
        url = {http://dx.doi.org/10.1016/0010-0285(75)90021-3},
        volume = {7},
        year = {1975}
      }

    Tags: ,

    Évaluation de la qualité d’images compressées avec des dissimilarités locales et globales

    septembre 17th, 2009 by fmn | 1 Comment | Filed in Recherche

      Le contenu de ce billet est issu d’une communication au colloque GRETSI en 2009 :

      • [2009,inproceedings] bibtex Go to document
        F. Morain-Nicolier, J. Landré, and S. Ruan, "Dissimilarités locales et globales pour évaluer la qualité d’images médicales compressées avec pertes," in XXIIe Colloque GRETSI, Dijon, 2009.
        @INPROCEEDINGS {Nicolier2009b,
          author = {Morain-Nicolier, F. and Landré, J. and Ruan, S.},
          title = {Dissimilarit{\'e}s locales et globales pour {\'e}valuer la qualit{\'e} d'images m{\'e}dicales compress{\'e}es avec pertes},
          booktitle = {XXIIe Colloque GRETSI},
          address = {Dijon},
          month = {sep},
          year = {2009},
          url = {http://pixel-shaker.fr/wp-content/uploads/publications/Nicolier2009b.pdf}
        }


      Mise en situation

      Lorsque l’on compare deux images, il est parfois essentiel de pouvoir localiser les zones où les deux images se ressemblent et celles où elles diffèrent. Cependant, la plupart des méthodes fournissant une mesure de similarité (au sens le plus général possible) produisent un nombre unique. Ce scalaire est censé renseigner sur la qualité de la ressemblance entre les deux images considérées. Cette mesure, globale, est incapable de rendre compte finement des écarts :

      Exemple de deux images localement différentes
      Exemple de deux images localement différentes (images libres de droit obtenues sur Wikimedia Commons)

      Seule une mesure locale, peut permettre d’extraire l’information suivante : les deux images sont identiques par rapport à leurs moitiés supérieures et différentes par rapport à leurs moitiés inférieures.

      En dehors de ce cas un peu artificiel, de nombreuses applications nécessitent de localiser les similarités. Par exemple, dans le domaine de l’imagerie médicale, le volume de données généré en une année peut se mesurer en tera-octets1. L’utilisation de méthodes de compression est donc indispensable. Pour obtenir des taux de compression véritablement utiles, les compressions avec pertes sont actuellement à l’étude. Cependant, des problèmes peuvent se poser en termes de diagnostic. En effet, le principal écueil avec ce type de codage (avec pertes) est la potentielle disparition ou application de détails important. Quelle peut-être l’utilité de compresser des images, si leur archivage empêche toute analyse ultérieure?

      Wang et al. 2 ont récemment proposé d’évaluer la qualité d’une image en mesurant un indice global de similarité structurelle (structural similarity indexSSIM). Cet indice possède de nombreuse propriétés intéressantes, et est donc de plus en plus largement employé. Mais il reste une mesure globale. Dans leur article, les auteurs proposent de rendre locale la mesure en réalisant le calcul de l’indice dans une fenêtre glissante. Cela est une approche très classique. Le gros reproche de cette “localisation” porte sur le choix de la taille de la fenêtre glissante.

      Précédemment3, nous avons introduit une mesure de dissimilarité locale permettant la comparaison d’images binaires. Une carte de dissimilarités locales (CDL) est ainsi construite en utilisant une une fenêtre glissante de taille auto-adaptative (voir le billet précédent par exemple).


      Carte de dissimilarités locales pour images en niveaux de gris

      Initialement, la CDL a été mise au point pour comparer des images binaires. La formule suivante est une expression de la CDL qui permet un calcul rapide (voir 3 pour les détails) :

       \mathrm{CDL}_{A, B} (x, y) = |A (x, y) - B (x, y) | \max (\mathrm{dt}_A (p), \mathrm{dt}_B (p))

      \mathrm{dt}_X est la transformée en distance de l’image X. Bien qu’initialement mise au point pour des images binaires, nous transposons cette définition dans le cas d’images en niveaux de gris. Ce passage est immédiat puisqu’il suffit d’utiliser la définition d’une transformée en distance d’une image en niveaux de gris. Il existe actuellement (à notre connaissance) plusieurs alternatives. Le choix portant sur la distance sous-jacente entre deux pixels :

      • GWDT (Gray Weighted Distance Transform) : la distance est l’intégrale des niveaux de gris entre les deux pixels 6. :

       d_{GWD}(a, b) = \frac{1}{2} (I(a) + I(b)) \times || a - b ||

      ||a-b|| est la distance spatiale entre les deux pixels a et b, I(a) est le niveau de gris du pixel a.

      • WDTOCS (Weighted Distance Transform On Curved Space) : la distance est la longueur du chemin géodésique entre les deux pixels 4 :

       d_{WDOCS}(a, b) = \sqrt{\left(I(a) + I(b)\right)^2 + || a - b ||^2}.

      Ces deux transformées peuvent être calculées rapidement, avec une très bonne approximation, par un algorithme ne parcourant l’image que deux fois. La formule de la CDLng est donc la même que la CDL binaire :

       \mathrm{CDLng}_{A, B} (x, y) = |A (x, y) - B (x, y) | \max (\mathrm{dt}_A (p), \mathrm{dt}_B (p))

      Appliquons cette CDLng à l’évaluation locale puis globale de la qualité d’images compressées.


      Estimation locale de la qualité de compression :

      Une image CT (Computed Tomography) est choisie comme référence et compressée par JPEG2000 à 0,16bpp (bits par pixels) :

      La compression introduit des perturbations, notamment au niveau de certaines structures. Calculons l’indice SSIM (pour deux tailles de fenêtre) entre la référence et l’image reconstruite :

      Images comparées avec SSIM local (taille 7 et 15)
      Images comparées avec SSIM local (taille 7 et 15)

      Même comparaison mais avec deux CDLng (avec GWD et WTDOCS) :

      Image SSIM local (taille 7 et 15)
      Image SSIM local (taille 7 et 15)

      Commentaires :

      • Aucune localisation de distorsions n’est satisfaisante avec l’indice SSIM . Seule une grande taille de fenêtre (15 x 15) permet d’obtenir des informations. Cependant, la grande taille de fenêtre induit un effet de lissage qui interdit toute localisation précise.
      • Pour les deux cartes CDL, les structures distordues sont clairement mises en évidence. Le compromis inhérent à l’indice SSIM local (lié au choix de la taille de la fenêtre glissante) n’existe pas.


      Estimation globale

      Nous construisons un indice de dissimilarité globale (IDG) en agrégeant les mesures de la CDLng :

       IDG(A, B) = \sqrt{\sum_{p \in A}CDL_{A, B}(p)^2}.

      L’indice SSIM est calculé entre la référence et une gamme de versions compressées de cette référence. Trois algorithmes de compression sont comparés : JPEG, JPEG2000 et SPIHT :

      La même évaluation est réalisée avec l’indice IDG (avec WDOCS) :

      • Les courbes indiquent un comportement parfaitement cohérent de l’indice global IDG proposé. Ainsi, la qualité de la compression JPG est reconnue plus faible que JPEG2000 et SPIHT.
      • Les courbes IDG permettent de retrouver le résultat d’une autre étude 4 : la compression JPEG2000 n’est plus performante que JPEG qu’avec des taux de compression élevé (i.e. faibles bpp, sur la droite des abcisses) : zoomer sur l’image pour améliorer la lecture de ce comportement. Ce résultat n’est pas observable avec SSIM.


      Conclusion

      Les deux mesures proposées (locale et globale) ont donc de très bonnes performances. Selon moi, l’explication est que la carte de dissimilarité sont bien définie localement, contrairement aux indices globaux calculés localement. Pour ces indices globaux, aucun choix de taille de fenêtre n’est satisfaisant. Si une petite fenêtre est choisie, les valeurs de variances ou de moyennes (a la base du SSIM) ne signifie que peu de chose. Si une grande fenêtre est retenue, les (fines) structures ne sont pas observables. Dans les deux cas, le SSIM ne peut attraper les différences locales.

      Du bon comportement local de la CDL nous tirons une mesure globale qui finalement, possède également un bon comportement. Il me semble plus cohérent de déduire une information globale d’un ensemble d’informations locale, que le contraire.

      FMN.

      1. Thèse de doctorat de Yann Gaudeau : Contributions en compression d’images médicales 3D et d’images naturelles 2D, soutenue en 2006.

      2.

      • [2004,article] bibtex Go to document
        Z. Wang, A. C. Bovik, H. R. Sheikh, and E. P. Simoncelli, "Image quality assessment: from error visibility to structural similarity," Image Processing, IEEE Transactions on, vol. 13, iss. 4, pp. 600-612, 2004.
        @article{Wang2004,
          author = {Wang, Zhou and Bovik, A. C. and Sheikh, H. R. and Simoncelli, E. P.},
          journal = {Image Processing, IEEE Transactions on},
          keywords = {ssim, sync},
          number = {4},
          pages = {600--612},
          title = {Image quality assessment: from error visibility to structural similarity},
          url = {http://dx.doi.org/10.1109/TIP.2003.819861},
          volume = {13},
          year = {2004}
        }

      3.

      • [2009,inproceedings] bibtex Go to document
        F. Morain-Nicolier, J. Landré, and S. Ruan, "Binary Symbol Recognition from Local Dissimilarity Map," in 8th International Workshop on Graphic Recognition (GREC2009), La Rochelle, France, 2009, pp. 143-148.
        @INPROCEEDINGS{Nicolier2009,
          author = {F. Morain-Nicolier and J. Landr\'e and S. Ruan},
          title = {Binary Symbol Recognition from Local Dissimilarity Map},
          booktitle = {8th International Workshop on Graphic Recognition (GREC2009)},
          year = {2009},
          pages = {143--148},
          address = {La Rochelle, France},
          month = {jul},
          url = {http://pixel-shaker.fr/wp-content/uploads/publications/Nicolier2009.pdf}
        }

      4.

      • [2007,article] bibtex
        Y. H. Shiao, T. J. Chen, K. S. Chuang, C. H. Lin, and C. C. Chuang, "Quality of compressed medical images," Journal of Digital Imaging, vol. 20, iss. 2, pp. 149-159, 2007.
        @article{Shiao2007,
          author = {Shiao, Y.H. and Chen, T.J. and Chuang, K.S. and Lin, C.H. and Chuang, C.C.},
          journal = {Journal of Digital Imaging},
          number = {2},
          pages = {149--159},
          title = {Quality of compressed medical images},
          volume = {20},
          year = {2007}
        }

      Tags: , , , , ,

      Reconnaissance de symboles binaires par mesure de dissimilarités locales

      août 31st, 2009 by fmn | 2 Comments | Filed in Recherche

        Ce billet est un résumé de la communication présentée à GREC2009 en juillet 2009 :

        • [2009,inproceedings] bibtex Go to document
          F. Morain-Nicolier, J. Landré, and S. Ruan, "Binary Symbol Recognition from Local Dissimilarity Map," in 8th International Workshop on Graphic Recognition (GREC2009), La Rochelle, France, 2009, pp. 143-148.
          @INPROCEEDINGS{Nicolier2009,
            author = {F. Morain-Nicolier and J. Landr\'e and S. Ruan},
            title = {Binary Symbol Recognition from Local Dissimilarity Map},
            booktitle = {8th International Workshop on Graphic Recognition (GREC2009)},
            year = {2009},
            pages = {143--148},
            address = {La Rochelle, France},
            month = {jul},
            url = {http://pixel-shaker.fr/wp-content/uploads/publications/Nicolier2009.pdf}
          }


        Introduction

        Dans des travaux antérieurs 1, avec Étienne Baudrier, nous avons proposé une mesure de dissimilarités locales entre images binaires. Cette mesure permet de localiser et de quantifier les différences entre deux images. Un des derniers résultats de la thèse d’Étienne fut d’obtenir une formule rapide de la Carte de Dissimilarités Locales (CDL):

         \mathrm{CDL}_{A, B} (p) = \|A (p) - B (p) \| \max (\mathrm{dt}_A (p), \mathrm{dt}_B (p))

        \mathrm{dt}_X est la transformée en distance de l’image X. Je montre que cette formule peut être linéarisée en :

         \mathrm{CDL}_{A, B} = B \mathrm{dt}_A + A \mathrm{dt}_B .

        Cette formulation est particulièrement intéressante puisque les opérateurs \max es \mathrm{abs} sont éliminés. Ce qui permet une implémentation très rapide dans le domaine de Fourier et ouvre la voie à la localisation de motifs.


        Comment appliquer la CDL à la reconnaissance de symboles

        Le problème est de choisir dans une bibliothèque de modèles, celui qui ressemble le plus à une image donnée. La solution retenue ici est de construire un scalaire représentatif de la dissimilarité entre I et M (un des modèles), puis de choisir le modèle dont la dissimilarité est la plus faible. Le scalaire est calculé par une somme des valeurs de la CDL:

         \sum_p CDL^{}_{I, M} (p)^{} = \sum_p M(p) \mathrm{dt}_I(p) + \sum_p I(p) \mathrm{dt}_M(p).

        Cette équation peut être interprétée comme un Chamfer Matching (CS) symétrique. Le Chamfer Score :

         \mathrm{CS}(I, M) = \frac{1}{N} \sum_p M(p) \mathrm{dt}_I(p)

        mesure comment l’image I est dissimilaire au modèle M. Autrement dit, c’est une mesure de la ressemblance de I à M. Une comparaison des équations du CS et de la somme des valeurs de la CDL montre que la mesure globale est une mesure de :

        • la ressemblance de I à M,
        • et de la ressemblance de M à I.
          La mesure globale est symétrique, mais l’introduction de pondérations permet d’obtenir une mesure flexible, la Mesure de Dissimilarités Globale (MDG) :

         \mathrm{MDG}(I, M) = \alpha \sum_p M(p) \mathrm{dt}_I^2(p) + \beta \sum_p I(p) \mathrm{dt}_M^2(p).

        Des sommes quadratiques sont employées pour améliorer la détection. Le choix des facteurs \alpha et \beta dépend de la mesure qui est nécessaire. Une mesure symétrique est obtenue si \alpha = \beta. Cette introduction possible d’asymétrie dosée permet d’obtenir une mesure se rapprochant de certains résultats de psychologie (voir Tversky entre autres).


        Reconnaissance robuste aux changements d’échelle et d’orientation par estimation log-polaire

        La mesure proposée n’est effective qu’avec des symboles de taille et d’orientation comparables. La CDL est une mesure robuste aux petites variations. Elle n’est donc robuste qu’au petits changements d’échelle et d’orientation. Pour comparer des symboles quelconques, une estimation de la déformation est réalisée dans le plan log-polaire. Ce recalage permet d’obtenir les paramètres d’homothétie et de rotation. Un recalage permet alors d’aligner les deux symboles au mieux.


        L’algorithme final complet

        1. Calculer Ilp la représentation log-polaire de I.
        2. Pour chaque modèle M :
          • calculer Mlp la représentation log-polaire de M,
          • estimer les paramètres de déformation entre Ilp et Mlp
          • effectuer le recalage de M
          • calculer la dissimilarité MDG entre I et le modèle recalé.
        3. Choisir le modèle avec la dissimilarité la plus faible.


        Cet algorithme est efficace (mais pas partout)

        Cette méthode est testé sur la base de symboles du grec2005 international symbol recognition contest. Six dégradations différentes sont disponibles. La série utilisée comporte 50 images contenant un symbole à reconnaître parmi 50.


        Quelques (bons) exemples de recalage

        Exemple de symbole recalé sous la dégradation n°1
        Exemple de symbole recalé sous la dégradation n°1
        Exemple de symbole recalé sous la dégradation n°2
        Exemple de symbole recalé sous la dégradation n°2
        Exemple de symbole recalé sous la dégradation n°3
        Exemple de symbole recalé sous la dégradation n°3
        Exemple de symbole recalé sous la dégradation n°4
        Exemple de symbole recalé sous la dégradation n°4
        Exemple de symbole recalé sous la dégradation n°5
        Exemple de symbole recalé sous la dégradation n°5
        Exemple de symbole recalé sous la dégradation n°6
        Exemple de symbole recalé sous la dégradation n°6


        Quelques résultats qui montrent que l’algortithme n’est pas très efficace s’il faut recaler

        Taux de réussite :

        Dégradation n° 1 2 3 4 5 6
        sans rotation/échelle 100% 100% 100% 100% 100% 54%
        avec rotation/échelle 96% 40% 94% 70% 42% 12%
        • Si les symboles sont de taille et orientation comparable, la méthode est très efficace. Dans le contest la meilleure performance pour la déformation 6 est de 59.81%. Les scores que nous obtenons sont donc intéressants.
        • Dans le cas de rotations/homothéties plus conséquentes les scores sont assez variés, parfois bons parfois mauvais. La cause d’échec est le plus souvent un mauvais recalage, ce qui compromet forcément la comparaison qui suit.
        • Aucune hypothèse n’est nécessaire sur les symboles et aucune segmentation n’est nécessaire.


        Discussion et travail à fournir

        • Je considère que la validité de la mesure de dissimilarité est faite puisque les performances sont mauvaises dans le cas où le recalage n’est pas bon.
        • Cependant pour le moment cette mesure n’est toujours pas robuste aux grands changements d’échelle et de rotation. Il faut étudier plus précisément la robustesse à ces changements. Il serait ainsi efficace d’évaluer l’erreur en fonction d’une variation d’échelle ou de rotation, pour déterminer la variation de rotation (ou d’échelle) supportable. Un nombre de patrons suffisant pourrait alors être déterminé. Est-ce que cette variation supportable dépend du contenu de l’image?
        • Une piste temporaire sera de tester la mesure de dissimilarité entre les deux images, directement dans le plan log-polaire, pour éviter l’étape de recalage.
        • Une formule rapide et flexible de la mesure de (dis)similarité entre deux images a été obtenues, locale ou globale. Il reste à étudier l’influence et l’efficacité du choix de pondération plus graduée. Par exemple \alpha = 0.1 et \beta = 0.9. Mon idée est que la robustesse au bruit risque de varier avec ces poids.

        FMN.

        1.

        • [2008,article] bibtex Go to document
          E. Baudrier, F. Nicolier, G. Millon, and S. Ruan, "The Adaptative Local Hausdorff-Distance Map as a new Dissimilarity Measure," Pattern Recognition, vol. 41, iss. 5, pp. 1461-1478, 2008.
          @ARTICLE{Baudrier2008,
            author = {E. Baudrier and F. Nicolier and G. Millon and S. Ruan},
            title = {The Adaptative Local Hausdorff-Distance Map as a new Dissimilarity Measure},
            journal = {Pattern Recognition},
            year = {2008},
            volume = {41},
            pages = {1461--1478},
            number = {5},
            month = {may},
            url = {http://pixel-shaker.fr/wp-content/uploads/publications/Baudrier2008.pdf}
          }

        Tags: , , , ,