Subscribe RSS

Posts Tagged ‘bibliographie’

Une liste de lecture issue de CVPR2010

juin 15th, 2010 by fmn | No Comments | Filed in Recherche

    En ce moment a lieu la conférence CVPR (Computer Vision and Pattern Recognition). Il s’agit d’une des conférences les plus importantes dans le domaine de l’analyse et du traitement d’image; traitant d’ailleurs plus de l’analyse que du traitement.

    Je ne pourrais malheureusement pas y être présent, entre autres parce que je n’y ai pas soumis de communication. Cela est d’autant plus dommage que l’édition 2010 a lieu à San Francisco, une ville que j’ai eu l’occasion d’apprécier en 1999.

    Cependant, la plupart des pdf sont en ligne sur le site de cvpapers (http://www.cvpapers.com/cvpr2010.html). Voici les principales communications qui sont placées dans ma liste de lecture (concernant de près ou de loin la similarité visuelle) :

    • Detecting and Sketching the CommonShai Bagon, Or Brostovski, Meirav Galun, Michal Irani (PDF).
      Les auteurs souhaitent détecter un éventuel objet commun à un faible nombre d’images. Il semble qu’ils utilisent des descripteurs d’auto-similarité pour cela.
    • What is an object? – Bogdan Alexe, Thomas Deselaers, Vittorio Ferrari (PDF)
      Typiquement le genre de réflexion que j’affectionne, à rapprocher de mon billet « Qu’est ce qu’une bonne forme? Qu’est ce qu’une figure saillante?.
    • Unsupervised Detection and Segmentation of Identical Objects - Minsu Cho, Kyoung Mu Le (PDF).
      A première vue, leur méthode me semble assez lourde (SIFT + réseau bayésien), mais je réserve mon avis pour le moment.
    • Global and Efficient Self-Similarity for Object Classification and DetectionThomas Deselaers, Vittorio Ferrari (PDF).
      A lire pour connaître leur définition de l’auto-similarité. Il semble que les auteurs discutent d’auto-similarité locale versus globale.
    • Fast Directional Chamfer Matching – Ming-Yu Liu, Oncel Tuzel, Ashok Veeraraghavan, Rama Chellappa (PDF – dispo sur le site de Ming-Yu Liu).
      Une étude d’un enrichissement du Chamger matching par ajout de l’information d’orientation des contours.

    Il y a également une série de papiers à parcourir, exploitant des descripteurs visuels. Bref, de la lecture en perspective.

    FMN.

    ps : a noter que Tomasz Malisiewicz postera des billets sur CVPR.

    Tags: , , ,

    Un nouveau journal libre d’accès : IPSJ Transactions on Computer Vision and Applications

    janvier 4th, 2010 by fmn | No Comments | Filed in Recherche

    L’année commence bien puisqu’un nouveau journal vient de naitre : IPSJ Transactions on Computer Vision and Applications.

    Comme son nom l’indique, les domaines couverts sont ceux du traitement et de l’analyse d’images. Assez classique somme toute. Sauf que la particularité de ce journal est d’être en ligne et libre d’accès. Ainsi toutes les articles sont disponibles, ils peuvent être lus, téléchargés et imprimés gratuitement. Si l’intérêt pour le lecteur est évident, les éditeurs espèrent ainsi obtenir une bonne visibilité pour leur journal. On leur souhaite de réussir (c’est pour cela que j’en fait la publicité).

    Dans le premier numéro, j’ai pour ma part relevé et placé dans ma liste de lecture les articles suivants :

    • Content-based Image Retrieval by Indexing Random Subwindows with Randomized Trees (Raphaël Marée, Pierre Geurts et Louis Wehenkel)
    • A Survey of Manifold Learning for Images (Robert Pless et Richard Souvenir)
    • Partial Similarity of Shapes Using a Statistical Significance Measure (Alexander M. Bronstein, Michael M. Bronstein, Yair Carmon et Ron Kimmel)
    • et Using Context to Recognize People in Consumer Images (Andrew C. Gallagher et Tsuhan Chen)

    Pour un premier numéro, j’y trouve donc mon compte.

    FMN.

    Tags: , ,

    Reconnaissance de symboles binaires par mesure de dissimilarités locales

    août 31st, 2009 by fmn | 2 Comments | Filed in Recherche

      Ce billet est un résumé de la communication présentée à GREC2009 en juillet 2009 :

      • [2009,inproceedings] bibtex Go to document
        F. Morain-Nicolier, J. Landré, and S. Ruan, "Binary Symbol Recognition from Local Dissimilarity Map," in 8th International Workshop on Graphic Recognition (GREC2009), La Rochelle, France, 2009, pp. 143-148.
        @INPROCEEDINGS{Nicolier2009,
          author = {F. Morain-Nicolier and J. Landr\'e and S. Ruan},
          title = {Binary Symbol Recognition from Local Dissimilarity Map},
          booktitle = {8th International Workshop on Graphic Recognition (GREC2009)},
          year = {2009},
          pages = {143--148},
          address = {La Rochelle, France},
          month = {jul},
          url = {http://pixel-shaker.fr/wp-content/uploads/publications/Nicolier2009.pdf}
        }


      Introduction

      Dans des travaux antérieurs 1, avec Étienne Baudrier, nous avons proposé une mesure de dissimilarités locales entre images binaires. Cette mesure permet de localiser et de quantifier les différences entre deux images. Un des derniers résultats de la thèse d’Étienne fut d’obtenir une formule rapide de la Carte de Dissimilarités Locales (CDL):

       \mathrm{CDL}_{A, B} (p) = \|A (p) - B (p) \| \max (\mathrm{dt}_A (p), \mathrm{dt}_B (p))

      \mathrm{dt}_X est la transformée en distance de l’image X. Je montre que cette formule peut être linéarisée en :

       \mathrm{CDL}_{A, B} = B \mathrm{dt}_A + A \mathrm{dt}_B .

      Cette formulation est particulièrement intéressante puisque les opérateurs \max es \mathrm{abs} sont éliminés. Ce qui permet une implémentation très rapide dans le domaine de Fourier et ouvre la voie à la localisation de motifs.


      Comment appliquer la CDL à la reconnaissance de symboles

      Le problème est de choisir dans une bibliothèque de modèles, celui qui ressemble le plus à une image donnée. La solution retenue ici est de construire un scalaire représentatif de la dissimilarité entre I et M (un des modèles), puis de choisir le modèle dont la dissimilarité est la plus faible. Le scalaire est calculé par une somme des valeurs de la CDL:

       \sum_p CDL^{}_{I, M} (p)^{} = \sum_p M(p) \mathrm{dt}_I(p) + \sum_p I(p) \mathrm{dt}_M(p).

      Cette équation peut être interprétée comme un Chamfer Matching (CS) symétrique. Le Chamfer Score :

       \mathrm{CS}(I, M) = \frac{1}{N} \sum_p M(p) \mathrm{dt}_I(p)

      mesure comment l’image I est dissimilaire au modèle M. Autrement dit, c’est une mesure de la ressemblance de I à M. Une comparaison des équations du CS et de la somme des valeurs de la CDL montre que la mesure globale est une mesure de :

      • la ressemblance de I à M,
      • et de la ressemblance de M à I.
        La mesure globale est symétrique, mais l’introduction de pondérations permet d’obtenir une mesure flexible, la Mesure de Dissimilarités Globale (MDG) :

       \mathrm{MDG}(I, M) = \alpha \sum_p M(p) \mathrm{dt}_I^2(p) + \beta \sum_p I(p) \mathrm{dt}_M^2(p).

      Des sommes quadratiques sont employées pour améliorer la détection. Le choix des facteurs \alpha et \beta dépend de la mesure qui est nécessaire. Une mesure symétrique est obtenue si \alpha = \beta. Cette introduction possible d’asymétrie dosée permet d’obtenir une mesure se rapprochant de certains résultats de psychologie (voir Tversky entre autres).


      Reconnaissance robuste aux changements d’échelle et d’orientation par estimation log-polaire

      La mesure proposée n’est effective qu’avec des symboles de taille et d’orientation comparables. La CDL est une mesure robuste aux petites variations. Elle n’est donc robuste qu’au petits changements d’échelle et d’orientation. Pour comparer des symboles quelconques, une estimation de la déformation est réalisée dans le plan log-polaire. Ce recalage permet d’obtenir les paramètres d’homothétie et de rotation. Un recalage permet alors d’aligner les deux symboles au mieux.


      L’algorithme final complet

      1. Calculer Ilp la représentation log-polaire de I.
      2. Pour chaque modèle M :
        • calculer Mlp la représentation log-polaire de M,
        • estimer les paramètres de déformation entre Ilp et Mlp
        • effectuer le recalage de M
        • calculer la dissimilarité MDG entre I et le modèle recalé.
      3. Choisir le modèle avec la dissimilarité la plus faible.


      Cet algorithme est efficace (mais pas partout)

      Cette méthode est testé sur la base de symboles du grec2005 international symbol recognition contest. Six dégradations différentes sont disponibles. La série utilisée comporte 50 images contenant un symbole à reconnaître parmi 50.


      Quelques (bons) exemples de recalage

      Exemple de symbole recalé sous la dégradation n°1
      Exemple de symbole recalé sous la dégradation n°1
      Exemple de symbole recalé sous la dégradation n°2
      Exemple de symbole recalé sous la dégradation n°2
      Exemple de symbole recalé sous la dégradation n°3
      Exemple de symbole recalé sous la dégradation n°3
      Exemple de symbole recalé sous la dégradation n°4
      Exemple de symbole recalé sous la dégradation n°4
      Exemple de symbole recalé sous la dégradation n°5
      Exemple de symbole recalé sous la dégradation n°5
      Exemple de symbole recalé sous la dégradation n°6
      Exemple de symbole recalé sous la dégradation n°6


      Quelques résultats qui montrent que l’algortithme n’est pas très efficace s’il faut recaler

      Taux de réussite :

      Dégradation n° 1 2 3 4 5 6
      sans rotation/échelle 100% 100% 100% 100% 100% 54%
      avec rotation/échelle 96% 40% 94% 70% 42% 12%
      • Si les symboles sont de taille et orientation comparable, la méthode est très efficace. Dans le contest la meilleure performance pour la déformation 6 est de 59.81%. Les scores que nous obtenons sont donc intéressants.
      • Dans le cas de rotations/homothéties plus conséquentes les scores sont assez variés, parfois bons parfois mauvais. La cause d’échec est le plus souvent un mauvais recalage, ce qui compromet forcément la comparaison qui suit.
      • Aucune hypothèse n’est nécessaire sur les symboles et aucune segmentation n’est nécessaire.


      Discussion et travail à fournir

      • Je considère que la validité de la mesure de dissimilarité est faite puisque les performances sont mauvaises dans le cas où le recalage n’est pas bon.
      • Cependant pour le moment cette mesure n’est toujours pas robuste aux grands changements d’échelle et de rotation. Il faut étudier plus précisément la robustesse à ces changements. Il serait ainsi efficace d’évaluer l’erreur en fonction d’une variation d’échelle ou de rotation, pour déterminer la variation de rotation (ou d’échelle) supportable. Un nombre de patrons suffisant pourrait alors être déterminé. Est-ce que cette variation supportable dépend du contenu de l’image?
      • Une piste temporaire sera de tester la mesure de dissimilarité entre les deux images, directement dans le plan log-polaire, pour éviter l’étape de recalage.
      • Une formule rapide et flexible de la mesure de (dis)similarité entre deux images a été obtenues, locale ou globale. Il reste à étudier l’influence et l’efficacité du choix de pondération plus graduée. Par exemple \alpha = 0.1 et \beta = 0.9. Mon idée est que la robustesse au bruit risque de varier avec ces poids.

      FMN.

      1.

      • [2008,article] bibtex Go to document
        E. Baudrier, F. Nicolier, G. Millon, and S. Ruan, "The Adaptative Local Hausdorff-Distance Map as a new Dissimilarity Measure," Pattern Recognition, vol. 41, iss. 5, pp. 1461-1478, 2008.
        @ARTICLE{Baudrier2008,
          author = {E. Baudrier and F. Nicolier and G. Millon and S. Ruan},
          title = {The Adaptative Local Hausdorff-Distance Map as a new Dissimilarity Measure},
          journal = {Pattern Recognition},
          year = {2008},
          volume = {41},
          pages = {1461--1478},
          number = {5},
          month = {may},
          url = {http://pixel-shaker.fr/wp-content/uploads/publications/Baudrier2008.pdf}
        }

      Tags: , , , ,