Category Archives: Recherche

La fin de la vision industrielle?

    En lisant ce matin le dernier numéro (nov. 2011) de Photonics Spectra, j'ai commencé par être fâché par la lecture de l'article "Vision software drives manufacturing" de Lynn Savage. Puis en réfléchissant, j'en ai tiré une prédiction réjouissante.

    L'article traite de l'actualité de la vision industrielle. Voici les extraits qui m'ont fait réagir :

    People new to machine vision technology might have a small amount of difficulty understanding the software that drives it, but it is not a big problem (John Perry, Senior manager at Cogex Corp in )

    (trad.) Les nouveaux venus en vision industrielle peuvent avoir quelques difficultés à comprendre les algorithmes, mais ce n'est pas un gros problème.

    Many of theses tasks [...] have been set in stone for some time now. The major challenges are keeping up with customers demands and the ever-evolving computers that running the show.

    (trad.) La plupart de ces méthodes ont été gravées dans le marbre depuis quelque temps maintenant. Les défis majeurs consistent à être en phase avec les clients et avec l'évolution des ordinateurs.

    "Surprising, the most popular features of Open eVision are still the first librairies that we have developped" (Marc Damhaut, Euresys)

    (trad.) De façon surprenante, les fonctionnalités d'Open eVision les plus populaires sont encore maintenant celles que nous avons développé en premier.

    Ma première réaction a été la surprise.

    Il apparaît que les utilisateurs finaux industriels, n'emploient pas de méthodes évoluées. Est-ce parce qu'il n'en ont pas l'usage, ou bien parce qu'ils ne les maitrisent pas?

    Cependant, il semble bien que la vision n'est plus un problème pour l'industrie. Les méthodes sont là. Il ne reste que des problèmes de coûts de calculs.

    Est-ce pour autant la fin de la recherche en traitement d'image? Clairement non, c'est même peut-être une bonne nouvelle pour la discipline. Car si les industriels ne sont plus demandeurs, cela va permettre à (ou obliger) la discipline de sortir du coté applicatif, pour se concentrer sur ses fondamentaux, qui ne sont pas la recherche de solutions à des problèmes pratiques.

    Mais alors quels sont-ils ces fondamentaux? C'est une excellente question. D'ailleurs en tant que discipline scientifique, qu'est-ce que le traitement d'image? Je proposerai ma réflexion dans de prochains billets.

    FMN.

    Note de lecture : Comparative study of metrics for evaluation of object localisation by bounding boxes [Hemery 2007]

      Hemery, B., Laurent, H. & Rosenberger, C., 2007, Image and Graphics, 2007. ICIG 2007. Fourth International Conference on, Comparative study of metrics for evaluation of object localisation by bounding boxes. pp. 459–64.

      Méthodologie/Résultats principaux

      Comparaison de métriques pour des tâches de localisation à l’aide des boites englobantes (bounding boxes). Le papier donne des éléments de réponse à la question : comment se comportent 26 mesures dans une tâche de localisation?.

      La tâche de localisation est simulée par une image vérité terrain (binaire) et en l’altérant en translations, rotations et homothéties.

      Les résultats sont donnés sous la forme de tableau assez instructifs :

      Variations en translation verticale

      t

      • Les mesures sont symétriques, ne permettant ainsi pas de différencier le sens de la translation. Plus exactement la différenciation est impossible car les valeurs sont toutes positives.
      • Certaines mesures ne permettent pas de distinguer une translation de un pixel, d’une autre de x pixels. Ce sont celles qui présentent des plages (quasi-)constantes.
      • La distance de Hausdorff pénalise les très grandes translations. Ce résultat est étrange à deux titres. 1/ la pente augmente avec l’altération, ce qui fait qu’une variation d’altération à petite altération est peu perceptible. Donc la pénalisation est plutôt sur les petites variations. 2/Preuve est faite que la distance de Hausdorff varie linéairement avec la translation, ce que l’on observe pas sur le graphique suivant :

      Pasted Graphic 5

      Variations en homothétie verticale

      a

      Variations en rotation

      Pasted Graphic 2

      Au final

      Pasted Graphic 3

      Avantages/Intérêt

      • Une comparaison objective bien menée

      A retenir :

      • Variation linéaire : cas le plus intéressant
      • Pénalisation des petites ou des grandes altérations (en fonction de la forme de la variation) : variations logarithmiques / exponentielles.

      Désavantages/Critique

      • Restrictions aux seules transformations géométriques. Par exemple le très grande sensibilité de la distance de Hausdorff aux outliers n’apparait pas.
      • Pas de mélange des transformations (ex : rotation + translation)
      • Un doute sur l'interprétation des pénalisations des petites/grandes variations (amha).

      FMN.

      Note de lecture : Phase congruence measurement for image similarity assessment [Liu 2007]

        Liu, Z. & Laganière, R., 2007, Phase congruence measurement for image similarity assessment, Pattern recognition letters, 28(1), pp. 166–72.

        Méthodologie/Résultats principaux

        Mesure de similarité entre deux images à partir de la congruence de phase, qui constitue une mesure de caractéristiques telles que : contours, lignes et bandes de Mach. L’argument est que les caractéristiques importantes perçues dans une image sont celles où les composantes fréquentielles sont en phase. La congruence de phase est insensible aux variations de luminosité.

        La carte de congruence de phase me parait furieusement ressembler à une image des contours :

        Pc

        La mesure est obtenue avec le calcul d’un coefficient de corrélation normalisé (ZNCC) entre les deux cartes de congruence de phase (pour chaque image) :

        ZNCC

        La comparaison avec d’autres méthodes (RMSE, SSIM, CORR, …) consiste à construire des variantes d’une image à MSE constant. Dans ce cas, la congruence de phase, comme le SSIM permet de différencier les variantes. Dans une autre étude menée dans un cadre de contrôle non-destructif d’images à rayons-X, la congruence de phase est discriminante, au contraire du SSIM.

        Avantages/Intérêt:

        • Un descripteur Une représentation insensible aux variations de luminosité et de contraste.
        • Un exemple de non-fonctionnement du SSIM

        Désavantages/Critique:

        • Comparaison assez pauvre (coefficient de corrélation)
        • La grande ressemblance entre la carte de congruence de phase et une image de contours me laisse penser que des résultats proches seraient obtenus en calculant le coefficient de corrélation entre deux images de contours.

        FMN.