Translate original post with Google Translate
Lorsque l'on travaille sur le concept de similarité, une des difficultés est de bien cerner les notions que l'on manipule. Le problème est encore plus grand lorsque le travail porte sur la similarité des images, où plus généralement sur la similarité d'objets issu de nos sens (la parole par exemple).
Il y a quelques jours, j'ai participé à une rencontre avec des collègues sur les "caractéristiques et similarités dans les images naturelles et les images de documents". Très intéressante journée, au cours de laquelle j'ai présenté mes travaux sur la mesure globale/locale de similarité entre images. Je ferais prochainement un billet-bilan de ce que j'ai retenu de cette journée (j'attends que les présentations soient en ligne pour le faire). Une présentation de Vinciane Lacroix portait sur l'extraction des palettes de couleurs utilisées dans une image. Lors de la présentation de ses résultats, elle s'étonnait d'une contradiction entre la distance mesurée entre deux couleurs et leur différence "apparente".
Les couleurs utilisées étaient représentées dans l'espace Lab. Il s'agit d'un espace de représentation spécialement étudié pour que les distances calculées entre couleurs correspondent aux différences perçues par le système visuel humain (cf. Wikipedia). Selon cette représentation, si deux couples de couleurs sont distants d'une valeur identique, leur différence perçue doit être la même. L'espace Lab est ainsi dit perceptuellement uniforme. Cependant, dans les résultats présentés, deux couples correspondaient à deux distances Lab vraiment différentes alors que leur proximité perçue semblaient identique, sinon très proche. Comment expliquer la contradiction ?
En fait les expériences menées par la commission internationnale de l'éclairage (CIE) ont permis de définir un observateur standard en moyennant les réponses données par plus d'une centaine de volontaires. Une description de l'expérience est donnée sur l'excellent site http://www.profil-couleur.com. Je me permet de reproduire une illustration :
![]()
Que peut-on constater ? La mesure de la différence perçue de deux couleurs est réalisée dans les conditions suivantes :
- les deux couleurs sont projetée l'une à coté de l'autre,
- la projection est réalisée sur un fond noir.
Il est possible d'affiner la connaissance de la distance donnée par l'espace Lab. Cet espace est perceptuellement uniforme pour deux couleurs proches géométriquement et en l'absence d'autres couleurs (de fond par exemple). Or dans les résultats présentés par V. Lacroix, les couleurs comparées n'étaient ni proches géométriquement et avec d'autres couleurs à proximité. Je pense que la contradiction des résultats avec l'expérience visuelle n'est donc qu'apparente. En fait ce cas est analogue à celui illustré par la figure suivante :
![]()
Dans cet image les couleurs utilisées pour les spirales "bleue" et "verte" sont en fait un seule et unique couleur. La proximités des autres couleurs perturbent le jugement que nous en avons. Pour s'en convaincre, il suffit d'ouvrir l'image dans un éditeur et de mesurer les les couleurs à la pipette, ou alors d'observer ces même spirales, seules :
![]()
Cette fois-ci, pas de doute possible, les "deux" couleurs sont bien identiques. On retrouve ce même phénomène avec des images en niveaux de gris :
Ici la luminance des carrés est la même partout. Pourtant, la perception de ces carrés n'est pas la même et dépend du contexte, à savoir du fond qui n'est pas uniforme.
Il est donc clair qu'il nous faut nous méfier de nos sens lorsqu'il s'agit d'interpréter des résultats. Pour ce qui est des notions de similarités, les psychologues distinguent la similarité perçue (perceived similarity) du jugement qui en est fait (judged similarity). Lorsque nous observons une scène, nous n'avons accès qu'au jugement de la similarité. Ce jugement est dépend d'un grand nombre de paramètres dont le contexte geométrique et le contexte temporel.
FMN.
ps : merci à D. Lemire pour un post sur Facebook qui m'a permis de trouver l'image des spirales, et donc de concrétiser ma réflexion. Un (très) grand nombre d'images illustrant l'interprétation permanente de sens réalisée par le système visuel humain peut se trouver sur la page du Pr. Kitoaka.
- Une sélection (automatique) de billets similaires :
- Note de lecture : Dissimilarity measures in color spaces [Coquin 2002]
- Transitivité ou inégalité triangulaire ?
- Similarité ou ressemblance?
- Mon frère, Brad Pitt et la saillance
- Petite revue des transformations en distance pour des images en niveaux de gris
Excellent billet. Est-ce que nous disposons de modèles mathématiques de la perception nous permettant de simuler ces illusions par ordinateur?
Question pertinente à creuser. Des modèles mathématiques de la perception existent et sont par exemple utilisés en évaluation de compression d'images. Est-ce que l'on peut utiliser ces modèles pour fabriquer automatiquement des images comportant des illusions ? Je ne sais pas, et je note cela comme devoir personnel de vacance.
S'il est vrai que la perception d'une couleur est influencée par son voisinage --- propriété exploitée par les artistes depuis bien longtemps et plus particulièrement par les impressionnistes (1) --- il n'en reste pas moins que, même dans des conditions optimales, l'espace Lab* ne rend pas toujours compte de la distance perçue entre des couleurs.
J'invite l'internaute à regarder l'exemple donné à la conférence: celui de la "Macbeth Color Chart" (http://www.ae5d.com/macbeth.html ), une charte de couleur utilisée en photographie, notamment pour la reproduction de tableaux (2). Les valeurs de référence (dans l'espace sRGB ou RGB) sont disponibles sur http://www.garybox.com/pages/images/macbethsrgb.jpg. La charte est conçue pour qu'il y aie peu d'interaction entre les couleurs d'où une organisation spatiale de celles-ci savamment pensée et un fond gris neutre assez foncé.
Vous pourrez calculer vous-mêmes les distances entre deux couleurs dans les espaces sRGB et RGB et même dans Lab* si vous avez matlab ou les formules données par Bruce Lindbloom. L'espace Lab* est "assez uniforme", mais pas tout à fait! Pour remédier à ce défaut, la CIE a proposé d'autres distances que la distance euclidienne: CIE 1994, CIE 2000, CMC --- pour leur définition voir http://www.brucelindbloom.com/.
Mon expérience est que la distance euclidienne (CIE 1976) n'est pas adéquate pour rendre compte des distances perçues entre des couleurs peu saturées -- i.e. les gris dans la charte (3). Les autres distances ne me satisfont pas non plus. Je suis donc intéressée pas toute distance (ou espace de couleur) qui rendrait mieux compte de cette perception.
(1) Ils connaissaient en effet les découvertes de Chevreul relatées dans son livre "De la loi du contraste simultané des couleurs" (1839) (Voir Art et science de la couleur. Chevreul et les peintres, de Delacroix à l'abstraction Georges Roque) (2) On prend en photo le tableau et la charte, et on corrige globalement l'image couleur afin que les couleurs mesurées sur la photo de la charte correspondent bien aux couleurs de référence. (3) En fait, à la conférence, j'ai présenté non pas la charte mais une photo de cette charte pour illustrer le problème de clustering.