Subscribe RSS

Posts Tagged ‘image’

Carte de Dissimilarités locales – implémentation de référence

July 8th, 2010 by fmn | No Comments | Filed in Research

Translate original post with Google Translate

Je viens de mettre à jour la page contenant les ressources sur la LDM (Local Dissimilarity Map – Carte de Dissimilarité Locales – cas binaire). La page contient dorénavant deux implémentations de référence. L’une d’elle est une application (en ligne de commande) java consistant en un fichier jar. L’autre est un workspace sage.
J’ai également ajouté des exemples illustrant l’intérêt de la méthode

FMN.

Tags: , , ,

Une liste de lecture issue de CVPR2010

June 15th, 2010 by fmn | No Comments | Filed in Research

Translate original post with Google Translate

En ce moment a lieu la conférence CVPR (Computer Vision and Pattern Recognition). Il s’agit d’une des conférences les plus importantes dans le domaine de l’analyse et du traitement d’image; traitant d’ailleurs plus de l’analyse que du traitement.

Je ne pourrais malheureusement pas y être présent, entre autres parce que je n’y ai pas soumis de communication. Cela est d’autant plus dommage que l’édition 2010 a lieu à San Francisco, une ville que j’ai eu l’occasion d’apprécier en 1999.

Cependant, la plupart des pdf sont en ligne sur le site de cvpapers (http://www.cvpapers.com/cvpr2010.html). Voici les principales communications qui sont placées dans ma liste de lecture (concernant de près ou de loin la similarité visuelle) :

  • Detecting and Sketching the CommonShai Bagon, Or Brostovski, Meirav Galun, Michal Irani (PDF).
    Les auteurs souhaitent détecter un éventuel objet commun à un faible nombre d’images. Il semble qu’ils utilisent des descripteurs d’auto-similarité pour cela.
  • What is an object? – Bogdan Alexe, Thomas Deselaers, Vittorio Ferrari (PDF)
    Typiquement le genre de réflexion que j’affectionne, à rapprocher de mon billet « Qu’est ce qu’une bonne forme? Qu’est ce qu’une figure saillante?.
  • Unsupervised Detection and Segmentation of Identical Objects - Minsu Cho, Kyoung Mu Le (PDF).
    A première vue, leur méthode me semble assez lourde (SIFT + réseau bayésien), mais je réserve mon avis pour le moment.
  • Global and Efficient Self-Similarity for Object Classification and DetectionThomas Deselaers, Vittorio Ferrari (PDF).
    A lire pour connaître leur définition de l’auto-similarité. Il semble que les auteurs discutent d’auto-similarité locale versus globale.
  • Fast Directional Chamfer Matching – Ming-Yu Liu, Oncel Tuzel, Ashok Veeraraghavan, Rama Chellappa (PDF – dispo sur le site de Ming-Yu Liu).
    Une étude d’un enrichissement du Chamger matching par ajout de l’information d’orientation des contours.

Il y a également une série de papiers à parcourir, exploitant des descripteurs visuels. Bref, de la lecture en perspective.

FMN.

ps : a noter que Tomasz Malisiewicz postera des billets sur CVPR.

Tags: , , ,

Bourse de thèse – Représentations parcimonieuses pour l’indexation et la recherche d’images.

May 25th, 2010 by fmn | No Comments | Filed in Research

Translate original post with Google Translate

Nous recherchons des candidats pour une bourse de thèse dans le domaine de l’indexation d’images – école doctorale Sciences, Technologie, Santé de l’université de Reims-Champagne-Ardenne (http://www.univ-reims.fr), laboratoire CReSTIC (http://crestic.univ-reims.fr). L’obtention de cette bourse sera définitive après sélection du candidat par la région Champagne-Ardenne.

Le sujet de thèse porte sur l’étude des représentations parcimonieuses multi-niveaux d’images pour l’indexation et la recherche de contenu avec une application aux collections d’images médiévales de la médiathèque de Troyes. La thèse sera dirigée par la professeur Su Ruan sur le site de l’IUT de Troyes.

Quelques détails:

La conservation du patrimoine et la numérisation des fonds documentaires des bibliothèques/médiathèques sont des priorités culturelles majeures. La sauvegarde et l’accès au plus grand nombre à ces documents fait partie intégrante de la politique des bibliothèques/médiathèques nationales [A] et régionales [B]. Dans le cadre de ces numérisations massives, des outils de recherche et d’interrogation sur les textes et les images vont être nécessaires. L’indexation d’images par le contenu consiste à extraire des caractéristiques visuelles des images d’une banque d’images afin d’autoriser des recherches dans la banque d’images [1]. Il existe de nombreux systèmes de recherche d’images par le contenu (Content-Based Image Retrieval Systems, CBIR) mais la plupart d’entre eux fonctionnent sur des caractéristiques locales ou globales des images basées sur les couleurs, les textures et les formes des objets présents dans l’image.

Nous proposons dans ce travail d’étendre l’indexation d’images à partir d’informations locales et d’informations globales. L’idée est d’utiliser les représentations parcimonieuses [2] consistant à fabriquer un dictionnaire d’objets visuels (atomes visuels). A partir de ce dictionnaire, il est possible de détecter les atomes visuels dans les images de la banque d’images et de repérer les images similaires (i.e. possédant un grand nombre d’atomes visuels en commun). Il est donc possible de construire une mesure de similarité entre les images de la banque d’images. Par extension, étant donnée une image exemple, on peut retrouver par décomposition en représentation parcimonieuses les images similaires dans la banque d’images en construisant un dictionnaire multi-niveaux à partir de l’image exemple [3].

Le but de la thèse est de créer une interface de recherche d’images orientée web afin de proposer aux utilisateurs une navigation et une recherche facile dans la banque d’images en utilisant les techniques de représentations parcimonieuses d’images. La création d’un logiciel de recherche d’images sera le principal livrable de cette thèse. Nous proposons d’utiliser comme banque d’images des images issues des collections de la médiathèque de l’agglomération de Troyes afin d’appliquer et de tester les résultats de notre système de recherche d’images.

Le dossier de candidature est à télécharger dans la rubrique actualités de la page de l’école doctorale Sciences Technologie Santé . Il doit être renvoyé pour le 4 juin 2010, dernier délai pour examen de la candidature par la région.

Le candidat devra impérativement contacter Su Ruan, Frédéric Morain-Nicolier ou Jérôme Landré respectivement “{su.ruan,frederic.nicolier,jerome.landre}@univ-reims.fr” afin de valider sa candidature.

[A] Bibliothèque Nationale de France : fonds documentaire Gallica – http://gallica.bnf.fr
[B] Médiathèque de Troyes – http://www.mediatheque-agglo-troyes.fr

[1] Nuno Vasconcelos, « From Pixels to Semantic Spaces: Advances in Content-Based Image Retrieval », IEEE Computer, pp. 20-26, July, 2007.
[2] Alfred M. Bruckstein, David L. Donoho, Michael Elad, « From Sparse Solutions of Systems of Equations to Sparse Modeling of Signals and Images, SIAM Review, Vol. 51, No. 1, pp. 34-81, February, 2009.
[3] Julien Mairal, Guillermo Sapiro and Michael Elad, « Learning Multiscale Sparse Representations for Image and Video Restoration », SIAM Multiscale Model. Simul., Vol. 7, No. 1, pp. 214–241, 2008.

Tags: , , , ,