Translate original post with Google Translate
En lisant ce matin le dernier numéro (nov. 2011) de Photonics Spectra, j'ai commencé par être fâché par la lecture de l'article "Vision software drives manufacturing" de Lynn Savage. Puis en réfléchissant, j'en ai tiré une prédiction réjouissante.
L'article traite de l'actualité de la vision industrielle. Voici les extraits qui m'ont fait réagir :
People new to machine vision technology might have a small amount of difficulty understanding the software that drives it, but it is not a big problem (John Perry, Senior manager at Cogex Corp in )
(trad.) Les nouveaux venus en vision industrielle peuvent avoir quelques difficultés à comprendre les algorithmes, mais ce n'est pas un gros problème.
Many of theses tasks [...] have been set in stone for some time now. The major challenges are keeping up with customers demands and the ever-evolving computers that running the show.
(trad.) La plupart de ces méthodes ont été gravées dans le marbre depuis quelque temps maintenant. Les défis majeurs consistent à être en phase avec les clients et avec l'évolution des ordinateurs.
"Surprising, the most popular features of Open eVision are still the first librairies that we have developped" (Marc Damhaut, Euresys)
(trad.) De façon surprenante, les fonctionnalités d'Open eVision les plus populaires sont encore maintenant celles que nous avons développé en premier.
Ma première réaction a été la surprise.
Il apparaît que les utilisateurs finaux industriels, n'emploient pas de méthodes évoluées. Est-ce parce qu'il n'en ont pas l'usage, ou bien parce qu'ils ne les maitrisent pas?
Cependant, il semble bien que la vision n'est plus un problème pour l'industrie. Les méthodes sont là. Il ne reste que des problèmes de coûts de calculs.
Est-ce pour autant la fin de la recherche en traitement d'image? Clairement non, c'est même peut-être une bonne nouvelle pour la discipline. Car si les industriels ne sont plus demandeurs, cela va permettre à (ou obliger) la discipline de sortir du coté applicatif, pour se concentrer sur ses fondamentaux, qui ne sont pas la recherche de solutions à des problèmes pratiques.
Mais alors quels sont-ils ces fondamentaux? C'est une excellente question. D'ailleurs en tant que discipline scientifique, qu'est-ce que le traitement d'image? Je proposerai ma réflexion dans de prochains billets.
FMN.
- Une sélection (automatique) de billets similaires :
- Comment éviter l'empirisme pour évaluer ou régler un système de vision ?
- Une présentation (rapide) de TeXmacs
- Quelques mots sur les dysfonctionnements de la propagation des sciences
- Publions sur Youtube ! Le cas du seam-carving.
- La recherche lance son blog
Ingénieur en traitement d'images (TI) et en vision industrielle (VI), j'aimerais apporter ma "vision" des choses.
Il ne faut pas oublier que dans "vision industrielle", il y a vision et pas traitement d'images. En gros, il faut bien voir qu'en VI tout commence par la vision. L'ingénieur en VI a une grosse connaissance dans les divers éclairages, leur spectre, leur spécificité (rasant, direct, ponctuel, lumière structurées), etc. De même avec les différents types de caméras (NIR, N&B, couleur, linéaire, matricielle, temps de vol, etc.) et optiques (polarisant, filtre, etc.). L'ingénieur en VI, s'il le peut, se contentera d'un simple seuillage. Sa connaissance c'est la VI, pas le TI.
Le système proposé au client doit être simple, assimilable et maintenable facilement par des techniciens qui ne sont pas formés du tout à la VI ou à la TI. Les enjeux sont souvent énormes donc on privilégie la simplicité et la robustesse en faisant un gros travail dans la vision (imaginez ce que représente l'arrêt d'une chaîne chez Renault !).
Ensuite, il y a des difficultés en VI qui sont autres que les difficultés en TI : des contraintes de temps (1000 images/s), de matériel (TI embarqué dans le FPGA d'une caméra), de taille d'image (image de 8000 pixels par 7000 pixels), etc. Le progrès en VI avance également dans toutes ces directions ; électronique embarquée dans les caméras de plus en plus puissantes, taille des pavés CCD et CMOS, etc. La recherche en TI ne constitue pas la seule source de progrès pour la VI.
Toutes les librairies en TI ne visent pas le même marché. Euresys est une librairie offrant "des outils de bases" au ingénieurs. Donc il n'est pas étonnant d'entendre Euresys révéler que ce sont leurs premières fonctionnalités (seuillage, blob, morpho, ...) qui sont les plus demandées. Après tout, Euresys est une librairie de TI tournée essentiellement vers la VI "classique" et propose peu de solutions au problèmes 3D par exemple.
Prenez par contre le cas de MVTec Halcon. C'est là une librairie de TI bien plus complète, bien implantée dans la VI et orientée vers des problèmes bien plus compliqués que ceux auxquels Euresys s'attaque (encore une fois, ce n'est pas le même marché ...). Halcon propose des pattern matching invariants en perspective, des outils 3D, des calculs de flots optiques, etc. Ils travaillent en étroite collaboration avec des universités allemandes. Ils retranscrivent des travaux récents de la part du monde de la recherche.
Mais la VI est encore en attente de solutions de la part des chercheurs. Il y a ainsi pas mal de balbutiements, dans les applications 3D, notamment associées aux robots industriels, faute d'algorithmes puissants, robustes et rapides à mettre en œuvre. Depuis 2008, la norme ISO 10218, autorise les barrières immatérielles pour que l'homme puisse travailler à proximité d'un robot et que celui-ci, assisté par des caméra, puisse agir en fonction (ralentir, s'arrêter, etc.). A ma connaissance, il n'y a rien aujourd'hui de très efficace à ce sujet. J'ai encadré une thèse CIFRE, il y a 2 ans sur un sujet en stéréo que se termine cette année et doit amener des solutions à des problèmes 3D rencontrés dans l'industrie. Bref, il y a encore pas mal de chose à chercher pour pallier aux problèmes rencontrés dans l'industrie. Par exemple, Kinect offre pas mal de possibilités dans l'industrie en 3D. Le capteur ne répond peut-être pas encore aux exigences industrielles mais ça viendra.
En conclusion, je dirai qu'il y a plusieurs champs d'application de la TI dans la VI. Certaines applications vont se régler par un simple seuillage et comptage et on optera pour Euresys. D'autres applications vont faire appel à des choses encore balbutiantes qui font encore aujourd'hui l'objet de recherches scientifiques. Et enfin, qu'il faut pas mal de temps pour que des progrès scientifiques arrivent à maturité dans l'industrie. Vous les chercheurs, vous avez du taf pour un bon moment je pense encore en TI.
Merci pour ce commentaire, assez complet je dois dire.
Je suis cependant en désaccord sur un point ou deux. Par exemple, en quoi les contraintes de temps, de matériel et de taille d’image n’apparaissent pas en TI? Je connais pas mal de chercheurs qui se revendiquent traiteurs d’image qui doivent gérer ces difficultés. Mais ce n'est pas l'essentiel.
J’assume le coté provocateur du titre du billet, qui cependant aurait du être “la fin du TI en VI”, et c’est le point principal de l’article de Photonics Spectra. Oui, il existe des librairies qui proposent des méthodes évoluées, mais quelle est leur part de marché? (je n’ai pas la réponse). Si je me fie à l’article, les réponses aux besoins principaux existent. Effectivement en 3D, il y a un champ d’investigation ouvert. Mais sur les applications “classiques” (contrôle qualité)?
Pour terminer, je trouve amusant (sans ironie) que votre commentaire se termine par “Vous les chercheurs, vous avez du taf pour un bon moment je pense encore en TI”. C’est justement la conclusion de mon billet de poser la question du TI en tant que discipline dissociée des besoins industriels. En gros, nul besoin d’industriels pour avoir des problèmes à résoudre en traitement d’image.
Très bien.
Un autre point de vue du point de vue de l'utilisateur: http://machinevision4users.blogspot.com/
Les billets de Brian sont toujours tres bases sur la realite industrielle qui fait parfois defaut dans certaines recherches.
Ma question centrale par rapport a tout ce debat, c'est de savoir a partir de quel moment on va voir arriver des methodes encore plus avancees qui permettent de justement aller au dela des problemes d'eclairages, de segmentations etc.... Je pense en particulier a toutes ces histoires d'apprentissage de dictionaires, de matrices a bas rang et les problemes de calibrations robustes associes. Un exemple:
http://nuit-blanche.blogspot.com/2011/09/its-stunning-and-quite-amazingly-rich.html
Igor.
Pour alimenter la réflexion : Machine Vision: The Future of Machine Vision.