Je suis actuellement en train de préparer un cours sur la vision artificielle. Je relis donc mes classiques. Ainsi, le livre « Vision par ordinateur - outils fondamentaux » de Horaud & Monga est un incontournable, parce qu'il est bien écrit et en français, même s'il date un peu (ici en ligne).
Dans l'introduction, les auteurs indiquent que
la reconnaissance visuelle doit être fiable et rapide
, ce qui semble tomber sous le sens.
Cependant, c'est une vision idéaliste. Un grand nombre de problèmes n'admettent pas de telles solutions. Il n'est évidemment pas question d'abandonner la fiabilité, sinon le système n'est pas utile. Par contre, la rapidité n'est pas forcément une propriété essentielle. Ce peut l'être pour l'ingénieur confronté à un problème incluant des contraintes de temps de calcul. Par contre pour le chercheur, je pense qu'il vaut mieux proposer une solution fiable et lente, si cette solution est nouvelle, plutôt que pas de solution du tout.
Ainsi à ces deux propriétés, j'en ajouterais une troisième, plus essentielle - du moins pour le chercheur en vision :
la reconnaissance visuelle doit être instructive.
Le système proposé doit permettre de mieux comprendre ce qu'est la vision artificielle, même si à la limite il ne permet pas de résoudre un problème donné. Il doit enrichir la connaissance sur l'image numérique, son analyse et ses interactions.
FMN.
- Une sélection (automatique) de billets similaires :
- Une perception grossière est suffisante pour attribuer une catégorie générale
- Comment éviter l'empirisme pour évaluer ou régler un système de vision ?
- De bon exemples de l'inégalité triangulaire en similarité visuelle ?
- Transitivité ou inégalité triangulaire ?
- Image numérique et tableau : est-ce identique ?
[...] je l'ai indiqué précédemment, nous devrions ajouter à ses critères celui de la capacité d'une proposition à enrichir les [...]