5 livres gratuits sur la vision par ordinateur
La vision par ordinateur est une branche de l'intelligence artificielle (IA) qui étudie comment les machines peuvent interpréter et comprendre les informations visuelles, telles que les images et les vidéos. Aujourd'hui, la plupart des modèles de vision par ordinateur sont basés sur des architectures d'apprentissage profond telles que les réseaux de neurones convolutifs (CNN), qui excellent dans des tâches telles que la classification d'images, la détection d'objets et la segmentation. Cependant, les fondamentaux nécessaires pour comprendre en profondeur le domaine remontent à des époques antérieures.
Pour vous aider à maîtriser ce domaine largement appliqué de l'IA, cet article répertorie cinq livres que vous pouvez lire gratuitement : des textes classiques pour acquérir les fondements théoriques et apprendre les techniques conventionnelles, et des textes plus récents couvrant des modèles avancés comme les réseaux de neurones profonds.
1. Vision par ordinateur : algorithmes et applications (R. Szeliski)
Ce livre de vision par ordinateur publié par Springer peut être acheté dans les principaux magasins en ligne. Néanmoins, il peut être téléchargé gratuitement sur le site Web de l’auteur pour un usage personnel uniquement. S'étendant sur plus de 1 200 pages, il s'agit d'une ressource clé dans le domaine de la vision par ordinateur, couvrant un large éventail de sujets et d'applications : reconnaissance d'objets, traitement d'images, reconstruction 3D, analyse de mouvement, etc.
2. Vision par ordinateur : modèles, apprentissage et inférence (S.J.D. Prince)
Texte de référence classique disponible en téléchargement ici, il fournit une introduction complète à la vision par ordinateur, soulignant les concepts fondamentaux des modèles et des techniques d'apprentissage automatique utilisés dans la plupart des systèmes de vision par ordinateur. Il couvre également une introduction approfondie aux modèles probabilistes et graphiques, essentiels à de nombreuses approches de vision par ordinateur.
3. Vision par ordinateur : fondements et applications (notes de cours de Stanford)
Cette excellente compilation réalisée par Rankay Krishna rassemble les notes de cours du cours homonyme de l’Université de Stanford. Une lecture plus concise mais exhaustive axée sur la démystification des concepts et définitions du domaine. La version PDF est accessible au département de vision de Stanford ici.
4. Programmation de la vision par ordinateur avec Python (J.E. Solem)
Ce livre sous licence Creative Commons se concentre sur la mise en œuvre pratique de systèmes de vision par ordinateur en Python, en utilisant des approches et des bibliothèques traditionnelles. À partir de la page 1, il plonge dans des exemples basés sur Python pour le traitement d'images, suivis par une variété d'applications telles que la réalité augmentée, le regroupement d'images et la classification d'images. Le livre couvre les techniques traditionnelles de vision par ordinateur sans réseaux de neurones ni architectures d'apprentissage profond impliquées, se concentrant plutôt sur les mathématiques, la géométrie et les approches classiques d'apprentissage automatique.
5. Apprentissage profond, MIT Press (I. Godfellow et al.)
Le célèbre livre Deep Learning publié par MIT Press ne peut pas être téléchargé pour être distribué au format PDF, mais ses chapitres sont accessibles au public pour lecture au format HTML sur le site Web du livre. Bien qu'il ne soit pas uniquement axé sur la vision par ordinateur, le livre fournit des chapitres essentiels pour comprendre les systèmes de vision modernes basés sur les architectures CNN (chapitre 9), les applications de vision par ordinateur (chapitre 12) et la modélisation probabiliste de données non structurées comme les images (chapitre 16), pour ne citer qu'eux. quelques. Ces chapitres constituent une suite idéale pour les lecteurs avancés, après avoir acquis les bases de la vision par ordinateur à travers les ouvrages précédemment répertoriés.