Découvrez comment l'apprentissage supervisé alimente l'IA avec des données étiquetées, permettant des prédictions précises et des applications telles que la détection d'objets et l'analyse des sentiments.
L'apprentissage supervisé est une catégorie fondamentale de l'apprentissage machine (ML) dans laquelle les algorithmes apprennent à partir d'un ensemble de données contenant des paires entrée-sortie, connues sous le nom de données étiquetées. Par essence, l'algorithme est "supervisé" parce qu'il apprend en comparant ses prédictions sur les données d'entrée aux sorties correctes connues (étiquettes) fournies dans les données d'apprentissage. L'objectif est que l'algorithme apprenne une fonction de mise en correspondance capable de prédire avec précision la sortie pour de nouvelles entrées inédites. Cette approche est au cœur de nombreuses applications modernes d'intelligence artificielle (IA), permettant aux systèmes de faire des prédictions ou de prendre des décisions basées sur des exemples historiques trouvés dans des ensembles de données de référence ou des ensembles de données personnalisés.
Le processus commence par un ensemble de données soigneusement préparé où chaque point de données est constitué de caractéristiques d'entrée et d'une étiquette de sortie correcte correspondante. Cela implique souvent un effort important de collecte et d'annotation des données. Par exemple, dans une tâche de classification d'images, les entrées seraient des images (éventuellement prétraitées à l'aide de techniques issues de bibliothèques comme OpenCV), et les étiquettes seraient les catégories auxquelles elles appartiennent (par exemple, "chat", "chien"). L'algorithme effectue des prédictions itératives sur les données d'apprentissage et ajuste ses paramètres internes (ou les poids du modèle) à l'aide d'un algorithme d'optimisation tel que la descente stochastique de gradient (SGD) ou Adam afin de minimiser la différence entre ses prédictions et les étiquettes réelles. Cette différence est mesurée par une fonction de perte. Cet apprentissage se poursuit, souvent sur plusieurs époques, jusqu'à ce que le modèle atteigne un niveau satisfaisant de précision ou d'autres mesures de performance pertinentes sur des données de validation distinctes, en veillant à ce qu'il se généralise bien aux nouvelles données et évite l'adaptation excessive.
L'apprentissage supervisé est incroyablement polyvalent et permet une vaste gamme d'applications dans lesquelles les données historiques peuvent prédire des événements futurs ou classer de nouvelles informations. Sa capacité à apprendre directement à partir d'exemples étiquetés le rend adapté aux tâches nécessitant une grande précision. De nombreuses tâches de vision artificielle (CV) s'appuient fortement sur l'apprentissage supervisé, y compris celles réalisées par des modèles de pointe comme Ultralytics YOLO.
Voici deux exemples concrets :
Parmi les autres applications courantes, citons la détection d'objets dans les images et les vidéos (utilisée dans les véhicules autonomes et les systèmes de sécurité), le filtrage des courriers électroniques indésirables, la prévision des prix de l'immobilier (une tâche de régression ) et la reconnaissance faciale. Elle est également appliquée à l'IA pour une gestion plus intelligente des stocks dans le commerce de détail et à l 'IA dans les solutions agricoles.
Plusieurs concepts sont essentiels pour comprendre et appliquer efficacement l'apprentissage supervisé :
L'apprentissage supervisé se distingue des autres paradigmes primaires d'apprentissage automatique :
En résumé, l'apprentissage supervisé est une technique puissante et largement utilisée qui s'appuie sur des données étiquetées pour former des modèles à des tâches prédictives. Il constitue l'épine dorsale de nombreuses applications d'IA réussies, y compris celles développées et soutenues par Ultralytics, et est une compétence cruciale pour toute personne travaillant dans le domaine de la science des données ou de l'IA.