En cliquant sur "Accepter tous les cookies", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser l'utilisation du site et de nous aider dans nos efforts de marketing. Plus d'informations
Paramètres des cookies
En cliquant sur "Accepter tous les cookies", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser l'utilisation du site et de nous aider dans nos efforts de marketing. Plus d'informations
Découvrez le nouveau modèle Ultralytics YOLO11, ses caractéristiques et ses applications en temps réel dans divers secteurs. Nous vous expliquons tout ce que vous devez savoir.
Le lundi 30 septembre, Ultralytics a officiellement lancé Ultralytics YOLO11, la dernière avancée en matière de vision par ordinateur, après ses débuts à YOLO Vision 2024 (YV24), l'événement hybride annuel d'Ultralytics. La communauté de l'IA s'est empressée d'explorer les capacités du modèle. Avec un traitement plus rapide, une plus grande précision et des modèles optimisés à la fois pour les périphériques et le déploiement dans le cloud, YOLO11 redéfinit ce qui est possible dans les applications de vision par ordinateur en temps réel.
Lors d'une interview, Glenn Jocher, fondateur et PDG d'Ultralytics, a déclaré : "Le monde évolue vers l'énergie propre, mais pas assez rapidement. Nous voulons que nos modèles puissent être entraînés en moins d'époques, avec moins d'augmentations et moins de données. Le plus petit modèle de détection d'objets, YOLO11n, ne comporte que 2,6 millions de paramètres, soit à peu près la taille d'un JPEG, ce qui est vraiment incroyable. Le plus grand modèle de détection d'objets, YOLO11x, a environ 56 millions de paramètres, et même cela est incroyablement petit comparé à d'autres modèles. Vous pouvez les entraîner sur un GPU bon marché, comme un GPU Nvidia vieux de cinq ans, avec juste un peu d'excitation et un peu de café.
Dans cet article, nous allons examiner de plus près YOLO11, en explorant ses caractéristiques, ses améliorations, ses performances et ses applications réelles pour vous aider à comprendre ce que ce modèle peut faire. Commençons par le commencement !
Comprendre YOLO11 : améliorations par rapport aux versions précédentes
YOLO11 est la dernière avancée dans la série de modèles de vision par ordinateur YOLO (You Only Look Once), et il offre des améliorations significatives par rapport aux versions précédentes comme YOLOv5 et YOLOv8. L'équipe d'Ultralytics a intégré les commentaires de la communauté et la recherche de pointe pour rendre YOLO11 plus rapide, plus précis et plus efficace. YOLO11 prend également en charge les mêmes tâches de vision par ordinateur que YOLOv8, y compris la détection d'objets, la segmentation d'instances et la classification d'images. En fait, les utilisateurs peuvent facilement passer à YOLO11 sans avoir à modifier leurs flux de travail existants.
L'un des points forts de YOLO11 est sa performance supérieure en termes de précision et de rapidité par rapport à ses prédécesseurs. Avec 22 % de paramètres en moins que YOLOv8m, YOLO11m atteint une précision moyenne plus élevée (mAP) sur l'ensemble de données COCO, ce qui signifie qu'il peut détecter des objets avec plus de précision et d'efficacité. En termes de vitesse de traitement, YOLO11 surpasse les modèles précédents, ce qui le rend idéal pour les applications en temps réel, où la rapidité de détection et de réponse est essentielle, et où chaque milliseconde compte.
Le graphique d'analyse comparative ci-dessous montre comment YOLO11 se distingue des modèles précédents. Sur l'axe horizontal, il montre la précision moyenne (AP) de la boîte COCO, qui mesure la précision de la détection des objets. L'axe vertical affiche la latence en utilisant TensorRT10 FP16 sur un GPU NVIDIA T4, indiquant la vitesse à laquelle le modèle traite les données.
Fig. 1. YOLO11 offre des capacités de pointe en matière de détection d'objets en temps réel.
Lancement du modèle YOLO11 : Open-source et options pour les entreprises
Avec le lancement d'Ultralytics YOLO11, Ultralytics élargit la série YOLO en proposant des modèles open-source et des modèles d'entreprise pour répondre à la demande croissante dans tous les secteurs d'activité.
Fig 2. Avec ce lancement, Ultralytics propose 30 nouveaux modèles.
Pour la première fois, Ultralytics introduit des modèles d'entreprise, marquant une étape importante dans notre offre de produits, et nous sommes ravis de partager ces nouvelles innovations avec nos utilisateurs. YOLO11 introduit cinq modèles propriétaires conçus spécifiquement pour des cas d'utilisation commerciale. Ces modèles d'entreprise, qui seront disponibles le mois prochain, sont entraînés sur le nouveau jeu de données propriétaire d'Ultralytics, composé de plus d'un million d'images, offrant ainsi des modèles pré-entraînés plus robustes. Ils sont conçus pour des applications exigeantes et réelles, telles que l'analyse d'images médicales et le traitement d'images satellites, où la détection précise d'objets est cruciale.
Exploration des fonctionnalités de la nouvelle génération de YOLO11
Maintenant que nous avons discuté de ce que YOLO11 offre, regardons ce qui rend YOLO11 si spécial.
L'un des principaux défis du développement de YOLO11 a été de trouver le bon équilibre entre des priorités concurrentes : rendre les modèles plus petits, plus rapides et plus précis. Comme l'explique Glenn Jocher, fondateur et PDG d'Ultralytics, "Travailler sur la recherche et le développement de YOLO est un véritable défi parce que vous voulez aller dans trois directions différentes : vous voulez rendre les modèles plus petits, vous voulez qu'ils deviennent plus précis, mais vous voulez aussi qu'ils soient plus rapides sur différentes plates-formes telles que le CPU et le GPU. Il s'agit là d'intérêts concurrents, et il faut donc faire des compromis et choisir où apporter des changements. Malgré ces défis, YOLO11 parvient à un équilibre impressionnant, apportant des améliorations en termes de vitesse et de précision par rapport aux versions précédentes telles que YOLOv8.
Fig. 3. Exemple d'utilisation de YOLO11 pour la détection d'objets.
YOLO11 apporte des améliorations substantielles, telles qu'une meilleure extraction des caractéristiques grâce à une architecture redessinée de la colonne vertébrale et du cou, ce qui permet une détection plus précise des objets. Le modèle est également optimisé pour la vitesse et l'efficacité, offrant des temps de traitement plus rapides tout en maintenant une grande précision. En plus de ces avantages, YOLO11 est hautement adaptable à différents environnements, fonctionnant de manière transparente sur les appareils périphériques, les plateformes cloud et les systèmes utilisant les GPU NVIDIA. Cette adaptabilité en fait un choix idéal pour les utilisateurs qui ont besoin d'options de déploiement flexibles sur différentes configurations matérielles, des appareils mobiles aux serveurs à grande échelle.
Applications YOLO11 en temps réel
La polyvalence de YOLO11 en fait un outil fiable dans de nombreux secteurs, en particulier lorsqu'il s'agit de cas d'utilisation complexes. Par exemple, il fonctionne de manière transparente sur les appareils périphériques et peut être utilisé pour des applications nécessitant une analyse en temps réel dans des environnements où la puissance de calcul est limitée. La conduite autonome en est un excellent exemple : les véhicules doivent prendre des décisions en une fraction de seconde pour assurer la sécurité de tous. YOLO11 aide en détectant et en analysant les objets sur la route, comme les piétons ou les autres voitures, même dans des conditions difficiles telles qu'une faible luminosité ou lorsque les objets sont partiellement cachés. Une détection rapide et précise permet d'éviter les accidents et de s'assurer que les véhicules à conduite autonome peuvent naviguer en toute sécurité.
Fig. 4. Glenn Jocher sur scène à YV24, parlant des applications de YOLO11.
Un autre exemple intéressant de la gamme de YOLO11 est sa capacité à gérer les boîtes de délimitation orientées (OBB). Cette fonction est essentielle pour détecter les objets qui ne sont pas parfaitement alignés. La détection d'objets OBB est une fonctionnalité particulièrement utile dans des secteurs tels que l'agriculture, la cartographie et la surveillance, où les images contiennent souvent des objets en rotation, tels que des cultures ou des bâtiments dans l'imagerie aérienne ou satellitaire. Contrairement aux modèles traditionnels, YOLO11 peut identifier des objets sous n'importe quel angle et fournir des résultats beaucoup plus précis pour les tâches qui requièrent de la précision.
YOLO11 pour les développeurs d'IA : Essayez-le vous-même
La prise en main de YOLO11 est simple et accessible, que vous préfériez coder ou ne pas coder. Pour travailler avec YOLO11 par le biais du code, vous pouvez utiliser le package Ultralytics Python pour entraîner et déployer facilement des modèles. Si vous préférez une approche sans code, Ultralytics HUB vous permet d'essayer YOLO11 en quelques clics.
Présentation du code YOLO11
Pour utiliser YOLO11 avec Python, vous devez d'abord installer le paquet Ultralytics. Selon vos préférences, vous pouvez le faire en utilisant pip, conda ou Docker. Pour des instructions détaillées et les meilleures pratiques liées au processus d'installation, n'oubliez pas de consulter notre Guide d'installation d'Ultralytics. Pendant l'installation des paquets requis pour YOLO11, si vous rencontrez des difficultés, reportez-vous à notre Guide des problèmes courants pour obtenir des solutions et des conseils.
Fig. 5. Utilisation de YOLO11 par l'intermédiaire du logiciel Ultralytics.
Pour les utilisateurs qui préfèrent une approche sans code, Ultralytics HUB offre un moyen facile d'entraîner et de déployer les modèles YOLO11 en quelques clics. Pour commencer avec HUB, il suffit de créer un compte sur la plateforme Ultralytics HUB, et vous pourrez commencer à former et à gérer vos modèles à travers une interface intuitive.
YOLO11 : Façonner l'avenir de l'IA visuelle
La communauté de l'IA fait constamment progresser le domaine de la vision par ordinateur en s'efforçant de développer des modèles plus rapides et plus précis pour les applications du monde réel. Ultralytics YOLO11 est une étape majeure dans cet effort, apportant une vitesse, une précision et une flexibilité accrues. Il est conçu pour des applications en temps réel et en périphérie, ce qui le rend idéal pour des secteurs tels que la santé et la conduite autonome. Que vous utilisiez le package Ultralytics Python ou le Hub Ultralytics sans code, YOLO11 simplifie les tâches complexes de Vision AI. Il offre de puissantes capacités de vision par ordinateur, ce qui en fait un excellent choix pour les développeurs et les entreprises.