En cliquant sur "Accepter tous les cookies", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser l'utilisation du site et de nous aider dans nos efforts de marketing. Plus d'informations
Paramètres des cookies
En cliquant sur "Accepter tous les cookies", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser l'utilisation du site et de nous aider dans nos efforts de marketing. Plus d'informations
Découvrez la différence entre l'inférence en temps réel et l'inférence par lots lors de l'utilisation d'Ultralytics YOLO11 pour diverses applications de vision par ordinateur.
Si vous avez vu une voiture auto-conduite en action, vous avez été témoin de l'inférence de l'IA en temps réel. Une voiture autonome utilise généralement des caméras, des capteurs et l'IA pour analyser son environnement et prendre des décisions presque instantanées. Cependant, lorsque des réponses rapides ne sont pas nécessaires, l'inférence en temps réel peut être gourmande en ressources.
Une meilleure option dans ces cas est l'inférence par lots. Au lieu de traiter les données en continu et en temps réel, l'inférence par lots permet de traiter de grands ensembles de données à intervalles réguliers. Cette approche permet d'économiser des ressources, de réduire la consommation d'énergie et de diminuer les coûts d'infrastructure.
Par exemple, dans les applications de vision par ordinateur, des modèles comme Ultralytics YOLO11 peuvent être utilisés pour des tâches en temps réel telles que la détection d'objets et la segmentation d'instances. Cependant, le traitement de grands volumes de données visuelles en temps réel peut être exigeant.
Fig. 1. Exemple de segmentation d'objets dans une image à l'aide de YOLO11.
Grâce à l'inférence par lots, YOLO11 peut être exécuté sur des données visuelles par lots, ce qui réduit la charge sur le système et améliore l'efficacité sans sacrifier les performances. Il est ainsi plus facile de déployer des solutions Vision AI à grande échelle sans surcharger le matériel ni augmenter les coûts.
Dans cet article, nous allons explorer l'inférence par lots, ses avantages, et comment l 'inférence par lots utilisant YOLO11 peut être appliquée dans les applications de vision par ordinateur. Commençons par le commencement !
Regard sur l'inférence par lots dans le domaine de la vision par ordinateur
L'inférence par lots consiste à s'attaquer à une tâche importante en une seule fois au lieu de la traiter morceau par morceau au fur et à mesure qu'elle arrive. Au lieu de traiter constamment les données en temps réel, l'inférence par lots vous permet de traiter de grands groupes de données à des intervalles déterminés. Cette approche est beaucoup plus efficace lorsque des réponses immédiates ne sont pas nécessaires, ce qui permet d'économiser les ressources informatiques, de réduire la consommation d'énergie et de diminuer les coûts.
Dans le domaine de la vision par ordinateur, il existe certaines applications pour lesquelles une faible latence est vitale. La faible latence fait référence au délai minimal entre la réception d'une entrée (telle qu'une image ou une trame vidéo) et la réponse du système. Par exemple, dans le domaine de la surveillance de la sécurité en temps réel, même de petits retards peuvent entraîner des risques pour la sécurité.
Cependant, dans de nombreux autres scénarios de vision par ordinateur, une faible latence n'est pas aussi critique. C'est là que l'inférence par lots se distingue, lorsque le système n'a pas besoin de réagir instantanément. L'inférence par lots consiste à transmettre des données visuelles à un modèle de vision par ordinateur par groupes ou par lots, ce qui permet au système de traiter de grands ensembles de données en une seule fois plutôt qu'en continu et en temps réel.
Comprendre le fonctionnement de l'inférence par lots
Voici un examen plus approfondi des étapes de l'inférence par lots :
Collecte de données : Les données visuelles sont collectées sur une période donnée. Il peut s'agir de séquences de sécurité, d'images de produits ou de données sur les clients, en fonction de l'application.
Préparation des lots : Les données collectées sont ensuite regroupées en lots. Au cours de cette étape, les données sont formatées selon les besoins du modèle. Par exemple, les images peuvent être redimensionnées, normalisées ou converties au format approprié pour être traitées par le modèle.
Prédiction: Une fois les données préparées, l'ensemble du lot est introduit dans le modèle (tel que YOLO11), qui traite l'ensemble du lot en une seule fois. Cela permet au modèle de faire des prédictions pour toutes les données du lot simultanément, ce qui rend le processus plus efficace par rapport au traitement individuel de chaque point de données.
Quand utiliser l'inférence par lots ?
Maintenant que nous avons expliqué ce qu'est l'inférence par lots et en quoi elle diffère de l'inférence en temps réel, examinons de plus près quand l'utiliser.
L'inférence par lots est idéale pour l'analyse de données historiques. Supposons que vous disposiez d'images de surveillance d'une station de métro sur le mois écoulé et que vous essayiez d'identifier des schémas spécifiques, tels que le nombre de personnes entrant et sortant à différents moments de la journée.
Au lieu de traiter chaque image en temps réel, l'inférence par lots vous permet de traiter l'ensemble des images d'un mois par lots, afin d'identifier les événements ou les tendances clés sans avoir besoin de résultats immédiats. De cette façon, vous pouvez analyser de grands volumes de données plus efficacement et obtenir des informations sur les tendances à long terme, sans surcharger le système ni nécessiter une surveillance constante.
L'inférence par lots est également une solution optimale lorsque les ressources du système sont limitées. En exécutant l'inférence pendant les heures creuses (la nuit, par exemple), vous pouvez économiser sur les coûts informatiques et vous assurer que le système n'est pas surchargé pendant les heures de pointe. Il s'agit donc d'une approche efficace et rentable pour les entreprises ou les projets qui ont besoin de traiter de grands ensembles de données, mais qui ne nécessitent pas d'analyse en temps réel.
Inférencement par lots à l'aide d'Ultralytics YOLO11
Le package Ultralytics Python prend en charge l'inférence par lots pour les modèles tels que YOLO11. Avec YOLO11, vous pouvez facilement lancer une inférence par lots en spécifiant l'argument "batch", qui détermine le nombre d'images ou de trames vidéo traitées en même temps.
Au cours du processus d'inférence par lot, les prédictions sont générées simultanément pour toutes les images du lot. Par défaut, la taille du lot est fixée à 1, mais vous pouvez l'ajuster à votre convenance.
Par exemple, si la taille du lot est fixée à 5, YOLO11 traitera cinq images ou trames vidéo à la fois et générera des prédictions pour les cinq en même temps. Des lots plus importants permettent généralement d'accélérer les temps d'inférence, car il est plus efficace de traiter plusieurs images en un seul lot que de les traiter individuellement.
Applications de vision par ordinateur rendues possibles par l'inférence par lots
Ensuite, explorons quelques cas réels d'utilisation de la vision par ordinateur pour l'inférence par lots.
Améliorer les diagnostics et la recherche dans le domaine des soins de santé
Dans la recherche médicale, il est très courant de travailler avec de grandes quantités de données visuelles. Dans ce cas, l'inférence par lots peut aider les scientifiques à analyser plus facilement les données dans des domaines tels que la chimie, la biologie et la génétique. Au lieu d'être analysées une par une, les données sont traitées par lots, ce qui permet d'économiser du temps et des efforts.
Par exemple, dans les établissements médicaux, l'inférence par lots peut être particulièrement utile pour analyser de grands ensembles d'images médicales telles que des IRM ou des tomodensitogrammes. Les hôpitaux peuvent collecter ces images tout au long de la journée et les traiter par lots pendant la nuit.
Cette approche permet aux hôpitaux de mieux utiliser leur matériel et leur personnel, de réduire les coûts opérationnels et de s'assurer que tous les scans sont examinés de manière cohérente et uniforme. Elle est également bénéfique pour les grands projets de recherche et les études à long terme, qui nécessitent le traitement de grandes quantités de données.
Fig. 2. Détection d'un scanner médical à l'aide de YOLO11.
Améliorer les véhicules autonomes à l'aide de simulations
Les voitures auto-conduites utilisent des technologies d'intelligence artificielle telles que la vision par ordinateur pour traiter le monde qui les entoure. Avec l'aide de modèles avancés comme YOLO11, les systèmes embarqués de la voiture peuvent reconnaître les autres véhicules, les voies de circulation, les panneaux de signalisation et les personnes dans la rue. Si l'inférence en temps réel est essentielle sur la route, la technologie de conduite autonome s'appuie aussi fortement sur l'inférence par lots en coulisses.
Fig. 3. YOLO11 peut facilement détecter les piétons sur la route.
Une fois qu'une voiture a effectué un trajet, les données qu'elle a collectées, telles que les heures d'enregistrement des caméras, les relevés des capteurs et les balayages LIDAR, peuvent être traitées ultérieurement en grandes quantités. Les ingénieurs peuvent ainsi mettre à jour les modèles d'intelligence artificielle de la voiture, renforcer la sécurité du système et améliorer sa capacité à faire face à différentes conditions de conduite.
L'inférence par lots est également utilisée dans les simulations de conduite autonome pour tester la façon dont les voitures autonomes réagiraient dans différentes situations, telles que la navigation dans des intersections encombrées ou la réponse à des mouvements de piétons imprévisibles. Cette approche permet de gagner du temps, de réduire les coûts et d'éviter les risques associés au test de chaque scénario en situation réelle.
L'analyse des données du commerce de détail pilotée par l'inférence par lots
De même, pour les magasins de détail, l'inférence par lots avec des modèles de vision par ordinateur comme YOLO11 peut considérablement améliorer l'efficacité opérationnelle. Par exemple, les systèmes de caméras des magasins peuvent capturer des milliers d'images tout au long de la journée, qui peuvent ensuite être traitées par lots pendant la nuit.
Cela permet aux magasins d'analyser ce qui se passe dans le magasin, comme le comportement des clients, les schémas de circulation et les interactions avec les produits, sans avoir besoin d'un traitement en temps réel, ce qui peut s'avérer difficile pour les petits magasins.
Un autre exemple intéressant est l'utilisation de l'inférence par lots pour générer des cartes thermiques, qui visualisent les zones de forte et de faible activité des clients dans le magasin. En analysant ces cartes thermiques, les détaillants peuvent identifier les zones qui attirent le plus de visiteurs et les parties du magasin qui pourraient nécessiter plus d'attention ou une optimisation de l'emplacement des produits. Ces données peuvent aider les détaillants à prendre de meilleures décisions sur l'agencement du magasin, le positionnement des produits et même les stratégies promotionnelles afin d'améliorer l'expérience des clients et les ventes.
Fig. 4. Les cartes thermiques peuvent aider les détaillants à identifier les zones populaires dans les magasins.
Avantages et inconvénients de l'inférence par lots
Voici quelques-uns des principaux avantages que l'inférence par lots peut apporter à divers secteurs d'activité :
Facilité d'intégration : L'inférence par lots peut être facilement intégrée dans les flux de travail existants, en particulier dans des secteurs comme le commerce de détail, la sécurité ou les soins de santé, où de grands volumes de données doivent être traités en vrac.
Gestion plus facile des données : Lorsque l'on travaille avec de grandes quantités de données, l'inférence par lots peut rationaliser la gestion des données puisque celles-ci sont regroupées en morceaux faciles à gérer. Il est ainsi plus facile de suivre, d'examiner et d'organiser les données au fil du temps.
Réduction de la charge du réseau: Lorsque les données sont traitées par lots, la quantité de données transférées à tout moment peut être minimisée, ce qui réduit la pression sur les ressources du réseau dans les systèmes basés sur l'informatique en nuage ou les environnements informatiques distribués.
Si l'utilisation de l'inférence par lots présente de nombreux avantages, il convient également de tenir compte de certaines limites. Voici quelques facteurs à prendre en compte :
Exigences en matière de stockage : Le stockage de grands ensembles de données pour le traitement par lots peut augmenter considérablement les coûts de stockage, en particulier pour les images haute résolution, les vidéos ou les grands volumes de données.
Risque d'arriérés: Si les données s'accumulent rapidement ou si des lots importants ne sont pas traités à temps, un arriéré peut se développer. Cela peut entraîner des retards dans la fourniture d'informations et le traitement de nouvelles données en temps voulu.
Pics d'utilisation des ressources: Les lots importants, en particulier ceux qui impliquent des images à haute résolution, peuvent provoquer des pics d'utilisation de la mémoire ou du calcul. S'ils ne sont pas correctement gérés, ces pics peuvent submerger les systèmes, entraînant des ralentissements ou des pannes.
Principaux enseignements
L'inférence par lots est un moyen efficace de traiter de grands volumes de données visuelles qui ne nécessitent pas de résultats immédiats. Plutôt que d'analyser chaque image en temps réel, il les traite par lots à des moments programmés, par exemple pendant la nuit.
Cette méthode est rentable, réduit la charge de calcul et fournit toujours des résultats précis. Qu'il s'agisse d'aider les magasins à gérer leurs stocks, d'assister les médecins dans l'analyse des scanners médicaux ou d'améliorer les technologies de conduite autonome, l'inférence par lots rend la vision par ordinateur plus accessible, plus abordable et plus pratique pour les applications du monde réel.