Todo lo que necesita saber sobre Ultralytics YOLO11 y sus aplicaciones

Abirami Vina

4 min leer

4 de octubre de 2024

Aprenda todo sobre el nuevo modelo Ultralytics YOLO11, sus características y aplicaciones en tiempo real en diversas industrias. Le guiaremos a través de todo lo que necesita saber.

El lunes 30 de septiembre, Ultralytics presentó oficialmente Ultralytics YOLO11, el último avance en visión por ordenador, tras su debut en YOLO Vision 2024 (YV24), el evento híbrido anual de Ultralytics. La comunidad de la inteligencia artificial está entusiasmada y se apresura a explorar las capacidades del modelo. Con un procesamiento más rápido, una mayor precisión y modelos optimizados tanto para dispositivos periféricos como para su despliegue en la nube, YOLO11 redefine las posibilidades de las aplicaciones de visión por ordenador en tiempo real.

En una entrevista, Glenn Jocher, fundador y consejero delegado de Ultralytics, declaró: "El mundo avanza hacia la energía limpia, pero no lo suficientemente rápido. Queremos que nuestros modelos se puedan entrenar en menos épocas, con menos aumentos y menos datos, así que estamos trabajando duro en ello". El modelo de detección de objetos más pequeño, YOLO11n, tiene sólo 2,6 millones de parámetros, aproximadamente el tamaño de un archivo JPEG, lo cual es una auténtica locura. El modelo de detección de objetos más grande, YOLO11x, tiene unos 56 millones de parámetros, e incluso eso es increíblemente pequeño comparado con otros modelos. Puedes entrenarlos en una GPU barata, como una Nvidia de hace cinco años, con sólo un poco de emoción y un poco de café".

En este artículo analizaremos en profundidad YOLO11, explorando sus características, mejoras, pruebas de rendimiento y aplicaciones reales para ayudarte a entender lo que este modelo puede hacer. Empecemos.

Entender YOLO11: mejoras respecto a versiones anteriores

YOLO11 es el último avance de la serie YOLO (You Only Look Once) de modelos de visión por ordenador, y ofrece mejoras significativas respecto a versiones anteriores como YOLOv5 y YOLOv8. El equipo de Ultralytics ha incorporado los comentarios de la comunidad y la investigación de vanguardia para que YOLO11 sea más rápido, preciso y eficaz. YOLO11 también admite las mismas tareas de visión por ordenador que YOLOv8, como la detección de objetos, la segmentación de instancias y la clasificación de imágenes. De hecho, los usuarios pueden cambiar fácilmente a YOLO11 sin necesidad de modificar los flujos de trabajo existentes.

Uno de los aspectos más destacados de YOLO11 es su rendimiento superior, tanto en precisión como en velocidad, en comparación con sus predecesores. Con un 22% menos de parámetros que YOLOv8m, YOLO11m alcanza una mayor precisión media (mAP ) en el conjunto de datos COCO, lo que significa que puede detectar objetos con mayor precisión y eficacia. En cuanto a velocidad de procesamiento, YOLO11 supera a los modelos anteriores, lo que lo hace ideal para aplicaciones en tiempo real, donde la rapidez de detección y respuesta son fundamentales y cada milisegundo cuenta.

El gráfico de evaluación comparativa que se muestra a continuación ilustra en qué se diferencia YOLO11 de los modelos anteriores. En el eje horizontal, muestra la precisión media (AP) de COCO Box, que mide la exactitud de la detección de objetos. El eje vertical muestra la latencia utilizando TensorRT10 FP16 en una GPU NVIDIA T4, lo que indica la rapidez con la que el modelo procesa los datos. 

__wf_reserved_inherit
Fig. 1. YOLO11 proporciona capacidades de detección de objetos en tiempo real de última generación.

Lanzamiento del modelo YOLO11: Opciones de código abierto y para empresas

Con el lanzamiento de Ultralytics YOLO11, Ultralytics amplía la serie YOLO ofreciendo modelos de código abierto y empresariales para satisfacer la creciente demanda en todos los sectores.

__wf_reserved_inherit
Fig. 2. Con este lanzamiento, Ultralytics ofrece 30 nuevos modelos.

YOLO11 presenta cinco tamaños de modelo distintos: Nano, Small, Medium, Large y X. Los usuarios pueden elegir el modelo más adecuado en función de las necesidades específicas de su aplicación de visión por ordenador. Los cinco tamaños ofrecen flexibilidad en tareas como la clasificación de imágenes, la detección de objetos, la segmentación de instancias, el seguimiento, la estimación de poses y la detección de objetos mediante cajas delimitadoras orientadas (OBB). Para cada tamaño, hay un modelo disponible para cada tarea, lo que da como resultado un total de 25 modelos de código abierto que forman el núcleo de la oferta de Ultralytics. Estos modelos son ideales para una amplia gama de aplicaciones, desde tareas ligeras en dispositivos periféricos, donde el modelo YOLO11n ofrece una eficiencia impresionante, hasta aplicaciones a mayor escala que requieren los modelos YOLO11l y YOLO11x.

Por primera vez, Ultralytics introduce modelos empresariales, marcando un hito importante en nuestra oferta de productos, y estamos encantados de compartir estas nuevas innovaciones con nuestros usuarios. YOLO11 introduce cinco modelos propios diseñados específicamente para casos de uso comercial. Estos modelos empresariales, que estarán disponibles el mes que viene, se han entrenado con el nuevo conjunto de datos propiedad de Ultralytics, que consta de más de un millón de imágenes y ofrece modelos preentrenados más robustos. Están diseñados para aplicaciones exigentes del mundo real, como el análisis de imágenes médicas y el procesamiento de imágenes de satélite, donde la detección precisa de objetos es crucial.

Exploración de las nuevas funciones de YOLO11

Ahora que ya hemos hablado de lo que ofrece YOLO11, echemos un vistazo a lo que hace que YOLO11 sea tan especial.

Uno de los principales retos a la hora de desarrollar YOLO11 fue encontrar el equilibrio adecuado entre prioridades contrapuestas: hacer los modelos más pequeños, más rápidos y más precisos. Como explica Glenn Jocher, fundador y consejero delegado de Ultralytics, "Trabajar en la investigación y el desarrollo de YOLO es todo un reto porque quieres ir en tres direcciones diferentes: quieres que los modelos sean más pequeños, quieres que sean más precisos, pero también quieres que sean más rápidos en diferentes plataformas como CPU y GPU. Todos estos intereses compiten entre sí, así que hay que llegar a compromisos y elegir dónde hacer los cambios". A pesar de estos retos, YOLO11 logra un equilibrio impresionante, ofreciendo mejoras tanto en velocidad como en precisión con respecto a versiones anteriores como YOLOv8.

__wf_reserved_inherit
Fig. 3. Ejemplo de utilización de YOLO11 para la detección de objetos.

YOLO11 aporta mejoras sustanciales como la extracción de características mejorada con una arquitectura de columna vertebral y cuello rediseñada, lo que permite una detección de objetos más precisa. El modelo también se ha optimizado para aumentar la velocidad y la eficacia, ofreciendo tiempos de procesamiento más rápidos y manteniendo al mismo tiempo una gran precisión. Además de estas ventajas, YOLO11 es altamente adaptable a diferentes entornos, ya que funciona sin problemas en dispositivos periféricos, plataformas en la nube y sistemas que utilizan GPU NVIDIA. Esta adaptabilidad lo convierte en la opción ideal para los usuarios que necesitan opciones de implantación flexibles en distintas configuraciones de hardware, desde dispositivos móviles hasta servidores a gran escala.

Aplicaciones YOLO11 en tiempo real

La versatilidad de YOLO11 la convierte en una herramienta fiable en muchos sectores, especialmente cuando se trata de casos de uso complejos. Por ejemplo, funciona a la perfección en dispositivos periféricos y puede utilizarse para aplicaciones que requieren análisis en tiempo real en entornos con potencia de cálculo limitada. Un ejemplo excelente es la conducción autónoma, en la que los vehículos deben tomar decisiones en fracciones de segundo para mantener la seguridad de todos. YOLO11 ayuda detectando y analizando objetos en la carretera, como peatones u otros coches, incluso en condiciones difíciles como poca luz o cuando los objetos están parcialmente ocultos. Una detección rápida y precisa ayuda a evitar accidentes y garantiza que los vehículos autoconducidos puedan circular con seguridad.

__wf_reserved_inherit
Fig. 4. Glenn Jocher en el escenario de YV24, hablando de las aplicaciones de YOLO11.

Otro ejemplo interesante del alcance de YOLO11 es su capacidad para manejar cajas delimitadoras orientadas (OBB). Es esencial para detectar objetos que no están perfectamente alineados. La detección de objetos OBB es una función especialmente útil en sectores como la agricultura, la cartografía y la vigilancia, donde las imágenes suelen contener objetos girados, como cultivos o edificios en imágenes aéreas o por satélite. A diferencia de los modelos tradicionales, YOLO11 puede identificar objetos en cualquier ángulo y proporcionar resultados mucho más exactos para tareas que requieren precisión.

YOLO11 para desarrolladores de IA: Pruébelo usted mismo

Empezar a trabajar con YOLO11 es sencillo y accesible, tanto si prefiere la codificación como si prefiere la opción sin código. Para trabajar con YOLO11 mediante código, puede utilizar el paquete Python de Ultralytics para entrenar y desplegar modelos fácilmente. Si prefiere trabajar sin código, Ultralytics HUB le permite probar YOLO11 con unos pocos clics.

Guía del código YOLO11

Para utilizar YOLO11 con Python, primero tendrás que instalar el paquete Ultralytics. Dependiendo de tus preferencias, puedes hacerlo mediante pip, conda o Docker. Para obtener instrucciones detalladas y las mejores prácticas relacionadas con el proceso de instalación, asegúrese de consultar nuestra Guía de instalación de Ultralytics. Mientras instala los paquetes necesarios para YOLO11, si encuentra alguna dificultad, consulte nuestra Guía de problemas comunes para obtener soluciones y consejos.

Una vez instalado el paquete Ultralytics, utilizar YOLO11 es muy sencillo. El siguiente fragmento de código le guiará a través del proceso de carga de un modelo, su entrenamiento, la comprobación de su rendimiento y su exportación al formato ONNX. Para ejemplos más detallados y usos avanzados, no deje de consultar la documentación oficial de Ultralytics, donde encontrará guías detalladas y las mejores prácticas para sacar el máximo partido a YOLO11.

__wf_reserved_inherit
Fig. 5. Utilización de YOLO11 a través del paquete Ultralytics. 

Para los usuarios que prefieren un enfoque sin código, Ultralytics HUB proporciona una manera fácil de entrenar y desplegar modelos YOLO11 con sólo unos clics. Para empezar a utilizar HUB, basta con crear una cuenta en la plataforma Ultralytics HUB y podrá empezar a entrenar y gestionar sus modelos a través de una interfaz intuitiva.

YOLO11: El futuro de la IA visual

La comunidad de la IA avanza constantemente en el campo de la visión por ordenador esforzándose por desarrollar modelos más rápidos y precisos para las aplicaciones del mundo real. Ultralytics YOLO11 es un hito importante en este esfuerzo, ya que aporta mayor velocidad, precisión y flexibilidad. Está diseñado para aplicaciones en tiempo real y de vanguardia, por lo que resulta ideal para sectores como la sanidad y la conducción autónoma. Tanto si utiliza el paquete Python de Ultralytics como el Ultralytics Hub sin código, YOLO11 simplifica las complejas tareas de Vision AI. Ofrece potentes funciones de visión por ordenador, por lo que es una gran opción para desarrolladores y empresas.

Consulte nuestro repositorio de GitHub y únase a nuestra activa comunidad para aprender más sobre IA. Descubra cómo Vision AI está impulsando la innovación en sectores como la sanidad y la agricultura.

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Empezar gratis
Enlace copiado en el portapapeles