Как использовать Ultralytics YOLO11 для обнаружения объектов OBB

Абирами Вина

5 минут чтения

8 октября 2024 г.

Узнайте, как Ultralytics YOLO11 может улучшить обнаружение объектов с помощью ориентированных ограничительных коробок (OBB) и для каких приложений идеально подходит эта задача компьютерного зрения.

Ежегодное гибридное мероприятие Ultralytics YOLO Vision 2024 (YV24) было посвящено обсуждению последних прорывов в области искусственного интеллекта и компьютерного зрения. Это был идеальный повод представить нашу новейшую модель, Ultralytics YOLO11. Модель поддерживает те же задачи компьютерного зрения, что и Ultralytics YOLOv8, что делает переход на новую модель легким для пользователей.

Предположим, вы использовали YOLOv8 для обнаружения объектов с помощью ориентированных ограничительных коробок (OBB), чтобы обнаруживать объекты под разными углами. Теперь вы можете перейти на YOLO11, внеся несколько незначительных изменений в свой код, и воспользоваться преимуществами YOLO11, начиная от повышенной точности и эффективности и заканчивая скоростью обработки. Если вы еще не использовали такие модели, как YOLO11, обнаружение OBB является отличным примером того, как YOLO11 может применяться в различных отраслях, предлагая практические решения, которые приносят реальную пользу.

В этой статье мы рассмотрим , что такое обнаружение объектов OBB, где оно может применяться и как использовать YOLO11 для обнаружения OBB. Мы также рассмотрим, как новые функции YOLO11 могут улучшить эти процессы и как делать выводы и обучать пользовательские модели, чтобы максимально использовать возможности обнаружения БДБ.

Функции нового поколения YOLO11 включают такие задачи, как обнаружение объектов OBB

Обнаружение объектов с помощью OBB делает традиционное обнаружение объектов еще одним шагом вперед, обнаруживая объекты под разными углами. В отличие от обычных ограничивающих рамок, которые остаются выровненными по осям изображения, OBB поворачиваются, чтобы соответствовать ориентации объекта. Обнаружение объектов с помощью OBB можно использовать для анализа воздушных или спутниковых изображений, на которых объекты не всегда расположены прямо. В таких отраслях, как градостроительство, энергетика и транспорт, способность точно обнаруживать наклонные объекты, такие как здания, транспортные средства или инфраструктура, может стать основой приложений компьютерного зрения с ощутимыми преимуществами. 

__wf_reserved_inherit
Рис. 1. Сравнение обычных и ориентированных ограничительных блоков.

YOLO11 поддерживает обнаружение OBB и был обучен на наборе данных DOTA v1.0, чтобы обнаруживать такие объекты, как самолеты, корабли и резервуары с различных точек зрения. YOLO11 поставляется в нескольких вариантах моделей для удовлетворения различных потребностей, включая YOLO11n-obb (Nano), YOLO11s-obb (Small), YOLO11m-obb (Medium), YOLO11l-obb (Large) и YOLO11x-obb (Extra Large). Каждая модель имеет разный размер, разный уровень скорости, точности и вычислительной мощности. Пользователи могут выбрать модель, обеспечивающую оптимальный баланс скорости и точности для их задач. 

Примеры использования YOLO11, которые позволяют взглянуть на обнаружение с новой стороны

Возможности обнаружения объектов в YOLO11, особенно поддержка ориентированных ограничительных блоков, позволяют повысить точность в различных отраслях. Далее мы рассмотрим несколько примеров того, как YOLO11 и обнаружение OBB можно использовать в реальных ситуациях, чтобы сделать процессы более эффективными, точными и легкими в управлении в различных областях.

Градостроительство и мониторинг инфраструктуры с помощью YOLO11

Если вы когда-нибудь восхищались дизайном и планировкой города, то это благодаря детальной работе градостроительной службы и мониторинга инфраструктуры. Одним из многочисленных аспектов мониторинга инфраструктуры является выявление и управление такими важными сооружениями, как резервуары, трубопроводы и промышленные объекты. YOLO11 может помочь градостроителям проанализировать аэрофотоснимки, чтобы быстро и точно обнаружить эти важные компоненты. 

Обнаружение объектов в ориентированных границах особенно полезно, поскольку позволяет обнаруживать объекты, рассматриваемые под разными углами (что часто бывает при использовании аэрофотоснимков). Точность здесь крайне важна для отслеживания промышленных зон, управления воздействием на окружающую среду и обеспечения надлежащего содержания инфраструктуры. OBB делает процесс обнаружения более надежным, помогая планировщикам принимать обоснованные решения о росте, безопасности и устойчивости города. Использование YOLO11 поможет планировщикам контролировать и управлять инфраструктурой, обеспечивающей бесперебойную работу городов.

__wf_reserved_inherit
Рис. 2. Использование YOLO11 для обнаружения резервуаров на аэрофотосъемке.

Проверка солнечных батарей с помощью дронов, YOLO11 и краевого ИИ

По мере того как возобновляемые источники энергии и инновации, такие как солнечные фермы, становятся все более популярными, регулярные проверки приобретают все большее значение. Солнечные панели необходимо проверять, чтобы убедиться, что они работают эффективно. Со временем такие вещи, как трещины, скопление грязи или несоосность, могут снизить их производительность. Регулярные осмотры помогают выявить эти проблемы на ранней стадии, чтобы можно было провести техническое обслуживание для поддержания бесперебойной работы.

Например, солнечные панели можно проверять на наличие повреждений с помощью беспилотников, интегрированных с краевым искусственным интеллектом и YOLO11. Анализ изображений на грани позволяет повысить точность и эффективность процесса осмотра. Из-за движения беспилотника и ракурса съемки солнечные панели могут быть запечатлены под разными углами. В таких случаях обнаружение OBB с помощью YOLO11 поможет дронам точно идентифицировать солнечные панели. 

YOLO11 может предоставить информацию для управления автопарком

Порты и гавани еженедельно обслуживают сотни судов, и управление таким большим флотом может оказаться непростой задачей. Дополнительный элемент сложности возникает при анализе судов на аэрофотоснимках: корабли часто располагаются под разными углами. Именно здесь пригодится поддержка обнаружения OBB в YOLO11

Обнаружение OBB позволяет модели обнаруживать суда под разными углами более точно, чем стандартные прямоугольные коробки. Используя YOLO11 с OBB, судоходные компании могут легче определять местоположение и состояние своего флота, отслеживая такие важные детали, как перемещение флота и логистика цепочки поставок. Такие решения с использованием технического зрения помогают оптимизировать маршруты, сократить задержки и улучшить общее управление флотом на всех морских маршрутах.

__wf_reserved_inherit
Рис. 3. Использование YOLO11 для обнаружения кораблей и гаваней под углом.

YOLO11 для разработчиков искусственного интеллекта: Обнаружение ориентированных ограничивающих блоков

Если вы разработчик искусственного интеллекта, желающий использовать YOLO11 для обнаружения OBB, есть два простых варианта для начала работы. Если вам удобно работать с кодом, то пакет Ultralytics Python - отличный выбор. Если же вы предпочитаете удобное решение без кода с возможностью обучения в облаке, Ultralytics HUB - это собственная платформа, созданная специально для этого. Для получения более подробной информации вы можете ознакомиться с нашим руководством по обучению и развертыванию Ultralytics YOLO11 с помощью Ultralytics HUB.

Теперь, когда мы увидели примеры применения поддержки OBB в YOLO11, давайте изучим пакет Ultralytics Python и посмотрим, как с его помощью можно делать выводы и обучать пользовательские модели

Выполнение выводов с помощью YOLO11

Во-первых, чтобы использовать YOLO11 с Python, вам нужно установить пакет Ultralytics. В зависимости от ваших предпочтений, вы можете установить его с помощью pip, conda или Docker. Для получения пошаговых инструкций вы можете обратиться к нашему руководству по установке Ultralytics. Если в процессе установки у вас возникнут проблемы, в нашем руководстве по общим проблемам вы найдете полезные советы по устранению неполадок.

После установки пакета Ultralytics работа с YOLO11 становится невероятно простой. Выполнение выводов - это процесс использования обученной модели для прогнозирования новых изображений, например обнаружения объектов с помощью OBB в режиме реального времени. Это отличается от обучения модели, когда вы учите модель распознавать новые объекты или улучшаете ее производительность при выполнении конкретных задач. Выводы используются, когда вы хотите применить модель к невидимым данным.

В приведенном ниже примере показано, как загрузить модель и использовать ее для прогнозирования ориентированных ограничительных рамок на изображении. Для получения более подробных примеров и советов по расширенному использованию обязательно ознакомьтесь с официальной документацией Ultralytics, где приведены лучшие практики и дальнейшие инструкции.

__wf_reserved_inherit
Рис. 4. Фрагмент кода, демонстрирующий выполнение выводов с помощью YOLO11.

Обучение пользовательской модели YOLO11

Обучение модели YOLO11 позволяет точно настроить ее производительность на конкретных наборах данных и задачах, таких как обнаружение объектов с ориентированной ограничительной рамкой. Хотя предварительно обученные модели, такие как YOLO11, можно использовать для общего обнаружения объектов, обучение пользовательской модели необходимо, если вам нужно, чтобы модель обнаруживала уникальные объекты или оптимизировала производительность на конкретном наборе данных.

В приведенном ниже фрагменте кода описаны шаги по обучению модели YOLO11 для обнаружения OBB. 

Сначала модель инициализируется с помощью предварительно обученных весов, специфичных для YOLO11 OBB (yolo11n-obb.pt). Затем используется функция обучения для тренировки модели на пользовательском наборе данных с такими параметрами, как файл конфигурации набора данных, количество циклов обучения, размер обучающего изображения и аппаратное обеспечение для выполнения обучения (например, CPU или GPU). После обучения производительность модели проверяется с помощью таких показателей, как точность и потери. 

Используя обученную модель, вы можете выполнять умозаключения на новых изображениях для обнаружения объектов с OBB и их визуализации. Кроме того, обученную модель можно преобразовать в форматы, например ONNX , для развертывания с помощью функции экспорта.

__wf_reserved_inherit
Рис. 5. Пример обучения YOLO11 для обнаружения объектов OBB.

Дальнейший путь развития ИИ в YOLO11

Ultralytics YOLO11 выводит обнаружение объектов на новый уровень благодаря поддержке ориентированных ограничительных рамок. Благодаря возможности обнаружения объектов под разными углами, YOLO11 можно использовать в различных отраслях. Например, он идеально подходит для таких отраслей, как градостроительство, энергетика и судоходство, где точность очень важна для таких задач, как проверка солнечных батарей или мониторинг автопарка. Благодаря более высокой производительности и точности YOLO11 поможет разработчикам ИИ решать реальные задачи. 

По мере того как ИИ будет все шире внедряться в нашу повседневную жизнь, модели, подобные YOLO11, будут определять будущее ИИ-решений.

Чтобы узнать о возможностях Vision AI, присоединяйтесь к нашему растущему сообществу и изучите наш репозиторий на GitHub. Мы стимулируем инновации, переосмысливая такие отрасли, как здравоохранение и самоуправляемые автомобили.

Давайте вместе построим будущее
искусственного интеллекта!

Начните свое путешествие в будущее машинного обучения

Начните бесплатно
Ссылка копируется в буфер обмена