Como utilizar o Ultralytics YOLO11 para a deteção de objectos OBB

Abirami Vina

5 min. de leitura

8 de outubro de 2024

Compreenda como o Ultralytics YOLO11 pode melhorar a deteção de objectos utilizando caixas delimitadoras orientadas (OBB) e para que aplicações esta tarefa de visão computacional é ideal.

O evento híbrido anual da Ultralytics, YOLO Vision 2024 (YV24), centrou-se na discussão dos mais recentes avanços em IA e visão computacional. Essa foi a ocasião perfeita para apresentar nosso mais novo modelo, o Ultralytics YOLO11. O modelo suporta as mesmas tarefas de visão computacional que o Ultralytics YOLOv8, tornando a mudança para o novo modelo sem esforço para os utilizadores.

Suponha que estava a utilizar o YOLOv8 para a deteção de objectos com caixas delimitadoras orientadas (OBB) para detetar objectos de vários ângulos. Pode agora mudar para o YOLO11 com algumas pequenas alterações no seu código e beneficiar das melhorias do YOLO11, que vão desde uma maior precisão e eficiência até à velocidade de processamento. Caso ainda não tenha utilizado modelos como o YOLO11, a deteção de OBB é um excelente exemplo de como o YOLO11 pode ser aplicado numa série de indústrias, oferecendo soluções práticas que têm um impacto real.

Neste artigo, veremos o que é a deteção de objectos OBB, onde pode ser aplicada e como utilizar o YOLO11 para detetar OBB. Iremos também explicar como as novas funcionalidades do YOLO11 podem melhorar estes processos e como executar inferências e treinar modelos personalizados para tirar o máximo partido das suas capacidades de deteção de OBB.

As funcionalidades da próxima geração do YOLO11 incluem tarefas como a deteção de objectos OBB

A deteção de objectos OBB leva a deteção de objectos tradicional um passo à frente, detectando objectos em diferentes ângulos. Ao contrário das caixas delimitadoras normais que se mantêm alinhadas com os eixos da imagem, as OBBs rodam para se adaptarem à orientação do objeto. A deteção de objectos OBB pode ser utilizada para analisar imagens aéreas ou de satélite em que os objectos nem sempre estão direitos. Em indústrias como o planeamento urbano, a energia e os transportes, a capacidade de detetar com precisão objectos angulares como edifícios, veículos ou infra-estruturas pode constituir a base de aplicações de visão por computador com benefícios tangíveis. 

__wf_reserved_inherit
Figura 1. Comparação entre caixas delimitadoras normais e caixas delimitadoras orientadas.

O YOLO11 suporta a deteção de OBB e foi treinado no conjunto de dados DOTA v1.0 para detetar objectos como aviões, navios e tanques de armazenamento a partir de diferentes perspectivas. O YOLO11 vem em diversas variações de modelos para atender a diferentes necessidades, incluindo YOLO11n-obb (Nano), YOLO11s-obb (Pequeno), YOLO11m-obb (Médio), YOLO11l-obb (Grande) e YOLO11x-obb (Extra Grande). Cada modelo oferece um tamanho diferente, com diferentes níveis de velocidade, precisão e potência computacional. Os utilizadores podem escolher o modelo que oferece o equilíbrio certo de velocidade e precisão para a sua aplicação. 

Casos de utilização do YOLO11 que introduzem um novo ângulo de deteção

As capacidades de deteção de objectos do YOLO11, especialmente o seu suporte para caixas delimitadoras orientadas, trazem maior precisão a várias indústrias. De seguida, veremos alguns exemplos de como o YOLO11 e a deteção de OBB podem ser utilizados em situações reais para tornar os processos mais eficientes, precisos e fáceis de gerir em diferentes áreas.

Planeamento urbano e monitorização de infra-estruturas com YOLO11

Se alguma vez admirou o design e a disposição de uma cidade, isso deve-se ao trabalho minucioso do planeamento urbano e da monitorização de infra-estruturas. Um dos muitos aspectos da monitorização de infra-estruturas é a identificação e gestão de estruturas importantes como tanques de armazenamento, condutas e instalações industriais. O YOLO11 pode ajudar os planeadores urbanos a analisar imagens aéreas para detetar estes componentes críticos com rapidez e precisão. 

A deteção de objectos com caixa delimitadora orientada é particularmente útil neste caso porque permite a deteção de objectos vistos de vários ângulos (frequentemente o caso com imagens aéreas). A precisão é vital neste caso para acompanhar as zonas industriais, gerir os impactos ambientais e assegurar a manutenção adequada das infra-estruturas. O OBB torna o processo de deteção mais fiável, ajudando os planeadores a tomar decisões informadas sobre o crescimento, a segurança e a sustentabilidade da cidade. A utilização do YOLO11 pode ajudar os planeadores a monitorizar e gerir a infraestrutura que mantém as cidades a funcionar sem problemas.

__wf_reserved_inherit
Fig. 2. Utilização do YOLO11 para detetar tanques de armazenamento em imagens aéreas.

Inspeção de painéis solares com drones, YOLO11 e IA de ponta

À medida que as energias renováveis e as inovações como os parques solares se tornam mais populares, as inspecções regulares estão a tornar-se mais importantes. Os painéis solares têm de ser verificados para garantir que estão a funcionar eficientemente. Com o tempo, coisas como fissuras, acumulação de sujidade ou desalinhamento podem diminuir o seu desempenho. As inspecções de rotina ajudam a detetar estes problemas atempadamente, pelo que pode ser feita a manutenção para os manter a funcionar sem problemas.

Por exemplo, os painéis solares podem ser inspeccionados quanto a danos utilizando drones que estão integrados com IA de ponta e YOLO11. A análise de imagens no limite traz mais precisão e eficiência ao processo de inspeção. Devido ao movimento e à perspetiva do drone, as imagens de vigilância podem frequentemente captar painéis solares de vários ângulos. Nestes casos, a deteção de OBB do YOLO11 pode ajudar os drones a identificar com precisão os painéis solares. 

O YOLO11 pode fornecer informações para a gestão de frotas

Os portos movimentam centenas de navios todas as semanas, e a gestão de uma frota tão grande pode ser um desafio. Um elemento adicional de dificuldade está envolvido na análise de navios em imagens aéreas; os navios aparecem frequentemente em ângulos diferentes. É aqui que o suporte do YOLO11 para a deteção de OBB é útil. 

A deteção OBB permite que o modelo detecte navios em vários ângulos com maior precisão do que as caixas rectangulares normais. Ao utilizar o YOLO11 com OBB, as empresas de transporte marítimo podem identificar mais facilmente a localização e o estado da sua frota, mantendo o registo de detalhes importantes como os movimentos da frota e a logística da cadeia de fornecimento. Estas soluções de visão ajudam a otimizar as rotas, a reduzir os atrasos e a melhorar a gestão global da frota nas rotas de navegação.

__wf_reserved_inherit
Fig. 3. Utilização do YOLO11 para detetar navios e portos num ângulo.

YOLO11 para programadores de IA: Deteção de caixas delimitadoras orientadas

Se é um programador de IA que pretende utilizar o YOLO11 para a deteção de OBB, existem duas opções fáceis para começar. Se se sente confortável a trabalhar com código, o pacote Ultralytics Python é uma óptima escolha. Se preferir uma solução fácil de utilizar e sem código, com capacidades de formação na nuvem, o Ultralytics HUB é uma plataforma interna concebida especialmente para o efeito. Para mais pormenores, pode consultar o nosso guia sobre formação e implementação do Ultralytics YOLO11 utilizando o Ultralytics HUB.

Agora que já vimos exemplos de como o suporte OBB do YOLO11 pode ser aplicado, vamos explorar o pacote Ultralytics Python e ver como pode executar inferências e treinar modelos personalizados utilizando-o. 

Execução de inferências com YOLO11

Primeiro, para usar o YOLO11 com Python, você precisará instalar o pacote Ultralytics. Dependendo de suas preferências, você pode optar por instalá-lo usando pip, conda ou Docker. Para obter instruções passo a passo, pode consultar o nosso Guia de Instalação do Ultralytics. Se você enfrentar algum desafio durante a instalação, nosso Guia de problemas comuns oferece dicas úteis de solução de problemas.

Depois de ter instalado o pacote Ultralytics, trabalhar com o YOLO11 é incrivelmente simples. A execução de uma inferência refere-se ao processo de utilização de um modelo treinado para fazer previsões sobre novas imagens - como a deteção de objectos com OBB em tempo real. É diferente do treino de modelos, que é quando se ensina o modelo a reconhecer novos objectos ou a melhorar o seu desempenho em tarefas específicas. A inferência é utilizada quando se pretende aplicar o modelo a dados não vistos.

O exemplo abaixo mostra como carregar um modelo e usá-lo para prever caixas delimitadoras orientadas em uma imagem. Para obter exemplos mais detalhados e dicas de utilização avançada, consulte a documentação oficial do Ultralytics para obter práticas recomendadas e instruções adicionais.

__wf_reserved_inherit
Fig. 4. Um excerto de código que mostra a execução de inferências utilizando o YOLO11.

Treinar um modelo YOLO11 personalizado

Treinar um modelo YOLO11 significa que pode afinar o seu desempenho em conjuntos de dados e tarefas específicos, como a deteção orientada de objectos com caixa delimitadora. Embora os modelos pré-treinados como o YOLO11 possam ser utilizados para a deteção geral de objectos, o treino de um modelo personalizado é essencial quando é necessário que o modelo detecte objectos únicos ou optimize o desempenho num conjunto de dados específico.

No trecho de código abaixo, abordamos os passos para treinar um modelo YOLO11 para deteção de OBB. 

Primeiro, o modelo é inicializado utilizando pesos pré-treinados específicos do YOLO11 OBB (yolo11n-obb.pt). Em seguida, é utilizada uma função de treino para treinar o modelo num conjunto de dados personalizado, com parâmetros como o ficheiro de configuração do conjunto de dados, o número de ciclos de treino, o tamanho da imagem de treino e o hardware para executar o treino (por exemplo, CPU ou GPU). Após o treino, o desempenho do modelo é validado para verificar métricas como a precisão e a perda. 

Utilizando o modelo treinado, é possível executar inferências em novas imagens para detetar objectos com OBB e visualizá-los. Além disso, o modelo treinado pode ser convertido para formatos como ONNX para implementação utilizando a funcionalidade de exportação.

__wf_reserved_inherit
Fig. 5. Um exemplo de treino do YOLO11 para a deteção de objectos OBB.

O caminho a seguir para os avanços da IA do YOLO11

O Ultralytics YOLO11 leva a deteção de objectos para o nível seguinte com o seu suporte para caixas delimitadoras orientadas. Ao ser capaz de detetar objectos em diferentes ângulos, o YOLO11 pode ser utilizado para várias aplicações em diferentes indústrias. Por exemplo, é perfeito para indústrias como o planeamento urbano, a energia e a navegação, onde a precisão é crucial para tarefas como a inspeção de painéis solares ou a monitorização de frotas. Com um desempenho mais rápido e uma precisão melhorada, o YOLO11 pode ajudar os programadores de IA a resolver desafios do mundo real. 

À medida que a IA se torna mais amplamente adoptada e integrada na nossa vida quotidiana, modelos como o YOLO11 irão moldar o futuro das soluções de IA.

Para saber mais sobre o potencial da Vision AI, junte-se à nossa crescente comunidade e explore o nosso repositório GitHub. Estamos a impulsionar a inovação, reinventando sectores como os cuidados de saúde e os automóveis autónomos.

Vamos construir juntos o futuro
da IA!

Comece a sua viagem com o futuro da aprendizagem automática

Comece gratuitamente
Ligação copiada para a área de transferência