Glossário

Matriz de confusão

Compreender o desempenho do modelo com uma matriz de confusão. Explore métricas, utilizações no mundo real e ferramentas para aperfeiçoar a precisão da classificação da IA.

Uma matriz de confusão é uma ferramenta de medição do desempenho utilizada na aprendizagem supervisionada, especificamente para problemas de classificação. Fornece um resumo abrangente do desempenho de um modelo de classificação, comparando as classificações previstas com as classificações reais efectivas para um conjunto de dados de teste. Esta visualização ajuda a compreender não só a correção geral do modelo, mas também os tipos de erros que comete (ou seja, onde o modelo está "confuso"). É particularmente útil na Aprendizagem Automática (AM) e na Inteligência Artificial (IA) para avaliar modelos treinados para tarefas como a classificação de imagens ou a deteção de objectos.

Compreender os componentes

Uma matriz de confusão é normalmente apresentada como uma grelha quadrada em que cada linha representa as instâncias de uma classe real e cada coluna representa as instâncias de uma classe prevista (ou vice-versa). Para um problema simples de classificação binária (duas classes, por exemplo, Positivo e Negativo), a matriz tem quatro células:

Verdadeiros positivos (TP): O modelo previu corretamente a classe positiva.
Verdadeiros negativos (TN): O modelo previu corretamente a classe negativa.
Falsos positivos (FP) (Erro do tipo I): O modelo previu incorretamente a classe positiva (previu positivo, mas a classe real era negativa).
Falsos negativos (FN) (erro do tipo II): O modelo previu incorretamente a classe negativa (previu negativo, mas a classe real era positiva).

Estes quatro componentes constituem a base para o cálculo de vários indicadores de desempenho.

Relação com outras métricas de avaliação

Embora uma matriz de confusão forneça uma análise pormenorizada, são derivadas dela várias métricas-chave para resumir o desempenho:

Exatidão: A proporção do total de previsões que estavam corretas (TP + TN) / (TP + TN + FP + FN). Embora simples, pode ser enganador para conjuntos de dados desequilibrados.
Precisão: Mede a exatidão das previsões positivas. TP / (TP + FP). Responde a: "De todas as instâncias previstas como positivas, quantas são efetivamente positivas?"
Recuperação (Sensibilidade ou taxa de verdadeiros positivos): Mede a capacidade do modelo de identificar instâncias positivas reais. TP / (TP + FN). Responde: "De todas as instâncias positivas reais, quantas foram corretamente identificadas pelo modelo?"
Pontuação F1: A média harmónica de Precisão e Recuperação, fornecendo uma pontuação única que equilibra ambas as preocupações.
Especificidade (Taxa de verdadeiros negativos): Mede a capacidade do modelo de identificar instâncias negativas reais. TN / (TN + FP).
Curva Caraterística de Funcionamento do Recetor (ROC): Traça a taxa de verdadeiros positivos (Recall) em relação à taxa de falsos positivos (1 - Especificidade) em várias definições de limiar, resumindo o desempenho em diferentes limiares de decisão.

Compreender a matriz de confusão ajuda a escolher as métricas mais relevantes para um problema específico, especialmente quando os custos dos diferentes tipos de erros (FP vs. FN) variam significativamente. Pode saber mais sobre isto no nosso guia de métricas de desempenho YOLO.

Utilização em Ultralytics

Ao treinar modelos como o Ultralytics YOLO para tarefas como a deteção de objectos ou a classificação de imagens, as matrizes de confusão são geradas automaticamente durante a fase de validação(modo Val). Estas matrizes ajudam os utilizadores a visualizar o desempenho do modelo em diferentes classes de conjuntos de dados como o COCO ou conjuntos de dados personalizados. Plataformas como o Ultralytics HUB fornecem ambientes integrados para modelos de treino, gestão de conjuntos de dados e análise de resultados, incluindo matrizes de confusão, para obter uma visão abrangente da avaliação do modelo. Isto permite uma rápida identificação das classes com as quais o modelo tem dificuldades, informando sobre o aumento dos dados ou a afinação dos hiperparâmetros. Estruturas como o PyTorch e o TensorFlow integram frequentemente ferramentas para gerar estas matrizes.

Aplicações no mundo real

As matrizes de confusão são vitais em muitos domínios:

Diagnóstico médico: Na avaliação de um modelo concebido para detetar doenças como o cancro a partir de imagens médicas, é crucial uma matriz de confusão. Um Falso Negativo (não detetar o cancro quando presente) pode ter consequências graves, potencialmente mais graves do que um Falso Positivo (detetar o cancro quando ausente, levando a mais testes). A análise da matriz ajuda a equilibrar a Precisão e a Recuperação de acordo com as necessidades clínicas. Para mais informações, consulte os recursos do NIH sobre imagiologia médica. Esta é uma área fundamental da IA nos cuidados de saúde.
Deteção de e-mails de spam: Para um filtro de spam, uma matriz de confusão ajuda a avaliar o desempenho. Um Falso Positivo (classificar um e-mail legítimo como spam) pode ser mais problemático para os utilizadores do que um Falso Negativo (deixar passar um e-mail de spam). A matriz detalha a frequência com que cada tipo de erro ocorre, orientando os ajustes do modelo. Pode explorar a investigação sobre a deteção de spam utilizando estas técnicas, que envolvem frequentemente o Processamento de Linguagem Natural (PNL). Outras aplicações incluem a deteção de fraudes e a avaliação de modelos em sistemas de segurança.

Benefícios e limitações

A principal vantagem de uma matriz de confusão é a sua capacidade de fornecer uma análise detalhada, classe a classe, do desempenho do modelo para além de uma única pontuação de precisão. Ela mostra claramente onde o modelo está "confuso" e é essencial para depurar e melhorar os modelos de classificação, especialmente em cenários com classes desequilibradas ou custos diferentes associados a erros. Suporta a visualização de dados para facilitar a interpretação. Uma limitação é que, para problemas com um número muito grande de classes(como os de grandes conjuntos de dados como o ImageNet), a matriz pode tornar-se grande e difícil de interpretar visualmente sem agregação ou técnicas de visualização especializadas.

Em resumo, a matriz de confusão é uma ferramenta de avaliação indispensável na aprendizagem supervisionada, oferecendo informações cruciais para o desenvolvimento de modelos robustos e fiáveis de Visão por Computador (CV) e outros modelos de ML. A compreensão dos seus componentes é fundamental para uma avaliação e iteração eficazes do modelo em plataformas como o Ultralytics HUB.

Matriz de confusão

Solução flexível de licenciamento empresarial para impulsionar a sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

Treine modelos YOLO de forma simples com o Ultralytics HUB

Compreender os componentes

Relação com outras métricas de avaliação

Utilização em Ultralytics

Aplicações no mundo real

Benefícios e limitações

Ler mais nesta categoria

O papel da visão computacional nos pipelines de inovação da Indústria 4.0

Principais destaques da Ultralytics na South Summit 2025

A agricultura hidropónica alimentada por IA da Vision melhora a monitorização das plantas

Junte-se à comunidade Ultralytics