Ultralytics 的年度混合活动 YOLO Vision 2024(YV24)重点讨论了人工智能和计算机视觉领域的最新突破。这是介绍我们最新机型Ultralytics YOLO11 的绝佳机会。该机型支持与Ultralytics YOLOv8 相同的计算机视觉任务,用户可以毫不费力地转向新机型。
假设您正在使用 YOLOv8 进行定向边界框 (OBB) 物体检测,以从不同角度检测物体。现在,您只需对代码稍作修改,就可以切换到 YOLO11,并从YOLO11 的改进(从提高准确性和效率到处理速度)中获益。如果您尚未使用过YOLO11 这样的模型,那么 OBB 检测就是一个很好的例子,说明YOLO11 如何应用于各行各业,提供实用的解决方案,产生真正的影响。
在本文中,我们将介绍什么是 OBB 对象检测、它可以应用在哪些方面以及如何使用 YOLO11 检测 OBB。我们还将介绍 YOLO11 的新功能如何改进这些流程,以及如何运行推论和训练自定义模型,以充分利用其 OBB 检测功能。
OBB 物体检测通过检测不同角度的物体,在传统物体检测的基础上更进一步。与保持与图像轴线对齐的普通边界框不同,OBB 可旋转以适应物体的方向。OBB 物体检测可用于分析航空或卫星图像,因为这些图像中的物体并不总是直的。在城市规划、能源和交通等行业中,准确检测建筑物、车辆或基础设施等有角度的物体的能力可以为计算机视觉应用奠定基础,带来切实的好处。
YOLO11 支持 OBB 检测,并在DOTA v1.0 数据集上进行了训练,可从不同角度检测飞机、船只和储油罐等物体。YOLO11 有多种型号以满足不同需求,包括 YOLO11n-obb(纳米)、YOLO11s-obb(小型)、YOLO11m-obb(中型)、YOLO11l-obb(大型)和 YOLO11x-obb(超大型)。每个型号都有不同的尺寸,速度、精确度和计算能力也各不相同。用户可以根据自己的应用选择在速度和精确度之间取得适当平衡的型号。
YOLO11 的对象检测功能,尤其是对定向边界框的支持,为各行各业带来了更高的精度。接下来,我们将举例说明 YOLO11 和 OBB 检测如何应用于实际情况,使不同领域的流程更高效、更准确、更易于管理。
如果你曾经欣赏过一座城市的设计和布局,那要归功于城市规划和基础设施监控的细致工作。基础设施监控的许多方面之一是识别和管理重要的结构,如储油罐、管道和工业用地。YOLO11 可以帮助城市规划者分析航空图像,快速、准确地检测这些重要部件。
定向边界框对象检测在此特别有用,因为它可以检测从不同角度观察的对象(航空图像通常如此)。精确度对于跟踪工业区、管理环境影响以及确保基础设施得到妥善维护至关重要。OBB 使检测过程更加可靠,有助于规划人员就城市的发展、安全和可持续性做出明智的决策。使用 YOLO11 可以帮助规划者监控和管理基础设施,从而保证城市的平稳运行。
随着可再生能源和太阳能发电场等创新技术的普及,定期检查变得越来越重要。需要对太阳能电池板进行检查,以确保其有效工作。随着时间的推移,裂缝、污垢堆积或偏差等问题都会降低它们的性能。定期检查有助于及早发现这些问题,以便进行维护,使其保持平稳运行。
例如,可以使用集成了边缘人工智能和 YOLO11 的无人机检查太阳能电池板的损坏情况。在边缘分析图像可提高检测过程的精度和效率。由于无人机的移动和视角,监控镜头可能经常从不同角度拍摄太阳能电池板。在这种情况下,YOLO11 的 OBB 检测可以帮助无人机准确识别太阳能电池板。
港口和码头每周要处理数百艘船只,管理如此庞大的船队是一项挑战。在分析航拍图像中的船只时还会遇到额外的困难,因为船只通常会以不同的角度出现。这就是YOLO11 支持 OBB 检测的用武之地。
与标准矩形框相比,OBB 检测使模型能够更准确地从不同角度检测船只。通过使用带有 OBB 的 YOLO11,航运公司可以更轻松地识别其船队的位置和状况,跟踪船队移动和供应链物流等重要细节。这种支持视觉的解决方案有助于优化航线、减少延误并改善航运路线上的整体船队管理。
如果您是一名人工智能开发人员,希望使用 YOLO11 进行 OBB 检测,有两种简单的方法可以入门。如果您喜欢使用代码,Ultralytics Python 软件包是一个不错的选择。如果您更喜欢用户友好、无需代码、具有云培训功能的解决方案,Ultralytics HUB是一个专门为此设计的内部平台。更多详情,请参阅我们关于使用 Ultralytics HUB培训和部署 Ultralytics YOLO11的指南。
既然我们已经举例说明了 YOLO11 的 OBB 支持可以应用在哪些方面,那么让我们来探索一下 Ultralytics Python 软件包,看看如何使用它来运行推论和训练自定义模型。
首先,要在 Python 中使用 YOLO11,您需要安装 Ultralytics 软件包。根据自己的喜好,可以选择使用 pip、conda 或 Docker 安装。有关分步说明,请参阅我们的《Ultralytics 安装指南》。如果在安装过程中遇到任何问题,我们的《常见问题指南》会提供有用的故障排除技巧。
一旦安装了 Ultralytics 软件包,使用 YOLO11 就会变得非常简单。运行推理指的是使用训练有素的模型对新图像进行预测的过程,比如实时使用 OBB 检测物体。它不同于模型训练,后者是指您教模型识别新物体或提高其在特定任务中的性能。当您想将模型应用于未见数据时,就需要使用推理。
下面的示例将教你如何加载一个模型,并用它来预测图像上的定向边框。如需了解更详细的示例和高级使用技巧,请务必查看Ultralytics官方文档,了解最佳实践和更多说明。
训练 YOLO11 模型意味着您可以微调其在特定数据集和任务(如定向边界框对象检测)上的性能。虽然像 YOLO11 这样的预训练模型可用于一般的物体检测,但当您需要模型来检测独特的物体或优化特定数据集的性能时,训练一个自定义模型是必不可少的。
在下面的代码片段中,我们将介绍训练用于 OBB 检测的 YOLO11 模型的步骤。
首先,使用预先训练好的 YOLO11 OBB 特定权重(yolo11n-obb.pt)对模型进行初始化。然后,使用训练函数在自定义数据集上训练模型,参数包括数据集配置文件、训练周期数、训练图像大小以及运行训练的硬件(如 CPU 或 GPU)。训练完成后,对模型的性能进行验证,检查准确率和损失等指标。
使用训练有素的模型,您可以在新图像上运行推理,以检测带有 OBB 的对象,并将其可视化。此外,还可以使用导出功能将训练好的模型转换为ONNX 等格式,以便部署。
Ultralytics YOLO11 通过对定向边界框的支持,将物体检测提升到了一个新的水平。由于能够检测不同角度的物体,YOLO11 可用于不同行业的各种应用。例如,它非常适合城市规划、能源和航运等行业,在这些行业中,精度对于太阳能电池板检测或车队监控等任务至关重要。凭借更快的性能和更高的精度,YOLO11 可以帮助人工智能开发人员解决现实世界中的难题。
随着人工智能越来越广泛地被采用并融入我们的日常生活,像 YOLO11 这样的模型将塑造人工智能解决方案的未来。
要了解 Vision AI 的潜力,请加入我们不断壮大的社区,并浏览我们的GitHub 存储库。我们通过重塑医疗保健和自动驾驶汽车等行业来推动创新。