Глоссарий

Сегментация изображений

Откройте для себя возможности сегментации изображений с помощью Ultralytics YOLO. Изучите точность на уровне пикселей, типы, области применения и реальные примеры использования ИИ.

Сегментация изображений - это фундаментальная техника компьютерного зрения (КВ), которая заключается в разделении цифрового изображения на несколько отдельных областей или сегментов. Основная цель - присвоить каждому пикселю изображения метку класса, по сути, упростив представление изображения до чего-то более осмысленного и удобного для анализа машинами. В отличие от обнаружения объектов, которые идентифицируются с помощью прямоугольных ограничительных рамок, сегментация изображений обеспечивает гораздо более детальное понимание содержимого изображения на уровне пикселей, определяя точную форму объектов. Такая точность крайне важна для задач, требующих детального пространственного восприятия.

Как работает сегментация изображений

Алгоритмы сегментации изображений работают путем изучения изображения пиксель за пикселем и группирования пикселей, обладающих определенными характеристиками - например, цветом, интенсивностью, текстурой или пространственным расположением, - в сегменты. Ранние методы опирались на такие техники, как пороговое выделение, выращивание областей и кластеризация(K-Means, DBSCAN). Однако современные подходы в значительной степени используют глубокое обучение (ГОО), в частности конволюционные нейронные сети (КНС). Эти нейронные сети изучают сложные иерархические характеристики непосредственно из обучающих данных, чтобы выполнить классификацию по пикселям. Типичным результатом является маска сегментации - изображение, в котором значение каждого пикселя соответствует метке класса, к которому он принадлежит, визуально выделяя точные границы объектов или регионов. Для построения и обучения таких моделей обычно используются такие фреймворки, как PyTorch и TensorFlow.

Типы сегментации изображений

Задачи сегментации изображений могут различаться в зависимости от того, как обрабатываются объекты и классы:

  • Семантическая сегментация: Присваивает каждому пикселю заранее определенную категорию (например, "автомобиль", "дорога", "небо"). Она не делает различий между разными экземплярами одного и того же класса объектов. Например, все автомобили будут иметь одну и ту же метку.
  • Сегментация экземпляра: Идет на шаг дальше семантической сегментации, определяя и очерчивая каждый отдельный экземпляр объекта на изображении. Каждый отдельный автомобиль получает уникальный идентификатор или маску, даже если они принадлежат к одному классу. Это особенно полезно при необходимости подсчета или отслеживания отдельных объектов.
  • Паноптическое сегментирование: Сочетает в себе семантическую сегментацию и сегментацию по экземплярам. Она присваивает метку класса каждому пикселю (как семантическая сегментация) и однозначно идентифицирует каждый объект (как сегментация экземпляров). Это обеспечивает комплексное, единое понимание сцены.

Различение сегментации изображений и смежных терминов

  • Сегментация изображений по сравнению с обнаружением объектов: При обнаружении объектов вокруг них рисуются ограничительные рамки, указывающие их местоположение и класс. Сегментация изображения представляет собой маску на уровне пикселей, точно определяющую форму каждого объекта или области, что позволяет получить более подробную информацию, чем простая рамка.
  • Сегментация изображений по сравнению с классификацией изображений: Классификация изображений присваивает единую метку всему изображению (например, "содержит кошку"). Сегментация изображений присваивает метку каждому пикселю изображения, идентифицируя несколько объектов или областей и их формы.
  • Сегментация изображений и распознавание изображений: Распознавание изображений - это более широкий термин для задач, в которых искусственный интеллект идентифицирует объекты, людей, места и т. д. на изображениях. Сегментация изображений - это особый тип распознавания изображений, ориентированный на разделение на уровне пикселей.

Применение в реальном мире

Детальный анализ, обеспечиваемый сегментацией изображений, позволяет использовать их в различных областях:

Сегментация изображений и ультралитература YOLO

Модели Ultralytics YOLO, такие как YOLOv8 и YOLO11, обеспечивают современную производительность для задач сегментации экземпляров, балансируя между скоростью и точностью для выводов в режиме реального времени. Фреймворк Ultralytics упрощает процесс обучения пользовательских моделей сегментации на таких наборах данных, как COCO, или специализированных наборах данных, таких как сегментация деталей автомобиля или трещин. Такие инструменты, как Ultralytics HUB, предлагают оптимизированную платформу для управления наборами данных, обучения моделей(доступно облачное обучение) и их развертывания. Вы можете изучить документацию по задаче сегментации для получения подробной информации о ее выполнении или воспользоваться руководствами по сегментации с помощью предварительно обученных моделей YOLOv8 или сегментации изображений с помощью YOLO11 в Google Colab.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему искусственного интеллекта. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединяйтесь сейчас
Ссылка копируется в буфер обмена