Глоссарий

Операции машинного обучения (MLOps)

Откройте для себя возможности MLOps: оптимизируйте развертывание ML-моделей, автоматизируйте рабочие процессы, обеспечьте надежность и эффективно масштабируйте успех ИИ.

Machine Learning Operations (MLOps) - это набор практик, направленных на надежное и эффективное развертывание и поддержку моделей Machine Learning (ML) в производстве. Черпая вдохновение в принципах DevOps, MLOps преодолевает разрыв между разработкой моделей (Data Scientists, ML Engineers) и ИТ-операциями (Ops Engineers), оптимизируя весь жизненный цикл ML от сбора данных до развертывания и мониторинга моделей. Цель - автоматизация и стандартизация процессов, позволяющих ускорить эксперименты, повысить надежность развертывания и постоянно совершенствовать системы ML в производственных средах.

Основные принципы MLOps

MLOps построен на нескольких ключевых принципах, предназначенных для управления уникальными сложностями систем ML:

  • Автоматизация: Автоматизация повторяющихся задач, таких как подготовка данных, обучение моделей, проверка и развертывание, с помощью конвейеров непрерывной интеграции/непрерывного развертывания (CI/CD), адаптированных для ML.
  • Сотрудничество: Содействие общению и сотрудничеству между командами, занимающимися наукой о данных, разработкой программного обеспечения и операционной деятельностью, на протяжении всего жизненного цикла ОД.
  • Версионирование: Реализация контроля версий для данных, кода и моделей для обеспечения воспроизводимости и прослеживаемости. Такие инструменты, как DVC, часто используются наряду с Git.
  • Мониторинг моделей: Постоянное отслеживание производительности модели, качества данных и работоспособности в процессе производства для выявления таких проблем, как дрейф данных или снижение производительности.
  • Управление и соответствие нормативным требованиям: Обеспечение соответствия моделей нормативным требованиям, этическим нормам(AI Ethics) и политике организации в отношении конфиденциальности и безопасности данных.

Жизненный цикл MLOps

Жизненный цикл MLOps охватывает весь путь ML-модели:

  1. Управление данными: Ввод, проверка, очистка(Data Cleaning) и версионирование наборов данных( руководства помаркировке и подготовкеданных можно найти в документах Ultralytics Docs).
  2. Разработка моделей: Экспериментирование с различными алгоритмами, построением функций и архитектурой, часто с использованием таких фреймворков, как PyTorch или TensorFlow.
  3. Обучение моделей: Обучение моделей в масштабе, возможно, с использованием распределенного обучения и управления экспериментами с помощью таких инструментов, как Weights & Biases или MLflow. Настройка гиперпараметров часто автоматизирована.
  4. Валидация модели: Оценка эффективности модели с помощью таких показателей, как точность или mAP, на данных проверки.
  5. Развертывание моделей: Упаковка(контейнеризация с помощью Docker) и развертывание моделей в производственных средах, возможно, с использованием платформ оркестровки, таких как Kubernetes.
  6. Мониторинг и переобучение моделей: Отслеживание производительности в реальном времени, обнаружение дрейфа или распада и запуск конвейеров переобучения при необходимости. Наблюдаемость играет здесь ключевую роль.

MLOps в сравнении со смежными понятиями

  • MLOps и AutoML: Если MLOps охватывает весь жизненный цикл, то Automated Machine Learning (AutoML) фокусируется на автоматизации этапов построения модели (подготовка данных, разработка функций, выбор модели, настройка гиперпараметров). Инструменты AutoML могут быть компонентом рабочего процесса MLOps.
  • MLOps против наблюдаемости: Наблюдаемость - это критически важная возможность в рамках стратегии MLOps. Она обеспечивает инструменты и методы (протоколирование, метрики, трассировка), необходимые для понимания внутреннего состояния и поведения развернутых систем ML, что позволяет эффективно осуществлять мониторинг и устранять неполадки.

Применение в реальном мире

Практика MLOps необходима для управления сложными системами ML в производстве:

  1. Рекомендательные системы: Такие компании, как Netflix или Spotify, используют MLOps для постоянного переобучения моделей рекомендаций на основе новых данных о взаимодействии с пользователями, A/B-тестирования различных версий моделей, мониторинга показателей вовлеченности и быстрого отката неэффективных моделей. Благодаря этому рекомендации остаются актуальными и персонализированными.
  2. Обнаружение мошенничества: Финансовые учреждения развертывают конвейеры MLOps для управления моделями обнаружения мошенничества. Это включает в себя мониторинг транзакционных данных на предмет дрейфа, автоматическое переобучение моделей с учетом новых моделей мошенничества, обеспечение низкой задержки вывода для обнаружения в режиме реального времени и ведение аудиторских записей для соблюдения нормативных требований. Модели Ultralytics YOLO, используемые в системах визуального контроля, которые могут использоваться для обнаружения мошенничества, также выигрывают от применения MLOps для развертывания и мониторинга.

Инструменты и платформы

Различные инструменты поддерживают разные этапы жизненного цикла MLOps:

Внедрение принципов MLOps помогает организациям более эффективно создавать, внедрять и управлять системами искусственного интеллекта, преодолевая разрыв между экспериментальными исследованиями и надежными производственными приложениями.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему искусственного интеллекта. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединяйтесь сейчас
Ссылка копируется в буфер обмена