Глоссарий

Вес модели

Узнайте о важности весов моделей в машинном обучении, их роли в прогнозировании и о том, как Ultralytics YOLO упрощает их использование для задач ИИ.

Веса модели - это основные параметры, которые модель машинного обучения (ML) получает в процессе обучения. Эти числовые значения представляют собой знания, полученные из обучающих данных, и являются основополагающими для того, как модель делает прогнозы или принимает решения на основе новых, невидимых данных. По сути, веса определяют силу и важность связей внутри модели, например, между нейронами в нейронной сети (NN). Они являются регулируемыми "ручками", которые отражают шаблоны, изучаемые моделью.

Понимание весов моделей

Представьте себе сложную машину с множеством регулируемых ручек; веса модели действуют подобно этим ручкам. В процессе обучения модели ей показывают примеры из набора данных, и она делает первоначальные предсказания. Разница между этими предсказаниями и реальными правильными ответами (истиной) измеряется функцией потерь. Затем алгоритм оптимизации, такой как стохастический градиентный спуск (SGD) или Adam, систематически корректирует эти веса с помощью таких методов, как обратное распространение, чтобы минимизировать эти потери. Этот процесс повторяется в течение многих итераций, или эпох, постепенно уточняя веса.

Изначально веса часто устанавливаются на небольшие случайные значения, но в процессе обучения они сходятся к значениям, которые отражают основные закономерности в данных. Очень важно отличать веса от гиперпараметров, таких как скорость обучения или размер партии. Гиперпараметры - это параметры конфигурации, заданные до начала обучения и определяющие сам процесс обучения, в то время как веса - это параметры, изучаемые в процессе обучения. Смещение - еще один тип обучаемого параметра, часто встречающийся наряду с весами в NN, - представляет собой базовый уровень активации нейрона, не зависящий от его входов. В то время как веса изменяют влияние входов, смещения изменяют выход функции активации.

Значимость весовых коэффициентов моделей

Веса модели очень важны, поскольку они напрямую кодируют изученные закономерности и взаимосвязи из обучающих данных. Хорошо подобранные веса позволяют модели достичь хорошего обобщения, делая точные предсказания на данных, с которыми она раньше не сталкивалась. Качество весов напрямую влияет на такие показатели эффективности модели, как точность, прецизионность, отзыв и надежность, которые часто обобщаются в таких метриках, как mAP. Плохо обученные веса, часто возникающие из-за недостатка данных, недостаточного времени обучения или чрезмерной подгонки (когда модель слишком хорошо изучает обучающие данные, включая шум), приводят к ненадежным предсказаниям на новых данных.

Во многих современных приложениях ИИ, особенно в области компьютерного зрения (КВ), модели часто предварительно обучаются на больших общих наборах данных, таких как ImageNet или COCO. Полученные веса отражают широкие визуальные характеристики, применимые для многих задач. Эти предварительно обученные веса, такие как те, что доступны для моделей Ultralytics YOLO, могут затем использоваться непосредственно для выводов или в качестве отправной точки для тонкой настройки на конкретной задаче или пользовательском наборе данных. Эта техника, известная как трансферное обучение, значительно ускоряет обучение и часто приводит к улучшению производительности, особенно при ограниченности пользовательских данных. Платформы, подобные Ultralytics HUB, позволяют пользователям управлять наборами данных, обучать модели и эффективно обрабатывать полученные веса моделей.

Применение в реальном мире

Весовые коэффициенты моделей являются движущей силой бесчисленных приложений искусственного интеллекта:

Управление и отслеживание веса

По мере усложнения моделей управление их весами и экспериментами, в результате которых они получаются, приобретает решающее значение для воспроизводимости и сотрудничества. Такие инструменты, как Weights & Biases (W&B), предоставляют платформу специально для MLOps, позволяя командам отслеживать гиперпараметры, метрики, версии кода и результирующие веса моделей для каждого эксперимента. Важно отметить, что платформа "Weights & Biases" отличается от понятий "веса" и "смещения" как параметров нейронной сети; платформа помогает управлять процессом поиска оптимальных весов и смещений. Подробнее об интеграции Ultralytics с W&B вы можете узнать из документации. Эффективное управление является ключевым для решения самых разных задач - от настройки гиперпараметров до развертывания моделей с помощью таких фреймворков, как PyTorch или TensorFlow.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему искусственного интеллекта. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединяйтесь сейчас
Ссылка копируется в буфер обмена