Help us learn about your current experience with the documentation. Take the survey.
机器学习模型实验
- Tier: 免费版、高级版、旗舰版 (Free, Premium, Ultimate)
- Offering: GitLab.com、GitLab 自托管、GitLab 专用版 (GitLab.com, GitLab Self-Managed, GitLab Dedicated)
在创建机器学习模型时,您可能会尝试不同的参数、配置和特征工程来提升模型性能。为了日后能够复现这些实验,您需要有效地跟踪元数据和产物。使用 GitLab 模型实验来直接将参数、指标和产物记录到 GitLab 中。
什么是实验?
在项目中,实验是一组可比较的模型运行的集合。实验可以是长期的(例如,当它们代表一个用例时),也可以是短期的(由合并请求触发的超参数调优结果),但通常包含具有相似参数集的模型运行,这些参数通过相同的指标进行测量。
模型运行
模型运行是机器学习模型训练的一种变体,最终可以提升为模型的版本。
数据科学家的目标是找到参数值能带来最佳模型性能的模型运行,这由给定的指标来体现。
一些示例参数:
- 算法(如线性回归或决策树)。
- 算法的超参数(学习率、树深度、周期数)。
- 包含的特征。
跟踪新实验和运行
实验和试验只能通过 MLflow 客户端兼容性来跟踪。有关如何使用 GitLab 作为 MLflow 客户端后端的更多信息,请参阅 MLflow 客户端兼容性。
探索模型运行
要列出当前活动的实验,请访问 https/-/ml/experiments 或:
- 在左侧边栏,选择 搜索或转到 并找到您的项目。
- 选择 分析 > 模型实验。
- 要显示所有已记录的运行及其指标、参数和元数据,请选择一个实验。
- 要显示运行的详细信息,请选择 详情。
查看日志产物
试验产物被保存为包。在为运行记录产物后,所有为该运行记录的产物都会列在包注册表中。运行的包名称为 ml_experiment_<experiment_id>,其中版本是运行 IID。产物的链接也可以从 实验运行 列表或 运行详情 中访问。
查看 CI 信息
您可以将运行与创建它们的 CI 作业关联,从而可以快速访问触发该管道的合并请求、管道和用户:
查看已记录的指标
当您运行实验时,GitLab 会记录某些相关数据,包括其指标、参数和元数据。您可以在图表中查看这些指标进行分析。
要查看已记录的指标:
- 在左侧边栏,选择 搜索或转到 并找到您的项目。
- 选择 分析 > 模型实验。
- 选择您要查看的实验。
- 选择 性能 选项卡。