ML实验记录全靠手动？Weights & Biases自动追踪训练过程，模型调参效率直接翻倍🚀-Skill优仓

这个Skill在解决什么问题

跑了几十个实验，结果发现根本不记得哪个参数组合效果最好——这是每个ML工程师都经历过的噩梦。Weights & Biases（W&B）这个Skill就是专门来解决这个问题的：自动记录每次训练的超参数、指标、模型权重，实时可视化训练曲线，还能用贝叶斯优化自动搜索最优超参数组合。

核心功能

W&B的能力可以分成四个层次。第一层是实验追踪，只需在训练脚本里加几行代码，loss、accuracy、learning rate等所有指标就会自动上传到云端仪表盘，支持多个run的横向对比。第二层是超参数Sweep，支持Grid Search、Random Search和贝叶斯优化三种策略，可以并行跑几十个trial，自动找到最优配置。第三层是Artifact管理，数据集、模型checkpoint、预测结果都可以作为Artifact存储，带完整的版本和血缘追踪。第四层是Model Registry，把训练好的模型注册到中央仓库，打上production、best等别名，方便团队协作和模型部署。

适用平台

这个Skill完美适配主流AI编程助手，包括Cursor、GitHub Copilot、Claude Code、OpenAI Codex、Gemini Code Assist、文心快码、腾讯云CodeBuddy、华为云CodeArts等。把W&B Skill加载进这些IDE之后，AI助手能直接理解wandb.init、wandb.log、wandb.Artifact等API的用法和最佳实践，生成的训练代码质量会明显提升，不再需要反复查文档。

实操代码示例

最基础的用法，三步搞定实验追踪：

import wandb

run = wandb.init(
    project='image-classification',
    config={'lr': 0.001, 'epochs': 50, 'batch_size': 32}
)

for epoch in range(run.config.epochs):
    train_loss = train_epoch()
    val_acc = validate()
    wandb.log({'train/loss': train_loss, 'val/accuracy': val_acc})

wandb.finish()

如果要跑超参数Sweep，用贝叶斯优化自动搜索：

sweep_config = {
    'method': 'bayes',
    'metric': {'name': 'val/accuracy', 'goal': 'maximize'},
    'parameters': {
        'learning_rate': {'distribution': 'log_uniform', 'min': 1e-5, 'max': 1e-1},
        'batch_size': {'values': [16, 32, 64, 128]}
    }
}

sweep_id = wandb.sweep(sweep_config, project='my-project')
wandb.agent(sweep_id, function=train, count=50)

HuggingFace用户更简单，TrainingArguments里加一行report_to='wandb'，Trainer会自动把所有训练指标同步过去，零额外代码。

优势分析

跟TensorBoard比，W&B最大的差异是云端协作和跨机器同步。TensorBoard的日志文件只在本地，换台机器就没了；W&B的数据在云端，团队成员可以直接访问同一个项目的所有run，不需要传文件。跟MLflow比，W&B的UI体验和可视化能力更强，Sweep功能也更成熟，贝叶斯优化的收敛速度比纯随机搜索快很多。另外W&B对PyTorch、TensorFlow、HuggingFace、PyTorch Lightning的集成都非常原生，基本上不需要写适配代码。