Constitutional AI共1篇
AI安全训练不用人工打标签?Constitutional AI自我批判+RLAIF两阶段训练真的绝了🔥-Skill优仓

AI安全训练不用人工打标签?Constitutional AI自我批判+RLAIF两阶段训练真的绝了🔥

Constitutional AI是Anthropic训练Claude所用的核心安全技术,通过「宪法原则」让模型自我批判和修正回答,无需人工标注有害内容。这个Skill完整实现了两阶段训练流程:SL阶段的自我批判+修正,...
Skill优仓的头像-Skill优仓Skill优仓6天前
05111