SFT CoT DeepSeek蒸馏 GRPO 详解强化学习 DPO RLHF 正版 大模型算法:强化学习 微调与对齐 效果优化及其实践书籍
SFT CoT DeepSeek蒸馏 GRPO 详解强化学习 DPO RLHF 正版 大模型算法:强化学习 微调与对齐 效果优化及其实践书籍
59¥59
正版 微调与对齐 DPO GRPO RLHF SFT CoT DeepSeek蒸馏
畅想之星图书专营店
已有 4 人购买
查看商品详情 点击展开
  • 相关推荐

    复制分享文案

    分享给好友

    点击一键复制

    复制口令购买
    ↓↓复制下方口令,打开手机淘宝,即可购买↓↓

    点击复制