SFT CoT DeepSeek蒸馏 GRPO 详解强化学习 DPO RLHF 正版大模型算法：强化学习微调与对齐效果优化及其实践书籍

SFT CoT DeepSeek蒸馏 GRPO 详解强化学习 DPO RLHF 正版大模型算法：强化学习微调与对齐效果优化及其实践书籍

￥57.55~~￥57.55~~

正版微调与对齐 DPO GRPO RLHF SFT CoT DeepSeek蒸馏

查看商品详情 点击展开

相关推荐

朱军著社清华大学出版正版概率机器学习计算机控制仿真与人工智能专业科技书籍

￥54.5 折扣价已售:8

从图灵机到人工智能疆界网络计算机正版智慧计算机控制仿真与人工智能书籍

￥44.5 折扣价已售:2

朱军著社清华大学出版正版概率机器学习计算机控制仿真与人工智能专业科技书籍

￥51 折扣价已售:23

周洋 GNN原理解析计算机网络刘忠雨李彦霖社正版深入浅出图神经网络机械工业出版计算机控制仿真与人工智能书籍

￥64 折扣价已售:1

第二版图像编辑英文版官方旗舰店计算机视觉：一种现代方法对象识别机器学习计算机网络计算机控制仿真与人工智能

￥102.4 折扣价已售:4

著等类脑智能机器人乔红计算机控制仿真与人工智能

￥118.8 折扣价

复制分享文案

分享给好友

点击一键复制

复制口令购买

↓↓复制下方口令，打开手机淘宝，即可购买↓↓

点击复制