THUDM/LongReward-llama3.1-8b-DPO

文本生成 Transformers Safetensors Chinese English AutoTrain Compatible text-generation-inference custom_code

模型介绍模型文件 Issues

LongReward-llama3.1-8b-DPO/modeling_llama.py

3 位贡献者

modeling_llama.py58.67 kB

一键复制

关于我们
意见反馈
文档
服务条款
隐私政策
合作伙伴

违法和不良信息举报中心

粤ICP备12009483号