API
HOT
模型
应用
解决方案
专区
文档
登录
THUDM
/
LongReward-llama3.1-8b-DPO
like
0
文本生成
Transformers
Safetensors
Chinese
English
AutoTrain Compatible
text-generation-inference
custom_code
模型介绍
模型文件
Issues
部署
LongReward-llama3.1-8b-DPO
/
model.safetensors.index.json
3 位贡献者
提交历史
model.safetensors.index.json
23.39 kB
一键复制