API
HOT
模型
应用
解决方案
专区
文档
登录
THUDM
/
LongReward-llama3.1-8b-DPO
like
0
文本生成
Transformers
Safetensors
Chinese
English
AutoTrain Compatible
text-generation-inference
custom_code
模型介绍
模型文件
Issues
部署
LongReward-llama3.1-8b-DPO
/
configuration.json
3 位贡献者
提交历史
configuration.json
48 Bytes
一键复制