API
HOT
模型
应用
解决方案
专区
文档
登录
THUDM
/
LongReward-llama3.1-8b-DPO
like
0
文本生成
Transformers
Safetensors
Chinese
English
AutoTrain Compatible
text-generation-inference
custom_code
模型介绍
模型文件
Issues
部署
LongReward-llama3.1-8b-DPO
/
modeling_llama.py
3 位贡献者
提交历史
modeling_llama.py
58.67 kB
一键复制