APIHOT 模型应用

THUDM/LongReward-llama3.1-8b-DPO

文本生成 Transformers Safetensors Chinese English AutoTrain Compatible text-generation-inference custom_code

模型介绍模型文件 Issues

LongReward-llama3.1-8b-DPO/model-00000-of-00005.safetensors

3 位贡献者

model-00000-of-00005.safetensors135 Bytes

一键复制

该文件使用 Git LFS 存储。文件过大无法显示，但您仍然可以下载。

Git LFS 详情

SHA256: 997773a4fa5c8605116909f7d5d20026cef13e47
Pointer size: 135 Bytes
Size of remote file: 4.06 GB