Open LLM Leaderboard

Open LLM Leaderboard

Hugging Face推出的开源大模型排行榜

标签：AI模型评测

链接直达手机查看

Open LLM Leaderboard 是最大的大模型和数据集社区 HuggingFace推出的开源大模型排行榜单，基于Eleuther AI Language Model Evaluation Harness （Eleuther AI语言模型评估框架）封装。由于社区在发布了大量的大型语言模型（LLM）和聊天机器人之后，往往伴随着对其性能的夸大宣传，很难过滤出开源社区取得的真正进展以及目前的最先进模型。因此，Hugging Face 使用Eleuther Al语言模型评估框架对模型进行四个关键基准测试评估。这是一个统一的框架，用于在大量不同的评估任务上测试生成式语言模型。

Open LLM Leaderboard

相关导航

MMBench

一个多模态模型评估平台

C-Eval

一个适用于大语言模型的多层次多学科中文评估套件

H2O LLM Eval

H2O LLM Eval

用于评估和比较LLM大模型的开放工具

Chatbot Arena

Chatbot Arena

Chatbot Arena是一个大型语言...

LLMEval3

复旦大学NLP实验室推出的大模型评测基准

FlagEval

智源研究院推出的大模型测评平台

暂无评论

暂无评论...

一站式AI信息服务平台：AI工具大全、AI每日快讯、AI项目库、AI融资快报、AI研究报告、AI教程、AI副业、AI考证等。助您全面系统了解AI、使用AI

关于我们广告合作免责声明柒柒快讯

Copyright © 2025 柒柒AI导航粤ICP备2023146609号-1

粤公网安备44011102483711号