LLMEval3

LLMEval3

复旦大学NLP实验室推出的大模型评测基准

标签：AI模型评测

链接直达手机查看

LLMEval-3聚焦于专业知识能力评测，涵盖哲学、经济学、法学、教育学、文学、历史学、理学、工学、农学、医学、军事学、管理学、艺术学等教育部划定的13个学科门类、50余个二级学科，共计约20W道标准生成式问答题目（后续将继续收集题目将总题库扩充至100W）。

LLMEval3

相关导航

Open LLM Leaderboard

Open LLM Leaderboard

Hugging Face推出的开源大模型排行榜

MMLU

个用于评估多任务语言理解模型性能的基准测试

Chatbot Arena

Chatbot Arena

Chatbot Arena是一个大型语言...

H2O LLM Eval

H2O LLM Eval

用于评估和比较LLM大模型的开放工具

C-Eval

一个适用于大语言模型的多层次多学科中文评估套件

HELM

一个综合评估语言模型的平台

暂无评论

暂无评论...

一站式AI信息服务平台：AI工具大全、AI每日快讯、AI项目库、AI融资快报、AI研究报告、AI教程、AI副业、AI考证等。助您全面系统了解AI、使用AI

关于我们广告合作免责声明柒柒快讯

Copyright © 2025 柒柒AI导航粤ICP备2023146609号-1

粤公网安备44011102483711号