CMMLU

CMMLU

一个用于评估中文语言模型的综合性基准

标签：AI模型评测

链接直达手机查看

CMMLU是一个综合性的中文评估基准，专门用于评估语言模型在中文语境下的知识和推理能力。CMMLU涵盖了从基础学科到高级专业水平的67个主题。它包括：需要计算和推理的自然科学，需要知识的人文科学和社会科学,以及需要生活常识的中国驾驶规则等。此外，CMMLU中的许多任务具有中国特定的答案，可能在其他地区或语言中并不普遍适用。因此是一个完全中国化的中文测试基准。

CMMLU

相关导航

HELM

一个综合评估语言模型的平台

MMBench

一个多模态模型评估平台

LLMEval3

复旦大学NLP实验室推出的大模型评测基准

SuperCLUE

一个中文通用大模型综合性测评基准

C-Eval

一个适用于大语言模型的多层次多学科中文评估套件

OpenCompass

OpenCompass

上海AI实验室推出的大模型开放评测体系

暂无评论

暂无评论...

一站式AI信息服务平台：AI工具大全、AI每日快讯、AI项目库、AI融资快报、AI研究报告、AI教程、AI副业、AI考证等。助您全面系统了解AI、使用AI

关于我们广告合作免责声明柒柒快讯

Copyright © 2025 柒柒AI导航粤ICP备2023146609号-1

粤公网安备44011102483711号