柒柒AI导航 柒柒AI导航 柒柒AI导航 柒柒AI导航
  • AI写作工具
    • AI文案写作
    • AI论文专区
    • AI小说创作
    • AI绘本创作
    • AI摘要工具
    • AI改写工具
    • AI内容检测
  • AI图像工具
    • AI图像生成
    • AI图片处理
    • AI调色工具
    • AI换脸工具
    • AI头像工具
  • AI视频工具
    • AI视频工具
    • AI视频生成
    • AI视频编辑
  • AI音频工具
    • AI语音生成
    • AI音乐创作
    • AI音频编辑
    • AI语音转文本
  • AI对话工具
    • AI智能问答
    • AI虚拟角色
  • AI提示指令
  • AI设计工具
    • AI设计工具
    • AI Logo设计
    • AI产品设计
    • AI服装设计
    • AI建筑设计
    • AI网站/APP设计
    • AI 3D设计
  • AI办公工具
    • AI制作PPT
    • AI数据表格
    • AI思维导图
    • AI文档工具
    • AI简历工具
    • AI会议工具
    • AI效率提升
    • AI翻译工具
  • AI编程工具
  • AI搜索引擎
  • AI商业工具
    • AI电商工具
    • AI营销工具
    • AI金融工具
    • AI法律工具
    • AI医疗工具
    • AI企业工具
  • AI生活工具
    • AI时尚助手
    • AI旅行助手
    • AI健身助手
    • AI心理健康
    • AI厨艺助手
    • AI游戏助手
    • AI趣味工具
  • AI副业平台
    • 自由职业平台
    • 联盟营销平台
    • 跨境电商平台
    • 自媒体平台
  • AI教育工具
  • AI开发训练
    • AI训练模型
    • AI模型评测
    • AI学习平台
    • AI开发框架
    • AI开放平台
  • 文章投稿
  • 工具收录
柒柒AI导航 柒柒AI导航
  • AI前沿信息源
  • AI研究报告
  • AI融资快报
  • AI项目库
  • AI新发布/功能更新
  • AI手机APP
    • AI手机APP
    • AI浏览器插件
  • AI工具排行榜
  • AI每日快讯
  • AI在线教程
  • AI副业指南

    AI模型评测

    H2O LLM Eval
    H2O LLM Eval

    用于评估和比较LLM大模型的开放工具

    LLMEval3
    LLMEval3

    复旦大学NLP实验室推出的大模型评测基准

    Chatbot Arena
    Chatbot Arena

    Chatbot Arena是一个大型语言...

    HELM
    HELM

    一个综合评估语言模型的平台

    MMBench
    MMBench

    一个多模态模型评估平台

    CMMLU
    CMMLU

    一个用于评估中文语言模型的综合性基准

    OpenCompass
    OpenCompass

    上海AI实验室推出的大模型开放评测体系

    SuperCLUE
    SuperCLUE

    一个中文通用大模型综合性测评基准

    FlagEval
    FlagEval

    智源研究院推出的大模型测评平台

    C-Eval
    C-Eval

    一个适用于大语言模型的多层次多学科中文评估套件

    Open LLM Leaderboard
    Open LLM Leaderboard

    Hugging Face推出的开源大模型排行榜

    MMLU
    MMLU

    个用于评估多任务语言理解模型性能的基准测试

    柒柒AI导航 柒柒AI导航
    一站式AI信息服务平台:AI工具大全、AI每日快讯、AI项目库、AI融资快报、AI研究报告、AI教程、AI副业、AI考证等。助您全面系统了解AI、使用AI

    关于我们 广告合作 免责声明 柒柒快讯

    扫码加微信柒柒AI导航

    扫码加微信

    关注公众号柒柒AI导航

    关注公众号
    Copyright © 2025 柒柒AI导航 粤ICP备2023146609号-1  粤公网安备44011102483711号