Notice: failed to open file: /www/wwwroot/hao.aiznk.com/dayrui/App/Webnav/Config/Events.php AI模型评测_AI智能库 - aiznk.com

AI智能库 - aiznk.com

AI智能库 - aiznk.com AI智能库 - aiznk.com AI智能库 - aiznk.com AI智能库 - aiznk.com
  • 站点推荐
  • AI写作工具
  • AI图像工具
    • 常用AI图像工具
    • AI图片插画生成
    • AI图片背景移除
    • AI图片无损放大
    • AI图片优化修复
    • AI图片物体抹除
  • AI视频工具
  • AI办公工具
    • AI幻灯片和演示
    • AI表格数据处理
    • AI文档工具
    • AI思维导图
    • AI会议工具
    • AI效率提升
  • AI对话聊天
  • AI音频工具
  • AI编程工具
  • AI设计工具
  • AI内容检测
  • AI学习网站
  • AI开发框架
  • AI提示指令
  • AI训练模型
  • AI模型评测
AI智能库 - aiznk.com AI智能库 - aiznk.com
  • AI智能库 - aiznk.com
    • AI写作工具
    • AI图像工具
    • AI视频工具
    • AI办公工具
    • AI对话聊天
    • AI音频工具
    • AI编程工具
    • AI设计工具
    • AI内容检测
    • AI学习网站
    • AI开发框架
    • AI提示指令
    • AI训练模型
    • AI模型评测
AI智能库 - aiznk.com AI智能库 - aiznk.com

    AI模型评测

    Open LLM Leaderboard
    Open LLM Leaderboard

    Hugging Face推出的开源大模型排行榜单

    MMLU
    MMLU

    大规模多任务语言理解基准

    SuperCLUE
    SuperCLUE

    中文通用大模型综合性测评基准

    H2O EvalGPT
    H2O EvalGPT

    H2O.ai推出的基于Elo评级方法的大模型评估系统

    PubMedQA
    PubMedQA

    生物医学研究问答数据集和模型得分排行榜

    FlagEval
    FlagEval

    智源研究院推出的FlagEval(天秤)大模型评测平台

    LLMEval3
    LLMEval3

    由复旦大学NLP实验室推出的大模型评测基准

    C-Eval
    C-Eval

    一个全面的中文基础模型评估套件

    CMMLU
    CMMLU

    一个综合性的大模型中文评估基准

    OpenCompass
    OpenCompass

    上海人工智能实验室推出的大模型开放评测体系

    HELM
    HELM

    斯坦福大学推出的大模型评测体系

    MMBench
    MMBench

    全方位的多模态大模型能力评测体系

    Chatbot Arena
    Chatbot Arena

    以众包方式进行匿名随机对战的LLM基准平台

    AI智能库 - aiznk.com AI智能库 - aiznk.com
    aiznk.com您身边的AI导航专家

    AI智能库 - aiznk.com 关于我们 免责声明

    Copyright © AI智能库 - aiznk.com