模型排行榜提供商

模型排行榜可以用来提供模型能力评估，便于根据场景选择合适的模型。

1. 全球最权威的盲测榜单：LMSYS Chatbot Arena

这是目前业内认可度最高的榜单，由加州大学伯克利分校等机构组成的 LMYSY Org 运营。

查看具体榜单会跳转到 https://arena.ai/,目前在国内无法访问。

2. 开源大模型风向标：Hugging Face Open LLM Leaderboard

由全球最大的 AI 社区 Hugging Face 推出，专门针对开源模型的性能评估。

Hugging Face 目前在国内无法直接访问。

3. 中文能力最强基准：SuperCLUE 与 OpenCompass

针对中文语境，国内有两个极具代表性的权威评测平台：

SuperCLUE（中文通用大模型综合性评测基准）：由 CLUE 团队推出，涵盖十大能力维度，特别关注中文语境下的理解、逻辑和幻觉控制。它通过构建多维度的评测体系，来衡量模型在不同任务上的效果、与国际模型的差距以及与人类水平的对比。

OpenCompass（司南）：由上海人工智能实验室推出的权威评测平台，涵盖语言、推理、知识、代码、数学等七大核心领域，评测维度非常全面。