<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>模型 on openclaw</title>
    <link>https://cncfstack.com/p/openclaw/docs/0300.model/</link>
    <description>Recent content in 模型 on openclaw</description>
    <generator>Hugo</generator>
    <language>en</language>
    <atom:link href="https://cncfstack.com/p/openclaw/docs/0300.model/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>模型排行榜提供商</title>
      <link>https://cncfstack.com/p/openclaw/docs/0300.model/model-select/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>https://cncfstack.com/p/openclaw/docs/0300.model/model-select/</guid>
      <description>&lt;p&gt;模型排行榜可以用来提供模型能力评估，便于根据场景选择合适的模型。&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;想看全球综合实力：首选 LMSYS Arena。&lt;/li&gt;&#xA;&lt;li&gt;想挑开源模型进行开发：首选 Hugging Face。&lt;/li&gt;&#xA;&lt;li&gt;关注中文落地应用表现：首选 SuperCLUE 或 OpenCompass。&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;&lt;strong&gt;1. 全球最权威的盲测榜单：LMSYS Chatbot Arena&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;p&gt;这是目前业内认可度最高的榜单，由加州大学伯克利分校等机构组成的 LMYSY Org 运营。&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;评测机制：采用“竞技场”盲测机制，用户同时与两个匿名大模型对话，根据回答质量投票。这种方式有效防止了模型针对测试集进行“刷题”作弊。&lt;/li&gt;&#xA;&lt;li&gt;核心指标：采用游戏竞技中的 Elo 等级分系统，能够真实反映模型在人类主观感知下的性能表现。&lt;/li&gt;&#xA;&lt;li&gt;访问地址：&lt;a href=&#34;https://lmsys.org/&#34;&gt;https://lmsys.org/&lt;/a&gt;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;查看具体榜单会跳转到 &lt;a href=&#34;https://arena.ai/&#34;&gt;https://arena.ai/&lt;/a&gt;,目前在国内无法访问。&lt;/p&gt;&#xA;&lt;p&gt;&lt;strong&gt;2. 开源大模型风向标：Hugging Face Open LLM Leaderboard&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;p&gt;由全球最大的 AI 社区 Hugging Face 推出，专门针对开源模型的性能评估。&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;评测机制：通过统一的自动化基准测试（如 ARC、HellaSwag、MMLU 等）对模型进行多维度跑分。&lt;/li&gt;&#xA;&lt;li&gt;特点：透明度高，是开发者选择基础模型、微调模型的重要参考依据。&lt;/li&gt;&#xA;&lt;li&gt;访问地址：&lt;a href=&#34;https://huggingface.co/open-llm-leaderboard&#34;&gt;https://huggingface.co/open-llm-leaderboard&lt;/a&gt;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;Hugging Face 目前在国内无法直接访问。&lt;/p&gt;&#xA;&lt;p&gt;&lt;strong&gt;3. 中文能力最强基准：SuperCLUE 与 OpenCompass&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;p&gt;针对中文语境，国内有两个极具代表性的权威评测平台：&lt;/p&gt;&#xA;&lt;p&gt;SuperCLUE（中文通用大模型综合性评测基准）：由 CLUE 团队推出，涵盖十大能力维度，特别关注中文语境下的理解、逻辑和幻觉控制。它通过构建多维度的评测体系，来衡量模型在不同任务上的效果、与国际模型的差距以及与人类水平的对比。&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;访问地址：&lt;a href=&#34;https://www.superclueai.com/generalpage&#34;&gt;https://www.superclueai.com/generalpage&lt;/a&gt;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;OpenCompass（司南）：由上海人工智能实验室推出的权威评测平台，涵盖语言、推理、知识、代码、数学等七大核心领域，评测维度非常全面。&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;访问地址：&lt;a href=&#34;https://rank.opencompass.org.cn/leaderboard-llm&#34;&gt;https://rank.opencompass.org.cn/leaderboard-llm&lt;/a&gt;&lt;/li&gt;&#xA;&lt;/ul&gt;</description>
    </item>
    <item>
      <title>模型提供商</title>
      <link>https://cncfstack.com/p/openclaw/docs/0300.model/model-providers/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>https://cncfstack.com/p/openclaw/docs/0300.model/model-providers/</guid>
      <description>&lt;p&gt;OpenClaw 可以使用许多 LLM 提供商。选择一个，完成身份验证，然后将默认 模型设置为 provider/model。&lt;/p&gt;&#xA;&lt;h2 id=&#34;国内模型提供商&#34;&gt;国内模型提供商&lt;a class=&#34;td-heading-self-link&#34; href=&#34;#%e5%9b%bd%e5%86%85%e6%a8%a1%e5%9e%8b%e6%8f%90%e4%be%9b%e5%95%86&#34; aria-label=&#34;Heading self-link&#34;&gt;&lt;/a&gt;&lt;/h2&gt;&#xA;&lt;h2 id=&#34;国外模型提供商&#34;&gt;国外模型提供商&lt;a class=&#34;td-heading-self-link&#34; href=&#34;#%e5%9b%bd%e5%a4%96%e6%a8%a1%e5%9e%8b%e6%8f%90%e4%be%9b%e5%95%86&#34; aria-label=&#34;Heading self-link&#34;&gt;&lt;/a&gt;&lt;/h2&gt;&#xA;&lt;p&gt;OpenAI（API + Codex）&#xA;Anthropic（API + Claude Code CLI）&#xA;OpenRouter&#xA;Vercel AI Gateway&#xA;Cloudflare AI Gateway&#xA;Moonshot AI（Kimi + Kimi Coding）&#xA;Mistral&#xA;Synthetic&#xA;OpenCode（Zen + Go）&#xA;Z.AI&#xA;GLM 模型&#xA;MiniMax&#xA;Venice（Venice AI）&#xA;Amazon Bedrock&#xA;Qianfan&lt;/p&gt;</description>
    </item>
    <item>
      <title>设置默认模型</title>
      <link>https://cncfstack.com/p/openclaw/docs/0300.model/default-model/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>https://cncfstack.com/p/openclaw/docs/0300.model/default-model/</guid>
      <description>&lt;p&gt;快速开始&#xA;使用该提供商进行身份验证（通常通过 openclaw onboard）。&#xA;设置默认模型：&lt;/p&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;background-color:#f8f8f8;-moz-tab-size:4;-o-tab-size:4;tab-size:4;&#34;&gt;&lt;code class=&#34;language-json&#34; data-lang=&#34;json&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#000;font-weight:bold&#34;&gt;{&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;  &lt;span style=&#34;color:#a40000&#34;&gt;agents:&lt;/span&gt; &lt;span style=&#34;color:#a40000&#34;&gt;{&lt;/span&gt; &lt;span style=&#34;color:#a40000&#34;&gt;defaults:&lt;/span&gt; &lt;span style=&#34;color:#a40000&#34;&gt;{&lt;/span&gt; &lt;span style=&#34;color:#a40000&#34;&gt;model:&lt;/span&gt; &lt;span style=&#34;color:#a40000&#34;&gt;{&lt;/span&gt; &lt;span style=&#34;color:#a40000&#34;&gt;primary:&lt;/span&gt; &lt;span style=&#34;color:#204a87;font-weight:bold&#34;&gt;&amp;#34;anthropic/claude-opus-4-6&amp;#34;&lt;/span&gt; &lt;span style=&#34;color:#000;font-weight:bold&#34;&gt;}&lt;/span&gt; &lt;span style=&#34;color:#a40000&#34;&gt;}&lt;/span&gt; &lt;span style=&#34;color:#a40000&#34;&gt;},&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#a40000&#34;&gt;}&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;</description>
    </item>
    <item>
      <title>阿里云Qwen模型配置</title>
      <link>https://cncfstack.com/p/openclaw/docs/0300.model/0310.aliyun-qwen/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>https://cncfstack.com/p/openclaw/docs/0300.model/0310.aliyun-qwen/</guid>
      <description></description>
    </item>
    <item>
      <title>腾讯云模型配置</title>
      <link>https://cncfstack.com/p/openclaw/docs/0300.model/0320.tencent-xx/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>https://cncfstack.com/p/openclaw/docs/0300.model/0320.tencent-xx/</guid>
      <description></description>
    </item>
  </channel>
</rss>
