开卷有易：大语言模型三大排行榜全览及国内AIGC服务备案信息放送

大语言模型排行榜

1.LMSYS排行榜

LMSYS 和加州大学伯克利分校 SkyLab 的成员开发了一个名为Chatbot Arena的开源项目，是一个开放的大型语言模型评估平台，允许用户与多种语言模型进行互动，并通过人类偏好对它们进行评级。平台收集了超过 100 万张人类投票，使用 Elo 排名系统和 Bradley-Terry 模型来展示语言模型的排名。

其访问地址是：

https://chat.lmsys.org/?leaderboard

最新的排行榜截图如下：

这是总体问答情况的排行榜，GPT4-o占据了榜首位置，来自中国的Yi-Large-preview进入前10，处于第9的位置。

Yi-Large-Preview，是一个千亿参数的闭源大模型，由国内的零一万物（01.AI）推出。而零一万物（01.AI）是一家专注于人工智能领域的公司，由著名的计算机科学家、企业家李开复带队孵化。

再来看中文问答的排行榜：

从上图可以看到，在中文问答测试中，Google公司的Gemini 1.5Pro排名第一。

零一万物（01.AI）的Yi-Large-Preview排到了第四的位置。

国内的另外两个大语言模型也进入了榜单前列，一个是阿里巴巴的Qwen-Max，一个是清华智谱的GLM 4。

2.SuperCLUE排行榜

SuperCLUE是基于中文语言理解测评基准的排行榜。是由一个致力于AI评测基准、AI数据集开源的开发者社区建立的科学、客观、中立的AI评测基准。其定位是：为更好的服务中文语言理解、任务和产业界，作为通用语言模型测评的补充，通过搜集整理发布中文任务及标准化测评等方式完善基础设施，最终促进中文NLP的发展。

其访问地址是：

https://www.superclueai.com/

上图是总排行榜，还可以选择“十大基础能力排行榜”等：

3.清华SUPERBENCH排行榜

清华大学的人工智能研究院出了一个SUPERBENCH排行榜，这个排行榜使用了一种不同的评测方法——

在黑盒环境中进行零样本思维链推理（COT）的评测。评测的具体流程如下：

语言模型需要在进行思维链推理后，按照特定的格式输出其最终答案。其次，为了更准确地评估语言模型在该数据集上的性能（而非仅仅是按格式输出结果的能力），对于那些未能遵循指定格式输出的模型，将进行进一步的提问。如果模型能够直接输出正确的结果，这也将被视为正确的回答。

其访问地址为：

https://fm.ai.tsinghua.edu.cn/superbench/#/leaderboard

开卷有易：大语言模型三大排行榜全览及国内AIGC服务备案信息放送

AI工具箱怎么用

AI工具那个好用

好用的AI工具有哪些？

Turnitin 使用什么人工智能检测器？揭秘学术诚信的守护者

看门人 AI 坏了吗？

人工智能深度学习神经网络在双色球彩票中的应用研究(二)

扫描全能王app2025最新版本免费下载官方正版软件

特稿｜专访李西峙：打造中国自主人工智能计算机语言体系和软件生态 | Tatfook site

【科普】人工智能的十种重要应用

'如何启动AI写作助手：快速开启智能创作工具指南'

AI芯片与传统芯片有什么区别|ai芯片|软件|人工智能|算法|数据

Windsurf：这款全新免费的 AI IDE 击败了Cursor 吗？超强上下文感知

2025 年最适合企业各种预算的 12 款客户服务软件

一张照片测出两个结果！AI算命App套路多，专家：警惕个人信息被滥用

探索计算、通信与控制的前沿进展

博思AIPPT 1.2.5.0

一键AI图文成片软件下载手机版

想做图文却找不到配图？AI智能媒体助理的AI配图比我想象好看

6款免费AI抠图软件，3秒抠图去背景，建议收藏！

免费 AI 照片编辑器，图像生成神器和设计工具

AI 代理工具

AI 开放平台

AI 模型库

AI 开源项目

AI 小工具

Prompt 词库

AI 教程

AI 资讯

跨境资讯

开卷有易：大语言模型三大排行榜全览及国内AIGC服务备案信息放送

AI工具箱怎么用

AI工具那个好用

好用的AI工具有哪些？

Turnitin 使用什么人工智能检测器？揭秘学术诚信的守护者

看门人 AI 坏了吗？

人工智能深度学习神经网络在双色球彩票中的应用研究(二)

扫描全能王app2025最新版本免费下载官方正版软件

特稿 ｜ 专访李西峙：打造中国自主人工智能计算机语言体系和软件生态 | Tatfook site

【科普】人工智能的十种重要应用

'如何启动AI写作助手：快速开启智能创作工具指南'

AI芯片与传统芯片有什么区别|ai芯片|软件|人工智能|算法|数据

Windsurf：这款全新免费的 AI IDE 击败了Cursor 吗？超强上下文感知

2025 年最适合企业各种预算的 12 款客户服务软件

一张照片测出两个结果！AI算命App套路多，专家：警惕个人信息被滥用

探索计算、通信与控制的前沿进展

博思AIPPT 1.2.5.0

一键AI图文成片软件下载手机版

想做图文却找不到配图？AI智能媒体助理的AI配图比我想象好看

6款免费AI抠图软件，3秒抠图去背景，建议收藏！

免费 AI 照片编辑器，图像生成神器和设计工具

特稿｜专访李西峙：打造中国自主人工智能计算机语言体系和软件生态 | Tatfook site