C-Eval is a comprehensive Chinese evaluation suite for foundation models. It consists of 13948 multi-choice
questions spanning 52 diverse disciplines and four difficulty levels, as shown below. You may explore our
dataset examples at Explore, or check our paper for more details.
Have any questions about C-Eval? Please contact us at ceval.benchmark@gmail.com
or create an issue on Github.
For potential collaboration, please contact junxianh@cse.ust.hk.
数据统计
数据评估
关于C-Eval特别声明
本站鸟瑞导航提供的C-Eval数据都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由鸟瑞导航实际控制,在2025年9月11日 上午4:25收录时,该网页上的内容,都属于合法合规,后期网页的内容如出现违规,请联系本站网站管理员进行举报,我们将进行删除,鸟瑞导航不承担任何责任。
相关导航
智源研究院是人工智能领域的新型研发机构,汇集国际顶尖人工智能学者,聚焦核心技术与原始创新,旨在推动人工智能领域发展政策、学术思想、理论基础、顶尖人才与产业生态的五大源头创新。

魔搭社区
ModelScope——汇聚各领域先进的机器学习模型,提供模型探索体验、推理、训练、部署和应用的一站式服务。在这里,共建模型开源社区,发现、学习、定制和分享心仪的模型。

Ollama
Get up and running with large language models.

AutoGPT
AutoGPT empowers you to create intelligent assistants that streamline your digital workflow, enabling you to dedicate more time to innovative and impactful pursuits.

AgentGPT
Assemble, configure, and deploy autonomous AI Agents in your browser.

腾讯混元大模型
腾讯混元大模型是由腾讯研发的大语言模型,具备跨领域知识和自然语言理解能力,实现基于人机自然语言对话的方式,理解用户指令并执行任务,帮助用户实现人获取信息,知识和灵感。

Gradio
Build & Share Delightful Machine Learning Apps

Cherry Studio
Cherry Studio AI 是一款强大的多模型 AI 助手,支持 iOS、macOS 和 Windows 平台。快速切换多个先进的 LLM 模型,提升工作学习效率。
暂无评论...




