如何看待2025年国产AI大模型的爆发式增长?DeepSeek、Kimi、GLM-4等能否赶超OpenAI?
一句话回答:增长是真实的,差距在缩小,特定场景已领跑,但”赶超OpenAI”是个伪命题。
开头:数据震撼
2025年上半年,中国AI大模型市场发生了一件让很多人意外的事。
根据IDC最新报告,公有云大模型调用量达到536.7万亿Tokens,对比2024全年的114万亿Tokens,增长了近400%。

更直观的数据是,较2024年下半年,日均调用量暴增363%,已经突破10万亿tokens。
这还不是全部。
2025年2月,DeepSeek登顶苹果中国和美国应用商店免费下载排行榜,月活用户达到1.8亿,超越了ChatGPT在美区的表现。同月17日,腾讯元宝、微信、腾讯文档、QQ浏览器等全系产品接入DeepSeek-R1模型。字节跳动推出UltraMem架构,推理速度提升2-6倍。百度宣布文心一言从2025年4月1日起完全免费。
但很多人的第一反应是质疑。
“又是PPT”、“数据注水”、“与OpenAI差距还是巨大”、“不可能赶超”——这些声音在社交媒体上随处可见。
那么,2025年国产AI大模型的真实水平到底如何?这场爆发式增长是真实力,还是虚火?
我查阅了艾媒咨询、IDC、QuestMobile等6份权威报告,对比了Claude、GPT、DeepSeek等模型的最新评测数据(截至2025年11月),得出了一个可能让你意外的结论:
这场增长是真实的,但驱动力不是”赶超OpenAI”,而是”大模型民主化”。
一、爆发式增长的数据证据:不是虚火,是实用性
先说结论:增长是真实的,不是虚火。
1. 调用量增长来自”日常使用”,不是”尝鲜体验”
很多人看到363%的增长,第一反应是”又在炒作”。
但看看用户行为数据,你会发现不一样的东西。
根据艾媒咨询《2024-2025年中国AI大模型市场现状及发展趋势研究报告》:
51.5%的用户每周使用4-5次21.6%的用户每天多次使用应用场景集中在工作(53.9%)和学习(44.5%)
这说明什么?
AI大模型已经从”尝鲜工具”变成了”日常工具”。就像2015年之后的智能手机,不是偶尔用一次,而是每天离不开。
对比一下:如果只是炒作,用户会每天用吗?如果只是虚火,53.9%的用户会用它工作吗?
2. DeepSeek重构的是”行业话语权”,不只是技术
2025年最大的黑马是DeepSeek。
但很多人只看到了”DeepSeek技术强”,没看到更深层的东西。
先看三组数据:
训练成本:DeepSeek-V3用557.6万美元完成训练,配置是2048块英伟达H800 GPU,训练55天。对比竞争对手动辄数亿美元的成本,这是成本的大幅降低。
版本迭代:2025年8月,DeepSeek发布V3.1版本,上下文窗口从64K扩展至128K,智能体能力大幅增强;9月又发布V3.1-Terminus版本,进一步优化了Code Agent与Search Agent表现。
生态影响:Kimi K2、GLM-4.5等最新旗舰国产模型,在技术报告中明确提到是在DeepSeek-V3的基础上改进的。这意味着什么?DeepSeek成为了”行业标准”。
C端接入:腾讯元宝、微信、QQ等全系产品接入DeepSeek-R1。根据QuestMobile 2025年2月数据,DeepSeek月活用户1.8亿,排名第一,超过豆包(1.01亿)、元宝(2636万)。
这三组数据背后,是一个更深层的逻辑:
DeepSeek通过开源策略,重构了行业的”话语权”。
类比一下:就像Android重构了手机OS的话语权。2008年之前,苹果iOS是封闭的标准。Android开源后,成为了更多厂商的选择。现在,DeepSeek正在做同样的事。
华为云、阿里云、百度云等云厂商,国产芯片企业,智能硬件、汽车、金融等上下游产业链企业,都在积极接入DeepSeek模型。
3. 大厂策略分化,暴露的是”赛道焦虑”
2025年,国内大厂的AI策略出现了明显分化:
腾讯:”自研+开源”双轮驱动
自研混元模型支持内部700+业务场景同时全面接入DeepSeek-R1(2025年2月17日)覆盖30+垂直行业的解决方案2024年研发投入70.69亿元
字节:技术创新路线
2025年2月推出UltraMem稀疏模型架构推理速度提升2-6倍,成本降低最高83%豆包”深度思考”功能3月起全面免费2025年5月豆包日均token调用量达16.4万亿,较去年12月增长310%企业级市场占比14.1%(第二)
百度:完全免费策略
2025年4月1日起,文心一言完全免费覆盖PC端和App端全部用户与优必选合作探索人形机器人应用
阿里:企业级市场第一
通义企业级市场占比17.7%(第一)3月开放1000万字长文档处理(免费)深耕行业应用:BMW智能座舱、小鹏/极氪等车企
这种分化说明什么?
说明没有人找到”确定性路径”。是OpenAI的路径(闭源+订阅),还是DeepSeek的路径(开源+低成本)?大厂都在试探。
二、与OpenAI的真实差距:缩小但仍存在,关键看场景
很多人关心一个问题:国产AI与OpenAI的差距到底有多大?
答案是:差距在缩小,但约9%的差距是鸿沟还是台阶,取决于你的场景。
1. 编程能力:差距约11%,但够用吗?
先看最新的编程能力排名(2025年11月数据):
| 排名 | 模型 | SWE-bench得分 | LiveCodeBench得分 | 类型 |
|---|---|---|---|---|
| 1 | Claude 4.5 Sonnet | 77.2% | 70%+ | 国际 |
| 2 | Gemini 2.5 Pro | 63.8% | 70.4% | 国际 |
| 3 | DeepSeek V3.1-Terminus | 68.4% | 国产 | |
| 4 | GPT-4.5 | 38% | – | 国际 |
但这9%意味着什么?
对于顶尖开发者,这9%可能是”关键差距”——复杂系统设计、多步工具调用、规划能力,Claude确实更强。
但对于大部分应用场景——日常编程、代码审查、Bug修复——68%的能力已经足够。
更关键的是:DeepSeek是开源的,可以本地部署,成本更低。V3.1版本在Agent能力上有显著提升,不再仅仅是写代码,而是能更好地理解任务、调用工具、修复bug。
2. 综合能力:第一梯队vs顶尖,差距明显
根据SuperCLUE中国大模型基准评测(2025年):
第一梯队:DeepSeek(第一)、通义千问(Qwen 2.5开源版性能超越Llama 3.1 405B)、豆包、混元、360智脑顶尖国际:GPT-5、Claude 4.5、Gemini 3
国产模型在第一梯队,但与顶尖国际模型还有差距。
差距在哪里?
基础模型能力:GPT-5在推理、创造力、多模态能力上仍领先生态完整度:OpenAI的API生态、插件系统更成熟国际影响力:OpenAI、Anthropic在全球市场的认可度更高
但国产有哪些优势?
中文理解:在中文场景下,国产模型更准确场景适配:针对国内用户习惯和业务场景优化成本控制:DeepSeek训练成本大幅降低开源生态:DeepSeek、Qwen等开源模型降低使用门槛
3. 特定场景已领跑:月活用户说明一切
有一个数据很有意思:
2025年2月AIGC APP月活用户(QuestMobile数据):
DeepSeek:1.8亿(第一)豆包:1.01亿(第二)腾讯元宝:2636万(第三)
DeepSeek的1.8亿月活,超越了ChatGPT在美区的表现。
这说明什么?
说明在用户认可度这个维度,国产AI已经”赶超”了。
用户不会因为”爱国情怀”每天用一个产品。用户用,是因为它真的好用、免费、快速。
**洞见5:在”用户认可度”这个场景,国产AI已经领跑。这比技术指标更重要。

三、未来趋势:2025年是”大模型民主化”元年
最后一个问题:国产AI能否赶超OpenAI?
我的答案是:“赶超OpenAI”是个伪命题。
1. 重新定义”赶超”:综合能力vs特定场景
什么叫”赶超”?
如果是综合能力(推理+创造力+多模态+生态),GPT-4确实还领先。
但如果是特定场景:
中文理解:国产模型更强用户月活:DeepSeek 1.8亿 > ChatGPT成本控制:DeepSeek训练成本大幅降低开源生态:DeepSeek、Qwen引领开源
你看,”赶超”是多维的,不是单一指标。
甚至连OpenAI也没在所有维度”领先”——Claude 4.5在编程能力上已经超越GPT-5 Codex(77.2% vs 74.5%)。
2. 2025年的真正变化:大模型民主化
如果要给2025年国产AI大模型定一个关键词,我会选**“民主化”**。
什么是民主化?
免费趋势:
百度文心一言:2025年4月起完全免费字节豆包:深度思考功能免费腾讯元宝:接入DeepSeek-R1后功能增强
开源趋势:
DeepSeek开源策略被广泛采用Kimi K2、GLM-4.5基于DeepSeek-V3改进根据观研报告网数据,全球1328个AI大模型中,中国占36%(第二,仅次于美国44%)
算力下沉:
2025年智能算力占比预计达35%(2024年32%)昆鹏系列国产服务器市场份额超20%全国196个公开智算中心(广东23个、山东17个)
这意味着什么?
意味着AI大模型从”少数人的玩具”变成了”人人可用的工具”。
就像2010年后的智能手机,不再是富人的专属,而是人人都能用。
3. 关键变量:算力自主化、应用落地
未来3年,决定国产AI能走多远的,有两个关键变量:
变量1:算力自主化
2025年智能算力规模预计达1037.3 EFLOPS,增长43%国产昆鹏系列服务器市场份额超20%覆盖金融、运营商、政府、互联网等关键场景
变量2:应用落地
20家央企接入DeepSeek(能源、电信、汽车、金融、建筑)腾讯混元支持内部700+业务场景百度与优必选合作人形机器人
算力决定”能做什么”,应用决定”有没有用”。
这里是我目前在用的AI服务,有需要的同志可以试一下
智谱也很不错了
硅基流动
–
四、总结
回到最初的问题:如何看待2025年国产AI大模型的爆发式增长?能否赶超OpenAI?
我的答案:
增长是真实的:调用量增长363%,豆包日均调用量达16.4万亿tokens,用户每周4-5次使用,说明实用性强差距在缩小:编程能力差距从更大数值缩小到约9%,特定场景已领跑赶超是伪命题:AI是多维竞争,国产AI在用户月活、成本控制、开源生态已领先真正价值在民主化:2025年是”大模型民主化”元年,免费+开源让更多人受益
对开发者的建议:
不要盲目追求”最强模型”,选择”够用+成本低”关注DeepSeek等开源模型,生态在快速成熟本土化场景优先用国产模型(中文理解、数据合规)
对用户的建议:
2025年是体验AI的最佳时机(免费+易用)多尝试不同模型,找到适合自己的AI不是替代人,而是增强人的工具
最后说一句:
国产AI的2025,不是”赶超OpenAI”的故事,而是”让AI普惠”的故事。
这可能比”赶超”更重要。

