“30秒写完一个模块,400%速度碾压同行”——Cursor2.0把这句广告变成了基准测试里的硬数字。

它没再靠GPT或Claude“做二房东”,而是甩出一颗自研炸弹:Composer,一颗专为“低延迟+工程级”写的MoE大模型。

—
把“快”拆给你看
每秒250个token,相当于一口气吐出四行Python,不卡、不断、不回头。
在Cursor Bench里,它把GPT-4Turbo的Python补全准确率从73.1%推到78.3%,TypeScript重构成功率干到85%,中位响应23秒——别人刚把依赖装完,它已经跑完单测。
—
为什么能快?
1. 强化学习直接上“战场”
训练场不是静态题库,而是100%真实代码仓:改需求、解冲突、补单测、回滚版本,错了就扣reward,对了就加速。
斯坦福独立复现发现,这种“真刀真枪”让复杂调试任务一次性成功率提37%。
2. MoE 稀疏激活
写前端只叫醒“Web专家”,写算法只踢“算法专家”,其余90%参数继续睡觉——算力省下来,速度自然起飞。
3. 多Agent“内卷”
一个需求甩给3个小弟:A写、B测、C找漏洞,30秒后投票选最优,直接把“单人思考”升级成“小组脑暴”。
—
新功能不是“炫技”,是“省工”
-原生浏览器工具:Composer自己开Chrome,调接口、抓日志、截报错,程序员只负责喝一口咖啡。
-语音→代码:对着麦克风说“加一个防抖的搜索框”,它直接吐出React+TypeScript,useDebounce一并写好。
– Agent-first 界面:左侧不再是一排文件树,而是“需求卡片”。
想改需求,直接拽卡片,Agent自动拆任务、插代码、跑CI,人类最后点“Merge”。
—
企业先吃上了螃蟹
微软Azure DevOps把Composer塞进CI/CD做Code Review:
92%的常见漏洞被它提前拦下,误报只有8%,等于给每个PR配了一位不加班的老司机。
内部灰度两周, review时间从人均45分钟压到11分钟,CTO直接拍板扩大rollout。
—
社区还在吵什么?
“自研”到底自研到哪一层?
Composer没交底:基础模型是否从开源 checkpoint 出生?
早期原型“Cheetah”是不是就是它的马甲?
Cursor团队只回一句:“架构与权重100%自研”,其余闭口。
透明度缺一块,就像跑车没给行驶证——速度再快,也怕交警。
—
给你一张“上车票”
个人开发者:
今晚就能在Cursor2.0里把Composer当默认引擎,30秒生成一个带测试的RESTfulCRUD,省下的时间拿去刷剧还是卷副业,随你。
中小团队:
把“语音需求”喂给Composer,让它先跑通0→1原型,再交给人精修,需求会上不再相互甩锅“理解有偏差”。
大厂基建:
可以学微软,把Composer当“第一遍reviewer”,让昂贵的高级工程师只盯算法与业务语义,漏网漏洞直接-90%。
—
最后一行代码
Cursor 2.0用强化学习+多Agent告知我们:
“快”不是把模型参数无脑堆大,而是让AI在真实战场里摔打,再用群体智慧筛出最优解。
当别人还在纠结“提示词怎么写”时,Composer已经把写完、测完、修完打包成30秒的标准动作。
下一次发布会,如果Cursor把“透明度”也补全,那它就不是“更快”,而是“让同行无路可走”。


好用的