Cursor发布首个编程大模型!代码生成250tokens秒,强化学习

“30秒写完一个模块,400%速度碾压同行”——Cursor2.0把这句广告变成了基准测试里的硬数字。

Cursor发布首个编程大模型!代码生成250tokens秒,强化学习

它没再靠GPT或Claude“做二房东”,而是甩出一颗自研炸弹:Composer,一颗专为“低延迟+工程级”写的MoE大模型。

Cursor发布首个编程大模型!代码生成250tokens秒,强化学习

把“快”拆给你看

每秒250个token,相当于一口气吐出四行Python,不卡、不断、不回头。

在Cursor Bench里,它把GPT-4Turbo的Python补全准确率从73.1%推到78.3%,TypeScript重构成功率干到85%,中位响应23秒——别人刚把依赖装完,它已经跑完单测。

为什么能快?

1. 强化学习直接上“战场”

训练场不是静态题库,而是100%真实代码仓:改需求、解冲突、补单测、回滚版本,错了就扣reward,对了就加速。

斯坦福独立复现发现,这种“真刀真枪”让复杂调试任务一次性成功率提37%。

2. MoE 稀疏激活

写前端只叫醒“Web专家”,写算法只踢“算法专家”,其余90%参数继续睡觉——算力省下来,速度自然起飞。

3. 多Agent“内卷”

一个需求甩给3个小弟:A写、B测、C找漏洞,30秒后投票选最优,直接把“单人思考”升级成“小组脑暴”。

新功能不是“炫技”,是“省工”

-原生浏览器工具:Composer自己开Chrome,调接口、抓日志、截报错,程序员只负责喝一口咖啡。

-语音→代码:对着麦克风说“加一个防抖的搜索框”,它直接吐出React+TypeScript,useDebounce一并写好。

– Agent-first 界面:左侧不再是一排文件树,而是“需求卡片”。

想改需求,直接拽卡片,Agent自动拆任务、插代码、跑CI,人类最后点“Merge”。

企业先吃上了螃蟹

微软Azure DevOps把Composer塞进CI/CD做Code Review:

92%的常见漏洞被它提前拦下,误报只有8%,等于给每个PR配了一位不加班的老司机。

内部灰度两周, review时间从人均45分钟压到11分钟,CTO直接拍板扩大rollout。

社区还在吵什么?

“自研”到底自研到哪一层?

Composer没交底:基础模型是否从开源 checkpoint 出生?

早期原型“Cheetah”是不是就是它的马甲?

Cursor团队只回一句:“架构与权重100%自研”,其余闭口。

透明度缺一块,就像跑车没给行驶证——速度再快,也怕交警。

给你一张“上车票”

个人开发者:

今晚就能在Cursor2.0里把Composer当默认引擎,30秒生成一个带测试的RESTfulCRUD,省下的时间拿去刷剧还是卷副业,随你。

中小团队:

把“语音需求”喂给Composer,让它先跑通0→1原型,再交给人精修,需求会上不再相互甩锅“理解有偏差”。

大厂基建:

可以学微软,把Composer当“第一遍reviewer”,让昂贵的高级工程师只盯算法与业务语义,漏网漏洞直接-90%。

最后一行代码

Cursor 2.0用强化学习+多Agent告知我们:

“快”不是把模型参数无脑堆大,而是让AI在真实战场里摔打,再用群体智慧筛出最优解。

当别人还在纠结“提示词怎么写”时,Composer已经把写完、测完、修完打包成30秒的标准动作。

下一次发布会,如果Cursor把“透明度”也补全,那它就不是“更快”,而是“让同行无路可走”。

Cursor发布首个编程大模型!代码生成250tokens秒,强化学习

© 版权声明

相关文章

1 条评论

您必须登录才能参与评论!
立即登录