牛牛游戏app GPT-5.2连肝7天, 300万行代码造出Chrome级浏览器
发布日期:2026-01-27 00:32 点击次数:73


【新智元导读】一个大模子合手续写代码,能写多久?一小时?一天?如故像大部分AI编程用具那样,完成一个任务就末端对话?Cursor的CEO MichaelTruell决定搞一次极限压力测试!
Michael Truell让Cursor中的GPT-5.2集合运行了整整一周。
不是一小时,不是一天,而是不眠不绝,日夜不停,168小时合手续写代码。
恶果?
300万行代码。数千个文献。
AI王人备从零构建出一个全新浏览器。

而且,如故Chrome那种浏览器。
HTML证明、CSS布局、文本渲染、还有一个自研的JavaScript诬捏机——全是AI我方写的。
Michael Truell蜻蜓点水地发了条推文:它基本能跑!豪迈的网页能快速且正确地渲染出来。


一个模子究竟能跑多久
传统的AI编程用具,比如Github Copilot和早期的其他IDE,都是一问一答口头。
对话长度有限,险峻文有限,任务复杂度有限。
自后出现了所谓的Agentic编程——Claude Code、Cursor Agent、Windsurf等用具让AI不错自主实行多步任务,读取文献、运行大叫、开导虚伪。
这还是是很大的高出,但大多量情况下,任务仍然以分钟计较,最多几小时。
AI完成一个功能,东说念主类review,然后连接下一个任务。
但莫得东说念主尝试过让一个模子集合跑一周。
直到GPT-5.2。
Cursor团队让GPT-5.2合手续运行了整整一周,不是断断续续,而是集合使命。

在这一周里,它:
写下了卓绝300万行代码
创建了数千个文献
实行了数万亿个token
从零构建了一个完整的浏览器渲染引擎
一个模子究竟能运行多久?
谜底是:表面上,不错无限。
只须基础步调牢固,只须任务填塞明确,AI就能合手续使命——不眠不绝,不吃不喝,7×24小时全年无休。
就像澳洲的放羊大叔的「赛博黑工」。
但本质上,不同模子的「耐力」互异弘大。
险峻文窗口是第通盘门槛。
早期的GPT-3.5唯有4K token险峻文,意味着对话稍长就会失忆。
Claude 3推出了200K险峻文,GPT-4 Turbo跟进128K,Gemini 1.5 Pro更是堪称维持100万token。
但险峻文长度只是表面值——实在练习的是模子在长任务中能否保合手一致性、专注度和实行力。
Cursor团队在实验中发现了谬误互异。

在Cursor这篇官方博客中,团队在实验中发现了谬误互异:
GPT-5.2 能万古分自主使命,遵守教唆精确,保合手专注不偏离;
Claude Opus 4.5 倾向尽早末端,走捷径,不时把限度权交还给用户;
GPT-5.1-Codex 虽专为编码巡视,但预备才调不如GPT-5.2,是以容易中断。
用更直白的话说:Opus像个焦急的实习生,干一会就思问「这么行不行?我先交了哈」;

而GPT-5.2像个练习的高等工程师,叮嘱明晰任务就埋头干到底。
这亦然为什么Cursor官方声称:GPT-5.2是处理弥远运行任务的前沿模子。
不啻浏览器。
Cursor还清楚了其他正在运行的实验样式:JavaLSP、Windows 7模拟器和Excel克隆。
数据都很夸张,AI我方不停地写了55万行代码、120万行代码和160万行代码。(话说,Excel代码比Windows还多点,因吹斯汀)


多智能体系统互助
一个模子在一周内写300万行代码,注释是不停的写,莫得东说念主类打扰!
这显著不是一个模子「单打独斗」,怎么作念到的?
Cursor团队清楚了他们的机密兵器:多智能体系统(Multi-Agent System)。

领先,他们尝试让所有这个词Agent对等互助,通过分享文献来同步气象。恶果发现:
Agent会合手有锁太久,或者干脆健忘开释锁。二十个Agent的速率下落到相等于两三个Agent的灵验隐晦量。

这像极了东说念主类团队中常见的问题:会议太多、相通资本高、包袱范围不清。
最终灵验的决议是分层架构:
预备者(Planners):合手续探索代码库,创建任务,进行高层决策
实行者(Workers):专注于完成具体任务,不温雅全局,提交后连接下一个
评审(Agent):判断每轮迭代是否及格,决定是否参加下一阶段
这险些是东说念主类软件公司的组织架构:居品司理/架构师考究预备,门径员考究实行,QA考究评审。
但分歧在于——这是成百上千个Agent同期使命。
Cursor团队末端了上百个Agent不错在消释个代码库上协同使命数周,险些莫得代码冲突。
这意味着AI还是学会了东说念主类团队需要多年才能磨合出的互助默契。

浏览器的「护城河」
比你思象的要深得多
若是听到「不即是个娇傲网页的软件吗」这种评价,所有这个词作念过浏览器内核的工程师能够都会苦笑。
在计较机科学的鄙夷链里,手写浏览器内核的难度,仅次于手写一个操作系统。
为了让你对这300万行代码有个倡导,咱们需要看一眼谷歌的Chromium(Chrome的开源母体)。
算作东说念主类软件工程的巅峰之一,Chromium的代码量早已龙套3500万行。
它不单是是一个软件,本色上还是是一个「伪装成欺诈门径的操作系统」。
GPT-5.2挑战的究竟是什么?
着手是CSS的「暗昧表面」。
网页排版从来不是豪迈的堆积木。
CSS尺度里充满了各式历史留传的怪癖、层叠司法(Cascade)和复杂的剿袭逻辑。
一位前火狐浏览器工程师曾打过比喻:末端一个完好意思的CSS引擎,就像是在模拟一个物理规章开合安祥变化的世界。你变嫌一个父元素的属性,可能导致几千个子元素的布局蓦地垮塌。
其次是「诬捏机里的诬捏机」。
此次AI不仅写了界面,还写了一个JS诬捏机。
当代网页跑的JavaScript代码需要内存治理、垃圾回收(GC)和安全沙箱。
稍稍处理不好,网页就会吃光你的内存,或者告成让黑客穿透浏览器采纳电脑。
最要命的是,它选了Rust。
Rust这门言语以「绝失当协的安全」著称,它的编译器就像一位特别神经质的考官。
东说念主类工程师在写业务逻辑时,频频要花一半的时分和编译器「吵架」,处理借用巡视(BorrowChecker)和人命周期问题。
AI不仅要懂业务,还得在几百万行代码的范围下,让这位「考官」挑不出舛误。
能在七天内把这些硬骨头啃下来,而况让它们协同使命,这还是不是豪迈的「写得快」了,这意味机器启动具备了顶级的架构掌控力。

当AI能够「隐忍孑然」
但这则新闻实在的炸点,其实不在于浏览器自身,而在于阿谁「Uninterrupted」(无中断)。
这是AI进化的分水岭。
在此之前,咱们熟悉的AI编程用具(比如早期的Copilot)的情况是:你写个函数头,它补全五行代码;你发个教唆,它生成一个剧本。
它们的回想是碎屑化的,注释力是片时的。
一朝任务稍稍复杂小数,比如「重构这个模块」,它们频频会顾前不顾后,改了这头坏了那头,终末还得东说念主来擦屁股。
但此次不雷同。这是一次「万古任务」的告捷。
这300万行代码分散在数千个文献里。
当AI写到第300万行时,它必须依然「铭记」第1行代码里定下的架构章程;
当渲染引擎和JS诬捏机打架时,它必须能回溯几万行代码去寻找Bug的起源。
这168个小时里,GPT-5.2确定写出过Bug。
但它莫得停驻来报错恭候东说念主类投喂谜底,而是我方读取虚伪日记,我方调试,我方重构,然后连接前行。
这种「编写-运行-开导」的自主闭环,也曾是咱们东说念主类工程师最引认为傲的护城河。
当今,这条护城河被填平了。
咱们正在目睹AI从「聊天伴侣」向「数字劳工」的质变。
昔日咱们引导AI作念「任务」,比如「写个贪嘴蛇」;
当今咱们引导AI作念「样式」,比如「造个浏览器」。

千里默的螺旋
天然这个AI版浏览器的练习度距离Chrome还有很长的路要走,但它证明了旅途的可行性。
当算力不错转机为极其复杂的工程实施才调时,软件开导的旯旮资本将趋近于零。
这场实验最令东说念主颠簸的,其实不是屏幕上阿谁渲染出的网页,而是阿谁在后台千里默运行了整整七天的历程条。
它不眠不绝,不急不躁,以每秒数千字符的速率构建着数字世界的基石。
也许咱们该再行疑望「创造」的界说了。
唯有当用具启动独缓慢夜深里搞定问题时,咱们才明白,它不再只是用具,而是咱们的同业者。

从澳洲大叔的「赛博黑工」
到AI万古任务
用5行代码逼疯硅谷的澳洲放羊大叔,其实只作念了一件事情,即是让AI不达主张不成住手。

至于Prompt.md写了什么大叫,并不是要点。
就像今天Cursor CEO搞的这个极限压力测试雷同,主张即是造一个Chrome、造一个Windows、开导一个Excel,只须没完成主张,AI就要一直运行下去。 回到最启动阿谁问题:
一个AI究竟能我方干多久?
物理上的谜底是无限。只须你有填塞的算力、牢固的基础步调、知晓的任务界说,AI不错无限运行下去。
但更焦炙的是,这改变了软件开导的经济学。
传统软件开导的主要资本是东说念主力和时分。
一个10东说念主团队开导一个复杂样式,可能需要6个月到数年。每个月的东说念主力资本可能是几十万到上百万。
当今,AI不错在一周内完成原来需要数月的使命。
资本可能只是一些token用度,Emad Mostaque(Stability AI前CEO)算计Cursor浏览器样式可能铺张了约30亿个token。
他还有一个思法:用若干token能够重写一套Windows级别的操作系统?资本怎么?

Token是越来越低廉的,就像之前的水和电,最终基于token的算力也会变得极其低价。
于是,软件经济学就被澈底颠覆。比如,软件按照授权付费的形势就怕要消灭了。
在2026年的今天,软件开导正在资格一场基因级别的变异。
从前,代码是东说念主类一转一转敲出来的产物。
异日,代码可能只是东说念主类意图的自动张开:你描画你思要什么,AI就能把它酿成现实。
一个模子能跑多久?
只须你需要,它就能跑下去。

备案号: