Skip to main content
距离人工智障写代码,吗?又是八个月了,好像又触发什么填坑trigger,所以我又来更新了,接上次提出的四个层面。 十月工作太忙,十一月回国流窜办公一有空就四处找老伙计们蹭吃蹭喝,所以X刷的少了cursor也用的少了,这周回来才又重新跟世界连接上,还好,变化小小,不至于翻天覆地。虽然有了Gemini 3 Pro和Claude Opus 4.5,但好像并没有什么大跃进,至少在cursor里只是一些marginal的提升,看来模型能力的收敛已成定局。那么这种情况下,如何选择使用哪个模型呢?最早玩代码生成只有Claude Sonnet能打,但现在百花齐放,用哪个都行,只要用的多了,用的顺手了,没太大差别。可如果模型的差异不存在了,模型即产品的说法还成立吗?如果只是看文本生成或者代码生成,似乎已经站不住脚了,于是模型厂商都开始卷“周边”,比如缓存,比如前端美学,好吧也算是模型原生能力的一部分,勉强也能算作模型即产品罢。 至于代码生成平台,一早入手的Replit早就忘记账号密码,现在只用Cursor,然后利用Github自动部署到Vercel,非常丝滑。以前觉得一点代码没写过的人Replit是极好的,但现在我觉得上手之后还是要尽快过渡到Cursor和自主选择云服务。无它,可以玩到更多玩具罢了。如果就是不喜折腾,Replit也是极好的。至于新晋的v0之类,咱也没用过就不评价了。当然了,如果是单一功能的小工具,在“打开手机随手一开发部署分享就能用”这个层面,Cursor还是差了点。从古早的现在都下架了的GPTs算起也是已经经历好多代,最终还是要看用户群和使用场景,这一层的产品可以说最能百花齐放了。 应用层,有点难评了,本来我期待的是每个人可以拥有自己高度定制化的工具,但现在看起来工具本身还是中心化的,像是用来搞学习的NotebookLM,用来生成报告的Manus,大众是一点没有想要自己制造工具,也并没有获得定制化应用的需求和渠道,代码生成本身还是成了程序员自己的大玩具。这是因为行业还在孵化,还是说人性就是如此,又或者我在X这个泡泡里习得了偏见?不会到头来程序员只是革了自己的命罢!不过要说软件开发新范式,倒也是个好话题了。 分发层,目前只有OpenAI有点动静,但现在看起来主要还是头部的平台产品动作比较快,跟我之前的期待也是不太一样,只能说上一波互联网平台产品牢牢占据生态位,后来者想要突破也没那么容易了。 那有没有什么完全超出我预期的呢,有。 一个月和更久以前我常有的一个观点是,最好只把模型当作手而不当作脑来使用,但以Cursor Agent为例,中等复杂的设计我现在可以放心的让它帮我调研技术选型,给出观点,并写好代码,虽然没有one shot但基本小修一下也都够用。想的更远一些,这也代表了一种新的组织结构,最厉害的人把自己的insights产品化,写入模型里,写入prompt里,供其他人使用,实现头脑的规模化利用,提高整体的平均水平也提升下限。但由于人跟人之间使用工具的能力差异,叠加模型性能的提升,从前的八二法则以后就是九一甚至更分化了。在此基础之上,组织内分工的界限也会模糊,全栈甚至全干开始普及。 什么你说在xxx领域现在生成的代码完全不能用?大概率只是时间问题而已,三年前GPT3.5基本的计算都稀巴烂呢。所以还是要有耐心。 畅想完未来,还是要回到现在。 如果说从Claude Sonnet 3.5到现在我的Vibe Coding都是为了Vibe而Vibe只为自己爽,那么最近的一个根本性改变是我计划Vibe出能我工作体验更好的产品来。也算是一个milestone了,首先因为模型和产品的能力以及我的掌握程度使我有做出这样产品的动力,其次也是因为工作本身也到了一种急需资源但是资源严重短缺只好自救的境地。整个过程花费了快两年,可我感觉自己在科技行业非研发部门已经算是比较激进的用户了,如果去看整个科技行业的渗透率我相信还是低的可怜。如果算上全人类,我们还太早太早。 总结一下就是,低估了未来同时高估了现在,道阻且长啊。