前沿实验室大乱斗:“大模型没有永远赢家” #RSI #田渊栋 #Meta #Anthropic #真财实学计划
✅ 已完成任务ID: 1238
30秒速读
核心摘要
本次访谈探讨大模型行业竞争格局,明确大模型赛道不存在永远的赢家。
可执行建议
- 相关从业者可重点布局大模型自迭代方向,跟进开源技术路线降低研发追赶成本
- 大模型厂商无需盲目追求炫技,可聚焦打磨产品体验、优化营收能力构建长期竞争力
标签与备注
标签
备注
暂无备注
转录文本
你怎么看Andrej Karpathy加入Anthropic这件事?圈内人大家怎么看?我觉得一个是说明,就是自迭代、自动研究非常重要,这个我觉得我们也很开心看到这个有意思的进展。所以说Karpathy在X上直播了自己做AutoResearch的整个流程,对吧?然后把相关的代码库都开源了。那段时间应该说很多人对这个非常有兴趣,也有很多人跟随这个路线,然后发现这个研究路线可以做很多优化。所以应该说他在这方面的影响很大。然后他也明确跟大家说了,他去Anthropic是做预训练,是做AutoResearch。所以应该说这就让大家觉得,确实自迭代,或者说自学习这个方向应该说是主流了,或者说大家都承认这个方向是对的。我觉得这是很好的。 那你觉得整个代码大模型这一块的格局,会延续现在的排位吗?还是说有机会出现一些变数?我觉得很难讲,因为其实说实话,用下来并没有觉得谁比谁强很多。比如说Claude 3 Code 5.5,我用的时候觉得挺好的,GPT-4o Code做的也都挺好,但各有各的问题。比如Claude会给你幻觉,而且其实CodeLlama我觉得并没有比Claude差太多,只要想追,能力层面和产品层面都是能追上去的。我觉得是可以追上,就看它执行的速度多快。所以我觉得如果一个方向特别火,大家都知道它的商业价值,那所有人都会去做,就会产生各种不同的方案。还有很多开源的,比如像DeepSeek Coder V4,我也用了,我觉得还挺好的。当然它有一个问题,可能一开始你必须让它预热一下,比如预热一万个token,它才会变聪明一点,一开始反应有点奇怪,过了一段时间之后,它就突然变聪明了,可以做很多事。 OpenAI和Anthropic的比拼,你觉得会是什么样的结果?现在很难说吧。因为OpenAI之前有个问题,很多方向都在做,也不是特别聚焦。现在Anthropic开始聚焦资源,就很难说两边谁更好。其实对用户来说这是好事,因为可用的方案很多,价格也会打下来。那接下来决定他们胜负手的关键因素是什么?谁能找到更新的范式?我觉得倒不是,因为代码本身已经很赚钱了。接下来的问题是,谁能让用户愿意去用他们的产品,我觉得这可能是重要的,所以还是产品层面的竞争。因为他们两家都已经,特别是Anthropic,他们现在最终的核心目标是营收,增长很高,一直往上走。那其实这里有个问题,一旦你开始有营收了,会有更多人信任你,这其实是一个很有意思的现象。如果这样的话,他们两边就会有这样的比拼:比如外界有人说OpenAI马上要赚钱了,那对Anthropic来说,大家就会问你怎么还没赚钱?也有很多人问,你估值这么高,对吧?那会不会有这个问题?他们都上市了嘛,一旦进入这个叙事阶段之后,逻辑可能和以前的逻辑不一样了。有一些实验室就说我要证明自己很厉害,我做出个新东西出来,你看没人做过,很厉害,超级惊艳。但一旦进入资本市场,要做资本叙事,要做营收增长,要打理资产负债表的时候,你就会回到最基础的商业模式:我希望我的公司是有营收、成本低、能稳定赚钱的。所以其实大家走的赛道可能就不一样。 然后来说说Meta,你在离开之后,它经历过数次重组,他们之前推了Llama 3出来,你怎么评价Llama 3?其实还不错,我也用了一下,首先我持有不少Meta的股票,对吧?我也没法客观评价,说实话。我觉得Llama 3还是不错的,特别是多模态,表现挺好,它的理解能力,还有一些回答也比较好,都还不错。当然总的来说,可能还是比GPT-4o差一点。然后我看到有评论说Llama 3是一个为Meta自身产品场景高度定制的模型,而不是一个非常强大的通用前沿模型。那这是不是意味着,它在AI的策略上就完全转向了,就不拼那种最强大的通用模型了?我倒不觉得是这样,我觉得它还是走的基础大模型路线,至少从它内部的工作模式来说,还是存在这样的路径:先训练一个更强的基础模型,然后再针对特定场景做微调,这个路径是更好的。他们其实还是没有放弃争夺最强大模型的目标,不然的话,就没必要花很多钱做这件事了。你觉得他们还有机会吗?其实机会还是很多的,因为大家都还在往前走,而且大模型一旦有人训练出来,不出几个月就会被人超过,大模型领域没有永远的赢家,应该这么说,对吧?现在大家都是犬牙交错地往前走,所以很难说。那需要什么?需要有一个人灵光一现?那也不是,这个还是需要团队作战,对吧?很多人一起把事情做好,拼在一起就可以了。这点上我特别同意姚期智的观点,我觉得大模型,特别是做工业级的大模型,大厂做大模型很多时候就是每个人都在各自赶进度,做完把流程跑通就可以了。那如果每个大厂都这样,那差异点在哪里?就看你做的多细,你的工作做的多努力,事情做的多好。有些小细节注意到了,有些没注意到,注意到的人可能就获得一些优势,没注意到的人就落后了,就是这样子。