Fable 5下线背后的思考 这两天Fable 5下线事件众说纷纭,各个角度都有,我来汇总下我对这件事的关注点和一些思考吧#AI #人工智能 #Fable5 #Mythos5 #Anthropic
✅ 已完成任务ID: 1195
30秒速读
核心摘要
Fable 5下线事件折射出前沿大模型发展与监管之间的现实矛盾。
可执行建议
- 普通用户尽早体验当下可公开访问的优质大模型,熟悉相关能力特性
- 国内相关从业者需加快前沿大模型自主研发,抢抓有限的发展时间窗口
高价值评论洞察
- 不少用户补充了Fable 5下线的非公开背景,指出事件并非仅由监管推动,还涉及股东亚马逊举报、Anthropic过度渲染AI安全玩脱拖累上市估值等商业博弈因素
- 大量用户对强AI模型封锁后的产业走向存疑,担忧巨额研发投入无法通过商用覆盖,认为封闭策略后续会被开源模型追上直接失效
用户关注点
- 国内大模型如何突破海外技术封锁、实现弯道超车的自主发展路径
- 强AI的安全风险边界、监管规则走向,以及AI普及带来的就业、消费失衡等社会影响
可复用选题/回应建议
- 补充产出Fable 5下线事件的商业博弈向解读内容,补全之前未覆盖的举报方、上市影响等细节
- 专门产出国内大模型差异化发展机遇的内容,明确发展窗口,消解评论区普遍的悲观情绪
代表性评论
- 用户提到“这次的举报人是亚马逊,也就是他们的股东之一,蛮复杂的。纯从技术层面来分析还是欠全面一些”,补充了事件未提及的商业维度信息,拓展事件分析深度
- 用户提问“他们不允许蒸馏,咱们的前沿模型该怎么搞才能弯道超车?”,精准戳中国内受众最关心的核心产业痛点
基本信息
标签与备注
标签
备注
暂无备注
转录文本
Hello,我刚刚锻炼完,然后跟大家分享一下关于非暴5下线,还有一系列事件背后我的观察。主要想跟大家分享三方面的想法。 首先是关于非暴5和MISOS5这两个模型之间的关系,以及为什么美国政府会下线这样的模型。第二个,就是前沿模型的能力在不断提升之后,接下来我们可能会面临的一些关于政府监管、包括国际竞争之间,各种大模型的能力和监管环境的匹配相关的一些看法。第三个,就是对于普通人来说,我们怎么看待现在的前沿模型的发展。我就分享这三个想法。 首先,MISOS5是一个非常强的模型,大概一个月左右之前开始上线,这个上线也只是面向Glasswing,也就是玻璃之翼的一些联盟企业,才可以使用它的能力。它非常强,在WSE BANCH PRO的一些评测上,它的得分都远超最强的模型Opus 4.8。这样的一个模型,它其实在网络漏洞的识别上非常强悍,也只在这个范围内使用,提供给这些做技术设施支持的相关企业,让他们可以更好地优先把这些漏洞先填补起来。大家其实也比较担心,如果这样的模型一旦落入到少数不法分子的手里,或者一些没安好心的人手里,大家会利用这些模型的漏洞。 去攻击一些我们潜在的软件,或者一些网络,会存在最大的风险。所以大家希望先把这个漏洞先填起来,当然这是美国范围内的。那Vibon 5呢?就是在这样的一个背景下诞生的。怎么诞生呢?就是在MISOS5的基础上增加了一圈的安全防护。所谓的安全防护,就是给到模型一些限制。比如说当有人问它,目前我们能不能发起一个网络漏洞的识别?比如说我们在生物化学的药剂的制造方面,能不能制造出来一些杀伤性武器?甚至比如说像模型的争流方面,有人去问问题的时候,能不能还是给它吐出来很多用户需要的东西?所以其实它增加的限制就是在三方面,用一个分类器在这三方面进行限制。第一个就是在网络漏洞和攻击这个方面去限制模型,去拒答,对吧?然后在生物和化学相关的一些问题上,它也会拒答,甚至是直接路由到OPOS 4.8来去回答。那第三种就是防范其他的模型去争流,它的模型在回答的时候会触发一些限制。所以在这个三重防护的基础上,他们公开了Vibon 5的这个应用,相当于是让大家可以使用这个Vibon 5。Vibon 5上线以来,其实大家也都体会到了它的能力的强悍。有的人是用一句话去生成一个类似于黑雾空一样的中奎这个游戏的一个画面,不是画面。 它是用游戏引擎来渲染出的一个游戏,相当于可以交互的、可以去玩的一个游戏。那这个画面,包括他找到的素材等等,他都是模型自己去找到的。也就是一句话的prompt,就生成了一个可玩的、可交互的游戏,这个还是非常强大的。包括我们在网络上也看到各种人去晒自己用Vibon 5做出来的一些东西,还是能够体会到一个非常大的差异的。有的人描述Vibon 5的进展就像day and night,就说明它是一个质的飞越。然后在上线了一两天之后,美国政府就收到了一些所谓的举报。然后举报什么呢?就说Jailbreak,就是模型的越狱。什么叫模型越狱呢?就是刚才我们讲到,其实它已经套了一层安全防护,就说有一些用户问一些特定的问题的时候,它不会去回答,它拒绝回答,或者它直接路由。但是我们知道模型,它就是靠提示词来去规范、靠提示词来去限制和调动的。那如果有人去通过一些提示词的方法,或者其他的方法,让模型能够绕过原来的限制,我们就说它叫越狱,叫Jailbreak,就是打破了这个监狱的意思。那这个情况下,用户就可以提任何的要求,模型就可以回答。所以Anthropic,它其实在自己的模型发布之前,其实经过了一系列测试,为了保证这个安全性,他们做了哪些工作呢?比如说像红队测试,就是Red Teaming,内部它有红队。 相当于红队可以去攻击这个模型,想尽各种办法去绕过这个系统的限制,这是一类。还有一类就是Bounty,赏金猎人。就像以前互联网软件,它会发布一些赏金,说在什么时间之内,如果你给我找到了软件的漏洞,我就给你提供赏金。他们大概经过了一千个小时的赏金测试,尝试去攻破这个模型的限制。当然在局部上有一些确实绕过了限制,但是Anthropic也是在进一步的调整中,堵上了一些相关的漏洞。这次美国政府它接到的举报,其实也是说,一个case之下,我就可以利用一套方法,来去绕过模型的这些限制,它确实是展现出了Jailbreak的能力。就相当于是可以把它的禁锢解掉,变成Misos5这样强劲的模型。然后这个时候,美国政府觉得是一个巨大的安全风险,所以它就向Anthropic提出要求,让所有的外国人都不能用了,就相当于只有美国国籍的公民,才能去使用这个模型。然后Anthropic他们内部其实也有很多员工,包括Andrey Kapasi等等,他们都是一些持有签证的外国人,加拿大人或者一些其他国家的人,也就是Anthropic内部的员工,都不可以使用这个模型了。在这样一种背景下,Anthropic干脆就把所有的人使用这个模型的权限停掉了,就是大家都别用了,他们采取了这样的一个策略。 当然,我觉得在Ansoopic发布的声明中,我们也看到,其实他们是“不敢行”的。他们就说,我其实已经做了非常严格的防控,但是其实没有任何一个模型,它能够做到100%的防御所有的攻击。但是我能做到的是防止Universal Jailbreak,就是说我肯定能做到的是,不让有人能够完全通过这个限制。它可能是局部攻破,但不可能完全绕过这个系统的限制。所以它其实认为,在前沿模型的发展中,不太可能这个模型就一点问题都没有,一点风险都没有。现在就来到了这样一个节点,就是前沿模型公司和政府之间,其实存在一个Balance,对风险预判和对风险认识的一个差异。那这样一种背景下,其实接下来我们会看到,很多模型可能都会遇到这个情况。因为像Ansoopic,它既然能做出来Favor 5、Measles 5这样的模型,也就意味着其他模型公司也可以做到。因为之前我们说,当一个事情被验证它是可行的时候,后来者去做就会容易很多。所以这种情况下也是一样的,现在前沿模型它的scaling law还没有见顶,它能够做到的,其他模型公司其实也会做到。所以接下来有人说,像GPT 5.5被限制其实也不远了,就包括很多的国产模型,未来也会达到这样的水平。那这样一种背景下,我觉得接下来大家会面临着。 风险和收益之间的评估。 比如说前沿模型的这些能力,稍有不慎,别有用心的人就可以对整个系统造成大规模的破坏。那这样一种情况下,你要怎么防护,对吧?那我要不要让前沿模型面世?那这个情况下,普通人能怎么样去使用这个前沿模型呢? 我觉得可能前两天用上Favor 5的这些人还是挺幸运的,因为可能这个模型接下来能不能被大家更广泛地用起来,我觉得是打问号的。但是接下来可能很多的前沿模型,都不一定能够民用了,就可能要定向使用,或者是在一些更高级的场景下去使用,这是我们面临的一个现实。所以现在大家能用到的一些比较好的模型,就尽早去用,尽快去用,而且也要了解,它其实是加了很多限制的。 我就感觉其实前沿模型,和大家日常在使用的这个模型,已经是两种物种了。就是前沿模型,它其实是代表着非常强的能力,甚至是ASI,不一定是AGI了,就是超级人工智能,只需要一句话,你就可以做很多的事情。所以这样一种背景下,大家不知道怎么看中国的模型自立自强,包括我们自己,可能要更加快前沿模型的研发,这个时间窗口还是非常有限的。 那前沿模型它的智力上限,真的高到一定程度的时候,在效率提升、更高质量的决策制定,还有很多的决策模拟之间,它都可以发挥非常大的作用和价值。所以我觉得这个国产模型,一定要尽快地去跟上来。然后我们普通人 也尽早地去体验各种模型的能力。这是我对Five五这个事件的一些信息收集和观点成熟。我不知道大家怎么想,拜拜。