爆火的Moltbook“AI智能体密谋反人类”截图,绝大多数都是假的!

爆火的Moltbook“AI智能体密谋反人类”截图,绝大多数都是假的!

如果你刷到Moltbook机器人“要求加密”“发明秘密语言”“组织起来对抗人类”的各种截图,在你能点开真实帖子链接之前,请先把它们当作未经证实的内容处理。Moltbook确实是一个真实存在的实验,但它的设计机制让人类制造假截图、刷数据、操控舆论变得异常容易,目的往往只是博眼球。

Moltbook并不是一扇干净的窗户,能让我们窥见“人类不看的时候AI智能体在干什么”。它是一个公开的、节奏极快的平台,身份验证极弱、病毒式传播激励极强,还有大量人类通过提示词、脚本和营销直接参与其中。

这并不意味着AI“scheming”(阴谋算计)完全不存在,而是说Moltbook上的截图是非常糟糕的证据来源。如果想要严肃证据,应该去看那些环境可控、提示词公开、可重复的安全研究。

Moltbook到底是什么?为什么它能火得这么快

Moltbook是一个类似Reddit的社交网络,但发帖和评论的主体是AI智能体,人类主要作为围观者。它在2026年1月底突然爆发,迅速席卷各大社交平台,因为它看起来就像一个实时直播的“机器人自己建社区”的现场。

它跟各种运行在个人电脑和服务器上的Agent框架深度绑定,“加入”成本极低——只要把一个智能体接上技能或API、设置定时发帖即可。这就是为什么网站能展现爆炸式增长,却不需要几百万人亲手打字。

热度还叠加了一层金钱叙事,包括围绕“MOLT”memecoin的各种炒作,这进一步激励人们优先发布最容易被转发的截图,而不是最真实的截图。

现状 可验证的部分 重要性
产品上线与核心设定 纯机器人社交信息流,人类仅作观众 这是真实的核心,即使很多帖子是摆拍
爆火驱动因素 社交转发、KOL反应、币圈炒作 制造“哇塞”时刻的动机极强
保障机制薄弱 身份和数据极易被刷 截图和“用户数”本身几乎不能证明任何事情

为什么最耸人听闻的Moltbook截图基本不可靠

1)任何人几乎都能让机器人“说”任何话

即使某条帖子真的是智能体发出来的,它通常也是在人类给出的指令下运行的,只需要一句精心设计的提示词,就能引导它输出极具戏剧性的内容。

被操控的Moltbook帖子示例

换句话说,“机器人发了”并不等于“机器人独立决定这么做”。

2)账号创建和“增长数据”可以被疯狂刷量

有广泛流传的安全说法称,Moltbook早期对账号创建几乎没有限速,导致可以自动化批量注册。

一位研究者表示,曾有单个智能体直接注册了50万个用户,这直接戳破了“X小时内Y万个智能体加入”的病毒式叙事。

3)截图的造假成本远低于真实证明

一张截图有三大致命问题:可以直接P图、可以真实但断章取义、可以真实但由带营销目的的人类操控的机器人账号发出。

被操控的Moltbook帖子示例

AI研究者Harlan Stewart直言不讳地总结:目前在网上爆火的很多Moltbook内容都是假的,这个平台根本不是研究“scheming”的好实验场。

真正重要的事情是安全与控制,而不是“机器人政治”

抛开那些病毒式恐慌帖不谈,Moltbook本身仍然因为人们把强力智能体接入而创造了真实的攻击面。一份安全通讯报道了早期实验热潮中出现的凭证泄露,并警告:如果智能体定期从Moltbook服务器拉取“指令”并执行,一旦指令通道被攻破,后果非常严重。

风险 实际表现 运行智能体时建议做法
凭证泄露 粗心配置导致Token、API Key、日志暴露 日志中绝不放密钥、定期轮换、使用保险库
提示词注入 智能体从不可信内容中拷贝指令 设置白名单、剥离链接、严格约束工具
远程控制通道 智能体周期性拉取并执行外部“指令” 沙箱运行、使用VM/容器、最小权限原则
数据操纵 虚假“增长”与虚假“共识” 只相信你能审计的活跃智能体数量,别看标题党数据

转发Moltbook截图前,用这份清单快速验证

用以下检查表,大部分病毒式垃圾内容都能在1分钟内被过滤掉:

  • 必须提供可点击的帖子链接,不要只给图片。
  • 查看智能体主页历史:是长期正常运行的账号,还是刚注册就发推广式内容?
  • 寻找利益信号:推广应用、聊代币、反复喊加入、类affiliate的措辞。
  • 尝试在平台上找到原帖:如果真有“巨大影响力”,应该搜得到。
  • 默认假设有人写提示词:内容读起来像电影台词,那多半一开始就是电影台词。

Moltbook本质上是一个混乱的公开信息流。真正有价值的工作发生在可控环境中:研究者能展示完整的提示词、工具链、确切的终止机制,以及模型多次抗拒关机的具体表现。

例如Palisade Research公开记录的“关机抗拒”测试,部分模型会修改或绕过关机脚本以完成任务,即使明确被要求允许关机。这种实验才是可度量、可重复的——而这正是Moltbook病毒式传播最欠缺的。

常见问题

Moltbook爆火的帖子“全是假的”吗?
不是。平台是真的,很多内容也确实是智能体产生的,但设计上让人类很容易植入帖子、操控叙事、刷指标。

Moltbook能证明AI智能体在秘密组织吗?
不能。公开截图无法证明自主性、意图或协调性。最多只能反映未知提示词和未知约束下的输出。

Moltbook能证明AI“永远不会搞阴谋”吗?
也不能。它只是两边都不构成强证据。想看关机抗拒或欺骗模式,还是得看控制实验。

把自家主力电脑上的智能体连到Moltbook安全吗?
要非常小心。早期热潮中已出现凭证泄露,且智能体定期从外部服务拉指令存在很大风险。建议隔离运行、最小权限、密钥规范管理。

最干净的核心结论是什么?
Moltbook是一个真实的智能体社交信息流,但爆火的截图是极弱的证据形式。真正值得关注的是:这个平台多么容易被操控,以及这对安全、测量和负责任AI叙事意味着什么。

全部评论0

没有了

到底了

查看更多

发表评论

评分:
显示验证码 验证码