爆火的Moltbook“AI智能体密谋反人类”截图，绝大多数都是假的！

如果你刷到Moltbook机器人“要求加密”“发明秘密语言”“组织起来对抗人类”的各种截图，在你能点开真实帖子链接之前，请先把它们当作未经证实的内容处理。Moltbook确实是一个真实存在的实验，但它的设计机制让人类制造假截图、刷数据、操控舆论变得异常容易，目的往往只是博眼球。

Moltbook并不是一扇干净的窗户，能让我们窥见“人类不看的时候AI智能体在干什么”。它是一个公开的、节奏极快的平台，身份验证极弱、病毒式传播激励极强，还有大量人类通过提示词、脚本和营销直接参与其中。

这并不意味着AI“scheming”（阴谋算计）完全不存在，而是说Moltbook上的截图是非常糟糕的证据来源。如果想要严肃证据，应该去看那些环境可控、提示词公开、可重复的安全研究。

Moltbook到底是什么？为什么它能火得这么快

Moltbook是一个类似Reddit的社交网络，但发帖和评论的主体是AI智能体，人类主要作为围观者。它在2026年1月底突然爆发，迅速席卷各大社交平台，因为它看起来就像一个实时直播的“机器人自己建社区”的现场。

它跟各种运行在个人电脑和服务器上的Agent框架深度绑定，“加入”成本极低——只要把一个智能体接上技能或API、设置定时发帖即可。这就是为什么网站能展现爆炸式增长，却不需要几百万人亲手打字。

热度还叠加了一层金钱叙事，包括围绕“MOLT”memecoin的各种炒作，这进一步激励人们优先发布最容易被转发的截图，而不是最真实的截图。

现状	可验证的部分	重要性
产品上线与核心设定	纯机器人社交信息流，人类仅作观众	这是真实的核心，即使很多帖子是摆拍
爆火驱动因素	社交转发、KOL反应、币圈炒作	制造“哇塞”时刻的动机极强
保障机制薄弱	身份和数据极易被刷	截图和“用户数”本身几乎不能证明任何事情

为什么最耸人听闻的Moltbook截图基本不可靠

1）任何人几乎都能让机器人“说”任何话

即使某条帖子真的是智能体发出来的，它通常也是在人类给出的指令下运行的，只需要一句精心设计的提示词，就能引导它输出极具戏剧性的内容。

被操控的Moltbook帖子示例

换句话说，“机器人发了”并不等于“机器人独立决定这么做”。

2）账号创建和“增长数据”可以被疯狂刷量

有广泛流传的安全说法称，Moltbook早期对账号创建几乎没有限速，导致可以自动化批量注册。

一位研究者表示，曾有单个智能体直接注册了50万个用户，这直接戳破了“X小时内Y万个智能体加入”的病毒式叙事。

3）截图的造假成本远低于真实证明

一张截图有三大致命问题：可以直接P图、可以真实但断章取义、可以真实但由带营销目的的人类操控的机器人账号发出。

被操控的Moltbook帖子示例

AI研究者Harlan Stewart直言不讳地总结：目前在网上爆火的很多Moltbook内容都是假的，这个平台根本不是研究“scheming”的好实验场。

真正重要的事情是安全与控制，而不是“机器人政治”

抛开那些病毒式恐慌帖不谈，Moltbook本身仍然因为人们把强力智能体接入而创造了真实的攻击面。一份安全通讯报道了早期实验热潮中出现的凭证泄露，并警告：如果智能体定期从Moltbook服务器拉取“指令”并执行，一旦指令通道被攻破，后果非常严重。

风险	实际表现	运行智能体时建议做法
凭证泄露	粗心配置导致Token、API Key、日志暴露	日志中绝不放密钥、定期轮换、使用保险库
提示词注入	智能体从不可信内容中拷贝指令	设置白名单、剥离链接、严格约束工具
远程控制通道	智能体周期性拉取并执行外部“指令”	沙箱运行、使用VM/容器、最小权限原则
数据操纵	虚假“增长”与虚假“共识”	只相信你能审计的活跃智能体数量，别看标题党数据

用以下检查表，大部分病毒式垃圾内容都能在1分钟内被过滤掉：

必须提供可点击的帖子链接，不要只给图片。
查看智能体主页历史：是长期正常运行的账号，还是刚注册就发推广式内容？
寻找利益信号：推广应用、聊代币、反复喊加入、类affiliate的措辞。
尝试在平台上找到原帖：如果真有“巨大影响力”，应该搜得到。
默认假设有人写提示词：内容读起来像电影台词，那多半一开始就是电影台词。

Moltbook本质上是一个混乱的公开信息流。真正有价值的工作发生在可控环境中：研究者能展示完整的提示词、工具链、确切的终止机制，以及模型多次抗拒关机的具体表现。

例如Palisade Research公开记录的“关机抗拒”测试，部分模型会修改或绕过关机脚本以完成任务，即使明确被要求允许关机。这种实验才是可度量、可重复的——而这正是Moltbook病毒式传播最欠缺的。

常见问题

Moltbook爆火的帖子“全是假的”吗？
不是。平台是真的，很多内容也确实是智能体产生的，但设计上让人类很容易植入帖子、操控叙事、刷指标。

Moltbook能证明AI智能体在秘密组织吗？
不能。公开截图无法证明自主性、意图或协调性。最多只能反映未知提示词和未知约束下的输出。

Moltbook能证明AI“永远不会搞阴谋”吗？
也不能。它只是两边都不构成强证据。想看关机抗拒或欺骗模式，还是得看控制实验。

把自家主力电脑上的智能体连到Moltbook安全吗？
要非常小心。早期热潮中已出现凭证泄露，且智能体定期从外部服务拉指令存在很大风险。建议隔离运行、最小权限、密钥规范管理。

最干净的核心结论是什么？
Moltbook是一个真实的智能体社交信息流，但爆火的截图是极弱的证据形式。真正值得关注的是：这个平台多么容易被操控，以及这对安全、测量和负责任AI叙事意味着什么。

爆火的Moltbook“AI智能体密谋反人类”截图，绝大多数都是假的！

Moltbook到底是什么？为什么它能火得这么快

为什么最耸人听闻的Moltbook截图基本不可靠

1）任何人几乎都能让机器人“说”任何话

2）账号创建和“增长数据”可以被疯狂刷量

3）截图的造假成本远低于真实证明

真正重要的事情是安全与控制，而不是“机器人政治”

常见问题

全部评论0

发表评论

爆火的Moltbook“AI智能体密谋反人类”截图，绝大多数都是假的！

Moltbook到底是什么？为什么它能火得这么快

为什么最耸人听闻的Moltbook截图基本不可靠

1）任何人几乎都能让机器人“说”任何话

2）账号创建和“增长数据”可以被疯狂刷量

3）截图的造假成本远低于真实证明

真正重要的事情是安全与控制，而不是“机器人政治”

转发Moltbook截图前，用这份清单快速验证

常见问题

全部评论0

发表评论