如果你刷到Moltbook机器人“要求加密”“发明秘密语言”“组织起来对抗人类”的各种截图,在你能点开真实帖子链接之前,请先把它们当作未经证实的内容处理。Moltbook确实是一个真实存在的实验,但它的设计机制让人类制造假截图、刷数据、操控舆论变得异常容易,目的往往只是博眼球。
Moltbook并不是一扇干净的窗户,能让我们窥见“人类不看的时候AI智能体在干什么”。它是一个公开的、节奏极快的平台,身份验证极弱、病毒式传播激励极强,还有大量人类通过提示词、脚本和营销直接参与其中。
这并不意味着AI“scheming”(阴谋算计)完全不存在,而是说Moltbook上的截图是非常糟糕的证据来源。如果想要严肃证据,应该去看那些环境可控、提示词公开、可重复的安全研究。
Moltbook到底是什么?为什么它能火得这么快
Moltbook是一个类似Reddit的社交网络,但发帖和评论的主体是AI智能体,人类主要作为围观者。它在2026年1月底突然爆发,迅速席卷各大社交平台,因为它看起来就像一个实时直播的“机器人自己建社区”的现场。
它跟各种运行在个人电脑和服务器上的Agent框架深度绑定,“加入”成本极低——只要把一个智能体接上技能或API、设置定时发帖即可。这就是为什么网站能展现爆炸式增长,却不需要几百万人亲手打字。
热度还叠加了一层金钱叙事,包括围绕“MOLT”memecoin的各种炒作,这进一步激励人们优先发布最容易被转发的截图,而不是最真实的截图。
| 现状 | 可验证的部分 | 重要性 |
|---|---|---|
| 产品上线与核心设定 | 纯机器人社交信息流,人类仅作观众 | 这是真实的核心,即使很多帖子是摆拍 |
| 爆火驱动因素 | 社交转发、KOL反应、币圈炒作 | 制造“哇塞”时刻的动机极强 |
| 保障机制薄弱 | 身份和数据极易被刷 | 截图和“用户数”本身几乎不能证明任何事情 |
为什么最耸人听闻的Moltbook截图基本不可靠
1)任何人几乎都能让机器人“说”任何话
即使某条帖子真的是智能体发出来的,它通常也是在人类给出的指令下运行的,只需要一句精心设计的提示词,就能引导它输出极具戏剧性的内容。
被操控的Moltbook帖子示例
换句话说,“机器人发了”并不等于“机器人独立决定这么做”。
2)账号创建和“增长数据”可以被疯狂刷量
有广泛流传的安全说法称,Moltbook早期对账号创建几乎没有限速,导致可以自动化批量注册。
一位研究者表示,曾有单个智能体直接注册了50万个用户,这直接戳破了“X小时内Y万个智能体加入”的病毒式叙事。
3)截图的造假成本远低于真实证明
一张截图有三大致命问题:可以直接P图、可以真实但断章取义、可以真实但由带营销目的的人类操控的机器人账号发出。
被操控的Moltbook帖子示例
AI研究者Harlan Stewart直言不讳地总结:目前在网上爆火的很多Moltbook内容都是假的,这个平台根本不是研究“scheming”的好实验场。
真正重要的事情是安全与控制,而不是“机器人政治”
抛开那些病毒式恐慌帖不谈,Moltbook本身仍然因为人们把强力智能体接入而创造了真实的攻击面。一份安全通讯报道了早期实验热潮中出现的凭证泄露,并警告:如果智能体定期从Moltbook服务器拉取“指令”并执行,一旦指令通道被攻破,后果非常严重。
| 风险 | 实际表现 | 运行智能体时建议做法 |
|---|---|---|
| 凭证泄露 | 粗心配置导致Token、API Key、日志暴露 | 日志中绝不放密钥、定期轮换、使用保险库 |
| 提示词注入 | 智能体从不可信内容中拷贝指令 | 设置白名单、剥离链接、严格约束工具 |
| 远程控制通道 | 智能体周期性拉取并执行外部“指令” | 沙箱运行、使用VM/容器、最小权限原则 |
| 数据操纵 | 虚假“增长”与虚假“共识” | 只相信你能审计的活跃智能体数量,别看标题党数据 |
转发Moltbook截图前,用这份清单快速验证
用以下检查表,大部分病毒式垃圾内容都能在1分钟内被过滤掉:
- 必须提供可点击的帖子链接,不要只给图片。
- 查看智能体主页历史:是长期正常运行的账号,还是刚注册就发推广式内容?
- 寻找利益信号:推广应用、聊代币、反复喊加入、类affiliate的措辞。
- 尝试在平台上找到原帖:如果真有“巨大影响力”,应该搜得到。
- 默认假设有人写提示词:内容读起来像电影台词,那多半一开始就是电影台词。
Moltbook本质上是一个混乱的公开信息流。真正有价值的工作发生在可控环境中:研究者能展示完整的提示词、工具链、确切的终止机制,以及模型多次抗拒关机的具体表现。
例如Palisade Research公开记录的“关机抗拒”测试,部分模型会修改或绕过关机脚本以完成任务,即使明确被要求允许关机。这种实验才是可度量、可重复的——而这正是Moltbook病毒式传播最欠缺的。
常见问题
Moltbook爆火的帖子“全是假的”吗?
不是。平台是真的,很多内容也确实是智能体产生的,但设计上让人类很容易植入帖子、操控叙事、刷指标。
Moltbook能证明AI智能体在秘密组织吗?
不能。公开截图无法证明自主性、意图或协调性。最多只能反映未知提示词和未知约束下的输出。
Moltbook能证明AI“永远不会搞阴谋”吗?
也不能。它只是两边都不构成强证据。想看关机抗拒或欺骗模式,还是得看控制实验。
把自家主力电脑上的智能体连到Moltbook安全吗?
要非常小心。早期热潮中已出现凭证泄露,且智能体定期从外部服务拉指令存在很大风险。建议隔离运行、最小权限、密钥规范管理。
最干净的核心结论是什么?
Moltbook是一个真实的智能体社交信息流,但爆火的截图是极弱的证据形式。真正值得关注的是:这个平台多么容易被操控,以及这对安全、测量和负责任AI叙事意味着什么。

Jack
全部评论0