《失控》
很多秩序不是被设计出来的,而是在足够多的连接里长出来的。
www.sharkloud.online / 2026 / personal notes
这里不是知识库,也不想装成答案机器。它更像一张摊开的书桌:读书、电影、AI、人机协作和运动记录,各放一格,慢慢留下我自己的判断。
颜色不是为了显得很努力,只是提醒自己:那些零散的输入,最后会不会真的变成判断。
这组书先不急着写观点。它们更像一排坐标:系统、反馈、事实、媒介、怀疑、叙事和实践。每次翻回来,都是为了校准自己看问题的方式。
很多秩序不是被设计出来的,而是在足够多的连接里长出来的。
机器负责重复,人负责判断;协作的质量,取决于反馈的质量。
真正改变系统的,往往不是更用力,而是找到更深的杠杆点。
很多判断不是错在逻辑,而是错在看世界的底图已经过期。
新的媒介不只是传递内容,它会重新塑造人的注意力和关系。
有些系统不是避免波动,而是从波动里获得力量。
好的管理不是控制每个细节,而是在混乱里守住方向。
故事反复出现,是因为人的困境总有相似的结构。
真正的思考,从愿意怀疑自己已经相信的东西开始。
判断不能离开现场,方法不能离开具体问题。
“真正改变系统的,往往不是更用力,而是找到更深的杠杆点。”摘记 / 《系统之美》
我喜欢的科幻片,最后都不是在讲机器。它们讲时间、记忆、自由意志、陪伴和人怎么证明自己还在选择。
我最喜欢它的一点,是技术没有变成神。越靠近宇宙,越回到人的选择。
“Mankind was born on Earth.”“It was never meant to die here.”如果现实可以被设计,自由意志就不再是抽象词,而是每天醒来后的第一道选择题。
“There is no spoon.”“I know kung fu.”AI 最先扰动的可能不是工作,而是陪伴。人被理解的时候,也会暴露出自己的孤独。
“I'm yours, and I'm not yours.”“The heart's not like a box.”测试从来不是单向的。你以为你在观察机器,机器也在观察你。
“Isn't it strange?”“You shouldn't trust him.”一个人的记忆如果可以被制造,那真实就不只关乎来源,也关乎它怎样改变行动。
“All the best memories are hers.”“Dying for the right cause.”语言不是工具那么简单。它会改变时间感,也会改变人承受命运的方式。
“Language is the foundation of civilization.”“If you could see your whole life...”台词只保留短句作为索引,方便回忆电影本身;长段对白仍建议回到影片观看。
这部分和读书、电影不一样。它适合写成长文:AIQ、企业落地、人机协作、意识争论、Agent 工作流,都不能只靠一句摘要讲清楚。
我越来越觉得,AIQ 不是“知道多少工具”,也不是“提示词写得多漂亮”。它更接近一种把问题、工具、反馈和责任重新放到一起的能力。
早期大家谈 AI 能力,常常停在两个层面:会不会提问,会不会让模型输出一段看起来能用的东西。这个阶段当然重要,但它太浅了。真正进入工作以后,问题很快会变成:我该把哪一段交给 AI?哪一段必须自己判断?AI 给出的东西,应该用什么标准验收?错了以后,责任算谁的?
秦昕、Jackson G. Lu 等人的 AIQ 研究,把它定义成“使用 AI 完成多种任务的能力”;Forrester 也把 AIQ 放到员工和组织的 AI 准备度里看。我更愿意把这两条线合在一起理解:AIQ 既是个人能力,也是组织有没有把 AI 安排进正确位置的能力。
这也是我理解 AIQ 的起点。它不是智商的 AI 版本,而是一组工作能力:把模糊任务拆开,把合适的工具接进去,把反馈做成闭环,把风险留在可见的位置。一个人 AIQ 高,不是因为他让 AI 写得更快,而是因为他知道什么时候应该慢下来。
第一处是场景。很多企业说要上 AI,其实还没说清楚要改变哪一个流程。于是 AI 被放成一个“万能入口”,看起来谁都能用,最后谁也不知道它真正帮到了哪里。
第二处是上下文。模型很强,但企业里的工作不是孤立文本。它需要权限、历史记录、客户状态、审批关系和业务规则。如果这些东西不被整理,AI 只能在外面猜。猜得越流畅,越危险。
第三处是评价。人类同事做错了,可以复盘;AI 做错了,很多团队只会说“模型不行”。这太粗糙了。到底是输入错了、工具错了、流程错了,还是人没有做最终判断?如果没有评价体系,AI 只会变成一层漂亮的烟雾。
所以我现在更愿意把 AIQ 看成一种组织能力。个人要学会和 AI 协作,企业更要学会给 AI 安位置。位置不清楚,能力越强,混乱越大。
我更担心一种表面安全的流程:每一步都写着“人工确认”,但人其实没有时间、没有信息,也没有动机去认真确认。
“Human in the loop”听起来很安心。可真实工作里,如果人只是最后点一下同意,那就不是回路,而是橡皮章。更糟的是,出了问题以后,系统还可以说:你看,人类确认过了。
我觉得有效的人机协作至少要满足三件事。第一,人要在关键节点,而不是所有节点。每一步都让人确认,会把人训练成忽略按钮的人。第二,人要拿到足够的上下文。没有来源、没有置信度、没有改动记录,所谓确认只是在赌。第三,人要有推翻 AI 的权力,而且推翻不应该被流程惩罚。
协作不是把工作平均分给人和机器。更像是重新安排节奏:机器适合批量生成、搜索、整理、模拟;人适合判断目标、识别异常、处理关系和承担后果。分工越清楚,协作越舒服。
这也是为什么我不喜欢把 AI 叫成“员工”。员工有责任,有关系,有成长,也有拒绝。AI 更像一种会说话的生产力层。它可以进入流程,但不能替代流程的主人。
真正的人机协作,应该让人更像人,而不是让人被迫像机器那样审核机器。
“它像不像人”不是一个足够好的问题。因为人太容易被语言骗到,也太容易把熟悉的情绪投射到一个会回应的系统里。
当 AI 能安慰人、反驳人、开玩笑,甚至记住你的偏好时,人很自然会问:它是不是有意识?这个问题迷人,也危险。迷人是因为它碰到了人的边界;危险是因为我们常常用“像”来偷换“是”。
我更愿意把问题拆开。它有没有持续的自我模型?有没有自己的目标?有没有感受痛苦和快乐的主体经验?它的记忆是为了服务对话,还是为了形成连续的自我?这些问题都比“它说话像不像人”更难,也更诚实。
在没有更强证据之前,我不会轻易说 AI 有意识。但我也不想用一句“只是统计”把所有问题打发掉。因为即便 AI 没有意识,人也会和它建立真实关系;即便它没有感受,它也会影响人的感受。
所以我现在关心的不是给 AI 发身份证,而是先把人的责任放稳:哪些场景不能伪装成陪伴,哪些判断不能交给一个没有后果感的系统,哪些关系不该被商业产品偷偷接管。
意识问题也许暂时没有答案。但人在面对一个越来越像人的系统时,必须先学会不那么容易被骗。
如果模型是发动机,那 Agent 需要的就不是更大的发动机,而是一座能运行的城市。
这段时间我看很多 AI 工具,最明显的感受是:大家太喜欢谈模型,太少谈环境。一个 Agent 真正进入工作流以后,它需要知道自己能去哪里、能碰什么数据、能调用哪些工具、失败以后怎么回滚、重要动作由谁批准。
所以我会把 MoltHub 这类东西理解成“Agent 城市”。城市里有道路,对应工具调用;有门禁,对应权限;有红绿灯,对应审批;有监控和日志,对应可追溯;有消防系统,对应失败回滚。没有这些,Agent 越聪明越像一辆没有刹车的车。
企业 AI 应用的卡点,往往不是模型答不出来,而是它不知道能不能答、该不该答、答完以后谁负责。这个问题不靠提示词解决,要靠系统设计解决。
我喜欢“城市”这个比喻,是因为它提醒我:好的 AI 工作流不是把人赶出去,而是让不同角色各走各的路。机器负责跑腿,人负责定方向;机器负责提醒,人负责决定;机器负责记录,人负责解释。
当 Agent 真正进入工作,最重要的不是让它像人,而是让它在一个人能理解、能接管、能追责的环境里工作。
健康板块不写成鸡血打卡。它更像一个身体日志:哪些运动做得多,哪天身体状态好,哪项技术卡住了,慢慢看出规律。
| 日期 | 运动 | 次数/时长 | 一句记录 |
|---|---|---|---|
| 06/22 | 🎾 网球 + 🧘 拉伸 | 2 项 | 正手击球点偏晚,重点改提前引拍。 |
| 06/19 | 🏸 羽毛球 | 80 分钟 | 后场步伐慢半拍,先练启动和回中。 |
| 06/17 | 🏊 游泳 | 1200 米 | 放松日,呼吸比速度更重要。 |
| 06/14 | 🏋️ 力量 | 上肢 + 核心 | 肩胛稳定比重量更优先。 |
| 06/12 | 🎾 网球 | 90 分钟 | 读了一点网球技术书,重新看正手随挥。 |
| 06/09 | 🧘 瑜伽 | 45 分钟 | 髋部打开后,腰背紧张感下降。 |