Day 12 · 思维模型详解

科学方法

2026-05-11 | Scientific Method

MODEL 01

假说-验证

Hypothesis-Testing

中文详解

假说-验证是科学方法的核心循环：先提出一个可测试的假设，再设计实验收集数据，最后根据证据判断假设是被支持还是被推翻。这个循环的价值不在于"证明正确"，而在于通过不断的证伪，逼近真相。其认知价值在于强制将模糊的直觉转化为精确的、可被现实击败的陈述——"我觉得这个产品有市场"不是假说，"在 A 渠道投放后一周内转化率 > 3%"才是假说。

真正非平凡的洞察在于：假说-验证最容易犯的错误不是"验证失败"，而是"验证了错误的假说"。大多数人花大量时间验证"这个方案行不行"，却从未检验更基础的前提——"这个问题是否真的存在"。在商业中，创业者精心验证了产品功能的可行性，却跳过了"用户是否真的有这个痛点"这个更底层的假设。假说-验证的正确顺序是自下而上——先验证最基础、推翻成本最低的假设。

实践方法：①将任何决策拆解为 3-5 个递进假设，按"基础→衍生"排序，从最底层开始验证；②为每个假设提前定义"杀手指标"——一个数字，低于某阈值就放弃，高于就推进，消除事后解释的空间；③养成"预注册"习惯——在实验前写下预期结果，防止事后根据数据"重新解读"（HARKing，即事后假设化）。

经典例子

19 世纪匈牙利医生塞麦尔维斯（Semmelweis）观察到产褥热死亡率在不同病房差异巨大。他提出假说："医生从解剖室直接进产房、手上携带的'尸体微粒'是致命原因。"实验：要求医生在接生前用含氯石灰水洗手。验证：洗手病房的产褥热死亡率从 12% 骤降至 1.3%。这个经典案例完美演示了假说-验证循环——先有可测试的猜想，再用数据说话。

场景 · BigCat

BigCat 考虑用一套 AI 工作流替代团队中某个手动流程。与其直接全面替换，假说-验证的做法是：
假说："AI 工作流可以将这个任务的处理时间缩短 60%，同时不降低质量。"
实验：选取1周的真实任务，双轨并行（人工 vs AI），记录时间和错误率。
验证：对比数据，如果提升不足 30%，则重新检视假说——是工具选择有误，还是任务本身不适合 AI 处理？

English Summary

Hypothesis-Testing is the engine of scientific progress: form a specific, falsifiable prediction, design an experiment, collect data, and update your beliefs accordingly. In business and investment contexts, it translates to disciplined small-scale testing before committing major resources — replacing "I think this will work" with "here's how we'll know if it works."

AI Prompts

中文提示词

我想验证这个商业/技术假设：[你的假设]。请帮我设计一个最小成本的验证实验，包括：(1) 将假设转化为可量化的预测指标，(2) 设计最简洁的测试方案，(3) 定义"通过"和"未通过"的明确标准，(4) 列出最可能导致结果失真的变量。

English Prompt

I need to test this hypothesis: [your hypothesis]. Design the minimum viable experiment: (1) convert the hypothesis into a measurable, specific prediction, (2) outline the simplest possible test, (3) define clear pass/fail criteria in advance, and (4) identify the confounding variables most likely to corrupt the results.

MODEL 02

可证伪性

Falsifiability (Popper's Criterion)

中文详解

哲学家卡尔·波普尔提出，一个理论要具有科学价值，必须是"可证伪的"——即存在某种可能的观察结果能够推翻它。无法被任何证据反驳的理论，不是科学，而是信仰。其核心区分力在于：科学命题是"我目前没有被推翻"（暂时性），伪科学命题是"我不可能被推翻"（永真性）。这也解释了为什么"明天可能涨也可能跌"的市场预测毫无价值——它不可能被任何结果证伪，因此不包含任何真正的预测信息。

真正非平凡的洞察在于：可证伪性不仅是评判科学理论的标准，更是检验个人信念质量的利器。一个人的信念系统中，不可证伪的成分越多，他的认知系统就越"脆弱"——因为它拒绝了一切来自现实的反馈。投资中最危险的叙事都有不可证伪的特征："长期来看一定会涨"——无论跌多久，总可以说"还不够长期"。可证伪性思维要求你在形成信念之前先回答：什么样的证据会让我放弃这个信念？找不到答案，就意味着这个信念已经脱离了理性范畴。

实践方法：①为你持有的每个重要判断写一份"证伪条件清单"——具体、可观察、有时间限制（如"6个月内若 X 未发生，则放弃这个判断"）；②警惕"不可证伪化漂移"——当你发现自己在不断修改判断条件以适应新数据时，你的信念可能已经从科学滑向了信仰；③在评估他人的预测或理论时，第一个问题永远是"什么情况下这个预测会被证明是错的？"——如果对方无法回答，这个预测就没有信息量。

经典例子

哲学家波普尔（Karl Popper）用"所有天鹅都是白色的"来阐释可证伪性：这个命题是科学的，因为只要发现一只黑天鹅就能推翻它。事实上，1697 年欧洲人在澳大利亚发现了黑天鹅，命题被证伪。与之对比，"命运自有安排"无法被任何观察推翻，因此不具备科学价值。可证伪性就是为信念划定"什么证据能推翻它"的边界。

场景 · BigCat

BigCat 对某 AI 芯片公司持长期看涨立场。可证伪性思维要求他明确陈述："如果接下来两个季度中，该公司数据中心业务增速低于25%，且竞争对手市占率提升超过5个百分点，则我的核心论点需要重新评估。"这个声明是可证伪的——它为信念划定了边界，防止"无论发生什么都能自圆其说"的确认偏误陷阱。

English Summary

Falsifiability, proposed by Karl Popper, is the criterion that separates science from pseudoscience: a genuine theory must make predictions that could, in principle, be proven wrong. In investing, strategy, and everyday reasoning, falsifiability forces you to define in advance what evidence would change your mind — preventing the intellectual trap of theories that can explain everything and therefore predict nothing.

AI Prompts

中文提示词

我持有一个观点：[你的观点/投资论点/判断]。请帮我进行可证伪性检验：(1) 将这个观点转化为可测试的预测，(2) 列出3个能推翻这个观点的具体可观察指标，(3) 评估这个观点是否具有真正的预测价值，还是只是事后解释的"叙事"。

English Prompt

I hold this view or thesis: [your view/investment thesis/belief]. Apply Popper's falsifiability test: (1) restate it as a concrete, testable prediction, (2) specify 3 observable outcomes that would force me to abandon or significantly revise this view, and (3) assess whether this belief has genuine predictive power or is merely an unfalsifiable narrative.

MODEL 03

控制变量

Controlled Variables

中文详解

控制变量是实验科学的基础操作：当你想了解 A 对 B 的影响时，必须确保除 A 以外的所有其他因素保持不变，否则你无法区分变化的原因究竟是 A 还是其他因素。这一原则的数学基础是"偏导数"概念——求 A 对 B 的影响，就是在固定所有其他变量后求导。日常决策中这一原则被普遍忽视，因为现实世界的变量总是同时变化的，人类大脑又天然倾向于把"同时发生"等同于"因此发生"。

真正非平凡的洞察在于：控制变量最大的实操困难不是"不知道要控制什么"，而是"不知道自己没控制什么"——即未知的混杂变量。这就是为什么随机对照实验（RCT）被称为因果推断的"金标准"：随机化不需要你知道所有混杂变量，它通过概率保证未知变量在实验组和对照组中均匀分布。在无法做 RCT 的场景（如投资、教育），退而求其次的方法是"自然实验"和"差异中的差异"（DiD）——寻找历史中的准随机事件作为因果推断的基础。

实践方法：①在生活和工作中做改变时，一次只改一个变量，坚持 2-4 周观察效果后再引入下一个变化；②当多个变量同时发生变化时（现实中的常态），至少列出所有你能识别的变量，承认"我无法确定哪个是原因"；③在评估他人的因果主张时，追问"对照组是什么？"——没有对照组的结论，只是轶事，不是证据。

经典例子

1747 年，英国海军军医詹姆斯·林德（James Lind）面对坏血病在船员中肆虐，设计了医学史上最早的对照实验之一。他选取 12 名症状相似的患病船员，分成 6 组，每组 2 人，分别给予柑橘、醋、海水、苹果酒等不同补充物，其余饮食完全相同。结果只有吃柑橘的那组迅速康复。正是因为他控制了其他变量，才能将治愈效果精准归因于柑橘中的营养成分（后来被证实为维生素 C）。

场景 · BigCat

BigCat 观察到孩子在使用某款学习 App 后，数学成绩在一个月内提升了 15 分。如果同期还换了数学老师、减少了游戏时间，又新增了每日练习习惯，那么这 15 分的提升到底是 App 的功劳，还是老师的功劳，还是练习习惯的效果？没有控制变量，这个"实验"只能说明相关性，无法归因。真正的判断需要隔离变量，单独测试。

English Summary

Controlled Variables is the experimental principle of isolating cause from effect: to understand the impact of variable A on outcome B, everything else must be held constant. Without this discipline, we mistake correlation for causation and attribute effects to the wrong causes. In product testing, investing, and parenting — wherever you're trying to learn what actually works — controlling variables is the difference between knowledge and noise.

AI Prompts

中文提示词

我正在分析[某个结果/现象]，希望找出真正的驱动因素。请帮我：(1) 列出所有可能影响这个结果的变量，(2) 设计一个控制变量的实验方案，隔离出关键变量，(3) 指出在我的当前分析中，哪些变量被混淆了，可能导致错误归因。

English Prompt

I'm trying to understand what's driving [outcome/phenomenon]. Help me apply controlled variable thinking: (1) list all variables that could plausibly influence the outcome, (2) design an experiment that isolates the key variable, and (3) identify which confounding variables in my current analysis might be leading me to the wrong causal conclusion.

MODEL 04

假说-验证

可证伪性

控制变量

相关 ≠ 因果