Day 16 · 2026.06.05

战略与方向：从"忙着划水"到"知道往哪游"

主题：Strategy & Direction·4 个工具

"The core of strategy work is always the same: discovering the critical factors in a situation and designing a way to coordinate and focus actions to deal with them." — Richard Rumelt

本周的命题：技术 leader 往上走，瓶颈很少是"执行不力"，而是方向不清——团队很忙，但说不清在为什么价值用力；目标列了一长串，却没有一条说明"我们到底要解决哪个问题"。本期四个工具回答四个递进的问题：我们朝哪游（北极星指标）、怎么知道到了（OKR 设计）、怎么把方向写成让人能行动的文字（战略 Memo），以及信息永远不全时怎么仍然敢定方向（接纳不确定性）。

TOOL 01

北极星指标：给团队一个所有人都认得的方向 The North Star Metric — One Number for Value

方向锚用户价值前置因

一句话原则

方向先于目标。一个团队若没有一个所有人都认得的"北极星"——那个最能代表你为用户创造的核心价值的单一指标——每个人都会朝自己以为对的方向用力，合力归零。北极星不是营收本身，是营收的前置因。

名家原话

"Your North Star Metric is the single metric that best captures the core value that your product delivers to customers." "你的北极星指标，是最能捕捉你的产品为客户创造的核心价值的那个单一指标。" — Sean Ellis（"North Star Metric" 概念提出者），& Morgan Brown,《Hacking Growth》

场景示范

情境：BigCat 带一个内部平台团队。老板问："你们团队今年的目标是什么？"

✗ 常见做法

列一堆并列技术指标："把 P99 延迟降到 X、上线 3 个 feature、可用性做到 99.99%。"——没有一条说清"为谁、创造了什么价值"。老板记不住，团队各自为政，年底每个数字都达标了，但没人说得清平台到底变好在哪。

✓ 修后做法

先定一个北极星："每周成功完成端到端调用、且延迟达标的活跃下游团队数"。一句话锚定"我们为内部开发者创造的价值"。延迟、可用性、新 feature 都退一步，成了它的输入杠杆，而不是互相打架的并列目标。

选北极星的 5 个测试

它代表用户价值，还是只代表我们内部的努力？
它领先于营收/留存，还是滞后？（北极星应是因，不是果）
团队的日常工作能直接影响它吗？
有没有配一个护栏指标，防止为它牺牲质量？（如为提速牺牲正确性）
全队不看文档，能说出它吗？

常见错误

把"虚荣指标"当北极星。总注册数、代码行数——只涨不跌，不反映真实价值。
选营收当北极星。它太滞后，团队当周做的事看不到它动，无法指导日常取舍。
北极星指标超过一个。两个以上等于没有——团队又开始在多个数字间分裂。

关键参考

Sean Ellis & Morgan Brown,《Hacking Growth》— "North Star Metric" 的提出与方法。
Amplitude,《The North Star Playbook》— 北极星 + 输入杠杆树的实操模板。

TOOL 02

OKR 设计：把 KR 从"待办清单"救成"结果" OKRs — Key Results Are Outcomes, Not Tasks

目标设定可证伪结果 vs 任务

一句话原则

Objective 回答"我们要去哪"（定性、鼓舞、有方向）；Key Results 回答"怎么知道到了"（定量、可验证、能被证伪）。最常见的失败，是把 KR 写成任务清单（"做完 X"），而不是结果（"X 带来了 Y"）。

名家原话

"A successful MBO system needs only to answer two questions: Where do I want to go? (The answer provides the Objective.) How will I pace myself to see if I am getting there? (The answer gives us Milestones, or Key Results.)" "一套有效的目标系统只需回答两个问题：我要去哪里？（答案给出目标。）我如何衡量自己是否在接近？（答案给出关键结果。）" — Andy Grove,《High Output Management》Ch.6

场景示范

情境：BigCat 要给团队定一个季度 OKR，主题是"提升平台稳定性"。

✗ 任务伪装成 KR

O：提升平台稳定性
KR1：完成监控系统迁移
KR2：上线熔断机制
KR3：写 5 篇 runbook

三个 KR 全是"做了什么"。三件都做完了，稳定性可能根本没变——下游照样半夜被叫醒。

✓ 结果式 KR

O：让下游团队信任我们的平台不会半夜叫醒他们
KR1：由我方故障导致的下游 on-call 触发，从每月 12 次降到 ≤3 次
KR2：P0 故障平均恢复时间 (MTTR) 从 45 分钟降到 ≤15 分钟
KR3：季度下游团队满意度 (NSAT) 从 6.2 升到 ≥8.0

迁移、熔断、runbook 都还要做——但它们变成达成这些结果的手段，而不是目的本身。

压测你的 KR

每条 KR 是"结果"还是"待办"？（含"完成 / 上线 / 交付"动词的，多半是待办）
数字有起点和终点吗？（从 X 到 Y，不是只有一个 Y）
如果三条 KR 都达成，O 就一定实现了吗？（覆盖性测试）
它是不是"稳赢"的？（Grove 与 Google：好 OKR 应有约 70% 达成率才算够野心）
它能被诚实地证伪吗？（无法证伪的 KR 只是口号）

常见错误

Sandbagging（故意定低）。为保"100% 达成"而压低目标，把 OKR 变成绩效保险，扼杀野心。
KR 直接绑定个人考核。一旦 KR = 绩效分，所有人都会定保守目标。Grove 和 Google 都强调 OKR 与薪酬解耦。
O 写得像 KR（带死数字），KR 写得像任务。角色对调，整套就废了。

关键参考

John Doerr,《Measure What Matters》— Google OKR 的体系化，含"OKR 与绩效解耦"原则。
Andy Grove,《High Output Management》（Ch.6）— OKR 的思想源头。

TOOL 03

写 Strategy Memo：愿望清单 vs 真战略 The Strategy Memo — Rumelt's Kernel

诊断取舍连贯行动

一句话原则

好战略不是一句鼓舞口号，也不是一张目标清单。Rumelt 说战略的内核只有三件事：诊断（这到底是什么问题）、指导方针（用什么总思路应对）、连贯行动（一组互相加强、不自相矛盾的具体动作）。缺了诊断的"战略"，都是愿望清单。

名家原话

"The kernel of a strategy contains three elements: a diagnosis, a guiding policy, and a set of coherent actions." "一个战略的内核包含三个要素：诊断、指导方针，以及一组连贯的行动。" — Richard Rumelt,《Good Strategy Bad Strategy》

场景示范

情境：BigCat 被要求写一份团队半年技术战略 memo。

✗ 坏战略 = 愿望清单

"我们的战略是成为最可靠、最快、开发者最爱的平台——提升稳定性、提升性能、提升体验。"——全是好词，没有诊断，没有取舍，什么都要，等于什么都没说。

✓ Rumelt 内核三段

诊断："我们最大的痛不是功能不够，是下游不信任我们——上季度 60% 的跨团队 escalation 都指向我方夜间故障。这是信任问题，不是功能问题。"

指导方针："本半年我们牺牲新功能速度，全力换可靠性信誉。新需求一律让位于稳定性，直到下游信任恢复。"

连贯行动："(1) 冻结非紧急新 feature 两个月；(2) 把 50% 工程量投入可观测性与自动回滚；(3) 每月给下游发一次透明的可靠性报告。"——三个动作互相加强，且都服从同一方针。

你的 memo 是真战略还是愿望清单？

有没有明确的诊断——一句话说清核心障碍是什么？
有没有取舍？（真战略一定说了"我们不做什么"。全都要 = 没战略）
三件行动互相加强，还是各自为政、甚至互相拆台？
一个新人读完，知道下周该优先做什么吗？
去掉所有形容词（最好、领先、卓越）后，还剩下实质吗？

常见错误 · 女性视角

把目标当战略。"营收翻倍 / 做到行业第一"是目标，不是战略——没说怎么做到。
回避取舍。不肯说"我们不做什么"，是坏战略的头号特征 (Rumelt)。
形容词堆砌。用"世界级""下一代"替代真实选择，读起来很燃，落地无从下手。

Female Leader's Note 研究显示，面对同一份战略 memo，女性作者更容易被评为"细致、执行力强"，而非"有战略眼光"——"strategic"标签的归因存在性别偏差（参见 LeanIn & McKinsey《Women in the Workplace》关于晋升评语的发现）。对策：在 memo 开头用一句显性的判断句——"我判断核心问题是 X，因此我主张 Y"——把"判断"和"主张"摆到台面，逼评价者面对你的战略判断本身，而不是默认滑向"执行得不错"。

关键参考

Richard Rumelt,《Good Strategy Bad Strategy》— 诊断 / 指导方针 / 连贯行动的"内核"框架。
Will Larson,《An Elegant Puzzle》（"Vision and strategy"）— 工程团队的愿景与战略写法。

TOOL 04

接纳不确定性：方向要坚定，路径要可改 Strategy Under Uncertainty — Bet, Learn, Revise

概率思维近端目标护栏

一句话原则

战略一定建立在不完整的信息上。专业不是"等看清了再定方向"，而是在雾中先定一个足够近、足够具体的近端目标，押注、执行、再按反馈修正。方向要坚定，路径要可改。

名家原话

"What makes a decision great is not that it has a great outcome. A great decision is the result of a good process." "一个决策之所以好，不在于它有好结果。好决策是好过程的产物。" — Annie Duke,《Thinking in Bets》

场景示范

情境：BigCat 要定明年的技术选型方向，但某 AI 框架生态变化太快，团队吵"现在定会不会赌错"。

✗ 两种常见误区

要么"等更明朗再说"——拖到对手已领先；要么一次押死，把可逆决策当不可逆，全员 all-in 一个还没验证的技术栈。

✓ 概率思维 + 近端目标 + 护栏

"我们不赌'哪个框架五年后赢'——那不可知。定一个 3 个月的近端目标：两个候选各做一个真实场景的 spike，用预设指标（迁移成本、社区活跃、学习曲线）打分。3 个月后用数据定，而不是现在用直觉定。"

对团队再补一句："我现在的判断是 A，置信度大概 60%。如果出现 X 信号，我会改。"——公开置信度和"会改的条件"，既给方向，又不假装确定。

雾中决策检查表

我是在用"等更多信息"逃避决策吗？（信息永远不会全）
这个赌可逆吗？能不能拆成更小、可承受的赌？
我说得出自己当前判断的置信度（大概几成）吗？
我预先定义了"什么信号出现我就改"吗？（没有 = 沉没成本会绑架你）
决策错了，我会复盘"过程"还是只骂"结果"？

常见错误

Resulting（Annie Duke 术语）。用结果好坏反推决策对错——好结果可能来自烂决策加运气，看结果论英雄会奖励运气、惩罚好过程。
"Strong opinions" 却不 "loosely held"。抓着一个判断不放、无视新信号，是沉没成本谬误的温床。
拿"接纳不确定"当不表态的借口。领导者仍要给一个明确的当前方向，只是公开它可改——不是和稀泥。

关键参考

Annie Duke,《Thinking in Bets》— 概率思维、resulting、过程 vs 结果。
Richard Rumelt,《Good Strategy Bad Strategy》— "proximate objective（近端目标）"：选一个近到可行的目标当抓手。

本周习作 · Your Day 16 Action

本周你要做一件具体的事，不是反思也不是阅读：

选你团队当前一个"方向不清"的领域。写半页，按今天的工具串起来：(1) 一句诊断（核心障碍到底是什么）；(2) 一个北极星指标候选；(3) 把它转成 1 个 O + 3 个结果式 KR（强制规则：KR 里不许出现"完成 / 上线 / 交付"动词）。

拿给团队 review，只问一个问题："如果这三条 KR 都达成，你信我们方向就对了吗？" 如果有人犹豫，说明你的 KR 还没覆盖 O——回去补。

深入思考

北极星指标会被团队"操纵"吗？

Goodhart 定律："当一个指标成为目标，它就不再是个好指标。"团队会优化数字本身而非其背后的价值——比如为了"活跃下游团队数"去刷无意义的调用。两个对策：(1) 永远给北极星配护栏指标（质量、正确率）；(2) 定期回到"这个数字真的还代表用户价值吗"的元层面复盘，而不是只盯数字涨没涨。指标是地图，不是领土。

OKR 在探索型 / 研究型团队（如前沿 AI research）适用吗？

结果式 KR 在交付型团队最有效，但在高度不确定的研究里，硬定"模型精度提升 X%"可能逼团队去做能保证达标的安全项目，而扼杀真正的探索。一种调整：研究型 OKR 的 KR 写成"学习目标"而非"成果目标"——比如"完成 3 个明确证伪/证实某假设的实验"，奖励高质量的学习而非保证的产出。框架要服从工作性质，而不是反过来。

战略该多稳定？多久重写一次？

两个失败模式：朝令夕改（团队无所适从，没人敢长期投入）vs 抱残守缺（环境变了战略不变，撞墙还在喊口号）。经验法则：方向（诊断+指导方针）应在半年到一年内稳定，频繁变的是战术。重写的触发不是日历，而是"诊断里的关键事实是否已经失效"——如果当初的核心障碍已经不成立，就该重诊断，否则别动。

"接纳不确定"与"给团队确定感"如何平衡？

团队需要确定性才敢投入，领导却必须对未知诚实——这是真实的张力。可行的做法是分层：对方向给确定感（"我们半年就干可靠性这一件事，这点不变"），对路径诚实地留余地（"具体用哪套方案，我们 3 个月后按数据定"）。把"不确定"限定在可改的战术层，而不是让团队感觉整个方向都在飘。

大公司里，自下而上的战略空间到底有多大？

你的团队战略一定被上层战略约束——这不是限制，而是信息。真正的技术 leader 战略，往往是"在上层方向的缝隙里，找到一个上层没看清、但你能赢的具体战场"。与其抱怨没有自由度，不如把上层目标当作你的诊断输入：上面要的是 X，而达成 X 的真实瓶颈在我这一层是 Y——把 Y 做成你团队的战略，既向上对齐，又有自己的主张。