Day 16 · 2026.06.05

战略与方向:从"忙着划水"到"知道往哪游"

主题:Strategy & Direction·4 个工具
"The core of strategy work is always the same: discovering the critical factors in a situation and designing a way to coordinate and focus actions to deal with them." — Richard Rumelt
本周的命题:技术 leader 往上走,瓶颈很少是"执行不力",而是方向不清——团队很忙,但说不清在为什么价值用力;目标列了一长串,却没有一条说明"我们到底要解决哪个问题"。本期四个工具回答四个递进的问题:我们朝哪游(北极星指标)、怎么知道到了(OKR 设计)、怎么把方向写成让人能行动的文字(战略 Memo),以及信息永远不全时怎么仍然敢定方向(接纳不确定性)。
TOOL 01

北极星指标:给团队一个所有人都认得的方向 The North Star Metric — One Number for Value

方向锚用户价值前置因
方向先于目标。一个团队若没有一个所有人都认得的"北极星"——那个最能代表你为用户创造的核心价值的单一指标——每个人都会朝自己以为对的方向用力,合力归零。北极星不是营收本身,是营收的前置因
"Your North Star Metric is the single metric that best captures the core value that your product delivers to customers." "你的北极星指标,是最能捕捉你的产品为客户创造的核心价值的那个单一指标。" — Sean Ellis("North Star Metric" 概念提出者),& Morgan Brown,《Hacking Growth》
情境:BigCat 带一个内部平台团队。老板问:"你们团队今年的目标是什么?"
✗ 常见做法

列一堆并列技术指标:"把 P99 延迟降到 X、上线 3 个 feature、可用性做到 99.99%。"——没有一条说清"为谁、创造了什么价值"。老板记不住,团队各自为政,年底每个数字都达标了,但没人说得清平台到底变好在哪。

✓ 修后做法

先定一个北极星:"每周成功完成端到端调用、且延迟达标的活跃下游团队数"。一句话锚定"我们为内部开发者创造的价值"。延迟、可用性、新 feature 都退一步,成了它的输入杠杆,而不是互相打架的并列目标。

★ 北极星指标 每周延迟达标的活跃下游团队数 输入杠杆 · 速度 P99 延迟达标率 输入杠杆 · 可靠 月故障触发次数 输入杠杆 · 易用 新接入耗时 护栏指标 · 别为提速牺牲 调用正确率不得下降
  • 它代表用户价值,还是只代表我们内部的努力?
  • 领先于营收/留存,还是滞后?(北极星应是因,不是果)
  • 团队的日常工作能直接影响它吗?
  • 有没有配一个护栏指标,防止为它牺牲质量?(如为提速牺牲正确性)
  • 全队不看文档,能说出它吗?
  • 把"虚荣指标"当北极星。总注册数、代码行数——只涨不跌,不反映真实价值。
  • 选营收当北极星。它太滞后,团队当周做的事看不到它动,无法指导日常取舍。
  • 北极星指标超过一个。两个以上等于没有——团队又开始在多个数字间分裂。
Sean Ellis & Morgan Brown,《Hacking Growth》— "North Star Metric" 的提出与方法。
Amplitude,《The North Star Playbook》— 北极星 + 输入杠杆树的实操模板。
TOOL 02

OKR 设计:把 KR 从"待办清单"救成"结果" OKRs — Key Results Are Outcomes, Not Tasks

目标设定可证伪结果 vs 任务
Objective 回答"我们要去哪"(定性、鼓舞、有方向);Key Results 回答"怎么知道到了"(定量、可验证、能被证伪)。最常见的失败,是把 KR 写成任务清单("做完 X"),而不是结果("X 带来了 Y")。
"A successful MBO system needs only to answer two questions: Where do I want to go? (The answer provides the Objective.) How will I pace myself to see if I am getting there? (The answer gives us Milestones, or Key Results.)" "一套有效的目标系统只需回答两个问题:我要去哪里?(答案给出目标。)我如何衡量自己是否在接近?(答案给出关键结果。)" — Andy Grove,《High Output Management》Ch.6
情境:BigCat 要给团队定一个季度 OKR,主题是"提升平台稳定性"。
✗ 任务伪装成 KR

O:提升平台稳定性
KR1:完成监控系统迁移
KR2:上线熔断机制
KR3:写 5 篇 runbook

三个 KR 全是"做了什么"。三件都做完了,稳定性可能根本没变——下游照样半夜被叫醒。

✓ 结果式 KR

O:让下游团队信任我们的平台不会半夜叫醒他们
KR1:由我方故障导致的下游 on-call 触发,从每月 12 次降到 ≤3 次
KR2:P0 故障平均恢复时间 (MTTR) 从 45 分钟降到 ≤15 分钟
KR3:季度下游团队满意度 (NSAT) 从 6.2 升到 ≥8.0

迁移、熔断、runbook 都还要做——但它们变成达成这些结果的手段,而不是目的本身。

  • 每条 KR 是"结果"还是"待办"?(含"完成 / 上线 / 交付"动词的,多半是待办)
  • 数字有起点和终点吗?(从 X 到 Y,不是只有一个 Y)
  • 如果三条 KR 都达成,O 就一定实现了吗?(覆盖性测试)
  • 它是不是"稳赢"的?(Grove 与 Google:好 OKR 应有约 70% 达成率才算够野心)
  • 它能被诚实地证伪吗?(无法证伪的 KR 只是口号)
  • Sandbagging(故意定低)。为保"100% 达成"而压低目标,把 OKR 变成绩效保险,扼杀野心。
  • KR 直接绑定个人考核。一旦 KR = 绩效分,所有人都会定保守目标。Grove 和 Google 都强调 OKR 与薪酬解耦
  • O 写得像 KR(带死数字),KR 写得像任务。角色对调,整套就废了。
John Doerr,《Measure What Matters》— Google OKR 的体系化,含"OKR 与绩效解耦"原则。
Andy Grove,《High Output Management》(Ch.6)— OKR 的思想源头。
TOOL 03

写 Strategy Memo:愿望清单 vs 真战略 The Strategy Memo — Rumelt's Kernel

诊断取舍连贯行动
好战略不是一句鼓舞口号,也不是一张目标清单。Rumelt 说战略的内核只有三件事:诊断(这到底是什么问题)、指导方针(用什么总思路应对)、连贯行动(一组互相加强、不自相矛盾的具体动作)。缺了诊断的"战略",都是愿望清单。
"The kernel of a strategy contains three elements: a diagnosis, a guiding policy, and a set of coherent actions." "一个战略的内核包含三个要素:诊断、指导方针,以及一组连贯的行动。" — Richard Rumelt,《Good Strategy Bad Strategy》
情境:BigCat 被要求写一份团队半年技术战略 memo。
✗ 坏战略 = 愿望清单

"我们的战略是成为最可靠、最快、开发者最爱的平台——提升稳定性、提升性能、提升体验。"——全是好词,没有诊断,没有取舍,什么都要,等于什么都没说。

✓ Rumelt 内核三段

诊断:"我们最大的痛不是功能不够,是下游不信任我们——上季度 60% 的跨团队 escalation 都指向我方夜间故障。这是信任问题,不是功能问题。"

指导方针:"本半年我们牺牲新功能速度,全力换可靠性信誉。新需求一律让位于稳定性,直到下游信任恢复。"

连贯行动:"(1) 冻结非紧急新 feature 两个月;(2) 把 50% 工程量投入可观测性与自动回滚;(3) 每月给下游发一次透明的可靠性报告。"——三个动作互相加强,且都服从同一方针。

  • 有没有明确的诊断——一句话说清核心障碍是什么?
  • 有没有取舍?(真战略一定说了"我们不做什么"。全都要 = 没战略)
  • 三件行动互相加强,还是各自为政、甚至互相拆台?
  • 一个新人读完,知道下周该优先做什么吗?
  • 去掉所有形容词(最好、领先、卓越)后,还剩下实质吗?
  • 把目标当战略。"营收翻倍 / 做到行业第一"是目标,不是战略——没说怎么做到。
  • 回避取舍。不肯说"我们不做什么",是坏战略的头号特征 (Rumelt)。
  • 形容词堆砌。用"世界级""下一代"替代真实选择,读起来很燃,落地无从下手。
Female Leader's Note 研究显示,面对同一份战略 memo,女性作者更容易被评为"细致、执行力强",而非"有战略眼光"——"strategic"标签的归因存在性别偏差(参见 LeanIn & McKinsey《Women in the Workplace》关于晋升评语的发现)。对策:在 memo 开头用一句显性的判断句——"我判断核心问题是 X,因此我主张 Y"——把"判断"和"主张"摆到台面,逼评价者面对你的战略判断本身,而不是默认滑向"执行得不错"。
Richard Rumelt,《Good Strategy Bad Strategy》— 诊断 / 指导方针 / 连贯行动的"内核"框架。
Will Larson,《An Elegant Puzzle》("Vision and strategy")— 工程团队的愿景与战略写法。
TOOL 04

接纳不确定性:方向要坚定,路径要可改 Strategy Under Uncertainty — Bet, Learn, Revise

概率思维近端目标护栏
战略一定建立在不完整的信息上。专业不是"等看清了再定方向",而是在雾中先定一个足够近、足够具体的近端目标,押注、执行、再按反馈修正。方向要坚定,路径要可改。
"What makes a decision great is not that it has a great outcome. A great decision is the result of a good process." "一个决策之所以好,不在于它有好结果。好决策是好过程的产物。" — Annie Duke,《Thinking in Bets》
情境:BigCat 要定明年的技术选型方向,但某 AI 框架生态变化太快,团队吵"现在定会不会赌错"。
✗ 两种常见误区

要么"等更明朗再说"——拖到对手已领先;要么一次押死,把可逆决策当不可逆,全员 all-in 一个还没验证的技术栈。

✓ 概率思维 + 近端目标 + 护栏

"我们不赌'哪个框架五年后赢'——那不可知。定一个 3 个月的近端目标:两个候选各做一个真实场景的 spike,用预设指标(迁移成本、社区活跃、学习曲线)打分。3 个月后用数据定,而不是现在用直觉定。"

对团队再补一句:"我现在的判断是 A,置信度大概 60%。如果出现 X 信号,我会改。"——公开置信度和"会改的条件",既给方向,又不假装确定。

  • 我是在用"等更多信息"逃避决策吗?(信息永远不会全)
  • 这个赌可逆吗?能不能拆成更小、可承受的赌?
  • 我说得出自己当前判断的置信度(大概几成)吗?
  • 我预先定义了"什么信号出现我就改"吗?(没有 = 沉没成本会绑架你)
  • 决策错了,我会复盘"过程"还是只骂"结果"?
  • Resulting(Annie Duke 术语)。用结果好坏反推决策对错——好结果可能来自烂决策加运气,看结果论英雄会奖励运气、惩罚好过程。
  • "Strong opinions" 却不 "loosely held"。抓着一个判断不放、无视新信号,是沉没成本谬误的温床。
  • 拿"接纳不确定"当不表态的借口。领导者仍要给一个明确的当前方向,只是公开它可改——不是和稀泥。
Annie Duke,《Thinking in Bets》— 概率思维、resulting、过程 vs 结果。
Richard Rumelt,《Good Strategy Bad Strategy》— "proximate objective(近端目标)":选一个近到可行的目标当抓手。

本周习作 · Your Day 16 Action

本周你要做一件具体的事,不是反思也不是阅读:

选你团队当前一个"方向不清"的领域。写半页,按今天的工具串起来:(1) 一句诊断(核心障碍到底是什么);(2) 一个北极星指标候选;(3) 把它转成 1 个 O + 3 个结果式 KR(强制规则:KR 里不许出现"完成 / 上线 / 交付"动词)。

拿给团队 review,只问一个问题:"如果这三条 KR 都达成,你信我们方向就对了吗?" 如果有人犹豫,说明你的 KR 还没覆盖 O——回去补。

深入思考

北极星指标会被团队"操纵"吗?
Goodhart 定律:"当一个指标成为目标,它就不再是个好指标。"团队会优化数字本身而非其背后的价值——比如为了"活跃下游团队数"去刷无意义的调用。两个对策:(1) 永远给北极星配护栏指标(质量、正确率);(2) 定期回到"这个数字真的还代表用户价值吗"的元层面复盘,而不是只盯数字涨没涨。指标是地图,不是领土。
OKR 在探索型 / 研究型团队(如前沿 AI research)适用吗?
结果式 KR 在交付型团队最有效,但在高度不确定的研究里,硬定"模型精度提升 X%"可能逼团队去做能保证达标的安全项目,而扼杀真正的探索。一种调整:研究型 OKR 的 KR 写成"学习目标"而非"成果目标"——比如"完成 3 个明确证伪/证实某假设的实验",奖励高质量的学习而非保证的产出。框架要服从工作性质,而不是反过来。
战略该多稳定?多久重写一次?
两个失败模式:朝令夕改(团队无所适从,没人敢长期投入)vs 抱残守缺(环境变了战略不变,撞墙还在喊口号)。经验法则:方向(诊断+指导方针)应在半年到一年内稳定,频繁变的是战术。重写的触发不是日历,而是"诊断里的关键事实是否已经失效"——如果当初的核心障碍已经不成立,就该重诊断,否则别动。
"接纳不确定"与"给团队确定感"如何平衡?
团队需要确定性才敢投入,领导却必须对未知诚实——这是真实的张力。可行的做法是分层:对方向给确定感("我们半年就干可靠性这一件事,这点不变"),对路径诚实地留余地("具体用哪套方案,我们 3 个月后按数据定")。把"不确定"限定在可改的战术层,而不是让团队感觉整个方向都在飘。
大公司里,自下而上的战略空间到底有多大?
你的团队战略一定被上层战略约束——这不是限制,而是信息。真正的技术 leader 战略,往往是"在上层方向的缝隙里,找到一个上层没看清、但你能赢的具体战场"。与其抱怨没有自由度,不如把上层目标当作你的诊断输入:上面要的是 X,而达成 X 的真实瓶颈在我这一层是 Y——把 Y 做成你团队的战略,既向上对齐,又有自己的主张。