一句话原则
方向先于目标。一个团队若没有一个所有人都认得的"北极星"——那个最能代表你为用户创造的核心价值的单一指标 ——每个人都会朝自己以为对的方向用力,合力归零。北极星不是营收本身,是营收的前置因 。
名家原话
"Your North Star Metric is the single metric that best captures the core value that your product delivers to customers."
"你的北极星指标,是最能捕捉你的产品为客户创造的核心价值的那个单一指标。"
— Sean Ellis("North Star Metric" 概念提出者),& Morgan Brown,《Hacking Growth》
场景示范
情境:BigCat 带一个内部平台团队。老板问:"你们团队今年的目标是什么?"
✗ 常见做法
列一堆并列技术指标:"把 P99 延迟降到 X、上线 3 个 feature、可用性做到 99.99%。"——没有一条说清"为谁、创造了什么价值"。老板记不住,团队各自为政,年底每个数字都达标了,但没人说得清平台到底变好在哪。
✓ 修后做法
先定一个北极星:"每周成功完成端到端调用、且延迟达标的活跃下游团队数" 。一句话锚定"我们为内部开发者创造的价值"。延迟、可用性、新 feature 都退一步,成了它的输入杠杆 ,而不是互相打架的并列目标。
★ 北极星指标
每周延迟达标的活跃下游团队数
输入杠杆 · 速度
P99 延迟达标率
输入杠杆 · 可靠
月故障触发次数
输入杠杆 · 易用
新接入耗时
护栏指标 · 别为提速牺牲
调用正确率不得下降
选北极星的 5 个测试
它代表用户价值 ,还是只代表我们内部的努力?
它领先 于营收/留存,还是滞后?(北极星应是因,不是果)
团队的日常工作能直接影响它吗?
有没有配一个护栏指标 ,防止为它牺牲质量?(如为提速牺牲正确性)
全队不看文档,能说出它吗?
常见错误
把"虚荣指标"当北极星。 总注册数、代码行数——只涨不跌,不反映真实价值。
选营收当北极星。 它太滞后,团队当周做的事看不到它动,无法指导日常取舍。
北极星指标超过一个。 两个以上等于没有——团队又开始在多个数字间分裂。
关键参考
Sean Ellis & Morgan Brown,《Hacking Growth》 — "North Star Metric" 的提出与方法。Amplitude,《The North Star Playbook》 — 北极星 + 输入杠杆树的实操模板。
一句话原则
Objective 回答"我们要去哪"(定性、鼓舞、有方向);Key Results 回答"怎么知道到了"(定量、可验证、能被证伪 )。最常见的失败,是把 KR 写成任务清单("做完 X"),而不是结果("X 带来了 Y")。
名家原话
"A successful MBO system needs only to answer two questions: Where do I want to go? (The answer provides the Objective.) How will I pace myself to see if I am getting there? (The answer gives us Milestones, or Key Results.)"
"一套有效的目标系统只需回答两个问题:我要去哪里?(答案给出目标。)我如何衡量自己是否在接近?(答案给出关键结果。)"
— Andy Grove,《High Output Management》Ch.6
场景示范
情境:BigCat 要给团队定一个季度 OKR,主题是"提升平台稳定性"。
✗ 任务伪装成 KR
O:提升平台稳定性 KR1:完成监控系统迁移 KR2:上线熔断机制 KR3:写 5 篇 runbook
三个 KR 全是"做了什么"。三件都做完了,稳定性可能根本没变 ——下游照样半夜被叫醒。
✓ 结果式 KR
O:让下游团队信任我们的平台不会半夜叫醒他们 KR1:由我方故障导致的下游 on-call 触发,从每月 12 次降到 ≤3 次 KR2:P0 故障平均恢复时间 (MTTR) 从 45 分钟降到 ≤15 分钟 KR3:季度下游团队满意度 (NSAT) 从 6.2 升到 ≥8.0
迁移、熔断、runbook 都还要做——但它们变成达成这些结果 的手段,而不是目的本身。
压测你的 KR
每条 KR 是"结果"还是"待办"?(含"完成 / 上线 / 交付"动词的,多半是待办)
数字有起点和终点 吗?(从 X 到 Y,不是只有一个 Y)
如果三条 KR 都达成,O 就一定 实现了吗?(覆盖性测试)
它是不是"稳赢"的?(Grove 与 Google:好 OKR 应有约 70% 达成率才算够野心)
它能被诚实地证伪 吗?(无法证伪的 KR 只是口号)
常见错误
Sandbagging(故意定低)。 为保"100% 达成"而压低目标,把 OKR 变成绩效保险,扼杀野心。
KR 直接绑定个人考核。 一旦 KR = 绩效分,所有人都会定保守目标。Grove 和 Google 都强调 OKR 与薪酬解耦 。
O 写得像 KR(带死数字),KR 写得像任务。 角色对调,整套就废了。
关键参考
John Doerr,《Measure What Matters》 — Google OKR 的体系化,含"OKR 与绩效解耦"原则。Andy Grove,《High Output Management》 (Ch.6)— OKR 的思想源头。
一句话原则
好战略不是一句鼓舞口号,也不是一张目标清单。Rumelt 说战略的内核只有三件事:诊断 (这到底是什么问题)、指导方针 (用什么总思路应对)、连贯行动 (一组互相加强、不自相矛盾的具体动作)。缺了诊断的"战略",都是愿望清单。
名家原话
"The kernel of a strategy contains three elements: a diagnosis, a guiding policy, and a set of coherent actions."
"一个战略的内核包含三个要素:诊断、指导方针,以及一组连贯的行动。"
— Richard Rumelt,《Good Strategy Bad Strategy》
场景示范
情境:BigCat 被要求写一份团队半年技术战略 memo。
✗ 坏战略 = 愿望清单
"我们的战略是成为最可靠、最快、开发者最爱的平台——提升稳定性、提升性能、提升体验。"——全是好词,没有诊断,没有取舍,什么都要,等于什么都没说。
✓ Rumelt 内核三段
诊断: "我们最大的痛不是功能不够,是下游不信任 我们——上季度 60% 的跨团队 escalation 都指向我方夜间故障。这是信任问题,不是功能问题。"
指导方针: "本半年我们牺牲新功能速度,全力换可靠性信誉。新需求一律让位于稳定性,直到下游信任恢复。"
连贯行动: "(1) 冻结非紧急新 feature 两个月;(2) 把 50% 工程量投入可观测性与自动回滚;(3) 每月给下游发一次透明的可靠性报告。"——三个动作互相加强,且都服从同一方针。
你的 memo 是真战略还是愿望清单?
有没有明确的诊断 ——一句话说清核心障碍是什么?
有没有取舍 ?(真战略一定说了"我们不做什么"。全都要 = 没战略)
三件行动互相加强 ,还是各自为政、甚至互相拆台?
一个新人读完,知道下周该优先做什么吗?
去掉所有形容词(最好、领先、卓越)后,还剩下实质吗?
常见错误 · 女性视角
把目标当战略。 "营收翻倍 / 做到行业第一"是目标,不是战略——没说怎么 做到。
回避取舍。 不肯说"我们不做什么",是坏战略的头号特征 (Rumelt)。
形容词堆砌。 用"世界级""下一代"替代真实选择,读起来很燃,落地无从下手。
Female Leader's Note
研究显示,面对同一份战略 memo,女性作者更容易被评为"细致、执行力强",而非"有战略眼光"——"strategic"标签的归因存在性别偏差(参见 LeanIn & McKinsey《Women in the Workplace》关于晋升评语的发现)。对策:在 memo 开头用一句显性的判断句——"我判断核心问题是 X,因此我主张 Y" ——把"判断"和"主张"摆到台面,逼评价者面对你的战略判断本身 ,而不是默认滑向"执行得不错"。
关键参考
Richard Rumelt,《Good Strategy Bad Strategy》 — 诊断 / 指导方针 / 连贯行动的"内核"框架。Will Larson,《An Elegant Puzzle》 ("Vision and strategy")— 工程团队的愿景与战略写法。
一句话原则
战略一定建立在不完整的信息上。专业不是"等看清了再定方向",而是在雾中先定一个足够近、足够具体的近端目标 ,押注、执行、再按反馈修正。方向要坚定,路径要可改。
名家原话
"What makes a decision great is not that it has a great outcome. A great decision is the result of a good process."
"一个决策之所以好,不在于它有好结果。好决策是好过程的产物。"
— Annie Duke,《Thinking in Bets》
场景示范
情境:BigCat 要定明年的技术选型方向,但某 AI 框架生态变化太快,团队吵"现在定会不会赌错"。
✗ 两种常见误区
要么"等更明朗再说"——拖到对手已领先;要么一次押死,把可逆决策当不可逆,全员 all-in 一个还没验证的技术栈。
✓ 概率思维 + 近端目标 + 护栏
"我们不赌'哪个框架五年后赢'——那不可知。定一个 3 个月的近端目标 :两个候选各做一个真实场景的 spike,用预设指标(迁移成本、社区活跃、学习曲线)打分。3 个月后用数据 定,而不是现在用直觉定。"
对团队再补一句:"我现在的判断是 A,置信度大概 60% 。如果出现 X 信号,我会改。"——公开置信度和"会改的条件",既给方向,又不假装确定。
雾中决策检查表
我是在用"等更多信息"逃避 决策吗?(信息永远不会全)
这个赌可逆吗?能不能拆成更小、可承受的赌?
我说得出自己当前判断的置信度 (大概几成)吗?
我预先定义了"什么信号出现我就改"吗?(没有 = 沉没成本会绑架你)
决策错了,我会复盘"过程 "还是只骂"结果"?
常见错误
Resulting(Annie Duke 术语)。 用结果好坏反推决策对错——好结果可能来自烂决策加运气,看结果论英雄会奖励运气、惩罚好过程。
"Strong opinions" 却不 "loosely held"。 抓着一个判断不放、无视新信号,是沉没成本谬误的温床。
拿"接纳不确定"当不表态的借口。 领导者仍要给一个明确的当前方向,只是公开它可改——不是和稀泥。
关键参考
Annie Duke,《Thinking in Bets》 — 概率思维、resulting、过程 vs 结果。Richard Rumelt,《Good Strategy Bad Strategy》 — "proximate objective(近端目标)":选一个近到可行的目标当抓手。
深入思考
北极星指标会被团队"操纵"吗? Goodhart 定律:"当一个指标成为目标,它就不再是个好指标。"团队会优化数字本身而非其背后的价值——比如为了"活跃下游团队数"去刷无意义的调用。两个对策:(1) 永远给北极星配护栏指标(质量、正确率);(2) 定期回到"这个数字真的还代表用户价值吗"的元层面复盘,而不是只盯数字涨没涨。指标是地图,不是领土。
OKR 在探索型 / 研究型团队(如前沿 AI research)适用吗? 结果式 KR 在交付型团队最有效,但在高度不确定的研究里,硬定"模型精度提升 X%"可能逼团队去做能保证达标的安全项目,而扼杀真正的探索。一种调整:研究型 OKR 的 KR 写成"学习目标"而非"成果目标"——比如"完成 3 个明确证伪/证实某假设的实验",奖励高质量的学习而非保证的产出。框架要服从工作性质,而不是反过来。
战略该多稳定?多久重写一次? 两个失败模式:朝令夕改(团队无所适从,没人敢长期投入)vs 抱残守缺(环境变了战略不变,撞墙还在喊口号)。经验法则:方向 (诊断+指导方针)应在半年到一年内稳定,频繁变的是战术 。重写的触发不是日历,而是"诊断里的关键事实是否已经失效"——如果当初的核心障碍已经不成立,就该重诊断,否则别动。
"接纳不确定"与"给团队确定感"如何平衡? 团队需要确定性才敢投入,领导却必须对未知诚实——这是真实的张力。可行的做法是分层:对方向 给确定感("我们半年就干可靠性这一件事,这点不变"),对路径 诚实地留余地("具体用哪套方案,我们 3 个月后按数据定")。把"不确定"限定在可改的战术层,而不是让团队感觉整个方向都在飘。
大公司里,自下而上的战略空间到底有多大? 你的团队战略一定被上层战略约束——这不是限制,而是信息。真正的技术 leader 战略,往往是"在上层方向的缝隙里,找到一个上层没看清、但你能赢的具体战场"。与其抱怨没有自由度,不如把上层目标当作你的诊断输入:上面要的是 X,而达成 X 的真实瓶颈在我这一层是 Y——把 Y 做成你团队的战略,既向上对齐,又有自己的主张。