Amazon — 16 Leadership Principles · LP2. Ownership

描述一个无人负责,你主动承担的项目。

Describe a project where no one owned it and you stepped up.

答案语言

考察要点

这道题重点考察候选人是否展现了 Amazon 的 Ownership (主人翁精神)Bias for Action (崇尚行动) 这两条领导力准则。

  • Ownership: 候选人是否将自己视为业务的“主人”,即使问题不在其直接职责范围内,也主动发现并承担责任去解决。他们着眼于长期价值,不会说“那不是我的工作”。
  • Bias for Action: 在面对不明确或无人负责的局面时,候选人是否能快速做出决策并采取行动,而不是陷入“分析麻痹”或等待他人指令。他们敢于承担经过计算的风险。

高分示范答案(STAR)

Situation(背景) 在 2021 年,我当时在一家电商公司担任核心订单服务的资深后端工程师。我的团队(约 5 人)负责维护订单履约流程。我们发现,每当大促期间出现线上问题时,On-call 工程师定位问题的效率极低。根本原因在于,公司内部分裂成近 50 个微服务,分别由不同团队维护,但没有任何统一的日志规范。日志格式五花八门,关键追踪 ID(如 trace_id, user_id)在不同服务间的命名和记录方式完全不一致,导致跨服务链路追踪几乎无法进行。这是一个典型的“三不管”地带,既不属于任何业务团队,也不属于基础架构团队的 KPI。

Task(任务) 我的目标是推动建立一套统一的日志规范,并至少在核心交易链路(用户、商品、订单、支付、履约)的 10+ 个关键服务中落地,将跨服务线上问题的平均解决时间(MTTR)降低 50% 以上。这是一个我自发定义的、没有任何资源和正式授权的项目。

Action(行动) 面对这个无人认领的难题,我采取了以下几个关键步骤:

  • 第一,我用数据量化问题,让痛点显性化。 我没有直接去游说,而是花了两天时间分析了过去一个季度的 P0/P1 级故障报告。我统计出,平均每次跨服务故障,On-call 工程师有超过 60% 的时间(约 4 小时)浪费在手动拼接和解读不同格式的日志上。我把这个数据做成了一页简报,清晰地展示了“不作为”的成本。

  • 第二,我主动设计方案并寻求盟友,而非等待指令。 我知道强制推行一个“重”方案会遭到巨大阻力。因此,我设计了一个“轻量级”方案:基于公司大部分团队都在用的 Log4j2 库,开发一个轻量级的扩展包,通过配置自动注入统一的 trace_id 和业务关键字段,对业务代码零侵入。然后,我找到了另外两个同样被日志问题困扰的支付团队和用户团队的资深工程师,向他们展示了我的数据和方案原型,赢得了他们的支持,形成了最初的核心推动小组。

  • 第三,我身先士卒,打造样板工程。 为了打消其他团队“没时间”、“改动风险高”的顾虑,我主动承担了“第一个吃螃蟹”的人。在自己的团队(订单服务)率先推行改造,只用了一个下午就完成了核心应用的适配,并录制了一个 5 分钟的视频,演示了改造前后排查问题的效率对比——一个原本需要 2 小时才能定位的问题,现在 10 分钟内就能搞定。

  • 第四,我将个人项目转化为团队成果,并建立长期机制。 在样板工程成功后,我将方案和成果分享到了公司的技术分享会上,吸引了更多团队的关注。同时,我与架构组合作,将这套日志规范作为“最佳实践”写入了新员工的入职文档,并推动他们在 CI/CD 流程中加入了日志规范的静态检查,从机制上保证了方案的延续性。

Result(结果)

  • 在我开始推动后的 3 个月内,超过 15 个核心服务(覆盖了 90% 的交易链路)主动接入了统一日志规范。
  • 线上跨服务故障的平均解决时间(MTTR)从之前的平均 4 小时下降到 1.5 小时,降低了 62.5%,超出了我最初的目标。
  • 由于问题定位效率大幅提升,SRE 团队统计该季度因线上问题导致的业务损失环比减少了约 20%。
  • 我学到了:要驱动一个没有明确负责人的项目,数据是最好的“授权书”,一个可落地的样板工程是最好的“邀请函”。

低分陷阱(常见扣分点)

  1. 故事不属于“无人拥有”的范畴:讲了一个自己分内项目,只是做得比较困难。这考察的是 Deliver Results,而不是 Ownership。
    • 反例:“老板让我优化一个性能问题,没人知道怎么做,我站了出来……”(这是你的本职工作)
  2. 行动部分含糊不清,滥用“我们”:无法判断候选人的个人贡献,听起来像是团队的功劳。
    • 反例:“我们团队发现日志很乱,所以我们决定统一一下。我们一起设计了方案,然后大家就都去接入了。”
  3. 结果没有量化,空洞无力:无法衡量项目的影响力,使故事可信度大打折扣。
    • 反例:“项目很成功,之后大家查问题都方便多了,效率提高了很多。”
  4. 过程过于顺利,没有体现挑战:一个好的 Ownership 故事通常会伴随着阻力,候选人如何克服阻力是亮点。
    • 反例:“我提出方案后,跟各团队一说,大家都很支持,很快就上线了。”(这在现实中几乎不可能)

高概率追问(3 个 + 示范回答要点)

  1. 追问:你在这个过程中遇到的最大阻力是什么?你是如何克服的?

    • 要点 1 (资源冲突):最大的阻力是其他团队的优先级。他们都有自己的业务 KPI,不愿意为这个“技术债”项目投入人力。我的策略不是强迫,而是“引诱”。我通过量化的数据(4小时 vs 10分钟)让他们看到 ROI,并通过提供极简的接入方案(一个依赖+几行配置)来降低他们的决策门槛。
    • 要点 2 (技术惯性):有个别团队对自己现有的、独特的日志工具很自豪,不愿意改变。对此,我没有去否定他们的工作,而是强调“标准化”对“整个系统”的好处,并邀请该团队的核心成员加入我们的“虚拟规范小组”,吸收他们方案中的优点,让他们从“被动接受者”变为“共同建设者”。
  2. 追问:在没有得到老板或管理层明确支持的情况下,你如何有信心投入时间去做这件事?

    • 要点 1 (风险控制):我并没有一开始就投入大量时间。我采用了 MVP(最小可行产品)的思路,先用少量时间(两天)做初步的数据分析和方案设计,验证这件事的价值和可行性。这是一种“小步快跑”的试错,风险可控。
    • 要点 2 (价值判断):作为服务的 Owner,我深知这个问题是影响我们服务稳定性和团队幸福感的巨大瓶颈。解决它,即使短期内不产生直接的业务收益,但长期来看对提升研发效率和系统可用性有巨大价值。这是基于我对业务痛点的深刻理解和作为工程师的责任感。
  3. 追问:这个项目成功后,你如何确保它不会再次退化?你是如何把它变成一个长期的机制的?

    • 要点 1 (工具化):我推动架构组将日志规范检查做进了 CI/CD 的 pipeline 里。任何新提交的代码如果不符合日志规范,流水线会直接失败。这把依赖人治的“规范”变成了自动化的“规则”。
    • 要点 2 (知识传承):我把整个项目的背景、方案、接入指南和最佳实践都整理成了完善的文档,并把它作为新员工入职培训的一部分。当新人从第一天就知道“正确的做法”是什么时,标准就自然而然地延续下去了。

故事复用建议

这个故事非常扎实,除了 OwnershipBias for Action,还可以用来回答以下问题:

  • Deliver Results: 你交付了一个有明确量化结果的复杂项目。
  • Invent and Simplify: 你没有发明一个全新的、复杂的日志系统,而是通过简化和标准化解决了问题。
  • Earn Trust: 你通过数据和以身作则赢得了其他团队的信任和支持。
  • Dive Deep: 你通过深入分析故障报告和日志数据来定位问题的根源。
  • Think Big: 你从一个团队的痛点出发,思考并解决了一个影响整个技术体系的问题。