Amazon — 16 Leadership Principles · LP4. Are Right, A Lot

说说你因为新信息而改变主意的一次经历。

Tell me about a time you had to change your mind based on new information.

答案语言

考察要点

这道题重点考察 Amazon 的 Are Right, A Lot 和 Learn and Be Curious 两条领导力准则。

Are Right, A Lot (决策正确)：这条 LP 并非指你从不犯错，而是指你拥有强大的判断力，能寻求多样的视角，并愿意基于新数据主动挑战和修正自己过去的决策，以最终达到正确的结果。
Learn and Be Curious (好奇求知)：这表明你不会停留在已知的舒适区。你会主动探索新领域、新数据、新可能性，并对意料之外的发现保持开放和好奇，而不是排斥。

高分示范答案（STAR）

Situation（背景） 在 2022 年 Q3，我在前公司（一家头部电商平台）担任推荐系统团队的资深工程师。我们团队共 8 人，负责为首页信息流构建新一代的实时特征存储系统。当时，用户画像特征的更新延迟长达 24 小时，严重影响了推荐的实时性和准确性。

Task（任务） 我的任务是主导这个实时特征库的技术选型和架构设计，目标是将特征更新的延迟从 24 小时降低到 5 秒以内。基于我们团队对 Redis 的丰富经验和其出色的读性能，我最初的方案是采用一个大规模的 Redis 集群。

Action（行动） 整个过程充满了挑战和反思，我的关键行动包括：

提出初步方案并进行验证：我首先基于团队技术栈和快速交付的考虑，设计了基于 Redis Cluster 的方案，并撰写了详细的设计文档。为了验证方案，我没有止步于理论分析，而是主动搭建了一个 PoC（概念验证）环境。
发现与初始假设相悖的新信息：在 PoC 阶段，我与数据科学团队合作，用真实的线上流量回放来模拟写入压力。这时我发现了一个致命问题：用户的写入行为具有极强的突发性（例如，在整点秒杀活动时），会产生远超预期的“热点 Key”写入。我的模拟数据显示，在这种峰值场景下，Redis 集群的 P99 写入延迟会飙升到 10 秒以上，并且有 0.1% 的几率出现数据丢失，这完全违背了我们的设计目标。
主动推翻自我，并提出新方案：面对这个数据，我意识到自己最初的判断是错的——我过分关注了读取性能和开发效率，而低估了写入模型的复杂性。我立即叫停了基于 Redis 的进一步开发，并紧急组织了一次架构评审会。会上，我坦诚地展示了 PoC 的失败数据，并公开承认我最初方案的风险。接着，我提出了一个替代方案：使用 Flink 进行流式数据处理，并将数据写入对高并发写入更友好的 DynamoDB（或类似的分布式 NoSQL 数据库）。
说服团队并管理风险：团队对引入新技术栈（DynamoDB）有顾虑，担心学习成本和项目延期。为了打消疑虑，我主动花了两天时间做了一个迷你的性能对比报告，用数据证明 DynamoDB 在我们场景下的写入优势。同时，我制定了一个分阶段的迁移计划，承诺先用一个周末带大家完成核心 API 的培训，从而将技术切换的风险降到最低。

Result（结果） 最终，团队采纳了我的新方案。项目虽然比原计划延迟了 3 周，但在 3 个月后成功上线。

性能：新系统平稳承接了“双十一”大促期间高达 50,000 QPS 的峰值写入，P99 延迟稳定在 200ms 以内。
业务目标：特征数据更新的平均延迟从 24 小时降至 1.5 秒，远超预期目标。
业务影响：上线后第一个季度，首页推荐的点击率（CTR）因此提升了 5%，为公司带来了百万美元级别的年化收入增长。通过这件事，我深刻体会到，对自己的假设保持警惕，并用真实数据去验证，远比捍卫最初的“正确”更重要。

低分陷阱（常见扣分点）

故事平淡，没有真正的“改变主意”：错误示范：“我本来想用 MySQL，后来想了想，还是用 NoSQL 更好。”——这只是决策过程，没有体现你推翻一个已经成型、甚至投入了资源的方案的勇气和逻辑。
将“改变主意”归咎于他人：错误示范：“PM 突然改了需求，所以我们不得不换方案。”——这体现的是被动接受，而不是你基于新信息的主动调整。面试官想看的是你的主观能动性。
Action 停留在“我们”：错误示范：“我们发现了一个问题，然后我们决定换方案。”——面试官无法判断你在其中扮演了什么角色。是你发现的问题吗？是你提出的新方案吗？是你去说服的大家吗？
改变的理由不够充分或量化：错误示范：“我感觉 Redis 可能扛不住，所以换了。”——“感觉”是面试中的大忌。你需要像范例中一样，用 PoC 的数据（延迟、失败率）来证明为什么必须改变。
结果含糊不清：错误示范：“项目很成功，推荐效果变好了。”——这毫无说服力。必须量化，比如“延迟从 X 降到 Y”，“CTR 提升 Z%”。

高概率追问（3 个 + 示范回答要点）

追问：当你向团队承认你最初的方案有缺陷时，他们是什么反应？你是如何处理这些反应的？
- 要点 1 (承认阻力)：坦诚说出团队的直接反应，比如“有同事觉得我们已经在 Redis 上投入了时间，现在改动成本太高”，或者“我的经理担心项目延期会影响他的绩效”。
- 要点 2 (聚焦共同目标)：强调你如何将讨论的焦点从“谁对谁错”或“沉没成本”转移到“如何才能最好地实现业务目标（系统稳定性和实时性）”上。
- 要点 3 (用数据说话)：再次强调你展示了无法辩驳的 PoC 数据，让团队明白这不是一个主观偏好问题，而是一个客观的技术风险问题。
追问：除了 DynamoDB，你还考虑过其他替代方案吗？为什么最终选择了它？
- 要点 1 (展示广度)：列出 1-2 个其他选项，例如 Apache Cassandra 或 ScyllaDB。这表明你的技术视野不局限。
- 要点 2 (权衡取舍)：清晰地阐述你的决策框架。例如：“我对比了 Cassandra 和 DynamoDB。Cassandra 性能可能更极致，但它需要我们自己维护集群，运维成本很高。考虑到我们团队规模和当时的紧迫性，DynamoDB 作为全托管服务，能让我们更专注于业务逻辑开发，总体拥有成本（TCO）更低，更符合‘Deliver Results’的原则。”
追问：如果时间倒流，在项目最开始你会做些什么来避免这个弯路？
- 要点 1 (流程改进)：回答应着眼于流程的优化，而不是简单地说“我一开始就会选 DynamoDB”。例如：“我会把‘极端压力场景模拟’作为技术选型 PoC 的一个标准步骤，而不是一个可选的验证项。”
- 要点 2 (加强跨团队沟通)：说明你会更早、更深入地与数据科学团队对齐，去理解数据生成的模型和流量的季节性、突发性规律，而不是仅仅基于一份需求文档来做设计。这体现了你的系统性思考能力。

故事复用建议

这个故事非常扎实，除了 Are Right, A Lot 和 Learn and Be Curious，它还可以根据你的表述侧重点，复用到以下维度的面试题中：

Ownership：你主动承担了架构设计的责任，并在发现问题后，承担了推翻重来和说服团队的责任。
Deliver Results：尽管过程有波折，但你始终聚焦于最终的业务目标，并交付了远超预期的量化成果。
Dive Deep：你没有停留在表面需求，而是深入到流量模型和压力测试中，发现了潜在的风险。
Bias for Action：在发现 PoC 问题后，你没有犹豫或隐瞒，而是立刻行动，组织会议，推动变革。
Disagree and Commit (反向应用)：你可以讲述团队成员如何对你的新方案 Disagree，而你如何通过数据和沟通让他们最终 Commit。