ByteDance / TikTok — 'Always Day 1' & 'Inspire Creativity' · 核心价值观与高频题

请描述一次你从零开始，并以“Day 1”心态开发产品或功能的经历。

Tell me about a time you started from scratch ('Day 1' mindset) on a product or feature.

答案语言

考察要点

这道题旨在考察你在面对全新、模糊不清的项目时，如何从零开始定义问题、搭建框架、快速行动并交付成果。它重点评估你的 Ownership（主人翁精神）、Invent and Simplify（创新与简化） 以及 Bias for Action（崇尚行动）。

高分示范答案（STAR）

Situation（背景） 在 2021 年，我当时在一家中型电商公司担任高级后端工程师。公司高层观察到直播带货的趋势，希望快速切入这个新领域来寻找新的增长点。我被指派到一个 3 人（1 PM, 2 SDE）的“突击队”，任务是从零开始探索直播购物功能的可行性。当时我们没有任何直播相关的技术积累或产品经验。

Task（任务） 我的任务是在一个季度内，从零技术和产品原型开始，设计并交付一个最小可行产品（MVP）。核心目标是验证用户对直播购物的兴趣，并跑通“观看-点击-购买”的核心链路。我们设定的量化目标是：MVP 上线后一个月内，实现 1000 日活跃用户（DAU）和 5% 的商品点击转化率。

Action（行动） 面对一个全新的领域，我主导了整个技术栈的从零到一的建设：

技术选型与架构设计：首先，我花了一周时间密集调研了市面上的直播技术方案，对比了自研 WebRTC 和采购第三方云服务的优劣。考虑到团队规模和上线速度，我最终决定并说服了团队采用“第三方 PaaS 服务处理音视频流 + 自研业务后端”的混合云架构。这个决策平衡了开发速度和长期维护成本，让我们能把精力聚焦在核心的电商业务逻辑上。
定义核心模型与快速开发：由于没有现成的代码，我从数据库表结构开始，设计了直播间、商品流、实时互动等核心数据模型。为了快速迭代，我主动向产品经理建议，第一版砍掉复杂的实时推荐和虚拟礼物功能，只保留最核心的商品展示和购买流程。我通过一个简单的流程图向他展示，这样做可以将后端开发时间从预估的 6 周缩短到 3 周，他很快就同意了。
攻克技术难点：项目中最棘手的问题是商品信息和直播画面的毫秒级同步。当主播讲解某个商品时，APP 界面必须立刻高亮对应商品。我设计了一个基于 WebSocket 的信令服务，通过自定义的时间戳和序列号机制，确保了信令消息的顺序和低延迟。在压测中，我发现 WebSocket 连接数过多会导致单机性能瓶颈，于是我引入了 Redis Pub/Sub 做消息广播，将单机支撑的并发连接数从 1000 提升到了 10000。
建立监控体系：在上线前，我坚持认为必须建立完善的监控。我主动使用 Prometheus 和 Grafana 搭建了核心指标监控大盘，包括：直播流稳定性（卡顿率）、信令延迟、API 成功率和服务器资源占用。这确保了我们在上线后能第一时间发现并定位问题。

Result（结果） 我们最终只用了 10 周就成功上线了直播购物 MVP，比原计划提前了 2 周。上线后第一个月，产品日活峰值达到了 1800，商品点击转化率稳定在 8%，均超过了最初设定的目标。这个成功的 MVP 验证了业务方向，直接促使公司成立了一个 10 人的正式部门来跟进此项目。通过这个项目，我深刻体会到在 0 到 1 的阶段，对核心问题的聚焦和技术的“恰当”选择是成功的关键。

低分陷阱（常见扣分点）

混淆“从零开始”和“常规项目”：把一个在成熟系统上添加新功能的故事，包装成“从零开始”。这道题的核心是“无”中生“有”，没有历史包袱，但也缺乏参考。
- 反例：“我们想给用户中心加一个新功能，我负责后端部分，从零开始写了几个 API...” (这是常规迭代，不是 Day 1)
Action 停留在“做了什么”，而非“为什么这么做”：只罗列工作，不解释决策背后的思考和权衡。
- 反例：“我用了 Go 写后端，用了 Redis 做缓存，用了 Kafka 做消息队列。” (为什么是 Go 不是 Java？为什么用 Kafka 而不是 RabbitMQ？你的决策点在哪里？)
缺乏主人翁精神，等待指令：故事听起来像是一个任务执行者，而不是一个项目推动者。
- 反例：“产品经理给了我们需求文档，我就按照文档开始写代码了。” (一个 Day 1 的项目，需求往往是不清晰的，你应该主动去澄清、挑战和定义需求。)
结果只有定性描述：没有量化结果，无法证明你的工作带来了实际价值。
- 反例：“项目上线后反响很好，领导很满意。” (多好？怎么衡量？领导满意不是一个可衡量的指标。)

高概率追问（3 个 + 示范回答要点）

追问：在技术选型时，你说服团队使用混合云方案，当时有其他不同意见吗？你是如何说服他们的？
- 要点 1 (阐述分歧)：明确指出分歧点。比如，另一位工程师倾向于完全自研 WebRTC，认为这样长期来看技术栈更可控，能做更深度的定制优化。
- 要点 2 (数据和逻辑驱动)：说明你如何用逻辑和数据来支撑你的观点。例如：“我准备了一个对比表格，从开发人力（我们只有2个工程师）、上线时间（目标3个月）、短期风险（我们没有WebRTC经验，调试会很耗时）和长期演进（PaaS服务可以随时替换成自研）四个维度进行了分析。数据显示，自研方案至少需要6个月才能达到稳定状态，会完全错过市场窗口期。”
- 要点 3 (达成共识)：强调你不是强压，而是寻求共识。“我强调我的方案并非永久锁定，而是一个快速启动的策略。我建议我们可以先用云服务跑起来，同时在后续版本中逐步探索自研组件来替换，最终那位同事也同意这是当前最务实的做法。”
追问：你说 MVP 砍掉了一些功能，如果当时产品经理坚持要做实时推荐，你会怎么办？
- 要点 1 (重申目标)：首先，把讨论拉回到项目的核心目标上。“我会首先和 PM 再次对齐我们的第一目标——验证核心购物链路，而不是打造完美的个性化体验。”
- 要点 2 (展示影响和提供选项)：清晰地量化坚持做的影响，并给出替代方案。“我会明确指出，增加实时推荐会使后端开发工作量增加至少3周，这会让我们无法按时上线。然后我会提供一个折中方案，比如第一版先做一个‘伪推荐’，比如只推荐店铺爆款或手动配置的商品列表，这样既有推荐的感觉，又几乎不增加开发成本。”
- 要点 3 (升级或寻求共识)：如果依然无法达成一致，说明你会如何升级问题。“如果 PM 仍然坚持，我会建议拉上我们的直接领导，三方一起明确这个 MVP 的优先级到底是‘功能完整度’还是‘上线速度’，让更高层来做这个商业决策。”
追问：你提到的那个 WebSocket 性能问题，你是如何发现并定位它的？
- 要点 1 (发现问题的契机)：说明问题的来源，是来自压测、预发布环境还是用户反馈。“在上线前的全链路压测中，我们用 k6 模拟 2000 用户并发访问。当并发数超过 1000 时，我从 Grafana 监控上观察到信令消息的 P99 延迟从 50ms 飙升到 2s，并且服务器的 CPU 使用率接近 100%。”
- 要点 2 (定位问题的过程)：具体描述你的排查步骤。“我首先用 pprof 分析了 Go 应用的 CPU 火焰图，发现大部分时间消耗在 WebSocket 的连接管理和消息写入循环上。这让我怀疑是单进程处理大量连接导致了上下文切换和资源竞争。”
- 要点 3 (验证假设和解决)：“为了验证这个假设，我写了一个简单的脚本，用 Redis Pub/Sub 替代直接的 WebSocket 广播。在同样 2000 并发下，CPU 使用率下降到 30%，延迟也恢复到了 100ms 以内。这证实了将消息广播的扇出（fan-out）逻辑从应用层下沉到专用的中间件是正确的解决方案。”

故事复用建议

这个“从零到一”的故事非常宝贵，因为它几乎可以从不同角度回答多种行为面试问题。你可以微调重点，用它来回答：

Ownership: 你主动承担了技术选型、架构设计、难题攻关和监控建设的全部职责。
Bias for Action: 你快速调研、做出决策，并说服团队砍掉非核心功能以保证上线速度。
Deliver Results: 你用具体的、超额完成的量化指标证明了项目的成功。
Invent and Simplify: 你设计了混合云架构和信令服务，并简化了 MVP 的功能范围。
Dealing with Ambiguity: 你在没有明确需求和技术方案的情况下，成功探索并交付了产品。
Are Right, A Lot: 你做出的技术选型和架构决策被证明是正确且高效的。
Technical Deep Dive: 可以深入讲解 WebSocket 性能优化、混合云架构的细节等。