倖存者偏差

阅读 1804 · 更新时间 2026年2月5日

倖存者偏差是指倾向于将市场上现存的股票或基金的表现视为具有代表性的综合样本,而忽视那些已经倒闭的股票或基金。倖存者偏差可能导致对历史业绩和基金或市场指数的一般属性过高估计。倖存者偏差风险是指基于公布的投资基金回报数据而做出错误投资决策的机会。

核心描述

  • 倖存者偏差 是一种常见倾向:在评估市场、股票或基金时,只观察仍在交易或仍在披露业绩的 “幸存者”,而那些表现不佳后被关闭、退市、清算或并购消失的对象,往往被悄然排除在视野之外。
  • 由于基金清盘、股票退市、产品清算与并购等事件会把较弱的历史记录从数据集中移除,历史平均表现可能被 “抬高”,风险也可能被 “压低”,从而与真实经历产生偏差。
  • 投资者可以通过使用 point-in-time(时点) 的可投资标的范围、纳入已清盘基金与已退市股票,并对比 “仅幸存者” 与 “全样本” 的研究结果,来降低倖存者偏差带来的影响。

定义及背景

倖存者偏差(也称 survivor bias)是一种抽样误差:你只能看到 “还存在的东西”。在投资领域,“可见集合” 往往是当下仍上市的股票、仍在运作的基金、仍在销售的份额类别;而 “缺失集合” 则包括已退市公司、已清盘基金,以及被并购整合而不再单独展示的产品——这些对象往往是在业绩较差后退出样本。

这之所以重要,是因为缺失数据并非随机。失败者更可能消失,数据集就会向赢家倾斜。结果是:管理人能力看起来更普遍、回撤似乎更小、长期平均回报也显得更平滑,但这些都可能高估了全体同批产品或公司在真实历史中的表现。换言之,倖存者偏差风险 是指基于公布的投资基金回报数据而做出错误投资决策的机会。

倖存者偏差与其他研究陷阱相关但不相同:

  • 选择偏差(selection bias) 更广泛:任何导致样本不具代表性的选择方式。倖存者偏差是其中一种特例,即 “未幸存者” 缺席。
  • 前视偏差(look-ahead bias) 指未来信息泄漏到过去决策中(例如用最终的指数成分股名单回测历史)。
  • 回测偏差(backtest bias) 是更大的统称,可能包含倖存者偏差、前视偏差与过拟合等问题。

计算方法及应用

快速覆盖检查:倖存者偏差率(SBR)

一个简单的诊断方法是衡量起初的标的中,有多少仍然可被观察到:

\[\text{SBR}=\frac{N_{\text{survivors}}}{N_{\text{initial}}}\]

若 SBR 较低,说明有大量路径已经消失,倖存者偏差的风险通常更高。

衡量业绩 “膨胀”(仅幸存者 vs 全样本)

为了估计业绩可能被高估的幅度,可以对比仅用幸存者计算的收益,与用全样本(幸存者 + 未幸存者)计算的收益:

\[\Delta R=R_{\text{survivors}}-R_{\text{full}}\]

两者需使用相同的加权方式(等权、市值加权或 AUM 加权)。若 \(\Delta R>0\),通常意味着存在倖存者偏差导致的业绩 “抬高”。

这些计算常用于哪里

  • 基金研究: 比较主动管理 “品类平均”、同业排名或业绩延续性研究。
  • 股票筛选: 用仅包含当前仍上市股票的样本测试因子或过滤条件,可能夸大命中率。
  • 指数研究: 用 “今天的成分股” 去重建历史(而不是使用逐期成分股),会嵌入类似倖存者偏差的失真。

小示例(假设情景,仅作说明,不构成投资建议)

假设 10 只基金同时起步。5 年后,6 只基金存续,平均收益为 +8%;另有 4 只基金在平均收益 -10% 后关闭。

  • 仅幸存者平均 = +8%
  • 全样本平均 = \((6\times 8\%+4\times (-10\%))/10=0.8\%\)

差值显示了倖存者偏差如何让 “典型结果” 看起来显著更好,而与全体同批产品的真实结果不一致。


优势分析及常见误区

采用 “考虑倖存者偏差” 的分析优势

  • 更贴近现实的收益估计: 纳入已清盘基金与已退市股票后,历史平均回报通常会降低,同时结果分布会更分散。
  • 更准确的风险度量: 当失败者从样本中消失时,波动率与最大回撤可能被低估;纳入非幸存者有助于暴露尾部风险。
  • 更公平的管理人对比: 当把缺失的落后者补回同业集合后,“四分位排名”“长期领先” 等主张往往会变得不那么亮眼。

代价与局限

  • 数据处理更困难: 退市证券与已清盘基金的历史可能存在代码变更、标识符不一致或记录不完整等问题。
  • 不能解决所有问题: 消除倖存者偏差并不等于消除前视偏差、选择偏差或数据挖掘等风险。
  • 仍需关注市场环境变化: 即使历史覆盖完整,也不能保证未来与过去一致。

常见误区

  • “只要在热门数据库里,就一定是完整数据。” 便捷数据集常是 “仅存续(live-only)”,这是倖存者偏差进入研究的常见来源。
  • “指数历史很长,说明是同一批公司一直在里面。” 指数收益序列可能真实可靠,但成分会变动;把指数历史解读为 “长期持有同一批公司” 是另一种说法。
  • “排行榜能证明优秀管理人长期稳定。” 各类榜单常排除已清盘、被并购吸收或停止披露的产品。

实战指南

第 1 步:像历史研究一样定义投资范围

明确写出地区、资产类型、时间窗口与纳入规则。对基金而言,需说明是否包含已清盘基金与不活跃的份额类别;对股票而言,需说明是否纳入已退市股票与退市收益(delisting returns)。

第 2 步:要求使用时点(point-in-time)数据

降低倖存者偏差需要逐期 “当时可见” 的成员信息,例如:

  • 指数逐期成分股(point-in-time index constituents)
  • 保留已清盘或被并购基金的基金列表
  • 不会把失败者静默删除的公司行动(corporate action)历史

第 3 步:对退出事件进行核对(退市、并购、清盘)

把退出视为 “结果”,而不是 “缺失值”。并购可能把弱业绩隐藏在更强的同系产品之下;对股票而言,需要显式处理退市事件,避免收益路径直接消失。

第 4 步:始终同时披露两种视角

在报告中同时发布:

  • 仅幸存者结果(许多仪表盘默认展示的口径)
  • 全样本结果(幸存者 + 未幸存者)

并突出 CAGR、最大回撤与波动率在两种口径下的差异。

第 5 步:使用一份操作清单(快速审计)

项目需要确认的问题
投资范围是否反映每个时点的可投资集合?
覆盖范围是否保留已清盘基金与已退市股票?
时间一致性筛选是否为时点口径(无未来信息)?
披露方式是否同时展示仅幸存者与全样本结果?
稳健性在更保守的退出假设下结果是否明显变化?

案例(假设情景,仅作说明,不构成投资建议)

分析师用 2005 到 2020 的数据做 “高质量股票” 回测,但样本只包含今天仍存在的股票代码。曲线看起来更平滑、回撤也显得较小。改用无倖存者偏差的数据集(纳入后来退市或破产的公司)后,该策略的波动率上升,最差年度收益变得更差。信号可能仍有参考价值,但对历史的预期会更贴近现实,因为倖存者偏差不再把失败者过滤掉。

关于券商筛选工具的一点说明

长桥证券(Longbridge) 等平台上,筛选工具可能更强调当前可交易标的,这对执行交易有帮助,但未必适合直接用于严谨的历史推断。若用于研究,建议与保留退市历史与时点成员信息的数据源交叉验证。


资源推荐

通俗参考

  • 类似 Investopedia 风格的解释文章:倖存者偏差、选择偏差、前视偏差与回测偏差(适合快速理解定义与例子)

监管与披露标准

  • 美国 SEC 关于业绩宣传与展示的材料
  • 英国 FCA 关于信息 “清晰、公允且不具误导性” 的指引

这些参考有助于理解为何在营销与报告中,披露倖存者偏差相关方法很重要。

专业标准

  • CFA Institute 课程中关于业绩评估偏差的讨论
  • GIPS 关于一致性业绩展示与可比性的相关理念

方法论文件

  • 指数编制方关于调样、成分变更与公司行动处理方式的方法说明

这些材料有助于区分 “指数历史收益” 与 “成分股随时间变化的成员结构” 各自代表的含义。


常见问题

投资中的倖存者偏差是什么?

倖存者偏差是指在分析时只看仍然存在的基金或股票,而忽略那些已经关闭、被并购整合、退市或破产的对象。由于失败者更可能消失,研究结果往往会比全体同批对象的真实经历更乐观。

为什么倖存者偏差通常会抬高业绩?

表现较差的产品更可能清盘或从数据库中移除。当这些负面结果消失后,样本会向赢家倾斜,从而提高平均回报,并且常常让波动率与回撤看起来更低。

投资者最常在哪里遇到倖存者偏差?

常见场景包括:公募基金排名、遗漏 “dead funds” 的对冲基金数据库、排除退市股票的股票筛选,以及用今天的指数成分股去模拟过去的回测。

倖存者偏差等同于选择偏差或前视偏差吗?

不等同。选择偏差指任何导致样本不具代表性的选择方式;前视偏差指使用了当时不可得的未来信息;倖存者偏差特指 “未幸存者缺失”,从而让可见数据系统性偏乐观。

如何在报告或数据集中识别倖存者偏差?

留意诸如 “active funds(在运作基金)”“current constituents(当前成分)”“available tickers(可用代码)” 等表述,并检查方法说明是否解释了清盘、退市、清算与并购的处理方式。若纳入规则不清晰,应默认存在倖存者偏差风险。

倖存者偏差对指数投资也重要吗?

对研究分析尤其重要。若用今天的指数成分重建历史,会遗漏被剔除或失败的成分。官方指数总回报序列可能相对稳健,但成分变更仍会影响你对 “这段历史代表什么” 的解释。


总结

倖存者偏差会通过排除已经消失的失败者,让市场、基金与策略看起来更赚钱、风险更低,从而高估历史业绩与一般属性。应对它通常不是依靠单一指标,而是一套研究实践:清晰定义投资范围、使用时点数据、纳入未幸存者,并对比仅幸存者与全样本结果。把 “消失的失败” 当作结果的一部分纳入分析,能帮助形成更贴近现实的预期,并支持更审慎的决策。

免责声明:本内容仅供信息和教育用途,不构成对任何特定投资或投资策略的推荐和认可。