BUSTED-PH

根据Selberg等(2026)发表的预印本论文，BUSTED-PH 是在经典 BUSTED 模型基础上的重要扩展，其核心区别在于BUSTED-PH专门设计用于检测与特定表型性状相关联的间歇性正选择，而经典BUSTED仅用于检测基因层面是否存在正选择，不与具体表型挂钩。

两者的主要区别对比如下：

1. 核心目标与设计哲学

BUSTED: 是一个基因层面的检验，旨在回答“这个基因在整个进化历史中是否经历过间歇性的正选择？”它检测的是基因内部是否存在位点在某些分支上经历正选择（dN/dS > 1），但不区分这些分支是否具有特定的表型。
BUSTED-PH: 是一个基因-表型关联层面的检验，旨在回答“这个基因的正选择信号是否与我所关注的表型性状的进化特异相关？”它明确地将系统发育树上的分支划分为前景分支（拥有目标表型） 和背景分支（不拥有该表型），并对比两者之间的选择机制。
2. 方法模型与检验框架

这是最根本的区别。BUSTED-PH在BUSTED模型的基础上，引入了表型分区和三重检验的框架：
分支划分: BUSTED-PH要求用户输入一个二元的表型状态（如有/无回声定位），并将树上的所有分支相应标记为“前景”或“背景”。对于内部节点，提供了多种祖先状态重建策略（如“共联”策略，仅当某节点的所有后代都具有该表型时才将其标记为前景）。
三重似然比检验:
1. 前景选择检验: 检测前景分支上是否存在间歇性正选择（类似经典BUSTED，但仅针对前景分支）。
2. 背景选择检验: 检测背景分支上是否存在间歇性正选择。这是一个关键创新，用于识别在整个谱系中普遍存在的适应性进化，这种进化可能与目标表型无关。
3. 机制差异检验: 检验前景分支和背景分支的选择压力分布是否显著不同。这是BUSTED-PH的核心，确保检测到的信号是前景分支特有的，而非全树共有的模式。
  3. 输出与解读
BUSTED: 输出一个p值，表明该基因是否在整个树上经历了正选择。但无法区分这种选择是普遍存在的，还是与某个特定性状相关。
BUSTED-PH: 输出一个综合的、保守的p值，该值要求同时拒绝“前景分支无选择”和“前景与背景选择机制无差异”这两个零假设。此外，它还提供一个启发式过滤器，用于优先考虑那些背景分支没有强烈选择信号的基因，从而最大限度地确保找到的表型关联是特异的。
4. 解决的问题与优势
BUSTED 的优势在于广泛筛查经历过适应性进化的基因。
BUSTED-PH 的优势在于精准隔离与表型相关的适应性进化信号，有效过滤两类主要噪声：
- 普遍性适应: 在全系统发育背景下都受到正选择的基因（如一些免疫基因）。
- 模型误设导致的假阳性: 通过直接对比前景与背景，减少了因进化模型不匹配而产生的错误关联。文中应用显示，在哺乳动物回声定位的全基因组筛选中，虽然单独的前景选择检验识别出761个基因，但经过BUSTED-PH的三重检验和过滤后，最终仅确认72个基因与回声定位显著相关，筛选掉了90%以上的候选者，体现了其严格性[1]。
  总结
  
  简而言之，BUSTED是检测“有没有选择”的工具，而BUSTED-PH是检测“选择是否与特定表型相关”的工具。BUSTED-PH通过将进化分支按表型分类并严格比较其间的选择机制，解决了传统方法难以区分性状特异性适应和背景进化噪声的难题，为研究趋同进化等表型背后的分子机制提供了更鲁棒的统计框架。

BUSTED-PH

1. 核心目标与设计哲学

2. 方法模型与检验框架

3. 输出与解读

4. 解决的问题与优势

总结