在基础临床相结合的趋势中,许多小伙伴可能都遇到过预测模型构建的难题。特别是在肿瘤领域,各类药物敏感性预测非常重要,也离不开癌细胞系药物基因组学。精准肿瘤学的目标是利用肿瘤的基因组图谱进行个体化治疗,基于癌细胞系的多重组学数据机器学习方法已经被用来预测药物敏感性。然而,如何正确训练和验证机器学习模型,在此之前还没有全面的指导方针。

这篇发表于年的药物基因组学(PGx)指南,对以下问题做出了全面解答:

1.哪些药物敏感性数据集和衡量标准最适合用来训练预测模型?

2.当药物基因组学方法从域内分析转移到跨域分析时,其预测效能发生了多大的变化?

3.非固体肿瘤组织对药物敏感性预测的效能有何影响?

01文章思路02内容介绍

一、PGx指南流程示意图

(A)从ORCESTRA平台获得原始药物基因组学数据集。

(B)通过PharmacoGx软件包获得每个数据集的分子(RNA-SEQ)和药理学概况(剂量-反应曲线以上面积/AAC)。

(C)通过PharmacoGx软件包执行基于文献中预期生物标志物的单变量建模,使用其他软件包执行基于蛋白质编码基因和特征选择的多变量建模。

二、药敏指标的确定

为了了解药物反应的预测因素,需要获得一个单一的数字来总结特定细胞系对药物治疗的敏感性。一般而言,IC50(半数抑制浓度)与AAC/AUC(剂量反应曲线上方/下方的面积)是比较常用的指标。

三、数据集的选用

本指南中采用了癌症治疗反应门户(CTRPv2)、Genentech细胞系筛选计划(GCSI)及癌症药物敏感性基因组学(GDSCv1和GDSCv2)等泛癌数据集。在本文中,我们重点介绍了这些数据集共有的11种药物,包括:硼替佐米、恩替他、西罗莫司、多西他赛、吉西他滨、克唑替尼、拉帕替尼、伏立诺他、埃罗替尼、紫杉醇和皮克替利。

四、临床前药物基因组学进展现状

作者对目前机器学习模型使用的数据集及药物敏感性预测因子等指标进行了统计总结。

由图可见,IC50是最常用的测量方法,跨域训练分析方法更为常见,且大多数模型是基于GDSCv1基因表达数据进行训练的。

五、针对重要问题的解答

为研究数据差异对药物敏感性预测因子的影响,作者们进行了域内和跨域两种研究。

在对PGx指南纳入的指标进行分析时,作者使用了不同的度量标准,包括Pearson相关分析、Spearman相关分析、均方根误差分析(RMSE)、Jaccard指数和标准化回归系数等,得到以下结果:

1.哪些药物敏感性数据集和衡量标准最适合用来训练预测模型?

CTRPv2、GCSI和GDSCv2数据集中有量化表达的基因约个,作者计算了这些数据集中11种常见药物与药物反应的关联强度,然后按大小进行排序,计算Jaccard指数,可见大多数药物AAC产生了最稳定的基因表达标志物排名;同时,使用岭回归和弹性网络的域内分析再次证实了稳定性分析的结果:在研究指标方面,IC50对数截断值优于其他预处理IC50的方法。单变量跨域稳定性分析表明,AAC和IC50对数截断值与药物反应的相关性最稳定;而多变量域内分析证实,就Pearson和Spearman相关性而言,AAC是比IC50更合适的药物敏感性衡量指标。

同时作者们观察到,在CTRPv2上训练的模型在Pearson相关性方面表现出更好的性能,在Spearman相关性和RMSE中观察到类似的结果,这表明药物筛选试验和样本量之间的一致性在跨域推广中起着重要作用。多变量分析表明,在CTRPv2上训练的模型在通用性与稳定性上优于GDSCv1。

2.当药物基因组学方法从域内分析转移到跨域分析时,其预测效能发生了多大的变化?

为了研究药物敏感性预测因子的普适性,作者在CTRPv2数据集上训练了不同的模型,并使用GDSCv2和GCSI数据集对模型进行了测试。多变量分析表明,当从域内分析转为跨域分析时,模型的效能会下降。使用多变量方法进行的跨域分析也再次证实,与IC50相比,AAC是一个更好的度量标准。作者建议从一个基因(或生物标记物)的简单分析开始,然后在一个数据集内执行多变量建模,最后在多个数据集上执行多变量建模。

3.非固体肿瘤组织对药物敏感性预测的效能有何影响?

与固体肿瘤样品相比,非固体肿瘤样品的灵敏度结果(AAC)明显不同,而且它们往往比固体肿瘤样本更敏感。作者们通过计算精确度召回曲线下面积(AUPR),训练岭回归模型等方法进行验证,并用GDSCv2和GCSI数据集对模型进行测试,以Pearson分析、Spearman分析和RMSE的形式报告结果。结果表明非固体样本的分子谱和药物敏感性的差异对药物敏感性预测有负面影响,建议在机器学习建模之前去除所有非固体组织,或进行分层分析。

03文章总结

PGx指南的应用有助于开发更稳定、通用的机器学习模型,也使临床前生物标记物的开发更准确。但指南没有涵盖所有方面,例如指南只



转载请注明地址:http://www.nasaoa.com/nsjp/9704.html