模型不如意十之八九,可拿出手无二三
呼和浩特最好的白癜风医院 http://pf.39.net/bdfyy/bdfzg/170112/5199035.html 今天是生信星球陪你的第天 大神一句话,菜鸟跑半年。我不是大神,但我可以缩短你走弯路的半年~ 就像歌儿唱的那样,如果你不知道该往哪儿走,就留在这学点生信好不好~ 这里有豆豆和花花的学习历程,从新手到进阶,生信路上有你有我! 今天又来开放性讨论啦。最近做了一个TCGA的数据分析,走到最后多因素cox模型构建这一步了,选择了三个基因,对数据集划分了高低风险,C-index值和timeROC计算的AUC值都还看得过去,but,就训练集的高低风险KM-plot出现了如此哭笑不得的交叉?(连测试机都没交叉,怎么训练集还叉上了) 疾病是乳腺癌,横坐标是月我发朋友圈问研究肿瘤的医学生们,模型成这种情况,是否可以使用?没想到这个问题很多人感触颇深,戳中了痛点:怎么看自己的模型,都是歪瓜裂枣,要么C-index值不够美丽,要么AUC值凄凄惨惨,要么就不稳定,训练集壮得像头牛,跑到测试集立刻痛哭流涕。 还有人晒出了寄几的同款图 以及已发表文章里那蜿蜒曲折并高冷不解释的交叉??? 看来我提的还是一个比较痛点的问题,在朋友圈和几个群里发出去,有幸收到了三五十条回复,我把讨论结果跟大家分享一下,总共有以下几个观点: 可以使用,因为p值小于0.05,并且趋势是对的。 不能使用kmplot,因为出现了交叉,不适合使用kmplot。 交叉点在个月以后,所以可以只讨论5年内或者8年内的,不考虑生存时间超长的那些病人(建模时去掉他们)。 可以分段讨论,说明一下为什么出现了交叉,我看到比较有说服力的理由是,可能因为过了个月后,样本的数量太少,导致比例变化大,不具有代表性了。 还想问一下,这一张,一小点的交叉,是否可能会被卡呢,要如何解释一下才好? 疾病是乳腺癌,横坐标是月插个小广告! 生信零基础入门学习小组 全国巡讲全球听(生信线上直播课,长期开班) 数据挖掘线上班(两天变三周,实力加量,长期开班) 一起来学单细胞吗? 答疑公告:生信星球答疑公告-年全年有效 豆豆花花攒钱买麦旋风,点一下广告=2毛
|
转载请注明地址:http://www.nasaoa.com/nstq/9673.html
- 上一篇文章: 滴滴滴工业级AI视觉模型部署内部课件免
- 下一篇文章: 没有了