您的位置: 复禾首页 > 中医 > 前沿资讯 > 正文

肿瘤细胞的驱动突变,麻省理工科学家发明癌症驱动的突变挖掘算法

发布时间: 2022-08-06 13:17

用手机扫描二维码 在手机上继续观看

手机查看

肿瘤细胞正是得益于一些具有“正向选择“功能的驱动突变,这种基因突变往往能起到促进细胞生长、入侵、抵抗死亡等作用。从而赋予肿瘤细胞增殖优势。识别这些突变的驱动基因一直是了解肿瘤发病机制和寻找相应治疗策略的重要组成部分。

肿瘤细胞的驱动突变,麻省理工科学家发明癌症驱动的突变挖掘算法

但肿瘤基因组中存在许多中性突变(对肿瘤的发生发展并不关键),且来自不同组织的肿瘤的突变具有一定的特异性,如何判断一个突变是驱动突变还是中性突变一直以来都是肿瘤领域研究的热点与难点.

最近,一个来自麻省理工学院BonnieBerger教授团队和哈佛医学院Po-RuLoh教授的团队在通过深度学习的方法绘制了千碱基级分辨率的癌症特异性体细胞突变率图谱,并在此基础上开发了可快速、精准识别肿瘤基因组中任意位置驱动突变的方法(Dig算法)。

研究人员利用这种算法探索了肿瘤非编码区发现了内含子中隐蔽剪接单核苷酸变异,及5’非翻译区突变在部分驱动基因(如TP53)中起到关键作用,的驱动突变,相关研究发表在期刊《自然生物技术》。

通常,识别驱动突变的方法主要有两种,一种是基于癌症驱动突变比中性突变频率更高的频率算法,另一种是基于突变基因编码的蛋白质的危害性评估的基因功能算法。对于第一种算法,识别过度突变的关键在于准确的体细胞中性突变率模型。

为了构建特定类型肿瘤的全基因组体细胞突变率模型,研究人员使用概率深度学习模型,通过识别以下两个特征进行计算:由表观遗传学特征如染色质可及性等导致的千碱基级变异,以及由DNA序列改变如紫外线暴露等导致的碱基对级变异。

肿瘤细胞的驱动突变,麻省理工科学家发明癌症驱动的突变挖掘算法

通过PCAWG(泛癌数据库)、Roadmap表观基因组学(表观遗传学数据库)、ENCODE(转录调控数据库)和参考基因组的数据,应用Dig算法构建了37种癌症类型的突变率图谱和推断的核苷酸突变偏向性。

研究员构建特定类型肿瘤的全基因组体细胞突变率模型

通过比对Dig预测的突变率及实际的突变率,Dig成功预测10-kb区域内单核苷酸变异(SNV)的中位数为77.3%,在1-Mb区域内的中位数为94.6%。由于Dig具有识别局部表观遗传结构的能力(如活跃的转录起始点),并将这些结构与突变率联系起来,其识别突变的效率及准确性优于同类的其他模型。

在构建的体细胞突变率模型具有优异准确性的基础上,Dig识别肿瘤驱动基因的效率自然也不遑多让。相比于其他用于识别驱动突变的算法,Dig在全基因组或全外显子测区的样本中显示出相同或更好的效率。

值得一提的是,使用Dig识别潜在的驱动基因比现有方法快1-5个数量级,Dig只需要不超过90秒,就可抵得上现有方法10分钟到超过2天的计算。

相比于同类型算法,Dig在预测体细胞突变路及识别肿瘤驱动基因的效率更好

对于编码区的驱动突变,已有很多算法进行研究,因此,研究人员着重利用Dig对非编码区的驱动突变进行研究,这也是Dig算法的一大优势,先前的许多算法都仅适用于寻找编码区的驱动突变。

首先,研究人员利用Dig算法来量化肿瘤中可能存在于基因外显子和内含子中的隐蔽剪接SNV(经典剪切位点外的体细胞突变并可致可变剪切)的程度。

肿瘤细胞的驱动突变,麻省理工科学家发明癌症驱动的突变挖掘算法

通过计算发现,在所选择研究的肿瘤抑制基因集中,隐蔽剪接SNV的发生频率要高于预期(P&0.001),且主要集中在内含子中。在肿瘤抑制基因集中,隐蔽剪接SNV约占到所有潜在驱动SNV的4.5%,略低于经典剪切SNV的频率(7.4%)。在12种肿瘤中,有7个肿瘤抑制基因具有显著的内含子隐蔽剪接SNV负担,如TP53和SMAD4。

抑癌基因中潜在驱动SNV各类型占比及7个具有显著的内含子隐蔽剪接SNV负担的抑癌基因

有趣的是,对于原癌基因,隐蔽剪接SNV发生的频率并不高,这提示隐蔽剪接SNV应该是导致功能丧失,而不是功能激活。

此外,研究人员还使用Dig算法研究了基因启动子中插入缺失标记(indels)的负荷。结果显示,TP53启动子是唯一具有全基因组显著indels负担的元件,且全为缺失突变(大部分缺失超过4个碱基)。这些突变集中在5’非翻译区,影响转录因子结合,抑制TP53的转录,从而驱动肿瘤发生。

TP53的5’非翻译区发生indels导致肿瘤发生

对106个肿瘤抑制基因和95个具有多外显子5’非翻译区的癌基因的5’非翻译区进行计算发现,ELF3的5’非翻译区同样有显著的SNV负担。然而,因为相应转录数据获取受限,研究人员无法对这些5’非翻译区突变的功能进行进一步分析。

肿瘤细胞的驱动突变,麻省理工科学家发明癌症驱动的突变挖掘算法

总的来说,研究人员基于概率深度学习方法开发的Dig算法可快速、准确地在测试基因组中寻找潜在的突变基因,其在构建中性突变率模型和识别候选驱动基因方面的强大性能,突出了深度学习在该类研究中的广阔前景。

Dig算法概览

由于Dig算法可快速评估分布在大范围基因组上的突变,因此其特别适用于识别弱或中等具有正向选择作用的驱动基因。

然而,该研究也有一定的缺陷,该研究仅靠计算预测,并不足以确定某一突变在肿瘤发生及发展中的因果作用,过量的突变率并不意味着其一定具有正向选择作用。因此,为了确定突变与肿瘤驱动因素的因果作用尚需实验验证。

更多健康资讯请点击医药头条,为您带来更多精彩内容!

该文章内容仅代表作者观点,不代表复禾健康观点,如涉及版权问题,请及时联系我们予以删除!
看病要趁早,不等待 不排队,全国知名专家 在线挂号
扫描左侧二维码,关注微信号:复禾健康,求医更省时更省心

推荐阅读

线上中医养生课助力健康知识科普,开启全民健康学习新风尚
线上中医养生课助力健康知识科普,开启全民健康学习新风尚
随着互联网的普及和中医养生文化的不断发展,线上养生课堂与中医课程平台,日益成为大众获取健康知识的重要途径,“每天学点儿养生知识”也成为了现代社会的“新时尚”,这种趋势的出现,不仅体现了现代人对健康生活的追求,也反映了健康教育方式的创新和发展...[详细]
2024-04-30 22:54
减重很辛苦但总瘦不下来?秀乎184饱腹巧克力,物理饱腹,轻松减重
减重很辛苦但总瘦不下来?秀乎184饱腹巧克力,物理饱腹,轻松减重
“为什么运动了一段时间还是不见瘦?”好多人在减重期都遇到过这个问题,这是因为运动耗能会很快陷入瓶颈,人体不适合长期依赖运动保持体重。想要变瘦,巧妙的饮食很重要。换句话说,减肥主要靠吃得巧,运动是辅助。秀乎184饱腹巧克力以自然饱腹、物理控体...[详细]
2024-04-30 17:40
发量回归不是梦,就看你愿不愿意相信达霏欣!
发量回归不是梦,就看你愿不愿意相信达霏欣!
脱发,这个看似微不足道的问题,却给许多人带来了巨大的困扰。无论男性还是女性,一旦面临脱发,自信心往往会受到严重打击,生活和工作也受到影响。然而,脱发问题并非不可战胜,通过科学合理的治疗方法,我们仍然可以有效地应对这一问题。了解脱发原因是前提...[详细]
2024-04-29 14:33
碎片化运动或能降低这种健康风险!绿瘦:让碎片化运动融入生活
碎片化运动或能降低这种健康风险!绿瘦:让碎片化运动融入生活
近年来,随着健康意识的日益增强,越来越多的人开始重视运动对身体健康的积极影响。然而,现实生活中的种种压力,如繁忙的工作、琐碎的事情等,使得很多人难以抽出固定的时间进行长时间的运动。为了解决这个问题,许多人开始寻找既能满足健康需求又不占用太多...[详细]
2024-04-29 13:23
中国医药教育协会新中医发展促进专业委员会换届大会在京成功召开
中国医药教育协会新中医发展促进专业委员会换届大会在京成功召开
4月23日,中国医药教育协会新中医发展促进专业委员会(以下简称:新中医专委会)换届大会在北京会议中心成功召开。中国医药教育协会终身荣誉会长、联合国国际生态生命安全科学院黄正明院士,中国医药教育协会副会长杨新波,全国人大代表、中国医药教育协会...[详细]
2024-04-27 12:53
京中盛会!2024 不孕不育生殖健康巡讲启动
京中盛会!2024 不孕不育生殖健康巡讲启动
4月23日,由中国医药教育协会主办、新中医发展促进专业委员会协办、好医生集团、好医生清宫药业支持的“2024不孕不育生殖健康巡讲专家行启动大会”在北京会议中心圆满举行。现场与会嘉宾近300人,线上超2000人共同见证本次大会。中国医药教育协...[详细]
2024-04-27 12:46
呵护中国儿童健康成长 葵花药业如何走好儿童用药赛道
近日,米内网发布儿科中成药领域销量TOP20产品。其中,葵花药业受到市场认可,旗下五个品牌成功上榜,成为此次上榜品牌数量最多的医药企业。用妈妈心做儿童药回顾葵花药业成立以来的儿药市场策略,如何“做好药”、让儿童“用好药”或许正是这家医药企业...[详细]
2024-04-26 14:20

精彩必读

夏季多发皮肤病该注意什么?夏季皮肤病用药小常识介绍
热门推荐 点击排行