内部核糖体进入位点(IRES)是一段能够介导非帽依赖翻译机制的m RNA序列。癌细胞在遭遇细胞凋亡、免疫监视、化疗和放射性治疗等应激状态时,通过IRES元件介导的非帽依赖翻译维持基本功能,从而帮助癌细胞对应激环境产生抗性。目前在人类m RNA中存在着大量的IRES元件尚未被发ATM/ATR抑制剂现,实验鉴定IRES元件的过程复杂繁琐。随着大数据时代的到来,深度学习正在越来越广泛地应用于生物序列的预测。因此,构建深度学习模型来预测IRES元件成为一种值得借鉴的方法。而转录因子中存在着大量IRES元件,转录因子是调控细胞转录过程的蛋白质,控制着许多细胞过程,包括增殖、凋亡、分化和炎症。转录因子的失调导致了大量人类疾病的产生,尤其是癌症。靶向转录因子已经表现出强大的癌症治疗效果,因此转录因子具有巨大的抗癌治疗潜力。在所有癌症中,肺癌是最具侵略性的恶性肿瘤。由于早期症状不明显,肺癌的预后极差,肺癌患者5年生存率不足20%。肺癌在临床表现、组织病理学、治疗反应和术后复发风险方面具有很大的异质性。利用高通量测序技术分析癌症的分子特征,可以在肺癌的诊断、预后和治疗方面发现可靠的生物标志物。考虑到IRES元件和转录因子在肿瘤发生发展过程发挥着重要作用,我们开发了一种新的基于深度学习的IRES元件识别程序,从转录因子中识别具有IRES元件的基因,接着从中筛选与肺癌预后相关的基因,构建预后模型,最后,基于预后模型评估肺癌患者的预后状况。本论文的主要工作和结果如下:我们通过深度学习的方法构建了一种新的IRES元件识别程序——acute chronic infectionIREStest。该程序的训练数据集正负样本为经过实验验证的1209个序列,并首次使用了基于深度学习的模型构建IRES元件预测程序,其特征提取模块由双向门控循环单元(Bi GRU)组成。在加入Transformer中的预热学习策略优化后,IREStest在测试集上有着76.25%的预测准确度和97.50%的敏感性,以及68.42%的精确度和80.41%的F1值,并且在独立测试集中准确度和F1值达到了86.96%和86.96%。而现有的两个真核IRES元件预测程序IRESfinder和IRESPred测试集准确率分别为65.00%和52.50%。IREStest在准确性、敏感性和F1值上都展现出更优异的性能。与现有IRES元件预测程序对比,IREStest具有更强的预测性能。鉴于IRES元件和转录因子在肿瘤发生和发展中的重要作用,我们旨在建立一个基于IRES-转录因子基因的预后模型来预测肺癌患者的预后。首先,通过IREStest从1617个转录因子中筛选到762个可能含有IRES元件的IRES-转录因子基因。然后,从TCGA和GEO分别获得1019例和462例肺癌患者基因表达数据和临床信息,作为训练集和测试集。通过Cox回归分析和LASSO回归从IRES-转录因子基因中筛选与预后相关的基因,最后经过精心挑选得到17个IRES-转录因子基因对构建预后模型。根据这一模型将1019例来自TCGA的肺癌患者和462例GEO数据集中的肺癌患者分为高风险组和低风险组,生存分析表明基于IRES-转录因子基因构建的模型能够评估点击此处患者的生存时间(p<0.001)。在独立预后分析中表明由IRES-转录因子构成的风险值能够作为独立于年龄、性别、分级和分期的预后因子判断肺癌患者的预后。最后我们使用CIBERSORT分析了高风险组和低风险组之间的免疫细胞差异,并通过GO富集分析评估了高风险组和低风险组在生物过程、分子功能和细胞成分之间的差异。本文使用深度学习开发了一种新的IRES元件识别程序IREStest,并将该程序用于从转录因子中识别具有IRES元件的基因,并进一步从中筛选出与肺癌预后相关的基因。我们使用Cox回归分析和LASSO回归方法,最终选出了17个IRES-转录因子基因对来构建预后模型。这种基于预后模型的方法可以预测肺癌患者的预后状况,为肺癌的个性化治疗提供了新的思路和方法。本文研究成果有助于进一步研究IRES元件和转录因子在癌症中发挥作用的分子机制,为癌症的诊断和靶向治疗打下了良好的科学研究基础。