结肠癌免疫相关基因筛选和预后模型建立

齐荣暄, 刘格良, 穆俊芳, 李晨龙, 李渊, 贺培凤, 于琦

齐荣暄, 刘格良, 穆俊芳, 李晨龙, 李渊, 贺培凤, 于琦. 结肠癌免疫相关基因筛选和预后模型建立[J]. 实用临床医药杂志, 2023, 27(14): 63-71, 77. DOI: 10.7619/jcmp.20231576
引用本文: 齐荣暄, 刘格良, 穆俊芳, 李晨龙, 李渊, 贺培凤, 于琦. 结肠癌免疫相关基因筛选和预后模型建立[J]. 实用临床医药杂志, 2023, 27(14): 63-71, 77. DOI: 10.7619/jcmp.20231576
QI Rongxuan, LIU Geliang, MU Junfang, LI Chenlong, LI Yuan, HE Peifeng, YU Qi. Screening of immune-related genes and establishment of prognostic model for colon cancer[J]. Journal of Clinical Medicine in Practice, 2023, 27(14): 63-71, 77. DOI: 10.7619/jcmp.20231576
Citation: QI Rongxuan, LIU Geliang, MU Junfang, LI Chenlong, LI Yuan, HE Peifeng, YU Qi. Screening of immune-related genes and establishment of prognostic model for colon cancer[J]. Journal of Clinical Medicine in Practice, 2023, 27(14): 63-71, 77. DOI: 10.7619/jcmp.20231576

结肠癌免疫相关基因筛选和预后模型建立

基金项目: 

山西省重点研发计划项目 202102130501003

山西省重点研发计划项目 201903D311011

山西省回国留学人员科研资助项目 HGKY2019057

山西医科大学省级博士基金项目 SD2229

山西省研究生教育创新项目 2022Y426

详细信息
    通讯作者:

    于琦, E-mail: yuqi@sxmu.edu.cn

  • 中图分类号: R735.3;R730.7

Screening of immune-related genes and establishment of prognostic model for colon cancer

  • 摘要:
    目的 

    筛选结肠癌(CC)关键预后相关免疫基因(KIGs), 构建免疫相关预后模型。

    方法 

    从癌症基因组图谱(TCGA)数据库中下载CC患者的基因表达数据和临床数据, 基于免疫分型筛选差异表达基因(DEGs), 将DEGs与ImmPort数据库中免疫基因取交集得到差异表达免疫基因(DEIGs)。通过单因素Cox回归分析、Lasso-Cox回归分析筛选出KIGs, 建立免疫相关预后模型,并验证预后模型的预测性能。分析风险评分与临床特征、免疫浸润细胞、肿瘤突变负荷、微卫星不稳定性的相关性。应用单因素和多因素Cox回归分析筛选CC的独立预后因素,进一步构建用于预测CC患者总生存率(OS)的列线图。

    结果 

    基于免疫分型筛选出1 439个DEGs, DEGs与ImmPort数据库免疫基因取交集得到379个DEIGs, 通过单因素Cox回归分析、Lasso-Cox回归分析筛选出12个KIGs, 构建免疫相关预后模型。高风险评分(高风险组)患者和低风险评分(低风险组)患者的OS差异有统计学意义(P < 0.05);预后模型预测1、3、5年OS的受试者工作特征曲线的曲线下面积(AUC)分别为0.735、0.725、0.699, 表明预后模型的预测效果较好。不同疾病分期、不同TNM分期患者的风险评分比较,差异有统计学意义(P < 0.05);KIGs与众多免疫浸润细胞均存在相关性(P < 0.05);高风险组与低风险组的肿瘤突变负荷比较,差异有统计学意义(P < 0.05);高风险组的微卫星不稳定性比低风险组更强。单因素和多因素Cox回归分析发现,风险评分是CC的独立预后因素(P < 0.001), 进一步构建的列线图对CC患者生存状态具有良好的预测能力和准确性。

    结论 

    本研究构建了基于12个KIGs的免疫相关预后模型,并建立了可用于预测CC患者OS的列线图,有助于医生做出个体化治疗决策。

    Abstract:
    Objective 

    To screen key prognosis-related immune genes(KIGs) in colon cancer(CC) and construct immune-related prognostic model.

    Methods 

    The gene expression data and clinical data of CC patients were downloaded from the Cancer Genome Atlas (TCGA), differential expressed genes (DEGs) were screened based on immune typing, and the intersection of DEGs and immune genes of ImmPort database was used to obtain differentially expressed immune genes (DEIGs). Univariate Cox analysis and Lasso-Cox analysis were used to screen KIGs to establish immune-related prognostic models. Next, the predictive performance of the prognostic model was verified. The correlations of risk score with clinical features, immune infiltrating cells, tumor mutation burden, and microsatellite instability were analyzed. Independent prognostic factors of CC were screened by univariate and multivariate Cox analysis, and a nomogram related to overall survival rate (OS) was constructed to predict the overall survival rate of CC patients.

    Results 

    A total of 1, 439 DEGs were screened out based on immune typing, and 379 DEIGs were obtained by the intersection of DEGs and immune genes of ImmPort database. A total of 12 KIGs were screened out by univariate Cox analysis and Lasso-Cox analysis, and an immune-related prognostic model was constructed. There was a significant difference in OS between high-risk score patients(high-risk group) and low-risk score patients (low-risk group)(P < 0.05). The area under the receiver operating characteristic curve (AUC) for 1-, 3- and 5-year were 0.735, 0.725 and 0.699, respectively, which showed that the model had a good predictive effect. There were significant differences in risk scores of patients with different disease stages and different TNM stages (P < 0.05); KIGs was correlated with numerous immune infiltrating cells (P < 0.05); micro-satellite instability was greater in the high-risk group than in the low-risk group. Univariate and multivariate Cox regression analysis showed that risk score was an independent prognostic factor for CC (P < 0.001), and the further constructed nomogram had good predictive power and accuracy for the survival status of CC patients.

    Conclusion 

    An immune-related prognostic model based on 12 KIGs is constructed in the study, and a nomogram is developed to predict overall survival in CC patients, which could help physicians make individualized treatment decisions.

  • 结肠癌(CC)是临床常见的消化道恶性肿瘤,其发病率、致死率在癌症中均位居前列[1]。早发现、早诊断和早治疗可显著改善CC患者的预后,但多数患者确诊CC时已达晚期,并不适合接受手术治疗,生存质量受到严重影响[2]。目前, TNM分期仍然是临床实践中预后预测的主要依据,但其局限性日益凸显,TNM分期相同的CC患者在治疗方法及预后方面存在显著差异[3]。这是因为TNM分期仅局限于肿瘤病理特征这一因素,而忽略了肿瘤微环境(TME)和免疫成分的影响,预测结果可能不够精确。近年来,免疫微环境在肿瘤发生、发展、侵袭和转移过程中的作用机制不断被发现[4]。研究[5-6]表明,在CC的发生和发展过程中,免疫相关基因通过调节炎症反应或影响肿瘤免疫监视发挥着重要作用。以免疫相关基因构建的预后模型已被证明在胃癌、膀胱癌中具有较好的预后预测潜力[7-8], 然而目前尚无基于免疫相关基因的预后模型用于评估CC的TME并预测CC患者的预后。本研究根据CC的免疫分型,分析肿瘤免疫间的相互作用,利用Lasso-Cox方法筛选出免疫相关基因作为生物标志物,构建免疫相关预后模型,并建立可用于预测CC患者OS的列线图,以期帮助医生对CC患者做出个体化治疗决策。

    从癌症基因组图谱(TCGA)数据库选择TCGA-COAD下载标准化基因表达的RNA-seq数据、临床数据和体细胞突变数据。根据体细胞突变数据计算每个样本每百万碱基中被检测出的体细胞基因编码错误、碱基替换、基因插入或缺失错误的总数,定义为肿瘤突变负荷(TMB)。从癌症免疫组图谱(TCIA)数据库选择COAD下载微卫星不稳定性(MSI)数据。从高通量基因表达(GEO)数据库下载归一化基因表达数据和临床数据,数据集登录号为GSE39582。

    根据基因表达数据并利用R包"estimate"估计样本免疫细胞、基质细胞的含量水平分值,以及样本纯度数值。利用CIBERSORTx(https://cibersortx.stanford.edu/)工具,基于每个样本基因表达数据估算免疫细胞浸润的丰度。

    本研究采用R包(GSVA、GSEABase和limma)的ssGSEA算法,基于人类分子特征数据库(MSigDB)中29个免疫基因集,综合评估本研究中每个样本的免疫学特征。将原始值x通过min-max标准化映射成在区间[0, 1]中的值x′。然后,利用R软件中基于dist方法的欧氏距离和基于hclust方法的Ward′s linkage进行层次聚类分析,确定CC的亚型。通过R包"Rtsne"的tSNE算法来验证CC亚型的准确性。

    基于免疫分型将样本分为高免疫组和低免疫组,采用R包"limma"筛选差异表达基因(DEGs), 筛选条件为|log2 FC|>0.585(FC为差异倍数)、错误发现率(FDR) < 0.05。从ImmPort数据库下载免疫相关基因列表,将列表基因与DEGs取交集,得到差异表达免疫基因(DEIGs)。通过对DEIGs进行单因素Cox回归分析,得到PIGs(P < 0.05)。

    利用基因集富集分析(GSEA)探讨涉及DEGs的关键信号通路,该分析可分别展示京都基因与基因组百科全书(KEGG)和Hallmark基因组中显著富集的通路(FDR < 0.01)。

    利用Lasso惩罚的Cox回归分析筛选PIGs, 构建CC的免疫相关预后模型,参与预后模型构建的PIGs被称为关键预后相关免疫基因(KIGs), 风险评分的计算公式如下:

    $$ { The\;risk\;score }=\sum\limits_{i=1}^n {Coef}_i \times {Expr}_i $$ (1)

    式中, Expri表示基因i的表达水平, Coefi表示模型中基因i的回归系数。基于得到的风险评分计算中位数,根据中位数将所有患者样本分为高风险组、低风险组,并采用R包"survival" "survminer"进行Kaplan-Meier生存分析。采用R包"timeROC"生成具有时间依赖性的受试者工作特征(ROC)曲线,并计算1、3、5年总生存率(OS)的曲线下面积(AUC)来验证预后模型的预测能力。风险评分与临床特征、免疫浸润细胞、TMB、MSI的相关性采用Spearman相关分析法进行分析,2组比较采用Wilcoxon秩和检验,多组比较采用Kruskal-Wallis秩和检验。使用R包"maftools"工具获取、分析和可视化CC样本基因突变瀑布图。对风险评分和其他临床因素进行单因素和多因素Cox回归分析,确定独立预后因素,基于上述协变量通过R包"rms" "nomogramEx" "regplot"建立列线图,并采用ROC曲线和校准曲线验证建立的列线图是否适用于临床。P < 0.05为差异有统计学意义。

    基于29个免疫基因集,采用ssGSEA算法和层次聚类算法分析来自TCGA-COAD队列的479个肿瘤样本,将样本分为高免疫组和低免疫组(图 1A图 1B)。R包"estimate"评估结果显示,与低免疫组相比,高免疫组基质评分、免疫评分和综合评分水平较高,差异有统计学意义(P < 0.001), 见图 1C。免疫细胞浸润分析结果显示,高免疫组与低免疫组的初始B细胞、CD8+T细胞、静止的CD4+记忆T细胞、记忆激活CD4 T细胞、滤泡辅助性T细胞、单核细胞、M1型巨噬细胞、M2型巨噬细胞、中性粒细胞存在显著差异(图 1D)。进一步采用tSNE算法对CC患者进行免疫水平聚类验证,结果证明了聚类算法的可靠性(图 1E)。本研究比较高免疫和低免疫这2种亚型中的HLA基因表达情况,发现24种HLA基因在高免疫亚型中的表达水平均高于低免疫亚型,差异有统计学意义(P < 0.05), 见图 1F

    图  1  层次聚类分析结果
    A: 样本分为高免疫和低免疫这2种亚型; B: TCGA-COAD中的肿瘤微环境热图和免疫特征; C: 高免疫组和低免疫组免疫评分、基质评分、综合评分比较; D: 高免疫组和低免疫组的免疫细胞浸润分析; E: tSNE算法验证分型结果; F: 高免疫与低免疫亚型的HLA基因表达差异。

    对高免疫组和低免疫组进行基因差异表达分析,得到1 439个DEGs, 其中1 074个基因表达上调,365个基因表达下调。将ImmPort数据库中免疫基因与DEGs取交集,得到379个DEIGs, 其中365个基因表达上调, 14个基因表达下调(图 2A~图 2D)。采用单因素Cox回归分析筛选出15个PIGs, 见图 2E。为了深入了解免疫基因表达影响CC生物学过程的整体模式,本研究通过GSEA确定DEGs涉及的通路。在Hallmark基因集中, DEGs主要富集在免疫反应、信号传导、细胞生长与死亡等相关通路,见图 2F。KEGG通路中, DEGs主要富集在免疫系统、信号分子与相互作用信号传导等相关通路,见图 2G

    图  2  DEGs、DEIGs和PIGs的鉴定及富集分析
    A: DEGs与免疫基因的交集; B: DEGs热图; C: DEIGs热图; D: DEGs火山图; E: 基于单因素Cox风险回归分析的PIGs及其风险比; F: DEGs的Hallmark基因集富集分析; G: DEGs的KEGG基因集富集分析。

    将PIGs作为预选基因进行Lasso-Cox回归分析,筛选出12个KIGs用于构建预后模型,见图 3A~B。下载GEO数据库中556例CC患者的样本数据并筛选相应临床数据(表 1), 作为验证集验证预后模型的准确性。分别计算TCGA-COAD、GEO GSE39582数据集中每例CC患者的风险评分,并根据风险评分中位数将患者分为高风险组和低风险组(图 3C~D)。与低风险组相比,高风险组患者的生存时间较短,病死率较高,见图 3E~F。Kaplan-Meier曲线分析显示,低风险组的OS高于高风险组,差异有统计学意义(P < 0.05), 见图 3G~H。ROC曲线显示,预后模型预测TCGA-COAD中患者1、3、5年OS的AUC分别为0.735、0.725、0.699, 预后模型预测验证集中患者1、3、5年OS的AUC分别为0.615、0.607、0.584, 表明预后模型有着良好的预测能力和准确性,见图 3I~J

    图  3  预后模型的构建和验证
    A: 在Lasso模型中调整参数进行10倍交叉验证(2条虚线之间的区域表示合理值); B: 12个KIGs在Lasso模型中的coef系数剖面图; C、D: TCGA-COAD、GEO GSE39582数据集中CC患者风险评分的分布和中位值; E、F: TCGA-COAD、GEO GSE39582数据集中CC患者生存状态、生存时间和风险评分的分布情况; G、H: TCGA-COAD、GEO GSE39582数据集中不同生存风险患者的Kaplan-Meier生存曲线; I、J: 预后模型在TCGA-COAD、GEO GSE39582数据集中预测1、3、5年OS的ROC曲线。
    表  1  GEO GSE39582数据集556例CC患者的临床特征
    特征 分类 例数 占比/%
    年龄 >65岁 337 60.6
    ≤65岁 218 39.2
    未知 1 0.2
    性别 304 54.7
    252 45.3
    疾病分期 0期 4 0.7
    Ⅰ期 32 5.8
    Ⅱ期 262 47.1
    Ⅲ期 199 35.8
    Ⅳ期 59 10.6
    T分期 T0 1 0.2
    T1 11 2.0
    T2 44 7.9
    T3 360 64.8
    T4 117 21.0
    Tis期 3 0.5
    未知 20 3.6
    M分期 M0 474 85.2
    M1 60 10.8
    MX 2 0.4
    未知 20 3.6
    N分期 N0 299 53.8
    N1 133 23.9
    N2 98 17.6
    N3 6 1.1
    未知 20 3.6
    下载: 导出CSV 
    | 显示表格

    基于TCGA-COAD数据,对风险评分与临床特征、免疫浸润细胞、TMB、MSI的相关性进行检验,患者的临床特征见表 2。不同疾病分期、不同TNM分期患者的风险评分比较,差异有统计学意义(P < 0.05), 见图 4A~D。KIGs与众多免疫细胞均存在相关性(P < 0.05), 见图 4E。风险评分与TMB呈正相关(r=0.16, P=0.002 1), 见图 4F; 高风险组和低风险组患者的TMB比较,差异有统计学意义(P < 0.05), 见图 4G; 低TMB组OS高于高TMB组,差异有统计学意义(P < 0.05), 见图 4H; 瀑布图显示,肿瘤驱动突变基因腺瘤性息肉样腺癌基因(APC)突变频率最高,见图 4I。高风险组较低风险组患者MSI更强,见图 4J; 进一步比较微卫星稳定状态(MSS)、微卫星低不稳定性(MSI-L)和微卫星高不稳定性(MSI-H)的风险评分差异发现, MSS与MSI-H(P=2e-05)、MSI-L与MSI-H(P=0.049)的风险评分差异均有统计学意义,见图 4K

    表  2  TCGA-COAD中446例CC患者的临床特征
    特征 分类 例数 占比/%
    年龄 >65岁 263 59.0
    ≤65岁 183 41.0
    性别 234 52.5
    212 47.5
    疾病分期 Ⅰ期 75 16.8
    Ⅱ期 175 39.2
    Ⅲ期 124 27.8
    Ⅳ期 61 13.7
    未知 11 2.5
    T分期 T1 10 2.3
    T2 76 17.0
    T3 303 67.9
    T4 56 12.6
    Tis期 1 0.2
    M分期 M0 329 73.8
    M1 61 13.7
    MX 49 10.9
    未知 7 1.6
    N分期 N0 265 59.4
    N1 102 22.9
    N2 79 17.7
    下载: 导出CSV 
    | 显示表格
    图  4  风险评分与临床特征、KIGs、TMB、MSI的相关性分析
    A~D: 风险评分与疾病分期、TNM分期的相关性(不同分期比较所得数据为P值); E: KIGs与免疫浸润细胞的相关性; F: 风险评分与TMB的相关性; G: 高风险组与低风险组TMB比较; H: 高风险组与低风险组Kaplan-Meier生存曲线分析; I: 前30个突变基因瀑布图; J: 高风险组与低风险组MSI比较; K: 不同微卫星稳定性状态的风险评分比较(不同状态比较所得数据为P值)。

    将风险评分、年龄、性别和疾病分期作为协变量进行单因素和多因素Cox回归分析,结果显示,风险评分是CC患者的独立预后因素(P < 0.001), 见图 5A~B。结合上述因素,构建列线图,进一步发挥预后模型的临床可用性,见图 5C。ROC曲线显示,列线图对生存状态具有良好的预测能力和准确性,预测1、3、5年OS的AUC分别为0.821、0.817、0.778, 见图 5D。校准图显示,列线图的性能与理想模型相似,见图 5E

    图  5  列线图的建立和验证
    A: 单因素Cox分析; B: 多因素Cox分析; C: 基于风险评分和临床特征构建列线图; D: 列线图预测1、3、5年OS的ROC曲线; E: 列线图的校准图。

    根据国际癌症研究机构2020年发布的数据, CC是世界范围内第3位常见的恶性肿瘤,且是恶性肿瘤相关死亡的第2位原因,已成为严重危害人类身体健康的重要公共卫生问题[1]。研究[9]表明, TME中的免疫细胞在肿瘤进展中起着重要的作用。即使肿瘤侵袭性较小,如果获得性免疫反应较弱,预后也会变差; 相反,无论肿瘤的局部范围和侵袭程度如何,高密度的获得性免疫细胞都预示着良好的预后[10]。因此,医生对患者进行诊断时必须对TME细胞的数量和类型进行明确,并在治疗后尽可能量化,以有效地指导治疗。转录组学分析可利用少量的RNA样本进行研究,近年来研究者们开始关注基于转录组学的基因表达在肿瘤免疫治疗中的影响。本研究筛选出CC的KIGs用于构建预后模型,并建立可预测CC患者OS的列线图,这可能有助于CC患者的预后风险预测、肿瘤分期预测和免疫治疗。

    本研究利用ssGSEA算法将CC分为高免疫和低免疫亚型,高免疫亚型的免疫细胞浸润程度更高, HLA基因表达水平更高,表明其相较于低免疫亚型具有更强的免疫原性,与既往研究[11]结果一致。DEGs不仅在免疫相关信号通路中富集,还在许多癌相关通路中富集,包括凋亡、胰腺癌、JAK/STAT信号通路、MAPK信号通路和p53信号通路,与既往研究[12]结论(不同的免疫信号与JAK/STAT信号通路呈正相关)相符。值得注意的是,本研究结果揭示了CC中通路活性与免疫活性之间可能存在联系。

    本研究基于筛选出的12个KIGs构建预后模型,结果显示,高风险评分患者和低风险评分患者的OS曲线明显分离,且随着风险评分的升高,疾病分期、TNM分期越高,表明该预后模型对肿瘤分期具有一定预测能力。本研究筛选出的12个KIGs中,大多数与肿瘤的发生发展存在关系,且在CC中也发挥着非常重要的作用。ULBP2编码一种主要的组织相容性复合体Ⅰ类相关分子,该分子与自然杀伤细胞(NK细胞)上的NKG2D受体结合,触发多种细胞因子和趋化因子的释放,进而促进NK细胞的募集和活化,并破坏靶细胞[13]ULBP2是维持B7-H3赋予CC细胞对V-δ-2T细胞毒性抗性的必要基因[14]ANGPTL4可通过增强葡萄糖摄取促进具核梭杆菌定植,进而促进结直肠癌细胞的糖酵解活性,对结直肠癌的增殖和侵袭具有促进作用[15]ANGPTL4可作为前列腺素E2的下游效应分子,可促进肿瘤细胞对低氧的适应,进而促进结直肠癌发展[16]CX3CL1配体与其受体CX3CR1通过将NK细胞和T细胞等抗肿瘤免疫细胞招募到TME而控制肿瘤的生长,从而发挥抗肿瘤作用。但另一方面, CX3CL1-CX3CR1轴也激活了促肿瘤反应[17]。多项证据[18-19]表明, CX3CL1与结直肠癌显著相关,可导致预后不良。FABP4主要在脂肪组织和巨噬细胞中表达,在肥胖相关疾病中功能显著,其通过与多种经典途径(如PI3K/AKT和STAT3/ALDH1信号传导)相互作用,在肿瘤发生和侵袭中起着关键作用[20]FABP4在CC中过表达会增加脂肪酸转运,增强能量和脂质代谢,激活AKT通路和上皮间质转化,进而促进CC细胞的迁移和侵袭[21]。HE X F等[22]发现, BST2通过募集肿瘤相关巨噬细胞(TAMs)并将其诱导为M2表型而增加TAMs的浸润率,这有助于形成免疫抑制的TME, 进而促进结直肠癌发展。RBP7编码的蛋白质是细胞视黄醇结合蛋白家族的成员[23], RBP7可作为肿瘤微环境调节因子诱导5-氟尿嘧啶耐药,从而影响结直肠癌患者的预后[24]。另有研究[25]表明, RBP7高表达是早期和晚期CC患者特异性生存率低的独立生物标志物,在功能上有助于CC细胞的恶性表型。TGFb1属于转化生长因子-β(TGF-β)家族中的一员, TGF-β1信号在肿瘤细胞中具有双重性作用,既在癌症前期细胞中发挥有效的细胞抑制和促凋亡活性,也有利于恶性转化后期的上皮间质转化和转移。此外, TGFb1还可通过各种通路影响癌症相关成纤维细胞、内皮细胞以及肿瘤免疫浸润细胞的活性,进而影响肿瘤的发展[26], 这些通路在结直肠癌中同样被验证[27-29]APOBEC3F是胞苷脱氨酶基因家族的成员[30], 是在基因簇中发现的7个相关基因或假基因之一,这些基因编码的蛋白可能是RNA编辑酶,在生长或细胞周期控制中起作用。研究[31]表明, APOBEC3F存在意味着成纤维细胞具有强烈的促炎活性,可促进结直肠癌的发展。目前, IL1RL2CHGB在癌症领域中的相关研究尚较少,未来可进一步深入分析。总之,这些KIGs从免疫应答、肿瘤相关免疫细胞活性、免疫细胞浸润、能量和脂质代谢、肿瘤细胞的耐氧特性等方面影响肿瘤细胞的增殖、迁移和浸润。

    微卫星通常由1~6个短串联重复DNA序列组成,MSI被认为是结直肠癌的主要致癌途径之一,这种不稳定性是由缺陷DNA错配修复机制引起的,可导致体细胞突变,增加肿瘤突变负担[32]。研究[33]表明,相较于MSS、MSI-L的CC患者, MSI-H的CC患者接受免疫检查点抑制剂治疗可获得更好的治疗效果。本研究发现,高风险组患者的MSI状态更高,表明免疫检查点抑制剂治疗在高风险组患者中可能获益更大。本研究中,低TMB组CC患者的预后与高TMB组更好,与既往研究[34]结论一致。由此提示, TMB或可作为一个独立的生物标志物,指导更有效的免疫治疗策略,并改善预后。本研究还发现,高风险组与低风险组的TMB存在显著性差异, TMB与风险评分呈正相关,由于高体细胞突变意味着MSI高,具有更强的免疫治疗反应,更高的TMB与更好的免疫疗法疗效之间的相关性已得到证实[35]

    综上所述,本研究构建了基于12个KIGs的免疫相关预后模型,并建立了可用于预测CC患者OS的列线图,这可能有助于CC患者总体生存情况的预测和个性化治疗方案的优化。本研究亦存在一些局限性: 本研究仅基于TCGA公开数据集进行分析,未来可结合其他数据库的数据进一步深入研究; 本研究筛选出的12个KIGs与CC患者预后显著相关,但仅通过数据挖掘方法进行分析,这些基因的功能和机制有待进一步开展实验研究加以阐明。

  • 图  1   层次聚类分析结果

    A: 样本分为高免疫和低免疫这2种亚型; B: TCGA-COAD中的肿瘤微环境热图和免疫特征; C: 高免疫组和低免疫组免疫评分、基质评分、综合评分比较; D: 高免疫组和低免疫组的免疫细胞浸润分析; E: tSNE算法验证分型结果; F: 高免疫与低免疫亚型的HLA基因表达差异。

    图  2   DEGs、DEIGs和PIGs的鉴定及富集分析

    A: DEGs与免疫基因的交集; B: DEGs热图; C: DEIGs热图; D: DEGs火山图; E: 基于单因素Cox风险回归分析的PIGs及其风险比; F: DEGs的Hallmark基因集富集分析; G: DEGs的KEGG基因集富集分析。

    图  3   预后模型的构建和验证

    A: 在Lasso模型中调整参数进行10倍交叉验证(2条虚线之间的区域表示合理值); B: 12个KIGs在Lasso模型中的coef系数剖面图; C、D: TCGA-COAD、GEO GSE39582数据集中CC患者风险评分的分布和中位值; E、F: TCGA-COAD、GEO GSE39582数据集中CC患者生存状态、生存时间和风险评分的分布情况; G、H: TCGA-COAD、GEO GSE39582数据集中不同生存风险患者的Kaplan-Meier生存曲线; I、J: 预后模型在TCGA-COAD、GEO GSE39582数据集中预测1、3、5年OS的ROC曲线。

    图  4   风险评分与临床特征、KIGs、TMB、MSI的相关性分析

    A~D: 风险评分与疾病分期、TNM分期的相关性(不同分期比较所得数据为P值); E: KIGs与免疫浸润细胞的相关性; F: 风险评分与TMB的相关性; G: 高风险组与低风险组TMB比较; H: 高风险组与低风险组Kaplan-Meier生存曲线分析; I: 前30个突变基因瀑布图; J: 高风险组与低风险组MSI比较; K: 不同微卫星稳定性状态的风险评分比较(不同状态比较所得数据为P值)。

    图  5   列线图的建立和验证

    A: 单因素Cox分析; B: 多因素Cox分析; C: 基于风险评分和临床特征构建列线图; D: 列线图预测1、3、5年OS的ROC曲线; E: 列线图的校准图。

    表  1   GEO GSE39582数据集556例CC患者的临床特征

    特征 分类 例数 占比/%
    年龄 >65岁 337 60.6
    ≤65岁 218 39.2
    未知 1 0.2
    性别 304 54.7
    252 45.3
    疾病分期 0期 4 0.7
    Ⅰ期 32 5.8
    Ⅱ期 262 47.1
    Ⅲ期 199 35.8
    Ⅳ期 59 10.6
    T分期 T0 1 0.2
    T1 11 2.0
    T2 44 7.9
    T3 360 64.8
    T4 117 21.0
    Tis期 3 0.5
    未知 20 3.6
    M分期 M0 474 85.2
    M1 60 10.8
    MX 2 0.4
    未知 20 3.6
    N分期 N0 299 53.8
    N1 133 23.9
    N2 98 17.6
    N3 6 1.1
    未知 20 3.6
    下载: 导出CSV

    表  2   TCGA-COAD中446例CC患者的临床特征

    特征 分类 例数 占比/%
    年龄 >65岁 263 59.0
    ≤65岁 183 41.0
    性别 234 52.5
    212 47.5
    疾病分期 Ⅰ期 75 16.8
    Ⅱ期 175 39.2
    Ⅲ期 124 27.8
    Ⅳ期 61 13.7
    未知 11 2.5
    T分期 T1 10 2.3
    T2 76 17.0
    T3 303 67.9
    T4 56 12.6
    Tis期 1 0.2
    M分期 M0 329 73.8
    M1 61 13.7
    MX 49 10.9
    未知 7 1.6
    N分期 N0 265 59.4
    N1 102 22.9
    N2 79 17.7
    下载: 导出CSV
  • [1]

    SUNG H, FERLAY J, SIEGEL R L, et al. Global cancer statistics 2020: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J]. CA Cancer J Clin, 2021, 71(3): 209-249. doi: 10.3322/caac.21660

    [2] 陈卓林, 龚时文, 黄东, 等. 新辅助化疗对结直肠癌肝转移患者术前的临床效果[J]. 中国肿瘤临床与康复, 2019, 26(10): 1200-1203. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGZK201910014.htm
    [3]

    ANGELL H K, BRUNI D, BARRETT J C, et al. The immunoscore: colon cancer and beyond[J]. Clin Cancer Res, 2020, 26(2): 332-339. doi: 10.1158/1078-0432.CCR-18-1851

    [4] 吴介恒, 杨安钢, 温伟红. PD-1/PD-L1参与肿瘤免疫逃逸的研究进展[J]. 细胞与分子免疫学杂志, 2014, 30(7): 777-780. https://www.cnki.com.cn/Article/CJFDTOTAL-XBFM201407028.htm
    [5]

    TAURIELLO D V F, PALOMO-PONCE S, STORK D, et al. TGFβ drives immune evasion in genetically reconstituted colon cancer metastasis[J]. Nature, 2018, 554(7693): 538-543. doi: 10.1038/nature25492

    [6]

    O′CONNELL J, BENNETT M W, NALLY K, et al. Altered mechanisms of apoptosis in colon cancer: Fas resistance and counterattack in the tumor-immune conflict[J]. Ann N Y Acad Sci, 2000, 910: 178-192; discussion 193-195.

    [7] 刘革新, 刘盼, 陈维顺. 胃癌免疫相关LncRNA预后风险模型的建立与分析[J]. 现代消化及介入诊疗, 2021, 26(7): 849-853. doi: 10.3969/j.issn.1672-2159.2021.07.011
    [8]

    WANG Z Q, ZHU L P, LI L, et al. Identification of an immune gene-associated prognostic signature in patients with bladder cancer[J]. Cancer Gene Ther, 2022, 29(5): 494-504. doi: 10.1038/s41417-022-00438-5

    [9]

    LEI X, LEI Y, LI J K, et al. Immune cells within the tumor microenvironment: biological functions and roles in cancer immunotherapy[J]. Cancer Lett, 2020, 470: 126-133. doi: 10.1016/j.canlet.2019.11.009

    [10]

    GALON J, FRIDMAN W H, PAGE S F. The adaptive immunologic microenvironment in colorectal cancer: a novel perspective[J]. Cancer Res, 2007, 67(5): 1883-1886. doi: 10.1158/0008-5472.CAN-06-4806

    [11]

    SHEN C, LUO C, XU Z J, et al. Molecular patterns based on immunogenomic signatures stratify the prognosis of colon cancer[J]. Front Bioeng Biotechnol, 2022, 10: 820092. doi: 10.3389/fbioe.2022.820092

    [12]

    SLATTERY M L, LUNDGREEN A, KADLUBAR S A, et al. JAK/STAT/SOCS-signaling pathway and colon and rectal cancer[J]. Mol Carcinog, 2013, 52(2): 155-166. doi: 10.1002/mc.21841

    [13]

    DING H, YANG X, WEI Y Z. Fusion proteins of NKG2D/NKG2DL in cancer immunotherapy[J]. Int J Mol Sci, 2018, 19(1): 177. doi: 10.3390/ijms19010177

    [14]

    LU H M, MA Y C, WANG M Y, et al. B7-H3 confers resistance to Vγ9Vδ2 T cell-mediated cytotoxicity in human colon cancer cells via the STAT3/ULBP2 axis[J]. Cancer Immunol Immunother, 2021, 70(5): 1213-1226. doi: 10.1007/s00262-020-02771-w

    [15]

    ZHENG X, LIU R, ZHOU C C, et al. ANGPTL4-mediated promotion of glycolysis facilitates the colonization of Fusobacterium nucleatum in colorectal cancer[J]. Cancer Res, 2021, 81(24): 6157-6170. doi: 10.1158/0008-5472.CAN-21-2273

    [16]

    KIM S H, PARK Y Y, KIM S W, et al. ANGPTL4 induction by prostaglandin E2 under hypoxic conditions promotes colorectal cancer progression[J]. Cancer Res, 2011, 71(22): 7010-7020. doi: 10.1158/0008-5472.CAN-11-1262

    [17]

    LU X J. Structure and function of ligand CX3CL1 and its receptor CX3CR1 in cancer[J]. Curr Med Chem, 2022, 29(41): 6228-6246. doi: 10.2174/0929867329666220629140540

    [18]

    ZHENG J, YANG M, SHAO J H, et al. Chemokine receptor CX3CR1 contributes to macrophage survival in tumor metastasis[J]. Mol Cancer, 2013, 12(1): 141. doi: 10.1186/1476-4598-12-141

    [19]

    OLSEN R S, NIJM J, ANDERSSON R E, et al. Circulating inflammatory factors associated with worse long-term prognosis in colorectal cancer[J]. World J Gastroenterol, 2017, 23(34): 6212-6219. doi: 10.3748/wjg.v23.i34.6212

    [20]

    LIU S J, WU D, FAN Z Y, et al. FABP4 in obesity-associated carcinogenesis: novel insights into mechanisms and therapeutic implications[J]. Front Mol Biosci, 2022, 9: 973955. doi: 10.3389/fmolb.2022.973955

    [21]

    TIAN W Y, ZHANG W J, ZHANG Y, et al. FABP4 promotes invasion and metastasis of colon cancer by regulating fatty acid transport[J]. Cancer Cell Int, 2020, 20: 512. doi: 10.1186/s12935-020-01582-4

    [22]

    HE X F, CHEN H J, ZHONG X Y, et al. BST2 induced macrophage M2 polarization to promote the progression of colorectal cancer[J]. Int J Biol Sci, 2023, 19(1): 331-345. doi: 10.7150/ijbs.72538

    [23]

    FOLLI C, CALDERONE V, RAMAZZINA I, et al. Ligand binding and structural analysis of a human putative cellular retinol-binding protein[J]. J Biol Chem, 2002, 277(44): 41970-41977. doi: 10.1074/jbc.M207124200

    [24]

    HUANG X X, KE K, JIN W W, et al. Identification of genes related to 5-fluorouracil based chemotherapy for colorectal cancer[J]. Front Immunol, 2022, 13: 887048. doi: 10.3389/fimmu.2022.887048

    [25]

    ELMASRY M, BRANDL L, ENGEL J, et al. RBP7 is a clinically prognostic biomarker and linked to tumor invasion and EMT in colon cancer[J]. J Cancer, 2019, 10(20): 4883-4891. doi: 10.7150/jca.35180

    [26]

    STREEL G D, LUCAS S. Targeting immunosuppression by TGF-β1 for cancer immunotherapy[J]. Biochem Pharmacol, 2021, 192: 114697. doi: 10.1016/j.bcp.2021.114697

    [27]

    JIN Q N, JIN X, LIU T, et al. A disintegrin and metalloproteinase 8 induced epithelial-mesenchymal transition to promote the invasion of colon cancer cells via TGF-β/Smad2/3 signalling pathway[J]. J Cell Mol Med, 2020, 24(22): 13058-13069. doi: 10.1111/jcmm.15907

    [28]

    GULUBOVA M, ALEKSANDROVA E, VLAYKOVA T. Promoter polymorphisms in TGFB1 and IL10 genes influence tumor dendritic cells infiltration, development and prognosis of colorectal cancer[J]. J Gene Med, 2018, 20(2/3): e3005.

    [29]

    CHEN W, CHEN Y W, SU J, et al. CaMKII mediates TGFβ1-induced fibroblasts activation and its cross talk with colon cancer cells[J]. Dig Dis Sci, 2022, 67(1): 134-145. doi: 10.1007/s10620-021-06847-0

    [30] 陈清梅, 陈睿, 邓阳. 肝细胞癌组织中APOBEC3s类胞苷脱氨酶基因家族成员的表达观察[J]. 山东医药, 2018, 58(47): 15-19. doi: 10.3969/j.issn.1002-266X.2018.47.004
    [31]

    BOCCARELLI A, DEL BUONO N, ESPOSITO F. Colorectal cancer in Crohn's disease evaluated with genes belonging to fibroblasts of the intestinal mucosa selected by NMF[J]. Pathol Res Pract, 2022, 229: 153728. doi: 10.1016/j.prp.2021.153728

    [32]

    PICARD E, VERSCHOOR C P, MA G W, et al. Relationships between immune landscapes, genetic subtypes and responses to immunotherapy in colorectal cancer[J]. Front Immunol, 2020, 11: 369. doi: 10.3389/fimmu.2020.00369

    [33] 张娟学, 叶玉伟, 张军, 等. 免疫检查点抑制剂治疗结直肠肿瘤相关研究进展[J]. 现代消化及介入诊疗, 2022, 27(6): 781-785. https://www.cnki.com.cn/Article/CJFDTOTAL-XDXH202206027.htm
    [34]

    CHEN J J, APIZI A, WANG L, et al. TCGA database analysis of the tumor mutation burden and its clinical significance in colon cancer[J]. J Gastrointest Oncol, 2021, 12(5): 2244-2259. doi: 10.21037/jgo-21-661

    [35]

    SAMSTEIN R M, LEE C H, SHOUSHTARI A N, et al. Tumor mutational load predicts survival after immunotherapy across multiple cancer types[J]. Nat Genet, 2019, 51(2): 202-206. doi: 10.1038/s41588-018-0312-8

  • 期刊类型引用(1)

    1. 徐鑫龙,李桓,马凯旋. 沉默信息调节因子2相关酶1和集落刺激因子1受体表达与结肠癌患者临床特征和预后的关系. 实用临床医药杂志. 2024(23): 70-74 . 本站查看

    其他类型引用(0)

图(5)  /  表(2)
计量
  • 文章访问数:  501
  • HTML全文浏览量:  116
  • PDF下载量:  46
  • 被引次数: 1
出版历程
  • 收稿日期:  2023-05-15
  • 修回日期:  2023-06-23
  • 网络出版日期:  2023-07-30

目录

/

返回文章
返回
x 关闭 永久关闭