人工智能对内镜医师疲劳状态下结直肠腺瘤检出率的影响

张丽贤, 陈倩, 刘颖, 孙悦, 卢冀超, 董梁, 尹平, 王丽华

张丽贤, 陈倩, 刘颖, 孙悦, 卢冀超, 董梁, 尹平, 王丽华. 人工智能对内镜医师疲劳状态下结直肠腺瘤检出率的影响[J]. 实用临床医药杂志, 2024, 28(23): 16-19, 26. DOI: 10.7619/jcmp.20243116
引用本文: 张丽贤, 陈倩, 刘颖, 孙悦, 卢冀超, 董梁, 尹平, 王丽华. 人工智能对内镜医师疲劳状态下结直肠腺瘤检出率的影响[J]. 实用临床医药杂志, 2024, 28(23): 16-19, 26. DOI: 10.7619/jcmp.20243116
ZHANG Lixian, CHEN Qian, LIU Ying, SUN Yue, LU Jichao, DONG Liang, YIN Ping, WANG Lihua. Impact of artificial intelligence on colorectal adenoma detection rate in fatigue state of endoscopists[J]. Journal of Clinical Medicine in Practice, 2024, 28(23): 16-19, 26. DOI: 10.7619/jcmp.20243116
Citation: ZHANG Lixian, CHEN Qian, LIU Ying, SUN Yue, LU Jichao, DONG Liang, YIN Ping, WANG Lihua. Impact of artificial intelligence on colorectal adenoma detection rate in fatigue state of endoscopists[J]. Journal of Clinical Medicine in Practice, 2024, 28(23): 16-19, 26. DOI: 10.7619/jcmp.20243116

人工智能对内镜医师疲劳状态下结直肠腺瘤检出率的影响

基金项目: 

河北省衡水市市级科技计划自筹项目 2020014046Z

详细信息
    通讯作者:

    陈倩

  • 中图分类号: R735.5;R574.6;R319

Impact of artificial intelligence on colorectal adenoma detection rate in fatigue state of endoscopists

  • 摘要:
    目的 

    分析人工智能(AI)对内镜医师疲劳状态下结直肠腺瘤检出率(ADR)的影响。

    方法 

    选取在河北省衡水市人民医院内镜中心接受结肠镜检查的患者784例为研究对象。依据患者操作时间段分为A组(n=405, 14: 00—15: 59)和B组(n=379, 16: 00—17: 30)。A组、B组中使用AI辅助检查的纳入AI亚组,未使用AI辅助检查的患者纳入无AI亚组。收集患者年龄、性别、肠道准备质量情况[波士顿肠道准备量表(BBPS)评分]等基线资料。统计A组、B组的结直肠ADR和结直肠息肉检出率(PDR)。比较A组、B组在有无AI辅助情况下的ADR。

    结果 

    A组总ADR为32.10%, 高于B组的26.91%, 但差异无统计学意义(P>0.05)。未使用AI辅助时, A组的ADR为25.85%, 高于B组的17.30%, 差异有统计学意义(P < 0.05)。B组使用AI辅助后, 其ADR高于A组未使用AI辅助,差异有统计学意义(P < 0.05); 未使用AI辅助时, A组PDR为33.17%, 高于B组的22.70%, 差异有统计学意义(P < 0.05)。使用AI辅助后, 2组PDR比较,差异无统计学意义(P>0.05)。在A组中, AI亚组(n=200)的ADR为38.50%, 无AI亚组(n=205)的ADR为25.80%, 差异有统计学意义(P=0.006)。在B组中, AI亚组(n=194)的ADR为36.08%, 无AI亚组(n=185)的ADR为17.30%, 差异有统计学意义(P < 0.001)。

    结论 

    AI辅助下的结肠镜检查可有效提高疲劳状态下内镜医师的结直肠ADR。

    Abstract:
    Objective 

    To analyze the impact of artificial intelligence (AI) on colorectal adenoma detection rate (ADR) in fatigue state of endoscopists.

    Methods 

    A total of 784 patients undergoing colonoscopy at the Endoscopy Center of Hengshui People's Hospital in Hebei Province were enrolled. Patients were divided into group A (n=405, time from 14: 00 to 15: 59) and group B (n=379, time from 16: 00 to 17: 30) based on the operation time. Patients in both groups who underwent AI-assisted examination were included in AI subgroup, while those without AI assistance were included in non-AI subgroup. Baseline data, including age, gender and bowel preparation quality [assessed by the Boston Bowel Preparation Scale (BBPS) score] were collected. The ADR and polyp detection rate (PDR) for colorectal lesions were calculated for both groups, and the ADR was compared between groups with and without AI assistance.

    Results 

    The overall ADR was 32.10% in the group A, which was higher than 26.91% in the group B, but the difference was not statistically significant (P>0.05). Without AI assistance, the ADR in the group A was 25.85%, which was significantly higher than 17.30% in the group B (P < 0.05). In the group B with AI assistance, the ADR was significantly higher than that in the group A without AI assistance (P < 0.05). Without AI assistance, the PDR in the group A was 33.17%, which was significantly higher than 22.70% in the group B (P < 0.05). After using AI assistance, there was no significant difference in PDR between the two groups (P>0.05). In the group A, the ADR was 38.50% in the AI subgroup (n=200) and 25.80% in the non-AI subgroup (n=205), with a statistically significant difference (P=0.006). In the group B, the ADR was 36.08% in the AI subgroup (n=194) and 17.30% in the non-AI subgroup (n=185), with a statistically significant difference (P < 0.001).

    Conclusion 

    AI-assisted colonoscopy can effectively improve the ADR of endoscopists under fatigue conditions.

  • 结直肠癌是常见恶性肿瘤之一,其发病率与致死率呈持续上升趋势,多数患者在确诊时已处于疾病晚期[1-2]。“正常黏膜-结直肠腺瘤-结直肠癌”被认为是结直肠癌发生的主要路径。因此,在结直肠腺瘤阶段进行准确筛查并阻止其进一步发展,已成为降低结直肠癌发病率的关键措施。该措施的有效实施很大程度上依赖于结肠镜检查技术的应用。结肠息肉漏诊现象普遍,总漏诊率为6.00%~27.00%[3]。除受内镜医师诊断经验、操作水平、退镜检查时间、肠道解剖结构和患者肠道清洁度影响以外,内镜医师的疲劳状态也是导致病变漏诊的重要原因。

    疲劳可分为生理性(身体疲劳)和心理性(精神疲劳)。对于经验丰富的内镜医师,鉴于操作的实际体力负荷相对较小,其生理疲劳通常不对整体身体机能产生显著影响,因此生理性疲劳不被视为影响结肠镜检查质量的因素。心理性疲劳会随着工作时间延长和工作强度增加而累积,并且缺乏直观的量化评估手段。研究[4]表明,检查时间每延后1 h, 腺瘤检出率(ADR)可下降4.6%(P=0.005)。相关研究常将内镜操作的中后时段定义为内镜医师可能出现疲劳的状态。研究[5-7]显示,人工智能(AI)辅助诊断可有效提高结直肠ADR。本研究探讨AI对不同操作时段内镜医师结直肠ADR的影响,并分析使用AI系统能否提升内镜医师在疲劳状态下的结直肠ADR。

    结直肠癌是常见恶性肿瘤之一,其发病率与致死率呈持续上升趋势,多数患者在确诊时已处于疾病晚期[1-2]。“正常黏膜-结直肠腺瘤-结直肠癌”被认为是结直肠癌发生的主要路径。因此,在结直肠腺瘤阶段进行准确筛查并阻止其进一步发展,已成为降低结直肠癌发病率的关键措施。该措施的有效实施很大程度上依赖于结肠镜检查技术的应用。结肠息肉漏诊现象普遍,总漏诊率为6.00%~27.00%[3]。除受内镜医师诊断经验、操作水平、退镜检查时间、肠道解剖结构和患者肠道清洁度影响以外,内镜医师的疲劳状态也是导致病变漏诊的重要原因。

    疲劳可分为生理性(身体疲劳)和心理性(精神疲劳)。对于经验丰富的内镜医师,鉴于操作的实际体力负荷相对较小,其生理疲劳通常不对整体身体机能产生显著影响,因此生理性疲劳不被视为影响结肠镜检查质量的因素。心理性疲劳会随着工作时间延长和工作强度增加而累积,并且缺乏直观的量化评估手段。研究[4]表明,检查时间每延后1 h, 腺瘤检出率(ADR)可下降4.6%(P=0.005)。相关研究常将内镜操作的中后时段定义为内镜医师可能出现疲劳的状态。研究[5-7]显示,人工智能(AI)辅助诊断可有效提高结直肠ADR。本研究探讨AI对不同操作时段内镜医师结直肠ADR的影响,并分析使用AI系统能否提升内镜医师在疲劳状态下的结直肠ADR。

    回顾性收集2020年8月—2021年1月在河北省衡水市人民医院内镜中心进行结直肠镜检查的患者资料,包括内镜报告和病理报告。纳入标准: 年龄为18~75岁者; 具备结肠镜检查适应证者。排除标准: 已知或疑似结直肠占位性病变者; 既往有结直肠外科手术史者; 肠道准备不合格,即总肠段波士顿肠道准备量表(BBPS)评分 < 6分者; 因口服阿司匹林等药物无法完成病理活检者。本研究经医院伦理学委员会批准。

    结肠镜检查主要在退镜过程中详细观察肠道黏膜,发现息肉并取病理组织活检,记录腺瘤检出情况。鉴于进镜时间差异,采用每位患者结肠镜检查完成时间进行分组。结肠镜检查统一安排在14: 00—17: 30进行,故将研究对象按操作时间段分为A组、B组,其中A组检查完成时间为14: 00—15: 59, B组检查完成时间为16: 00—17: 30。AI辅助诊断系统于2020年6月开始在本院内镜中心的消化内镜检查中应用。根据是否使用AI辅助检查,将患者进一步分为AI亚组与无AI亚组。

    回顾性收集2020年8月—2021年1月在河北省衡水市人民医院内镜中心进行结直肠镜检查的患者资料,包括内镜报告和病理报告。纳入标准: 年龄为18~75岁者; 具备结肠镜检查适应证者。排除标准: 已知或疑似结直肠占位性病变者; 既往有结直肠外科手术史者; 肠道准备不合格,即总肠段波士顿肠道准备量表(BBPS)评分 < 6分者; 因口服阿司匹林等药物无法完成病理活检者。本研究经医院伦理学委员会批准。

    结肠镜检查主要在退镜过程中详细观察肠道黏膜,发现息肉并取病理组织活检,记录腺瘤检出情况。鉴于进镜时间差异,采用每位患者结肠镜检查完成时间进行分组。结肠镜检查统一安排在14: 00—17: 30进行,故将研究对象按操作时间段分为A组、B组,其中A组检查完成时间为14: 00—15: 59, B组检查完成时间为16: 00—17: 30。AI辅助诊断系统于2020年6月开始在本院内镜中心的消化内镜检查中应用。根据是否使用AI辅助检查,将患者进一步分为AI亚组与无AI亚组。

    在研究期间,AI组和无AI组采用的结肠镜检查设备为日本奥林巴斯290系列及260系列。AI辅助诊断所用设备由武汉楚精灵医疗科技有限公司研发。所有执行肠镜检查的医师均为具有丰富经验的高年资医师(肠镜操作总例数>5 000例)。

    在研究期间,AI组和无AI组采用的结肠镜检查设备为日本奥林巴斯290系列及260系列。AI辅助诊断所用设备由武汉楚精灵医疗科技有限公司研发。所有执行肠镜检查的医师均为具有丰富经验的高年资医师(肠镜操作总例数>5 000例)。

    使用SPSS 26.0统计学软件进行数据分析。符合正态分布的计量资料以($\overline x $±s)表示,组间比较采用独立样本t检验。计数资料以[n(%)]表示,组间比较采用卡方检验。P < 0.05为差异有统计学意义。

    使用SPSS 26.0统计学软件进行数据分析。符合正态分布的计量资料以($\overline x $±s)表示,组间比较采用独立样本t检验。计数资料以[n(%)]表示,组间比较采用卡方检验。P < 0.05为差异有统计学意义。

    2020年8月—2021年1月,共纳入患者784例,其中A组405例, B组379例。A组中有200例(49.38%)使用AI辅助肠镜检查, B组中有194例(51.19%)使用AI辅助肠镜检查。2组使用AI辅助检查例数比较,差异无统计学意义(P=0.614)。2组平均年龄、性别以及BBPS评分比较,差异无统计学意义(P>0.05), 见表 1

    表  1  2组患者基线资料比较($\overline x $ ±s)[n(%)]
    项目 分类 A组(n=405) B组(n=379) P
    年龄/岁 53.67±11.01 53.46±11.56 0.790
    性别 235(58.02) 224(59.10) 0.759
    170(41.98) 155(40.90)
    BBPS评分 6分 109(26.91) 98(25.86) 0.737
    7~9分 296(73.09) 281(74.14)
    使用AI辅助 200(49.38) 194(51.19) 0.614
    205(50.62) 185(48.81)
    BBPS: 波士顿肠道准备量表。
    下载: 导出CSV 
    | 显示表格

    2020年8月—2021年1月,共纳入患者784例,其中A组405例, B组379例。A组中有200例(49.38%)使用AI辅助肠镜检查, B组中有194例(51.19%)使用AI辅助肠镜检查。2组使用AI辅助检查例数比较,差异无统计学意义(P=0.614)。2组平均年龄、性别以及BBPS评分比较,差异无统计学意义(P>0.05), 见表 1

    表  1  2组患者基线资料比较($\overline x $ ±s)[n(%)]
    项目 分类 A组(n=405) B组(n=379) P
    年龄/岁 53.67±11.01 53.46±11.56 0.790
    性别 235(58.02) 224(59.10) 0.759
    170(41.98) 155(40.90)
    BBPS评分 6分 109(26.91) 98(25.86) 0.737
    7~9分 296(73.09) 281(74.14)
    使用AI辅助 200(49.38) 194(51.19) 0.614
    205(50.62) 185(48.81)
    BBPS: 波士顿肠道准备量表。
    下载: 导出CSV 
    | 显示表格

    A组ADR为32.10%, 略高于B组的26.91%, 但差异无统计学意义(P>0.05)。通过对是否使用AI辅助肠镜检查进行分层分析,结果显示,未使用AI辅助时, A组的ADR为25.85%, 高于B组的17.30%, 差异有统计学意义(P < 0.05)。使用AI辅助后, 2组ADR比较,差异无统计学意义(P>0.05)。B组使用AI辅助后,其ADR高于A组未使用AI辅助,差异有统计学意义(P < 0.05)。未使用AI辅助时, A组PDR为33.17%, 高于B组的22.70%, 差异有统计学意义(P < 0.05)。使用AI辅助后, 2组PDR比较,差异无统计学意义(P>0.05)。在BBPS评分方面, 2组中7~9分患者的ADR、PDR高于6分患者。见表 2

    表  2  2组结直肠ADR、PDR比较[n(%)]
    项目 分类 腺瘤 息肉
    A组(n=405) B组(n=379) P OR(95%CI) A组(n=405) B组(n=379) P OR(95%CI)
    总检出 130(32.10) 102(26.91) 0.112 1.284(0.943~1.737) 152(37.53) 124(32.72) 0.159 1.235(0.921~1.658)
    使用AI辅助 53(25.85) 32(17.30) 0.041 1.667(1.018~2.729) 68(33.17) 42(22.70) 0.022 1.690(1.077~2.651)
    77(38.50) 70(36.08) 0.620 1.109(0.737~1.669) 84(42.00) 82(42.27) 0.957 0.989(0.663~1.476)
    BBPS评分 6分 12(11.01) 10(10.20) 0.851 1.089(0.448~2.644) 19(17.43) 17(17.35) 0.987 1.006(0.490~2.066)
    7~9分 118(39.86) 92(32.74) 0.075 1.362(0.968~1.915) 133(44.93) 107(38.08) 0.095 1.327(0.952~1.850)
    A组是否使用AI辅助患者的ADR与PDR计算分母分别为200、205例, B组分别为194、185例; A组BBPS评分为6分、7~9分患者的ADR与PDR计算分母分别为109、296例, B组分别为98、281例。
    下载: 导出CSV 
    | 显示表格

    A组ADR为32.10%, 略高于B组的26.91%, 但差异无统计学意义(P>0.05)。通过对是否使用AI辅助肠镜检查进行分层分析,结果显示,未使用AI辅助时, A组的ADR为25.85%, 高于B组的17.30%, 差异有统计学意义(P < 0.05)。使用AI辅助后, 2组ADR比较,差异无统计学意义(P>0.05)。B组使用AI辅助后,其ADR高于A组未使用AI辅助,差异有统计学意义(P < 0.05)。未使用AI辅助时, A组PDR为33.17%, 高于B组的22.70%, 差异有统计学意义(P < 0.05)。使用AI辅助后, 2组PDR比较,差异无统计学意义(P>0.05)。在BBPS评分方面, 2组中7~9分患者的ADR、PDR高于6分患者。见表 2

    表  2  2组结直肠ADR、PDR比较[n(%)]
    项目 分类 腺瘤 息肉
    A组(n=405) B组(n=379) P OR(95%CI) A组(n=405) B组(n=379) P OR(95%CI)
    总检出 130(32.10) 102(26.91) 0.112 1.284(0.943~1.737) 152(37.53) 124(32.72) 0.159 1.235(0.921~1.658)
    使用AI辅助 53(25.85) 32(17.30) 0.041 1.667(1.018~2.729) 68(33.17) 42(22.70) 0.022 1.690(1.077~2.651)
    77(38.50) 70(36.08) 0.620 1.109(0.737~1.669) 84(42.00) 82(42.27) 0.957 0.989(0.663~1.476)
    BBPS评分 6分 12(11.01) 10(10.20) 0.851 1.089(0.448~2.644) 19(17.43) 17(17.35) 0.987 1.006(0.490~2.066)
    7~9分 118(39.86) 92(32.74) 0.075 1.362(0.968~1.915) 133(44.93) 107(38.08) 0.095 1.327(0.952~1.850)
    A组是否使用AI辅助患者的ADR与PDR计算分母分别为200、205例, B组分别为194、185例; A组BBPS评分为6分、7~9分患者的ADR与PDR计算分母分别为109、296例, B组分别为98、281例。
    下载: 导出CSV 
    | 显示表格

    在A组中, AI亚组的ADR为38.50%, 无AI亚组的ADR为25.80%, 差异有统计学意义(P=0.006, OR=1.795, 95%CI: 1.176~2.741)。在B组中, AI亚组的ADR为36.08%, 无AI亚组的ADR为17.30%, 差异有统计学意义(P < 0.001, OR=2.699, 95%CI: 1.669~4.365)。在PDR方面, AI系统在B组中表现出更高的辅助效能,而在A组中效果不显著。见表 3

    表  3  AI系统在相同操作时间段的检出率比较[n(%)]
    项目 A组(n=405) B组(n=379)
    AI亚组(n=200) 无AI亚组(n=205) P OR(95%CI) AI亚组(n=194) 无AI亚组(n=185) P OR(95%CI)
    腺瘤检出 77(38.50) 53(25.85) 0.006 1.795(1.176~2.741) 70(36.08) 32(17.30) < 0.001 2.699(1.669~4.365)
    息肉检出 84(42.00) 68(33.17) 0.067 1.459(0.974~2.186) 82(42.27) 42(22.70) < 0.001 2.493(1.595~3.896)
    下载: 导出CSV 
    | 显示表格

    在A组中, AI亚组的ADR为38.50%, 无AI亚组的ADR为25.80%, 差异有统计学意义(P=0.006, OR=1.795, 95%CI: 1.176~2.741)。在B组中, AI亚组的ADR为36.08%, 无AI亚组的ADR为17.30%, 差异有统计学意义(P < 0.001, OR=2.699, 95%CI: 1.669~4.365)。在PDR方面, AI系统在B组中表现出更高的辅助效能,而在A组中效果不显著。见表 3

    表  3  AI系统在相同操作时间段的检出率比较[n(%)]
    项目 A组(n=405) B组(n=379)
    AI亚组(n=200) 无AI亚组(n=205) P OR(95%CI) AI亚组(n=194) 无AI亚组(n=185) P OR(95%CI)
    腺瘤检出 77(38.50) 53(25.85) 0.006 1.795(1.176~2.741) 70(36.08) 32(17.30) < 0.001 2.699(1.669~4.365)
    息肉检出 84(42.00) 68(33.17) 0.067 1.459(0.974~2.186) 82(42.27) 42(22.70) < 0.001 2.493(1.595~3.896)
    下载: 导出CSV 
    | 显示表格

    结直肠息肉主要分为较低风险息肉(如炎性息肉、增生性息肉)和潜在癌前腺瘤性息肉。根据“腺瘤-癌”理论的发展模式,对结直肠癌高危人群进行筛查,早期发现腺瘤并进行干预治疗是改善结直肠癌预后的关键措施[8-9]。ADR为衡量电子结肠镜检查质量的关键指标[10]。研究[7]显示,每增加1%的ADR, 致死性间隔期结直肠癌的风险降低5%。然而,结肠息肉的漏诊现象较为普遍[11]。研究[12]显示,结肠镜检查的息肉漏诊率约为25%。另一项回顾性研究[13]显示,结肠镜检查息肉漏诊率为22.5%, 其中小息肉(< 5 mm)占漏诊息肉的87.3%。研究[14]显示,结肠小息肉易被遗漏,而腺瘤的漏诊率高达26%。VAN RIJN J C等[15]对相关研究进行Meta分析显示,结肠镜检查的总体息肉漏诊率为22%。

    结肠息肉漏诊原因包括病变因素(息肉大小、部位、形态、数目等)和非病变因素(肠道清洁度、盲肠插管率、退镜时间、肠镜检查设备、患者舒适度和静脉麻醉等)。研究[16]表明,内镜医师的疲劳状态也是病变漏诊的重要原因之一。研究[17]表明,检查时间段为结肠镜检查质量的独立影响因素之一。一项荟萃分析[18]发现, ADR不受检查时间及内镜医师以上午、下午轮班方式检查的影响。但如果同一内镜医师全天工作则会导致下午的ADR显著降低。LU Z H等[19]按结肠镜检查时间进行分组,早期组(上午8: 00—10: 59或下午1: 00—2: 59)与晚期组(上午11: 00—12: 59或下午3: 00—4: 59)相比,早期组的ADR显著高于晚期组。排除停药时间、肠道准备情况及内镜医师资质等干扰因素后,当天内镜医师的累积疲劳是导致结肠镜检查质量下降的独立风险因素。上述研究主要针对全天工作的内镜医师, GURUDU S R等[20]将内镜医师分为全天工作组和半天工作组,在全天工作组中,上午的ADR显著高于下午,而在半天工作组中, ADR并不受上午、下午影响。分析全天工作时,后半时段ADR下降原因,考虑为连续和重复的视觉刺激可能削弱反应力和判断力,从而导致视野内息肉未被识别以及视野外息肉漏诊,同时增多退镜时的盲点[21-22]。在影像学及病理学等领域也观察到类似现象,长时间工作导致的视觉疲劳可增加漏诊率和误诊率[23-24]

    本研究中,内镜中心医师实行全天工作制。通过比较2个操作时段(14: 00—15: 59、16: 00—17: 30)的ADR, 旨在验证内镜医师的疲劳状态是否影响结肠镜检查的质量。结果显示, B组(6: 00—17: 30)ADR为26.91%, 低于A组(14: 00—15: 59)的32.10%, 但差异无统计学意义(P>0.05)。2组中均有部分患者为AI辅助肠镜检查,考虑这一因素可能会对结果造成影响,故根据是否使用AI辅助进行分层。本研究结果显示,无AI辅助时, A组ADR显著高于B组(25.85% 与17.30%), 这与LU Z H等[19]研究结果一致。由此提示,当天疲劳状态的积累会降低ADR, 使结肠镜检查质量下降。

    一项荟萃分析[25]发现,医学影像AI技术在结直肠息肉诊断中的灵敏度为92%, 特异度为93%, 准确率为92%, 其诊断效能显著优于单独使用静止图像。一项前瞻性、多中心、随机对照试验[26]发现,低年资内镜医师使用AI辅助进行结肠镜检查时, ADR也显著提高。本研究显示,A组中AI辅助亚组的ADR显著高于无AI辅助亚组(P=0.006); B组中AI系统的辅助效果更加显著, ADR从17.30%提高至36.08%(P < 0.001)。上述结果证实AI辅助肠镜检查系统可提高结直肠ADR, 与相关研究[6, 26-7]结果一致。本研究中, PDR的结果与ADR相似,这一结果与LU Z H等[19]研究一致,提示AI可提高内镜医师疲劳状态下结直肠ADR。但本研究仍存在一些局限性:首先,本研究纳入的病例样本量较小,尚需扩大样本量进行统计分析;其次,本研究仅在单个内镜中心开展,其结果是否适用于其他临床机构仍有待验证;最后,在不同研究中内镜中心的ADR存在差异。这可能由以下因素造成:结肠腺瘤的发病率受地域和人群特征影响;各研究对研究对象的排除标准不一;参与研究的内镜医师资质参差不齐。

    综上所述,本研究证实了AI辅助肠镜检查系统能够有效提升结肠镜检查质量,具体表现为提高ADR。本研究为不同内镜中心结肠镜检查同质化的实现提供了新思路。

    结直肠息肉主要分为较低风险息肉(如炎性息肉、增生性息肉)和潜在癌前腺瘤性息肉。根据“腺瘤-癌”理论的发展模式,对结直肠癌高危人群进行筛查,早期发现腺瘤并进行干预治疗是改善结直肠癌预后的关键措施[8-9]。ADR为衡量电子结肠镜检查质量的关键指标[10]。研究[7]显示,每增加1%的ADR, 致死性间隔期结直肠癌的风险降低5%。然而,结肠息肉的漏诊现象较为普遍[11]。研究[12]显示,结肠镜检查的息肉漏诊率约为25%。另一项回顾性研究[13]显示,结肠镜检查息肉漏诊率为22.5%, 其中小息肉(< 5 mm)占漏诊息肉的87.3%。研究[14]显示,结肠小息肉易被遗漏,而腺瘤的漏诊率高达26%。VAN RIJN J C等[15]对相关研究进行Meta分析显示,结肠镜检查的总体息肉漏诊率为22%。

    结肠息肉漏诊原因包括病变因素(息肉大小、部位、形态、数目等)和非病变因素(肠道清洁度、盲肠插管率、退镜时间、肠镜检查设备、患者舒适度和静脉麻醉等)。研究[16]表明,内镜医师的疲劳状态也是病变漏诊的重要原因之一。研究[17]表明,检查时间段为结肠镜检查质量的独立影响因素之一。一项荟萃分析[18]发现, ADR不受检查时间及内镜医师以上午、下午轮班方式检查的影响。但如果同一内镜医师全天工作则会导致下午的ADR显著降低。LU Z H等[19]按结肠镜检查时间进行分组,早期组(上午8: 00—10: 59或下午1: 00—2: 59)与晚期组(上午11: 00—12: 59或下午3: 00—4: 59)相比,早期组的ADR显著高于晚期组。排除停药时间、肠道准备情况及内镜医师资质等干扰因素后,当天内镜医师的累积疲劳是导致结肠镜检查质量下降的独立风险因素。上述研究主要针对全天工作的内镜医师, GURUDU S R等[20]将内镜医师分为全天工作组和半天工作组,在全天工作组中,上午的ADR显著高于下午,而在半天工作组中, ADR并不受上午、下午影响。分析全天工作时,后半时段ADR下降原因,考虑为连续和重复的视觉刺激可能削弱反应力和判断力,从而导致视野内息肉未被识别以及视野外息肉漏诊,同时增多退镜时的盲点[21-22]。在影像学及病理学等领域也观察到类似现象,长时间工作导致的视觉疲劳可增加漏诊率和误诊率[23-24]

    本研究中,内镜中心医师实行全天工作制。通过比较2个操作时段(14: 00—15: 59、16: 00—17: 30)的ADR, 旨在验证内镜医师的疲劳状态是否影响结肠镜检查的质量。结果显示, B组(6: 00—17: 30)ADR为26.91%, 低于A组(14: 00—15: 59)的32.10%, 但差异无统计学意义(P>0.05)。2组中均有部分患者为AI辅助肠镜检查,考虑这一因素可能会对结果造成影响,故根据是否使用AI辅助进行分层。本研究结果显示,无AI辅助时, A组ADR显著高于B组(25.85% 与17.30%), 这与LU Z H等[19]研究结果一致。由此提示,当天疲劳状态的积累会降低ADR, 使结肠镜检查质量下降。

    一项荟萃分析[25]发现,医学影像AI技术在结直肠息肉诊断中的灵敏度为92%, 特异度为93%, 准确率为92%, 其诊断效能显著优于单独使用静止图像。一项前瞻性、多中心、随机对照试验[26]发现,低年资内镜医师使用AI辅助进行结肠镜检查时, ADR也显著提高。本研究显示,A组中AI辅助亚组的ADR显著高于无AI辅助亚组(P=0.006); B组中AI系统的辅助效果更加显著, ADR从17.30%提高至36.08%(P < 0.001)。上述结果证实AI辅助肠镜检查系统可提高结直肠ADR, 与相关研究[6, 26-7]结果一致。本研究中, PDR的结果与ADR相似,这一结果与LU Z H等[19]研究一致,提示AI可提高内镜医师疲劳状态下结直肠ADR。但本研究仍存在一些局限性:首先,本研究纳入的病例样本量较小,尚需扩大样本量进行统计分析;其次,本研究仅在单个内镜中心开展,其结果是否适用于其他临床机构仍有待验证;最后,在不同研究中内镜中心的ADR存在差异。这可能由以下因素造成:结肠腺瘤的发病率受地域和人群特征影响;各研究对研究对象的排除标准不一;参与研究的内镜医师资质参差不齐。

    综上所述,本研究证实了AI辅助肠镜检查系统能够有效提升结肠镜检查质量,具体表现为提高ADR。本研究为不同内镜中心结肠镜检查同质化的实现提供了新思路。

  • 表  1   2组患者基线资料比较($\overline x $ ±s)[n(%)]

    项目 分类 A组(n=405) B组(n=379) P
    年龄/岁 53.67±11.01 53.46±11.56 0.790
    性别 235(58.02) 224(59.10) 0.759
    170(41.98) 155(40.90)
    BBPS评分 6分 109(26.91) 98(25.86) 0.737
    7~9分 296(73.09) 281(74.14)
    使用AI辅助 200(49.38) 194(51.19) 0.614
    205(50.62) 185(48.81)
    BBPS: 波士顿肠道准备量表。
    下载: 导出CSV

    表  1   2组患者基线资料比较($\overline x $ ±s)[n(%)]

    项目 分类 A组(n=405) B组(n=379) P
    年龄/岁 53.67±11.01 53.46±11.56 0.790
    性别 235(58.02) 224(59.10) 0.759
    170(41.98) 155(40.90)
    BBPS评分 6分 109(26.91) 98(25.86) 0.737
    7~9分 296(73.09) 281(74.14)
    使用AI辅助 200(49.38) 194(51.19) 0.614
    205(50.62) 185(48.81)
    BBPS: 波士顿肠道准备量表。
    下载: 导出CSV

    表  2   2组结直肠ADR、PDR比较[n(%)]

    项目 分类 腺瘤 息肉
    A组(n=405) B组(n=379) P OR(95%CI) A组(n=405) B组(n=379) P OR(95%CI)
    总检出 130(32.10) 102(26.91) 0.112 1.284(0.943~1.737) 152(37.53) 124(32.72) 0.159 1.235(0.921~1.658)
    使用AI辅助 53(25.85) 32(17.30) 0.041 1.667(1.018~2.729) 68(33.17) 42(22.70) 0.022 1.690(1.077~2.651)
    77(38.50) 70(36.08) 0.620 1.109(0.737~1.669) 84(42.00) 82(42.27) 0.957 0.989(0.663~1.476)
    BBPS评分 6分 12(11.01) 10(10.20) 0.851 1.089(0.448~2.644) 19(17.43) 17(17.35) 0.987 1.006(0.490~2.066)
    7~9分 118(39.86) 92(32.74) 0.075 1.362(0.968~1.915) 133(44.93) 107(38.08) 0.095 1.327(0.952~1.850)
    A组是否使用AI辅助患者的ADR与PDR计算分母分别为200、205例, B组分别为194、185例; A组BBPS评分为6分、7~9分患者的ADR与PDR计算分母分别为109、296例, B组分别为98、281例。
    下载: 导出CSV

    表  2   2组结直肠ADR、PDR比较[n(%)]

    项目 分类 腺瘤 息肉
    A组(n=405) B组(n=379) P OR(95%CI) A组(n=405) B组(n=379) P OR(95%CI)
    总检出 130(32.10) 102(26.91) 0.112 1.284(0.943~1.737) 152(37.53) 124(32.72) 0.159 1.235(0.921~1.658)
    使用AI辅助 53(25.85) 32(17.30) 0.041 1.667(1.018~2.729) 68(33.17) 42(22.70) 0.022 1.690(1.077~2.651)
    77(38.50) 70(36.08) 0.620 1.109(0.737~1.669) 84(42.00) 82(42.27) 0.957 0.989(0.663~1.476)
    BBPS评分 6分 12(11.01) 10(10.20) 0.851 1.089(0.448~2.644) 19(17.43) 17(17.35) 0.987 1.006(0.490~2.066)
    7~9分 118(39.86) 92(32.74) 0.075 1.362(0.968~1.915) 133(44.93) 107(38.08) 0.095 1.327(0.952~1.850)
    A组是否使用AI辅助患者的ADR与PDR计算分母分别为200、205例, B组分别为194、185例; A组BBPS评分为6分、7~9分患者的ADR与PDR计算分母分别为109、296例, B组分别为98、281例。
    下载: 导出CSV

    表  3   AI系统在相同操作时间段的检出率比较[n(%)]

    项目 A组(n=405) B组(n=379)
    AI亚组(n=200) 无AI亚组(n=205) P OR(95%CI) AI亚组(n=194) 无AI亚组(n=185) P OR(95%CI)
    腺瘤检出 77(38.50) 53(25.85) 0.006 1.795(1.176~2.741) 70(36.08) 32(17.30) < 0.001 2.699(1.669~4.365)
    息肉检出 84(42.00) 68(33.17) 0.067 1.459(0.974~2.186) 82(42.27) 42(22.70) < 0.001 2.493(1.595~3.896)
    下载: 导出CSV

    表  3   AI系统在相同操作时间段的检出率比较[n(%)]

    项目 A组(n=405) B组(n=379)
    AI亚组(n=200) 无AI亚组(n=205) P OR(95%CI) AI亚组(n=194) 无AI亚组(n=185) P OR(95%CI)
    腺瘤检出 77(38.50) 53(25.85) 0.006 1.795(1.176~2.741) 70(36.08) 32(17.30) < 0.001 2.699(1.669~4.365)
    息肉检出 84(42.00) 68(33.17) 0.067 1.459(0.974~2.186) 82(42.27) 42(22.70) < 0.001 2.493(1.595~3.896)
    下载: 导出CSV
  • [1]

    YUAN Z J, WENG S S, YE C Y, et al. CSCO guidelines for colorectal cancer version 2022: Updates and discussions[J]. Chung Kuo Yen Cheng Yen Chiu, 2022, 34(2): 67-70. doi: 10.21147/j.issn.1000-9604.2022.02.01

    [2] 胡旭辉, 饶文辉, 袁辉, 等. 幽门螺杆菌及其相关胃黏膜病变与结直肠肿瘤的相关性分析[J]. 实用临床医药杂志, 2022, 26(23): 14-19. doi: 10.7619/jcmp.20222005
    [3]

    KWAK M S, CHA J M, JEON J W, et al. Artificial intelligence-based measurement outperforms current methods for colorectal polyp size measurement[J]. Dig Endosc, 2022, 34(6): 1188-1195. doi: 10.1111/den.14318

    [4]

    LEE A, ISKANDER J M, GUPTA N, et al. Queue position in the endoscopic schedule impacts effectiveness of colonoscopy[J]. Am J Gastroenterol, 2011, 106(8): 1457-1465. doi: 10.1038/ajg.2011.87

    [5]

    BYRNE M F, CHAPADOS N, SOUDAN F, et al. Real-time differentiation of adenomatous and hyperplastic diminutive colorectal polyps during analysis of unaltered videos of standard colonoscopy using a deep learning model[J]. Gut, 2019, 68(1): 94-100. doi: 10.1136/gutjnl-2017-314547

    [6]

    WANG P, BERZIN T M, GLISSEN BROWN J R, et al. Real-time automatic detection system increases colonoscopic polyp and adenoma detection rates: a prospective randomised controlled study[J]. Gut, 2019, 68(10): 1813-1819. doi: 10.1136/gutjnl-2018-317500

    [7]

    GONG D X, WU L L, ZHANG J, et al. Detection of colorectal adenomas with a real-time computer-aided system (ENDOANGEL): a randomised controlled study[J]. Lancet Gastroenterol Hepatol, 2020, 5(4): 352-361. doi: 10.1016/S2468-1253(19)30413-3

    [8]

    SIEGEL R, MILLER K D, FUCHS H E, et al. Cancer statistics, 2021[J]. CA A Cancer J Clin, 2021, 71(1): 7-33. doi: 10.3322/caac.21654

    [9] 宋姝, 李志国, 郭在强, 等. 结直肠锯齿状息肉相关研究热点及趋势的可视化分析[J]. 实用临床医药杂志, 2024, 28(12): 92-95, 117. doi: 10.7619/jcmp.20240027
    [10]

    REES C J, BEVAN R, ZIMMERMANN-FRAEDRICH K, et al. Expert opinions and scientific evidence for colonoscopy key performance indicators[J]. Gut, 2016, 65(12): 2045-2060. doi: 10.1136/gutjnl-2016-312043

    [11]

    NISHIHARA R, WU K N, LOCHHEAD P, et al. Long-term colorectal-cancer incidence and mortality after lower endoscopy[J]. N Engl J Med, 2013, 369(12): 1095-1105. doi: 10.1056/NEJMoa1301969

    [12]

    AHN S B, HAN D S, BAE J H, et al. The miss rate for colorectal adenoma determined by quality-adjusted, back-to-back colonoscopies[J]. Gut Liver, 2012, 6(1): 64-70. doi: 10.5009/gnl.2012.6.1.64

    [13] 何晋德, 王怀堂, 刘玉兰, 等. 常规电子结肠镜检查中结肠息肉漏诊分析[J]. 中华消化内镜杂志, 2007, 24(5): 354-356. doi: 10.3760/cma.j.issn.1007-5232.2007.05.009
    [14]

    ZHAO S B, WANG S L, PAN P, et al. Magnitude, risk factors, and factors associated with adenoma miss rate of tandem colonoscopy: a systematic review and meta-analysis[J]. Gastroenterology, 2019, 156(6): 1661-1674. e11. doi: 10.1053/j.gastro.2019.01.260

    [15]

    VAN RIJN J C, REITSMA J B, STOKER J, et al. Polyp miss rate determined by tandem colonoscopy: a systematic review[J]. Am J Gastroenterol, 2006, 101(2): 343-350. doi: 10.1111/j.1572-0241.2006.00390.x

    [16] 苏便欣, 张学彦. 结肠镜检查肠息肉漏诊及其相关因素研究进展[J]. 胃肠病学, 2016, 21(2): 115-117. doi: 10.3969/j.issn.1008-7125.2016.02.013
    [17]

    SANAKA M R, SHAH N, MULLEN K D, et al. Afternoon colonoscopies have higher failure rates than morning colonoscopies[J]. Am J Gastroenterol, 2006, 101(12): 2726-2730. doi: 10.1111/j.1572-0241.2006.00887.x

    [18]

    WU J Q, ZHAO S B, WANG S L, et al. Comparison of efficacy of colonoscopy between the morning and afternoon: a systematic review and meta-analysis[J]. Dig Liver Dis, 2018, 50(7): 661-667. doi: 10.1016/j.dld.2018.03.035

    [19]

    LU Z H, ZHANG L H, YAO L W, et al. Assessment of the role of artificial intelligence in the association between time of day and colonoscopy quality[J]. JAMA Netw Open, 2023, 6(1): e2253840. doi: 10.1001/jamanetworkopen.2022.53840

    [20]

    GURUDU S R, RATUAPLI S K, LEIGHTON J A, et al. Adenoma detection rate is not influenced by the timing of colonoscopy when performed in half-day blocks[J]. Am J Gastroenterol, 2011, 106(8): 1466-1471. doi: 10.1038/ajg.2011.125

    [21]

    MARCONDES F O, GOUREVITCH R A, SCHOEN R E, et al. Adenoma detection rate falls at the end of the day in a large multi-site sample[J]. Dig Dis Sci, 2018, 63(4): 856-859. doi: 10.1007/s10620-018-4947-1

    [22]

    WANG P, XIAO X, GLISSEN BROWN J R, et al. Development and validation of a deep-learning algorithm for the detection of polyps during colonoscopy[J]. Nat Biomed Eng, 2018, 2(10): 741-748. doi: 10.1038/s41551-018-0301-3

    [23]

    ELSHEIKH T M, KIRKPATRICK J L, FISCHER D, et al. Does the time of day or weekday affect screening accuracy?A pilot correlation study with cytotechnologist workload and abnormal rate detection using the ThinPrep Imaging System[J]. Cancer Cytopathol, 2010, 118(1): 41-46. doi: 10.1002/cncy.20060

    [24]

    ALSHABIBI A S, SULEIMAN M E, TAPIA K A, et al. Effects of time of day on radiological interpretation[J]. Clin Radiol, 2020, 75(2): 148-155. doi: 10.1016/j.crad.2019.10.006

    [25]

    NAZARIAN S, GLOVER B, ASHRAFIAN H, et al. Diagnostic accuracy of artificial intelligence and computer-aided diagnosis for the detection and characterization of colorectal polyps: systematic review and meta-analysis[J]. J Med Internet Res, 2021, 23(7): e27370. doi: 10.2196/27370

    [26]

    REPICI A, SPADACCINI M, ANTONELLI G, et al. Artificial intelligence and colonoscopy experience: lessons from two randomised trials[J]. Gut, 2022, 71(4): 757-765. doi: 10.1136/gutjnl-2021-324471

    [27]

    BARUA I, VINSARD D G, JODAL H C, et al. Artificial intelligence for polyp detection during colonoscopy: a systematic review and meta-analysis[J]. Endoscopy, 2021, 53(3): 277-284. doi: 10.1055/a-1201-7165

表(6)
计量
  • 文章访问数:  107
  • HTML全文浏览量:  9
  • PDF下载量:  18
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-07-22
  • 修回日期:  2024-09-07
  • 刊出日期:  2024-12-14

目录

/

返回文章
返回
x 关闭 永久关闭