观察性研究 开放获取
版权 ©2021年作者(年代)。 Baishideng Pubeoplay app苹果系统下载blishing Group Inc.保留所有权利。
世界杂志。 2021年10月14日; 27(38):6476-6488
2021年10月14日在线发布。doi:10.3748 / wjg.v27.i38.6476
深度学习vs用于克罗恩病临床预测的传统学习算法:一项概念证明研究
丹尼·康,丹尼尔·R·范·兰根伯格,阿比纳夫·瓦苏德万
丹尼·康,丹尼尔·R·范兰根伯格,阿比纳夫·瓦苏德万,澳大利亚维多利亚州Box Hill 3128 Eastern Health消化和肝脏科
Daniel R van Langenberg, Abhinav Vasudevan,莫纳什大学医学院、护理和健康科学学院,澳大利亚维多利亚州Box Hill 3128
ORCID号码: 丹尼(监狱0000-0002-4983-6103);Daniel R van Langenberg(0000-0003-3662-6307);阿Vasudevan (0000-0001-5026-9014).
作者的贡献cond贡献概念,数据收集,统计分析,数据解释,手稿起草;van Langenberg DR贡献了概念化,数据解释,批判性地审查手稿的重要知识内容;Vasudevan A贡献了概念化,数据收集,数据解释,对手稿的重要知识内容的批判性审查;所有作者都通过了手稿的最终版本。
院校检讨委员会声明:本研究由东部卫生研究与伦理办公室审查和批准(批准号:LR 61/2015)。
知情同意的声明:由于分析使用回顾性获得的匿名临床数据,患者不需要提供知情同意。
兴趣冲突陈述: Con D没有相关的利益冲突需要声明。选择投票制已获费灵资助参加教育会议。van Langenberg DR担任过演讲者,并/或得到了来自Takeda、Ferring和Shire的旅行支持。他与艾伯维(Abbvie)、詹森(Janssen)和辉瑞(Pfizer)签订了咨询协议。他获得了Ferring、Shire和AbbVie的研究资助。
数据共享声明:无其他数据。
斯特罗布的声明:作者已阅读了STROBE Statement-checklist of items,并根据STROBE Statement-checklist of items对稿件进行了编写和修改。
开放获取:本文是由内部编辑器选择的开放式文章,并由外部审阅者进行全面审核。它根据Creative Commons attuction非商业(CC By-NC 4.0)许可证分发,允许其他人在商业上分发,混音,调整,构建,并许可其衍生物在不同术语上运作,提供了原始的工作得到适当引用,使用是非商业的。看:http://creativeCommons.org/licenses/by-nc/4.0/
相应的作者: Danny Con医学博士,统计学家,消化和肝脏科,Eastern Health, 8 Arnold Street, Box Hill 3128, Victoria, Australia。 dannycon302@gmail.com
收到:3月5日,2021年3月
同行评议开始2021年3月5日
第一个决定: 2021年4月17日
修改后:2021年4月26日
接受:9月6日,2021年
文章在新闻:2021年9月6日
在线发布:2021年10月14日

摘要
背景

开发炎症性肠病(IBD)预测模型的传统方法依赖于使用统计回归方法来获得临床评分,如克罗恩病(CD)活动指数。beplay体育 怎么样然而,传统方法无法利用更复杂的数据结构,如重复测量。深度学习方法具有自动发现和学习预测指标与预后之间复杂、隐藏关系的潜力,但其在CD和IBD临床预测中的应用尚未探索。

目的

确定并比较深度学习与传统算法在预测抗肿瘤坏死因子(anti-tumor necrosis factor, anti-TNF)治疗CD反应方面的效用。

方法

这是一项回顾性单中心队列研究,研究对象为从2010年1月1日至2015年12月31日开始接受抗tnf治疗(阿达木单抗或英夫利昔单抗)的所有乳糜泻患者。缓解定义为开始抗tnf后12个月c反应蛋白(CRP) < 5 mg/L。比较了三种监督学习算法:(1)传统的统计学习算法仅对基线数据进行多变量logistic回归;(2)仅基于基线数据的前馈人工神经网络深度学习算法;(3)基于重复数据的递归神经网络深度学习算法。通过10次重复的5倍交叉验证,使用接受者操作特征曲线下面积(AUC)评估预测性能。

结果

共有146名患者(中位年龄36岁,男性48%)。抗tnf开始时的伴随治疗包括硫嘌呤(68%),甲氨喋呤(18%),皮质类固醇(44%)和氨基水杨酸(33%)。12月后,64%的CRP <5 mg / L.传统的学习算法选择了预测模型的以下基线变量:复杂的疾病行为,白蛋白,单核细胞,淋巴结浓度和γ-谷氨酸转移酶,并具有0.659,95%置信区间的交叉验证AUC(CI):0.562-0.756。使用仅基线数据的前馈人工神经网络显示为0.710的A​​UC(95%CI:0.622-0.799;P= 0.25vs传统)。与传统算法相比,使用重复生物标志物测量的递归神经网络显示出显著更高的AUC (0.754, 95%CI: 0.674-0.834;P= 0.036)。

结论

深度学习方法在预测抗tnf治疗后的CD缓解方面是可行的,与传统模型构建方法相比,具有更强的预测性能。

关键词: 机器学习人工智能精密医学个性化医疗深度学习

核心提示:深度学习具有巨大的潜力,但其在预测克罗恩病(CD)预后方面的临床应用尚未被探索。这项研究表明,与仅使用基线数据的传统统计算法相比,深度学习算法(递归神经网络)使用更复杂的信息结构,包括重复的生物标志物测量,具有更好的预测性能。因此,该概念验证研究为深度学习方法在乳糜泻临床预测中的进一步研究奠定了基础。



介绍

克罗恩病(CD)是一种异质性慢性炎症性肠病(IBD),其特征是间歇性发作、药物改变、潜在手术需求beplay体育 怎么样和大量心理疾病[12].与许多慢性疾病一样,预测疾病轨迹、治疗结果和对乳糜泻治疗的反应是临床实践的关键组成部分,其管理是为个人量身定制的[3.].精密药物一直是由可用电子健康数据,基因组数据和新型疾病生物标志物的广泛扩展驱动[3.].然而,解读大量信息和多种数据类型之间的复杂关系提出了新的分析挑战。

构建预测模型的传统方法依赖于多变量回归方法,通常是对纵向预测的分类或比例危害的逻辑回归[4].因此,产生的预测模型通常仅是所包括的预测器的线性组合,并且可以具有了解数据内的更复杂的关系的能力有限。传统预测工具的机器学习和人工智能的优势是计算算法自动查找和学习复杂,预测标记和结果之间的隐藏关系的潜在能力[56].对于深度学习或人工神经网络(ANN)方法来说尤其如此,尽管它们的“黑盒”方法因无法在预测器和结果之间产生因果解释而受到批评[6].

尽管存在一些局限性,但人们对开发和测试机器学习和深度学习工具来帮助决策的兴趣很大[57].在腔内胃肠学中,机器学习正在获得牵引力,但其使用相对局限于内窥镜检查中的自动图像识别[8-11]以及基因组和微生物学数据的特征选择[1213].虽然人们对预测乳糜泻的临床结果很感兴趣,例如对治疗药物(包括生物制剂)的反应[14-18和免疫调制剂1920.],研究机器学习模型在这类预测任务中的效用的研究则较为有限[21-23].特别是,深度学习或神经网络在乳糜泻临床预测中的应用尚不清楚[7].

在这个概念证明研究中,我们旨在评估深度学习算法与传统统计学习算法在临床预测中的效用。特别是,我们的目标是将这些算法作为一般意义上的学习和预测方法进行比较,而不是开发任何具体的预测模型或评分。

材料和方法
学习规划

这项概念验证研究利用了一个由澳大利亚墨尔本三家急症医院组成的三级卫生网络的回顾性纵向队列研究。研究的重点是比较两种监督学习算法(传统统计学习)的能力vs(深度学习),以预测治疗12个月后的缓解,使用临床变量和基线可用的生物标志物。采用交叉验证的方法对每种算法的性能进行了评价。这项研究的重点是比较两种学习方法的预测性能,而不是任何特定的模型本身。本研究由东部卫生研究与伦理办公室批准(批准号:LR 61/2015)。

研究群体

所有成人患者> 18岁,根据标准确诊为乳糜泻[24如果他们在2010年1月至2015年12月期间开始使用抗肿瘤坏死因子(anti-TNF)药物(阿达木单抗或英夫利昔单抗)治疗腔内CD,并接受至少一剂药物。排除因肛周疾病而接受抗肿瘤坏死因子治疗而无管腔疾病的患者。随访12个月,以确定生化缓解率。

成果

根据12个月时血清c反应蛋白(CRP) < 5 mg/L,抗tnf反应被定义为达到生化缓解。选择这个终点是因为CRP是一个公认的生物标志物,可以反映疾病活动并预测CD的预后[2526].此外,CRP正常化预测缓解期乳糜泻患者预后更好[2728].在12个月后和18个月前首次测量CRP。在此期间未检测CRP的患者被排除在外。

数据收集和预处理

收集基线特征通过医院和临床记录,包括蒙特利尔分类,伴随基线治疗,之前的抗肿瘤坏死因子暴露和之前的手术。在两个时间点收集生物标志物数据:(1)基线测量定义为抗tnf开始前最接近的测量,直到开始前3个月;(2)在开始前12个月进行第二次最接近的测量。只有基线数据完整的患者被纳入,而缺失的先前值则用各自的基线值进行估算。对以下变量进行对数转化以纠正偏度:血清胆红素、丙氨酸转氨酶、碱性磷酸酶和γ -谷氨酰基转移酶(GGT)。出于隐私和道德的考虑,本文的数据不能公开分享。数据将在合理的要求下共享给通讯作者。

统计学习算法(常规方法)

开发预测临床模型的传统方法是进行单变量和多变量回归分析,以找到有用的和最好的独立预测结果(见图)1).变量选择的标准通常包括显著性检验(P值)或基于可能性的信息标准(如赤池信息标准)。在这项研究中,考虑到结果的二分类性质(CRP < 5 mg/L),使用了logistic回归vsCRP≥5 mg/L)。传统方法通常只使用单个时间点的数据,因此我们只使用基线数据(所有生物标志物最接近的测量)。对于这种传统的方法,我们采用了以下建模算法:(1)对每个变量进行单变量logistic回归,并保留所有变量P< 0.5;(2)对所有具有去除准则的保留变量进行逆向逐步选择P> 0.2;(3)利用剩余多变量模型的回归系数得出预测得分。

图1
图1比较两种监督学习算法的预测建模过程。 A:传统统计学习;B:深入学习。
深度学习算法(实验方法)

基本的深度学习算法是前馈ANN [6].人工神经网络由多个层组成:一个输入层(包含所有的输入预测变量),一个输出层(预测)和一些“隐藏”层(见图)1).隐藏层中的节点称为“神经元”。隐藏层允许神经网络学习输入变量和感兴趣的结果之间复杂的非线性关系。一层中的节点对后续层中的其他节点的影响是“训练”或使用数学函数拟合的,并最终决定信息如何通过人工神经网络传播——这类似于在传统统计学中对数据拟合一条回归线。只有输入和输出层而没有隐藏层的人工神经网络可以类似于简单的逻辑回归,尽管它们并不等效。

然而,与传统的统计算法一样,基本的前馈神经网络仍然只能在单个时间点上建模预测器之间的关系。递归神经网络(RNN)是一种更高级的深度学习算法,它能够对随时间变化的重复测量进行建模。像前馈神经网络一样,信息从输入层传播到输出层。然而,信息不是只允许传递一次,而是按顺序或“循环”地输入给RNN——也就是说,每组重复的测量数据一次输入一次,允许RNN更新预测器和结果之间的关系。因此,该算法还能够学习和利用生物标志物随时间的动态,这是传统统计学习方法无法实现的。

我们在三个独立的实验中检验了前馈神经网络和RNN:(1)在前馈神经网络中使用所有基线临床数据;(2)在前馈神经网络中仅使用基线生物标志物数据;(3)在RNN中使用重复的生物标志物数据。在本研究中,经过超参数调整后,我们使用了3个隐含层的前馈神经网络体系结构,每个隐含层有64个神经元,以及1个隐含层有64个神经元的RNN体系结构。

比较的算法

传统统计算法和实验深度学习算法(ANN)的预测性能被定义为它们使用接收算子特征曲线下面积(AUC)正确分类12个月CRP < 5 mg/L的能力。由于人工神经网络的学习能力可以任意增加,一个过度强大的人工神经网络如果训练得对原始训练队列有近乎完美的预测,那么它在外部队列中的预测能力就会很差(这被称为“过拟合”,这是一个众所周知的现象)。同样,相同的传统统计学习算法在应用于不同的队列时,可能会得到不同变量的模型。因此,评估学习算法预测未纳入原始训练队列的患者预后的能力(外部效度)是很重要的。

在没有外部测试群体的情况下评估外部有效性,交叉验证是一个适合此目的的内部验证程序[4].在交叉验证期间,队列被随机分为k同样大小的子队列,称为“折叠”(其中k通常是5或10)。然后,先在剩下的部分上训练算法,然后留出一个折叠来测试算法k-1折(见图2).这允许在培训期间未使用的患者测试算法。然后对每个折叠重复该过程(每个折叠轮流在测试折叠时)。重复后的平均AUCktimes给出了交叉验证的AUC。但是,这个过程并不是没有错误的,因为分区进程可能会随机地带来比通常性能更好(或更差)的性能。因此,重要的是要多次重复整个过程,以减少这种错误[29].

图2
图2原理图的k-fold交叉验证程序k= 5。 这种方法被认为比随机训练-测试分割更可靠,这类似于只训练一个模型,而不是平均值k模型。AUC:接收机操作员特征曲线下的面积。

在本研究中,我们使用了重复10次的5倍交叉验证来估计每个算法在未见数据上的通用性。采用方差校正重复算法对各学习算法的交叉验证的AUCs进行统计比较kt测试而不是传统的配对t测试,因为与相同数据集的重复分区的独立性冲突[29].为了比较,我们给出了在同一整个队列上训练和测试后每个模型的naïve或表观AUC,但这是没有信息的。考虑到研究的探索性性质,样本大小的计算仅作为指导进行,没有先前的类似研究作为AUC假设的基础。假设AUC方差为10%,检测具有80%功率和95%显著性的AUC差异为10%的目标样本量为n= 157 [30.].相反,在相同条件下检测15%的AUC差异,样本量为n= 70是必需的。使用Python 3.8.4编程语言和开源模块PyTorch创建深度学习算法。Stata/IC 16 (Texas, United States, 2020)用于创建统计学习算法。

结果
基线特征

共纳入146例乳糜泻患者(见表)1).他们的中位年龄为36岁[四分位范围(IQR) 25-50], 48%为男性,自诊断以来的中位疾病持续时间为5年(IQR 1-12)。开始的抗tnf为英夫利昔单抗58%,阿达木单抗42%。抗tnf开始时的伴随治疗包括硫嘌呤(68%),甲氨喋呤(18%),皮质类固醇(44%)和氨基水杨酸(33%)。超过四分之一(28%)的患者之前接受过肠道手术,而15%的患者之前接触过抗tnf。12个月后,94例(64%)患者生化缓解(CRP < 5 mg/L)。

表1研究队列的基线特征(n= 146)。
特征
n(%)
年龄,年龄,中位数(IQR) 36 (25 - 50)
76(52)
男性 70(48)
吸烟者(主动) 33 (23)
CD的行为
B1:非狭窄,非渗透 75 (51)
B2:狭窄 56 (38)
B3:穿透/瘘管 15(10)
CD位置
L1:回肠 41 (28)
L2:结肠 43 (29)
L3: Ileocolonic 62 (42)
L4:孤立UGI 0 (0)
亚洲人参与 20 (21)
初始anti-TNF开始
英夫利昔单抗 84 (58)
Adalimumab 62 (42)
基线thiopurine 99 (68)
基线甲氨蝶呤 27 (18)
基线糖皮质激素 64 (44)
基线aminosalicylates 48 (33)
之前anti-TNF 22日(15)
肠道手术前 41 (28)
疾病持续时间,年,中位数(IQR) 5(1-12)
基线调查
CRP, mg/L,中位(IQR) 3 (2 - 8)
白蛋白,g/L,中位(IQR) 37 (36-41)
统计学习算法

单变量分析:在单变量试验中,与12个月时生化缓解相关的基线因素包括非复杂的疾病行为(B1)、较高的白蛋白和平均红细胞血红蛋白浓度(MCHC)、较低的血小板、淋巴细胞和单核细胞(每个)P< 0.05;见表2),而较低的中性粒细胞计数几乎是显著的(P= 0.06)。与年龄、性别、疾病部位或基线药物治疗无显著相关性(见表)2).

表2估计差距差距为95%,对单变性和多变量的逻辑回归分析有95%的置信区间。
预测
单变量
多变量
或(95%CI)
P价值
形容词或(95%置信区间)
P价值
年龄,每年 0.98 (0.96 - -1.00) 0.10 - -
男(vs女性) 1.42 (0.72 - -2.82) 0.31 - -
CD的行为
B1 1.0 不包含
B2 0.45 (0.22 - -0.94) 0.034 不包含
B3 0.42(0.13-1.29) 0.13 不包含
CD位置
L1:回肠 1.0 不包含
L2:结肠 1.33 (0.54 - -3.31) 0.54 不包含
L3:Ileocoltonic. 0.91 (0.40 - -2.06) 0.83 不包含
回肠位置(L1) 0.94 (0.45 - -2.00) 0.88 不包含
复杂的疾病(B2和B3) 0.44 (0.22 - -0.89) 0.021 0.36 (0.16 - -0.80) 0.012
主动吸烟者 0.76 (0.40 - -1.47) 0.42 - -
亚洲人参与 1.14 (0.49 - -2.65) 0.77 不包含
抗tnf类型:英夫利昔单抗(vsadalimumab) 1.12 (0.56 - -2.22) 0.75 不包含
基线免疫调制剂 1.24 (0.47 - -3.27) 0.66 不包含
基线糖皮质激素 1.10 (0.56 - -2.18) 0.78 不包含
基线aminosalicylates 1.16 (0.56 - -2.40) 0.69 不包含
之前anti-TNF 0.96 (0.37 - -2.47) 0.94 不包含
肠道手术前 0.71(0.34-1.48) 0.36 - -
疾病持续时间,每日志e一年 0.83 (0.65 - -1.06) 0.14 - -
白蛋白,每g / L 1.12 (1.03 - -1.22) 0.006 1.08 (0.98 - -1.20) 0.12
血红蛋白,每g / L 1.01 (0.99 - -1.04) 0.32 - -
HCT,per% 0.91 (0.71 - -1.16) 0.44 - -
碾压混凝土,每109/ L 1.07 (0.84 - -1.36) 0.60 不包含
MCV,每FL 1.01 (0.96 - -1.07) 0.64 不包含
妇幼保健,每个pg /细胞 1.15 (0.99 - -1.32) 0.06 - -
MCHC,每毫克/ L 1.05(1.02-1.08) 0.002 1.05(1.02-1.09) 0.004
血小板,每100 × 109/ L 0.63 (0.43 - -0.93) 0.020 - -
中性粒细胞,每109/ L 0.91 (0.82 - -1.00) 0.06 - -
淋巴细胞,每109/ L 0.66(0.46-0.93) 0.019 0.65 (0.41 - -1.02) 0.06
单核细胞,每109/ L 0.23 (0.08 - -0.63) 0.004 0.34 (0.10 - -1.16) 0.09
嗜酸性粒细胞,每109/ L 0.61 (0.08 - -4.77) 0.64 不包含
嗜碱性菌,每0.01 × 109/ L 0.92(0.80-1.06) 0.24 - -
胆红素,每个日志eµmol / L 1.38 (0.70 - -2.72) 0.36 - -
alt,每个日志e国际单位/ L 1.04 (0.60 - -1.80) 0.90 不包含
高山,每个日志e国际单位/ L 0.55 (0.18 - -1.64) 0.28 - -
GGT,每个日志e国际单位/ L 0.71 (0.46 - -1.09) 0.12 0.69 (0.43 - -1.11) 0.13

多变量分析:经过逆向逐步选择,最终的多变量模型中保留了以下变量:复杂疾病、基线白蛋白、单核细胞、淋巴细胞、MCHC和GGT(见表)2).结果预测模型由以下公式给出(系数符合两个显著数字):评分= 0.079 ×(白蛋白,g/L) + 0.050 × (MCHC, mg/L) - 1.1 ×(单核细胞,109/L) - 0.43 ×(淋巴细胞,109/L) - 1.0 ×(复杂疾病,y= 1 |n=0) - 0.69 × loge(GGT,IU / L)。

结果预测:经过10× 5倍交叉验证,统计学习算法的平均AUC为0.659[95%置信区间(CI): 0.562-0.756]。这表明统计学习算法有望对与研究队列特征相似的外部队列中65.9%的患者进行准确分类(见表)3.).该算法在94%的情况下比机会(AUC > 0.5)表现得更好,在38%的情况下AUC > 0.7(见图)3.).模型的naïve AUC(在同一数据上训练和测试时)为0.771。

图3
图3经10 × 5倍交叉验证后的接收者特征曲线下面积分布。 A:传统统计学习算法(mean 0.659, SD 0.095);B:递归神经网络(均值0.754,SD 0.078);C:头对头比较,每一次折叠和重复匹配(平均差+ 0.095,P= 0.036)。AUC:接收机操作员特征曲线下的面积。
表3交叉验证实验中学习算法的比较。
算法
数据集1
AUC (%)
P价值2
的意思是
SD
传统的统计数据 基线临床+生物标志物数据 65.9 9.5 -
前馈神经网络 基线临床+生物标志物数据 71.0 8.7 0.25
前馈神经网络 仅基线生物标志物数据 70.6 8.3 0.33
递归神经网络 基线和先前的生物标志物数据 75.4 7.8 0.036
深入学习算法

具有完整基线数据的前馈神经网络:具有完整基线数据的前馈神经网络的交叉验证AUC为0.710 (95%CI: 0.622-0.799)(见图)3.和表3.).使用校正后的方差,这个差异在统计学上不显著t测试(P= 0.25)。该算法在100%的时间里表现得更好,在54%的时间里表现良好(AUC > 0.7)(见图)3.).作为对比,模型的naïve AUC为0.857。

仅含基线生物标志物数据的前馈神经网络:使用仅基线生物标志物数据的相同前锋ANN具有类似的交叉验证AUC,0.706(95%CI:0.621-0.791),与传统算法相比,再次没有显着差异(P= 0.33)(见表3.).该算法的性能优于100%的机会时间和良好的性能(AUC > 0.7) 58%的时间(见图3.).模型naïve的AUC为0.776。

RNN具有重复的生物标记数据:同一前馈神经网络仅使用基线生物标志物数据的交叉验证AUC为0.754 (95%CI: 0.674-0.834),显著高于传统算法的AUC (P= 0.036)(见表3.).这表明RNN有望准确地对与研究队列具有相似特征的外部队列中75.4%的患者进行分类。RNN算法在100%的时间里表现得更好,并且在72%的时间里表现良好(AUC > 0.7)(见图)3.).比较而言,模型naïve的AUC为0.892。

讨论

可用健康数据的迅速扩展推动了机器学习和深度学习工具的开发,以预测临床医学中的有用结果[56].由于这种条件的异质性和慢性性质以及随时间的时间,因此,机器学习和数据科学技术的出现尤其适用于IBD,以及随时间的疾病活动的重复措施提供了可能更适合复杂建模技术的数据。例如,含有CD的那些通常存在于各种不同的不同疾病表型和潜在的病原因的那些,以及它们对治疗的反应和疾病课程的轨迹的变化大幅不同,并根据其反应而变化[31].该研究表现出深度学习算法预测CD患者对抗TNF治疗的反应的潜力。预测对给定治疗的响应可能性的能力对于风险效益评估至关重要,这反过来又是促进临床医生和患者之间的共同决策的重要性[32].此外,尽管生物学疗法在IBD中具有革命性的管理[31],医疗治疗现在是医疗费用的主要驱动因素[3334和健康经济方面的考虑将不可避免地影响治疗的选择。理想情况下,患者应该接受既有效又划算的治疗。因此,不可能有“一刀切”的管理策略,精准和个性化的医疗是关键目标。

传统的统计学习算法产生了许多有用的临床评分,包括CD活动指数[35],CD的简单内窥镜分数[36,以预测对生物治疗的反应[16]和分数从肠结核中区分CD [37].传统分数的优点通常是简单和可解释。一个简单的分数可以在床边记忆和计算,并且是直观的,因为它们利用了重要的风险因素的利益结果。然而,临床评分只能适用于一个相当普通的亚组患者,而不是特定于任何个人,因为它们使用的变量相对较少。此外,传统方法不能轻易地对更复杂、非线性或依赖时间的健康状态进行建模。随着新的基因组和微生物学分析,以及具有海量数据链接的全面电子医疗记录的快速吸收,传统学习算法选择有用的预测因素的能力可能变得多余[38].

虽然深度学习对于分析非数值数据类型的优势是明显的,例如内镜中的图像数据[39-41]和自然语言处理中的文本或语音数据[42],深度学习对数值数据分析的效用不太清楚,但仍然有前景。最近的一项研究证明了机器学习在类风湿性关节炎中预测抗TNF反应的效用,但除了临床数据外,还依赖于遗传标记[43].另一项最近的研究使用机器学习来预测强直性脊柱炎患者是否需要抗tnf治疗,但没有评估是否可以预测治疗的反应[44].预计新数据科学和机器学习技术需要处理大量数据以用于临床实践,尽管此任务的最佳算法仍然未知。尽管如此,随着提供全面的培训数据,机器学习工具有可能有助于辅助个性化风险预测,尽管目前没有IBD存在这种模型。在我们的队列中,RNN深度学习算法能够在结合重复的生物标志物测量后优于传统算法,因此另外学习各个生物标志物的非线性时间动态 - 具有传统预测模型不可能的壮举。预期具有足够的培训数据,诸如RNN之类的深度学习方法将能够随着时间的推移从个体患者的多个重复健康状态纳入时间序列数据。具有深度学习方法的清晰权衡是需要更多数据协调和软件执行。但是,常规临床实践中的自动化记录的持续吸收可能会降低未来的这种限制。此外,随着来自综合前一次病史,血清和粪便生物标志物,成像和内窥镜数据以及遗传学,机器学习在包括IBD的慢性疾病预测中的作用可能会扩大,血清和粪便生物标志物,成像和内窥镜数据以及遗传学的宽度和遗传资料。

该研究也证明了在模型开发过程中应用模型验证技术的重要性[29].人工神经网络和其他强大的算法有能力学习复杂的数据差异,但只关注学习能力的不明确的模型有学习数据中的随机变化或人工产物的倾向,这些只是由于偶然出现的。这一点可以从RNN在训练中获得优秀的AUC,但在未见数据上测试时AUC降低(naïve AUC 0.892;旨在AUC 0.754)。统计学习算法也出现了同样的现象,但程度稍轻(naïve AUC 0.771;旨在AUC 0.659)。因此,开发预测模型的研究应注意避免naïvely评估预测性能,并确保有效的交叉验证或bootstrapping方法用于适当的区间验证[4].如果可行,在全新和不同的队列中对预测模型的外部验证是模型验证的金标准[4].

本研究使用的数据集是回顾性的,来自一个单一的中心,该中心将结果受制于信息偏差并限制其外部效度。所使用的结果是生化缓解,因为这是一种容易获得的重复测量,允许更传统的和机器学习模型的演示,然而,公认的临床症状和/或粘膜愈合是更临床相关的终点。然而,本研究的目的是在这个概念证明研究中论证深度学习方法在临床预测中的可行性,而不是开发一个具体的预测模型。此外,在实践中,需要更大的群体来适当地训练和校准深度学习模型,以最大化它们在现实世界中的效用。在未来,所有研究特定预测模型的研究在应用于临床实践之前,都应该经过前瞻性的对照验证,特别是表明使用预测模型指导管理后,结果会得到改善。

结论

总之,我们已经证明了与传统方法相比,CD中临床预测的深度学习算法的可行性。然而,传统的统计方法保留了简单性和直观的优势,允许它们在床边使用。然而,随着可用健康数据的快速扩展,机器学习模型可能有可能取代目前常规方法,并大大改善了患者结果的临床预测工具的开发。

文章强调了
研究背景

机器学习和人工智能有可能彻底改变炎症性肠病的精准治疗。beplay体育 怎么样目前,深度学习技术在内镜肿瘤自动检测中的应用一直是研究的热点,但在临床预后预测方面的应用还比较欠缺。

研究动机

临床预测的传统方法依赖于常规统计算法,例如回归,这不适用于更复杂的数据,例如重复的生物标志物测量。

研究目标

确定并比较深入学习与常规算法的实用性预测克罗恩病(CD)对抗肿瘤坏死因子(抗TNF)治疗的反应。

研究方法

一组开始接受抗tnf治疗的CD患者的回顾性队列被用来实验开发和交叉验证三种监督学习算法:(1)统计学习算法;(2)前馈人工神经网络;(3)具有重复数据的递归神经网络。预测效用是用接受者操作特征曲线(AUC)下的面积来量化的。

研究成果

在我们的146例患者队列中,传统统计学习算法的表现最弱[AUC 0.659, 95%置信区间(CI): 0.562-0.756],相比前馈人工神经网络(AUC 0.710, 95%CI: 0.622-0.799;P= 0.25vs常规)和使用反复生物标志物测量的复发性神经网络(AUC 0.754,95%CI:0.674-0.834;P= 0.036vs传统)。

研究的结论

深度学习方法在预测抗tnf治疗后的CD缓解方面是可行的,与传统模型构建方法相比,具有更强的预测性能。

研究视角

这是第一个利用炎症性肠病的重复临床数据研究深层神经网络在预测临床结果中的效用的研究。beplay体育 怎么样未来的研究应纳入额外的数据类型,如遗传、成像和内窥镜因素。

脚注

稿件来源:特邀稿件

专科类型:胃肠病学和肝病学

国家/地区的原产地:澳大利亚

PEER审查报告的科学质量分类

A级(优秀):0分

B级(非常好):B级

C级(良好):C级

D级(一般):0

E级(差):0

p -审稿人:金波,余春生

参考
1. Podolsky DK..beplay体育 怎么样炎症性肠病。英国医学杂志.2002;347: 417 - 429。PubMed迪伊本文引用:引用于:2543引用于f6出版:1011文章的影响:133.8文献引用分析(0)
2. 杰克逊BD,Con D,Gorelik A,Liew D,Kangle S,De Cruz P.检查疾病活动与患者报告的炎症性肠病群体中的关系措施的关系。beplay体育 怎么样实习生地中海J.2018;48: 1234 - 1241。PubMed迪伊本文引用:由十字架引用:5引用by F6Publishing: 5文章的影响:2.5文献引用分析(0)
3. Denson拉, Curran M, McGovern DPB, Koltun WA, Duerr RH, Kim SC, Sartor RB, Sylvester FA, Abraham C, de Zoeten EF, Siegel CA, Burns RM, Dobes AM, Shtraizent N, Honig G, Heller CA, Hurtado-Lorenzo A, Cho JH。IBD研究的挑战:精准医学。Inflamm肠说.2019;25: S31-S39。PubMed迪伊本文引用:引用于Crossref: 28引用by F6Publishing: 19文章的影响:14.0文献引用分析(0)
4. 卫星公斤, Altman DG, Reitsma JB, Ioannidis JP, Macaskill P, Steyerberg EW, Vickers AJ, Ransohoff DF, Collins GS。个人预后或诊断的多变量预测模型(TRIPOD)透明报告:解释和阐述。安实习生地中海.2015;162: w1 - 73。PubMed迪伊本文引用:引自:1456引自f6出版:560文章的影响:242.7文献引用分析(0)
5. 陈H., JJY唱。人工智能在胃肠病学和肝病医学图像分析中的潜力。J Gastroenterol肝肝.2021;36: 31-38。PubMed迪伊本文引用:由十字架引用:4引用by F6Publishing: 5文章的影响:4.0文献引用分析(0)
6. Le Berre C人工智能在胃肠病学和肝病学中的应用胃肠病学.2020;158: 76 - 94. - e2。PubMed迪伊本文引用:引自:108在F6Publishing中引用:79文章影响:54.0文献引用分析(0)
7. Kohli A.,Holzwanger Ea,征收。炎症性肠疾病中人工智能的新兴利用。beplay体育 怎么样世界杂志.2020;26: 6923 - 6928。PubMed迪伊本文引用:引自:CrossRef: 1引用by F6Publishing: 2文章的影响:1.0文献引用分析(0)
8. 竹中平藏K, Ohtsuka K, Fujii T, Negi M, Suzuki K, Shimizu H, Oshima S, Akiyama S, Motobayashi M, Nagahori M, Saito E, Matsuoka K, Watanabe M.开发和验证溃疡性结肠炎患者内镜图像的准确评估。胃肠病学.2020;158:2150-2157。PubMed迪伊本文引用:引自Crossref: 50引用by F6Publishing: 34文章的影响:50.0文献引用分析(0)
9. 大谷K在胶囊内镜图像上使用一种新的深度卷积神经网络自动检测不同类型的小肠病变。内窥镜检查.2020;52: 786 - 791。PubMed迪伊本文引用:由十字架引用:8引用by F6Publishing: 9文章的影响:8.0文献引用分析(0)
10. Klang E.通过视频胶囊内镜自动检测克罗恩病溃疡的深度学习算法。Gastrointest Endosc.2020;91: 606 - 613. - e2。PubMed迪伊本文引用:引用于:46引用by F6Publishing: 34文章的影响:23.0文献引用分析(0)
11. Sze科幻,张WI,黄永志,许逸特,林jtw。AmplifEYE辅助结肠镜检查vs标准结肠镜检查:随机对照研究。J Gastroenterol肝肝.2021;36: 376 - 382。PubMed迪伊本文引用:由十字架引用:1引用by F6Publishing: 2文章的影响:1.0文献引用分析(0)
12. ABBAS M.,Matta J,Le T,Bensmail H,Obafemi-Ajayi T,Honavar V,El-Manzalawy Y.使用基于网络的特征选择的炎症性肠病生物标志物发现。beplay体育 怎么样《公共科学图书馆•综合》.2019;14: e0225382。PubMed迪伊本文引用:引自:Crossref: 10引用by F6Publishing: 6文章的影响:5.0文献引用分析(0)
13. Bodein一, Chapleur O, Droit A, Lê Cao KA。整合微生物组纵向研究与其他数据类型的通用多元框架。麝猫面前.2019;10: 963。PubMed迪伊本文引用:引自:Crossref: 13引用by F6Publishing: 10文章的影响:6.5文献引用分析(0)
14. 松岗KHamada S, Shimizu M, Nanki K, Mizuno S, Kiyohara H, Arai M, Sugimoto S, Iwao Y, Ogata H, Hisamatsu T, Naganuma M, Kanai T, Mochizuki M, Hashiguchi M.预测日本克hn病患者维持治疗期间英夫利昔单抗治疗反应的因素。《公共科学图书馆•综合》.2018;13: e0204632。PubMed迪伊本文引用:引自:Crossref: 11引用by F6Publishing: 8文章的影响:3.7文献引用分析(0)
15. 丁NS, Malietzis G, Lung PFC, Penez L, Yip WM, Gabe S, Jenkins JT, Hart A. body composition profile与抗tnf治疗克罗恩病的反应相关,并可能提供一种替代的给药范式。食物药物杂志.2017;46:883-891。PubMed迪伊本文引用:引自:Crossref: 21引用by F6Publishing: 14文章的影响:5.3文献引用分析(0)
16. 理发师通用电气, Yajnik V, Khalili H, Giallourakis C, Garber J, Xavier R, Ananthakrishnan。基因标记预测克罗恩病中抗tnf生物治疗的原发性无应答和持久应答。am胃肠玉米醇.2016;111:1816-1822。PubMed迪伊本文引用:引用于Crossref: 45引用by F6Publishing: 38文章影响:9.0文献引用分析(0)
17. 沃德毫克, Warner B, Unsworth N, Chuah SW, Brownclarke C, Shieh S, Parkes M, Sanderson JD, Arkir Z, Reynolds J, Gibson PR, Irving PM。克罗恩病中的英夫利昔单抗和阿达木单抗药物水平:与疾病活动和影响因素的对比关联食物药物杂志.2017;46: 150 - 161。PubMed迪伊本文引用:引自:Crossref: 44引用by F6Publishing: 34文章影响:11.0文献引用分析(0)
18. 莫滕森JH在克罗恩病中,瓜氨酸化和mmp降解的波形蛋白生物标志物(VICM)预测抗tnf α治疗的早期反应。中国新药杂志.2021;55: 59 - 66。PubMed迪伊本文引用:在十字架中引用:3引用by F6Publishing: 2文章的影响:3.0文献引用分析(0)
19. 反对DParthasarathy N, Bishara M, Luber RP, Joshi N, Wan A, Rickard JA, Long T, Connoley DJ, Sparrow MP, Gibson PR, van Langenberg DR, Vasudevan A.开发一种简单的、基于血清生物标志物的模型,预测克罗恩病早期生物治疗的需要。J Crohns结肠炎.2021;15: 583 - 593。PubMed迪伊本文引用:由十字架引用:1引用by F6Publishing: 2文章的影响:1.0文献引用分析(0)
20。 康沃尔郡的JS炎症性肠病中硫嘌呤治疗反应的生物标志物预测。beplay体育 怎么样前面地中海(洛桑).2020;7:8。PubMed迪伊本文引用:在十字架中引用:3引用by F6Publishing: 3文章的影响:3.0文献引用分析(0)
21. Waljee AK.,华莱士碧,科恩梅尔堡S,刘y,刘b,欺诈者k,stidham rw,zhu j,higgins pdr。中度至重型克罗恩病患者缓解术中的机器学习模型的开发与验证。JAMA Netw开放.2019;2: e193721。PubMed迪伊本文引用:引用于Crossref: 18引用by F6Publishing: 17文章影响:9.0文献引用分析(0)
22. Waljee AK.,李立生R, Wiitala WL,张勇,刘波,朱军,Wallace B, Govani SM, Stidham RW, Hayward R, Higgins PDR。利用机器学习预测炎症性肠病患者住院和门诊使用皮质类固醇。beplay体育 怎么样Inflamm肠说.2017;24: 45-53。PubMed迪伊本文引用:引自:Crossref: 36引用by F6Publishing: 26文章的影响:18.0文献引用分析(0)
23. 诺姆斯关键词:克罗恩病,粪钙保护素,抗肿瘤坏死因子,内镜和放射治疗,治疗效果J Crohns结肠炎.2020;14:1231-1240。PubMed迪伊本文引用:由十字架引用:2引用by F6Publishing: 2文章的影响:2.0文献引用分析(0)
24. Maaser C., Sturm Vavricka SR, Kucharzik T, Fiorino G, Annese V,花茎甘蓝E, Baumgart特区Bettenworth D, Borralho Nunes P,布里奇J,马匹F,以利R, Ellul P, Gonzalez-Lama Y,戈登•H Halligan年代,Katsanos K, Kopylov U, Kotze PG, KrustinšE, Laghi, Limdi JK, Rieder F, Rimola J,泰勒SA二苯乙炔D, van Rheenen P, Verstockt B,斯托克J;欧洲克罗恩和结肠炎组织[ECCO]和欧洲胃肠和腹部放射学会[ESGAR]。ECCO-ESGAR IBD诊断评估指南第1部分:初始诊断,已知IBD的监测,并发症的检测。J Crohns结肠炎.2019;13: 144 - 164。PubMed迪伊本文引用:由十字架引用:313引用于f6出版版:228文章的影响:156.5文献引用分析(0)
25. 波特交流, Aubrecht J, Birch C, Braun J, Cuff C, Dasgupta S, Gale JD, Hinton R, Hoffmann SC, Honig G, Linggi B, Schito M, Casteele NV, Sauer JM。克罗恩病的生物标记物支持新的治疗干预措施的发展。Inflamm肠说.2020;26: 1498 - 1508。PubMed迪伊本文引用:由十字架引用:2引用by F6Publishing: 3文章的影响:2.0文献引用分析(0)
26. 苹果电脑, Battat R, Parker CE, Khanna R, Jairath V, Feagan BG。c反应蛋白和粪钙保护素的更新:它们是克罗恩病疾病活动的准确测量吗?专家Rev Gastroenterol, Hepatol.2019;13: 319 - 330。PubMed迪伊本文引用:引自:Crossref: 12引用by F6Publishing: 11文章的影响:6.0文献引用分析(0)
27. 林X关键词:克罗恩病,c -反应蛋白,黏膜愈合,深度缓解,预后中国Transl杂志.2020;11:E00135。PubMed迪伊本文引用:由十字架引用:2引用by F6Publishing: 3文章的影响:2.0文献引用分析(0)
28. 点击B., Vargas EJ, Anderson AM, Proksell S, Koutroubakis IE, Ramos Rivers C, Hashash JG, Regueiro M, Watson A, Dunn MA, Schwartz M, Swoger J, Baidoo L, Barrie A 3rd, Binion DG。无症状克罗恩病:c反应蛋白升高的无症状患者有后续住院的风险Inflamm肠说.2015;21: 2254 - 2261。PubMed迪伊本文引用:由十字架引用:6引用by F6Publishing: 10文章影响:1.2文献引用分析(0)
29. Bouckaert RR弗兰克·E。比较学习算法的显著性检验的可复制性评估,在知识发现和数据挖掘进展中。见:Dai H, Srikant R, Zhang C.《计算机科学》讲义。施普林格:柏林,海德堡,2004年。PubMed迪伊本文引用:
30. Hajian-Tilaki K.生物医学信息学诊断试验研究中的样本量估计。J生物医学通知.2014;48: 193 - 204。PubMed迪伊本文引用:引用文献:296引用by F6Publishing: 208文章的影响:42.3文献引用分析(0)
31. 托雷斯J,mehandru s,colommel jf,佩林 - biroulet l. crohn病。《柳叶刀》.2017;389:1741-1755。PubMed迪伊本文引用:引自Crossref: 615在F6Publishing:240中引用文章影响:123.0文献引用分析(0)
32. 反对D, Jackson B, Gray K, De Cruz P. eHealth对炎症性肠beplay体育 怎么样病自我管理的患者视角。Scand杂志.2017;52: 973 - 980。PubMed迪伊本文引用:引自:Crossref: 10引用by F6Publishing: 7文章的影响:2.5文献引用分析(0)
33. van der Valk ME, margen MJ,塞维M, van der M,迪杰斯特拉克,van Bodegraven AA,支撑材HH,德容DJ, van der Woude CJ, Romberg-Camps MJ,克莱门斯CH,詹森JM, van de Meeberg PC, Mahmmod N, van der Meulen-de郑大世AE, Ponsioen CY, Bolwerk C, Vermeijden JR Siersema PD, Leenders M,奥尔登堡B;COIN研究小组和荷兰克罗恩和结肠炎倡议。炎症性肠病两年随访费用的演变beplay体育 怎么样《公共科学图书馆•综合》.2016;11: e0142481。PubMed迪伊本文引用:引用于Crossref: 66引用by F6Publishing: 56文章的影响:13.2文献引用分析(0)
34. 杰克逊B与澳大利亚三级炎症性肠病护理相关的医疗保健费用。beplay体育 怎么样Scand杂志.2017;52: 851 - 856。PubMed迪伊本文引用:由十字架引用:1引用by F6Publishing: 2文章影响:0.3文献引用分析(0)
35. 最好的车手克罗恩病活动指数的发展。全国克罗恩病合作研究。胃肠病学.1976;70: 439 - 444。PubMed迪伊本文引用:
36. Daperno米D’haens G, Van Assche G, Baert F, Bulois P, Maunoury V, Sostegni R, Rocca R, Pera A, Gevers A, Mary JY, Colombel JF, Rutgeerts P.开发和验证一种新的简化的克罗恩病内镜活动评分:SES-CD。Gastrointest Endosc.2004;60: 505 - 512。PubMed迪伊本文引用:引自Crossref: 811在F6Publishing中引用:259文章的影响:50.7文献引用分析(0)
37. Limsrivilai J.肠结核或克罗恩病:旨在区分这两种胃肠道疾病的诊断模型的综述。int Res.2021;19:21-32。PubMed迪伊本文引用:由十字架引用:8引用by F6Publishing: 6文章的影响:8.0文献引用分析(0)
38. 唱JJ医疗保健中的人工智能:为第五次工业革命做准备。Med J Aust..2020;213: 253 - 255. - e1。PubMed迪伊本文引用:由十字架引用:4引用by F6Publishing: 2文章的影响:4.0文献引用分析(0)
39. Iwagami H, Ishihara R, Aoyama K, Fukuda H, Shimamoto Y, Kono M, Nakahira H, Matsuura N, Shichijo S, Kanzaki H, Ishii T, Nakatani Y, Tada T.人工智能检测食管和食管胃交界腺癌。J Gastroenterol肝肝.2021;36: 131 - 136。PubMed迪伊本文引用:由十字架引用:6引用by F6Publishing: 6文章的影响:6.0文献引用分析(0)
40。 东我,Rittscher J. Colonoscopic Polyp检测人工智能:高性能vs人类的天性。J Gastroenterol肝肝.2020;35: 1663 - 1664。PubMed迪伊本文引用:由十字架引用:1引用by F6Publishing文章的影响:1.0文献引用分析(0)
41。 Parasher G,黄M,Rawat M.人工智能在胃肠内镜内窥镜检查中的演变作用。世界杂志.2020;26: 7287 - 7298。PubMed迪伊本文引用:引自:CrossRef: 1引用by F6Publishing: 2文章的影响:1.0文献引用分析(0)
42。 Shung D基于自然语言处理和决策规则的急性消化道出血早期诊断。J Gastroenterol肝肝.2021;36: 1590 - 1597。PubMed迪伊本文引用:由十字架引用:1引用by F6Publishing文章的影响:1.0文献引用分析(0)
43。 关Y6 .张华,王志军,王志军,王志军。基于融合临床和遗传标记的机器学习方法预测类风湿性关节炎患者抗肿瘤坏死因子药物反应。关节炎Rheumatol.2019;71: 1987 - 1996。PubMed迪伊本文引用:引用于:29引用by F6Publishing: 19文章的影响:14.5文献引用分析(0)
44。 李年代,Eun Y,Kim H,Cha Hs,Koh Em,Lee J.机器学习预测强直性脊柱炎患者的早期TNF抑制剂用户。Sci代表.2020;10: 20299。PubMed迪伊本文引用:由十字架引用:1引用by F6Publishing文章的影响:1.0文献引用分析(0)