基于影像组学的机器学习模型辅助肺磨玻璃结节浸润程度鉴别的应用价值

栏目:科技资讯  时间:2023-08-07
手机版

  磨玻璃结节(ground-glass nodules,GGNs)根据是否含有实性成分分为混合GGNs和纯GGNs[]。近年来,随着低剂量螺旋CT(low-dose computed tomography,LDCT)的发展,越来越多肺GGNs被发现,目前亚洲地区肺癌门诊患者多为GGNs患者[]。国际早期肺癌行动计划(I-ELCAP)报道了CT检查发现的GGNs的恶性概率(34%)明显高于实性结节(7%)[],因此术前准确区分GGNs浸润程度可辅助临床医生为不同的患者制定个性化精准诊疗方案,在保证总生存期不变的情况下尽可能多地保留患者肺功能、提高患者生存质量、避免过度治疗等方面具有重要意义。

  目前GGNs术前诊断评估方法包括侵入性和非侵入性检测方法。对GGNs的评估受到诊断工具CT、正电子发射体层成像(positron emission tomography,PET)[-]和非手术活检[-]相对不敏感的限制,如LDCT的高假阳性率、PET昂贵的费用以及对于亚实性结节有限的评估价值。侵入性检测方法,如经皮肺穿刺活检术、支气管镜组织采样、细针抽吸活检[],由于存在取样不充分和假阴性结果等而存在一些局限性,操作不规范容易造成咯血、气胸等并发症[];还增加了患者的医疗费用,一项分析[]表明40%的肺癌医保支出源自良性肺结节的侵入性操作。

  影像组学通过高通量计算从医学图像中提取和分析临床医生肉眼看不到的定量图像特征[-]。先前已有研究[-]利用影像组学特征建立诊断或预后模型,并开发用于临床决策支持和个性化诊断的临床工具。此外影像组学具有以下优势:与穿刺活检受限于取材量、取材部位差异而存在假阴性结果相比,影像组学在无创的条件下通过对整个病灶以及病灶微环境进行完整分析可以解释肿瘤内以及肿瘤间的异质性[-]。但目前影像组学所产生的高通量信息处理也给临床带来一定挑战。既往的研究报道支持向量机(support vector machine,SVM)在处理、分析这些大量的信息方面具有高效进行复杂运算的优势。因此鉴于以上情况,本研究旨在建立基于影像组学特征的SVM模型预测术前GGNs浸润程度,并探讨其针对不同实性成分直径GGNs的预测能力,与Mayo及Brock模型进行性能对比以及对临床医生诊疗的辅助价值。

  回顾性收集上海市肺科医院2021年3月—7月、兰州大学第一医院2019年1月—2022年5月胸外科手术完整切除的肺GGNs患者的临床资料。纳入标准:(1)术前1个月内CT扫描发现肺亚实性结节;(2)病理诊断为非典型腺瘤样增生(atypical adenomatous hyperplasia,AAH)、原位腺癌(adenocarcinoma in situ,AIS)、微浸润腺癌(minimally invasive adenocarcinoma,MIA)、浸润性腺癌(invasive adenocarcinoma,IA)中任意一种;(3)结节实性成分直径<3 cm;(4)术前未行任何治疗;(5)过去5年内无肺癌及其他恶性肿瘤史。排除标准:(1)术前无就诊医院CT资料;(2)非薄层CT图像资料(<3 mm)或其他无法获取薄层CT影像的情况。使用简单随机化分组方法将纳入患者按7∶3 比例随机分为训练集和测试集。

  记录患者的姓名、性别、年龄、吸烟史、既往史、家族史等资料。

  使用图像存档与通信系统(PACS)从2家医院检索术前CT图像。兰州大学第一医院CT扫描参数为:(1)GE Discovery CT750 HD 64排螺旋CT(GE公司,美国)。管电压:120 kV;管电流:自动管电流调节;螺距:0.863 1;层厚:1 mm;视野:350 mm;图像矩阵:512×521;(2)Siemens Somatom Definition AS+ 64排螺旋CT(西门子医疗系统,德国)。管电压:120 kV;管电流:自动管电流调节;螺距:1.2;层厚:1 mm;视野:326 mm;图像矩阵:512×521。上海市肺科医院CT扫描参数为:Siemens Somatom Definition AS(西门子医疗系统,德国)或Brilliance 40(飞利浦医疗系统,荷兰)。在120 kV管电压和200 mA管电流下,不使用造影剂。Siemens组使用Somatom Definition AS扫描仪(640.625 mm检测器,1.0节距)。在飞利浦组,使用华晨40扫描仪(400.625 mm探测器配置,0.4节距)进行扫描。按以下参数对所有CT资料进行重建:卷积核=170 f,层间距2 mm,层厚2 mm,肺窗窗位?450~?600 Hu,窗宽1 200~1 500 Hu。检查前对患者行呼吸训练,扫描时患者平躺于CT扫描床上,双臂向上抱头状,仪器自动从肺尖扫描至肺底,仰卧位深吸一口气后屏住呼吸开始扫描。由2位研究者使用已发布的3D Slicer软件(4.10.1版本,www.slicer.org),采用手工方式对每个CT图像结节进行感兴趣区域 (region of interest,ROI)勾画,结节涉及的每个层面都需勾画,在此区域中手动排除支气管、大血管、骨骼和纵隔等非肺组织区域;见。所有勾画工作均在薄层肺窗图像上完成。从整个样本中随机选择30例患者由2名研究者独立分割病灶使用组内相关系数(intraclass correlation coefficient,ICC),评估2名研究者之间的一致性。记录结节部位、最大直径和结节类型,并判断结节是否具有毛刺征、是否存在钙化、是否合并肺气肿,出现争议时商讨解决。

  2名研究者对病灶进行手动分割的一致性较好,观察者间ICC为0.87。将每个人工标注的ROI使用Python3.7.1中的PyRadiomics包(www.python.org) 进行影像组学特征提取,共提取了1 317个影像组学特征,包括一阶统计特征(first order statistics)、形状特征(shape)、纹理特征和高阶统计特征,共分为7类:(1)一阶统计特征(n=252);(2)形状(n=14);(3)灰度共生矩阵(GLCM,n=336);(4)灰度依赖矩阵(GLDM,n=197);(5)灰度运行长度矩阵(GLSZM,n=224);(6)灰度大小区域矩阵(GLSZM,n=224);(7)领域灰度差矩阵(NGTDM,n=70)。其中一阶统计量描述了CT图像ROI的强度信息,如标准差、均数、方差等特征。形状特征反映了区域的大小和形状,如最大直径、体积、表面积等特征。纹理特征可量化区域异质性差异。高阶统计特征指从原始图像的小波变换中得到的一阶统计特征和纹理特征,包括平方根、小波和对数等特征。采用最小冗余最大相关性(max-relevance and min-redundancy,mRMR)和最小绝对收缩与选择算子(least absolute shrinkage and selection operator,LASSO)方法5折交叉验证筛选有判别肺结节肿瘤浸润程度价值的影像组学特征。LASSO算法的基本原理是通过构造添加一阶范数惩罚项即所有回归系数绝对值之和,将所有变量的回归系数进行收缩,随着惩罚参数(λ)的增加,越来越多的系数被快速收缩至0,未被收缩至0的变量则被保留下来进行模型训练。

  所有手术切除的结节病灶分别由患者所在医院病理科医师将标本经4%中性甲醛固定液固定、病灶切片、石蜡包埋、制片、苏木精-伊红染色(HE染色),由2名经验丰富的高年资病理诊断医师(侯立坤、孙少华)经过显微镜读片后做出诊断,当结果不一致时经综合讨论达成一致。根据2015年世界卫生组织病理分类诊断标准[]:(1)AAH:局部病变(≤0.5 cm),上皮细胞出现轻-中度不典型增生,未出现间质性炎性反应和纤维组织增生;(2)AIS:肿瘤细胞沿肺泡壁以贴壁的方式生长,未发现肺间质、血管或者胸膜浸润;(3)MIA:腺泡细胞以贴壁式生长为主且浸润灶直径≤0.5 cm;(4)IA:局灶性病变,病变浸润直径>0.5 cm。根据病理结果将肺腺癌分为非浸润性病变(AAH+AIS)和浸润性病变(MIA+IA)。

  目前Mayo和Brock模型是国内外公认的肺结节恶性概率预测模型,恶性概率P=ex/(1+ex),其中x取值不同。Mayo模型[]x=?6.827 2+(0.039 1×年龄)+(0.791 7×吸烟史)+(1.338 8×恶性肿瘤史)+(0.127 4×结节直径)+(1.040 7×毛刺征)+(0.783 8×上叶位置)。Brock模型[]x=?6.614 4+(0.646 7×性别)+(?5.553 7×直径)+(0.930 9×毛刺征)+(0.600 9×上叶位置)。以病理诊断结果为金标准,分别绘制这2个模型的受试者工作特征(receiver operating characteristic,ROC)曲线。

  使用SPSS 25进行统计分析,计量资料不服从正态分布采用中位数(上下四分位数)[M(P25,P75)]描述,组间比较采用秩和检验。服从正态分布的计量资料采用均数±标准差(±s)描述,组间比较采用t检验;计数资料以例数及率表示,组间比较采用χ2检验。Python3.7.1进行特征筛选以及SVM模型建立,并计算敏感度、特异度、预测准确率、阴性预测值、阳性预测值等指标评估模型的预测性能,绘制决策曲线和校准曲线以评估模型的预测价值。MedCalc统计软件进行分析,将SVM模型与Mayo、Brock模型预测性能进行比较。P≤0.05为差异有统计学意义。

  本研究方案经上海市肺科医院伦理委员会批准(批准号:K20-003),免除知情同意。

  共纳入400例患者,其中女267 例、男 133 例,平均年龄(52.4±12.7)岁。训练集280例,测试集120例。两组患者年龄、实性成分最大径、结节最大径、浸润程度、病理亚型、病变位置、结节性质等方面差异无统计学意义(P>0.05)。测试集中女性患者比例略高于训练集(P=0.044);见。

  各影像组学特征收缩系数的收缩路径曲线及筛选出的影像组学特征见。随着影像组学特征的λ值增大,进入模型的变量减少,变量系数的绝对值也逐渐向0靠近。最后LASSO筛选出8个影像组学特征非零系数的潜在预测特征。

  在预测早期肺腺癌非浸润病变和浸润性病变的二分类问题上,该模型在训练集的AUC值为0.91[95%CI(0.88,0.94)],测试集的AUC值为0.86[95%CI(0.80,0.93)];为了验证该模型在不同结节大小中的区分性能,我们根据结节最大径进行了亚组分析,由于>20 mm组结节均为浸润性病变,未进行性能分析。该SVM模型在训练集和测试集的不同结节直径亚组中表现出较为稳定的区分性能;见。2个数据集及亚组预测值和真实值的混淆矩阵见~。SVM模型的AUC明显优于Mayo模型0.73[95%CI(0.68,0.78)]和Brock模型0.73[95%CI(0.68,0.78)];见。

  通过决策曲线图可见预测模型的临床净收益高于所有干预和无干预曲线,说明该模型能够在临床上获益;见。校准曲线图可见预测模型的预测值与真实值间的误差较小,具有较高的准确度;见。

  我们通过2名初级胸外科住院医师(A和B)在有或无SVM模型辅助下,分别对结节肿瘤浸润程度判断情况进行比较来评估该模型的临床实用价值,用Delong test判断ROC曲线是否有统计学意义。医师A在模型辅助下判断肺结节肿瘤浸润程度AUC值从0.75[95%CI(0.70,0.79)]提升到0.82[95%CI(0.78,0.85),P<0.01];医师B在模型辅助下AUC值从0.64[95%CI(0.59,0.69)]提升到0.77[95%CI(0.73,0.81),P<0.000 1]。在该模型辅助下,敏感度、特异度、准确率均明显提高;见。

  机器学习是人工智能的一个分支,包含深度学习和机器学习算法,在医学领域的应用十分广泛[-]。机器学习通过从大量数据中学习如何执行特定任务,并在学习过程中逐渐提升该任务的执行表现,最终产生可以顺利执行该任务的计算机算法。机器学习、人工神经网络等模型已经应用于肺癌的诊断[, -],并且在内部数据中取得了很好的鉴别性能和准确率[]。然而这些工具存在有限的外部验证、过拟合以及无法解释的结果等缺陷。过去10年中新出现的证据表明医学图像中包含与病理学、血液学、基因组学、蛋白质组学互补的数据[]。在许多研究[, -]中证实了影像组学在疾病诊断、肿瘤分期、基因突变预测、生存预后等方面有更高的敏感性和特异性。Chae等[]利用纹理特征建立了人工神经网络以区分部分实性肺结节是非浸润病变还是浸润性病变,其AUC达0.98,但是由于样本量较小(86个)且未进行验证,因此不可排除存在过拟合的可能以及缺乏泛化性。Lu等[]建立的区分浸润性和惰性结节的模型AUC为0.846,鉴别诊断的性能有待进一步提高。

  通过肉眼在胸部CT中获取的信息有限,可能会遗漏一些定义肺结节类型的重要信息,此外早期浸润性病变和非浸润性病变在影像学表现上存在重叠导致LDCT在早期检测方面存在许多局限性,包括检测到大量不确定结节以及对惰性肿瘤的过度诊断,可能导致临床并发症甚至死亡[]。术中冰冻切片时肺泡间隔严重变形以及完全塌陷,因此术中冰冻组织学的病理检查有时不足以确定AIS、MIA、IA,从而导致切除范围不足或者术后再次补充肺叶切除的可能性[]。而ROI包括肺结节的整个三维空间,与术中冰冻获取的部分肿瘤相比,理论上有一定的优势。

  本研究建立并验证了基于影像组学特征的SVM模型来鉴别浸润性病变和非浸润性病变,该模型在测试集和亚组均表现出了较好的预测性能。我们的研究中证明了第十百分位数(first order statistics)、均方根(first order statistics)、短行程灰度强调(GLRLM)、归一化依赖不均匀性(GLDM)、大依赖灰度强调(GLDM)、相关信息测度1(GLCM)、区域熵(GLSZM)是预测肺亚实性结节肿瘤浸润程度的影响因素。GLCM是一种统计纹理的分析方法,评估像素之间的空间关系,并确定特定的像素组合在图像中出现的频率。既往有研究[]报道GLCM中的总和平均值和一阶类别的均匀性可以鉴别浸润性和非浸润性腺癌。均方根是衡量灰度水平与均值差异的一个指标,能够代表结节密度的异质性,这与侵袭性肿瘤的生物学有关[, ]。区域熵是衡量区域大小和灰度水平分布的不确定性和随机性,其值越高表示纹理特征的异质性越强,越倾向于侵袭性肿瘤。短行程灰度强调可以量化短运行长度和低灰度水平值间的联合分布。对比度是衡量空间强度变化的尺度,但也取决于整体灰度的动态范围,当动态范围和空间变化率都很高时,对比度值越大。归一化依赖不均匀性衡量整个图像依赖的相似性,较低的值表明相互依赖的图像间较强的同质性。相关研究[-]也报道了一阶统计特征(first order statistics)可以有效鉴别IA和非浸润性病变或MIA。

  不同于其他学者[-]的研究基于MIA完整切除时可以和AIS一样达到100%的5年生存率,将MIA归类为惰性病变。本研究认为MIA虽然没有淋巴结及血行转移,但是可以转变为IA,可行肺叶切除或亚肺叶切除。并且MIA和AIS在微环境、laminin-5表达水平[]、TP53突变频率方面[]存在差异,因此将MIA和IA归类为浸润性病变进行研究。 虽然有些研究[, -]报道即使在结节直径小的、纯GGNs中出现病理浸润性特征也并不罕见。在我们的亚组分析中,结节最大径>20 mm组全部为浸润性病变,其中84.9%(45/53)为亚实性结节,侧面反映了结节最大径和结节性质对评估肺结节肿瘤浸润程度有一定的意义,但由于本研究样本量较小,需要进一步进行多中心、大样本量的前瞻性研究来验证。

  本研究的一个优势是通过将2个中心的数据混合后随机分为训练集和测试集,从而降低了来自不同机构中人口统计学和临床协变量间的差异。但尚存在一定的局限性:(1)本研究为回顾性研究,并且仅纳入了经手术切除的AAH及肺腺癌患者,排除了其他恶性组织类型及良性病变,存在一定的选择偏倚;(2)采用手工勾画ROI,虽然经过第三位经验丰富的医师进行检查,但未对分割的可变性进行评估,因此需要开发一种可靠、稳健的自动切割方法来解决这一问题;(3)患者间的CT扫描方案未统一,可能导致对放射组学特征估计的偏差;(4)应当进一步探究结节周围影像组学特征是否会额外增加肺结节肿瘤浸润程度的预测性能。

  综上所述,基于影像组学特征的机器学习模型是一种较为可行的鉴别诊断肺结节肿瘤浸润程度的工具,为结节实性成分直径<3 cm肺亚实性结节肿瘤浸润性的鉴别诊断提供了辅助价值,可以为临床医师术前制定最佳的治疗干预方案提供参考价值,避免过度治疗或延误治疗。

  利益冲突:无。

  作者贡献:何花、杨德伦、赵蒙蒙、邓家骏负责文章构思和设计;马敏杰、韩彪、陈昶提供研究材料和患者资料;何花、杨德伦、孙硕、何立、马翔负责数据收集和整理;何花、杨德伦、赵蒙蒙、邓家骏负责数据分析和解释;所有作者参与文章写作与定稿。

上一篇:未成年能不能去献血?
下一篇:2015年成人高考《教育理论》教育学第二章考点