文 献 综 述
文献综述 基于高分辨生物组织断层图特征向量的分类模型 摘要:增强型数字显微镜将高分辨显微成像技术与计算成像相结合,可实现无标记实时数字诊断,辅助外科医生进行术中肿瘤边界的快速判断。全场光学相干层析术 (Full-field Optical Coherence Tomography, FF-OCT)是一种非侵入无标记的高分辨生物组织成像技术,通过结合低相干光源的白光干涉技术和显微物镜,以及面阵成像相机,对生物组织进行二维层析成像,同时结合纵向扫描成像方式,可实现对生物组织三维结构微米量级的层析成像。支持向量机(Support Vector Machine,SVM)是一种基于统计学习理论的数学模型,是关于给定数据集合最大化特定数学函数的机器算法。基于全场光学相干断层结构的形态学特征,建立特征向量,采用支持向量机模型对肿瘤与癌变结构进行训练与分析。基于此,对SVM的FF-OCT技术的原理和实际应用展开研究背景调查、分析与展望。 关键词:全场光学相干层析术 支持向量机 算法优化 生物医学 Abstract:with the combination of high-resolution microscopic imaging technology and computational imaging, enhanced digital microscope can realize unmarked real-time digital diagnosis and assist surgeons to quickly judge the tumor boundary during operation. Full-field optical coherence tomography(FF-OCT)is a non-invasive and label-free high-resolution biological tissue imaging technology. By combining the white light interference technology of low coherent light source, micro objective lens and area array imaging camera, two-dimensional tomography of biological tissue can be realized by combining longitudinal scanning imaging mode and micrometer tomography of three-dimensional structure of biological tissue. Support vector machine (SVM)is a mathematical model based on statistical learning theory, which is a machine algorithm for maximizing specific mathematical functions in a given data set. Based on the morphological characteristics of the full-field optical coherence tomography structure, the eigenvector is established, and the support vector machine model is used to train and analyze the tumor and cancerous structure. Based on this, the research background investigation, analysis and prospect of the principle and practical application of FF-OCT technology of SVM are carried out. Keywords:full-field optical coherence tomography; support vector machine; algorithm optimization; biomedical science 1 引言 在上个世纪60年代,计算机的发明将这个世界改变,随着计算机问世的各类机器算法也逐渐投入人们的视线,应用到息息相关的生活中。支持向量机(Support Vector Machine)在众多分类算法中表现出卓越的性能。全场光学相干层析术(Full Field Optical Coherence Tomography)是一种具有革新意义的非侵入式无标记高分辨生物组织成像技术,辅以计算机系统,利用FF-OCT获取高分辨率的生物组织断层图像;利用SVM对图像进行特征提取并进行肿瘤与癌变的特异性分析,将SVM和FF-OCT两者联系使用,可以作为一种对肿瘤或癌性疾病的辅助诊断工具。本文分别介绍了支持向量机和FF-OCT的基本原理和应用,为后续的研究打下理论基础。 2 支持向量机 支持向量机(Support Vector Machine,简称SVM)最早于1964年由V.N. Vapnik,A.Y. Chervonenkis,C. Cortes 等人提出的一种服务于统计学和人工智能类别的机器学习算法。它本质上是一种Vapnik-Chervonenkis理论(VC理论)的从有限样本中估计出(学习)相关性的通用数学框架[1]。其主要的特性是分离超平面、最大边缘超平面、软边缘、核函数四个方面[2]。这种机器算法自从提出后便获得大量应用,在二十世纪末期和二十一世纪初,支持向量机以其比神经网络等传统方法更强的泛化能力在机器学习界声名鹊起。因此,支持向量机已经成功地应用于人脸检测、验证和识别、目标检测和识别、手写字符和数字识别、文本检测和分类、语音和说话人验证、识别、信息和图像检索、预测等领域[1]。 很长一段时间内支持向量机都是统计学习理论中最年轻的分支,因此早期许许多多的科学家都致力于支持向量机的优化以提高其泛用性。Chris J.C. Burges等人在1997年便提出了利用“虚拟支持向量”的方法改进支持向量机泛化性能,同时利用“约简集”的方法通过逼近支持向量机决策面来实现速度的提高,二者结合将大幅优化支持向量机的精度和速度,虚拟支持向量法适用于任何不变性已知的支持向量机问题,而约简集方法则适用于任何的支持向量机模型[3]。基于平滑分类的思想,在2001年Yue-Jye Lee和O.L.Mangasarian等人提出了一种新型重构——无约束光滑重构,即光滑支持向量机[5](Smooth Support Vector Machine,SSVM),利用完全任意核生成和快速牛顿-Armijo算法的全局收敛性和二次收敛性的SSVM在交叉验证正确率上是其他四种方法(稳健线性规划算法(RLP)、特征选择凹最小化算法(FSV)、基于1范数方法的支持向量机(SVMk.K1)、经典支持向量机(SVMk.K2))中最高的,其运算速度也最快。在更大的问题上,SSVM与SVMlight[6]、SOR和SMO[4]相当或更快,同时SSVM还可以生成例如棋盘的高度非线性的分离面。而针对训练算法的优化,截止到2002年,支持向量机的训练算法主要有三大类:以SVM-light为代表的分解算法、序贯分类法和在线训练法。Osuna针对SVM训练速度慢及时间空间复杂度大的问题提出了分解算法,并将之用于人脸检测中。其关键点在于选择一种最优的工作集选择算法。Platt提出了SMO(序贯最小优化)算法来解决大训练样本的问题。S.S.Keerthi等人对Platt的SMO算法进行分析并提出了在判别最优条件时用两个阈值替代一个阈值的重大改进,使算法更加合理,同时他们还指出SMO算法应用于回归和函数估计问题。Chih-WeiHsu通过改变SVM的提法提出了一种简单训练算法BSVM,使算法变得简单易行[4]。 由于支持向量机的训练使得分类向量的维数对支持向量机的性能影响不像对传统分类器的影响那样明显,所以支持向量机具有处理非常大的特征空间的潜力。此外,基于其良好的泛化特性,在训练过程中支持向量机的结构性误分类风险是最小的。[1]这使得其在机器状态检测和故障诊断上有着良好的应用,如进行滚动轴承故障诊断、机床故障诊断、暖通空调机器检测等。在生物医学上,由于其独特的核方法,支持向量机也常被用来处理非矢量输入[8],如可变长度序列或图形。对于脑MRI图像,采用支持向量机作为分类器对图像进行分类的效率比起人工神经网络(ANN)更佳,灵敏度、特异度和准确度也有所提高[9]。同时,自2000年初获得高通量的微阵列基因表达数据以来,支持向量机作为分类器已被用于癌症分类。癌症基因组数据具有高维、异质和噪声等特点。支持向量机学习在癌症中的应用基因组学是一项流行且成功的工作[10]。在本课题中,获取的高分辨生物组织断层图像可以在用matlab提取出特征向量后利用支持向量机建立形态学特征,这与肝组织断层图像的分形参数作为定量应用到SVM中的实验相仿[11]。 尽管支持向量机在很多方面展现出非凡的优势和才能,也有着各国界不同科学家的努力使其不断优化,但SVM并不是在所有数据集上都是排名靠前的。在SVM本身的建立上,从零到建立并不需要过多的复杂性,而其在投入实际应用时最大的困难是对分类器模型的训练,通过极其大量的训练进行调参的过程非常的繁琐冗杂,往往耗费极大时间。这与那些大多数能够“开箱即用”的简单统计程序和集成方法相比并没有优势。对于回归任务,神经网络、投影寻踪回归和随机森林[7]通常也都比支持向量机能产生更好的结果。这也就说明,支持向量机并不是在每个领域内都拥有极佳的表现,同时局限于其调参的过程,支持向量机还有很大的改善需求和发展空间。 3 全场光学相干层析 光学相干层析成像(Optical Coherence Tomography,OCT)是近二十年来的一种新兴的成像技术,发展迅速。它具有高分辨无损的即时成像能力,同时易于与仪器对接组合成系统,应用前景十分广阔[12]。在对生物组织成像方面,它利用生物组织的后向散射光与参考光发生弱相干干涉以获得生物组织的深度信息,结合扫描成像方式,可实现对生物组织三维结构微米量级的层析成像[13]。2017年,Cecilia.S.Lee等人将深度学习神经网络与OCT结合进行生物图像数据的处理[18]。2019年,Victor.T.T.Chan等人提出OCT已可以用于测量阿茨海默症的光谱域[19]。 全场光学相干层析(Full Field Optical Coherence Tomography,FF-OCT)是由法国物理化学实验室(Ecole Supeacute;rieure de Physique et de Chimie Industrielles,ESPCI)和法国高等工业物理化学学院研究小组于1998年提出的一种光学系统[14]。这种基于CCD探测器的并行成像技术不需要横向扫描就可以一次性得到样品的横断面信息,因而不必采用复杂的二维扫描振镜组,这就是“全场”的优势所在[13]。 传统的FF-OCT系统一般使用较高数值孔径的水浸显微物镜。2001年,De Martino等人使用热光源进行照明,发展了基于Linnik干涉结构和使用快速CCD进行探测的全场OCT系统【15】,之后随着不断地发展深入,各国各地科学家对FF-OCT系统一步一步进行优化。2008年,Yang等人研制了一套采用新型无色散移相器进行移相操作的FF-OCT系统[17],避免了宽光谱条件下采用有色散移相器和传统移相算法带来的系统误差,此系统在器件使用量小的情况下获得了较强的算法适应性和较快的成像速度。同年,Jihoon等人提出了一种适用于高速系统的FF-OCT系统,该系统利用数学希尔伯特变换,仅从两幅相依干涉条纹图像中恢复出一副EN图像,该方法对相移量的误差具有较强的稳健性且和抗干扰性[21]。到2014年,Gao研究小组在基于Linnik干涉结构全场光学相干层析系统采用卤钨灯作为光源,并将水浸显微物镜替换为普通物镜,极大的降低了成本[14] [16]。2015年,Gao研究小组运用单片调制相位,克服系统采用压电陶瓷参考镜光强手动调制的缺点,同时结合补偿系统球差的方法一定程度上提高了基于Linnik结构的FF-OCT系统成像质量[20]。 近十年来,FF-OCT在各类领域里展现了自己的优势。2010年,Choi WJ等人通过检索原始钞票防伪特征的内部结构,证明了FF-OCT的深度分辨成像能力获取的现金全息图在防伪科学领域具有潜力[22]。2012年,Subhash H M总结了FF-OCT和SS-FF-OCT(单次全场光学相干层析)在生物成像上从医学诊断到手术指导再到聚合物微结构表征的应用,与此同时,法国总部的LL tech公司将第一台FF-OCT商业化[23]。2015年,Auksorius E等人设计了一种利用FF-OCT技术进行人体内侧指纹成像的技术(O-FF-OCT),通过获取倾斜图像来确定每个皮肤层的深度,可以在少于1s的时间内获取,除了指纹检测,还可以应用于研究和检测各类皮肤病和肤质状况[24]。2020年,Mececirc; P团队通过将FF-OCT系统、SD-OCT系统和高速音圈平移平台相结合而实现的一种方法能够记录给定深度样品的高速正面截面的成像,这项技术解决了活体人视网膜采集成像时存在连续的不自主的头部和眼睛的轴向运动问题,将误差降低了7倍[25]。纵观各类FF-OCT的应用的发展,FF-OCT在生物医学领域的应用是目前最前沿、最有意义的实践。特别是癌症(即恶性肿瘤)仍未出现有效防治和特效药物的当前阶段,在临床医学中观察肿瘤的形态学特征对肿瘤的生长、转移过程中起着重要作用,FF-OCT以其非侵入、无标记的高分辨生物组织成像特点,具有良好的实时成像性能。将全场光学相干层析(FF-OCT)与支持向量机(SVM)相结合,可以实现形态学特征的量化,构建一种综合诊断系统,这也是本课题的意义所在。 4 结合OCT图像的支持向量机分类技术 基于OCT比起其他方法更快的高速扫描速度和比起更加优质的信号灵敏度,OCT在临床医学上常被作为强有力的诊断工具。截止到2013年,虽然已经有一部分研究利用纹理信息来对OCT图像进行分层分类,但被报道的研究只有少部分使用纹理特征来表征正常和异常的视网膜组织。N. Anantrasirichai等人在2013年提出了基于支持向量机的光学相干层析纹理分类技术应用于青光眼的检测[26],其原理是给定视网膜层内由于光线反射而产生的纹理被OCT捕捉,并将提取的信息用SVM进行特征分类,从结果上来看,采用视网膜内层厚度和质地的纹理特征比单独使用层厚准确度更高,同时SVM的分类精度比其他算法高出4%以上。2018年,Luo S, Fan Y, Liu H等人[27]利用支持向量机对人体胃癌相干层析图像进行自动分类,SVM对正常图样和癌变图样分类的准确率、灵敏度度、特异度分别为91.3%、95.3%、87.2%。2019年,基于支持向量机的分类方法,Cheng-En Ko等人对利用OCT图像检测老年性黄斑变性(AMD)的过程中是否采用图像裁剪技术进行了讨论,结论为使用图像裁剪的图像准确率在第一阶段为93.4%,只比不使用的情况下损失了0.5%,但节省了约12个小时的计算时间和大约一半的内存储存[28]。2020年,Venkatraman K和M Sumathi使用MATLAB对从OCT中提取的具有相同特征的图像进行了SVM的评估,将输入图像分为正常和异常两类并进行灵敏度和特异性评估,对囊样黄斑水肿(CME)、脉络膜新生血管膜(CNVM)和黄斑裂孔(MH)等失眠前的征兆表现出高效优质的诊断力[29]。 5 总结 本文对支持向量机(SVM)和全场光学相干层析(FF-OCT)分别作出了系统的介绍,从基本原理到优化发展再到两者随着时间不断深入推进的各类应用。从SVM与OCT技术的结合使用发展来看,基于SVM的强大分类能力和OCT的高分辨成像能力,对生物医学方面特别是对临床上生物组织异常(如:视网膜病变、内脏肿瘤、癌细胞等)的诊断应用表现出优异的诊断力。但是将OCT或FF-OCT与SVM的结合仅仅使用在活体生物医学上是否局限了一定的目光?或许我们可以跳出“活体”和“临床”的拘束,对非自然死亡的死者进行法医学的组织特征判断,从断层图像的分析上寻找到死亡原因,对罪犯的锁定进一步缩小范围。同时,OCT的应用大部分都在有机物(特别是生物)方向,设想利用高分辨非侵入的成像能力和光谱分析结合,对化石、岩层等非生物界的横断面进行特征分析,进行年代推演等的应用也是具有可能性的。对于SVM的优化,近几年火热的研究领域——深度学习也将为SVM和OCT的联用在更加复杂、困难的判断环境下提供更好的视野。科技不会停下发展的脚步,上述的未知领域或许可以为今后的发展工作提供参考。 参考文献
|
以上是毕业论文开题文献,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。