- · 《检验医学与临床》刊物[08/03]
- · 《检验医学与临床》征稿[08/03]
- · 《检验医学与临床》投稿[08/03]
- · 《检验医学与临床》数据[08/03]
- · 《检验医学与临床》栏目[08/03]
人工智能助力检验医学发展(2)
作者:网站采编关键词:
摘要:1.3.4 迁移学习 深度学习和强化学习任务均从零知识开始,这意味着模型的结构和参数开始是随机猜测的。除此之外,实现机器学习需要大量标注好的高质
1.3.4 迁移学习 深度学习和强化学习任务均从零知识开始,这意味着模型的结构和参数开始是随机猜测的。除此之外,实现机器学习需要大量标注好的高质量数据以及强大的计算资源和算力基础。因此学者们考虑对已有大数据集进行最大程度的开发,于是迁移学习诞生了。迁移学习也是实现机器学习的一种手段,迁移学习可以理解为将计算机在一个任务上学习到的知识迁移到另一个新任务上,作为其起点继续对新任务进行学习。迁移学习包括基于实例的迁移学习,其特点为源域实例类似目标域实例;基于特征的迁移学习,其特点为源域特征与目标域特征有重叠;以及在训练阶段共享一部分参数或者先验分布的基于共享参数的迁移学习[13],迁移学习概念如图3所示。
图2 深度学习概念图Fig.2 Deep learning concept diagram.
图3 迁移学习概念图Fig.3 Transfer learning concept diagram.
1.4 智能化的实践基础
1.4.1 大数据 人工智能有3大要素:算法、数据、算力,数据是人工智能的基础之一。人工智能的发展需要通过对特定数据进行反复的学习,总结经验与知识。数据的质量往往对人工智能算法的好坏有决定性作用,统一标准的数据集是对人工智能算法优劣进行准确评价的保证,大数据技术的发展迎来了人工智能发展的春天[14]。“大数据”这个概念正式被提出是在2011年,并且在人工智能的催生下产生了大量优秀的带标注或反馈信息的数据集,如ImageNet,COCO,人脸数据库(AFLW)等。ImageNet是世界上最大的图像识别数据库,模拟人类的识别系统建立,目前ImageNet中共有14,197,122幅图像,涵盖了21,841个类别,每个类别中又有上百张图片。利用ImageNet训练的不同模型常在迁移学习中用做预训练,预训练在缩短计算机训练时间的同时还可以提升模型训练效果。AFLW人脸数据库是一个多姿态、多视角的大规模人脸数据库,该数据库大概包括25,000万张人脸图像,59%为女性,41%为男性,且每个人脸都被标注了21个特征点,这个数据集在人脸识别领域有极高的研究价值[15]。
1.4.2 算力基础 1956年,人工智能诞生却被当时时代的局限性限制,计算机计算能力无法达到人工智能的要求,人工智能一度面临寒冬。近年来与人工智能算法数据处理相关的芯片蓬勃发展,大致可以分为四种:CPU、GPU、NPU、TPU[16]。CPU擅长高效率处理指令,适合处理逻辑控制密集的计算任务。GPU擅长图形类或非图形类无逻辑数据高度并行计算,更适合处理数据密集的计算任务,所以GPU比CPU更适合深度学习的大量矩阵、卷积运算[17-18]。TPU是为机器学习量身定做的一款计算芯片,以张量为处理单位可以加速人工智能算法框架TensorFlow的运行,相比CPU和GPU,为机器学习量身定做的TPU执行每个操作所需的晶体管数量更少,效率更高[19]。NPU是嵌入式神经网络处理器,专门为物联网人工智能而设计,面向神经网络算法进行加速,典型代表为中科院研制的寒武号系列[20-21]。
1.4.3 软件平台 机器学习软件平台包括Caffe,TensorFlow,Keras,PyTorch等机器学习算法框架,这些框架的出现将机器学习常用的算法和模型封装成固定的组件,降低了机器学习的门槛。机器学习算法工作随着各类框架的出现变得通俗易懂,算法框架的出现不仅保证了运用的灵活也保证了运算的效率,目前机器学习领域各类优秀算法的百花齐放离不开软件平台的技术支持[22-23]。
2 人工智能催化医学检验革命
2.1 检验标本处理
2.1.1 标本采集机器人 当前最典型,最成熟的标本采集机器人当属全自动采血机器人,全自动采血机器人通过红外线照射配合超声波可以得到与血管位置、直径相关的数据。机器视觉可将血管位置、直径等相关数据作为输入,选择合适的算法对数据进行计算然后预测出血管位置、直径以及针头采血的最佳位置及角度[24]。王涛等人提出了一种新的基于计算机图像从血管造影图像中自动提取冠状动脉的图像分割方法。该方法基于多尺度自适应Hessian的增强方法对血管造影图像进行增强后,与统计区域合并技术结合从图像中分割出血管轮廓,提取中心线并且计算出血管直径[25-26]。自动采血机器人利用了智能识别技术,用智能机器取代了人工,减少了人类的主观性失误,将工作员从繁重且危险的工作中解脱出来。
2.1.2 样本稀释机器人 实验室及检验科所采集的样本一般浓度较高,需要稀释到不超出检测方法学的线性范围。尿液,粪便及阴道分泌物有形成分显微镜检测时,样本均需要稀释到合适浓度。检测时,医务人员通常是直接将未进行稀释的样品进行检测,发现检测效果不佳后再做稀释。如阴道分泌物虽然呈液体状可以直接上镜检测,但是太浓稠的样本会导致镜检时有形成分黏连重叠,不利于医务人员观察。样本稀释机器人分为两类,一类利用光学原理,带有一个光电检测器,将透过样本检测到的透射光的大小作为输入,输出则为该样本是否需要稀释。另一类则需要具体的样本中某类成分的浓度数据。有学者利用基于多层感知器的人工神经网络对心肌肌钙蛋白I检测结果数据集进行建模得到可以用于判断心脏病患者体液样品是否需要稀释的算法模型,对不需要和需要进行稀释样品的正确推断率分别为100%和86.2%[27]。样本稀释机器人的出现不仅解决了样品处理过程中耗时过长的问题,也减少了样品浪费和多余的繁琐操作。
文章来源:《检验医学与临床》 网址: http://www.jyyxylczz.cn/qikandaodu/2020/0828/414.html