中医诊断学论文

您当前的位置:学术堂 > 医学论文 > 中医学论文 > 中医诊断学论文 >

中医四诊合参智能化研究现状与实现策略

来源:中医杂志 作者:赵文;张佳;徐佳君;辛
发布于:2020-02-06 共8809字

  摘    要: 为确保中医诊断的正确性,除了要求单诊信息的准确性和客观性外,更重要的是四诊合参。中医四诊信息客观采集和分析系统的研究不断取得突破,为开展四诊客观信息的融合研究奠定了基础,但不同诊法设备分类标准不统一,信息来源存在差异,制约了四诊合参的融合。通过梳理近年来有关中医四诊包括望诊、闻诊、问诊、脉诊等方面的智能化研究,结合四诊合参智能化研究尚处起步阶段的现状,提出尝试从多源数据融合角度,借助协同训练法、多核学习法、基于子空间学习法提升四诊合参的融合度及准确性,探寻四诊合参智能化的可能实现路径。

  关键词: 四诊合参; 中医智能化; 多源数据融合; 协同训练法; 多核学习法; 子空间学习法;

  Abstract: In order to ensure the correctness of Chinese medicine diagnosis, in addition to the accuracy and objectivity of the single diagnosis information, it is more important to integrate the four diagnosis. The research on the objective collection and analysis system of the four diagnosis information of traditional Chinese medicine has made breakthroughs, laying a foundation for the research on the fusion of objective information of the four diagnosis. However, the classification criteria of different diagnosis equipment are not uniform, and the sources of information are different, which restricts the integration of the four diagnosis. In this paper, by combing the research on the intellectualization of four diagnosis of traditional Chinese medicine in recent years, including inspection, listening and smelling, inquirying, and pulse diagnosis, and combining the current status of the research on intellectualization of the four diagnosis integration in its initial stage, an attempt is made from the perspective of multi-source data fusion, with the help of collaborative training method, multi-core learning method, and subspace-based learning method to improve the integration and accuracy of the four diagnosis integration, and explore the possible path for intelligentization of the four diagnosis integration.

  Keyword: four diagnosis integration; traditional Chinese medicine intellectualization; multi-source data fusion; collaborative training method; multi-core learning method; subspace-based learning method;

  随着中医学数字化、智能化的逐渐发展,中医学与人工智能技术的结合研究已经上升到国家健康战略高度[1]。20世纪70年代,中国学者便试图将人工智能技术成果应用于中医研究,并开发出第一代基于知识规则的专家系统[2],至今已持续有四十余年的探讨。在此期间,中医大数据、中医四诊设备研制、中医四诊信息融合、中医智能辅助诊疗平台等模块得以快速发展[3,4]。但目前相关领域仍存在诸多制约中医智能化发展的共性问题亟待解决,如中医诊断术语标准、四诊信息融合、中医证候诊断客观化等[4,5]。本文梳理近年来有关中医四诊技术应用的研究,并对当前研究存在的问题和可能的解决路径加以分析阐述如下。

  1、 中医四诊合参与智能化:制约中医诊断智能化的瓶颈问题

  四诊合参独具中医特色,是中医进行疾病诊断的基本原则,其主要包含四诊与合参两方面。四诊即望、闻、问、切四种中医诊察收集病情资料的基本方法,合参即依据中医思维将四诊信息加以融合。中医学注重整体思维,认为四诊彼此联系、不可分割,且疾病发生、发展复杂多变,证候、脉象均有真有假,若四诊信息收集不全便难以判断出疾病的虚实真假,很容易造成误诊误治,只有将四诊信息有机结合才能全面系统地了解疾病,从而做出准确判断。

  中医学具有庞大的数据和潜在的规则,并涉及天时、地域、人文、哲学等多学科知识,蕴含大量的数学符号、系统论要素,这与计算机领域的符号主义和联接主义存在共通之处,故可借助数学建模以及系统分析等途径实现中医与人工智能的有机结合。而在中医智能化研究领域重要且关键的问题之一是要做到中医诊断智能化,这是实现中医智能化辨证、智能化治疗疾病的前提。当前四诊技术智能化研究领域已取得部分成果和突破,然而在四诊合参智能化领域尚有诸多困难有待解决,这也成为制约中医诊断智能化发展的瓶颈问题。

  2、 四诊智能化研究现状及存在问题

  自21世纪以来,诸多学者在中医望诊、闻诊、问诊、脉诊信息客观化采集设备与数据处理算法方面做了大量工作,在相关技术与智能化方面不断取得突破。
 

中医四诊合参智能化研究现状与实现策略
 

  2.1、 望诊智能化研究

  在面诊方面,诸多研究在图像分割技术方面做了探讨,Snake算法[6]、Otsu最优全局阚值处理算法[7]、线性判别式分析[8]等算法的运用提升了面诊的面色、光泽及脸型分类特征提取的准确率。在目诊方面,分别运用彩色人眼检测算法[9]、Cam-shift跟踪算法[10]提升了捕捉定位眼球运动轨迹的速度和准确性。在舌诊方面,JSEG算法[11]、边缘检测算法[12]、图论分割法[13]等的融入提升了舌体轮廓分割、舌苔和舌色识别的准确性。

  值得注意的是,已有部分智能化望诊运用到了临床疾病研究中,如采用智能化舌诊探讨高尿酸血症患者舌象与病机相关性[14];基于深度卷积神经网络技术,结合DeepGestalt深度学习算法,从人脸照片中识别出罕见遗传综合征的能力表现已经优于临床医生[15]。

  然而,由于望诊诊法自身的复杂性和计算机相关技术未完全成熟,尚有一些问题有待进一步探讨和解决,主要表现为:1)在望眼神和望面部光泽以及望舌体动态等方面缺乏较为精确的算法模型,现有技术难以将较为抽象、灵动的望诊信息有效转化为计算机语言;2)在望诊原始资料收集与归纳方面存在标记不统一、不规范,采集人员中医临床水平差异度较高等因素,导致望诊信息数据的可信度和利用度降低;3)望诊所采集的面部图像信息较为特殊敏感,直接涉及个人隐私,易触发伦理纠纷、肖像权纠纷等问题。

  2.2、 闻诊智能化研究

  在听声音研究中,双向关系型记忆网络[16]、隐马尔可夫模型[17]、高斯混合模型以及熵构建[18]等系统技术被用于量化语音和提升语音识别度。在嗅气味研究中,基于乘性校正法的长期漂移校正算法[19]、基于金属氧化物半导体传感器阵列[20]等方法技术的提出进一步提高了气味诊断的稳定性和准确度。

  有关闻诊智能化的研究相关技术尚未成熟,存在较多问题,主要表现在:1)缺少标准化、大体量的人体生理性和病理性声音、气味数据库,现有数据质量较差;2)分析声音、气味信息需要综合运用声学、物理学、化学、数学、统计学等多学科技术,而当前各相关学科融合度欠佳;3)现有的闻诊智能化研究较为局限,多集中在肺系疾病、喉科疾病的声音研究和口腔气味分析,难以适应临床多病种、复杂兼夹证等的闻诊辨病需求;4)所研制的智能化闻诊仪暂时仅能对声音、气味信息进行定性或定量分析,而不能对闻诊数据进行整体评价;5)闻诊智能化研究较依赖于设备研制,在相关计算机算法模型方面的研究较为薄弱,难以在复杂多变的外界环境中发挥应有的作用。

  2.3、 问诊智能化研究

  问诊智能化研究起步较早,20世纪70年代便有学者尝试将人工智能技术融入问诊领域,随后混合优化的特征选择算法[21]、隐结构法的启发式双重爬山算法[22]、极值随机森林算法以及含有隐节点的贝叶斯网络[23]等技术被运用到问诊证候模型的建立中。

  当前越来越多的中医问诊模型陆续出现,如基于多标记学习和深度学习算法的慢性胃炎中医证候模型[24]、基于聚类分析及概率论原理的心系疾病的隐结构模型[25],但仍存在有待解决的问题:1)中医存在通假字、一词多义、同义词、歧义词、抽象词等复杂文学现象,使得计算机无法准确做出识别,如何将复杂抽象的中医语言尽可能转化为易被理解的现代术语是亟待突破的难题;2)中医数据标准化研究有待进一步强化,统一规范的中医信息采集分析互联互通系统亟待建立,以便更好地解决中医数据共享和交换存在的问题;3)能够很好体现出中医整体思维、符合临床实际需求、灵活智能的问诊模型有待深入研发。

  2.4、 脉诊智能化研究

  切诊的智能化研究主要集中于脉诊,而脉诊智能化研究主要涉及两方面,一是脉象采集传感器技术研究,二是对脉象特征提取方法和脉象波形图分析处理的计算机算法研究。研究者分别基于序列图像提取运动信息算法[26]、深层卷积神经网络[27]、希尔伯特黄变换分析法[28]、BP神经网络[29]等方法技术对脉象信号、脉搏波识别与分类等问题进行探讨分析,促进了脉诊智能化的发展。

  然而当前涉及多探头、阵列式脉象采集传感器技术尚未完全成熟[4],虽然脉诊新型传感器技术和算法不断涌现,但仍存在有待解决的问题:1)未真正实现脉象结果的客观化与标准化,如何准确地提取分析脉象测量结果有待进一步探讨;2)获取的大部分脉象信息不够全面,难以同时反映脉象“位、数、形、势”四要素信息;3)缺乏与望诊、闻诊、问诊有机合参的智能化脉诊设备,不能准确体现中医思维特点,距离临床应用仍有较大距离。

  3、 四诊合参智能化研究现状

  21世纪初的十年间,受限于信息分析方法和信息融合技术的不成熟,四诊技术智能化研究呈现四诊“各自为战”的特点,未能有效发挥“四诊合参”的优势。近几年,中医四诊信息客观采集和分析系统的研究不断取得突破,为开展四诊客观信息的融合研究奠定了基础,中医诊断智能化研究逐渐出现四诊融合的趋势。但目前不同诊法设备分类标准不统一,信息来源存在差异,故而与真正实现四诊合参智能化仍然有较大距离。

  基于中国知网数据库(CNKI),以“四诊合参”为主题词,以“智能化”或“计算机”为关键词进行检索,调研近20年文献,共检索到27篇有效文献,与四诊合参智能化研究直接相关的文献不足10篇,由此可见,四诊合参智能化研究尚处于起步阶段。对主题词类别进行计量可视化分析,可构建有关“四诊合参”的知识图谱。结果提示,“诊断”“症状体征”“疾病”均与“四诊合参”存在关联,从中医学角度理解,诊断信息、症状体征信息、疾病信息、治疗信息等均可为四诊信息的融合提供数据,从而提高四诊合参的准确性。从计算机角度来看,“软件”“聚类分析”“信息技术”“因特网”“分类法”“逻辑学”“联机系统”“人工智能”“机器学习”“数据收集”“云计算”等主题词均与“四诊合参”存在隐性关联,从而提示借助计算机技术有助于推动四诊合参的实现,这就启发我们要挖掘两者间的共性特征,以促进两者的有机融合。

  4、 四诊合参智能化的实现路径

  根据文献调研分析及四诊合参的原理,合参的实质是望、闻、问、切等各类数据信息的融合过程,而计算机在处理复杂数据方面具有绝对优势,因此,可以考虑从多源数据融合角度借助计算机技术探寻四诊合参智能化的可能路径。

  4.1、 多源数据学习与四诊合参智能化的相关性

  多源数据学习由Yarowsky等[30]提出,其算法通常满足一致性原则和互补性原则,用于对多种数据进行认知、综合和判断。多源指从不同信息源采集到的数据,可看作是对同一事物从不同视角或不同途径的刻画,每种刻画存在与之相应的映射集。通过利用多源数据探索数据间的关联,可以改善学习性能[31],使学习系统具有更强的泛化能力。

  人类天生具有视觉、嗅觉、听觉、触觉等各类感觉通路,并借此来感知复杂的外部环境信息,经过大脑处理后将信息归类、整合、升华,从多源数据中提炼出可被理解和掌握的知识[32]。对于计算机而言,机器学习与人类学习原理是一致的[33]。机器学习的终极目的也是从有限的数据中获取知识,同样是通过相似性对对象进行归类[34],这与人类使用概念对世界上的事物进行归类的原理是相通的。因此,通过训练机器从多源数据中学习概念,提炼规则,可以做到将四诊设备获取的多源数据有机整合,从而实现四诊合参智能化。

  4.2、 实现四诊合参智能化的可能路径

  早期有关四诊合参的研究多采用单纯数据融合,如回归分析、聚类分析、支持向量机等[35],该方式是把若干数据源简单合并成一个大数据源,这种方式忽略了不同数据源间的冗余性,因而整体学习效果不尽如人意[36]。基于此,我们认为可以尝试结合当前先进的多源数据融合算法模型提升四诊合参的智能化程度。具体技术方法主要有协同训练法、多核学习法、基于子空间学习法[36]以及以上三种学习法的变种和新法。

  4.2.1、 借助协同训练方法提升四诊合参智能化程度

  协同训练方法[37]是多源数据结合的方式,通过在每一个数据集合中分别训练一个训练集进行多角度分类,并从预测结果中标记训练出新的分类器,加以挑选,强调不同数据集在输出上保持一致,反复迭代后得到最终分类器,可对测试集进行预测分析,克服了传统监督学习中需要训练大量有标记的数据才能得到一个强学习器的弊端。临床获取的四诊数据往往体量庞大,多未标记,训练难度和融合性较差,若采用协同训练方法加以训练,就有可能利用未标记数据训练出分类器,作为示例辅助探查新数据,从而充分发挥多源数据的优势,实现不同数据源之间一致性最大化[38,39],提升四诊合参的准确性。其具体应用流程见图1。

  图1 基于协同训练法实现四诊合参智能化流程图
图1 基于协同训练法实现四诊合参智能化流程图

  4.2.2、 借助多核学习方法提升四诊合参智能化程度

  多核学习方法[40]是选用一组合适的核以及核结合方式进行多源学习,具有更高的灵活性,通过直接相加核和加权相加多个核函数映射到多维组合空间,涵盖了各个子空间不同的映射信息,能够将异构数据中不同特征信息分别通过最合适的单个核函数加以映射,从而使数据在新组合空间中更加准确地表达。若将此方法运用在四诊信息的处理中,可通过对望诊、闻诊、问诊、脉诊等多源数据进行多核函数的映射,由各个核子空间融合为一个核空间,进而实现四诊合参,提高样本数据的分类诊断预测度。其具体应用流程见图2。

  图2 基于多核学习法实现四诊合参智能化流程图
图2 基于多核学习法实现四诊合参智能化流程图

  4.2.3、 借助基于子空间学习方法提升四诊合参智能化程度

  基于子空间学习的方法[41,42]是通过找到一个所有数据共享的低维子空间,利用低维表示代替多个高维数据进行聚类或分类,将多源信息直接结合在一起,然后利用潜在子空间进行学习,以获得数据强判别性信息的描述。若运用该方法处理多源四诊信息,可将望诊、闻诊、问诊、脉诊数据投射到一个共享低维子空间,利用该潜在空间对数据信息加以训练学习,形成稳定的训练空间集,从而提升四诊合参的融合识别度。其具体应用流程见图3。

  图3 基于子空间学习法实现四诊合参智能化流程图
图3 基于子空间学习法实现四诊合参智能化流程图

  三种学习法从不同角度提升四诊合参的融合度,协同训练法可以灵活地对未标记的四诊数据进行集成学习,以类似投票的形式训练出具有预测能力的分类器,节约了四诊合参的融合时间;多核学习法可发挥不同四诊子核的映射能力,能够将多源数据通过核函数实现有机融合;基于子空间学习法则充分借助共享子空间捕捉不同多源的四诊互补信息,降低了四诊合参的冗余性。当然,随着计算机算法的不断更新,越来越多的多源融合方法涌现出来,如借助数据融合技术来增强网站信息检索与推荐能力的亚马逊知识图谱[43],基于深度学习的融合算法被应用于医学成像[44]等,这些都有可能为实现四诊合参的智能化提供思路。

  5、 小结

  《医门法律》言:“望闻问切,医之不可缺一。”《四诊抉微》亦言:“然诊有四,在昔神圣相传,莫不并重。”中医诊断的正确性不仅依赖单诊信息的准确性和客观性,还与四诊合参密切相关,因此,四诊合参智能化研究是中医诊断客观化研究的必然发展趋势,而这也是亟待攻克的难题之一。应用人工智能技术为中医诊疗服务成为业内外高度关注的重点,当前在中医四诊信息采集客观化、智能化方面已取得进展,面象、舌象分割算法及面部光泽、眼球运动捕捉识别技术的不断提升为四诊合参智能化的研究奠定了基础,但有关闻诊和脉诊的智能化研究相对薄弱。今后需要借助新兴技术探寻隐含在现象背后的知识和规律,将协同训练法、多核学习法、基于子空间学习法等用以促进四诊合参智能化只是初步探讨,相信未来随着智能算法的不断进步,中医四诊合参智能化程度会越来越高,最终会实现真正意义的中医智能化。

  参考文献

  [1] 中华人民共和国国务院.新一代人工智能发展规划[Z/OL].(2017-07-08)[2019-05-04].http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm.
  [2]白春清.中医专家系统三十年[J].医学信息,2011,24(2):550-552.
  [3]黄欣荣,钟平玉,马纲.人工智能与中医智能化[J].中医杂志,2017,58(24):2076-2079,2106.
  [4]王忆勤.中医诊断技术发展及四诊信息融合研究[J].上海中医药大学学报,2019,33(1):1-7.
  [5]徐玮斐,刘国萍,王忆勤,等.近5年中医证候诊断客观化研究述评[J].中医杂志,2016,57(5):442-445.
  [6]朴鑫.面诊中的人脸分割研究[D].深圳:哈尔滨工业大学深圳研究生院,2006.
  [7]上官文娟.面向中医面诊的面色及脸型分类中的特征提取方法研究[D].厦门:厦门大学,2017.
  [8]李福凤,李国正,周睿,等.基于PLS、LDA的中医面诊光泽识别研究[J].世界科学技术-中医药现代化,2011,13(6) :977-981.
  [9]尹方平.复杂背景下的人眼检测方法[J].计算机仿真,2009,26(10):225-228.
  [10]吴暾华.面向中医面诊诊断信息提取的若干关键技术研究[D].厦门:厦门大学,2008.
  [11]王永刚,杨杰,周越,等.中医舌象颜色识别的研究[J].生物医学工程学杂志,2005,22(6):1116-1120.
  [12]张志顺.改进的小波变换在中医舌象边缘检测中的研究[J].计算机工程与应用,2012,48(35):135-138.
  [13]陈善超,符红光,王颖.改进的一种图论分割方法在舌像分割中的应用[J].计算机工程与应用,2012,48(5):201-203.
  [14]江涛,曾令旨,齐真,等.高尿酸血症患者舌象的图像特征研究[J].中医杂志,2018,59(22):1948-1952.
  [15]YARON G,YAIR H,OMRI B,et al.Identifying facial phenotypes of genetic disorders using deep learning[J].Nature Med,2019,25(1):60-64.
  [16] 林耿弘.中医闻诊自动分析虚证患者语音之分类辨识[D].台北:台湾私立中原大学,2004.
  [17]胡赣.基于特征组合的中医声诊客观化研究[D].上海:华东理工大学,2014.
  [18]房春英.病理声音诊断系统的设计与实现[C]//清华信息科学与技术国家实验室.第十二届全国人机语音通讯学术会议(NCMMSC2013)论文集.贵阳:贵州大学,2013:7.
  [19]张霞.呼吸气体分析仪长期漂移校正关键问题研究[D].哈尔滨:哈尔滨工业大学,2015.
  [20]王乐.基于FPGA面向口臭检测的电子鼻系统研究[D].长春:吉林大学,2017.
  [21]邵欢,李国正,刘国萍,等.多标记中医问诊数据的症状选择[J].中国科学:信息科学,2011,41(11):1372-1387.
  [22]刘国平,邓峰,夏春明,等.基于隐结构的中医脾系问诊信息客观化分析[J].中医杂志,2011,52(16):1372-1375.
  [23] 胡宗杰.基于极值随机森林的慢性胃炎中医问诊证候分类研究[D].上海:华东理工大学,2017:26.
  [24]LIU GP,YAN JJ,WANG YQ,et al.Application of multi-label learning using the relevant feature for each label in chronic gastritis syndrome diagnosis[J].Evid Based Complement Med,2012,10(3):1-9.
  [25]XU ZX,ZHANG NL,WANG YQ,et al.Statistical validation of traditional Chinese medicine syndrome postulates in the context of patients with cardivascular disease[J].J Altern Compl Med,2013,19(10):799-804.
  [26]王亮.基于时变图像序列的脉搏信息检测方法研究[D].兰州:兰州理工大学,2007.
  [27]胡晓娟.中医脉诊信号感知与计算机辅助识别研究[D].上海:华东师范大学,2013.
  [28]刘攀.基于HHT和多分类支持向量机的脉象信号分析与研究[D].上海:华东理工大学,2015.
  [29]王颖纯,白丽娜.基于BP神经网络的中医脉诊体质类型判定[J].中医杂志,2014,55(15):1288-1291.
  [30]YAROWSKY D.Unsupervised word sense disambiguation rivaling supervised methods[C]//Proc.33rd annual meeting of the association for computational linguistics.Cambridge,Massachusetts:Morgan Kaufmann Publishers,1995:189-196.
  [31]ZHAO J,XIE X,XU X,et al.Multi-view learning overview:recent progress and new challenges[J].Inform Fusion,2017,38(11):43-54.
  [32]DRONKERS NF,BALDO JV.Encyclopedia of neuroscience[M].Cambridge,Massachusetts:Academic Press,2009:503-508.
  [33]Pavlus J.Searching for the algorithms underlying life[EB/OL].(2016-02-04)[2019-06-19].https://cac-m.acm.org/opinion/interviews/197981-searching-for-the-algorithms-nderlying-life/fulltext.
  [34]URCUIOLI PJ,WASSERMAN EA,ZENTALL TR.Associative concept learning in animals:Issues and opportunities[J].J Exp Anal Behav,2014,101(1):165-170.
  [35]徐琎,王忆勤,邓峰,等.中医四诊多源信息融合分析方法的研究进展[J].中华中医药学刊,2010,28(6):1203-1205.
  [36]杨柳,于剑,刘烨,等.面向认知的多源数据学习理论和算法研究进展[J].软件学报,2017,28(11):2971-2991.
  [37]BLUM A,MITCHELL T.Combining labeled and unlabeled data with cotraining[C]//Proceedings of the eleventh annual conference on computational learning theory.Madison,Wisconsin:ACM,1998:92-100.
  [38]ZHANG J,LI CD,LIN YJ,et al.Computational drug repositioning using collaborative filtering via multi-source fusion[J].Exp Sys Appl,2017,84(10):281-289.
  [39]ZHANG J,LI CD,SUN ZQ,et al.Towards a unified multi-source-based o-ptimization framework for multi-label learning[J].Appl Soft Comput,2019,76(3):425-435.
  [40]G?NEN M,ALPAYDN E.Multiple kernel learning algorithms[J].J Mach Learn Res,2011,12(7):2211-2268.
  [41]HOTELLING H.Relations between two sets of varieties[J].Biometrika,1936,28(3):321-377.
  [42]LIU J,JIANG Y,LI Z,et al.Partially shared latent factor learning with multiview data[J].IEEE Trans Neural Net Learn Sys,2015,26(6):1233-1246.
  [43]ARUN KRISHNAN.Making search easier:How Amazon′s product graph is helping customers find products more easily[EB/OL].(2018-08-17)[2019-04-19.https://blog.aboutamazon.com/innovation/making-search-easier.
  [44]LIU Y,CHEN X,WANG Z,et al.Deep learning for pixel-level image fusion:Recent advances and future prospects[J].Inform Fusion,2018,42(7):158-173.

作者单位:福建中医药大学中医证研究基地 福建省中医健康状态辨识重点实验室 厦门大学
原文出处:赵文,张佳,徐佳君,辛基梁,周常恩,李绍滋,李灿东.四诊合参智能化发展现状及实现路径[J].中医杂志,2020,61(01):58-62+67.
相关内容推荐
相关标签:
返回:中医诊断学论文