SCI医学论文

您当前的位置:学术堂 > 医学论文 > 基础医学论文 > SCI医学论文 >

石斛品种的红外光谱判别模型构建研究

来源:光谱学与光谱分析 作者:刘飞,王元忠,杨春艳
发布于:2016-05-19 共5365字

摘要

  引言
  
  石斛是名贵中药材,以茎入药,具有益胃生津、滋阴清热、润肺止咳、明目强身等功效。是兰科中最大的一个属,全球大约有1 100种,主要分布于热带、亚洲和太平洋岛屿。我国约有63种,供作药用的约有39种,主要分布于云南、广西、广东、贵州、台湾等地[1].由于市场需求量大,生长缓慢,野生资源少,部分石斛品种的市场缺口较大。人工种植的石斛,产品质量良莠不齐,伪品较多。因此,建立一种简便、快捷的石斛品质控制和品种识别的方法很重要。
  
  有关石斛品种的识别,通过性状鉴别[2]、化学分析鉴别[3]的方法,或通过分子鉴别中的RAPD技术[4]、DNA杂交[5]等方法进行鉴别,不仅复杂和繁琐,而且耗时较长。近红外光谱鉴别,需每套仪器建立一个模型,且稳定性较差。傅里叶变换红外光谱(FTIR)技术具有样品用量少、前处理简便,测试分析快速、不损坏样品成分结构、灵敏度高等优点,常用以分析研究物质内部分子结构定性或定量的信息,已广泛应用于中药材、林业、粮油食品等方面的研究[6-8].判别分析是根据已经掌握的事物分类情况,对每个类别、若干样本的数据信息,总结出客观事物分类的规律性,建立判别模型,当遇到新的不知类别的样本时,根据总结出来的判别模型,来判别该样本所属类别的方法[9].此方法中的逐步判别法能够按照设定的规则将样本的变量信息逐一进行检验,筛选出对样本分类影响比较大的变量来建立判别模型进行判别分类。判别分析在经济、医学、烟草等方面应用比较广泛[10,11],在植物的分类研究方面已有成功的应用报道,如肖波等利用判别分析结合高光谱成像技术对草坪品种进行识别研究[12],但此方法结合FTIR技术应用于石斛的鉴别研究报道尚未发现。本文用30个品种、206株石斛茎样品的红外光谱,采用判别分析中的Wilks'Lambda逐步判别法,按照Fisher线性判别准则,构建石斛品种的红外光谱判别模型,选用不同的光谱范围和不同的训练样本情况进行判别分析研究,以期为石斛品种的准确识别提供简便快捷的新方法。
  
  1 实验部分
  
  1.1仪器及参数。
  
  PE公司生产的Frontier型傅里叶变换红外光谱仪,装备DTGS检测器,光谱扫描范围为4 000~400cm-1,累加扫描次数为16次,分辨率为4cm-1.光谱数据处理使用Omnic8.0软件,判别分析使用SPSS20.0软件。
  
  1.2样品制备及光谱预处理。
  
  样品有30个品种、206株石斛茎,全部取自云南省文山州文山学院兰科种质资源圃,并经云南省农业科学院药用植物研究所鉴定。样品在45℃恒温下烘干至恒重,用中药粉碎机粉碎待测。测试时取石斛茎粉末样品放入玛瑙研钵磨为均匀的细粉,再加入溴化钾搅磨均匀,然后压片测试。每株石斛茎样品压制1个扫描片测试光谱,所有光谱都已扣除背景,进行自动基线校正、九点平滑和归一化等预处理。表1为各实验样品的品种名称及其编号。
  

  
  2 结果与讨论
  
  2.1石斛茎的红外光谱特征。
  
  图1是部分石斛品种第1个样品的红外光谱图。由图可知,不同品种石斛茎样品的红外光谱非常相似,其共有吸收峰主要有3 390,2 922,2 854,1 739,1 603,1 509,1 460,1 425,1 376,1 330,1 245,1 158,1 105,1 053,899,764,661,610cm-1等。仔细观察各品种光谱,其特征主要为:(1)在多糖物质的振动带1200~950cm-1范围,各品种样品光谱的最强峰均在1 053cm-1附近,且1 158~1 053cm-1光谱范围都是阶梯连续增强的强峰。1158cm-1附近的吸收峰归属为纤维素等多糖类物质的C-O-C不对称伸缩振动[6];1 105cm-1附近的强峰归属为纤维素等多糖类物质1O的伸缩振动;1053cm-1附近的强吸收峰归属为多糖类物质C-O的伸缩振动。(2)在羰基、酰胺和苯环的振动带1 740~1 450cm-1范围,1740cm-1附近和1 603cm-1附近都为中等强度的吸收峰,1740cm-1主要为羰基中C O的伸缩振动[8],1603cm-1归属为苯环的伸缩振动;1509cm-1附近和1 460cm-1附近都为弱吸收峰,1509cm-1归属为苯环的骨架伸缩振动和N-H的面内弯曲振动;1460cm-1归属为CH2的不对称弯曲振动。(3)在脂类、蛋白质类、多糖类物质的混合振动带1 450~1 200cm-1范围,1425,1 376和1 245cm-1附近均为中等强度的吸收峰,1425cm-1为CH2剪切振动,1376cm-1为CH3的弯曲振动,1245cm-1主要为多糖类物质C-O-C和C-O的伸缩振动;1330cm-1附近均为弱吸收峰,是紫丁香基的特征峰,归属为O-H的面内弯曲振动[8];(4)在多糖物质的指纹振动区950~600cm-1范围,899cm-1附近均为弱吸收峰,归属为环状C-O-C不对称面外伸缩振动与CH2非平面摇摆振动的特征峰;764,661,610cm-1附近也均为弱吸收峰,主要为糖环骨架伸缩振动的指纹峰。上述光谱特征表明石斛茎的主要成分为纤维素等多糖类物质。
  

  
  2.2石斛茎的红外光谱判别分析。
  
  在FTIR光谱中,每一个数据点就是样本的一个变量。这些变量,对石斛品种的识别影响不同;如果不进行选择,全部用来建立判别函数,不仅计算工作量大,而且会因变量间存在的自相关性,影响判别函数的稳定性,降低判别模型的准确性。1,需对用以进行判别分析的光谱范围进行选择。按照红外光谱中物质组分的振动范围先选择1 800~1 250cm-1光谱范围的287个变量数据,通过逐步判别分析中的Wilks'Lambda方法,按照Fisher线性判别准则来提取特征变量,对各品种训练样本数从2~6个的情况分别建立判别分析模型,对训练样本和测试样本进行回判和预测。然后又对1 800~1 500,1 500~1 250,1 250~600,1 250~950,950~600cm-1等5个光谱范围按照上述方法进行了判别分析比较。
  
  2.2.1 1 800~1 250cm-1光谱范围的判别分析。
  
  表2为采用1 800~1 250cm-1范围的光谱变量,各品种的训练样本数由2个变化到6个的情况下提取的特征变量情况。由表2可知,当各品种的训练样本数发生变化时,根据Wilks'Lambda方法,从287个光谱变量中提取的特征变量数随着训练样本数的增加而增多,但不同训练样本数下提取的特征变量间没有联系。不同训练样本情况下提取的特征变量,代表了全部287个变量的大部分信息;提取的特征变量不同,说明所建立的判别模型也不同。表3为各品种的训练样本数由2个变化到6个时建立的判别分析模型对训练样本进行回判,对余下样本作为测试样本进行预测的情况。由表3知,训练样本的回判正确率都为100%;测试样本的预测正确率随着训练样本数的增加逐渐增高。每个品种的训练样本数为2个时,测试样本的预测正确率为79.4%;每个品种的训练样本数为3个时,测试样本的预测正确率为91.3%;每个品种的训练样本数为6个时,测试样本的预测正确率为100%.上述判别分析结果表明,采用逐步判别分析中的Wilks'Lambda方法,按照Fisher线性判别准则建立模型来对不同品种的测试样本进行品种判别,能够较好的识别石斛的品种。
  

  

  
  2.2.2 不同光谱范围的判别分析比较。
  
  表4是对1 800~1 500,1 500~1 250,1 250~600,1 250~950,950~600cm-1等5个光谱范围按照2.2.1中的方法进行判别分析的结果。由表4可知,5个不同的光谱范围进行判别分析的结果差异比较明显。对于不同的训练样本数,1800~1 500cm-1光谱范围建立的判别模型对训练样本回判的正确率都是100%,对测试样本预测的正确率都是最高的。光谱范围950~600cm-1建立的判别模型对训练样本回判,对测试样本预测的结果也较好。结合2.2.1中的判别分析情况,说明通过逐步判别分析来识别不同品种的石斛,6个光谱范围中选择1 800~1 250,1 800~1 500和950~600cm-1等3个光谱范围比较合适。
  
  在各光谱范围的判别分析中,每个品种的训练样本数是2个时,判别模型对测试样本预测的正确率最高的是82.3%,最低的是72.6%;每个品种的训练样本数是3个时,判别模型对测试样本预测的正确率最高的是94.8%,最低的是84.5%;训练样本数进一步增多,模型对测试样本的预测正确率增大。一般来说,判别模型对样本的判别正确率大于80%,就可以使用判别分析方法来进行品种识别。
  
  因此,通过逐步判别分析来识别不同品种的石斛,每个品种的训练样本数达到3个及以上时,建立的判别模型能较好的识别石斛的品种。
  
  上述各光谱范围,1800~1 500cm-1是羰基、酰胺和苯环的振动带,变量间少部分存在自相关性;1500~1 250cm-1是脂类、蛋白质类、多糖类物质的混合振动区,变量间也有少部分存在自相关性;1250~950cm-1是多糖类物质的特征振动区,变量间有明显的自相关性;950~600cm-1是多糖类物质的指纹振动区,变量间没有自相关性;1250~600cm-1是1 250~950和950~600cm-1的总和,前半部分的变量间具有明显的自相关性,前半部分与后半部分的变量间也有明显的自相关性。
  
  在表4的判别分析结果中,各光谱范围对训练样本回判有错误的是1 250~600,1 250~950和1 500~1 250cm-1三个范围。除1 250~600和1 250~950cm-1范围外,另外三个范围都有提取的特征变量整体有随训练样本数的增加而增多的趋势。各光谱范围对测试样本的预测正确率有随训练样本数的增加而增大的趋势,但1 250~600和1 250~950范围的这种趋势不明显,特别是当训练样本数达到每个品种6个时,测试样本的预测正确率反而明显的降低。
  
  上述三种情况,都出现在光谱变量间自相关性比较明显或有自相关性的光谱范围,说明利用逐步判别法进行品种识别,选用变量间有自相关性的光谱范围会降低判别模型的稳定性和判别正确率。
  
  因此,红外光谱结合判别分析对石斛品种进行识别,选用的光谱范围应避开变量间自相关性明显或有自相关性的范围。
  
  3 结论
  
  利用FTIR技术测试了30个石斛品种,206株石斛样品的红外光谱。利用统计分析软件SPSS20.0中的判别分析模块,采用Wilks'Lambda逐步判别分析法提取特征变量,按照Fisher线性判别准则建立判别分析模型来识别不同品种的石斛。选择了6个光谱范围来进行分析对比,同时对用以建立判别分析模型的训练样本分五种情况进行了分析比较。不同的光谱范围光谱变量数不同,判别分析中提取的特征变量数不仅与各光谱范围的变量数有关,还与各光谱范围内变量间的自相关性和训练样本数量有关。光谱范围内变量间的自相关性影响判别模型的稳定性和判别正确率,1800~1 250,1 800~1 500,950~600cm-1等3个光谱范围相对较适宜进行判别分析。用以建立判别模型的各品种训练样本数量对模型的判别准确性也有影响,各品种的训练样本数达到3个及以上时,能保证所建立的模型有较好的判别效果。
  
  1 800~1 250,1 800~1 500,950~600cm-1等3个光谱范围在各品种的训练样本数为3至6个时,所建模型的判别正确率在87.9%~100%.因此,用FTIR光谱结合判别分析的方法来识别石斛的品种,各品种的训练样本数应在3个及以上,选用的光谱范围应为1 800~1 250,1 800~1 500或950~600cm-1.FTIR光谱结合判别分析对植物品种的识别,是一种用已知品种的样本光谱信息来建立各品种判别分析模型,通过未知品种的光谱信息来进行其所属品种预测的统计分析方法。
  
  若将本方法应用于我国的60多个石斛品种,那么所建立的模型将成为石斛品种识别的一种新方法。样品的FTIR光谱所反映的信息,实质上是样品的化学成分及含量信息。石斛茎的化学成分及含量,受遗传因素和生长环境以及灌溉施肥等因素的影响。本实验虽然选用的样品和品种都较多,但所有样品都来自于同一产地,对于不同产地的石斛,本方法还有待于进一步的研究。
  
  References
  
  [1]RAN Mao-xiong,ZHOU Hou-fang,WEI De-sheng,et al(冉懋雄,周厚坊,魏德生,等)。Culture Technique of Non-PollutionDendrobiun one of the Rare Chinese Medicinal Herb(名贵中药材绿色栽培技术石斛)。Beijing:Science and Technical Documentation Press(北京:科学技术文献出版社),2002.
  [2]Kunming Institute of Botany,Chiese Academy of Science(中国科学院昆明植物研究所)。A Record of Plants Species in Yunnan(Vol.14)(云南植物志·第14卷)。Beijing:Science Press(北京:科学出版社),2003.
  [3]MAO You-er,ZHOU Gui-fen(毛幼儿,周桂芬)。Journal of Jiangxi University of Traditional Chinese Medicine(江西中医学院学报),2011,23(4):38.
  [4]WANG Xue-jun,XIONG Xing-hua,GUAN Chun-yun(王学军,熊兴华,官春云)。Crop Research(作物研究),2010,24(2):99.
  [5]LI T X,WANG J K,BAI Y F,et al.Nucleic Acids Research,2004,32(4):45.
  [6]SUN Su-qin,ZHOU Qun,CHEN Jian-bo(孙素琴,周群,陈建波)。Analysis of Traditional Chinese Medicine by Infrared Spectroscopy(中药红外光谱分析与鉴定)。Beijing:Chemical Industry Press(北京:化学工业出版社),2010.
  [7]Ma G,Li Y Y,Dong J,et al.Vibrational Spectroscopy,2013,64(1):44.
  [8]HU Ai-hua,XING Shi-yan,GONG Qi-liang(胡爱华,邢世岩,巩其亮)。Journal of Northeast Forestry University(东北林业大学学报),2009,37(9):79.
  [9]WANG Dong-hua(汪 冬 华)。Multivariate Statistical Analysid and SPSS Application(多 元 统 计 分 析 与SPSS应 用)。Shanghai:EastUniversity of Science and Technology Press(上海:华东理工大学出版社)。2010.
  [10]ZHANG Xin-xin,LI Yu,JI Yu-jia,et al(张新新,李雨,纪玉佳,等)。Journal of Shandong University(Health Sciences)(山东大学学报·医学版),2012,50(1):143.
  [11]ZHU Li-jun,WANG Peng,SHI Feng-cheng,et al(朱立军,王鹏,施丰成,等)。Journal of Southwest University·Natural ScienceEdition(西南大学学报·自然科学版),2012,34(3):9.
  [12]XIAO Bo,MAO Wen-hua,LIANG Xiao-hong,et al(肖波,毛文华,梁小红,等)。Spectroscopy and Spectral Analysis(光谱学与光谱分析),2012,32(6):1620.

相关内容推荐
相关标签:
返回:SCI医学论文