摘要:介绍了人工神经网络的基本原理, 概述了三种典型人工神经网络模型的特点及其在材料基因工程领域中的应用范围。当实验数据充足, 可选择RBF人工神经网络;当需要提供较强的理论依据以及实验数据少的情况下, BP神经网络是比较优先的选择;当遇到分类与识别问题时可应用自组织竞争神经网络。
关键词:材料基因工程; 人工神经网络; 数据分析;
Research on Artificial Neural Network for Material Genetic Engineering
CUI Yan LU Yunkun CAO Leigang LIU Fengbin
Mechanical and Material Engineering College, North China University of Technology
Abstract:
The basic principles of artificial neural network (ANN) were reviewed. The characteristics of the three typical ANN models and its application range in the fields of material genetic engineering were briefly illustrated. The RBF artificial neural network could be selected when the experimental data was sufficient. BP neural network was the preferred choice when it was necessary to provide strong academic basis and less experimental data. Self-organizing competition neural networks could be applied when encountering the classification and identification problems.
Keyword:
material genetic engineering; artificial neural network; data analysis;
长期以来, 新材料的研发采用大量串联实验验证的试错法, 以此经验为主的模式, 不仅使得研发成本高、资源浪费大, 而且大大延长新产品研发和更新换代周期[1,2,3]。因此, 美国于2011年6月宣布了“先进制造业伙伴关系”计划, 材料基因组计划 (MGI) 是其重要组成部分。材料基因组计划的总体目标是将先进材料的发现、开发、制造和使用的速度提高一倍[4]。材料基因工程由计算工具、实验手段与数字化处理三方面组成[2,5,6]。其中, 实验手段主要体现为高通量制备与表征技术, 为后期数字化处理提供大量实验数据。数字化处理涉及信息学、统计学以及数据挖掘等领域, 旨在高效科学地处理实验数据, 从而快速建立材料性能数据库, 进而验证理论模型的准确性并优化组分/工艺参数。
不同于传统的试错法, 材料基因工程采用“并联”的研发模式, 涉及复杂体系和物相、复杂化学反应、多因素/多水平的工艺实验参数等, 多数情况下难以准确揭示其内在本质联系, 且难以用固定的数学模型进行模拟拟合[7]。为此, 人工神经网络在数据处理领域得到大力推广。
人工神经网络 (ANN) 是20世纪80年代以来人工智能领域兴起的研究热点[8], 在生物学、医学、经济等领域已有广泛应用。人工神经网络处理方法是将若干活动规律相同的神经元, 按照一定的连接方法组成复杂的结构, 进行分布式并行信息处理的算法数学模型[9]。在材料基因工程领域处理关系复杂的大量数据问题时, 人工神经网络方法将实验过程中输入 (工艺因素、水平等) 和输出 (材料性能) 参量之间的变化规律看作“黑箱”, 基于其较强的自学习能力, 通过对已知样本数据的学习获得的网络连接权重作为“黑箱”中的“机器知识”, 直接构建输入和输出之间映射关联的一种数据处理方法 (例如材料组分/工艺、结构、性能之间的关系) [10,11]。
近年来, 虽然人工神经网络在材料领域已有所应用, 但是存在方法选取不合理导致结果不准确的问题。本文介绍了典型人工神经网络模型的原理, 结合其在材料领域的应用案例, 讨论了其在材料基因工程领域数据处理中的特点。
1 人工神经网络的原理
人工神经网络是对人脑神经网络的抽象和模拟, 其基本处理单元为人工神经元, 而一个可储存和处理数据的人工神经网络由大量的人工神经元构成[12]。人工神经网络主要包括连接方式、信息流向以及网络学习方式三个方面。
连接方式可分为层状结构与网状结构。层状结构分为输入层、隐藏层与输出层, 各层次之间依照顺序相互连接, 信号通过此顺序单向传递;而网状结构则是任意两个神经元之间都可互相连接, 并非单向传递网络信息流向类型基本分为前馈型网络与反馈型网络。前馈型网络中无反馈, 各神经元从输入层开始, 接收前一级输入的信号, 传输到下一层, 直至最终输出;而反馈型神经网络则是每个神经元将自身的输出信号作为输入信号反馈给其他神经元, 它需要在训练一段时间可达到稳定。人工神经网络的学习方式分为有导师学习法与无导师学习法两种。其中, 有导师学习法就是把训练集输入网络中, 根据网络计算的数值与实际数值的偏差调整神经元中的权数, 进行进一步优化;无导师学习法则是根据给出的一组数据, 从数据中找寻规律进行预测。
人工神经网络具有良好的数据储存分布性、高速的处理并行性、良好的数据信息容错性和优秀的信息处理自适应性等特点, 在材料基因过程的应用越来越广泛。
2 人工神经网络在材料基因工程的应用
目前, 人工神经网络已被逐渐应用于材料基因工程领域, 通过高效处理由高通量制备、表征得到的大量实验数据, 进而快速、准确构建材料组分/工艺与结构/性能之间的关联, 缩短实验研发到实际应用的周期。常用的人工神经网络包括自组织竞争神经网络、BP神经网络和RBF神经网络。
2.1 自组织竞争神经网络
自组织竞争神经网络是由输入层与竞争层组织的二层结构网络 (网络中不包含隐层) , 两层之间双向连接, 以一种无导师指导的方式进行训练。该网络是通过自动寻找数据中的内在关联, 自组织、自适应地改变网络参数与结构。网络的输出由竞争层各神经元的输出组成, 在神经元中, 存在一种模拟人脑的竞争关系。通过神经元间的抑制或者激活, 相互竞争, 传递函数中输入最大的元素对应的神经元是竞争的“获胜者”, 即代表着被选中。在竞争中最终被选择的“获胜”神经元输出的值为1, 其余的神经元的输出都是0。
自组织竞争神经网络主要用于解决分类与识别问题。例如, 刘占军等[13]采用自组织竞争神经网络对板材拉深材料参数进行识别, 采取了586组数据进行训练, 成功建立了工况参数和性能参数的关联。通过训练得到的材料性能参数与H62黄铜板材真实值对比, 识别精度较高, 其中硬化指数、强度系数、各向异性系数和弹性模量的最大识别误差分别为1.1%、1.35%、0.6%和3.2%。结果表明其可以满足智能控制的要求。王磊等[14]也基于自组织神经网络, 建立了损伤试样与识别信号的关联, 并基于自组织竞争神经网络开发出诊断损伤检测系统。
自组织竞争人工神经网络具有结构简单、容易操作的优点。然而, 其多局限于解决分类和识别的问题, 不适于研究材料组分和工艺参数与结构和性能之间映射关系的问题。因此, 在以预测为目的的实验中, 自组织竞争神经网络无法将优势体现出来。
2.2 BP神经网络
BP神经网络是一种由输入层、隐层、输出层组成的层状结构神经网络, 如图1所示, 其中的隐层可扩展为多个隐层。相邻层之间各神经元进行全连接, 而隐层内各神经元之间无连接。BP人工神经网络按前馈型有导师学习的方式进行训练, 其工作原理是减小希望输出与实际输出误差, 从输出层经各中间层逐层修正连接权, 将修正后的模型重新训练[15]。
图1 BP神经网络示意图Fig.1 Schematic diagram of BP neural network
BP神经网络原理是将计算输出后的数据与真实实验数据进行对比从中得出误差, 利用此误差估计前一层的误差, 以此类推, 反向传输, 最终获得各层误差。依据这些误差修正权值, 重新进行网络训练, 直到误差减弱达到接受范围。同时, BP神经网络可通过增加神经元个数, 调整适合的隐层, 无限逼近一个非线性函数, 从而解决非线性难题。
尹海莲等[16]建立了以Cr、Ti C、Si C和B4C质量分数为输入层, 以碳/陶瓷复合材料的力学性能为输出层的BP人工神经网络, 并且经过了8000多次训练, 建立了质量分数与力学性能的关系。对比实验数据, 证实人工神经网络预测结果与真实结果误差在±0.18%以内, 训练结果理想。崔升等[17]在研究纳米氧化锌铝的导电性能研究中, 通过创建5个输入神经元单隐层以及1个输出神经元的神经网络, 通过50组数据构建了Al掺杂量、水与体积比、p H、老化时间和烧成温度这5个因素和导电性能的关联。陈强等[18]通过改进后的Levenberg-Marquardt算法构建一个组分的质量分数与烧灼率关联的BP神经网络, 有效改善收敛慢以及陷入局部最小值问题。
BP神经网络因其极强的非线性映射能力、简单的结构、对于数据的联想记忆功能以及对于输入数据的自适应功能而备受青睐, 目前应用最为广泛。但是BP神经网络的学习效率较低、速度比较慢, 并且因其梯度下降算法的原因, 当函数是非凸状函数时, 有陷入局部极小值的问题[4]。
2.3 RBF神经网络
RBF神经网络由输入层、单隐层、输出层组成, 与BP神经网络不同, 其隐层仅有一层且不可扩展 (图2) 。RBF人工神经网络按前馈型、局部逼近的方式进行, 由无导师监督和有导师监督两部分组成, 可灵活调节精度逼近连续函数、解决非线性问题和分类等问题。
图2 RBF人工神经网络示意图Fig.2 Schematic diagram of RBF artificial neural network
RBF神经网络的特点是其隐层中的基函数使用径向基函数[19]。首先通过无导师训练得到输入层与隐层之间的权数与阈值, 再通过有导师训练得到隐层与输出层的权值与阈值, 而后通过训练得到完善的RBF神经网络。因为是局部逼近, RBF网络可避免陷入局部最小值的问题。
邹戈等[20]建立一个以纤维含量、保温时间、成型压力和加热温度为输入量, 拉伸强度、冲击韧性为输出层神经元的RBF人工神经网络来预测复合板材的力学性能。网络由15组样本训练, 并且依据5组测试样本进行对比, 预测拟合结果显示, 其误差值控制在5%以内, 所以网络训练还是较为成功的。同时, RBF网络用于解决分类问题, 具有很强的抗干扰能力。董晓马等[21]构建以5种检测信号为输入神经元、4种损伤模式为输出神经元的RBF人工神经网络模型, 研究碳纤维层合板损伤模式的分类问题。结果显示, 即使加入5%的干扰信号, RBF网络依然可以准确的辨别出损伤模式。
RBF对于非线性拟合能力很好, 通过局部逼近的方式不但可高速的以任意精度逼近任意连续函数, 而且解决了BP网络陷入局部极小值的缺陷。RBF不仅可以运用在解决预测的问题上, 在分类问题上也有良好的表现。RBF神经网络以其收敛速度快, 自学习能力强, 鲁棒性高, 分类能力优异等优点而备受关注。但是在训练样本变大时, RBF神经网络的隐层神经元数远远高于BP神经网络, 导致RBF神经网络的复杂度增大, 结构比BP神经网络复杂, 从而运算量也有所增加, 这也是RBF神经网络的局限性。
综上, 人工神经网络在数据处理方面有其独特的优势。其中自组织竞争神经网络多用于解决分类与识别问题上, 应用范围窄;而BP神经网络与RBF人工神经网络都可以用较低的误差对实验输出进行模拟, 用来解决材料研究的复杂问题, 例如构建材料组分-工艺-结构-性能之间的映射关联, 实现材料性能的预测。杨榛[22]在研究添加剂改性炭材料高温粘结剂的性能时, 通过实验对比证实, RBF网络的训练结果和测试样本的平均相对误差均小于BP网络。林剑锋[23]在研究Sn O2气敏元件浓度测量问题时, 得到相同的结果。同时, 杨榛[22]指出, RBF网络的收敛速度很快, 训练时间低于BP网络的训练时间。吴涛[24]通过分别构建BP神经网络和RBF神经网络研究钛合金变形因素与流体力学之间的关联, 尽管RBF的速度与误差大小优于BP神经网络, 但是BP神经网络对新样本的适应能力与RBF神经网络相比有明显优势, 因此相比BP神经网络, RBF实验需要更充足的实验数据。在拥有大量数据的高通量实验制备表征并且能够构建较为复杂的网络结构条件下, 可利用RBF神经网络使海量的实验数据真正发挥加速材料研发和应用进程的作用[25];而数据量较小时, 泛化能力强的BP神经网络较为适合。三种人工神经网络在材料基因工程中的应用范围如表1所示。
表1 训练方法的对比Tab.1 Comparison of training methods
3 结语
自组织竞争神经网络、BP神经网络与RBF人工神经网络都均在材料基因工程领域研究中有所应用, 其中BP神经网络与RBF神经的应用更为广泛。从训练的误差方面显示RBF的训练精度略高于BP神经网络, 但是RBF网络在样本数据少的情况下无法工作, 结构复杂等问题较为显著。当实验数据量充足时, 可以选择RBF人工神经网络;当需要实验数据相对较少的情况下, BP神经网络是比较优先的选择;当遇到分类与识别问题时可以应用自组织竞争神经网络。
参考文献
[1]刘俊聪, 王丹勇, 李树虎, 等.材料基因组计划及其实施进展研究[J].情报杂志, 2015 (1) :61-66.
[2]赵继成.材料基因组计划简介[J].自然杂志, 2014, 36 (2) :89-104.
[3]刘利民.材料基因工程:材料设计与模拟[J].新型工业化, 2015, 12 (5) :71-88.
[4]毛健, 赵红东, 姚婧婧, 等.人工神经网络的发展及应用[J].电子设计工程, 2011, 19 (24) :62-65.
[5]杨明理, 崔颍琦, 马兴涛, 等.利用计算加速材料研制-材料基因工程介绍[C]//第六届全国计算原子与分子物理学术会议论文集.2016.
[6]范晓丽.材料基因组计划与第一性原理高通量计算[J].中国材料进展, 2015, 34 (9) :689-695.
[7]乔英杰, 尹海莲, 梁军, 等.基于人工神经网络的碳/陶瓷复合材料性能预测[J].东南大学学报 (自然科学版) , 2005, 35 (3) :400-403.
[8]汤素丽, 罗宇锋.人工神经网络技术的发展与应用[J].电脑开发与应用, 2009, 22 (10) :59-61.
[9]张乐福, 谢生长.人工神经网络在材料实验数据处理中的应用[J].材料科学与工艺, 1997 (1) :28-31.
[10]徐强, 张幸红, 韩杰才, 等.人工神经网络在材料科学中的应用与展望[J].材料科学与工艺, 2005, 13 (4) :352-356.
[11]张乐福, 谢生长.人工神经网络在材料实验数据处理中的应用[J].材料科学与工艺, 1997 (1) :28-31.
[12]陈雯柏.人工神经网络原理与实践[M].西安:西安电子科技大学出版社, 2016:4-20.
[13]刘占军, 王铁丽, 吴钢, 等.自组织竞争神经网络板材拉深材料参数识别[J].锻压技术, 2006, 31 (4) :17-19.
[14]王磊, 袁慎芳.Kohonen神经网络在复合材料损伤主动监测技术中的应用[J].材料科学与工程, 2002, 20 (4) :513-516.
[15]林仕高, 欧元贤.BP神经网络学习参数优化研究[J].微计算机信息, 2010, 26 (16) :199-200.
[16]尹海莲, 胡自力.基于BP神经网络的复合材料性能预测[J].南京航空航天大学学报, 2006, 38 (2) :234-238.
[17]崔升, 沈晓冬, 蔡永明, 等.纳米级氧化锌铝的导电性能研究[J].无机盐工业, 2004, 36 (5) :16-17.
[18]陈强, 李贺军, 李爱军, 等.人工神经网络建模在抗烧蚀炭/炭复合材料基体改性研究中的应用[J].新型炭材料, 2004, 19 (4) :275-280.
[19]姜静清, 宋初一, 刘娜仁, 等.RBF神经网络的训练法及分析[J].内蒙古民族大学学报:自然汉文版, 2003, 18 (4) :301-303.
[20]邹戈, 姚正军, 李超, 等.用RBF神经网络预测材料力学性能的研究[J].计算机与应用化学, 2007, 24 (10) :1397-1400.
[21]董晓马, 张为公, 陈砚祥, 等.基于RBF神经网络的复合材料损伤识别[C]//中国仪器仪表与测控技术交流大会, 2007.
[22]杨榛, 顾幸生, 梁晓怿, 等.基于RBF神经网络的添加剂改性炭材料高温黏结剂的性能预报模型[J].新型炭材料, 2007, 22 (4) :349-354.
[23]林剑锋, 戚金清, 王兢, 等.神经网络在Sn O2气敏元件浓度测量中的应用[J].仪表技术与传感器, 2009 (S1) :388-389.
[24]吴涛.钛 (氢) 合金热变形流变应力的人工神经网络预测[D].哈尔滨:哈尔滨工业大学, 2004.
[25]王海舟, 汪洪, 丁洪, 等.材料的高通量制备与表征技术[J].科技导报, 2015, 33 (10) :31-49.
分子筛多孔晶体材料因其特殊的孔道结构,被广泛用于吸附分离、催化反应、离子交换等领域,在石油化工、精细化工及功能材料中有重要应用....
1研究背景新材料的发展长期以来采用的是通过以经验、半经验为基础的传统炒菜式实验来摸索,并给予确认的研究模式。这种模式的效率很低,已经难以适应当前世界各国经济快速发展的需求,而且需耗费大量的资源、能源和人力,非常不经济。材料科学家一直在寻...