基于BP神经网络的不同标号汽油的辨识方法研究

刘晓俊

(中国人民武装警察部队学院研究生四队,河北 廊坊)

摘要:通过对不同标号汽油在不同载体上的残留物中组分变化特征研究,并以残留物中组分含量之间的相关系数作为衡量基准,选定相对稳定的特征组分。据此,结合选定的特征组分,建立基于BP神经网络的不同标号汽油的辨识方法。研究表明,运用自建的BP神经网络,能够识别不同标号的汽油,网络的均方误差MSE能处于较低水平,测试集的识别正确达到85.7%。

关键词:汽油残留物;特征组分;BP神经网络;助燃剂辨识

1 引言

放火案件中,犯罪分子为快速有效地达到放火目的,往往借助助燃剂来实施犯罪[1]。但由于助燃剂种类繁多且易受现场环境影响,给鉴定工作带来诸多难题。因此,如何准确识别火场是否存在助燃剂及所使用助燃剂种类,已成为火灾物证技术鉴定领域亟待解决的问题。

国内外诸多专家学者对助燃剂分类辨识进行过研究,其中多借鉴于理论成熟、内容全面、方法新颖的化学计量学中关于数据处理的模式识别理论。其中,P.M.L.Sandercock[2]、Maria Monfreda[3]、B.K.Lavine[4]利用气质联用技术检测残留物成分的同时,分别结合主成分分析(PCA)、线性判别(LDA)、判别分析法(DA)、遗传算法(GA)判别助燃剂的种类,并结合实际检验其适用性。王荣辉[5]、支有冉[6]通过PCA压缩实验数据,分别运用Fisher、系统聚类分析辨识易燃液体类别,取得不错的应用效果。

2 实验原理及实验方法的选定

2.1 实验样品的制备

实验原材料:93#汽油、95#汽油、97#汽油、棉制毛巾、木材条、橡胶板。

助燃剂原样与萃取剂按照1:10的比例混合即可制备助燃剂原样的样品。制备助燃剂在不同载体上残留物样品流程如下。首先,将准备完毕的助燃剂和燃烧物(七种典型助燃剂各20mL若干份,裁剪成10cm×10cm的棉制毛巾若干,锯切成10cm×3cm×5cm的木材条若干,裁剪成10cm×9cm×1cm的橡胶板若干、200mL的坩埚若干)置于一个封闭的燃烧实验室内,其中,空载条件将助燃剂倒入坩埚内,其他载体条件将助燃剂均匀洒在载体之上。然后,用点火器引燃助燃剂,开始计时,记下其燃烧完全自然熄灭的时长t。计算0.85t,在相同条件下在0.85t时以窒息的方式将助燃剂及载体熄灭。最后,不同种类助燃剂与不同载体结合时重复以上实验步骤得到实验样品。

2.2 燃烧残留物样品的提取

因本实验涉及的助燃剂种类较多,不能统筹兼顾、针对不同助燃剂燃烧残留物特性选择合适的萃取剂,所以一致选取GB/T 24572.1—2009规定的乙醚和正己烷试剂混合作为萃取剂。

提取流程如下:提取样品放置于合适大小的烧杯中,倒入乙醚和正己烷混合溶液,浸泡十分钟后,使用定性滤纸过滤,收集于蒸发皿中,待其浓缩定容至1mL,最后将浓缩液密封于标准进样瓶中并贴上标签注明。

2.3 GC-MS分析条件的设定

实验仪器:Agilent Technologies 6890N Network GC System/5973 Network Mass Selective Detector。

色谱条件:

分流比为10:1,He流量为1.2mL/min,柱前压9.9×105Pa。温升程序设定为:初始柱温为50℃保持2min,再以10℃/min的温升速率至150℃并保持2min,最后以6℃/min的速率升温至260℃并保持10min。

质谱条件:

GC/MSD接口温度280℃;离子源温度230℃,四级杆温度150℃;EI离子源,电子能量70eV;全扫描(SCAN)质量范围50~550aum,扫面间隔为0.01min。

3 不同标号汽油燃烧残留物成分分析及特征组分的选定

结合表1~表3、图1,从各物质类别种类数角度分析不同标号汽油在不同载体条件下的变化特征:直链烷烃、异构烷烃、环烷烃、烯烃类在空载条件下保持数量相对稳定,其余载体条件下则会不同程度的减少,橡胶板条件下则未检测出其成分。苯的同系物数量在空载条件下会与原样保持相同,其他载体条件下则稳定至15种左右。萘的同系物在残留物中基本稳定在2种左右。总体来说,不同载体条件残留物的物质种类数均急剧减少,甚至出现组分缺失的情况,而苯、萘的同系物相对较为稳定。

表1 93#汽油在不同载体条件下的物质数量分布/种

表2 95#汽油在不同载体条件下的物质数量分布/种

表3 97#汽油在不同载体条件下的物质数量分布/种

图1 不同标号汽油在不同载体上物质数量分布

经过上述的分析,不同标号汽油中苯、萘的同系物类相较其他物质种类表现出较为优秀的稳定性。进而通过统计部分苯、萘的同系物在不同载体条件下的峰面积百分比,并附其保留时间,部分组分因相关系数不高而并未选取,如表4~表6所示。

表4 93#汽油特征组分在不同载体条件下的峰面积百分比/%

表5 95#汽油特征组分在不同载体条件下的峰面积百分比/%

表6 97#汽油特征组分在不同载体条件下的峰面积百分比/%

据上述统计情况,通过MATLAB获取不同标号汽油特征组分含量的相关系数矩阵,详细信息如图2所示。

图2 不同标号汽油特征组分相对含量在不同载体条件下的相关系数矩阵

图中由蓝至红,六边形的颜色越深,相关系数越大。通过比对分析,不同标号汽油各自特征组分系列相对含量在原样与残留物之间的相关系数最低至0.45,但也具有一定的相关性。换言之,在不同载体条件下,不同标号汽油中特征组分的相对含量稳定性较高。总之,特征组分不仅是不同标号汽油原样中所含成分,且在不同载体条件下能保持较为稳定的相对含量比例关系。

4 基于BP神经网络的不同标号汽油比对辨识方法

本小节将针对不同标号的助燃剂,整合助燃剂指纹谱图数据,结合MATLAB中神经网络系统工具,以实现辨识目的。

4.1 BP神经网络

BP神经网络(Error Back Propagation)由输入、隐含及输出三层组成,实质上通过边向后传递误差,边修正误差的方法持续调节参数(权值和阈值),以实现或逼近预期输入、输出映射关系BP神经网络结构见图3。

图3 BP神经网络结构

算法过程如下。

(1)初始化

式中,分别为处理前后的网络输出和输入。

(2)进入循环,计算输出。隐含层各节点的输入、输出分别为

输出层各节点的输入、输出分别为

(3)误差逆传播 设定实际输出为,那么预期输出与实际输出的误差均方Ek

实际输出层各节点的误差

隐含层各节点的误差

(4)修正权值和阈值。

式中,N为修正次数。以上循环执行m次。

(5)假如全局误差在设定范围内,跳转至(6);否则跳转至(2)。

(6)计算输出层。

4.2 不同标号汽油指纹谱图信息整合

将93#、95#、97#汽油原样1组,空载条件5组,棉质毛巾载体条件、木材载体条件、橡胶板载体条件各3组,共3×15=45组实验样品数据进行整合,如表7所示。

表7 不同标号汽油的指纹谱图信息汇总

4.3 BP神经网络分析方法

在MATLAB平台中输入nortool,即可进入BP神经网络GUI,导入实验样品信息,设定参数。其中,训练、验证及测试集分别占总实验样品集的70%、15%、15%。使用表3.1中的矩阵代表各实验样品,二进制数列001、010、011分别代表93#、95#、97#汽油的类标号。图4为BP神经网络的GUI入口界面。

图4 BP神经网络的GUI入口界面

使用代码能便捷设定相关参数,部分代码如下。

    inputs=x';
    targets = y';
    %自建网络,设定神经元参数
    net = patternnet(hiddenLayerSize);
    %通过归一化预处理助燃剂相关信息
    net.inputs{1}.processFcns = {'removeconstantrows',mapminmax'};
    net.outputs{2}.processFcns = {'removeconstantrows',mapminmax'};
    %按照70%、15%、15%的比例划分样品数据,分别作为训练、验证及测试之用
    net.divideParam.trainRatio = 70/100;
    net.divideParam.valRatio = 15/100;
    net.divideParam.testRatio = 15/100;
    %以均方差大小评价自建网络
    net.performFcn ='mse';
    %设置网络的绘图参数
    net.plotFcns = {'plotperform','plottrainstate','ploterrhist,...'plotregression','plotfit'};
    %开始训练自建神经网络
    [net,tr]= train(net,inputs,targets);
    outputs = net(inputs);
    errors = gsubtract(targets,outputs);
    performance = perform(net,targets,outputs)
    %保存训练完毕的神经网络
    save('training_net.mat','net'' ,'tr');

依据上述代码可生成如图5的网络功能图。

由图5可知,该网络结构为10-50-3,即10输入、50中间神经元、3输出。以均方差大小评价自建网络。图中给出训练结束时的具体参数,如训练步数、消耗时间、网络表现、误差梯度等信息。

图5 自建BP神经网络参数一览

图6为训练过程的均方误差MSE表现。蓝、绿、红色曲线分别代表训练、验证、测试集的表现。MSE越接近0,训练效果越理想。通过观察分析可知,最优地表现出现于第7次训练,此时的均方误差最小,为0.1724。在之后训练过程中,网络的均方误差趋于平缓,并处于较低水平。

图6 自建网络在训练过程中的均方差MSE表现

图7中依次为训练、验证、测试、总实验样品集的混淆矩阵。矩阵中绿色方块为识别正确,反之,红色方块为识别错误,蓝色方块内的百分比为该集合的识别正确率。测试集中识别93#、95#、97#汽油的正确率为85.7%。总体来讲,自建的BP神经网络能辨识较为相近的不同标号助燃剂,基本满足预期识别效果。

图7 助燃剂实验样品的混淆矩阵

5 结论

本课题选取不同标号汽油即93#汽油、95#汽油、97#汽油作为研究对象,分析总结助燃剂在不同载体条件下成分变化规律,探究保持相对稳定的特征组分,整合实验数据,结合模式识别理论,建立基于BP神经网络的助燃剂比对辨识的方法,得出结论:运用自建的BP神经网络,能够识别不同标号的汽油,网络的均方误差MSE能处于较低水平,测试集的识别正确达到85.7%。

参考文献

[1] 鲁志宝.火灾现场中易燃液体物证鉴定方法的研究.天津:天津大学,2003,6.

[2] P.M.L.Sandercock,E.Du Pasquier.Chemical fingerprinting of gasoline 2 Comparison of unevaporated and evaporated automotive gasoline samples.Forensic Science International,2004,140:43-59.

[3] Monfreda M.Gregori A.2011.Differentiation of unevaporated gasoline samples according to their brands,by SPME-GC-MS and multivariate statistical analysis.Journal of forensic sciences.56(2):372-380.

[4] B.K.Lavine,D.Brzozowski,AJ.Moores,etc.Genetic algorithm for fuel spill identification.Analytica Chimica Acta,2001,437:233-246.

[5] 王荣辉,宗若雯,等.主成分分析法和Fisher判别方法在汽油分类分析过程中的应用.中国科学技术大学学报,2006,36(12):1331-1335.

[6] 支有冉.不同石化燃料燃烧烟尘的来源辨识.化工学报,2011(12):3575-3577.