一种采用相空间重构的多源数据融合方法
来源:独旅网
第50卷第8期 西 安 交 通 大 学 学 报 JOURNAL OF XI’AN JIAOTONG UNIVERS1TY Vo1.50 NO.8 Aug.2016 2016年8月 DOI:10.7652/Xjtuxb201608O14 一种采用相空间重构的多源数据融合方法 赵皓,高智勇,高建民,王荣喜 (西安交通大学机械制造系统工程国家重点实验室,710049,西安) 摘要:针对化工生产系统中状态监控变量数量庞大、冗余度高等问题,提出了一种采用相空间重构 的多源数据融合方法。该方法首先根据互信息法和Cao方法分别求取相空间重构参数延迟时间 和嵌入维数;然后,基于信息熵对自适应加权融合估计方法的融合目标函数进行改进,并利用社会 认知优化算法确定各信息源的权重系数,实现多源数据融合;最后,通过实际化工生产系统的数据 分析对所提方法进行有效性验证。实验结果表明,相比于传统方法,由该方法得到的重构相空间的 信息更加完备,其信息量和平均峰值信噪比分别平均提高135.6 和4O.6 。该方法为解决多源 异类传感器数据融合问题提供了一种新思路。 关键词:相空间重构;数据融合;自适应加权融合估计;信息熵 中图分类号:TP212 文献标志码:A 文章编号:0253—987X(2016)08-0084—06 A Fusion Method of Multisource Data Using Phase Space Reconstruction ZHAO Hao,GAO Zhiyong,GAO Jian,'nin,WANG Rongxi (State Key Laboratory for Manufactu ring System Engineering,Xi’an 710049,China) Abstract:A new fusion technology for multi—source data based on the phase space reconstruction is proposed to focus on the problem of multivariable and high redundancy of the condition monitoring variables in the chemical production system.Both the mutual information method and the Cao method are used to select the reconstruction parameters,the time delay and the embedding dimension.Then,the information entropy is employed to obtain an improved obj ective function in adaptive weighted fusion estimating method for multisource data fusion,and the weighting coefficients of various information sources are calculated by means of a social cognitive optimization algorithm.The effectiveness of the proposed method is verified by an analysis of one case study of real chemical plant data sets.The results and a comparison with the traditional method show that the proposed method gets improvements in the amount of information and average PSNR,respectively.It is concluded that the proposed method improves the completeness of the information of the reconstructed phase space and provides a new approach for the multi—source data fusion of heterogeneous sensors. Keywords:phase space reconstruction;data fusion;adaptive weighted fusion estimation; information entropy 化工生产系统是典型的耗散系统,其中包含数 百甚至更多的监测变量对其状态进行监测,产生了 收稿日期:2016—01—12。 作者简介:赵皓(1993),男,硕士生;高智勇(通信作者),男,副教授,博士生导师。 基金项目: 国家自然科学基金资助项目(51375375)。 网络出版时间:2016—06—28 网络出版地址:http://WWW.cnki.net/kcms/detail/61.1069.T.20160628.2029.006.html 第8期 赵皓,等:一种采用相空间重构的多源数据融合方法 海量的监测时间序列,但同时也带来了大量的冗余 信息。多传感器数据融合技术能够将来自多个传感 器的信息和数据进行综合分析与处理,在实现多源 的嵌入相空间,只要维数m≥2d+1l6]。假设一个 时间序列为{z(1),-z(2),…, ( 一1),z( )},根据 嵌入定理,重构相空间可以表示为x一[.z( ),z( + r),…,x(i4-( 一1)r)] ∈R ,i一1,2,…,N,N为 相点数且满足N— 一(m一1)z-,r是延迟时间,m是 信息互补的同时能有效降低冗余程度。 数据级融合作为最基础的融合层次,能够提供 特征级、决策级所不能提供的详细信息。张品等人 采用基于卡尔曼滤波器的贝叶斯估计方法提高了融 合精度 ;宾光富等人通过关联函数分析调整加权 融合模型权重系数得到了最佳融合结果[2]。然而, 嵌入维数。本文中分别采用互信息法和Cao方 法l_7]计算延迟时间和嵌入维数。 1.1.1 互信息法 对于由2个离散信息系统S一 {S ,Sz,…,sK}和Q一{q ,q。,…,q,}构成的共同系 目前的数据级融合方法主要是针对同类传感器,针 对异类传感器的研究很少,并且最大的问题在于异 统,在给定S的情况下可以得到关于系统Q的信 息,称为s和Q的互信息 一类传感器获得的是物理意义不同的目标或现象的信 息,因此融合结果得不到合理的解释。相空间重构 理论则为解决这一问题提供了可能。 相空间重构作为非线性时间序列分析的重要手 段,能够将动力系统的吸引子在高维空间中恢复出 来。通过相空间重构所得到的是能够反映时间序列 耋砉 ·b[ ] (1) 式中:P (s ,q )为事件S 、q 的联合分布概率。定 义[5,q]一[z( ),x(t4-r)],则互信息是与延迟时间 相关的函数,记为 (r)。取 (r)的第一个极小值作 为最优延迟时间。 动力学特性的信息空间,而原始时间序列所蕴含的 物理意义被淡化,因此,可以将多源数据融合问题转 化为多变量相空间重构问题。许多学者针对多变量 相空间重构问题开展了研究。。 ],但目前的研究方法 1.1.2 Cao方法 对于d维相空问中的第i个相 点矢量X( ),都有某个应合并的最邻近点 维时,这2个相点间的距离变成R + ( )。令 一 ( ), 其距离为R ( )。当相空间维数从d维增加到d4-1 或只是将各个变量在相空间上进行拓展,增大计算 量,或假设数据符合已知的概率分布,并没有很好地 解决重构相空间中信息不完备、冗余度高等问题。 针对以上问题,本文将相空间重构理论与数据 定义 E(m)一— -_一 一 r 融合技术相结合,提出了一种解决多源异类传感器 数据融合问题的方法。首先,各个单一时间序列都 n( ,m) (3) 包含并且反映了原复杂系统的部分信息,选择能够 反映系统特性的参数分别进行相空间重构;结合数 据融合技术,采用改进的自适应加权融合估计的方 法对相空间中的每一维数据进行融合,得到包含尽 可能多的原复杂系统信息的融合相空间。将本文所 提出的方法结合某化工企业分布式控制系统(dis— tributed control system,DCS)数据进行分析,通过 对比融合结果可以发现,由本文方法得到的融合相 E ( )一 (4) 对于一个确定时间序列,E ( )将在m大于m。后 不再变化,此时m。为选取的嵌入维数。 将上述单时间序列相空间重构方法拓展到多时 间序列相空间重构。选取r个变量,分别求取延迟 时间r ,r ,… 和嵌人维数m ,m ,…,m 。为了 保证各个变量相空间都能够完全展开,同时在相轨 迹不产生压缩的前提下保证数据间的相关性,选取 最大的嵌入维数m和最小的延迟时间r作为相空 空间能够包含参与融合的各信息源的重要信息,较 传统方法得到的融合相空间信息更为完备。 1 多时间序列相空间重构 1。1相空间重构数学模型 间重构参数 m—max‘ ,mz,…, r l z-==:rain(z.i, ,…,r ) J (5) 非线性时间序列相空间重构理论的基础是 Takens等于1981年提出的嵌入定理,即对于无限 长、无噪声的d维混沌吸引子的标量时间序列 { ( )},总可以在拓扑不变的意义上找到一个m维 由此可以得到r个重构相空间。 1.2 基于自适应加权融合估计的数据融合 随着变量个数的增加,重构相空间在携带更多 原系统动力学信息的同时,也很有可能携带冗余信 http f WWW. dxb CD http , zkxb.xjtu.edu.cn 西安交通大学学报 第5O卷 息。信息熵 作为一种信息度量的方法,可以定量 许把一个知识点重复分配给多个学习代理。 地衡量信息量的大小,且信息熵与信息量的大小成 反比关系_9]。本文据此提出信息度这一概念,并与 自适应加权融合估计算法相结合,对融合目标函数 进行改进。具体过程为:对于监测时间序列T ,…, 丁,,设W ,…,W 为各时间序列所对应的加权因 步骤2替代学习过程(针对每个学习代理):①模 仿学习过程,从知识库中随机地选出2个或多个知 识点(一般选择2个),但是这些选出的知识点不能 与学习代理本身的知识点重复,然后基于竞争选择 的原则在这几个知识点当中选择出一个较好的知识 点(即选取式(8)或(9)的较小者);②观察学习过程, 子,则加权融合后的最终结果为 T=:=>:w T (6) 通过比较选择出来的知识点和学习代理自身的知识 点的水平,选择水平相对较好的知识点作为中心点 。,数据融合的关键步骤就是要找到目标函数F 在式(7)约束条件下的最小值 f0≤W ≤1,i一1,2,…,r st.使用较差的知识点作为参考点 ,然后学习代 理基于邻域搜索的原则(以z 作为参考点选出一个 {I W 一1 —(7) l 新的点z ,对r维的点z 一zI.r+2rand()(z2 一 32 ),rand()是属于(O,1)的随机值),根据这2个知 识点移动到一个新的知识点,之后将该知识点添加 到知识库中。 步骤3知识库更新过程:从知识库中移除N 个具 有最差水平的知识点。 步骤4重复步骤2和步骤3,直到满足终止条件。 社会认知优化算法的流程如图1所示。 传统自适应加权融合估计算法的目标函数为 F 一∑w2 2 i 1 (8) 式中: 表示各变量的方差。本文将目标函数改为 F2一H( :百 w X ) (9) 式中:H表示信息熵,对于概率分布P一(P ,…, )来说,tg,g'N H一∑P 1bp ,0≤P ≤1,∑P 一1 i=l 一1。 本文提出信息度y,其表达式为 Y—e一 (10) 由式(10)可知,信息度与信息熵成反比关系,即与信 息量成正比关系。上述问题的求解是一个典型的多 属性目标优化问题。下面将使用社会认知优化算法 对各变量加权因子进行最优解求取。 图1社会认知优化算法流程图 1.3基于社会认知优化算法的权重优化 社会认知优化算法(social cognitive optimiza— tion,SCO)是由谢晓峰教授提出的一种智能算 法l_】 ,在求解复杂非线性问题和多属性优化问题中 具有很好的效果_】 ]。该算法主要包括知识点、 2多源数据融合过程 多源数据融合过程分为以下几个步骤。 (1)数据预处理。对原始时间序列进行归一化 库、学习代理、邻域搜索等概念,整个优化过程由一 系列学习代理来完成。 假设库中知识点个数为N ,学习代理的个数 为N (一般情况下N 一3N ),循环学习的次数为 T。社会认知算法的实现步骤如下口 。 步骤1初始化过程:①在知识库(式(7))中随机生 成每个知识点对应的加权因子w ,w ,…,w 和适 应度水平(目标函数式(8)或式(9)的值);②随机将 等处理,同时取出r个需要参加相空问重构的变量。 (2)相空间重构参数计算。对选取的r个变量 分别求取延迟时间r ,r2,…, 和嵌人维数m , , …,m ,并根据式(5)确定新相空间的嵌入维数m和 (3)各变量相空间重构。根据上一步中确定的 延迟时间f。 相空间重构参数,将r个变量分别重构到新的相空 间中,其中第i个变量{z (1),32 (2),…,z ( ))的重 构相空间可以表示为 知识库中的知识点分配给每个学习代理,但是不允 http://WWW.jdxb.cn http://zkxb.xjtu.edu.cn 第8期 赵皓,等:一种采用相空间重构的多源数据融合方法 Y —Ex ( ), ( +r),…,z ( +(m一1)r)] ∈R (11) 袁1 监测点1和2的相空间重构参数 式中:i一1,2,…r; 一l,2,…,N;N— 一(m一1)r。 (4)多源数据融合。使用自适应加权融合估计 算法对上述r个重构相空间的每一维分别进行数据 融合,得到重构相空间 1.0 Z一[2( ),z(j+r),…,z(j+( 一1)r)] ∈R (12) O.8 式中:J一1,2,…,N;N—n一(优一1)r。其中融合相 空间中的第k个坐标点 0.6 0.4 z(k)一> .2C (足)W (愚) 百 (13) 0.2 式中: (是)表示第i个变量的第k个点值;硼 (忌)为 (志)的权重。 0.0 O.2 0.4 I 0.6 0.8 1.0 3 应用实例 将本文所提出的方法应用到某能源化工企业的 实际压缩机组所产生的时间序列中,通过对比融合 效果,验证本文所提方法的有效性。选取监测点A— ATI7611(监测点1)测量增压机进气温度,选取监 1 0 图2监测点1时间序列重构图 O 8 O 6 O 4 0 2 测点PSE7655(监测点2)测量空气机组汽轮转速。 本文中所采用的数据均直接来源于企业DCS数据, 以1 min为间隔,连续采集48 h,共2 882个数据点。 首先,分别计算2个监测点时间序列的延迟时 间和嵌入维数,如表1所示。 将2个监测点的时间序列重构相空间中前二维 分别记为5C ,Y ,i一1,2,监测点1、2的重构图分别 如图2和图3所示。 图3监测点2时间序列重构图 的条件下每一维中每一个数据块的权重,结果分别 如表2和表3所示(目标函数为式(9)时求得的每一 维的权重系数相同,因此只列举第1维)。 根据式(5),上述2个监测点融合相空间重构参 数选择为嵌入维数m一4,延迟时间r一4。根据上 述参数重新得到重构相空间y 和y ,将2个相空 间中的每一维数据按照500的数据量进行分块,使 分别根据上述权重值以及y 、y 的相点值,重 新计算融合相空间z中的每一个相点。z中的前二 维分别记为 、z ,融合后的相空间轨迹图分别如图 4、5所示。 用社会认知优化算法(设定参数N。。。一300,N 一 100,T一1 000),分别计算在目标函数为式(8)和(9) 表2 目标函数为式(8)时数据块权重计算结果 Wl W2 数据块—m一1 m一2 —m一3 m一4 —一1 m一2 —m一3 m一4 http://www.jdxb.cn http://zkxb.xjtu.edu.en 西安交通大学学报 第5O卷 表3 m一1目标函数为式(9)时数据块权重 计算结果 数据块 w O.951 2 值,结果如表4所示。 表4各维度相空间信息度 w O.O48 8 O.OO1 2 O.998 8 O.9O7 7 O.99O 2 O.987 3 O.O92 3 O.0O9 8 O.O12 7 o.004 4 O.995 6 从表4中可以看出,本文所提出的方法使得融 合后相空间中每一维度的信息度值都为最大,即所 包含的信息量最大,相比于传统方法平均提高了 135.6 ,因此具有更好的融合效果。 (2)平均峰值信噪比。在图像融合中常用峰值 信噪比来衡量融合后的噪声是否得到抑制口引。在 这里认为原始相空间与融合相空间的差异就是噪 声,而原始相空间就是信息。定义原始相空间y与 z1 融合相空间z的均方根误差为 1 图4传统方法得到的融合相空间轨迹图 m N ,,。 ERMs一( ∑∑[y )一Z(i ])“ (14) 式中:m、N分别表示相空间的维数与相点个数; y(i,J)、z(i,J)分别为原始相空间与融合相空间的 相点值。则峰值信噪比的计算公式为 RPsN一101g『L 上 RMS J] 此定义平均峰值信噪比 Zl ) 峰值信噪比越大,则说明融合的效果越好。本文据 图5本文方法得到的融合相空间轨迹图 ∑R ( ) RPsN一 r (16) 4融合效果评价 4.1定性评价 式中:RPsN( )表示参与融合的第i个变量的峰值信 噪比;r表示参与融合的变量个数。对比2种方法 的计算结果,如表5所示。 表5 2种方法各维度平均峰值信噪比比较 对比图2、3可以发现,图2不包含图3的球形 特征,图3也不具备图2的椭圆形特征,即两者的重 构信息都是不完备的。对比图4、5可以发现,图4 中包含图3的球形特征,但并不包含图2的椭圆形 特征,而图5在整体上与图2相似,含有椭圆形特 征,同时在左下角含有图3的球形特征。因此,本文 所提出的改进方法较传统方法具有更好的融合效果。 4.2定量评价 从表5中可以看出,本文中所提出的改进方法 (1)信息量。由式(10)知,本文中所提出的信息 具有更大的平均峰值信噪比,相比于传统方法提高 了40.6%。 度的大小与时间序列中所包含的信息量成正比关 系。分别求取图2~图5相空间每一维度的信息度 综合上述对比结果可以看出:相比于传统方法, http://WWW.jdxb.cn http://zkxb.xjtu.edu.cn 第8期 赵皓,等:一种采用相空间重构的多源数据融合方法 89 由本文所提出的多源数据融合方法得到的融合相空 间信息更加完备,具有更好的融合效果。 struction of proper phase space with cross auto—。corre—_ lation[J].Neurocomputing,2013,l13:49—57. theory of communi— -I8] SHANN0N C E.A mathematical5 结论 cation I-J].The Bell System Technical Journal,1 948, 27(3):379—423. 本文针对复杂系统中状态监控变量数量庞大、 冗余度高等问题,提出了一种采用相空间重构的多 源数据融合方法。通过具体的实例验证分析表明, [9] 张继国,辛格.信息熵:理论与应用I-M].北京:中国 水利水电出版社,2012:35—46. [1O] XIE Xiaofeng,ZHANG Wenjun,YANG Zhilian.So— cial cognitive optimization for nonlinear programming 由本文方法得到的融合相空间包含了所有参与融合 的各信息源的重要信息,其信息空间更加完备,为后 续的数据分析奠定了良好的数据基础。该方法不仅 可以解决同类传感器之间的数据融合问题,也为异 类传感器的数据融合问题提供了一种新思路。 参考文献: Eli 张品,董为浩,高大冬.一种优化的贝叶斯估计多传 感器数据融合方法[J].传感技术学报,2014(5): 643—648. problem[c]∥Proceedings of International Conference on Machine Learning and Cybernetics.Piscataway, NJ,USA:IEEE,2002:779—783. n.The Social EL1] MA Li,WANG Rongxi,CHEN Yanpicognitive optimization algorithm:modifiability and ap— plication[c]//Proceedings of International Conference on E—Produce E—Service and E-Entertainment.Piscat— away,NJ,USA:IEEE,2010:1—4. ZHANG Jianke,LIU Sanyang,WANG Rongxi.Con— [12] trol of chaotic systems by chaotic social cognitive opti— ZHANG Pin,DONG Weihao,GAO Dadong.An opti— mal method of data fusion for multi—sensors based on mization[J].ICIC Express Letters,2011,5(3):693— 699. Bayesian estimation[J].Chinese Journal of Sensors and Actuators,2014,27(5):643—648. [13] 刘贵喜,杨万海.基于小波分解的图像融合方法及性 能评价I-J].自动化学报,2002,28(6):927—934. LIU Guixi,YANG Wanhai.A wavelet decomposition [2]BIN Guangfu,JIANG Zhinong,LI Xuejun,et a1. Weighted multi—‘sensor data level fusion method of vi—- based image fusion scheme and its performance evalua— bration signal based on correlation function[J].Chi— nese Journal of Mechanical Engineering,2011,24(5): 899-9O4. tion口].Acta Automatica Sinica,2002,28(6):927— 934. [3] GARCIA S P,ALMEIDA J S.Multivariate phase space reconstruction by nearest neighbor embedding [本刊相关文献链接] 董恩清,刘伟,宋洋.采用三角形节点块处理无线传感器网络 节点定位中节点翻转歧义的迭代方法.2015,49(4):84—90. with different time delays I-j].Physical Review:E, 2005,72(2):027205. [4]WANG Rongxi,GAO Jianmin,GAO Zhiyong,et a1. Data fusion based phase space reconstruction from [doi:10.7652/xjtuxb2O1504014] 徐田华,杨连报,胡红利,等.高速铁路信号系统异构数据融 合和智能维护决策.2015,49(1):72—78.[doi:10.7652/xjtuxb 201501012] 司刚全,张寅松,赵为犁.考虑可信度评价的多传感器一致性 鲁棒测度方法.2013,47(8):7-11.[doi:10.7652/xjtuxb2O13 08002] 司刚全,张寅松,娄勇.考虑自支持度和互支持度的多传感器 一multi—time series[J].International Journal of Data— base Theory and Application,2015,8(6):101—110. I-5]从蕊,刘树林,马锐.基于数据融合的多变量相空间 重构方法[J].物理学报,2008,57(12):7487—7493. CONG Rui,LIU Shulin,MA Rui.An approach to phase space reconstruction from multivariate data based on data fusion[J].Acta Physica Sinica,2008, 57(12):7487-7493. 致性测度算子.2012,46(10):20—23.[doi:10.7652/xjtuxb 2012100041 宋渤,徐龙起,张桂铭,等.采用微传感器的黏/密度实验系统 [6]TAKENS F.Detecting strange attractors in turbulence 口].Lecture Notes in Mathematics,1981,898:366— 38l| 及其性能测试.2014,48(3):44—48.[doi:lO.7652/xjtuxb 201403009] [7]PALIT S K,MKHERJEE S,BHATTACHARYA D K.A high dimensional delay selection for the recon— (编辑 刘杨) http:}}WWW. dxb.cn http ff zkxb.xjtu.edu.cn