技术领域
[0001] 本发明涉及语义缓存算法,特别是一种普适的博弈均衡的语义缓存算法。
相关背景技术
[0002] 语义缓存是各种移动传感器数据库系统的O2O应用中的重要研究内容,近年来,在大数据及物联网飞速发展的背景下,语义缓存技术受到了广泛的关注和重视。
[0003] 综合国内外的研究成果来看,发现传统的方法都具有局限性,均不能满足现在O2O移动传感器数据库发展的需求。例如:
[0004] 在文献1中,虽然簇缓存算法考虑了语义与时间因素,但是只有定性分析,没有定量描述(Q.Ren and M.H.Dunham,“Using clustering for effective managementof a semantic cache in mobile computing,”Mobile 99 Proceedings ofthe 1st ACM international workshop on Data engineering for wirelessand mobile access,1999.);在文献2中,branch bound and greedy dual-sizefrequency(BBGDSF)虽然考虑了语义和时间因素提供了定量分析,但是只考虑了静态位置信息模型,没有考虑动态位置因素(L.Savary,G.Gardarin,and K.Zeitouni“,Geocach a cache for gml geographical,data,”International Journal of Data Warehousing&Mining,vol.3,pp.66–87,2007.);
在文献3中,collaborativespatial data sharing(CSDS)虽然费用模型考虑了动态位置因素,但是没有考虑语义和时间因素(Z.Huang,C.S.Jensen,andB.C.Ooi,“Collaborative spatial datasharing among mobile lightweight devices,”SSTD’07 Proceedings ofthe 10th international conference on Advances in spatial and
temporaldatabases,2007.)。
具体实施方式
[0057] 下面结合实施例和附图对本发明作进一步的说明,这些实施例仅仅是对本发明较佳实施方式的描述,但并不限定以下所述的内容。
[0058] 本发明提供的普适的博弈均衡的语义缓存算法,其涉及各种移动传感器数据库系统的O2O应用的位置,数据,能量博弈均衡的语义缓存查询机制。
[0059] 首先,基于纳什均衡机制,我们提出了一个根据分析语义,时间和位置三个因素关系作用的协方差系数的应用。
[0060] 其次,对基本的模型和参数做了重要等级的分析。
[0061] 第三,我们描述和概括了通用的纳什均衡机制,利用新旧向量间的协方差系数相等,找到纳什均衡点,来求解协方差系数的问题。
[0062] 第四,进而利用这些协方差系数,为在分布式查询处理中的查询优化,获取优化的语义缓存费用模型。
[0063] 第五,扩展到多因素比例变化。之前各各因素所占的比例是相等的,但在实践应用中,不同因数所占比例往往是不同的,可以对所述的模型做相应的扩展来解决这个问题。
[0064] 第六,值得强调的是,该方法能够扩展到任意有限维度,所有这些是我们方法的典型特征。我们使用大量的试验,测试调整了我们的模型,而且从海量的试验结果中选择有效的解空间证明我们的方法是有效的。
[0065] 最后,扩展的模拟结果显示,我们的机制在响应时间和端点满足率上,优于现有的方法。
[0066] 本发明提供的普适的博弈均衡的语义缓存算法,具体是:基于纳什均衡机制,设计分析和求解语义、时间和位置三个因素的参数表达,并且构建博弈均衡方程,求解关系作用的协方差系数,找到三个因素向量博弈均衡点,以此获得普适的博弈均衡的语义缓存算法,进而扩展到多因素比例变化,还能够扩展到任意有限维度。
[0067] 该算法包括定义基本概念、确定移动节点的权重、协方差系数标准化、纳什均衡、多因素纳什均衡和扩展到多因素比例变化步骤,具体如下:
[0068] 1.定义基本概念:
[0069] 首先,用一对坐标来代表欧几里德空间(x,y),移动用户的位置表示为坐标(Lx,Ly);移动速度V表示为,用户的位置在(Lx,Ly)时的速度,这里Vx和Vy是分别在x,y轴方向上的速度;所有的移动节点、语义缓存块和考虑的因素的总数分别由I,J,K标识;
[0070] 然后,定义三个整数集合
[0071]
[0072] 它表示一个移动节点 语义缓存块 因素或约束
[0073] 在移动节点 的语义缓存块 的因数权 表示为wi,j,k;
[0074] 在移动节点 的语义缓存块 对所有k个因素的总权重表示为Wi,j。
[0075] 2.确定移动节点的权重:
[0076] 在确定移动节点的权重的过程中,先计算每个因素权的协方差系数,然后再算出每个因素权值,最后计算出它们的线性组合总权重。具体如下:
[0077] 在移动节点 上的语义缓存 的总权重Wi,j定义为在移动节点,语义缓存j所有被考虑因素的线性组合。
[0078]
[0079] 该公式 αk∈R是一个权wi,j,k的非负可扩展的协方差系数。
[0080] 在本发明的语义缓存LDD查询优化中,权重在K=1,2,3时的定义为语义权wi,j,1,时间权wi,j,2,位置权wi,j,3,其表达式为:
[0081]
[0082] wi,j,2=L,(4)
[0083]
[0084] 上述三个权描述传感器数据库系统中的不同的关系,其中:语义权wi,j,1,Fi,j表示查询的频率,Ci,j费用,Si,j大小之间的关系;生命权wi,j,2表示时间生命周期;位置权表示wi,j,3,查询起点和查询对象的动态位置关系。V指移动设备的速度,tc指当前时间,tx是指移动设备通过该位置时的时间,tf是指将来时间。这三个权的对象是相互独立的,因而这三个权向量线性无关。
[0085] 3.协方差系数标准化:
[0086] 在协方差系数标准化是指,所有协方差系数的和为1。具体如下:
[0087] 定理1.由多维权重的线性组合的总权重可由带有协方差系数αi,1,αi,2,...,αi,k的方程来描述,其满足以下关系:
[0088]
[0089] 4.纳什均衡:
[0090] 由方程(2)和(6)所表示的费用模型是系统获得多因素平衡的一种标准形式,本发明引入纳什均衡的概念来解决这种平衡关系。
[0091] 在博弈论中所有的参与者同时选择行动称为静态博弈,完全信息博弈是指所有的博弈者对博弈问题的信息结构有完全的了解。为了简单有效的解决三维向量博弈均衡的问题,可以先从二维向量博弈均衡开始。如果二维向量博弈均衡成立,很容易扩展到三维向量,进而扩展到任意有限维。
[0092] 具体如下:
[0093] 设定位置,能量,数据权向量W’,W”和W”’是博弈的参与者。
[0094] (1)可以把2维位置权向量W’和能量权向量W”博弈均衡看作是一个完全信息静态博弈,此博弈通过矩阵来分析2维位置权向量W’与能量权向量W”的博弈来实现。
[0095] 博弈矩阵参见表1。在表1中,W’从行分析,W”从列分析。每个参与向量有两个策略:独占Monopolization(M)或合作Collaboration(C)。矩阵的每个值代表W’和W”每个权向量所作策略的相关收益。
[0096] 表1:博弈均衡矩阵位置权向量w’和能量权向量w”,
[0097] 独占Monopolization M;合作Collaboration C.
[0098] w”
[0099] MC
[0100]0,0 1,0
0,1 CosA,CosB
[0101] w’M
[0102] C
[0103] (2)引入占优战略的概念来分析。占优战略是指在博弈中,对于所有的其它参与者的选择。如果某种策略s都是参与者i的最优选折,那么S是是参与者i的占优策略。
[0104] 首先,排除(M,M)情况,因为对W’和W”都不是占优的,如果两个向量都独占,将无法工作。其次,如果(M,C),w’最大化利益,占优;如果(C,M),W”最大化利益,占优;如果W’,W”是理性的,它们都不会选折(M,C)和(C,M)。最后,W’W”只会选折(C,C),收益(CosA,CosB)的情况,即只有在(C,C)情况下存在博弈均衡。而且CosA,CosB都是变量,所以只有在CosA=CosB时,是博弈均衡点。
[0105] 同理可推广到位置,数据权向量W’和W”’博弈均衡,见表2。
[0106] 表2:博弈均衡矩阵位置权向量w’和数据权向量w”’.
[0107] 独占Monopolization M;合作Collaboration C.
[0108] w”’
[0109] M C
[0110]0,0 1,0
1,0 cosA,cosC
[0111] w’M
[0112] C
[0113] 只有在(C,C)情况下存在博弈均衡,而且只有在CosA=CosB时,是博弈均衡点。进而可推广到能量,数据权向量W’和W”’博弈均衡W”和W”’见表3。
[0114] 表3:博弈均衡矩阵能量权向量w”和数据权向量w”’.
[0115] 独占Monopolization M;合作Collaboration C.
[0116] w”’
[0117] M
[0118] C
[0119]0,0 1,0
1,0 cosB,cosC
[0120] w”M
[0121] C
[0122] 只有在(C,C)情况下存在博弈均衡,而且只有在CosA=CosB时,是博弈均衡点。
[0123] 综上所述,可得在三维向量博弈均衡的情况下,在CosA=CosB=CosC时,是博弈均衡点。
[0124] 5.多因素纳什均衡:
[0125] 定理2:给定K个线性无关的向量:
[0126]
[0127] 它们的线性组合如下:
[0128]
[0129] Wi,*,1,Wi,*,2,...,1的纳什均衡点是:
[0130]
[0131] 定理3:对K个线性无关的向量在方程(7)和它们的线性组合方程(8)带有协方差系数满足条件方程(6)它的关系在方程(9)时,它的纳什均衡点为:
[0132]
[0133] 6.扩展到多因素比例变化:
[0134] 目前本实施例建立的方程(7)、(8)、(9)等是一个通用模型,其位置、能量和数据三个因素所占的比例是相等的。但在实践应用中,不同因数所占比例往往是不同的。可以对所述的模型做相应的扩展来解决这个问题。任何问题都是从简单到复杂,从低级到高级发展演化而来的。
[0135] 为了简单而有效的讨论,我们举三维向量为例来说明问题。
[0136] 原来的权重模型:W=αW′+βW″+γW″′, (11)
[0137] 如方程(2)的三因素实例。
[0138] 本实施例通过以下方法,将原来的权重模型演变为新的权重模型:
[0139] 先在W′,W″,W″′中增加相关系数
[0140] 设定: 位置权, 能量权, 数据权,而且则原
[0141] 来的权重模型演变为:
[0142]
[0143] 如果相应权重w的对应系数越大,那么它在整个模型中所占的比重越大,这个系数可由用户根据需要设定。进而如何确定不同参数在模型中的比例,可以用到敏感度分析,这部份内容不在本实施例讨论范围之内,可以参见文献A.Saltelli,M.Ratto,T.Andres,F.Campolongo,J.Cariboni,D.Gatelli,M.Saisana and S.Tarantola.Global Sensitivity Analysis.John Wiley&Sons,the primer edition,2008.
[0144] 本发明提供的上述的普适的博弈均衡的语义缓存算法,其性能可以通过以下方法验证。
[0145] 本发明算法有一个固有的平台,该平台是综合考虑位置、能量和数据的三维向量博弈均衡。实际上对这三维向量的任意因素,有很多人考虑专门的算法。本发明算法有机地组合了这三维因素,更重要的是,这样以来,它更容易扩展,根据现有的平台,能够获得全新的效果。它可以无缝的链接到多个因素,获得渴望的效果。本发明算法是一个通用的机制,可以考虑K>3因素,为了方便应用,下面给出一个对三维因素专门的例子的试验。
[0146] (1)性能评测指标:
[0147] 众所周知,当今无线通讯是一个非常新颖的领域,也是一个创造巨大生产力的领域。2014年11月11日光棍节阿里巴巴用时38分钟突破100亿交易额!双十一当天总金额571亿2千8百万,无线占比42.6%!除夕全天微信红包收发总量达10.1亿次,央视春晚微信摇一摇互动总量达110亿次,峰值达8.1亿次/次钟;祝福在185个国家传递了3万亿公里。
[0148] 随着无线手机用户的增多,和应用的扩展,这样的应用场景会越来越频繁。如,在Wechat中会有多个用户同时在线聊天分享文字、图片、音乐和视屏等信息。会有多个用户同时在线玩游戏,等等,本发明算法主要是针对这样的场景设计的。首先,最重要的是节省了平均相应时间,试想在峰值达8.1亿次/分钟的应用场景下,平均相应时间的节省是多么的重要;其次,是节省了带宽等资源,对于这样一个巨大的无线交互式交通,快速的查询响应,高效的缓存和数据库操作,显注的无线带宽的节省,当有亿万用户交互时,提高的效率将非常明显。
[0149] 性能评测指标有两个基本参数:
[0150] 平均响应时间:所有的查询的响应时间的平均值。从查询在移动设备上发出,到该查询得到回答,之间的流逝时间称为查询的响应时间。更短的响应时间意味着更高的性能。
[0151] 平均端点满足率:在查询系统服务器之前,一个查询在相邻的移动客户的语义缓存块中被满足。更高的端点满足率表示更优的性能,它意味着更短的节点交互,更多的无线带宽节省和更低的系统服务器交互费用。
[0152] 上述两个基本参数表示来源于移动客户的语义缓存,而不是网络服务器的查询结果,在所有查询结果中的比例。
[0153] (2)试验设计:
[0154] 为了评价平均响应时间和平均端点满足率这两个性能指标,本发明设计了传感器系统,包括:两个服务器和多个移动客户,通过无线方式相互连接。这些移动客户在矩形区域内移动,提交查询的位置、时间、语义,和其它属性与要求。每个移动节点都保留有自己的缓存,当一个移动客户提交查询,他首先在本地缓存中处理查询;如果查询没有完全满足,他转到其它节点做进一步的查询;如果查询仍旧没有得到满意的回答,就将该查询传送到服务器端进行查询。
[0155] 在移动传感器数据库系统中,服务器保留一个完全的数据版本。每个移动客户装备了很多功能模块,包括网络管理模块、查询处理模块和语义缓存管理模块,其中:网络管理模块维护与其它节点和中心服务器的无线网络交互;查询处理模块经由语义缓存生成和处理查询。语义缓存管理模块管理语义缓存的存储与替换操作。
[0156] (3)系统指标和情景:
[0157] 模拟试验的系统设置指标如下表,每个移动节点在一个矩形框内移动,这两个边随机的生成50m到1000m,100m到2000m,它移动的速度在每秒1unit/sec到10unit/sec之间。移动设备的整数在100到5000之间,产生了一个中等规模的数据级。这个无线半径为100m到
10m。无线网络带宽设为典型的值19.2kbps。传递路由信息的最大跳数为两跳,是为了获得较好的缓存效果,而又不必付出过高的费用。
[0158] (4)改变语义度参数:
[0159] 将位置度固定在30%,语义度取1;2;3;4,选择不同类型的方法比较:我们的方法,BBGDSF,CSDS,实验结果显示我们的方法优于其它的方法。
[0160] 由于篇幅因素,我们只选择位置度固定在30%,语义度取2;4,的试验结果:
[0161] 图1-图2表示平均响应时间。如图1-图2所示,因为本方法综合考虑了多个因数,使得多因素能够获得精细的纳什均衡,所以该方法的平均响应时间明显优于其它方法。
[0162] 图3-图4表示平均端点满足率。如图3-图4所示,随着语义度的增加,我们的方法显示比其它方法更好的平均端点满足率,尤其当运行时间相当长的时候。
[0163] (5)改变位置度试验结果:
[0164] 将语义度固定在3,位置度取10%;20%;50%;60%,然后选择不同类型的方法比较:我们的工作,BBGDSF,CSDS,实验结果显示我们的工作优于其它的方法。
[0165] 由于篇幅因素,我们只选择语义度固定在3,位置度取10%;50%,的试验结果:
[0166] 图5-图6表示平均响应时间。如图5-图6所示,本方法明显好于其它方法。
[0167] 图7-图8表示平均端点满足率。如图7-图8所示,在大部分情况下,本方法显示比其它的方法更好的平均端点满足率,尤其当长时间运行时,该方法显示出优势。
[0168] 综上所述,本发明方法优于其它的方法,在众多可能的条件中,较长的应用时间下,该方法更强壮,更适应于复杂多变边的网络应用。