首页 / 认知无线网络中频谱博弈分配方法

认知无线网络中频谱博弈分配方法无效专利 发明

技术领域

[0001] 本发明涉及无线通信技术领域,特别涉及认知无线网络中频谱博弈分配方法。

相关背景技术

[0002] 随着各种无线通信新技术的不断出现以及各种无线业务的兴起,以及新一代宽带无线网络的大量出现(如LTE-A和WiMAX),频谱资源短缺的问题日益严重。目前无线电频谱是采取固定方式分配给不同的网络(即为授权频谱),由国家统筹规划管理。实际应用中的大量测量结果表明,这种固定频谱授权分配使用的方式导致某些频谱承载的业务量很大,出现严重的拥塞现象;而同时,也有些频谱的频谱使用效率极低,造成了频谱资源的严重浪费。认知无线电的提出被认为是解决这一问题最完美的技术方案,由此衍生的认知无线网络也已被视为未来网络的主流发展方向。
[0003] 认知是指无线电必须具有自我感知能力,了解其工作环境的基本状况,并使用无线电知识表示语言与其他的实体进行通信,从而实现无线电的控制问题。认知无线电技术为次用户提供了择机使用和共享频谱的能力,主要包括频谱检测、频谱分配(管理)以及频谱切换等多方面的内容,核心思想是使无线通信设备具有发现“频谱空洞”并合理利用的能力。
[0004] 频谱分配是指根据需要接入系统的节点数目及其服务要求将频谱分配给一个或多个指定节点。频谱分配策略的选择直接决定系统容量、频谱利用率以及能否满足用户因不同业务而不断变化的需求。在认知无线电中,为了解决频谱资源的匾乏和目前固定分配频谱利用率较低的问题,就要求找到更有效的方法来充分感知和利用无线频谱资源。基本途径有两条:其一,提高频谱利用率,将已授权用户的频谱资源充分利用,减少浪费;其二,提高系统通信效率,将已获得的频谱资源和其他资源综合优化分配,进而提高利用率,这些都涉及到频谱分配的内容。
[0005] 认知无线电中的频谱共享问题一直是国内外理论研究的热点,自认知无线电概念的提出发展至今,不少学者提出了认知无线电中频谱共享问题的分析模型,它们大多是借鉴于一些经典的数学理论以及微观经济学理论等,现就较为常见的两种频谱分配模型介绍如下:
[0006] (1)基于图论的频谱分配模型
[0007] 基于图论的频谱分配模型是建立在相应的干扰和约束条件之上的。在认知无线电的研究中,将认知用户组成的网络拓扑结构抽象成图,图中的每一个顶点代表无线用户,每一条边表示一对顶点间的冲突或者干扰。特别的,如果图中的某两个顶点由一条边连接,则假定这两个节点不能同时使用相同的频谱。另外,将每一个顶点与一个集合相关联,这个集合代表该顶点所在区域位置可以使用的频谱资源。由于每个顶点地理位置的不同,因而不同顶点所关联的资源集合是不同的。在建立了网络拓扑结构图的基础上,便可以根据图论着色理论对认知无线电用户进行频谱分配。
[0008] 但是,基于该模型的频谱分配方法中,频谱分配的完成时间与空闲信道数多少以及网络的动态特性有关,在网络结构发生变化的时候需要更新拓扑图并重新着色进行频谱的再分配,因而该模型无法适应认知无线电中空闲频谱快速时变的要求,也不适应认知无线电网络的动态变化。
[0009] (2)基于定价拍卖的频谱分配模型
[0010] 利用微观经济学中定价拍卖原理而制定的无线电资源分配机制在近年来被广泛研究,而且已经证明是认知无线电网络的频谱分配问题的有效解决方法。在这种基于拍卖的频谱分配模型中,网络结构一般采用集中式结构,认知无线电用户是投标者,中心接入点(Access Point,AP)或基站(Base Station,BS)在一次拍卖中充当拍卖人。在一个拍卖轮回中,每个投标者为满足自身需要给频谱资源投标,由拍卖人根据最大化认知无线电网络收益等原则确定胜利者。
[0011] 基于定价拍卖的频谱分配模型根据不同的网络效用需要来确定自身的目标函数,即确定赢家胜出的规则。例如采用最大化系统吞吐量原则将某段频谱分配给在其上吞吐量投标值最大的用户,利用效用公平原则和时间公平原则保证投标在竞争频谱资源过程中的效用公平和时间公平等等。
[0012] 但是,基于该模型的频谱分配方法中,只是根据次用户的频谱租用需求进行决策,并未考虑主用户的出租效益和空闲频谱动态变化情况,决策时如果次用户需要在需求和效益之间进行平衡,则有可能导致一个轮回的决策时间过长(多个次用户多次调整需求值),因而该模型也无法适应认知无线电中空闲频谱快速时变的要求,也不适应频谱分配的实时性要求。

具体实施方式

[0047] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0048] 本发明适用于可实施集中式控制的网络部署场景中,场景模型如图1所示,认知无线电网络场景包括三个部分:主用户、次用户、频谱管理机构。本发明中只研究主用户之间的博弈过程,将所有次用户当作一个整体考虑,主要通过将频谱共享问题抽象为博弈论中的寡头竞争模型,在主用户出租频谱数量上进行博弈直至达到均衡状态,最终目的是提高主用户空闲频谱利用率。
[0049] 图2为本发明中认知无线网络中频谱博弈分配方法的流程图。次用户检测到空闲频谱后请求租借频谱,频谱管理中心收到次用户的租借请求信息和详细参数信息,调用主用户的博弈算法,确定为次用户提供频谱的主用户。在博弈过程中,每个主用户每次博弈时都根据各主用户的历史策略调整它的当次策略——出租频谱数量,以期获得最大效用。在博弈最终达到稳定平衡状态时,根据次用户的请求,在通信期间,多个主用户为次用户分配需要大小的频谱。本发明的频谱博弈分配方法完全反映了认知无线电系统中频谱分配的过程,所述方法包括步骤:
[0050] (1)次用户检测到空闲频谱,与频谱管理中心建立连接,将该次用户的详细信息,如效用函数、频谱需求函数、目标误比特率等传送给频谱管理中心,请求租借频谱。
[0051] (2)频谱管理中心将次用户的频谱租借请求信息进行公示。
[0052] (3)不同的主用户出租一定数量的频谱,并观察供需情况,随时调整自己出租频谱的数量进行博弈,以获得最大效益。
[0053] (4)频谱管理中心判断主用户博弈是否达到稳定状态,即系统中出租的频谱总量和各主用户出租的频谱数量是否均稳定不变。若未达到稳定状态,则继续等待博弈结束;若达到稳定状态,则进行公示,并选定主用户出租频谱。
[0054] (5)主用户观察到博弈结束,则与次用户建立通信连接,以稳定状态时自己决定出租频谱的数量将频谱出租给次用户。
[0055] (6)次用户使用主用户的频谱,在结束通信之后将频谱归还给主用户。
[0056] 在第四步中,频谱管理中心通过观察连续三次的博弈结果是否相同来判断博弈是否达到稳定状态。若三次博弈结果均相同说明博弈已处于稳定平衡,各主用户不需要再进行决策博弈。
[0057] 在本发明的方法中,针对不同的应用场景,分别设计了静态博弈算法(实施例1中的古诺模型)和动态博弈算法(实施例2中基于产量决策的斯坦科尔伯格模型)进行博弈,最终目的是提高主用户空闲频谱利用率。博弈稳定后主用户效用最大化,从而出租频谱的积极性最高,次用户使用主用户的频谱进行通信,改善主用户的频谱利用率,实现认知无线电技术的应用价值。
[0058] 实施例1
[0059] 在本发明的实施例1中,考虑的场景为各主用户没有延迟、同时采取策略的情况,在此情况下提出了静态博弈算法(又称古诺模型算法),该算法的思想是:各主用户出租品质相同的频谱,主用户的行为自私不合作,相互之间以出租的频谱数量进行博弈。各主用户同时采取出租策略(决定出租的频谱数量),且能获悉其他主用户之前采取的策略。主用户根据历史策略判断当次最适合自己的策略,经过多次博弈之后,各主用户出租的频谱数量达到均衡稳定值。算法的最终目的是使得主用户出租的频谱数量最大化,但求解目标是使主用户的效用最大化,主用户的效用表示为:
[0060] up(bi)=pbi-C(bi) (1)
[0061] 其中bi表示主用户i出租的频谱数量,p表示出租频谱时的博弈值,C(bi)表示主用户i的出租成本(即出租频谱后导致服务质量QoS下降的损失)。在博弈过程中规定各主用户出租频谱时的博弈值p相同,但随供需情况(主要是随出租频谱的总量)变化,由后面的推导过程中可以看出,该博弈值仅仅是一个中间变量,其最终会转化为一个由其他物理参数表示的函数而消去;为便于形象理解,可以将该博弈值称为主用户出租频谱的价格或类似概念,该概念仅用来表示博弈过程中供需变化的依赖关系,是一种理论概念,与实际的货币、收入或商业行为无任何关联,本发明也不涉及任何商业行为或策略。
[0062] 该效用函数反映了主用户出租频谱的积极性,效用大,主用户通过频谱出租可获得的系统收益(为系统整体运行带来的效率和/或服务质量的改进)多,从而主用户出租频谱的积极性就高,反之,效用低则出租频谱的积极性就越小。
[0063] 古诺模型算法的纳什均衡求解即是求当主用户效用最大时出租频谱的数量。从公式可以看出,出租频谱博弈值和主用户出租频谱的成本均未知。下面分别说明频谱博弈值和出租成本的求解方法。
[0064] 由前面的论述可知:频谱博弈值和频谱数量是成反比关系的,可出租的频谱数量越多,频谱博弈值(为便于形象理解,可用价格这一概念替换后进行推理)越低;反之可出租的频谱数量越少,频谱博弈值越高。可以通过次用户的效用函数得到频谱博弈值和频谱数量的准确关系。
[0065] 次用户的效用函数的选择不是唯一的,但必须选择对于某个特定的应用具有物理意义的,并且还要具有某些数学性质。本文要保证频谱分配算法能够达到均衡收敛,根据文献《差异化双寡头中的价格与数量的竞争》(N.Singh and X.Vives,″Price and quantity competition ina differentiated duopoly″,BAND J.Economics,vol.15,no.4,1984,pp.546-554.)给出的二次效用函数做出适当修改如下:
[0066]
[0067] 其中 是所用调制方式的频带利用率,bi表示主用户i出租的频谱数量,p表示出租频谱的博弈值。
[0068] 采用公式的二次效用函数原因如下:
[0069] (1)根据博弈论中纳什均衡存在性定理,要求效用函数必须连续且是凸的,公式中的效用函数满足该条件,因此存在纯战略纳什均衡。同时,函数值随着次用户传输速率增加而增大,体现了用户的满意饱和度。
[0070] (2)对该二次函数微分可以得到线性的带宽需求函数,从而可以采用标准的方法分析自适应算法的分布式策略的稳定性,简化后续处理。
[0071] 如果公式是一个二次凸函数,则必然有一个最大值。通过将该效用函数对频谱数量求导即可获得效用最大值,同时得到频谱博弈值与频谱数量的关系:
[0072]
[0073] 由此得到频谱博弈值函数:
[0074]
[0075] 上述公式(4)即可表示出频谱博弈值与频谱数量成反比的关系,为了获得两者之间的准确关系,还必须要求出 即所用调制方式的频带利用率。
[0076] 而 的值与认知无线电的无线传输模型有关,具体地,在本发明的认知无线电网络中:次用户系统采用自适应调制技术,传输速率可以根据信道质量动态的调整。采用正交幅度调制方式MQAM(采用矩形星座图,如4-QAM,16-QAM),单输入单输出高斯噪声信道的比特错误概率(BER)近似表示为:
[0077] BER≈0.2exp(-1.5γ/(2k-1)) (5)
[0078] 其中,γ表示接收机信噪比,k是所用调制方式的频带利用率即公式中的 设定比特错误概率的门限值为BERtar,则频带利用率为:
[0079] k=log2(1+Kγ) (6)
[0080] 其中
[0081]
[0082] 结合公式(4)、(6)、(7)可得到频谱博弈值与频谱数量的关系:
[0083]
[0084] 接下来再求主用户的出租成本。如果主用户将当前空闲的频谱租借给次用户使用,那么次用户没有结束通信之前,该频谱分配有效,即使是主用户也不能使用该频谱,因此主用户可以使用的带宽减少,导致主用户的服务质量下降,这就是主用户与次用户共享频谱的成本。
[0085] 在古诺模型算法和后面要阐述的斯坦科尔伯格模型算法中,如果假设边际成本不变(设为c),则成本函数为cbi,这种模型适用于主用户带宽无限,可以无限度满足次用户需求的情况。但实际上频谱是稀缺资源,主用户的带宽有限,主用户租借给次用户使用的频谱占其可用频谱的比例越大,对主用户的QoS影响越大,因此边际成本不变的成本函数在认知无线电系统中不适用,本发明根据认知无线电系统的实际情况采用二次成本函数,将主用户的出租成本表示为:
[0086]
[0087] 其中w代表成本函数的权重, 是一个主用户i连接需要的带宽,Wi和Mi分别指主用户i的频谱宽度和本地连接数目, 表示主用户i的频带使用效率,因为公式(9)中的二次函数对带宽进行微分后,得到的边际成本是随着需求的增加而增加的,这与实际情况吻合,同时Wi、Mi、 等参数也能够体现出不同主用户i之间的差异性,符合认知无线电频谱共享的实际情况。
[0088] 综合上述公式(1)、(8)、(9)可得到博弈过程中主用户i的实际效用函数:
[0089]
[0090]
[0091] 因此主用户i的实际效用仅与系统的物理条件和其出租的频谱数量有关,博弈过程转变为对出租的频谱数量的调整。具体地,在本发明的认知无线网络中频谱博弈分配方法的博弈过程中(即上述方法的步骤3中),各主用户首先同时提出自己的出租策略(即各自初始的出租频谱数量);随后每个主用户i同时根据公式(10)中的实际效用函数调整各自出租的频谱数量bi,以使得当前情况下每次博弈后自己的实际效用最大;在经过多次博弈后系统会达到一个稳定状态,此时各主用户出租频谱的效用及系统共享频谱的整体效用达到一种均衡状态,在此情况下进行的频谱分配与共享使用可使得系统中频谱利用率最高。
[0092] 实施例2
[0093] 在本发明的实施例2中,考虑的场景为主用户采取策略的时间存在先后顺序的情况,其中由一批主用户先采取策略,其他主用户后采取策略;在此情况下提出了动态博弈算法(又称斯坦科尔伯格模型算法),该算法的思想是:各主用户出租品质相同的频谱,主用户的行为自私不合作,相互之间以出租的频谱数量进行博弈。由于某些原因(比如各主用户与频谱管理中心之间的网络时延不同),各主用户不是同时采取出租策略,而是由一批主用户先采取策略,另外一批主用户根据前面主用户的策略,采取适合自己的出租策略。先采取策略的主用户知道自己采取的策略会被后采取策略的主用户所知晓。主用户根据历史策略判断当次最适合自己的策略,经过多次博弈之后,各主用户出租的频谱数量达到均衡稳定值。
[0094] 斯坦科尔伯格模型算法中的主用户效用函数、次用户效用函数、成本函数、无线传输模型等都与古诺模型算法相同,只是博弈过程的初始情况不同。对于各函数的推导过程同实施例1,在此不再赘述。
[0095] 博弈过程中,规定各主用户出租频谱的博弈值相同,并随需求情况波动。一部分主用户首先同时提出自己的出租策略(即一部分主用户初始的出租频谱数量),这部分主用户的出租策略对全体主用户可知;随后每个主用户i同时根据公式(10)中的实际效用函数调整各自出租的频谱数量bi,以使得当前情况下每次博弈后自己的实际效用最大;在经过多次博弈后系统会达到一个稳定状态,此时各主用户出租频谱的效用及系统共享频谱的整体效用达到一种均衡状态,在此情况下进行的频谱分配与共享使用可使得系统中频谱利用率最高。
[0096] 为进一步说明本发明的实际处理过程和其效果,以下通过仿真模型对本发明的方法做进一步描述:
[0097] 在仿真模型中,每一个主用户的可用带宽为20MHz,每一个主用户的本地连接数为-45,次用户的目标误比特率为10 ,每个主用户连接需要的服务速率为2Mbps,权重为2,次用-4
户的接收信噪比设为两个值11db、15.4db,即公式(10)中Wi=20,Mi=5,BERtar=10 ,w=2,γ=15.4dB。
[0098] 对于实施例1的古诺模型,单次博弈过程的算法求解过程为:
[0099] 步骤1:设定初值Wi=20,Mi=5,BERtar=10-4, w=2,γ=15.4dB。
[0100] 步骤2:将初始值代入公式(10),得到单个主用户的效用函数,该效用函数为二次函数,要求得当函数取得最大值时bi的值(即该主用户i要使效用最大应该采取的策略值),经过转化,该值表示为其他主用户均衡值 的函数:
[0101]
[0102] 步骤3:根据步骤2可得到N个主用户的策略值,N个函数联合求解即可求得各主用户的均衡值。
[0103] 可通过各种仿真情况的对比图来说明实施例1的古诺模型算法的效果,图3表示两个主用户之间的反应函数曲线(两种不同的信噪比),两条曲线的交点即是纳什均衡点。古诺模型存在纳什均衡解,各博弈方(主用户)之间的博弈达到稳定状态,各主用户的博弈策略稳定不变,在纳什均衡点各主用户的效用达到最大。
[0104] 随意设定多个(2、4、6个)主用户第一次采取策略的值,可得到其博弈达到均衡的过程图。图4中两个主用户设定初值分别为0.85MHz和1.25MHz,经过8次博弈之后达到纳什均衡。图5中四个主用户设定初值分别为0.25MHz、0.55MHz、0.85MHz、1.15MHz,经过20次博弈之后达到纳什均衡。图6中六个主用户设定初值分别为0.25MHz、0.55MHz、0.85MHz、1.15MHz、0.5MHz、1.0MHz,经过30次博弈之后达到纳什均衡。主用户越多,博弈达到均衡需要的博弈次数越多。但因为信号传输时间非常短,所以总的博弈时间仍然非常短。
[0105] 考虑主用户的数量从2个到20个变化,对其纳什均衡时得到的出租频谱总量进行仿真如图7所示。从图7可以看出,古诺模型算法出租的频谱总量要远大于平均分配算法。对于平均分配算法,出租频谱总量随着主用户数量增多变化不大;而对于古诺模型算法,随着主用户数量的增加出租频谱总量出现曲线型增加的趋势,但在主用户数量在20附近,出租频谱总量开始变得稳定,增加的趋势不明显。同时可以看出,无论是古诺模型算法还是平均分配算法,当信噪比变大时主用户出租频谱总量都同时增加。
[0106] 从图8可以看出,对于平均分配算法,频谱博弈值比较稳定,对于古诺模型算法,随着主用户数量的增加,出租频谱的博弈值有明显的下降,在主用户数量在20附近开始趋向平稳。古诺模型算法与平均分配算法相比,出租频谱的博弈值明显较低,次用户租借频谱的意愿也会更加强烈。
[0107] 对于实施例2的斯坦科尔伯格模型,单次博弈过程的算法求解过程为:
[0108] 步骤1:设定初值Wi=20,Mi=5,BERtar=10-4, w=2,γ=15.4db。
[0109] 步骤2:设m为先采取策略的主用户的个数,n为后采取策略的主用户的个数,求解后采取策略的主用户i的策略值bi;
[0110] 此时已知先采取策略的主用户j的策略值Bj,设其总和为 按照古诺模型算法求解方法求解可得:
[0111]
[0112] 步骤3:求解先采取策略的主用户的策略值,将初值和 代入到公式(8)中(其中n为后采取策略的主用户的个数),按照古诺模型算法求解方法求解可求出Bi的值,再由式(10)得到bi的值,至此求解完成。
[0113] 同样通过各种仿真情况的对比图来说明实施例2的斯坦科尔伯格模型算法的效果,随意设定两个先采取策略的主用户和两个后采取策略的主用户第一次采取策略的值,可得到其博弈达到均衡的过程如图9所示。在图9中设定先采取策略的两个主用户的初值分别为0.45MHz和0.55MHz,后采取策略的两个主用户的初值分别为0.75MHz和1.25MHz。从图中可以看出,四个主用户经过8次博弈之后达到稳定状态。在稳定状态时,先采取策略的主用户的策略值要大于后采取策略的主用户的值,体现了斯坦科尔伯格模型算法中的先动优势。
[0114] 图10是六个主用户的博弈过程。设定先采取策略的三个主用户的初值分别为0.75MHz、1.25MHz和1.5MHz,后采取策略的三个主用户的初值分别为0.55MHz、0.45MHz和
0.7MHz。从图中可以看出,六个主用户经过20次博弈之后达到稳定状态,与四个主用户相比说明:主用户数量越多,达到纳什均衡的稳定状态需要的博弈次数越多。在稳定状态时,先采取策略的主用户的策略值要大于后采取策略的主用户的值,体现了斯坦科尔伯格模型算法中的先动优势。
[0115] 最后,考虑主用户的数量从2个到20个变化,同时对三种算法纳什均衡时得到的出租频谱总量进行仿真比较如图11和图12所示。在图11中SNR=15.4dB,Stackelberg1(斯坦科尔伯格模型1)设定先采取策略的主用户个数为1,后采取策略的主用户的个数由1增加到19;Stackelberg2(斯坦科尔伯格模型2)设定后采取策略的主用户个数为1,先采取策略的主用户的个数由1增加到19。从图11可以看出,古诺模型算法和斯坦科尔伯格模型算法出租的频谱总量要远大于平均分配算法。
[0116] 在图12中SNR=11dB,同样表明古诺模型算法和斯坦科尔伯格模型算法出租的频谱数量要远大于平均分配算法。将图5-10与图5-9相比较可以看出,信噪比从15.4dB变为11dB时,三种算法的出租频谱总量都相应的减少。
[0117] 图13为三种算法的出租频谱博弈值比较图。可以看出,对于平均分配算法,频谱博弈值比较稳定,对于古诺模型算法和斯坦科尔伯格模型算法,随着主用户数量的增加,出租频谱的博弈值有明显的下降,在主用户数量在20附近开始趋向平稳。后两种算法与平均分配算法相比,出租频谱的博弈值明显较低,次用户租借频谱的意愿也会更加强烈。同时斯坦科尔伯格模型算法的频谱博弈值要比古诺模型算法的频谱博弈值低,体现了斯坦科尔伯格模型算法的优势。
[0118] 图14为三种算法单个主用户的效用比较。可以看出,三种算法单个主用户的效用不相上下。对于斯坦科尔伯格模型算法,先采取策略的主用户的效用比后采取策略的主用户的效用要大。
[0119] 从以上仿真结果可以看出,古诺模型算法和斯坦科尔伯格模型算法相比平均分配算法,均能显著提高频谱利用率,仿真结果验证了该理论分析结论。
[0120] 具体地,相对于现有技术,古诺模型算法和斯坦科尔伯格模型算法的频谱博弈值要远低于平均算法的频谱博弈值,因而本发明的频谱分配方法的次用户租借频谱的意愿也要比平均算法的次用户更加强烈,体现了古诺模型算法和斯坦科尔伯格模型算法的优势。对于古诺模型算法和斯坦科尔伯格模型算法,系统中主用户的个数增大,博弈达到纳什均衡需要的博弈次数越多,但整体数量级比较低,博弈消耗时间非常短。
[0121] 此外,在斯坦科尔伯格模型算法中,先采取策略的主用户与后采取策略的主用户相比,出租的频谱总量更多,单个主用户的效用更大,体现了先动优势。
[0122] 更进一步地,斯坦科尔伯格模型算法与古诺模型算法相比,前者出租的频谱总量更大,但两种模型适用的场景不同。古诺模型算法适用于各主用户没有延迟,同时采取策略;斯坦科尔伯格模型算法适用于主用户采取策略的时间存在先后顺序的场景。至于何时采取古诺模型算法,何时采取斯坦科尔伯格模型算法则由实际情况决定。
[0123] 对不同信噪比的情况进行仿真显示,信噪比越大,各算法出租频谱总数都越大,但算法之间的优劣相同。
[0124] 以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的发明保护范围应由权利要求限定。

当前第1页 第1页 第2页 第3页