本发明涉及认知无线电网络干扰管理以及资源分配控制技术领域,特别是指一种非完美感知的认知网络基于斯塔克伯格博弈资源分配方法。
背景技术:
为了满足无线移动用户对高速率通信需求不断增长,物联网作为5g移动通信的关键技术能够连接海量移动设备及移动终端,这将导致频谱资源的急剧匮乏。认知无线电网络能够智能感知、接入授权频段、提高频谱利用率,已成为物联网的先进技术。
在认知无线电网络中,多个异构的认知用户采用动态频谱接入技术共享授权频段资源,但认知用户的传输必将对主用户产生干扰,如何分配认知用户的频谱使用机会以及控制认知用户与主用户之间的干扰成为了目前认知无线电网络亟待解决的问题。将博弈论思想引入到认知无线电网络中实现资源的有效控制成为了目前提高认知网络稳定性和性能的重要途径之一。
近年来,将博弈论的经济学理论应用于认知无线电系统的研究有很多。由于认知网络中多个认知用户在频谱接入以及频谱分配方面存在竞争关系,目前已有研究将认知用户的频谱分配和功率控制建模成合作博弈和非协作博弈问题。以上研究通过合作博弈和非协作博弈过程,解决了高能效认知用户功率传输以及多载波频谱分配等问题,具有很高的实用价值。但是这些研究并没有考虑到现实情况中主用户不可能无条件允许认知用户使用授权频段的问题。为了克服这个问题,已有研究斯塔克伯格博弈应用于认知无线电网络,从主用户和认知用户双方利益角度出发研究频谱使用和功率控制技术。但是大多数研究并没有考虑非完美感知条件下认知用户对于主用户的干扰限制。其次大多数研究并没有考虑在非完美感知条件下,主用户根据每个认知用户的信道状态而制定单一认知用户非统一干扰价格策略。
技术实现要素:
针对上述背景技术中存在的不足,本发明提出了一种非完美感知的认知网络基于斯塔克伯格博弈资源分配方法,解决了现有技术中没有考虑非完美感知条件造成整个网络需求效用低下的技术问题。
本发明的技术方案是这样实现的:
一种非完美感知的认知网络基于斯塔克伯格博弈资源分配方法,其步骤如下:
s1、构建基于非完美感知的认知无线电网络,其中,认知无线电网络包括授权网络和认知网络,授权网络包括一个主基站和k个主用户,认知网络包括n对认知用户传输对,认知用户传输对包括认知用户传输端和认知用户接收端,所述主基站通过授权频段与主用户相通信,n个认知用户传输端通过动态频谱接入方式共享授权频段;
s2、构建基于非完美感知的频谱共享模型的认知用户传输机制,认知用户传输机制包括感知时隙和数据传输时隙,在感知时隙内,n个认知用户传输端协作感知主基站的活动状态,在数据传输时隙内,n个认知用户传输端分别根据主基站的活动状态竞争使用授权频段;其中,主基站的活动状态包括空闲和繁忙,空闲时认知用户传输端采用高功率传输,繁忙时认知用户传输端采用低功率传输;
s3、构建基于斯塔克伯格博弈模型的认知无线电网络资源分配优化的数学模型,其中,斯塔克伯格博弈模型是以基于非完美感知的干扰功率价格为博弈对象,主基站为主导者发布干扰功率价格且获取干扰收益,n个认知用户传输端作为从属者竞争使用授权频段且支付传输干扰费用;
s4、构建主基站的收益效用函数和认知用户的效用函数,并利用斯塔克伯格博弈算法分别对主基站的收益效用函数和认知用户的效用函数进行博弈分析,获得斯塔克伯格博弈模型的纳什均衡点;其中,纳什均衡点包括主基站的最优干扰价格和认知用户的最大传输功率;
s5、根据不同信道状态下认知用户的传输效益的公平性,制定单一认知用户的非统一干扰功率价格策略。
所述步骤s4中主基站的收益效用函数为:
其中,upu(li)为主基站的收益效用函数,
所述认知用户的效用函数为:
其中,
所述检测概率pd为:
其中,
其中,
利用斯塔克伯格博弈算法分别对主基站的收益效用函数和认知用户的效用函数进行博弈分析的方法为:
s41、设置干扰功率限制条件:
s42、设置传输功率限制条件:
s43、在干扰功率限制和传输功率限制条件下最大化认知用户的效用函数;
s43.1、将第i个认知用户的效用函数转化为最大化效用函数:
s43.2、设置感知时间为
其中,λ0、λ1均为拉格朗日对偶变量,
s43.3、利用拉格朗日乘子法对步骤s43.2进行求解,得出最优传输功率
其中,α0=p0(1-pf)为授权频段空闲下认知用户错误感知到主基站活跃的概率,p0为授权频段空闲概率,α1=p0-α0为授权频段空闲下认知用户正确感知到主基站空闲的概率,σn为噪声方差,gi,i为第i个认知用户传输对之间的信道增益;
s44、在干扰功率限制下最大化主基站的收益效用函数;
s44.1、将主基站的收益效用函数转化最大化收益效用函数为:
其中,li≥0;
s44.2、根据最优传输功率
干扰功率限制条件转化为:
s44.3、利用拉格朗日对偶算法对主基站的收益效用函数进行优化:
其中,λ、μi均为拉格朗日对偶变量;
s44.4、利用拉格朗日乘子法对步骤s44.3进行求解,得出主基站的最优干扰价格:
所述斯塔克伯格博弈模型的纳什均衡点为:
所述最优的收益效用函数和最优的效用函数均满足:
其中,
所述步骤s5中制定单一认知用户的非统一干扰功率价格策略的方法为:
s51、将n个认知用户的信道状况按φ1>...>φi>...>φn的顺序进行排序,其中,φi=ηigi,i/hsp,i,i∈{1,...,n},ηi表示第i个认知用户单位传输速率的收益,gi,i为第i个认知用户传输对之间的信道增益,hsp,i为第i个认知用户与主基站之间的信道增益;
s52、根据步骤s51中n个认知用户的信道状况,制定单一认知用户非统一干扰功率价格:
其中,
本技术方案能产生的有益效果:从无线通信网络实际情况出发,考虑到信道衰落以及现有技术条件不可能做到完美感知,本发明着重研究非完美感知认知无线电网络中认知用户的频谱分配以及功率传输方法;以基于感知的干扰功率价格为博弈对象,将主基站和多个认知用户的实际效用收益进行斯塔克伯格博弈建模;在非完美感知条件下进一步根据每个认知用户的信道状态,制定多个认知用户统一干扰功率价格策略以及单一认知用户非统一干扰价格策略,提高了整个网络的需求效用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的系统模型图;
图2为基于感知的频谱共享模型和机会接入模型在不同频谱使用概率以及干扰功率限制门限值下的主基站的收益对比图;
图3为基于统一干扰功率价格策略和单一认知用户非统一干扰价格策略下的主基站的收益对比图;
图4为基于感知的频谱共享模型和机会接入模型在不同频谱使用概率以及干扰功率限制门限值下的认知用户的传输效益对比图;
图5为基于统一干扰功率价格策略和单一认知用户非统一干扰价格策略下的认知用户的传输效益对比图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种非完美感知的认知网络基于斯塔克伯格博弈资源分配方法,具体步骤如下:
s1、构建基于非完美感知的认知无线电网络,其中,认知无线电网络包括授权网络和认知网络,授权网络包括一个主基站(basestation,bs)和k个主用户(primaryuser,pu),认知网络包括n对认知用户(secondaryuser,su)传输对,认知用户传输对包括认知用户传输端和认知用户接收端,所述主基站通过授权频段与主用户相通信,n个认知用户传输端通过动态频谱接入方式共享授权频段。
s2、构建基于非完美感知的频谱共享模型的认知用户传输机制,认知用户传输机制包括感知时隙τ和数据传输时隙t-τ,在感知时隙τ内,n个认知用户传输端协作感知主基站的活动状态,在数据传输时隙t-τ内,n个认知用户传输端分别根据主基站的活动状态竞争使用授权频段,在主基站允许情况下接入授权频段;其中,主基站的活动状态包括空闲和繁忙,空闲时认知用户传输端采用高功率传输,繁忙时认知用户传输端采用低功率传输。
当主基站不使用授权频段时,认知用户只接收到噪声信号;当主基站使用授权频段时,认知用户同时接收到主基站信号和噪声信号。将n个认知用户接受信号进行最大比合并,通过能量采集和融合判决得出检测概率和虚警概率:
其中,
s3、构建基于斯塔克伯格博弈模型的认知无线电网络资源分配优化的数学模型,其中,斯塔克伯格博弈模型是以基于非完美感知的干扰功率价格为博弈对象,主基站为主导者发布干扰功率价格且获取干扰收益,n个认知用户传输端作为从属者竞争使用授权频段且支付传输干扰费用
s4、构建主基站的收益效用函数和认知用户的效用函数,并利用斯塔克伯格博弈算法分别对主基站的收益效用函数和认知用户的效用函数进行博弈分析,获得斯塔克伯格博弈模型的纳什均衡点;其中,纳什均衡点包括主基站的最优干扰价格和认知用户的最大传输功率。
由于频谱感知技术的局限性以及多径衰落、阴影效应等不可避免的因素,认知用户不能做到完美感知。当授权频段空闲时,认知用户错误感知到主基站工作(虚警),相应的概率为α0=p0(1-pf),其中,p0表示授权频段空闲概率,第i个认知用户的传输速率为:
当主基站工作时,认知用户在数据传输时隙内会对主基站产生干扰,为了保护主基站的通信质量,对n个认知用户传输端采用干扰功率限制;对于第i个认知用户,认知用户根据感知结果调节传输功率获得传输速率收益,同时需要向主基站支付干扰费用,因此,认知用户的效用函数为:
其中,
针对主基站来说,多个认知用户向主基站缴纳干扰费用,因此,主基站的收益效用函数为:
其中,upu(li)为主基站的收益效用函数,
利用斯塔克伯格博弈算法分别对主基站的收益效用函数和认知用户的效用函数进行博弈分析,获得斯塔克伯格博弈模型的纳什均衡点的方法为:
s41、设置干扰功率限制条件:
s42、设置传输功率限制条件:
s43、在干扰功率限制和传输功率限制条件下最大化认知用户的效用函数;
s43.1、将第i个认知用户的效用函数转化为最大化效用函数:
s43.2、设置感知时间为
其中,λ0、λ1均为拉格朗日对偶变量,
s43.3、利用拉格朗日乘子法对步骤s43.2进行求解,以求得带约束条件目标函数的极值问题,得出最优传输功率
其中,α0=p0(1-pf)为授权频段空闲下认知用户错误感知到主基站活跃的概率,p0为主基站空闲概率,α1=p0-α0为授权频段空闲下认知用户正确感知到主基站空闲的概率,σn为噪声方差,gi,i为第i个认知用户传输对之间的信道增益,即第i个认知用户传输端与第i个认知用户接收端之间的信道增益。
s44、在干扰功率限制下最大化主基站的收益效用函数;
s44.1、将主基站的收益效用函数转化最大化收益效用函数为:
其中,li≥0;
s44.2、根据最优传输功率
干扰功率限制条件转化为:
s44.3、利用拉格朗日对偶算法对主基站的收益效用函数进行优化:
其中,λ、μi均为拉格朗日对偶变量;
s44.4、利用拉格朗日乘子法对步骤s44.3进行求解,以求得带约束条件目标函数的极值问题,得出主基站的最优干扰价格:
主基站的最优干扰价格即为主基站在获得最大化收益时对n个认知用户制定的统一干扰功率价格。
因此,斯塔克伯格博弈模型的纳什均衡点为:
其中,
s5、根据不同信道状态下认知用户的传输效益的公平性,制定单一认知用户的非统一干扰功率价格策略,具体方法为:
s51、将n个认知用户的信道状况按φ1>...>φi>...>φn的顺序进行排序,其中,φi=ηigi,i/hsp,i,i∈{1,...,n},ηi表示第i个认知用户单位传输速率的收益,gi,i为第i个认知用户传输对之间的信道增益,即第i个认知用户传输端与第i个认知用户接收端之间的信道增益,hsp,i为第i个认知用户与主基站之间的信道增益;
s52、根据步骤s51中n个认知用户的信道状况,制定单一认知用户非统一干扰功率价格:
其中,
图2给出了基于感知的频谱共享模型和机会频谱接入模型在非统一干扰功率价格策略下,授权网络的干扰传输效益与干扰功率门限值的关系图。其中,在主网络中授权频段空闲概率p0分别设为p(h0)=0.8和p(h0)=0.6。由图2可知,当主基站能接受的干扰功率门限值越大,授权网络的总体收益将会越高。同时当授权频段的空闲概率越高,授权网络的总体收益也将会增高。这是因为相对于空闲概率为0.6时,当空闲概率为0.8时认知用户将会有更多的无干扰功率费用的传输机会接入授权频谱。在同一干扰功率门限值和授权频段空闲概率情况下,基于感知的频谱共享模型中授权网络的收益将大于机会频谱接入模型的收益。充分表明基于感知的频谱共享模型将拥有更加灵活的传输机制。
图3给出了在非统一干扰功率价格传输策略和统一干扰功率价格传输策略下,在基于感知的频谱共享模型中,授权网络的干扰传输效益与干扰功率门限值的关系图。从实际出发将授权频段空闲概率设为0.6。由图3可以看出,当干扰功率门限值较小时,授权网络在非统一和统一干扰功率价格策略下的收益几乎相同。这是因为主基站所能接受的认知用户传输干扰值越低,允许使用授权频段的认知用户个数将会越少。而当干扰功率门限值增大时,非统一干扰功率价格传输策略下授权网络的收益将大于统一扰功率价格传输策略下的收益。充分表明非统一干扰功率价格传输策略对于授权网络效益具有优越性。
图4给出了基于感知的频谱共享模型和机会频谱接入模型在非统一干扰功率价格策略下,认知用户总传输效益与干扰功率门限值的关系对比图。其中,在主网络中授权频段空闲概率p0分别设为p(h0)=0.8和p(h0)=0.6。由图4可知,当主基站所允许的干扰功率门限值越大,认知用户的总传输效益将会越高。同时当授权频段的空闲概率从0.6增加到0.8时,认知用户的总传输效益明显增长。这是因为认知用户不需要向主基站支付干扰费用的传输机会将随着空闲概率的增加而增大,而这将大大降低认知用户的传输成本。当干扰功率门限值非常小时,在基于感知的频谱共享模型和机会频谱接入模型下认知用户总传输效益基本相同,这将充分表明授权网络的干扰功率限制将是制约认知用户传输效益的关键因素。
图5给出了在非统一干扰功率价格传输策略和统一干扰功率价格传输策略下,在基于感知的频谱共享模型中,认知用户总传输效益与干扰功率门限值的关系图。从实际出发,将授权频段空闲概率设为0.6。由图5可以看出,当干扰功率门限值较小时,认知用户在两种传输策略下总传输效益几乎相同。这是因为主基站对于认知用户的干扰要求越严格,符合信道传输条件的认知用户将会越少。而当干扰功率门限值增大时,非统一干扰功率价格传输策略下认知用户总传输效益将小于统一扰功率价格传输策略下的收益。充分表明在非统一干扰功率价格传输策略中将会有更多的认知用户需要支付更多的干扰功率费用。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
1.一种非完美感知的认知网络基于斯塔克伯格博弈资源分配方法,其特征在于,其步骤如下:
s1、构建基于非完美感知的认知无线电网络,其中,认知无线电网络包括授权网络和认知网络,授权网络包括一个主基站和k个主用户,认知网络包括n对认知用户传输对,认知用户传输对包括认知用户传输端和认知用户接收端,所述主基站通过授权频段与主用户相通信,n个认知用户传输端通过动态频谱接入方式共享授权频段;
s2、构建基于非完美感知的频谱共享模型的认知用户传输机制,认知用户传输机制包括感知时隙和数据传输时隙,在感知时隙内,n个认知用户传输端协作感知主基站的活动状态,在数据传输时隙内,n个认知用户传输端分别根据主基站的活动状态竞争使用授权频段;其中,主基站的活动状态包括空闲和繁忙,空闲时认知用户传输端采用高功率传输,繁忙时认知用户传输端采用低功率传输;
s3、构建基于斯塔克伯格博弈模型的认知无线电网络资源分配优化的数学模型,其中,斯塔克伯格博弈模型是以基于非完美感知的干扰功率价格为博弈对象,主基站为主导者发布干扰功率价格且获取干扰收益,n个认知用户传输端作为从属者竞争使用授权频段且支付传输干扰费用;
s4、构建主基站的收益效用函数和认知用户的效用函数,并利用斯塔克伯格博弈算法分别对主基站的收益效用函数和认知用户的效用函数进行博弈分析,获得斯塔克伯格博弈模型的纳什均衡点;其中,纳什均衡点包括主基站的最优干扰价格和认知用户的最大传输功率;
s5、根据不同信道状态下认知用户的传输效益的公平性,制定单一认知用户的非统一干扰功率价格策略。
2.根据权利要求1所述的非完美感知的认知网络基于斯塔克伯格博弈资源分配方法,其特征在于,所述步骤s4中主基站的收益效用函数为:
其中,upu(li)为主基站的收益效用函数,γ=(t-τ)/t,τ为感知时隙,t-τ为数据传输时隙,li为第i个认知用户向主基站支付的单位干扰功率价格,β0=p1(1-pd)为授权频段活跃下认知用户错误感知到主基站空闲的概率,β1=p1-β0为授权频段活跃下认知用户正确感知到主基站活跃的概率,p1为授权频段活跃概率,pd为认知用户的检测概率,hsp,i为第i个认知用户与主基站之间的信道增益,
所述认知用户的效用函数为:
其中,
3.根据权利要求2所述的非完美感知的认知网络基于斯塔克伯格博弈资源分配方法,其特征在于,所述检测概率pd为:
其中,
其中,
4.根据权利要求1所述的非完美感知的认知网络基于斯塔克伯格博弈资源分配方法,其特征在于,利用斯塔克伯格博弈算法分别对主基站的收益效用函数和认知用户的效用函数进行博弈分析的方法为:
s41、设置干扰功率限制条件:
s42、设置传输功率限制条件:
s43、在干扰功率限制和传输功率限制条件下最大化认知用户的效用函数;
s43.1、将第i个认知用户的效用函数转化为最大化效用函数:
s43.2、设置感知时间为
其中,λ0、λ1均为拉格朗日对偶变量,
s43.3、利用拉格朗日乘子法对步骤s43.2进行求解,得出最优传输功率
其中,α0=p0(1-pf)为授权频段空闲下认知用户错误感知到主基站活跃的概率,p0为授权频段空闲概率,α1=p0-α0为授权频段空闲下认知用户正确感知到主基站空闲的概率,σn为噪声方差,gi,i为第i个认知用户传输对之间的信道增益;
s44、在干扰功率限制下最大化主基站的收益效用函数;
s44.1、将主基站的收益效用函数转化最大化收益效用函数为:
其中,li≥0;
s44.2、根据最优传输功率
干扰功率限制条件转化为:
s44.3、利用拉格朗日对偶算法对主基站的收益效用函数进行优化:
其中,λ、μi均为拉格朗日对偶变量;
s44.4、利用拉格朗日乘子法对步骤s44.3进行求解,得出主基站的最优干扰价格:
5.根据权利要求1或4所述的非完美感知的认知网络基于斯塔克伯格博弈资源分配方法,其特征在于,所述斯塔克伯格博弈模型的纳什均衡点为:
6.根据权利要求5所述的非完美感知的认知网络基于斯塔克伯格博弈资源分配方法,其特征在于,所述最优的收益效用函数和最优的效用函数均满足:
其中,
7.根据权利要求1所述的非完美感知的认知网络基于斯塔克伯格博弈资源分配方法,其特征在于,所述步骤s5中制定单一认知用户的非统一干扰功率价格策略的方法为:
s51、将n个认知用户的信道状况按φ1>...>φi>...>φn的顺序进行排序,其中,φi=ηigi,i/hsp,i,i∈{1,...,n},ηi表示第i个认知用户单位传输速率的收益,gi,i为第i个认知用户传输对之间的信道增益,hsp,i为第i个认知用户与主基站之间的信道增益;
s52、根据步骤s51中n个认知用户的信道状况,制定单一认知用户非统一干扰功率价格:
其中,