本发明涉及数据处理技术,更具体的说,是涉及o-ran系统中的基于联邦学习的人工智能模型处理方法和装置。
背景技术:
o-ran的全称是开放的无线接入网络,其意指在于设计和开发开放式的、智能化的无线接入设备。在o-ran系统中,能体现智能化的功能主要有2个模块:非实时无线接入网智能控制器(nonrealtimeradiointelligentcontroller,non-rtric;也可称为非实时ric)和近实时无线接入网智能控制器(nearrealtimeradiointelligentcontroller,near-rtric;也可称为近实时ric)。其中:
非实时ric和近实时ric具有智能化的特点,可以利用人工智能技术进行预测、推理等服务;
联邦学习的原理是进行局部训练,将局部训练的模型参数在中心节点进行合并。这样可以最大可能地优化人工智能模型的性能;
目前,在o-ran标准化组织中,关于非实时ric和近实时ric的讨论没有涉及联邦学习的课题,无相关公开的技术资料。
技术实现要素:
有鉴于此,本发明提供如下技术方案:
1.一种o-ran系统中的基于联邦学习的人工智能模型处理方法,应用于o-ran系统中的智能处理单元,其特征包括:
非实时智能处理单元请求实时智能处理单元对特定应用在本地进行学习,然后反馈学习后的人工智能模型参数以及学习后的性能统计结果;
非实时智能处理单元将自己评估的性能和实时智能处理单元反馈的性能进行比对,基于性能差值的最大比算法和反馈时延对模型参数进行合并;
非实时智能处理单元将合并后的模型参数传输给实时智能处理单元,进行实时推理应用。
2.根据权利要求1所述的性能统计包括以下量纲之一或者任意组合:
时延,吞吐量,可靠性,连接密度,业务体验满意度。
3.根据权利要求1所述的特定应用,包括:
波束优化、负载均衡、业务体验水平、无线资源管理。
4.根据权利要求1所述的基于性能差值的最大比算法,包括:按照实时智能处理单元反馈的性能和非实时智能处理单元评估的性能的差值,确定合并的权重,差值越大,合并的权重越大。
5.根据权利要求1所述的反馈时延,包括:如果模型反馈的时延大于特定门限,不合并此模型参数。
6.根据权利要求1所述的在本地进行学习,包括:
利用本地采集的数据进行加强学习。
7.根据权利要求1所述的智能处理单元为利用人工智能技术处理数据的单元,包括o-ran定义的非实时ric和近实时ric。
8.一种o-ran系统中的基于联邦学习的人工智能模型处理装置,应用于o-ran系统中的智能处理单元,其特征包括:
非实时智能处理单元请求实时智能处理单元对特定应用在本地进行学习,然后反馈学习后的人工智能模型参数以及学习后的性能统计结果;
非实时智能处理单元将自己评估的性能和实时智能处理单元反馈的性能进行比对,基于性能差值的最大比算法和反馈时延对模型参数进行合并;
非实时智能处理单元将合并后的模型参数传输给实时智能处理单元,进行实时推理应用。
9.根据权利要求8所述的性能统计包括以下量纲之一或者任意组合:
时延,吞吐量,可靠性,连接密度,业务体验满意度。
10.根据权利要求8所述的特定应用,包括:
波束优化、负载均衡、业务体验水平、无线资源管理。
11.根据权利要求8所述的基于性能差值的最大比算法,包括:按照实时智能处理单元反馈的性能和非实时智能处理单元评估的性能的差值,确定合并的权重,差值越大,合并的权重越大。
12.根据权利要求8所述的反馈时延,包括:如果模型反馈的时延大于特定门限,不合并此模型参数。
13.根据权利要求8所述的在本地进行学习,包括:
利用本地采集的数据进行加强学习。
14.根据权利要求8所述的智能处理单元为利用人工智能技术处理数据的单元,包括o-ran定义的非实时ric和近实时ric。
经由上述技术方案可知,与现有技术相比,本发明实施例公开了一种o-ran系统中基于联邦学习的人工智能模型处理方法和装置,方法包括:
基于人工智能模型的性能,非实时智能处理单元针对特定应用触发联邦学习模式,包括以下几个步骤:
1)非实时智能处理单元请求实时智能处理单元对特定应用在本地进行学习,然后反馈学习后的模型参数以及学习后的性能统计;
2)非实时智能处理单元进行性能比对,基于性能差值的最大比算法和模型的反馈时延对模型参数进行合并;
3)非实时智能处理单元将合并后的模型参数传输给实时智能处理单元,进行实时推理应用;
4)重复上述过程直到非实时智能处理单元判断人工智能模型的性能达到目标。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种o-ran系统中基于联邦学习的人工智能模型处理方法流程图;
图2为本发明实施例公开的基于联邦学习的人工智能模型的架构图和利用最大比和时延进行模型参数合并的示意图;
图3为本发明实施例公开的一种o-ran系统中基于联邦学习的人工智能模型处理装置的结构示意图(应用于近实时ric);
图4为本发明实施例公开的一种o-ran系统中基于联邦学习的人工智能模型处理装置的结构示意图(应用于非实时ric)。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例公开的一种o-ran系统中基于联邦学习的人工智能模型处理方法流程图,图1所示方法应用于o-ran系统中的无线智能控制单元,例如ric。在此实施例中,非实时ric作为中心节点,近实时ric作为局部节点。由于安全性或者处理能力的限制,非实时ric没有全局的训练数据或者没有能力进行全局的训练。使用联邦学习可以逼近模型训练的全局最优,提高模型应用的性能。参见图1所示,该方法可以包括:
步骤101:非实时智能处理单元评估人工智能模型对特定应用的性能;
其中,所述智能处理单元可以为o-ran系统中已有的,或未来可能出现的智能单元,该智能单元可以是利用人工智能技术实时地处理数据的单元,为o-ran系统中定义的具备智能功能的单元,例如ric(radiointelligencecontroller,无线智能控制器)等;
步骤102:非实时智能处理单元请求实时智能处理单元进行本地学习,然后反馈学习后的模型参数和性能统计结果;
步骤103:基于性能差值的最大比算法和模型的反馈时延,非实时智能处理单元进行模型参数的合并;
所述性能差值的最大比算法,包括根据性能差值,差值越大,合并的权重越大;
所述模型的反馈时延,包括进行合并的模型参数反馈时延必须要小于或者等于特定门限。此门限可以通过信令配置,或者预先设置;
步骤104:非实时智能处理单元将合并后的模型参数传输给实时智能处理单元,进行实时推理应用。
本实施例所述的o-ran系统中基于联邦学习的人工智能模型处理方法,主要基于人工智能模型的性能,由非实时智能处理单元针对特定应用触发联邦学习模式,包括以下几个步骤:
1)非实时智能处理单元请求实时智能处理单元对特定应用在本地进行学习,然后反馈学习后的模型参数以及学习后的性能统计结果;
2)非实时智能处理单元进行性能比对,基于性能差值的最大比算法和模型的反馈时延对模型参数进行合并;
3)非实时智能处理单元将合并后的模型参数传输给实时智能处理单元,进行实时推理应用;
4)重复上述过程直到非实时智能处理单元判断人工智能模型的性能达到目标。
通过上述操作,可以最大程度优化o-ran系统的性能,并且排除由于反馈不及时导致的性能下降问题。上述实施例中,以近实时ric/非实时ric作为实时智能处理单元/非实时智能处理单元的一个例子,非实时ric基于采集的无线参数评估人工模型的性能,如果性能较差(例如小于特定门限),将触发联邦学习模式。具体步骤参照以上描述。
图2为本发明实施例公开的基于联邦学习的人工智能模型的架构图和利用最大比和时延进行模型参数合并的示意图,结合图2所示,非实时ric与三个近实时ric(x1,x2,x3)进行通信,x1/x2/x3与各自的无线通信单元例如cu/du/ru(集中式处理单元/分布式处理单元/射频单元)通信。非实时ric采集无线通信单元的数据,然后通过分析无线网络性能判断x1/x2/x3中人工智能模型的性能。如果性能较差,例如吞吐量小于某个门限,非实时ric将启动联邦学习模式。详细过程如下所示:
1)非实时ric向近实时ric发送联邦学习请求;
2)收到请求后,近实时ric在本地进行学习。并且向非实时ric反馈训练好的模型参数和最新的性能统计结果;
3)非实时ric根据性能差别和时延合并模型参数。例如针对x1,计算的性能差别为b1=(z1-z1’),针对x2,计算的性能差别为b2=(z2-z2’),针对x3,计算的性能差别为b3=(z3-z3’)。其中z1/z2/z3为近实时ric反馈的性能,z1’/z2’/z3’为非实时ric自己评估的性能。模型参数合并的公式为:
m=b1/(b1 b2 b3)×y1 b2/(b1 b2 b3)×y2 b3/(b1 b2 b3)×y3;
如果将模型参数合并的时延门限设为30ms,非实时ric的模型参数合并公式为m=b1/(b1 b2 b3)×y1 b2/(b1 b2 b3)×y2;其中模型参数y3由于时延太大,不进行合并;
如果将模型参数合并的时延门限设为15ms,非实时ric的模型参数合并公式将为m=b1/(b1 b2 b3)×y1;其中模型参数y2和y3由于时延太大,不进行合并;
4)非实时ric将合并后的模型参数部署给近实时ric,近实时ric利用新部署的模型进行推理应用;
5)重复上述过程直到非实时ric检测到模型的性能达到特定目标。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
上述本发明公开的实施例中详细描述了方法,对于本发明的方法可采用多种形式的装置实现,因此本发明还公开了一种装置,下面给出具体的实施例进行详细说明。
图3为本发明实施例公开的一种o-ran系统中的基于联邦学习的人工智能模型处理装置的结构示意图,本装置可应用于o-ran系统中的近实时ric。
参见图3所示,o-ran系统中的人工智能模型处理装置30可以包括:
数据接收模块301,用于接收来自不同无线通信单元、非实时智能控制单元的数据或者信令;
信息获取模块302,用于基于数据接收模块301采集的数据获取无线网络性能、信令信息;
数据确定模块303,用于本地训练、推理,确定发送给非实时智能控制单元的状态信令内容以及相关的操作;
操作执行模块304,用于依据模块303的决定执行相应的操作。
图4为本发明实施例公开的一种o-ran系统中的基于联邦学习的人工智能模型处理装置的结构示意图,本装置可应用于o-ran系统中的非实时ric。
参见图4所示,o-ran系统中的人工智能模型处理装置40可以包括:
数据接收模块401,用于接收来自不同无线通信单元、近实时智能控制单元的数据或者信令;
信息获取模块402,用于基于数据接收模块401采集的数据获取无线网络性能、信令信息;
数据确定模块403,用于评估近实时智能单元的无线性能,决定是否启动联邦学习,并且将近实时智能单元反馈的模型参数进行合并,确定发送给近实时智能处理单元的状态信令内容以及相关的操作;
操作执行模块404,用于依据模块403的决定执行相应的操作。
本实施例所述的一种o-ran系统中基于联邦学习的人工智能模型处理方法和装置,方法包括:基于人工智能模型的性能,非实时智能处理单元针对特定应用触发联邦学习模式,包括以下几个步骤:
1)非实时智能处理单元请求实时智能处理单元对特定应用在本地进行学习,然后反馈学习后的模型参数以及学习后的性能统计结果;
2)非实时智能处理单元进行性能比对,基于性能差值的最大比算法和模型的反馈时延对模型参数进行合并;
3)非实时智能处理单元将合并后的模型参数传输给实时智能处理单元,进行实时推理应用;
重复上述过程直到非实时智能处理单元判断人工智能模型的性能达到目标。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
1.一种o-ran系统中的基于联邦学习的人工智能模型处理方法,应用于o-ran系统中的智能处理单元,其特征包括:
非实时智能处理单元请求实时智能处理单元对特定应用在本地进行学习,然后反馈学习后的人工智能模型参数以及学习后的性能统计结果;
非实时智能处理单元将自己评估的性能和实时智能处理单元反馈的性能进行比对,基于性能差值的最大比算法和反馈时延对模型参数进行合并;
非实时智能处理单元将合并后的模型参数传输给实时智能处理单元,进行实时推理应用。
2.根据权利要求1所诉的性能统计包括以下量纲之一或者任意组合:
时延,吞吐量,可靠性,连接密度,业务体验满意度。
3.根据权利要求1所述的特定应用,包括:
波束优化、负载均衡、业务体验水平、无线资源管理。
4.根据权利要求1所述的基于性能差值的最大比算法,包括:按照实时智能处理单元反馈的性能和非实时智能处理单元评估的性能的差值,确定合并的权重,差值越大,合并的权重越大。
5.根据权利要求1所述的反馈时延,包括:如果模型反馈的时延大于特定门限,不合并此模型参数。
6.根据权利要求1所述的在本地进行学习,包括:
利用本地采集的数据进行加强学习。
7.根据权利要求1所述的智能处理单元为利用人工智能技术处理数据的单元,包括o-ran定义的非实时ric和近实时ric。
8.一种o-ran系统中的基于联邦学习的人工智能模型处理装置,应用于o-ran系统中的智能处理单元,其特征包括:
非实时智能处理单元请求实时智能处理单元对特定应用在本地进行学习,然后反馈学习后的人工智能模型参数以及学习后的性能统计结果;
非实时智能处理单元将自己评估的性能和实时智能处理单元反馈的性能进行比对,基于性能差值的最大比算法和反馈时延对模型参数进行合并;
非实时智能处理单元将合并后的模型参数传输给实时智能处理单元,进行实时推理应用。
9.根据权利要求8所述的性能统计包括以下量纲之一或者任意组合:
时延,吞吐量,可靠性,连接密度,业务体验满意度。
10.根据权利要求8所述的特定应用,包括:
波束优化、负载均衡、业务体验水平、无线资源管理。
技术总结