广告的预测点击率获取方法、装置、电子设备和存储介质与流程

专利2022-06-29  73


本发明实施例涉及广告技术领域,具体涉及一种广告的预测点击率获取方法、装置、电子设备和存储介质。



背景技术:

广告的点击率除了与广告素材本身做得引人入胜等原因外,最重要的因素是这支广告是否正好切中观看用户的喜好与需求。然而,目前品牌广告的点击率较低,投放广告主要依靠人工经验,广告点击率优化工作难以取得长足的进步,投放广告时依靠人工经验,针对性不强,准确率较低。可见一种优化广告点击率的方案有待被提出。



技术实现要素:

为了解决现有技术存在的至少一个问题,本发明实施例提供一种广告的预测点击率获取方法、装置、电子设备和存储介质。

第一方面,本发明实施例提出的一种广告的预测点击率获取方法,包括:

基于广告的历史数据确定用户对广告的偏好信息;

对偏好信息进行特征提取,以提取到的特征数据作为训练数据;

基于预设的算法模型对训练数据进行训练得到训练模型;

使用训练模型对广告测试数据进行预测,得到广告的预测点击率。

在一些实施例中,基于广告的历史数据确定用户对广告的偏好信息,包括:确定历史数据中的推送数据、曝光数据和点击数据,将推送数据对应的用户和曝光数据对应的用户进行关联,提取用户的特征字段;

对偏好信息进行特征提取,以提取到的特征数据作为训练数据,包括:

将曝光数据对应的用户和点击数据对应的用户进行关联,增加特征曝光数据中点击过的用户为正样本,曝光数据中未点击过的用户为负样本。

在一些实施例中,对偏好信息进行特征提取之前,还包括:

对经过关联的数据进行清洗、处理和缺失值补充。

在一些实施例中,上述方法还包括:

在对偏好信息进行特征提取之后,若偏好信息中的特征为具有有限类别的离散型特征,对离散型特征进行离散化编码;若偏好信息中的特征为连续型特征,则基于预设模型算法的类型确定是否对连续型特征进行离散化编码。

在一些实施例中,上述方法还包括:

在得到广告的预测点击率之后,使用广告的测试数据确定广告的点击率阈值;如果广告的预测点击率大于点击率阈值,则投放该广告,否则不投放该广告。

在一些实施例中,上述方法还包括:

将广告的偏好信息按比例分成训练样本信息、测试样本信息和预测样本信息,训练样本信息用于训练广告点击率预测模型,测试样本信息用于测试广告点击率预测模型;预测样本信息用于预测广告点击率。

第二方面,本发明实施例提供了一种广告的预测点击率获取装置一种的装置,包括:

确定模块:用于基于广告的历史数据确定用户对广告的偏好信息;

特征提取模块:用于对偏好信息进行特征提取,以提取到的特征数据作为训练数据;

训练模块:用于基于预设的算法模型对训练数据进行训练得到训练模型;

预测模块:用于使用训练模型对广告测试数据进行预测,得到广告的预测点击率。

在一些实施例中,上述装置中确定模块基于广告的历史数据确定用户对广告的偏好信息,包括:确定历史数据中的推送数据、曝光数据和点击数据,将推送数据对应的用户和所述曝光数据对应的用户进行关联,提取用户的特征字段;

特征提取模块对所述偏好信息进行特征提取,以提取到的特征数据作为训练数据,包括:

将曝光数据对应的用户和点击数据对应的用户进行关联,增加特征曝光数据中点击过的用户为正样本,曝光数据中未点击过的用户为负样本。

第三方面,本发明实施例提供了一种电子设备,包括:处理器和存储器;

所述处理器通过调用所述存储器存储的程序或指令,用于执行如上述广告的预测点击率获取方法的步骤。

第四方面,本发明实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储程序或指令,所述程序或指令使计算机执行上述广告的预测点击率获取方法的步骤。

本发明实施例的优点在于:基于广告的历史数据确定用户对广告的偏好信息;对偏好信息进行特征提取,以提取到的特征数据作为训练数据;基于预设的算法模型对训练数据进行训练得到训练模型;使用训练模型对广告测试数据进行预测,得到广告的预测点击率,不需要人工进行中间干预,降低人员参与的成本而且能够充分利用广告的历史数据信息,从而确定出用户对广告的偏好信息,结合训练模型对点击率进行预测,预测出的点击率可以很好的指导广告的投放,使得广告的投放更有针对性。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。

图1为本发明实施例提出的一种广告的预测点击率获取方法的流程示意图;

图2为本发明实施例提出的一种广告的预测点击率获取装置的结构示意图;

图3为本发明实施例提供的电子设备的硬件结构示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。基于所描述的本发明的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

图1为本发明实施例提出的一种广告的预测点击率获取方法的流程示意图。

第一方面,结合图1,本发明实施例提出的一种广告的预测点击率获取方法,包括:

s101:基于广告的历史数据确定用户对广告的偏好信息。

具体的,本申请实施例中的广告历史数据可以是一些用于表征广告投放效果的业务指标以及投放广告的花费,例如广告在某个投放媒体和/或某个投放终端上的推送数据、点击数据、曝光数据等,以及,在某个投放媒体和/或某个投放终端上投放广告的花费数据等,从而基于广告历史数据确定用户对广告的偏好信息,如点击量较多的确定为用户对广告的偏好信息。

s102:对偏好信息进行特征提取,以提取到的特征数据作为训练数据。

具体的,本申请实施例中的对用户对广告的偏好信息进行特征提取包括:将曝光数据对应的用户和点击数据对应的用户进行关联,增加特征曝光数据中点击过的用户为正样本,曝光数据中未点击过的用户为负样本。

s103:基于预设的算法模型对训练数据进行训练得到训练模型。

具体的,本申请实施例中于预设的算法模型对训练数据进行训练得到训练模型按照预设的算法模型进行训练得到训练模型,包括:使用逻辑回归模型和/或树模型算法对训练数据进行训练,得到训练模型,使用逻辑回归模型和/或树模型算法对训练数据进行训练,得到训练模型。

s104:使用训练模型对广告测试数据进行预测,得到广告的预测点击率。

具体的,本申请实施例中能够充分利用大量用户信息,包括推送数据、点击数据、曝光数据等,从而进一步确认偏好信息,然后结合训练模型得到广告的预测点击率,从而可以很好的指导广告的投放,使得广告的投放更有针对性。

在一些实施例中,基于广告的历史数据确定用户对广告的偏好信息,包括:确定历史数据中的推送数据、曝光数据和点击数据,将推送数据对应的用户和曝光数据对应的用户进行关联,提取用户的特征字段。

对偏好信息进行特征提取,以提取到的特征数据作为训练数据,包括:

将曝光数据对应的用户和点击数据对应的用户进行关联,增加特征曝光数据中点击过的用户为正样本,曝光数据中未点击过的用户为负样本。

具体的,本申请实施例中,通过将特征曝光数据中点击过的用户为正样本,特征曝光数据中未点击过的用户为负样本,从而能够更快的对偏好信息进行确定。

在一些实施例中,对偏好信息进行特征提取之前,还包括:

对经过关联的数据进行清洗、处理和缺失值补充。

具体的,本申请实施例中,在对偏好信息进行特征提取之前就对经过关联的数据进行清洗、处理和缺失值进行补充,提高了广告数据的准确性。

在一些实施例中,上述方法还包括:

在对偏好信息进行特征提取之后,若偏好信息中的特征为具有有限类别的离散型特征,对离散型特征进行离散化编码;若偏好信息中的特征为连续型特征,则基于预设模型算法的类型确定是否对连续型特征进行离散化编码。

具体的,本申请实施例中的有限类别特征包括设备类型、用户性别等,需要对它进行离散化编码,连续型特征:包括素材时长、视频时长,广告投放的历史统计值等。连续型特征是否需要进行离散化要根据选择的算法模型而定,例如,逻辑回归模型由于要对各维度数据进行线性组合,所以需要进行离散化处理,而使用树模型则不需要进行离散化;连续特征离散化一般采用分段离散的方法,比如广告素材时长,可以分几秒为一段进行编码。

在一些实施例中,上述方法还包括:

在得到广告的预测点击率之后,使用广告的测试数据确定广告的点击率阈值;如果广告的预测点击率大于点击率阈值,则投放该广告,否则不投放该广告。

具体的,本申请实施例中通过找到一个最佳点击率阈值,从而对每一个广告请求,通过广告点击率预测模型即可预测广告可能会被点击的概率,如果被点击的概率超过了最佳点击率阈值,则进行投放,否则不投放该广告,进一步的提升了广告投放的针对性。

在一些实施例中,上述方法还包括:

将广告的偏好信息按比例分成训练样本信息、测试样本信息和预测样本信息,训练样本信息用于训练广告点击率预测模型,测试样本信息用于测试广告点击率预测模型;预测样本信息用于预测广告点击率。

具体的,本申请实施例中通过数据训练得到的模型需要经过测试数据的验证来判断模型的好坏,在本实施例中,可以使用第一天的大部分广告历史数据训练样本信息进行模型的训练得到训练广告点击率预测模型,使用小部分数据进行模型的预测,进行点击率预测。

图2为本发明实施例提出的一种广告的预测点击率获取装置的结构示意图。

第二方面,结合图2,本发明实施例提供了一种广告的预测点击率获取装置一种的装置,包括:

确定模块201:用于基于广告的历史数据确定用户对广告的偏好信息。

具体的,本申请实施例中的广告历史数据可以是一些用于表征广告投放效果的业务指标以及投放广告的花费,例如广告在某个投放媒体和/或某个投放终端上的推送数据、点击数据、曝光数据等,以及,在某个投放媒体和/或某个投放终端上投放广告的花费数据等,从而基于广告历史数据确定用户对广告的偏好信息,如点击量较多的确定为用户对广告的偏好信息。

特征提取模块202:用于对偏好信息进行特征提取,以提取到的特征数据作为训练数据。

具体的,本申请实施例中的对用户对广告的偏好信息进行特征提取包括:将曝光数据对应的用户和点击数据对应的用户进行关联,增加特征曝光数据中点击过的用户为正样本,曝光数据中未点击过的用户为负样本。

训练模块203:用于基于预设的算法模型对训练数据进行训练得到训练模型。

具体的,本申请实施例中于预设的算法模型对训练数据进行训练得到训练模型按照预设的算法模型进行训练得到训练模型,包括:使用逻辑回归模型和/或树模型算法对训练数据进行训练,得到训练模型,使用逻辑回归模型和/或树模型算法对训练数据进行训练,得到训练模型。

预测模块204:用于使用训练模型对广告测试数据进行预测,得到广告的预测点击率。

具体的,本申请实施例中能够充分利用大量用户信息,包括推送数据、点击数据、曝光数据等,从而进一步确认偏好信息,然后结合训练模型得到广告的预测点击率,从而可以很好的指导广告的投放,使得广告的投放更有针对性。

在一些实施例中,上述装置中确定模块基于广告的历史数据确定用户对广告的偏好信息,包括:确定历史数据中的推送数据、曝光数据和点击数据,将推送数据对应的用户和所述曝光数据对应的用户进行关联,提取用户的特征字段。

特征提取模块对所述偏好信息进行特征提取,以提取到的特征数据作为训练数据,包括:

将曝光数据对应的用户和点击数据对应的用户进行关联,增加特征曝光数据中点击过的用户为正样本,曝光数据中未点击过的用户为负样本。

第三方面,本发明实施例提供了一种电子设备,包括:处理器和存储器;

所述处理器通过调用所述存储器存储的程序或指令,用于执行如上述广告的预测点击率获取方法的步骤。

第四方面,本发明实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储程序或指令,所述程序或指令使计算机执行上述广告的预测点击率获取方法的步骤。

图3为本发明实施例提供的电子设备的硬件结构示意图,如图3所示,该电子设备可以包括手机、pad的智能终端,该电子设备包括:

一个或多个处理器301,图3中以一个处理器301为例;存储器302;电子设备还可以包括:输入装置303和输出装置304。

电子设备中的处理器301、存储器302、输入装置303和输出装置304可以通过总线或者其他方式连接,图2中以通过总线连接为例。

存储器302作为一种非暂态计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的应用程序的界面显示方法对应的程序指令/模块(例如,附图2所示的确定模块201、特征提取模块202、训练模块203和预测模块模块204)。处理器301通过运行存储在存储器302中的软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的广告的预测点击率获取方法。

存储器302可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器302可以包括高速随机存取存储器,还可以包括非暂态性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态性固态存储器件。在一些实施例中,存储器302可选包括相对于处理器301远程设置的存储器,这些远程存储器可以通过网络连接至终端设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置303可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置304可包括显示屏等显示设备。

本发明实施例还提供一种包含计算机可读存储介质,该计算机可读存储介质存储程序或指令,该程序或指令使计算机执行行时用于执行一种广告的预测点击率获取方法,该方法包括:

基于广告的历史数据确定用户对广告的偏好信息;

对偏好信息进行特征提取,以提取到的特征数据作为训练数据;

基于预设的算法模型对训练数据进行训练得到训练模型;

使用训练模型对广告测试数据进行预测,得到广告的预测点击率。

可选的,该计算机可执行指令在由计算机处理器执行时还可以用于执行本发明任意实施例所提供的广告的预测点击率获取方法的技术方案。

通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、闪存(flash)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的广告的预测点击率获取方法。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。

虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。


技术特征:

1.一种广告的预测点击率获取方法,其特征在于,包括:

基于广告的历史数据确定用户对广告的偏好信息;

对所述偏好信息进行特征提取,以提取到的特征数据作为训练数据;

基于预设的算法模型对所述训练数据进行训练得到训练模型;

使用所述训练模型对广告测试数据进行预测,得到广告的预测点击率。

2.根据权利要求1所述的方法,其特征在于,所述基于广告的历史数据确定用户对广告的偏好信息,包括:确定历史数据中的推送数据、曝光数据和点击数据,将所述推送数据对应的用户和所述曝光数据对应的用户进行关联,提取用户的特征字段;

所述对所述偏好信息进行特征提取,以提取到的特征数据作为训练数据,包括:

将所述曝光数据对应的用户和所述点击数据对应的用户进行关联,增加特征曝光数据中点击过的用户为正样本,曝光数据中未点击过的用户为负样本。

3.根据权利要求2所述的方法,其特征在于,对所述偏好信息进行特征提取之前,还包括:

对经过关联的数据进行清洗、处理和缺失值补充。

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

在对所述偏好信息进行特征提取之后,若所述偏好信息中的特征为具有有限类别的离散型特征,对离散型特征进行离散化编码;若所述偏好信息中的特征为连续型特征,则基于所述预设模型算法的类型确定是否对所述连续型特征进行离散化编码。

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

在得到广告的预测点击率之后,使用广告的测试数据确定广告的点击率阈值;如果广告的预测点击率大于所述点击率阈值,则投放该广告,否则不投放该广告。

6.根据权利要求1所述的方法,其特征在于,所述方法还包括:

将所述广告的偏好信息按比例分成训练样本信息、测试样本信息和预测样本信息,所述训练样本信息用于训练广告点击率预测模型,所述测试样本信息用于测试广告点击率预测模型;所述预测样本信息用于预测广告点击率。

7.一种广告的预测点击率获取装置,其特征在于,包括:

确定模块:用于基于广告的历史数据确定用户对广告的偏好信息;

特征提取模块:用于对所述偏好信息进行特征提取,以提取到的特征数据作为训练数据;

训练模块:用于基于预设的算法模型对所述训练数据进行训练得到训练模型;

预测模块:用于使用所述训练模型对广告测试数据进行预测,得到广告的预测点击率。

8.根据权利要求7所述的装置,其特征在于,确定模块基于广告的历史数据确定用户对广告的偏好信息,包括:确定历史数据中的推送数据、曝光数据和点击数据,将所述推送数据对应的用户和所述曝光数据对应的用户进行关联,提取用户的特征字段;

所述特征提取模块对所述偏好信息进行特征提取,以提取到的特征数据作为训练数据,包括:

将所述曝光数据对应的用户和所述点击数据对应的用户进行关联,增加特征曝光数据中点击过的用户为正样本,曝光数据中未点击过的用户为负样本。

9.一种电子设备,其特征在于,包括:处理器和存储器;

所述处理器通过调用所述存储器存储的程序或指令,用于执行如权利要求1至6任一项所述方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储程序或指令,所述程序或指令使计算机执行如权利要求1至6任一项所述方法的步骤。

技术总结
本发明提供一种广告的预测点击率获取方法、装置、电子设备和存储介质,基于广告的历史数据确定用户对广告的偏好信息;对偏好信息进行特征提取,以提取到的特征数据作为训练数据;基于预设的算法模型对训练数据进行训练得到训练模型;使用训练模型对广告测试数据进行预测,得到广告的预测点击率,通过本发明实施例对广告的点击率进行预测,不需要人工进行中间干预,降低人员参与的成本,而且能够充分利用广告的历史数据信息,从而确定出用户对广告的偏好信息,结合训练模型对点击率进行预测,预测出的点击率可以很好的指导广告的投放,使得广告的投放更有针对性。

技术研发人员:晏彦军;郎永彪;尹子杰;尹彬
受保护的技术使用者:晓推(武汉)信息科技有限公司
技术研发日:2020.02.15
技术公布日:2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-50449.html

最新回复(0)