处理收视指标数据的方法、装置、设备及存储介质与流程

专利2022-06-29  64


本发明涉及数据处理
技术领域
,更具体地,涉及一种处理收视指标数据的方法、一种处理收视指标数据的装置、一种电子设备及一种计算机可读存储介质。
背景技术
:目前,电视机顶盒stb(settopbox)能够在播放电视节目的同时,还可以通过双向有线电视网络回传用户的收视行为数据,例如,用户正在观看的频道等。电视运营商利用大数据平台对回传的用户的收视行为数据进行统计分析,以得到自身所提供的电视节目的收视指标曲线等,例如,收视率曲线。但是,由于电视机顶盒和电视机通常是两个独立的设备,电视关机后电视机顶盒不关闭是常见的现象,以及电视机顶盒无法感知电视机的开关机状态,这将导致在电视机关闭,即用户实际上已经不再观看节目,而电视机顶盒未关闭的情况下,电视机顶盒仍会回传用户的收视行为数据,例如用户正在观看的频道。而在该情况下回传的用户的收视行为数据仍会被纳入收视指标曲线等的计算中,这样使得大数据平台经统计分析得到的收视指标曲线等并不准确。技术实现要素:本发明的一个目的是提供一种用于处理收视指标数据的新技术方案。根据本发明的第一方面,提供了一种处理收视指标数据的方法,包括:获取在目标时间段内的每一采集时刻采集到的对于待处理对象的有效行为数、以及对应采集时刻的对于待处理对象的观看用户数;所述待处理对象包括目标频道或目标地理区域;根据所述有效行为数、以及所述观看用户数,确定户均有效行为数的曲线;对所述户均有效行为数的曲线对应的户均有效行为数进行归一化处理,以得到活跃度系数的曲线;获取在所述目标时间段内的对于待处理对象的初始的收视指标曲线;所述收视指标曲线为反映初始的收视指标值与所述采集时刻之间的映射关系的曲线;根据所述活跃度系数的曲线、所述初始的收视指标曲线,以得到优化后的收视指标曲线。可选的,所述方法在所述根据所述有效行为数、以及所述观看用户数,确定户均有效行为数的曲线之后,还包括:对所述户均有效行为数的曲线进行平滑处理,以得到平滑处理后的户均有效行为数的曲线;所述对所述户均有效行为数的曲线对应的户均有效行为数进行归一化处理,以得到活跃度系数的曲线,包括:对平滑处理后的户均有效行为数的曲线对应的户均有效行为数进行归一化处理,以得到活跃度系数的曲线。可选的,在所述待处理对象为目标频道、所述优化后的收视指标曲线为基于收视时间的第一优化后的收视指标曲线的情况下,所述方法还包括:根据目标频道的节目单,确定每一节目的播放时间段;从所述第一优化后的收视指标曲线中,获取对应于对应节目的播放时间段的第一目标优化后的收视指标曲线;将所述第一目标优化后的收视指标曲线对应的所有收视指标值的平均指标值,作为对应节目的优化后的收视指标值。可选的,在所述待处理对象为目标频道、所述优化后的收视指标曲线为基于观看用户数的第二优化后的收视指标曲线的情况下,所述方法还包括:根据目标频道的节目单,确定每一节目的播放时间段;从所述第二优化后的收视指标曲线中,获取对应于对应节目的播放时间段的第二目标优化后的收视指标曲线;获取对应节目的播放时间段内,每一采集时刻对应的初始观看时长、对应采集时刻对应的优化后的观看时长、对应采集时刻对应的初始观看用户数、对应节目的时长;根据所述每一采集时刻对应的初始观看时长、对应采集时刻对应的优化后的观看时长、对应采集时刻对应的初始观看用户数、对应节目的时长,确定对应采集时刻的优化后的观看用户数;根据所述对应采集时刻的优化后的观看用户数、所述第二目标优化后的收视指标曲线,确定对应节目的优化后的收视指标值。可选的,所述对所述户均有效行为数的曲线对应的户均有效行为数进行归一化处理,以得到活跃度系数的曲线,包括:通过设定的归一化函数,对所述户均有效行为数的曲线对应的户均有效行为数进行归一化处理,以得到活跃度系数的曲线。可选的,所述归一化函数为:线性分段函数、三角函数对应的分段函数、对数函数、成长曲线函数中的任一个。可选的,所述方法还包括:根据所述优化后的收视指标曲线,输出分析结果。可选的,所述收视指标曲线为观看时长曲线、观看用户数曲线、收视率曲线、收视份额曲线、到达率曲线中的任一个。根据本发明的第二方面,提供了一种处理收视指标数据的装置,包括:第一获取模块,获取在目标时间段内的每一采集时刻采集到的对于待处理对象的有效行为数、以及对应采集时刻的对于待处理对象的观看用户数;所述待处理对象包括目标频道或目标地理区域;确定模块,用于根据所述有效行为数、以及所述观看用户数,确定户均有效行为数的曲线;归一化模块,用于对所述户均有效行为数的曲线对应的户均有效行为数进行归一化处理,以得到活跃度系数的曲线;第二获取模块,用于获取在所述目标时间段内的对于待处理对象的初始的收视指标曲线;所述收视指标曲线为反映初始的收视指标值与所述采集时刻之间的映射关系的曲线;优化模块,用于根据所述活跃度系数的曲线、所述初始的收视指标曲线,以得到优化后的收视指标曲线。根据本发明的第三方面,提供了一种电子设备,所述电子设备包括如第二方面所述的装置;或者,包括存储器和处理器,所述存储器用于存储计算机指令,所述处理器用于从所述存储器中调用所述计算机指令,以执行如第一方面中任一项所述的方法。根据本发明的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实现根据第一方面中任一项所述的方法。在本实施例中,通过根据获取到的在目标时间段内的每一采集时刻采集到的对于待处理对象的有效行为数、以及对应采集时刻的对于待处理对象的观看用户数,确定出户均有效行为数的曲线。由于用户均有效行为数可反映出表示用户活跃程度的活跃度系数,因此,基于户均有效行为数的曲线得到活跃度系数的曲线。这样,根据活跃度系数的曲线、初始的收视指标曲线,所得到的优化后的收视指标曲线,可从初始的收视指标曲线中筛选出活跃用户,即筛选出使得电视开关机状态和机顶盒开关机状态一致的用户所产生的收视指标。即优化后的收视指标曲线为一个准确的收视指标曲线。通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。附图说明被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。图1是实现本发明实施例提供的处理收视指标数据的方法的电子设备的硬件配置的框图;图2是本实施例提供的一种处理收视指标数据的方法的流程图;图3是本发明实施例提供的各种归一化函数的示意图;图4是本发明实施例提供的一种在目标时间段内的对于待处理对象的初始的收视率曲线的示意图;图5是本发明实施例提供的一种切换频道数的曲线的示意图;图6是本发明实施例提供的一种调整音量数的曲线的示意图;图7是本发明实施例提供的一种其他人机交互动作数的曲线的示意图;图8是本发明实施例提供的一种有效行为数的曲线的示意图;图9是本发明实施例提供的一种户均有效行为数的曲线的示意图;图10是本发明实施例提供的一种平滑处理后的户均有效行为数的曲线的示意图;图11是本发明实施例提供的一种活跃度系数的曲线的示意图;图12是本发明实施例提供的一种优化后的收视率曲线和初始的收视率曲线的示意图;图13是本发明实施例提供的一种处理收视指标数据的装置的结构示意图;图14是本发明实施例提供的一种电子设备的结构示意图。具体实施方式现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。<硬件配置>图1是根据本发明实施例提供的一种处理收视指标数据的方法的电子设备的硬件配置的框图。电子设备1000通常为电视运营商搭建的一个大数据平台,该大数据平台可以是终端,也可以是服务器。进一步的,服务器可以云端服务器等。电子设备1000可以包括处理器1100、存储器1200、接口装置1300、通信装置1400、显示装置1500、输入装置1600、扬声器1700、麦克风1800,等等。其中,处理器1100可以是中央处理器cpu、微处理器mcu等。存储器1200例如包括rom(只读存储器)、ram(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1300例如包括usb接口、耳机接口等。通信装置1400例如能够进行有线或无线通信。显示装置1500例如是液晶显示屏、触摸显示屏等。输入装置1600例如可以包括触摸屏、键盘等。用户可以通过扬声器1700和麦克风1800输入/输出语音信息。尽管在图1中对电子设备1000均示出了多个装置,但是,本发明可以仅涉及其中的部分装置,例如,电子设备1000只涉及存储器1200和处理器2100。应用于本发明的实施例中,电子设备1000的存储器1200用于存储指令,该指令用于控制处理器1100执行本发明实施例提供的处理收视指标数据的方法。在上述描述中,技术人员可以根据本发明所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。<方法实施例>如图2所示,本实施例提供了一种处理收视指标数据的方法,该方法包括如下s2100-s2500:s2100、获取在目标时间段内的每一采集时刻采集到的对于待处理对象的有效行为数、以及对应采集时刻的对于待处理对象的观看用户数;待处理对象包括目标频道或目标地理区域。在一个实施例中,目标时间段可以为具体的某一天,例如2019年1月1号。或者,目标时间段还可以为具体的某一个月,例如2019年1月1日-2019年1月31日。当然,目标时间段还可以为其他,对此本实施例不做限定。在本实施例中,上述的采集时刻为内置在电视机顶盒中采集用户的收视行为数据的探针的采集数据的时刻。通常,探针每隔1s采集一次用户的收视行为数据,或者,每隔1min采集一次用户的收视行为数据。其中,用户的收视行为数据包括:用户正在观看的频道、用户在切换频道时的切换时刻、用户在调整音量时的调整时刻、用户在进行其他人机交互动作(例如调节亮度)时的其他人机交互时刻等中的至少一个。另外,需要说明的是,探针在每一采集时刻经采集得到一组数据,这一组数据中至少包括:探针的设备信息、采集时刻以及对应采集时刻的用户的收视行为数据。在本实施例中,有效行为指的是,用户的收视行为数据中涉及到人机交互的收视行为数据所对应的收视行为。基于上述对用户的收视行为数据的说明可知,有效行为可具体为:切换频道、调整音量或其他人机交互动作(例如调节亮度)。可以理解的是,上述s2100中的有效行为数可根据用户的收视行为数中涉及到的人机交互动作的收视行为数据确定。在一个例子中,对于待处理对象,若目标时间段内的一个采集时刻共有1000个探针采集到数据,即共得到1000组数据。而这1000组数据中对应的用户的收视行为数据里对应的有效行为为切换频道的为300组,则对应采集时刻的切换频道数为300。这100组数据中对应的用户的收视行为数据里对应的有效行为为调整音量的为400组,则对应采集时刻的调整音量数为400。这1000组数据中对应的用户的收视行为数据里对应的有效行为为其他人机交互动作的为对应采集时刻的200组,则切换频道数为200。进一步的,这1000组数据中,有900组数据中对应的用户的收视行为数据里对应有有效行为。那么上述s2100中涉及到的对应采集时刻的有效行为数为900。基于上述内容可知,在一个示例中,在有效行为为:切换频道、调整音量或其他人机交互动作的情况下,上述s2100中的有效行为数可具体表示为:actt=σactt,sw ∑actt,vol ∑actt,other其中,actt为目标时间段内的一采集时刻t采集到的对于待处理对象的有效行为数;∑actt,sw为采集时刻t采集到的对于待处理对象的切换频道数;∑actt,vol为采集时刻t采集到的对于待处理对象的调整音量数;∑actt,other为采集时刻t采集到的对于待处理对象的其他人机交互动作数。需要说明的是,每一采集时刻的切换频道数、调整音量数或其他人机交互动作数可通过对应的曲线进行表示。这里的具体可具体为:反映在目标时间段内每一采集时刻的切换频道数的曲线、反映在目标时间段内每一采集时刻的调整音量数的曲线、反映在目标时间段内每一采集时刻的其他人机交互动作数的曲线。基于这里的曲线,可得到反映在目标时间段内每一采集时刻的有效行为数的曲线。利用该有效行为数的曲线,可得到目标时间段内的每一采集时刻的有效行为数。在本实施例中,对应采集时刻的对于待处理对象的观看用户数具体为:对应采集时刻中回传数据的探针数。继续以上一例子为例,对于待处理对象,在目标时间段内的一个采集时刻共有1000个探针采集到数据时,观看用户数为1000。另外,以待处理对象为目标地理区域为例,确定上述s2100中的有效行为数以及观看用户数所基于的探针为目标地理区域中的探针。需要说明的是,上述s2100中得到的有效行为数和对应的观看用户数,还可以采用其他方式得到,例如,根据样本探针的方式得到。s2200、根据有效行为数、观看用户数,确定户均有效行为数曲线。在本实施例中,户均有效行为数曲线的横轴为时间,纵轴为户均有效行为数。在本实施例中,上述s2200的具体实现为:将基于上述s2100得到的同一采集时刻对应的有效行为数与观看用户数之间的比值,作为对应采集时刻的户均有效行为数;然后将目标时间段内每一采集时刻对应的户均有效行为数形成的曲线,作为上述s2200中的户均有效行为数曲线。在一个示例中,对于户均有效行为数曲线,在目标时间段内的一采集时刻t采集到的对于待处理对象的有效行为数用actt表示时,对应的采集时刻t的户均有效行为数可表示为如下公式:其中,aput为采集时刻t的户均有效行为数;vnt为采集时刻t的观看用户数。可以理解的是,由于活跃用户(使得电视开关机状态和机顶盒开关机状态一致的用户)的存在,才会产生有效行为,因此,从大数据角度来看,当有一定规模的用户在打开电视机观看电视节目时,对应有相匹配规模的有效行为数。基于此原理,可通过户均有效行为数反映出用户的活跃程度。进一步的,可利用户均有效行为数来反映表示用户活跃程度的活跃度系数。s2300、对户均有效行为数的曲线对应的户均有效行为数进行归一化处理,以得到活跃度系数的曲线。在本实施例中,由于户均有效行为数的值域通常在0.001至0.1之间,而反映用户活跃程度的活跃度系数的值域为0~100%,因此,在得到一个采集时刻的户均有效行为数之后,可将该户均用户行为数进行归一化处理,以得到对应采集时刻的活跃度系数。然后将目标时间段内每一采集时刻的活跃度系数形成的曲线,作为上述s2300中的活跃度曲线。可以理解的是,上述s2400中的活跃度曲线的横轴为时间,纵轴为活跃度系数。在一个实施例中,上述s2300的具体实现可以为如下的s2310:s2310、通过设定的归一化函数,对户均有效行为数的曲线对应的户均有效行为数进行归一化处理,以得到活跃度系数的曲线。在本实施例中,设定的归一化函数指的是,根据预设的拐点值以及预设的凹凸性得到的归一化函数。其中,拐点指的是归一化函数的值为1时,最小的户均有效行为数。可以理解的是,当户均有效行为数超过一定值,即这里的最小的户均有效行为数时,可认为对应采集时刻的观看用户数近似为真实的观看用户数,即对应采集时刻的观看用户数与对应采集时刻的电视开机数近似相同。需要说明的是。在本实施例中,拐点值为根据经验值,或者大量实验得到。示例性的,由于黄金时间段内的采集时刻对应的观看用户数近似为观看用户数,此时,可将黄金时间段内的采集时刻对应的户均有效行为数的例如均值作为上述的拐点值。以及,可以理解的是,当归一化函数的拐点越大,活跃度系数的曲线的凹凸越多。另外,凹凸性指的是归一化函数上升过程中所呈现凹凸状态。以及,凹凸性可根据归一化函数对应的参数的参数值进行设定。需要说明的是,在本实施例中,归一化函数的凹凸性可根据实验值,或者大量实验得到。可以理解的是,当归一化函数中的某一分段函数呈现上凸状时,归一化函数能够对活跃度系数进行放大。当归一化函数的某一分段函数呈现下凹状时,归一化函数能够对活跃度系数进行压缩。在一个示例中,午夜时间段内存在的非活跃用户(使得电视开关机状态和机顶盒开关机状态不一致的用户)居多,因此,午夜时间段对应的户均有效行为数通常很低,因此,可将归一化函数在午夜时间段内设置为呈现下凹状。在一个实施例中,归一化函数为线性分段函数、三角函数对应的分段函数、对数函数、成长曲线函数中的任一个。其中:线性分段函数可表示为:三角函数对应的分段函数可表示为:对数函数可表示为:fnor(x)=logabx k,x∈(0, ∞)成长曲线函数可表示为:其中,x指的是户均有效行为数。fnor(x)为户均有效行为数x对应归一化的值。a、b、w以及k为对应归一化函数对应的参数。可以理解的是,a、b、w以及k的具体取值,可根据预设的拐点值以及预设的凹凸性确定。在一个示例中,上述的线性分段函数、三角函数对应的分段函数、对数函数、成长曲线函数示例性如图3所示。s2400、获取在目标时间段内的对于待处理对象的初始的收视指标曲线。其中,初始的收视指标曲线为反映初始的收视指标值与采集时刻之间的映射关系的曲线。在本实施例中,初始的收视指标曲线为根据传统技术统计分析出的收视指标曲线。这里的收视指标曲线为观看时长曲线、观看用户数曲线、收视率曲线、市场份额曲线、到达率曲线中的任一个。可以理解的是,这里的收视指标曲线还可以其他收视指标曲线。s2500、根据活跃度系数的曲线、初始的收视指标曲线,以得到优化后的收视指标曲线。在本实施例中,上述s2500的具体实现为:将同一采集时刻对应的活跃度系数和初始的收视指标曲线中对应的收视指标相乘,将相乘后得到的曲线,作为优化后的收视指标曲线。在一个示例中,对于优化后的收视指标曲线,采集时刻t对应的优化后的收视指标值可表示为:rtg_acvt=rtgt×acvt其中,rtg_acvt为采集时刻t的优化后的收视指标值;rtgt为采集时刻t的初始的收视指标值;acvt为采集时刻t的活跃度系数。在本实施例中,通过根据获取到的在目标时间段内的每一采集时刻采集到的对于待处理对象的有效行为数、以及对应采集时刻的对于待处理对象的观看用户数,确定出户均有效行为数的曲线。由于用户均有效行为数可反映出表示用户活跃程度的活跃度系数,因此,基于户均有效行为数的曲线得到活跃度系数的曲线。这样,根据活跃度系数的曲线、初始的收视指标曲线,所得到的优化后的收视指标曲线,可从初始的收视指标曲线中筛选出活跃用户,即筛选出使得电视开关机状态和机顶盒开关机状态一致的用户所产生的收视指标。即优化后的收视指标曲线为一个准确的收视指标曲线。在上述任一实施例的基础上,本实施例提供的处理收视指标的方法还包括如下s2510:s2510、根据优化后的收视指标曲线,输出分析结果。在一个实施例中,分析结果可以为根据优化后的收视指标曲线得到的节目编排建议。示例性的,在收视指标曲线对应的收视指标值的综合值低于某一预设的指标值时,分析结果可以为:建议引入热门节目。其中,综合值可以为黄金时间段的收视指标值的平均值,或者收视指标曲线对应的整个时间段的中值等。对此,本实施例不做限定。示例性的,分析结果还可以为:将处于例如08:00-22:30内,某一节目在对应时间段内的所得到的收视指标值最大值偏低于另一预设的指标值的情况下,分析结果可以为:建议将该节目编排在22:30-次日08:00内。在另一个实施例中,分析结果还可以为根据优化后的收视指标,统计出的热门节目。这样,可根据该分析结果向用户推荐相关节目。在上述任一实施例的基础上,本实施例提供的处理收视指标的方法还在上述s2200之后,还包括如下s2210:s2210、对户均有效行为数的曲线进行平滑处理,以得到平滑处理后的户均有效行为数的曲线。在本实施例,由于在某一节目开始或结束时刻,通常会产生大量的有效行为数,因此,户均有效行为数据会在该时刻为一个很大的值。体现在户均有效行为数的曲线上,则在该时刻上会出现一个“尖峰”。而这种“尖峰”是由于节目编排所引起的,而并不代表用户的活跃程度远高于相邻时刻。因此,考虑一段时间内的有效行为数是更加合理的。基于此,在得到户均有效行为数的曲线后,可对该曲线进行平滑处理。这样,得到的户均有效行为数的曲线可以更加准确的反映出用户的活跃程度。在一个实施例中,可采用滑动平均法、低通滤波的方式,对一定时间窗口内的户均有效行为数进行平均或卷积运算。需要说明的是,时间窗口的大小可根据实际经验确定,通常时间窗口为一个大于30min的时间窗口。基于此,上述s2300的实现具体为如下的s2310:s2310、对平滑处理后的户均有效行为数的曲线对应的户均有效行为数进行归一化处理,以得到活跃度系数的曲线。在上述实施例的基础上,本实施例得到的采集时刻t对应的活跃度系数可表示为:其中,aput为采集时刻t的户均有效行为数;acvt为采集时刻t的活跃度系数;fwnd(aput)为对采集时刻t的户均有效行为数进行平滑处理后值;fnor(fwnd(aput))为采集时刻t的平滑处理后的户均有效行为数进行归一化后的值;vnt为采集时刻t的观看用户数。在上述任一实施例的基础上,本实施例提供的处理收视指标数据的方法,在待处理对象为目标频道、优化后的收视指标曲线为基于收视时间的第一优化后的收视指标曲线的情况下,本实施例提供的方法还包括如下的s2610-s2630:s2610、根据目标频道的节目单,确定每一节目的播放时间段。在本实施例中,基于收视时间的第一优化后的指标曲线可以为:优化后的收视率曲线、优化后的观看时长曲线、优化后的收视份额曲线。在本实施例中,在待处理对象为目标频道时,可获取目标频道的节目单(也可称之为电子节目指南epg,electronicprogramguide),然后从该节目单中确定出每一节目的播放时间段。s2620、从第一优化后的收视指标曲线中,获取对应于对应节目的播放时间段的第一目标优化后的收视指标曲线。在本实施例中,在得到每一节目的播放时间段后,将第一优化后的收视曲线中,与对应节目的播放时间段相同的时间段所对应的曲线,作为上述的第一目标优化后的收视指标曲线。s2630、将第一目标优化后的收视指标曲线对应的所有收视指标值的平均指标值,作为对应节目的优化后的收视指标值。在一个示例中,以收视指标为收视率为例对本实施例的原理进行说明。其中,rtg_acv为节目的优化后的收视指标值;vt_acv为节目的优化后的观看时长;dur为节目的时长(节目播放时间段的时间长度);s为观看用户数;n为节目时长中包含的采集时刻的数量;t为相邻的采集时刻之间的时间间隔;acvt为采集时刻t的活跃度系数;vtt为采集时刻t的观看时长。基于上述公式可知,基于收视时间的第一优化后的收视曲线,可得到基于收视时间的节目的优化后的收视指标值,且基于收视时间的节目的优化后的收视指标值为第一目标优化后的收视指标曲线中对应的所有收视指标值的平均指标值。在本实施例中,本实施例提供的方法可对节目的基于时间的收视指标值进行优化。在上述任一实施例的基础上,本实施例提供的处理收视指标数据的方法在待处理对象为目标频道,优化后的收视指标曲线为基于观看用户数的第二优化后的收视指标曲线的情况下,还包括如下s2710-s275:s2710、根据目标频道的节目单,确定每一节目的播放时间段。s2720、从第二优化后的收视指标曲线中,获取对应于对应节目的播放时间段的第二目标优化后的收视指标曲线。在本实施例中,上述s2710与上述的s2610的具体实现相同,以及上述s2720与上述s2620的具体实现相同,因此,这里不再赘述。在本实施例中,基于观看用户数的第二优化后的收视指标曲线为:优化后的观看用户数曲线、优化后的到达率曲线中的任一个。s2730、获取对应节目的播放时间段内,每一采集时刻对应的初始观看时长、对应采集时刻对应的优化后的观看时长、对应采集时刻对应的初始观看用户数、对应节目的时长;在本实施例中,每一采集时刻对应的初始观看时长为,利用传统统计技术统计分析出的观看时长曲线中,对应采集时刻的观看时长。对应采集时刻的优化后的观看时长为,在初始的收视指标曲线为初始的观看时长的曲线的情况下,执行本实施例提供的方法得到的优化后的观看时长的曲线,在对应采集时刻对应的观看时长。对应采集时刻对应的初始观看用户数为:利用传统统计方式统计出的的观看用户数曲线中,对应采集时刻的观看用户数。对应节目的时长为:对应节目的播放时间段的时间长度。s2740、根据每一采集时刻对应的初始观看时长、对应采集时刻对应的优化后的观看时长、对应采集时刻对应的初始观看用户数、对应节目的时长,确定对应采集时刻的优化后的观看用户数;在本实施例中,非活跃用户在电视关机后不存在收视行为,但是对于非活跃用户来说,电视机顶盒确仍能回传收视行为数据,即对于非活跃用户来说,在电视机关机后,电视机顶盒仍会回传反映出用户“完整地观看了”电视关机前一时刻所播放的节目的数据。可以理解的是,此时的观看时长与该节目时长相同。因此,优化后的节目观看时长和初始的节目观看时长之间的差值为非活跃用户贡献出的。基于此,优化后的观看用户数为:其中,rch_acv为节目的优化后的观看用户数;rch为节目的初始的观看用户数;vt_acv为节目的优化后的观看时长;dur为对应节目的时长。s2740、根据对应采集时刻的优化后的观看用户数、第二目标优化后的收视指标曲线,确定对应节目的优化后的收视指标值。在本实施例中,以第二目标优化后的收视指标曲线为观看用户数为例,上述s2740的具体实现为:对于第二目标优化后的收视指标曲线中每一采集时刻对应的观看用户数,利用上述s2730得到对应采集时刻的节目的优化后的观看用户数,将每一采集时刻对应的节目的优化后的观看用户数,作为对应节目的优化后的收视指标值。在本实施例中,本实施例提供的方法可对节目的基于观看用户数的收视指标值进行优化。基于上述对本实施例提供的处理收视指标数据的方法,在一个实施例中,以待处理对象为目标频道,且目标时间段为连续的三天(第一天0:00:00至第三天23:59:59))、收视指标曲线为收视率曲线、有效行为为:切换频道、调整音量、其他人机交互行为为例,对本实施例的提供的处理收视指标数据的方法进行说明。基于上述s2400得到的在目标时间段内的对于待处理对象的初始的收视率曲线如图4所示;基于上述s2200获取到的切换频道数的曲线如图5所示,获取到的调整音量数的曲线如图6所示,获取到的其他人机交互动作数的曲线如图7所示;基于图5-7,得到的有效行为数的曲线如图8所示;进一步的,基于图8,得到的户均有效行为数的曲线如图9所示。基于s2210,对图9所示的户均有效行为数进行平滑处理,得到的平滑处理后的户均有效行为数的曲线如图10所示;基于s2310,对如图10所示的平滑处理后的户均有效行为数的曲线,进行归一化处理,得到的活跃度系数的曲线如图11所示。基于s2500,利用如图11所示的活跃度系数的曲线与如图4所示的初始的收视率曲线,得到的优化后的收视率曲线如图12所示。在上一实施例的基础上,基于上述对本实施例提供的处理收视指标数据的方法,以节目的优化后的收视指标为收视率为例,对节目的优化后的收视率进行说明:目标频道在上述的连续三天的节目单相同,其中,节目单具体如下表所示:节目开始时间结束时间初始的收视率节目17:007:300.268%节目212:0012:300.670%节目315:0015:300.547%节目418:0018:300.652%节目520:0020:300.853%节目623:0023:300.558%节目70:000:050.487%(午夜)节目81:001:300.362%(午夜)节目93:003:300.221%(午夜)节目105:005:300.140%表1基于上述步骤,得到每一节目的优化后的收视率为如下述的表2所示:表2由表可见,上午时段(节目1)、中午时段(节目2)、晚间黄金时段(节目4、节目5)的节目收视率几乎不受影响;而在夜间(节目6、节目7)、午夜(节目8、节目9)时段和下午时段(节目3),由于存在大量的非活跃用户,导致对应的收视率存在虚高的现象。通过本实施例提供的处理收视指标数据的方法,可有效处理这些时段的非活跃用户,使节目的收视率结果更加真实可靠。<装置实施例>如图13所示,本实施例提供一种处理收视指标数据的装置130,该装置130包括:第一获取模块131、确定模块132、归一化模块133、第二获取模块134以及优化模块135。其中:第一获取模块131,获取在目标时间段内的每一采集时刻采集到的对于待处理对象的有效行为数、以及对应采集时刻的对于待处理对象的观看用户数;所述待处理对象包括目标频道或目标地理区域。确定模块132,用于根据所述有效行为数、以及所述观看用户数,确定户均有效行为数的曲线。归一化模块133,用于对所述户均有效行为数的曲线对应的户均有效行为数进行归一化处理,以得到活跃度系数的曲线。第二获取模块134,用于获取在所述目标时间段内的对于待处理对象的初始的收视指标曲线;所述收视指标曲线为反映初始的收视指标值与所述采集时刻之间的映射关系的曲线。优化模块135,用于根据所述活跃度系数的曲线、所述初始的收视指标曲线,以得到优化后的收视指标曲线。在一个实施例中,本实施例提供的装置130还包括平滑模块136。其中,平滑模块136用于:对所述户均有效行为数的曲线进行平滑处理,以得到平滑处理后的户均有效行为数的曲线。在本实施例中,归一化模块133具体用于:对平滑处理后的户均有效行为数的曲线对应的户均有效行为数进行归一化处理,以得到活跃度系数的曲线。在一个实施例中,在所述待处理对象为目标频道、所述优化后的收视指标曲线为基于收视时间的第一优化后的收视指标曲线的情况下,优化模块135还用于:根据目标频道的节目单,确定每一节目的播放时间段;从所述第一优化后的收视指标曲线中,获取对应于对应节目的播放时间段的第一目标优化后的收视指标曲线;将所述第一目标优化后的收视指标曲线对应的所有收视指标值的平均指标值,作为对应节目的优化后的收视指标值。在本实施例中,在所述待处理对象为目标频道、所述优化后的收视指标曲线为基于观看用户数的第二优化后的收视指标曲线的情况下,优化模块135还具体用于:根据目标频道的节目单,确定每一节目的播放时间段;从所述第二优化后的收视指标曲线中,获取对应于对应节目的播放时间段的第二目标优化后的收视指标曲线;获取对应节目的播放时间段内,每一采集时刻对应的初始观看时长、对应采集时刻对应的优化后的观看时长、对应采集时刻对应的初始观看用户数、对应节目的时长;根据所述每一采集时刻对应的初始观看时长、对应采集时刻对应的优化后的观看时长、对应采集时刻对应的初始观看用户数、对应节目的时长,确定对应采集时刻的优化后的观看用户数;根据所述对应采集时刻的优化后的观看用户数、所述第二目标优化后的收视指标曲线,确定对应节目的优化后的收视指标值。在一个实施例中,归一化模块133具体用于:通过设定的归一化函数,对所述户均有效行为数的曲线对应的户均有效行为数进行归一化处理,以得到活跃度系数的曲线。在一个实施例中,所述归一化函数为:线性分段函数、三角函数对应的分段函数、对数函数、成长曲线函数中的任一个。在一个实施例中,处理收视指标数据的装置130还包括输出模块。其中,输出模块用于:根据所述优化后的收视指标曲线,输出分析结果。在一个实施例中,所述收视指标曲线为观看时长曲线、观看用户数曲线、收视率曲线、收视份额曲线、到达率曲线中的任一个。<设备实施例>如图14所示,本实施例提供了一种电子设备140,该电子设备140包括如上述装置实施例中提供的处理收视指标数据的装置140。或者,包括:处理器141和存储器142。所述存储器142用于存储可执行的指令,所述指令用于控制所述处理器141执行根据上述方法实施例中任一项所述的方法。或者,该电子设备140还可以是如图1所示的电子设备1000。<存储介质实施例>本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实现根据上述任一项所述的方法。本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c 等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本
技术领域
的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本
技术领域
的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。当前第1页1 2 3 
技术特征:

1.一种处理收视指标数据的方法,其特征在于,包括:

获取在目标时间段内的每一采集时刻采集到的对于待处理对象的有效行为数、以及对应采集时刻的对于待处理对象的观看用户数;所述待处理对象包括目标频道或目标地理区域;

根据所述有效行为数、以及所述观看用户数,确定户均有效行为数的曲线;

对所述户均有效行为数的曲线对应的户均有效行为数进行归一化处理,以得到活跃度系数的曲线;

获取在所述目标时间段内的对于待处理对象的初始的收视指标曲线;所述收视指标曲线为反映初始的收视指标值与所述采集时刻之间的映射关系的曲线;

根据所述活跃度系数的曲线、所述初始的收视指标曲线,以得到优化后的收视指标曲线。

2.根据权利要求1所述的方法,其特征在于,所述方法在所述根据所述有效行为数、以及所述观看用户数,确定户均有效行为数的曲线之后,还包括:

对所述户均有效行为数的曲线进行平滑处理,以得到平滑处理后的户均有效行为数的曲线;

所述对所述户均有效行为数的曲线对应的户均有效行为数进行归一化处理,以得到活跃度系数的曲线,包括:

对平滑处理后的户均有效行为数的曲线对应的户均有效行为数进行归一化处理,以得到活跃度系数的曲线。

3.根据权利要求1所述的方法,其特征在于,在所述待处理对象为目标频道、所述优化后的收视指标曲线为基于收视时间的第一优化后的收视指标曲线的情况下,所述方法还包括:

根据目标频道的节目单,确定每一节目的播放时间段;

从所述第一优化后的收视指标曲线中,获取对应于对应节目的播放时间段的第一目标优化后的收视指标曲线;

将所述第一目标优化后的收视指标曲线对应的所有收视指标值的平均指标值,作为对应节目的优化后的收视指标值。

4.根据权利要求1所述的方法,其特征在于,在所述待处理对象为目标频道、所述优化后的收视指标曲线为基于观看用户数的第二优化后的收视指标曲线的情况下,所述方法还包括:

根据目标频道的节目单,确定每一节目的播放时间段;

从所述第二优化后的收视指标曲线中,获取对应于对应节目的播放时间段的第二目标优化后的收视指标曲线;

获取对应节目的播放时间段内,每一采集时刻对应的初始观看时长、对应采集时刻对应的优化后的观看时长、对应采集时刻对应的初始观看用户数、对应节目的时长;

根据所述每一采集时刻对应的初始观看时长、对应采集时刻对应的优化后的观看时长、对应采集时刻对应的初始观看用户数、对应节目的时长,确定对应采集时刻的优化后的观看用户数;

根据所述对应采集时刻的优化后的观看用户数、所述第二目标优化后的收视指标曲线,确定对应节目的优化后的收视指标值。

5.根据权利要求1所述的方法,其特征在于,所述对所述户均有效行为数的曲线对应的户均有效行为数进行归一化处理,以得到活跃度系数的曲线,包括:

通过设定的归一化函数,对所述户均有效行为数的曲线对应的户均有效行为数进行归一化处理,以得到活跃度系数的曲线。

6.根据权利要求5所述的方法,其特征在于,所述归一化函数为:线性分段函数、三角函数对应的分段函数、对数函数、成长曲线函数中的任一个。

7.根据权利要求1-6任一项所述的方法,其特征在于,所述方法还包括:

根据所述优化后的收视指标曲线,输出分析结果。

8.一种处理收视指标数据的装置,其特征在于,包括:

第一获取模块,获取在目标时间段内的每一采集时刻采集到的对于待处理对象的有效行为数、以及对应采集时刻的对于待处理对象的观看用户数;所述待处理对象包括目标频道或目标地理区域;

确定模块,用于根据所述有效行为数、以及所述观看用户数,确定户均有效行为数的曲线;

归一化模块,用于对所述户均有效行为数的曲线对应的户均有效行为数进行归一化处理,以得到活跃度系数的曲线;

第二获取模块,用于获取在所述目标时间段内的对于待处理对象的初始的收视指标曲线;所述收视指标曲线为反映初始的收视指标值与所述采集时刻之间的映射关系的曲线;

优化模块,用于根据所述活跃度系数的曲线、所述初始的收视指标曲线,以得到优化后的收视指标曲线。

9.一种电子设备,其特征在于,所述电子设备包括如权利要求8所述的装置;或者,

包括存储器和处理器,所述存储器用于存储计算机指令,所述处理器用于从所述存储器中调用所述计算机指令,以执行如权利要求1-7中任一项所述的方法。

10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-7任一项所述的方法。

技术总结
本发明公开了一种处理收视指标数据的方法、装置、设备及存储介质。其中,方法包括:获取在目标时间段内的每一采集时刻采集到的对于待处理对象的有效行为数、以及对应采集时刻的对于待处理对象的观看用户数;待处理对象包括目标频道或目标地理区域;根据有效行为数、以及观看用户数,确定户均有效行为数的曲线;对户均有效行为数的曲线对应的户均有效行为数进行归一化处理,以得到活跃度系数的曲线;获取在目标时间段内的对于待处理对象的初始的收视指标曲线;收视指标曲线为反映初始的收视指标值与采集时刻之间的映射关系的曲线;根据活跃度系数的曲线、初始的收视指标曲线,以得到优化后的收视指标曲线。

技术研发人员:郑冠雯
受保护的技术使用者:国家广播电视总局广播电视规划院
技术研发日:2020.01.06
技术公布日:2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-53451.html

最新回复(0)