本发明涉互联网技术领域,特别涉及一种网络文章评价方法、系统、计算机设备及可读存储介质。
背景技术:
当前,不论传统媒体机构还是第三方评价体系,对网络文章的评价仍以发文量、阅读量为主要评判标准,各方只能唯“点击率”论英雄。但实际上,包括网民的点击率、转发率在内的传播数据仅代表了文章的热度,只是对网络文章应有的评价标准之一,不应完全等同于其质量。
此外,由于某些资讯分发平台现行的广告分润制度,均秉持“注意力经济”的基本原则,一定程度上助推了“标题党”“洗稿”“批量建号”等破坏新闻环境的行为,使得存在信息虚假、标题引诱等弊病,进而说明发文量、阅读量等并不能完全等同于文章的质量。因此,基于发文量、阅读量等评价文章质量的方法存在准确性低为问题,进而影响网络文章发表或发布的准确性、有效性。
技术实现要素:
本发明实施例提供了一种网络文章评价方法,以解决现有技术中网络文章评价存在准确性低、有效性差的技术问题。该方法包括:
获取网络文章在首发网站上的版本,将该版本的网络文章作为待评价文章;
根据表征首发网站影响力的资质相关信息,确定所述待评价文章的来源分,其中,所述来源分的大小与所述首发网站的影响力的大小成正比;
根据所述待评价文章的网络媒体传播信息,确定所述待评价文章的传播分,其中,所述传播分的大小与网络媒体传播情况成正比;
发送评审所述待评价文章的内容的评审请求;
接收评审结果,根据所述评审结果确定所述待评价文章的评审分,其中,所述评审分的大小表征所述待评价文章的内容的质量情况;
根据所述待评价文章的来源分、传播分以及评审分,确定所述待评价文章的文章指数。
本发明实施例还提供了一种网络文章评价装置,以解决现有技术中网络文章评价存在准确性低、有效性差的技术问题。该装置包括:
文章获取模块,用于获取网络文章在首发网站上的版本,将该版本的网络文章作为待评价文章;
来源确定模块,用于根据表征首发网站影响力的资质相关信息,确定所述待评价文章的来源分,其中,所述来源分的大小与所述首发网站的影响力的大小成正比;
传播确定模块,根据所述待评价文章的网络媒体传播信息,确定所述待评价文章的传播分,其中,所述传播分的大小与网络媒体传播情况成正比;
请求发送模块,用于发送评审所述待评价文章的内容的评审请求;
评审确定模块,用于接收评审结果,根据所述评审结果确定所述待评价文章的评审分,其中,所述评审分的大小表征所述待评价文章的内容的质量情况;
指数确定模块,用于根据所述待评价文章的来源分、传播分以及评审分,确定所述待评价文章的文章指数。
本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意的网络文章发布方法,以解决现有技术中网络文章评价存在准确性低、有效性差的技术问题。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述任意的网络文章发布方法的计算机程序,以解决现有技术中网络文章评价存在准确性低、有效性差的技术问题。
在本发明实施例中,通过获取网络文章在首发网站上的版本,并将该版本的网络文章作为待评价文章,进而对待评价文章进行评价,例如,根据表征首发网站影响力的资质相关信息,确定待评价文章的来源分,该来源分的大小与首发网站的影响力的大小成正比,该来源分在一定程度代表了该待评价文章的来源的可靠性、真实性;根据待评价文章的网络媒体传播信息(例如,媒体覆盖情况、重点频道刊登情况、点击量、阅读量、转发量等信息),确定待评价文章的传播分,该传播分的大小与网络媒体传播情况成正比,该传播分在一定程度代表了该待评价文章的传播情况、传播力度;发送评审待评价文章的内容的评审请求,接收评审结果,根据评审结果确定待评价文章的评审分,该评审分的大小在一定程度表征、代表了待评价文章的内容的质量情况;最后,基于待评价文章的来源分、传播分以及评审分,确定待评价文章的文章指数,该文章指数是综合来源分、传播分以及评审分后确定的,使得该文章指数代表了待评价文章的可靠性、真实性、传播情况、内容质量情况等综合质量,由于上述评价待评价文章的过程,综合考量了待评价文章的首发网站的相关信息、网络媒体传播情况以及待评价文章的本身内容,使得该评价过程相对更全面、客观、真实,进而使得评价结果相对更准确、可靠、有效,即文章指数更能真实、准确地反映待评价文章的质量情况,进而可以将文章指数标记在待评价文章上并进行展示,通过文章指数的展示即可更直观、准确地向用户展示、明示待评价文章的质量,有利于使得发布结果更准确,进而有利于向用户精准地展示有效信息,有利于有效地推动高质量文章的传播,避免或减少高质量文章被埋没。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的限定。在附图中:
图1是本发明实施例提供的一种网络文章评价方法的流程图;
图2是本发明实施例提供的一种网络文章划分领域的原理示意图;
图3是本发明实施例提供的一种计算机设备的结构示意图;
图4是本发明实施例提供的一种网络文章评价系统的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施方式和附图,对本发明做进一步详细说明。在此,本发明的示意性实施方式及其说明用于解释本发明,但并不作为对本发明的限定。
在本发明实施例中,提供了一种网络文章评价方法,如图1所示,该方法包括:
步骤102:获取网络文章在首发网站上的版本,将该版本的网络文章作为待评价文章;
步骤104:根据表征首发网站影响力的资质相关信息,确定所述待评价文章的来源分,其中,所述来源分的大小与所述首发网站的影响力的大小成正比;
步骤106:根据所述待评价文章的网络媒体传播信息,确定所述待评价文章的传播分,其中,所述传播分的大小与网络媒体传播情况成正比;
步骤108:发送评审所述待评价文章的内容的评审请求;
步骤110:接收评审结果,根据所述评审结果确定所述待评价文章的评审分,其中,所述评审分的大小表征所述待评价文章的内容的质量情况;
步骤112:根据所述待评价文章的来源分、传播分以及评审分,确定所述待评价文章的文章指数。
由图1所示的流程可知,在本发明实施例中,通过获取网络文章在首发网站上的版本,并将该版本的网络文章作为待评价文章,进而对待评价文章进行评价,例如,根据表征首发网站影响力的资质相关信息(例如,网站属性、网站发布文章的质量、网站规模等信息),确定待评价文章的来源分,该来源分的大小与首发网站的影响力的大小成正比,该来源分在一定程度代表了该待评价文章的来源的可靠性、真实性;根据待评价文章的网络媒体传播信息,(例如,媒体覆盖情况、重点频道刊登情况、点击量、阅读量、转发量等信息),确定待发布的传播分,该传播分的大小与网络媒体传播情况成正比,该传播分在一定程度代表了该待评价文章的传播情况、传播力度;发送评审待评价文章的内容的评审请求,接收评审结果,根据评审结果确定待评价文章的评审分,该评审分的大小在一定程度表征、代表了待评价文章的内容的质量情况;最后,基于待评价文章的来源分、传播分以及评审分,确定待评价文章的文章指数,该文章指数是综合来源分、传播分以及评审分后确定的,使得该文章指数代表了待评价文章的可靠性、真实性、传播情况、内容质量情况等综合质量,由于上述评价待评价文章的过程,综合考量了待评价文章的首发网站的相关信息、网络媒体传播情况以及待评价文章的本身内容,使得该评价过程相对更全面、客观、真实,进而使得评价结果相对更准确、可靠、有效,即文章指数更能真实、准确地反映待评价文章的质量情况,进而可以将文章指数标记在待评价文章上,发布待评价文章,通过文章指数的展示更能直观、准确地向用户展示、明示待评价文章的质量,有利于使得发布结果更准确,进而有利于向用户精准地展示有效信息,有利于有效地推动高质量文章的传播,避免或减少高质量文章被埋没,该评审分在一定程度代表了对该待评价文章的内容的考量程度。
具体实施时,上述获取待评价文章的方式可以是主动获取也可以是被动获取,本申请不做具体限定。例如,主动获取的方式可以是主动在网站上抓取网络文章,为了确保获取文章的质量,可以在指定网站(例如,属性为重点新闻网站、地方社科院类网站、高校网站、地方行政网站等网站)上抓取网络文章,进而基于抓取的网络文章自动追溯文章的转载情况,根据网站发表时间、各家网站标注的来源、文中可能出现的“转发自/来源于/原标题”等关键词进行识别、通过作者个人文章库识别等手段,分析判断网络文章的首发网站(例如,网络文章被10家网站刊载,其中7家标注其来源为人民网,3家标注其来源为其他网站,则判定其首发网站为人民网),自动将首发网站的文章版本确定为待评价文章。被动获取的方式可以是设置网络文章创作网页,在网页上设置入口,通过用户在入口投稿来获取待评价文章。
具体实施时,在根据表征首发网站影响力的资质相关信息,确定待评价文章的来源分的过程中,为了确保网络文章评价的公平性,可以明确网络文章的来源范围,并根据表征首发网站影响力的资质相关信息确定来源分,表征首发网站影响力的资质相关信息可以包括网站属性信息(例如,网站建设主体信息)、网站发布文章的质量信息(例如,可以是文章的评价得分)以及网站规模(例如,网站的用户量、覆盖区域等)等信息。根据资质相关信息确定待评价文章的来源分时,可以采取不同的方式,结果符合来源分的大小与首发网站的影响力的大小成正比即可,以便该来源分可以相对反映该待评价文章的来源的可靠性、真实性。例如,可以预先设置各项信息组合与来源分的对应关系,即对应关系中不同信息项的组合对应不同的来源分,将首发网站的资质相关信息与对应关系匹配即可确定出待评价文章的来源分。例如,还可以预先根据每项信息的情况、程度分别为每项信息设置一个分值(例如,网站属性越正规对应分值越高,网站发布文章的质量越高对应分值越高,网站规模越大对应的分值越高),将各项信息的分值直接相加或将各项信息的分值附加权重后再相加,即可得到待评价文章的来源分。
具体实施时,在本实施例中还提供了另一种确定待评价文章的来源分的方式,例如,可以通过以下公式来确定待评价文章的来源分:
来源分=首发网站属性值*属性权重 首发网站权重值*网站权重 预设时段内优秀文章数量*文章权重 首发网站所发表文章的文章指数的平均分*指数权重;
其中,根据首发网站的属性信息确定首发网站的网站类型,首发网站属性值是首发网站的网站类型对应的数值,不同网站类型对应不同数值;属性权重是首发网站属性值在来源分中所占的比重;首发网站权重值是根据首发网站的网页级别(pr)值确定的;网站权重是首发网站权重值在来源分中所占的比重;优秀文章是文章指数大于预设文章指数的文章;文章权重是预设时段内优秀文章数量在来源分中所占的比重;指数权重是首发网站所发表文章的文章指数的平均分在来源分中所占的比重。
具体的,根据首发网站的属性信息可以将网站分类,例如,分为4类网站类型:中央新闻网站、重点理论网站、地方网站、其他网站,不同网站类型对应不同数值,网站类型越权威对应的数值可以越大,例如,中央新闻网站、重点理论网站、地方网站、其他网站分别对应的数值分别为9、6、3、1。
具体的,pr(pagerank)值是根据google排名运算法则得到的,用来标识网页的等级/重要性,pr值越高说明该网页越受欢迎,可以从google、百度等第三方机构获取pr值,进而首发网站权重值可以参考pr值等参数得出,不同pr值对应的首发网站权重值的分布区间可以为0~9。比如腾讯网、新华网的权重值是9,而小网站的权重值可能是0。
具体的,预设时段内优秀文章数量可以是月均优秀文章数,即所述网站平均每月文章指数达到预设文章指数的文章数。
具体的,首发网站所发表文章的文章指数的平均分即统计所述网站已通过本方法评价过的文章,计算平均文章指数。
具体实施时,针对所述待评价的网络文章,可以展示每个网络文章的来源分。
具体实施时,在根据待评价文章的网络媒体传播信息,确定待评价文章的传播分的过程中,可以取自网络文章首发日起预设时长(例如,一周或包括点击和转发的峰值时间的预设时长内)内的网络媒体传播信息,网络媒体传播信息可以包括媒体覆盖情况、重点频道刊登情况、反响情况等信息。
具体的,媒体覆盖情况可以是转载量(转载量指的是当前文章被转载的次数)、转载媒体构成(转载媒体构成指分析转载当前文章的媒体构成,媒体权威性从高到低依次为重点频道、核心来源网站、其他网站、自媒体,其中,重点频道是指位于网站指数排名位于前20%的重点网站的重点频道以及首页)、搜索引擎收录数(搜索引擎收录数是指被国内主流搜索引擎收录情况)等信息。
具体的,重点频道刊登情况可以包括重点理论频道的转载时长等信息,重点理论频道的转载时长是指当前文章被重点网站的重点频道展示的时长,如,在网站a的重点频道(如首页)展示5分钟。
具体的,反响情况可以包括阅读量(阅读量是指网络用户对当前网络文章的浏览量)、评论量(评论量是指网络用户对当前网络文章的评论数)、转发量(转发量是指网络用户对当前网络文章的转发量)、观点被引量(观点被引量是指通过技术手段深挖文章原创性观点,该观点在其他网络文章中的被转引情况)、点赞量等信息。
根据网络媒体传播信息确定待评价文章的传播分时,可以采取不同的方式,结果符合传播分的大小与网络媒体传播情况成正比即可,以便该传播分可以相对反映该待评价文章的传播情况、传播力度。例如,可以预先根据每项信息的情况、程度分别为每项信息设置一个分值(例如,媒体覆盖数量越多对应分值越高,重点频道刊登数量越多对应分值越高,反响越好对应的分值越高),将各项信息的分值直接相加或将各项信息的分值附加权重后再相加,即可得到待评价文章的传播分。
具体实施时,在本实施例中还提供了另一种确定待评价文章的传播分的方式,例如,可以通过以下公式来确定待评价文章的传播分:
当(媒体覆盖指数权重*m 重点频道刊登指数权重*c 反响指数权重*r)<h时,传播分=(媒体覆盖指数权重*m 重点频道刊登指数权重*c 传播指数权重*r)*(n/h);当(媒体覆盖指数权重*m 重点频道刊登指数权重*c 传播指数权重*r)≥h时,传播分=n,
其中,m表示媒体覆盖指数,所述媒体覆盖指数是根据媒体对所述待评价文章的转载数以及媒体的权重值来确定的;媒体覆盖指数权重表示媒体覆盖指数在传播分中所占的比重;c表示重点频道刊登指数,所述重点频道刊登指数是根据预先指定重点频道对所述待评价文章的转载数和刊登时长确定的,重点频道是指根据资质信息确定的权威性最高的频道;重点频道刊登指数权重表示重点频道刊登指数在传播分中所占的比重;r表示反响指数,所述反响指数是根据所述待评价文章的反响情况确定的;反响指数权重表示反响指数在传播分中所占的比重;(媒体覆盖指数权重*m 重点频道刊登指数权重*c 反响指数权重*r)表示传播指数,h表示预设时长内已评价文章中传播指数的最大值;n表示传播分的评分分制中的最大值。
具体实施时,可以通过以下方式来确定媒体覆盖指数,通过获取所述待评价文章被其他网站或自媒体的转载情况,以及被搜索引擎收录情况,被搜索引擎收录视为被该网站转载,确定各个媒体对所述待评价文章的转载数;通过参考google、百度等第三方机构的pr值等参数得出媒体的权重值,进而将每个媒体的权重值乘以该媒体对所述待评价文章的转载数,将得到的各个乘积相加,将相加得到的和通过自然对数进行线性回归后,作为所述待评价文章的传播数据中媒体覆盖指数的基础数值;
将媒体平均权重值乘以参与转载的媒体总数,得到的乘积通过自然对数进行线性回归后,作为所述待评价文章的传播数据中媒体覆盖指数的修正数值,其中,所述媒体平均权重值为媒体权重值分制的一半,当媒体权重值分制为0~9,则媒体平均权重值为5;
将所述媒体覆盖指数的基础数值乘以基础数值在媒体覆盖指数中所占权重,将所述媒体覆盖指数的修正数值乘以修正数值在媒体覆盖指数中所占权重,将所得到的两乘积相加,相加得到的和为所述待评价文章的传播数据中的媒体覆盖指数;
例如,媒体覆盖指数=80%*(媒体1的权重值*媒体1对所述待评价文章的转载数 媒体2的权重值*媒体2对所述待评价文章的转载数 ……媒体n的权重值*媒体n对所述待评价文章的转载数) 20%*媒体平均权重值*参与转载的媒体总数;
基础数值在媒体覆盖指数中所占权重以80%、修正数值在媒体覆盖指数中所占权重以20%、媒体平均权重值以5为例,具体m可以具体表示如下:
m=80%*ln[∑weight1*count1,weight2*count2,…weight(i)*count(i)] 20%*ln(5*tracedsitecount 1)}^2*10;weight表示媒体的权重值,count表示媒体对所述待评价文章的转载数,tracedsitecount 1表示参与转载的网站总数。
具体实施时,可以通过以下方式来确定重点频道刊登指数,通过获取所述待评价文章被预先指定的重点频道对所述待评价文章的转载数和刊登时长,重点网站刊登时长可以分钟计算;
将预先指定的重点频道中刊登所述待评价文章的总次数乘以转载媒体的最高权重值(例如,参考google、百度等第三方机构的pr值等参数得出媒体的权重值分制为0~9,则转载媒体的最高权重值为9),将所得到的乘积通过自然对数进行线性回归后,作为重点频道刊登频次值;
将预先指定的重点频道中刊登时长通过自然对数进行线性回归后,作为重点频道刊登时长值,其中,所述刊登时长以分钟计算;
将所述重点频道刊登频次值乘以重点频道刊登频次值在重点频道刊登指数中所占权重,将所述重点频道刊登时长值乘以重点频道刊登时长值在重点频道刊登指数中所占权重,将所得到的两乘积相加,相加得到的和为所述待评价文章的传播数据中的重点频道刊登指数;
例如,重点频道刊登指数=60%*转载媒体的最高权重值*重点频道中刊登所述待评价文章的总次数 40%*重点频道中刊登所述待评价文章的总时长);
重点频道刊登频次值在重点频道刊登指数中所占权重以60%、重点频道刊登时长值在重点频道刊登指数中所占权重以40%、转载媒体的最高权重值以10为例,具体c可以具体表示如下:
c={60%*ln(10*channels 1) 40%*ln(channeltime 1)}^2*10;channels 1表示重点频道中刊登所述待评价文章的总次数,channeltime 1表示重点频道中刊登所述待评价文章的总时长。
具体实施时,可以通过以下方式来确定反响指数,通过获取所述待评价文章在互联网的被评论数、被阅读数、被点赞数等数据;
将被评论数乘以被评论数在反响指数中所占权重,将被阅读数乘以被阅读数在反响指数中所占权重,将被点赞数乘以被点赞数在反响指数中所占权重,将所得到的三个乘积相加,作为所述待评价文章的传播数据中的反响指数;
例如,反响指数=40%*10*评论数 40%*阅读数 20%*点赞数;
被评论数在反响指数中所占权重以40%、被阅读数在反响指数中所占权重以40%、被点赞数在反响指数中所占权重以20%为例,具体r可以具体表示如下:
r={40%*ln(10*comments 1) 40%*ln(reads 1) 20%*ln(agrees 1)}^2*10;
comments 1表示被评论数,reads 1表示被阅读数,agrees 1表示被点赞数。
具体实施时,媒体覆盖指数权重以30%、重点频道刊登指数权重以40%、反响指数权重以30%、传播分的评分分制以100分为例,具体传播分可以具体表示如下:
当(30%*m 40%*c 30%*r)<h时,传播分=(30%*m 40%*c 30%*r)*(100/h);当(30%*m 40%*c 30%*r)≥h时,传播分=100。
具体实施时,为了可以更准确地确定待评价文章内容的质量情况,在本申请中,发送评审待评价文章的内容的评审请求,该评审请求可以发送给运行上述网络文章发布方法的系统之外的、可对文章内容进行评价的机构或平台,即该机构或平台作为评审主体进行评审,运行上述网络文章发布方法的系统不进行评审,进而运行上述网络文章发布方法的系统接收机构或平台反馈的评审结果,再基于评审结果确定待评价文章的评审分,该评审分的大小可以表征反映待评价文章的内容的质量情况,本申请对机构或平台进行评审的方式不做具体限定。
具体实施时,为了进一步提高对待评价文章内容的评审的准确性,在本实施例中,发送评审所述待评价文章的内容的评审请求,包括:
对所述待评价文章进行分词处理,获取文本关键词;
根据所述待评价文章的首发网站的相关信息和所述文本关键词,分析所述待评价文章的文章类型,其中,所述文章类型包括网络评论文章和网络理论文章,网络评论文章可以是对某一事件、实物进行评论的文章,网络理论文章可以是基于某一思想、概念进行理论的文章;
将所述文本关键词与预设的领域关键词(即表示不同领域的关键词,例如,经济民生、时事政治、文史科教等领域的关键词)进行匹配,确定所述待评价文章所属的领域类型;
根据所述待评价文章的文章类型和领域类型发送评审所述待评价文章的内容的评审请求给评审主体,所述评审主体不属于所述待评价文章的署名作者范围,即可以根据文章类型和领域类型,将评审请求发送给待评价文章领域内的且具有评审该文章类型文章的资格的上述评审主体。
具体实施时,预设的领域关键词可以存储在关键词库中,即关键词库中存储着各个领域的关键词,如图2所示,可以通过以下步骤确定待评价文章所属的领域类型,将关键词库中的关键词与文本关键词进行匹配,如果匹配成功次数小于10,在这些匹配成功次数对应的领域中,将匹配成功次数最多的一个领域确定为待评价文章所属的领域类型;如果匹配成功次数大于等于10,确定这些匹配成功次数对应的领域类型,可能确定出多个领域类型,如果确定出的领域类型数大于6,则在确定出的领域类型中,将匹配成功次数排在前三的三个领域确定为待评价文章所属的领域类型;如果确定出的领域类型数小于等于6,则在确定出的领域类型中,将匹配成功次数排在前二的二个领域确定为待评价文章所属的领域类型。
具体实施时,为了进一步可以准确地确定不同类型的网络文章的评审分,在本实施例中,通过以下步骤确定网络理论文章的评审分,例如,接收上述评审主体反馈的评审结果后,根据所述评审结果确定所述待评价文章的评审分,包括:
在所述待评价文章为网络理论文章时,接收的评审结果包括不同评审主体基于所述待评价文章内容的不同维度的评分;具体的,评分的维度本申请不做具体限定,例如,可以是3个、4个、5个等不同数目的维度。
针对每个维度,将每个评审主体对该维度的评分减去评分中值,得到每个评审主体在该维度的倾向值,其中,所述评分中值为评分分制的一半,具体的,评分分制本申请不做具体限定,例如,可以是10分、30分、100分等分制;
将每个评审主体在各维度的倾向值相加,得到每个评审主体对所述待评文章的总体倾向值;
将各评审主体的总体倾向值乘以各评审主体自身对应的权重,将得到的各个乘积相加,将相加得到的和除以评审主体个数,将得到的商加上所述评分中值,相加得到的和为所述待评价文章的评审分,其中,评审主体对应的权重是根据评审主体的资质信息确定的。
具体的,评审主体的资质信息可以包括评审主体的级别(例如,机构或平台是地方级还是行业内级别的)、研究领域(例如,机构或平台主要专注的领域是否与待评价文章属于相同领域)、性质(例如,机构或平台是属于教育类的高校、或是公众类的文章评审平台,或是隶属于地方或国家的官方机构)等信息,初始时,可以根据各信息项衡量各评审主体评审的准确性,相对准确性越高对应的权重越大。
具体实施时,以3个评分的维度为例,上述确定待评价文章的评审分的过程可以用以下公式表示:
评审分={[(a维度评分a-评分中值) (b维度评分b-评分中值) (c维度评分c-评分中值)]*评审主体1的权重x …… [(a维度评分a-评分中值) (b维度评分b-评分中值) (c维度评分c-评分中值)]*评审主体n的权重z}/评审主体数n 评分中值。
具体实施时,针对网络理论文章的评审主体,可以根据各个评审主体的评审情况调整各评审主体的权重。例如,可以根据评审主体的评审数量(例如,评审过的文章数量)、评审方式(例如,简单评分,简单评分 评审文字结果,简单评分 预设字数的评审文字结果等方式)以及预设时长内的评审频率(例如,连续10天或一个月内评审过的文章数等),调整评审主体的权重。具体的,评审数量越高、评审方式越详细、评审频率越高可以提高权重,否则,降低权重。
具体实施时,在本实施例中,通过以下步骤确定网络评论文章的评审分,例如,接收上述评审主体反馈的评审结果后,根据所述评审结果确定所述待评价文章的评审分,包括:
在所述待评价文章为网络评论文章时,接收的评审结果包括不同评审主体对所述待评价文章的内容的评分和对所述待评价文章的不同指标(可以是用于衡量文章质量的指标,例如,创新、完整等)的投票情况;
将所有评审主体的评分的均值作为所述待评价文章的基础评分;
将每个指标的投票数乘以该指标的该票数对应的权重,将得到的乘积相加,将相加得到的和作为所述待评价文章的指标分,其中,每个指标的不同票数对应不同的权重,例如,针对指标1,投票数为1时,对应的权重为0.5,投票数为2时,对应的权重为0.75,……投票数为4时,对应的权重为1.25,以此类推,即投票数越高对应的权重越高。
将所述待评价文章的基础评分加上所述指标分,相加得到的和为所述待评价文章的评审分。
具体实施时,上述评分分制以90分为例,上述确定待评价文章的评审分的过程可以用以下公式表示:
评审分=(评分a 评分b 评分c …… 评分x)/评审主体数n 指标分
例如,针对网络评论文章,反馈的评审结果如下:
评审主体1反馈的评分为7,没有为任何指标投票;
评审主体2反馈的评分为8,为创新指标投1票;
评审主体3反馈的评分为8,为创新指标、完整指标各投1票;
评审主体4反馈的评分为9,为创新指标、完整指标各投1票;
那么,该网络评论文章的基础评分为(7 8 8 9)/4=8,指标分为(创新指标票数3*1 完整指标票数2*0.75)=4.5,评审分为8 4.5=12.5分。
具体实施时,为了提高评价结果的准确性,在本实施例中,接收评审结果,根据所述评审结果确定所述待评价文章的评审分,包括:
在接收的评审结果数量大于等于预设数值时,根据所述评审结果确定所述待评价文章的评审分,否则,结束对所述待评价文章的评价流程。
具体实施时,为了进一步提高网络文章评价、发布的有效性,在本实施例中,对待评价文章进行查重,例如,将所述待评价文章与资源库内的文章进行内容匹配,确定所述待评价文章的重复率;根据重复率的大小确定是否评价所述待评价文章或是否发布所述待评价文章。例如,重复率大于设置数值时,可以停止该待评价文章的评价、发布操作或删除该待评价文章。
具体的,可以采用“自适应多阶指纹”技术将所述待评价文章与资源库内的文章进行内容匹配,“自适应多阶指纹”技术是指分别对待检测文章和比对资源库中文章进行分层处理,如按照篇章、段落、句子等层级进行分层,分别创建指纹索引,对指纹进行多阶比对,并进行加权分析,支持对篇章、段落、句子各层级检测。具体的,分层依据主要包括分词技术与主要观点句的挖掘技术,比如通过多篇文章内容比对,挖掘表述相似或意思相近的观点,将这些内容标出并依据时间顺序排列,找到这些观点的最初提出者,作为判断文章原创程度的依据。这些观点可能是一句话、一段话或几段话。
资源库内的文章可以是全网络范围的文章,可以将待评价文章与资源库内的文章通过关键字、句子、段落等方式进行比对匹配,匹配成功的内容在待评价文章整体内容中所占的比例为重复率。
具体实施时,对文章审查重复率可以分为2次,一次可以在发送评价请求前,另一次可以在文章已完成评价且准备公布文章指数前。主要包括以下几方面:
1、文章内容审查
文章内容审查主要根据文章审查标准进行文字复制比审查,是对抄袭、改写等不端行为的检测。
(1)在文章审核推送后,自动在本系统资源库内对文章内容进行比对查重,对于重复率超过30%的文章判为无效文章,终止对该文章的评价推送。
(2)在公布文章指数前,自动在全网范围内对文章内容进行再次比对查重,对于重复率超过10%的文章作标记提醒,并标出其疑似重复内容来源,以便进一步判断核实重复率。
2、文章来源审查
(1)在文章审核推送后,自动追溯文章的转载情况。具体操作可以是,根据网站发表时间、各家网站标注的来源、文中可能出现的“转发自/来源于/原标题”等关键词进行识别、通过作者个人文章库识别等手段,分析判断文章首发来源。合并相同文章,自动将首发来源的文章设置为主文章。如文章被10家网站刊载,其中7家标注其来源人民网,3家标注其他网站,则判定其首发来源为人民网。
(2)在公布文章指数前,自动在全网范围内再次审查其来源网站,对首发来源存疑的文章,调整来源分,并作出标记提醒,以便进一步判断核实来源。
(3)建立媒体网站信用名单,对于被检测出未标记真实来源网站、修改发表时间、修改作者等不规范转载行为进行记录,视情况纳入失信名单,对其网站进行降权或移除收录名单处理。
(4)可在后台该文的传播详情中看到具体分析情况,每12小时更新。
3、文章作者审查
(1)文章审核期间需填写必要的作者信息,没有作者信息的文章视为无效文章,不予评价。
(2)对于重名作者,系统应自动在审核环节予以显著提示,根据作者单位信息、匹配领域等,通过技术手段进行初步判定,并经编辑人工核验后确认作者身份。
(3)在文章审核推送后,原则上不可修改、添加作者。如有误需经作者或管理员申请,并作修改记录。
(4)对于同一文章拥有多位作者的待评价文章,对于第一作者,以原创文章的形式展示于其个人文章库;对于其他合著作者,以合著文章的形式展示于其个人文章库。
(5)文章不可被所有署名作者进行评价。
具体实施时,为了便于用户了解一段时间内发布文章的质量、排名情况,在本实施例中,针对预设时间内已完成评价的网络文章,按照文章指数降序的顺序排列;展示前预设数量的所述待评价文章的文章指数。
例如,预设时间可以是一周、一个月或一年,那么将一周内排序前预设数量的所述待评价文章集中展示,则可以呈现周榜单的效果,通过该展示用户可以直观地了解到一周内发布文章的排名情况和一周内发布了哪些高质量的文章,将一月内排序前预设数量的所述待评价文章汇总展示,则可以呈现出月榜单的效果,将一年内排序前预设数量的所述待评价文章汇总展示,则可以呈现出年榜单的效果。该预设数量可以根据实际情况具体确定,例如,可以是50、100等,本申请不做具体限定。
具体实施时,还可以分别以作者、区域、首发网站等为维度,按照文章指数升序的顺序排列所述待评价文章,进而展示前预设数量的待评价文章,即呈现出针对不同维度的榜单效果。
具体实施时,为了便于用户直接、集中地获取关于某一话题(可以是实物、事件)的文章,在本实施例中,针对预设时间内发布的所述待评价文章,确定所述待评价文章的文本关键词;
根据所述待评价文章的文本关键词,为所述待评价文章设置标签,即该标签反映了该待评价文章的主题或话题;
将具备相同标签的所述待评价文章汇总展示,即实现了将同一话题相关的文章集中展示,例如,可以通过同一页面或同一列表的形式集中展示同一话题相关的文章。
具体实施时,上述网络文章展示方法可以运行在各网站或平台上,上述网络文章展示方法的使用可以提高展示结果的准确性,进而有利于向用户精准地展示有效信息,有利于有效地推动高质量文章的传播,避免或减少高质量文章被埋没,由于上述文章指数能真实、准确地反映待评价文章的质量情况,因此,文章指数的展示情况、基于文章指数的排名情况可以为发表文章的作者或机构的学术评价、职称晋升等过程提供依据。
具体实施时,为了确保网络文章评价的有效性和评价结果展示的及时性,在本实施例中,接收不同评审主体对所述待评价文章的内容的评分结果,统计接受到的评分结果数量;
针对接受到的评分结果数量超过预先制定数值的所述待评价文章,判断所述待评价文章为已完成评价文章;
针对所述已完成评价文章,仍然用上述办法发送评审请求、接受评审结果、获取传播数据并计算文章指数。
具体实施时,为了便于用户了解、查询文章指数的计算过程与具体构成情况,在本实施例中,针对已完成评价的文章,展示其来源分、传播分、评审分、综合得分的详细构成及计算方法,因此,增强了本实施例的评价结果的公开透明性和可信度。
在本实施例中,提供了一种计算机设备,如图3所示,包括存储器302、处理器304及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意的网络文章评价方法。
具体的,该计算机设备可以是计算机终端、服务器或者类似的运算装置。
在本实施例中,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述任意的网络文章评价方法的计算机程序。
具体的,计算机可读存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机可读存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读存储介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
基于同一发明构思,本发明实施例中还提供了一种网络文章发布装置,如下面的实施例所述。由于网络文章发布装置解决问题的原理与网络文章发布方法相似,因此网络文章发布装置的实施可以参见网络文章发布方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是本发明实施例的网络文章评价系统的一种结构框图,如图4所示,该装置包括:
文章获取模块402,用于获取网络文章在首发网站上的版本,将该版本的网络文章作为待评价文章;
来源确定模块404,用于表征首发网站影响力的资质相关信息,确定所述待评价文章的来源分,其中,所述来源分的大小与所述首发网站的影响力的大小成正比;
传播确定模块406,根据所述待评价文章的网络媒体传播信息,确定所述待评价文章的传播分,其中,所述传播分的大小与网络媒体传播情况成正比;
请求发送模块408,用于发送评审所述待评价文章的内容的评审请求;
评审确定模块410,用于接收评审结果,根据所述评审结果确定所述待评价文章的评审分,其中,所述评审分的大小表征待评价文章的内容的质量情况;
指数确定模块412,用于根据所述待评价文章的来源分、传播分以及评审分,确定所述待评价文章的文章指数。
在一个实施例中,来源确定模块通过以下公式计算所述待评价文章的来源分:
来源分=首发网站属性值*属性权重 首发网站权重值*网站权重 预设时段内优秀文章数量*文章权重 首发网站所发表文章的文章指数的平均分*指数权重;
其中,根据首发网站的属性信息确定首发网站的网站类型,首发网站属性值是首发网站的网站类型对应的数值,不同网站类型对应不同数值;属性权重是首发网站属性值在来源分中所占的比重;首发网站权重值是根据首发网站的网页级别值确定的;网站权重是首发网站权重值在来源分中所占的比重;优秀文章是文章指数大于预设文章指数的文章;文章权重是预设时段内优秀文章数量在来源分中所占的比重;指数权重是首发网站所发表文章的文章指数的平均分在来源分中所占的比重。
在一个实施例中,传播确定模块通过以下公式计算所述待评价文章的传播分:
当(媒体覆盖指数权重*m 重点频道刊登指数权重*c 反响指数权重*r)<h时,传播分=(媒体覆盖指数权重*m 重点频道刊登指数权重*c 传播指数权重*r)*(n/h);当(媒体覆盖指数权重*m 重点频道刊登指数权重*c 传播指数权重*r)≥h时,传播分=n,
其中,m表示媒体覆盖指数,所述媒体覆盖指数是根据媒体对所述待评价文章的转载数以及媒体的权重值来确定的;媒体覆盖指数权重表示媒体覆盖指数在传播分中所占的比重;c表示重点频道刊登指数,所述重点频道刊登指数是根据预先指定重点频道对所述待评价文章的转载数和刊登时长确定的,重点频道是指根据资质信息确定的权威性最高的频道;重点频道刊登指数权重表示重点频道刊登指数在传播分中所占的比重;r表示反响指数,所述反响指数是根据所述待评价文章的反响情况确定的;反响指数权重表示反响指数在传播分中所占的比重;(媒体覆盖指数权重*m 重点频道刊登指数权重*c 反响指数权重*r)表示传播指数,h表示预设时长内已评价文章中传播指数的最大值;n表示传播分的评分分制中的最大值。
在一个实施例中,所述请求发送模块,包括:
分词单元,用于对所述待评价文章进行分词处理,获取文本关键词;
分析单元,用于根据所述待评价文章的首发网站的相关信息和所述文本关键词,分析所述待评价文章的文章类型,其中,所述文章类型包括网络评论文章和网络理论文章;
匹配单元,用于将所述文本关键词与预设的领域关键词进行匹配,确定所述待评价文章所属的领域类型;
请求发送单元,用于根据所述待评价文章的文章类型和领域类型发送评审所述待评价文章的内容的评审请求给评审主体,所述评审主体不属于所述待评价文章的署名作者范围。
在一个实施例中,评审确定模块,包括:
倾向值确定单元,用于在所述待评价文章为网络理论文章时,接收的评审结果包括不同评审主体基于所述待评价文章内容的不同维度的评分,针对每个维度,将每个评审主体对该维度的评分减去评分中值,得到每个评审主体在该维度的倾向值,将每个评审主体在各维度的倾向值相加得到每个评审主体对所述待评文章的总体倾向值,其中,所述评分中值为评分分制的一半;
第一评审确定单元,用于将各评审主体的倾向值乘以各评审主体自身对应的权重,将得到的各个乘积相加,将相加得到的和除以评审主体个数,将得到的商加上所述评分中值,相加得到的和为所述待评价文章的评审分,其中,评审主体对应的权重是根据评审主体的资质信息确定的。
在一个实施例中,还包括:
调整模块,用于根据评审主体的评审数量、评审方式以及预设时长内的评审频率,调整评审主体的评审权限和权重。
在一个实施例中,评审确定模块,还包括:
基础评分确定单元,用于在所述待评价文章为网络评论文章时,接收的评审结果包括不同评审主体对所述待评价文章的内容的评分和对所述待评价文章的不同指标的投票情况,将所有评审主体的评分的均值作为所述待评价文章的基础评分;
指标分确定单元,用于将每个指标的投票数乘以该指标的该票数对应的权重,将得到的乘积相加,将相加得到的和作为所述待评价文章的指标分,其中,每个指标的不同票数对应不同的权重;
第二评审确定单元,用于将所述待评价文章的基础评分加上所述指标分,相加得到的和为所述待评价文章的评审分。
在一个实施例中,评审确定模块还用于在接收的评审结果数量大于等于预设数值时,根据所述评审结果确定所述待评价文章的评审分,否则,结束对所述待评价文章的评价流程。
在一个实施例中,还包括:
查重模块,用于采用“自适应多阶指纹”特征检测技术将所述待评价文章与资源库内的文章进行内容匹配,确定所述待评价文章的重复率;
发布判断模块,用于根据重复率的大小确定是否评价所述待评价文章或是否发布所述待评价文章。
在一个实施例中,还包括:
排序模块,用于针对预设时间内已完成评价的网络文章,按照文章指数升序的顺序排列;
第一展示模块,用于展示前预设数量的所述网络文章的文章指数。
在一个实施例中,还包括:
文本关键词确定模块,用于针对预设时间内发布的所述待评价文章,确定所述待评价文章的文本关键词;
标签设置模块,用于根据所述待评价文章的文本关键词,为所述待评价文章设置标签;
第二展示模块,用于将具备相同标签的所述待评价文章汇总展示。
本发明实施例实现了如下技术效果:通过获取网络文章在首发网站上的版本,并将该版本的网络文章作为待评价文章,进而对待评价文章进行评价,例如,根据表征首发网站影响力的资质相关信息(例如,网站属性、网站发布文章的质量、网站规模等信息),确定待评价文章的来源分,该来源分的大小与首发网站的影响力的大小成正比,该来源分在一定程度代表了该待评价文章的来源的可靠性、真实性;根据待评价文章的网络媒体传播信息(例如,媒体覆盖情况、重点频道刊登情况、阅读量、转发量等信息),确定待发布的传播分,该来源分的大小与首发网站的影响力的大小成正比,该传播分在一定程度代表了该待评价文章的传播情况、传播力度;发送评审待评价文章的内容的评审请求,接收评审结果,根据评审结果确定待评价文章的评审分,该评审分的大小在一定程度表征、代表了待评价文章的内容的质量情况;最后,基于待评价文章的来源分、传播分以及评审分,确定待评价文章的文章指数,该文章指数是综合来源分、传播分以及评审分后确定的,使得该文章指数代表了待评价文章的可靠性、真实性、传播情况、内容质量情况等综合质量,由于上述评价待评价文章的过程,综合考量了待评价文章的首发网站的相关信息、网络媒体传播情况以及待评价文章的本身内容,使得该评价过程相对更全面、客观、真实,进而使得评价结果相对更准确、可靠、有效,即文章指数更能真实、准确地反映待评价文章的质量情况,进而可以将文章指数标记在待评价文章上,发布待评价文章,通过文章指数的展示更能直观、准确地向用户展示、明示待评价文章的质量,有利于使得发布结果更准确,进而有利于向用户精准地展示有效信息,有利于有效地推动高质量文章的传播,避免或减少高质量文章被埋没。
显然,本领域的技术人员应该明白,上述的本发明实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明实施例不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
1.一种网络文章评价方法,其特征在于,包括:
获取网络文章在首发网站上的版本,将该版本的网络文章作为待评价文章;
根据表征首发网站影响力的资质相关信息,确定所述待评价文章的来源分,其中,所述来源分的大小与所述首发网站的影响力的大小成正比;
根据所述待评价文章的网络媒体传播信息,确定所述待评价文章的传播分,其中,所述传播分的大小与网络媒体传播情况成正比;
发送评审所述待评价文章的内容的评审请求;
接收评审结果,根据所述评审结果确定所述待评价文章的评审分,其中,所述评审分的大小表征所述待评价文章的内容的质量情况;
根据所述待评价文章的来源分、传播分以及评审分,确定所述待评价文章的文章指数。
2.如权利要求1所述的网络文章评价方法,其特征在于,根据表征首发网站影响力的资质相关信息,确定所述待评价文章的来源分,包括:
通过以下公式计算所述待评价文章的来源分:
来源分=首发网站属性值*属性权重 首发网站权重值*网站权重 预设时段内优秀文章数量*文章权重 首发网站所发表文章的文章指数的平均分*指数权重;
其中,根据首发网站的属性信息确定首发网站的网站类型,首发网站属性值是首发网站的网站类型对应的数值,不同网站类型对应不同数值;属性权重是首发网站属性值在来源分中所占的比重;首发网站权重值是根据首发网站的网页级别值确定的;网站权重是首发网站权重值在来源分中所占的比重;优秀文章是文章指数大于预设文章指数的文章;文章权重是预设时段内优秀文章数量在来源分中所占的比重;指数权重是首发网站所发表文章的文章指数的平均分在来源分中所占的比重。
3.如权利要求1所述的网络文章评价方法,其特征在于,根据所述待评价文章的网络媒体传播信息,确定所述待评价文章的传播分,包括:
当(媒体覆盖指数权重*m 重点频道刊登指数权重*c 反响指数权重*r)<h时,传播分=(媒体覆盖指数权重*m 重点频道刊登指数权重*c 传播指数权重*r)*(n/h);当(媒体覆盖指数权重*m 重点频道刊登指数权重*c 传播指数权重*r)≥h时,传播分=n,
其中,m表示媒体覆盖指数,所述媒体覆盖指数是根据媒体对所述待评价文章的转载数以及媒体的权重值来确定的;媒体覆盖指数权重表示媒体覆盖指数在传播分中所占的比重;c表示重点频道刊登指数,所述重点频道刊登指数是根据预先指定重点频道对所述待评价文章的转载数和刊登时长确定的,重点频道是指根据资质信息确定的权威性最高的频道;重点频道刊登指数权重表示重点频道刊登指数在传播分中所占的比重;r表示反响指数,所述反响指数是根据所述待评价文章的反响情况确定的;反响指数权重表示反响指数在传播分中所占的比重;(媒体覆盖指数权重*m 重点频道刊登指数权重*c 反响指数权重*r)表示传播指数,h表示预设时长内已评价文章中传播指数的最大值;n表示传播分的评分分制中的最大值。
4.如权利要求1所述的网络文章评价方法,其特征在于,发送评审所述待评价文章的内容的评审请求,包括:
对所述待评价文章进行分词处理,获取文本关键词;
根据所述待评价文章的首发网站的相关信息和所述文本关键词,分析所述待评价文章的文章类型,其中,所述文章类型包括网络评论文章和网络理论文章;
将所述文本关键词与预设的领域关键词进行匹配,确定所述待评价文章所属的领域类型;
根据所述待评价文章的文章类型和领域类型发送评审所述待评价文章的内容的评审请求给评审主体,所述评审主体不属于所述待评价文章的署名作者范围。
5.如权利要求4所述的网络文章评价方法,其特征在于,接收评审结果,根据所述评审结果确定所述待评价文章的评审分,包括:
在所述待评价文章为网络理论文章时,接收的评审结果包括不同评审主体基于所述待评价文章内容的不同维度的评分;
针对每个维度,将每个评审主体对该维度的评分减去评分中值,得到每个评审主体在该维度的倾向值,其中,所述评分中值为评分分制的一半;
将每个评审主体在各维度的倾向值相加,得到每个评审主体对所述待评文章的总体倾向值;
将各评审主体的总体倾向值乘以各评审主体自身对应的权重,将得到的各个乘积相加,将相加得到的和除以评审主体个数,将得到的商加上所述评分中值,相加得到的和为所述待评价文章的评审分,其中,评审主体对应的权重是根据评审主体的资质信息确定的。
6.如权利要求5所述的网络文章评价方法,其特征在于,还包括:
根据评审主体的评审数量、评审方式以及预设时长内的评审频率,调整评审主体的权重。
7.如权利要求4所述的网络文章评价方法,其特征在于,接收评审结果,根据所述评审结果确定所述待评价文章的评审分,包括:
在所述待评价文章为网络评论文章时,接收的评审结果包括不同评审主体对所述待评价文章的内容的评分和对所述待评价文章的不同指标的投票情况;
将所有评审主体的评分的均值作为所述待评价文章的基础评分;
将每个指标的投票数乘以该指标的该票数对应的权重,将得到的乘积相加,将相加得到的和作为所述待评价文章的指标分,其中,每个指标的不同票数对应不同的权重;
将所述待评价文章的基础评分加上所述指标分,相加得到的和为所述待评价文章的评审分。
8.如权利要求1所述的网络文章评价方法,其特征在于,接收评审结果,根据所述评审结果确定所述待评价文章的评审分,包括:
在接收的评审结果数量大于等于预设数值时,根据所述评审结果确定所述待评价文章的评审分,否则,结束对所述待评价文章的评价流程。
9.如权利要求1所述的网络文章评价方法,其特征在于,还包括:
将所述待评价文章与资源库内的文章进行内容匹配,确定所述待评价文章的重复率;
根据重复率的大小确定是否评价所述待评价文章。
10.如权利要求1至9中任一项所述的网络文章评价方法,其特征在于,还包括:
针对预设时间内已完成评价的网络文章,按照文章指数降序的顺序排列;
针对所述已完成评价文章,展示前预设数量的所述网络文章的文章指数。
11.如权利要求1至9中任一项所述的网络文章评价方法,其特征在于,还包括:
针对预设时间内发布的所述待评价文章,确定所述待评价文章的文本关键词;
根据所述待评价文章的文本关键词,为所述待评价文章设置标签;
将具备相同标签的所述待评价文章汇总展示。
12.一种网络文章评价系统,其特征在于,包括:
文章获取模块,用于获取网络文章在首发网站上的版本,将该版本的网络文章作为待评价文章;
来源确定模块,用于根据表征首发网站影响力的资质相关信息,确定所述待评价文章的来源分,其中,所述来源分的大小与所述首发网站的影响力的大小成正比;
传播确定模块,根据所述待评价文章的网络媒体传播信息,确定所述待评价文章的传播分,其中,所述传播分的大小与网络媒体传播情况成正比;
请求发送模块,用于发送评审所述待评价文章的内容的评审请求;
评审确定模块,用于接收评审结果,根据所述评审结果确定所述待评价文章的评审分,其中,所述评审分的大小表征待评价文章的内容的质量情况;
指数确定模块,用于根据所述待评价文章的来源分、传播分以及评审分,确定所述待评价文章的文章指数。
13.如权利要求12所述的网络文章评价系统,其特征在于,所述评审请求发送模块,包括:
分词单元,用于对所述待评价文章进行分词处理,获取文本关键词;
分析单元,用于根据所述待评价文章的首发网站的相关信息和所述文本关键词,分析所述待评价文章的文章类型,其中,所述文章类型包括网络评论文章和网络理论文章;
匹配单元,用于将所述文本关键词与预设的领域关键词进行匹配,确定所述待评价文章所属的领域类型;
评审请求发送单元,用于根据所述待评价文章的文章类型和领域类型发送评审所述待评价文章的内容的评审请求给评审主体,所述评审主体不属于所述待评价文章的署名作者范围。
14.如权利要求13所述的网络文章评价系统,其特征在于,评审确定模块,包括:
倾向值确定单元,用于在所述待评价文章为网络理论文章时,接收的评审结果包括不同评审主体基于所述待评价文章内容的不同维度的评分,针对每个维度,将每个评审主体对该维度的评分减去评分中值,得到每个评审主体在该维度的倾向值,将每个评审主体在各维度的倾向值相加得到每个评审主体对所述待评文章的总体倾向值,其中,所述评分中值为评分分制的一半;
第一评审确定单元,用于将各评审主体的总体倾向值乘以各评审主体自身对应的权重,将得到的各个乘积相加,将相加得到的和除以评审主体个数,将得到的商加上所述评分中值,相加得到的和为所述待评价文章的评审分,其中,评审主体对应的权重是根据评审主体的资质信息确定的。
15.如权利要求14所述的网络文章评价系统,其特征在于,还包括:
调整模块,用于根据评审主体的评审数量、评审方式以及预设时长内的评审频率,调整评审主体的评审权限和权重。
16.如权利要求13所述的网络文章评价系统,其特征在于,评审确定模块,还包括:
基础评分确定单元,用于在所述待评价文章为网络评论文章时,接收的评审结果包括不同评审主体对所述待评价文章的内容的评分和对所述待评价文章的不同指标的投票情况,将所有评审主体的评分的均值作为所述待评价文章的基础评分;
指标分确定单元,用于将每个指标的投票数乘以该指标的该票数对应的权重,将得到的乘积相加,将相加得到的和作为所述待评价文章的指标分,其中,每个指标的不同票数对应不同的权重;
第二评审确定单元,用于将所述待评价文章的基础评分加上所述指标分,相加得到的和为所述待评价文章的评审分。
17.如权利要求12所述的网络文章评价系统,其特征在于,还包括:
查重模块,用于将所述待评价文章与资源库内的文章进行内容匹配,确定所述待评价文章的重复率;
发送判断模块,用于根据重复率的大小确定是否发送评价所述待评价文章的评审请求。
18.如权利要求12至17中任一项所述的网络文章评价系统,其特征在于,还包括:
排序模块,用于针对预设时间内已完成评价的网络文章,按照文章指数降序的顺序排列;
第一展示模块,用于展示前预设数量的所述网络文章的文章指数。
19.如权利要求12至17中任一项所述的网络文章评价系统,其特征在于,还包括:
文本关键词确定模块,用于针对预设时间内发布的所述待评价文章,确定所述待评价文章的文本关键词;
标签设置模块,用于根据所述待评价文章的文本关键词,为所述待评价文章设置标签;
第二展示模块,用于将具备相同标签的所述待评价文章汇总展示。
20.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至11中任一项所述的网络文章评价方法。
21.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至11中任一项所述的网络文章评价方法的计算机程序。
技术总结