一种基于博弈论的专利侵权检测方法及系统与流程

专利2022-06-29  70


本发明属于信息检索及其数据库结构技术领域,尤其涉及一种基于博弈论的专利侵权检测方法及系统。



背景技术:

目前,业内常用的现有技术是这样的:随着时代的进步,人们对于知识产权的保护愈加重视,专利作为知识产权保护的重要手段申请数量急剧增加。而专利在授予之后一旦发现存在侵权行为会给公司及个人带来巨大损失。但是专利的手工审核不仅速度慢且因专利审核人员领域知识的限制导致专利审核过程可能存在误判的情况,因此在专利申请之前进行自动化侵权检测可以大大减少专利申请人的损失。因此实现专利侵权检测的自动化,既可以使专利申请人在申请专利之前进行预检测,也可以在专利审核过程中检索可能侵权专利,以此缩短专利审查周期。专利审查主要审查三个特性:有用性、新颖性和创造性。有用性是指专利所述的技术方案是可实施的,是从专利自身描述进行判断的。而侵权检测是检测专利是否侵权了其他专利,是根据专利之间的关系进行判断的,因此专利侵权检测只考虑新颖性和创造性不考虑对有用性的检测。目前常见的专利侵权检测主要是通过改进相似度检测的结构及方法,这些方法以专利文本为研究对象对专利进行侵权检测。

目前常见的专利侵权检测主要是通过改进相似度检测的结构及方法,这些方法以专利文本为研究对象对专利进行侵权检测。

目前方法的不足之处在于:

(1)自专利法改革之后,增加了对专利内容进行的实质审查,实质审查主要审查专利的三个特性:有用性、新颖性和非显而易见性,而侵权检测是针对该专利与其他专利的关系,可以暂时不考虑有用性,过去方法忽视了对非显而易见性的检测。

(2)过去方法没有将专利文本与其他普通文本区别开来,对比过程中只考虑了文本本身,没有考虑专利申请人的理性决策。申请专利无效判决的过程是一个双向的过程,疑似被侵权方可以控告疑似侵权方侵权,而疑似侵权方也有权对法院判决产生异议,可以对国家知识产权局专利复审委员会提起诉讼。在这个过程中双方都会结合对方的选择做出对自己最有利的选择。

(3)过去方法的对比方法没有考虑到确定专利的新颖性的过程是一个双向的过程,不仅要考虑该专利比之前专利多的技术特征,还要考虑该专利比之前专利少的那些技术特征。

(4)忽略了层次性,降低了对侵权对象表征的精确性。过去的方法只考虑到专利中最重要部分是由权利要求构成的权利要求书,事实上对于专利而言,专利主要由权利要求构成,权利要求主要由技术特征构成,这种对于专利文本层次性的忽略,导致对侵权对象即专利表征的精确性降低。

(5)忽略了针对性,这种信息损失降低了实验结果的准确性。过去方法以权利要求书整体相似结果作为专利侵权判定依据,事实上专利侵权检测是针对单个权利要求的,只要专利中有一个权利要求侵权其他专利,该专利就会被判定为侵权,这种对判定对象针对性的缺失导致实验结果的准确性降低。

综上所述,现有技术存在的问题是:

(1)过去专利侵权检测的自动化方法对非显而易见性的检测效果差。

(2)过去方法没有将专利文本与其他普通文本区别开来,对比过程中只考虑了文本本身,没有考虑专利申请人的理性决策。

(3)过去方法的对比方法没有考虑到确定专利的新颖性的过程是一个双向的过程,没有涉及到该专利比之前专利少的技术特征。以上问题导致专利侵权检测的结果并不准确。

(4)现有技术的检测方法中对侵权对象表征信息的不精确导致实验结果准确性不高。

(5)现有技术的检测方法中对真实侵权场景信息的不准确表达导致实验结果可靠性不高。

(6)现有技术的检测方法中针对性信息的丢失导致实验结果精确性不高。

解决上述技术问题的难度:传统的对比方法对于非显而易见性的检测难以进行;只考虑对比的方法无法体现申请人的决策过程。传统的对比方法难以表示专利构成的层次性;对于侵权真实场景难以体现;对于专利侵权判定的针对性的表达存在困难。

解决上述技术问题的意义:结合法律知识以及专利审核的实际过程,更加准确的对专利侵权进行检测,可以提高结果准确度,降低专利申请人的损失。结合法律知识、专利文本结构以及专利审核的实际过程,更加准确的对专利侵权进行检测,可以提高结果准确度,降低专利申请人的损失,缩短专利审查周期。



技术实现要素:

针对现有技术存在的问题,本发明提供了一种基于博弈论的专利侵权检测方法及系统。本发明根据自然语言处理的步骤首先需要对数据进行预处理,然后需要计算博弈过程中用到的数值,最后通过博弈得到最终结果。本发明根据自然语言处理的步骤首先通过计算机技术对采集到的专利数据进行搜索和预处理,然后使用word2vec得到的相似性作为技术特征之间的相似关系,基于专利结构和相似关系构建博弈树,通过计算期望支付选定专利中的技术特征和权利要求,得到侵权风险。重复上述过程,汇总侵权风险以生成侵权风险检测报告。

本发明是这样实现的,一种基于博弈论的专利侵权检测方法及系统,所述基于博弈论的专利侵权检测方法具体包括:

步骤一,进行数据采集,由于采集到的数据不符合实验数据的结构,需要对采集的数据进行预处理。

步骤二,通过分析专利文本发现,专利的技术特征一般由名词表示,因此将名词作为专利的技术特征,通过计算技术特征的新颖性、非显而易见性以及权利要求之间、专利之间的博弈进行侵权风险计算。

步骤三,博弈结果得到的支付即为专利侵权风险。

进一步,步骤一中,提供了实验所需数据,所述数据采集包括:

(1)美国专利商标局(uspto)包含了最为全面、完整的专利申请以及专利授予信息,因此选用专利商标局(uspto)的专利本文作为数据源。

(2)基于网络爬虫的方法批量获取专利商标局(uspto)的专利数据。

进一步,所述数据预处理包括:

(1)专利的核心技术都写在专利文本的权利要求部分,因此抽取专利数据中的权利要求书。

(2)实验所需数据就是权利要求部分的名词,因此对抽取出的文本数据进行停用词、分词、提取名词处理。

(3)为后续计算新颖性和非显而易见性,使用word2vec对词进行向量化。

进一步,步骤二中,为后续博弈过程提供数据支持,所述技术特征的新颖性以及非显而易见性计算方法具体包括:

(1)通过使用词向量计算距离,选取权利要求中的某个词,因为只要两个词是相近的则它们的新颖性就低,因此计算这个词到其他权利要求中词的最短距离(也即1-最大相似度)作为这个词所对应的技术特征支付的新颖性。

(2)通过使用词向量计算距离,选取权利要求中的某个词,因为只要两个词是相近的则它们的非显而易见性就低,因此计算这个词到它所在权利要求中其他词的最短距离(也即1-最大相似度)作为这个词所对应的技术特征的非显而易见性,并将技术特征的非显而易见性归一化之后作为技术特征的选择概率。

(3)对于权利要求的支付,将技术特征博弈结果得出的技术特征的支付作为该权利要求的支付。

(4)对于权利要求的选择概率,根据对专利文本的分析发现,权利要求的重要性除了和它是否为独立权利要求有关,还与它所含技术特征数成反比,因此综合权利要求所含技术特征数以及其是否为独立权利要求计算,归一化之后得到该权利要求选择概率。

进一步,步骤二中,所述权利要求之间、专利之间的博弈具体包括:

(1)利用节点a、b表示博弈参与人即博弈的权利要求或是博弈的专利。节点上的分支表示参与人的策略,对于每一个策略都有一个选择概率,叶子节点处表示的是参与人的支付。

(2)基于对专利文本的分析,将技术的组成元素作为技术特征。

1)当t为技术特征f时,支付函数的计算如下所示:

其中,σi表示参与人i的混合策略;-i表示除参与人i之外的参与人;表示在混合策略σi和下参与人i的支付;表示参与人-i选择混合策略σ-i时参与人i选择策略的支付;表示之间的距离,使用word2vec将词表示为词向量,使用词向量的距离作为计算结果;

2)当t为权利要求c时,支付函数的计算如下所示:

其他计算方法与上述t为技术特征f时相同;表示权利要求包含的技术特征数;表示独立权利要求;表示从属权利要求。

进一步,所述基于博弈论的专利侵权检测系统具体包括:

数据采集与预处理模块、风险计算模块、结果输出模块。

数据采集与预处理模块:与风险计算模块连接,用于选择数据源、爬取数据并对爬取数据进行处理。

风险计算模块:与数据采集与预处理模块、结果输出模块连接;用于计算技术特征的新颖性和非显而易见性,进行权利要求之间、专利之间的博弈。

结果输出模块:与风险计算模块连接,用于将博弈结果得到的支付作为专利侵权风险输出。

本发明的另一目的在于提供一种终端,所述终端实现所述基于博弈论的专利侵权检测方法的处理器。

本发明的另一目的在于提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行所述的基于博弈论的专利侵权检测方法。

本发明的另一目的在于提供一种实现所述基于博弈论的专利侵权检测方法的专利检索设备。

本发明的另一目的在于提供一种基于博弈论的专利侵权检测方法还包括:通过计算机技术对采集到的专利数据进行搜索和预处理;

对搜索和预处理后的专利数据使用word2vec得到的相似性作为技术特征之间的相似关系,基于专利结构和相似关系构建博弈树,并通过计算期望支付选定专利中的技术特征和权利要求,得到侵权风险数据;

汇总得到的所述侵权风险数据生成侵权风险检测报告。

所述基于博弈论的专利侵权检测方法进一步包括:

步骤一,进行专利数据采集,对上传的专利进行检索,对检索到的专利数据中的权利要求数据进行预处理;

步骤二,调用外部词向量数据库计算技术特征之间的相似关系作为技术特征的新颖性和创造性;

步骤三,构建以权利要求为节点,以技术特征为边的博弈树,权利要求之间进行博弈,博弈结果选中的技术特征间的支付作为权利要求侵权风险;

步骤四,构建以专利为节点,以权利要求为边的博弈树,专利之间进行博弈,博弈结果选中的权利要求间的支付作为专利侵权风险;

步骤五,汇总结果,生成侵权风险报告。

进一步,步骤一中,进行专利数据采集的方法包括:对下载的专利文本全文专利数据以xml格式保存为专利数据库;

解析上传的专利文本,根据xml格式文本中的标签提取专利的cpc分类号,根据提取到的cpc分类号在专利数据库中搜索潜在对手方专利;

通过对xml格式的上传专利和潜在对手方专利的文本数据进行提取得到专利文本中的权利要求书,然后对提取得到的权利要求书进行预处理操作,预处理后得到的文本以文档形式存储在计算机存储设备中;

对检索到的专利数据中的权利要求数据进行预处理方法包括:利用计算机文本处理技术对权利要求书中的单词进行分词、词性标注、去停用词,选取词性为名词的单词保存到计算机存储设备中。

进一步,在步骤二中,所述的外部词向量数据库包括:使用word2vec训练wiki英文语料库得到的词向量数据库,词向量数据库中的单词采用向量形式表示;选取的名词由从词向量数据库中查找到的词向量表示;

所述计算技术特征的新颖性和创造性的方法具体包括:(1)通过调用词向量数据库训练得到的模块和gensim库表示单词间的相似性,首先依次选取每个专利权利要求中的技术特征,技术特征为选取的名词,然后选取选定的技术特征和所述名词所在的权利要求中其他技术特征相似性最大的值,最后该值到1的距离为该技术特征的创造性;

(2)通过调用词向量数据库训练得到的模块和gensim库表示单词间的相似性,依次选取两个专利中权利要求中的技术特征,每次选中的两个技术特征的相似性到1的距离为对应的技术特征的新颖性;

(3)将计算得到的创造性和新颖性以文档形式存储到计算机存储设备中。

进一步,在步骤三中,以边所表示的技术特征的创造性作为博弈树中对应边的权值,以边所表示的技术特征之间的新颖性作为对应的前者技术特征的支付,新颖性的值到1的距离作为后者技术特征的支付;将计算得到的支付以文档形式存储到计算机存储设备中;

专利1表示上传专利,专利2表示潜在对手方专利中的一个专利,专利1中权利要求1和专利2中权利要求2进行博弈,根据博弈结果专利1权利要求1选中的技术特征通过以下过程得到:

v(s)表示专利1中权利要求的某个技术特征s的期望支付,其中σ(s)表示技术特征s对应边上的权值;v(s,s’)表示专利1申请人选择技术特征s,专利2申请人选择技术特征s’时的专利申请人的支付;s’表示专利2中权利要求2中的全部技术特征;

通过计算机运行得到专利1中权利要求1的每个技术特征的期望支付,选取该权利要求中期望支付最大的技术特征为该权利要求中的对专利申请人最有利的技术特征1;选取专利2中权利要求2的最有利技术特征2,技术特征1和技术特征2为专利1权利要求1和专利2权利要求2通过博弈选中的两个技术特征,并将结果以文档形式存储到计算机存储设备中。

进一步,在步骤四中,以边所表示的权利要求的权重作为边的权值,以边所表示的权利要求之间的博弈结果作为对应的权利要求的支付;权利要求之间的博弈结果为选定的最有利的技术特征1、最有利的技术特征2两个技术特征;

结合权利要求的类型以及权利要求所包含的技术特征个数作为权利要求的权重:

式中表示权利要求包含的技术特征数;表示独立权利要求;表示从属权利要求;并将权重以文档形式存储到计算机存储设备中。

进一步,在步骤四中,进行专利1和专利2之间的博弈,根据博弈结果专利1和专利2选中的权利要求通过以下过程得到:

v(c)表示专利1中某个权利要求的期望支付,其中σ(c)表示权利要求c对应边上的权值;v(c,c’)表示专利1申请人选择权利要求c,专利2申请人选择权利要求c’时的专利申请人1的支付;c’表示专利2中全部的权利要求。

计算出专利1中每个权利要求的期望支付,选取该专利中期望支付最大的权利要求为该专利中的对专利1申请人最有利的权利要求1,选取专利2中的最有利权利要求2,权利要求1和权利要求2即为专利1和专利2通过博弈选中的两个权利要求,两个权利要求对应的专利1的支付即为专利的侵权风险。计算过程通过计算机运行得到,结果将专利的侵权概率以百分比形式存储在计算机存储设备上;

在步骤五中,依次检测潜在对手方专利与用户上传专利的侵权风险,将所有结果以文档的形式保存到计算机存储设备中,并将文档作为检测报告返回,通过打印设备将检测报告打印出来。

本发明的另一目的在于提供一种基于博弈论的专利侵权检测方法的基于博弈论的专利侵权检测系统,所述基于博弈论的专利侵权检测系统包括:

数据采集与预处理模块,用于进行专利数据采集,对上传的专利进行检索,对检索到的专利数据中的权利要求数据进行预处理;

技术特征间的相似关系获取模块,与数据采集与预处理模块连接,用于调用外部词向量数据库计算技术特征之间的相似关系作为技术特征的新颖性和创造性;

权利要求侵权风险分析模块,与技术特征间的相似关系获取模块连接,用于构建以权利要求为节点,以技术特征为边的博弈树,权利要求之间进行博弈,博弈结果选中的技术特征间的支付作为权利要求侵权风险;

专利侵权风险分析模块,与权利要求侵权风险分析模块连接,用于构建以专利为节点,以权利要求为边的博弈树,专利之间进行博弈,博弈结果选中的权利要求间的支付作为专利侵权风险;

侵权风险报告生成模块,用于汇总结果,生成侵权风险报告。

综上所述,本发明的优点及积极效果为:本发明提供一种检测专利权利要求侵权风险的方法,步骤1)利用计算机技术对专利数据进行采集并存储为专利数据库,用户上传专利,根据用户上传专利查找潜在对手方,并对专利文本数据的权利要求进行预处理操作;步骤2)通过计算机对专利的权利要求进行自动信息处理得到关键词即专利的技术特征,通过调用外部词向量数据库计算技术特征之间的相似关系作为技术特征的新颖性和创造性;步骤3)使用计算机构建以权利要求为节点,以技术特征为边,以技术特征的创造性为边的权重,以技术特征之间的新颖性作为支付的博弈树,在此结构下,权利要求节点之间进行博弈,采用纳什均衡原理检测出专利权利要求的侵权概率;步骤4)使用计算机构建以专利为节点,以权利要求为边,以权利要求所占权重作为边的权重,以权利要求之间的侵权概率作为支付的博弈树,在此结构下,专利节点之间进行博弈,采用纳什均衡原理检测出专利是否侵权。步骤5)汇总上传专利与所有潜在对手方专利的侵权风险,生成侵权风险报告。本发明以专利文本数据库和外部词向量数据库作为数据支撑,以数据挖掘技术作为手段,以计算机和存储介质作为平台,将专利最重要部分权利要求书作为主要研究对象,同时考虑专利的新颖性和创造性,通过对专利权利要求的加工构建博弈树,通过计算机实现权利要求节点、专利节点之间进行博弈,最终根据纳什均衡原理判断专利是否侵权。实现了专利侵权检测的自动化,提高了侵权检测效率和结果准确率,可以有效的运用到专利申请人预检测和专利审查的实际中。

本发明在侵权检测过程中将专利的最重要部分权利要求书作为主要分析对象,通过对专利的层次表示提高了侵权对象表征的精确性;考虑到真实的侵权场景,使用博弈方法体现出真实场景的双向性;仔细研究侵权判定依据,补充了侵权判定针对权利要求这一信息。本发明全方位的考虑了各种因素对于结果精确性和可靠性的影响,有效提高了专利侵权检测的效率和准确率,可以很好的运用在专利申请人专利侵权预检测和专利审核过程中。

本发明在侵权检测过程中同时对新颖性和非显而易见性进行检测,克服了技术偏见,结合精深的法律和专利的相关专业知识取得了很好的实验结果;本发明在侵权风险计算过程中考虑了专利申请人的理性决策过程,解决了人们一直渴望解决、但始终未能获得成功的,关于实际检测过程的技术难题。本发明综合考虑了专利新颖性的双向过程,既考虑了该专利比之前专利多的技术特征,还考虑了该专利比之前专利少的那些技术特征,全方位的考虑了各种因素对于结果准确性的影响;填补了国内外空白,对于专利文本比较提出了新的策略。

本发明通过计算机技术对采集到的专利数据进行搜索和预处理;对搜索和预处理后的专利数据使用word2vec得到的相似性作为技术特征之间的相似关系,基于专利结构和相似关系构建博弈树,并通过计算期望支付选定专利中的技术特征和权利要求,得到侵权风险数据;汇总得到的所述侵权风险数据生成侵权风险检测报告。本发明通过计算机实现权利要求节点、专利节点之间进行博弈,最终根据纳什均衡原理判断专利是否侵权;实现了专利侵权检测的自动化,提高了侵权检测效率和结果准确率,可以有效的运用到专利申请人预检测和专利审查的实际中。

附图说明

图1是本发明实施例提供的基于博弈论的专利侵权检测方法流程图。

图2是本发明实施例提供的基于博弈论的专利侵权检测原理图。

图3是本发明实施例提供的博弈过程示意图。

图4是本发明实施例提供的基于博弈论的专利侵权检测系统结构示意图。

图5是本发明实施例提供的检测专利权利要求侵权风险的方法流程图。

图6是本发明实施例提供的技术特征博弈树示意图。

图7是本发明实施例提供的权利要求博弈树示意图。

图8本发明实施例提供的检测专利权利要求侵权风险的方法侵权检测报告样例图。

图9是本发明实施例提供的技术方案图。

图10是本发明实施例提供的基于博弈论的专利侵权检测系统示意图。

图中:1、数据采集与预处理模块;2、风险计算模块;3、结果输出模块;4、技术特征间的相似关系获取模块;5、权利要求侵权风险分析模块;6、专利侵权风险分析模块;7、侵权风险报告生成模块。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

过去专利侵权检测的自动化方法对非显而易见性的检测效果差。过去方法没有将专利文本与其他普通文本区别开来,对比过程中只考虑了文本本身,没有考虑专利申请人的理性决策。过去方法的对比方法没有考虑到确定专利的新颖性的过程是一个双向的过程,没有涉及到该专利比之前专利少的技术特征。以上问题导致专利侵权检测的结果并不准确。

针对现有技术存在的问题,本发明提供了一种基于博弈论的专利侵权检测方法,下面结合附图对本发明作详细的描述。

如图1所示,本发明实施例提供的基于博弈论的专利侵权检测方法具体包括:

s101:进行数据采集,并对采集的数据进行预处理。

s102:通过计算技术特征的新颖性、非显而易见性以及权利要求之间、专利之间的博弈进行侵权风险计算。

s103:博弈结果得到的支付即为专利侵权风险。

步骤s101中,本发明实施例提供的数据采集以及数据预处理具体包括:

数据采:(1)选用专利商标局(uspto)的专利本文作为数据源。(2)基于网络爬虫的方法批量获取专利商标局(uspto)的专利数据。

数据预处理:(1)抽取专利数据中的权利要求书。(2)对抽取出的文本数据进行停用词、分词处理。(3)使用word2vec对词进行向量化。

步骤s102中,本发明实施例提供的技术特征的新颖性以及非显而易见性计算方法具体包括:

(1)通过使用词向量计算距离,选取该技术特征到其他权利要求的技术特征的最短距离作为该技术特征的新颖性也即技术特征的支付。

(2)通过使用词向量计算距离,选取该技术特征到本权利要求的其他技术特征的最短距离作为该技术特征的非显而易见性也即技术特征的选择概率。

(3)对于权利要求的支付,将技术特征博弈结果得出的技术特征的支付作为该权利要求的支付。

(4)对于权利要求的选择概率,综合权利要求所含技术特征数以及其是否为独立权利要求计算得到该权利要求选择概率。

在本发明实施例中,图2是提供的基于博弈论的专利侵权检测原理。

如图3所示,步骤s102中,本发明实施例提供的权利要求之间、专利之间的博弈具体包括:

(1)将博弈参与人即进行博弈的权利要求或是专利分别视为节点a、b。节点上的分支表示参与人的策略,对于每一个策略都有一个选择概率,叶子节点处表示的是参与人的支付。

(2)基于对专利文本的分析,将技术的组成元素作为技术特征。

1)当t为技术特征f时,支付函数的计算如下所示:

其中,σi表示参与人i的混合策略。-i表示除参与人i之外的参与人。表示在混合策略σi和下参与人i的支付。表示参与人-i选择混合策略σ-i时参与人i选择策略的支付。表示之间的距离,使用word2vec将词表示为词向量,使用词向量的距离作为计算结果。

2)当t为权利要求c时,支付函数的计算如下所示:

其他计算方法与上述t为技术特征f时相同。表示权利要求包含的技术特征数。表示独立权利要求。表示从属权利要求。

如图4所示,本发明实施例提供的基于博弈论的专利侵权检测系统具体包括:

数据采集与预处理模块1、风险计算模块2、结果输出模块3。

数据采集与预处理模块1:与风险计算模块2连接,用于选择数据源、爬取数据并对爬取数据进行处理。

风险计算模块2:与数据采集与预处理模块1、结果输出模块3连接。用于计算技术特征的新颖性和非显而易见性,进行权利要求之间、专利之间的博弈。

结果输出模块3:与风险计算模块2连接,用于将博弈结果得到的支付作为专利侵权风险输出。

下面结合附图对本发明的技术方案作进一步的描述。

如图5所示,本发明实施例提供的基于博弈论的专利侵权检测方法具体包括:

s501:进行专利数据采集,用户上传专利并进行检索,对检索到的专利数据中的权利要求数据进行预处理。

s502:调用外部词向量数据库计算技术特征之间的相似关系作为技术特征的新颖性和创造性。

s503:构建以权利要求为节点,以技术特征为边的博弈树,权利要求之间进行博弈,博弈结果选中的技术特征间的支付作为权利要求侵权风险。

s504:构建以专利为节点,以权利要求为边的博弈树,专利之间进行博弈,博弈结果选中的权利要求间的支付作为专利侵权风险。

s105:汇总结果,生成侵权风险报告。

步骤s501中,所述数据采集包括:从美国专利商标局(uspto)下载的美国专利数据,数据包含专利文本全文且以xml格式保存为专利数据库,由于xml格式对专利文本的各个部分都有标签,本发明通过提取特定标签内容就可以得到所需的专利对应部分,根据用户上传专利从专利数据库中检索符合条件的专利作为潜在对手方,然后对搜索到的专利和上传专利提取得到权利要求书并进行预处理操作。检索操作包括:对美国专利而言,cpc分类号是依据专利的应用领域确定的,因此根据xml中标签提取上传专利的cpc分类号可确定该专利的应用领域,使用提取到的cpc分类号在专利数据库中检索同cpc分类号的专利,即搜素到同领域下的专利。预处理操作包括:利用计算机文本处理技术对权利要求书中的单词进行分词、词性标注、去停用词,权利要求书中最多的,最能体现专利技术特征的是名词,因此选取词性为名词的单词保存。

步骤s502中,wiki英文语料库是目前最为全面、数据量最大的数据库,word2vec词向量表示能很好的表现出词语之间的语义关系,基于以上考虑本发明使用word2vec训练wiki英文语料库得到的词向量数据库,数据库中的单词表示为向量形式。将预处理后得到的名词则由从词向量数据库中查找到的词向量表示。

通过对词向量的计算可以体现出单词之间的远近关系,通过计算机计算得到的相似性表示的是单词之间的相似程度,另外本发明使用词之间的距离表示词的远近程度,使用计算得到的相似性到1的距离表示。基于此可得到技术特征(即预处理后得到的名词,后文中使用技术特征表示对应的名词)的新颖性和创造性。具体方法包括:

(1)通过调用词向量数据库训练得到的模块和gensim库表示单词间的相似性。技术特征的创造性是指在该领域下该技术有明显先进性。本发明使用权利要求的技术特征表示技术领域,使用技术特征到其所在权利要求中技术特征的最小距离作为该技术特征的创造性。首先选取一个技术特征,然后选取该技术特征和他所在的权利要求中其他技术特征距离最小值作为该技术特征的创造性;

(2)技术特征的新颖性是指技术不属于现有技术。本发明使用其他专利的权利要求表示现有技术,使用技术特征和其他专利中的技术特征的距离作为他们之间的相对新颖性。首先选取一个技术特征,另选一个其他专利中的技术特征,两个技术特征的距离即为该技术特征的新颖性。

步骤s503中,专利申请人在申诉过程中会选择专利权利要求中最具创造性的技术特征作为申述证据,故以边所表示的技术特征的创造性作为博弈树中对应边的权值,边上权值体现专利申请人选择该技术特征的概率。专利的技术特征在与其他专利技术特征比较时,新颖性体现了该技术特征相对于其他专利技术特征赢的可能性,故以边所表示的技术特征之间的新颖性作为对应的前者技术特征的支付,两个专利的比较结果是此消彼长的状态,故技术特征之间的相似性作为后者技术特征的支付,构建的技术特征博弈树如图6所示。

假设专利1表示用户上传专利,专利2表示潜在对手方专利中的一个专利,在此使用专利1中权利要求1和专利2中权利要求2进行博弈,根据博弈结果专利1权利要求1选中的技术特征通过以下过程得到:

v(s)表示专利1中权利要求的某个技术特征s的期望支付,其中σ(s)表示技术特征s对应边上的权值;v(s,s’)表示专利1申请人选择技术特征s,专利2申请人选择技术特征s’时的专利申请人的支付;s’表示专利2中权利要求2中的全部技术特征。

计算出专利1中权利要求1的每个技术特征的期望支付,选取该权利要求中期望支付最大的技术特征为该权利要求中的对专利申请人最有利的技术特征1,同样,选取专利2中权利要求2的最有利技术特征2,技术特征1和技术特征2即为专利1权利要求1和专利2权利要求2通过博弈选中的两个技术特征。

步骤s504中,构建以专利为节点,以权利要求为边的博弈树,专利之间进行博弈,博弈结果选中的权利要求间的支付作为专利侵权风险。

专利文本的构成具有层次性,专利中包含权利要求,权利要求包含技术特征,故在建立了以权利要求为节点,以技术特征为边的博弈树之后,需要建立以专利为节点,以权利要求为边的博弈树。边所表示的权利要求的权重作为边的权值,以边所表示的权利要求之间的博弈结果作为对应的权利要求的支付,构建的权利要求博弈树如图7所示。

权利要求分为独立权利要求和从属权利要求,从属权利要求是对独立权利要求的细化,权利要求书中,对于独立权利要求的保护更为重视。且相对于技术特征较多的权利要求,技术特征较少的权利要求更为重要一些。因此本发明结合权利要求的类型以及权利要求所包含的技术特征个数作为权利要求的权重:

式中表示权利要求包含的技术特征数;表示独立权利要求;表示从属权利要求。

权利要求之间的博弈结果即为权利要求7选定的两个技术特征。

例如专利1和专利2之间进行博弈,根据博弈结果专利1和专利2选中的权利要求通过以下过程得到:

v(c)表示专利1中某个权利要求的期望支付,其中σ(c)表示权利要求c对应边上的权值;v(c,c’)表示专利1申请人选择权利要求c,专利2申请人选择权利要求c’时的专利申请人1的支付;c’表示专利2中全部的权利要求。

计算出专利1中每个权利要求的期望支付,选取该专利中期望支付最大的权利要求为该专利中的对专利1申请人最有利的权利要求1,同样,选取专利2中的最有利权利要求2,权利要求1和权利要求2即为专利1和专利2通过博弈选中的两个权利要求,两个权利要求对应的专利1的支付即为专利的侵权风险。最终的博弈结果是每个专利申请人都选择对自己最有利的权利要求中的最有利的技术特征,技术特征之间的距离作为专利申请人侵权风险。

步骤s505中,对于根据cpc分类号搜索到的专利依次通过计算机运行得到与用户上传专利的侵权风险,将所有的结果以文档的形式保存到计算机存储设备中,以文档形式作为检测报告返回给用户,用户可通过打印设备将检测报告打印出来。如图8为侵权风险检测报告样例。

本发明的总体技术方案流程如图9所示。

如图10所示,本发明实施例提供一种基于博弈论的专利侵权检测系统包括:

数据采集与预处理模块1,用于进行专利数据采集,对上传的专利进行检索,对检索到的专利数据中的权利要求数据进行预处理。

技术特征间的相似关系获取模块4,与数据采集与预处理模块1连接,用于调用外部词向量数据库计算技术特征之间的相似关系作为技术特征的新颖性和创造性。

权利要求侵权风险分析模块5,与技术特征间的相似关系获取模块连接,用于构建以权利要求为节点,以技术特征为边的博弈树,权利要求之间进行博弈,博弈结果选中的技术特征间的支付作为权利要求侵权风险。

专利侵权风险分析模块6,与权利要求侵权风险分析模块5连接,用于构建以专利为节点,以权利要求为边的博弈树,专利之间进行博弈,博弈结果选中的权利要求间的支付作为专利侵权风险。

侵权风险报告生成模块7,用于汇总结果,生成侵权风险报告。

本发明和现有技术的方法对比如表1。

表1

下面结合实验对本发明的技术效果作详细的描述。

本发明的实验数据是从uspto下载的专利,其中专利us7645279和专利us6652523均为有效专利,即不涉及侵权问题,专利us6736759因专利us6002982被判定为无效专利,即涉及侵权问题。为了验证本发明提出方法的有效性,实验与现有技术中较先进的方法(公开了该方法的参考文献:changyonglee,bomisong,yongtaepark.howtoassesspatentinfringementrisks:asemanticpatentclaimanalysisusingdependencyrelationships.techn.analysis&strat.manag.25(1):23-38(2013).)进行比较。

表2为本发明方法与现有技术方法关于专利us7645279和专利us6652523的对比实验结果。

表2

表3为本发明方法与现有技术方法关于专利us6002982和专利us6736759的对比实验结果。

表3

其中m1表示本发明提出的方法,m2表示上述现有技术中的方法,通过表格可以看出,m2的最终结果是两篇专利的整体相似性,m1的最终结果是根据方法选出的权利要求和技术特征计算侵权风险,对于专利us7645279和专利us6652523的实验结果,m1的侵权风险低于m2,结合两篇专利不侵权的事实,m1的结果优于m2。对于专利us6002982和专利us6736759的实验结果,m1的侵权风险高于m2,结合两篇专利侵权的事实,m1的结果优于m2。表格进一步分析了两个方法的实验过程,m2方法根据总体相似度计算技术特征、权利要求和专利的侵权风险,m1选择两个专利各自的最有利技术特征、权利要求作为专利侵权风险。由于m1考虑到专利审核过程中以权利要求为单位,即只要有一个权利要求侵权专利就侵权,且专利申请人双方都会选择对自己最有利进行申诉,所以m1较m2准确性更高。

综上所述,m1对侵权对象表征更为精确,对真实侵权场景信息的表达更为准确,且没有丢失对权利要求的针对性信息,基于以上优势,m1的实验结果较m2可靠性和准确性更高。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。


技术特征:

1.一种基于博弈论的专利侵权检测方法,其特征在于,所述基于博弈论的专利侵权检测方法具体包括:

步骤一,进行数据采集,并对采集的数据进行预处理;

步骤二,将名词作为专利的技术特征,通过计算技术特征的新颖性、非显而易见性以及权利要求之间、专利之间的博弈进行侵权风险计算;

步骤三,获得专利侵权风险博弈结果。

2.如权利要求1所述基于博弈论的专利侵权检测方法,其特征在于,步骤一中,所述数据采集包括:选用专利本文作为数据源;基于网络爬虫的方法批量获取专利商标局的专利数据。

3.如权利要求1所述基于博弈论的专利侵权检测方法,其特征在于,步骤一中,所述数据预处理包括:抽取专利数据中的权利要求书;对抽取出的文本数据进行停用词、分词处理;使用word2vec对词进行向量化。

4.如权利要求1所述基于博弈论的专利侵权检测方法,其特征在于,步骤二中,所述技术特征的新颖性以及非显而易见性计算方法具体包括:

(1)通过使用词向量计算距离,选取权利要求中的某个词,计算这个词到其他权利要求中词的最短距离作为这个词所对应的技术特征支付的新颖性;

(2)通过使用词向量计算距离,选取权利要求中的某个词,计算这个词到它所在权利要求中其他词的最短距离作为这个词所对应的技术特征支付的新颖性;

(3)对于权利要求的支付,将技术特征博弈结果得出的技术特征的支付作为该权利要求的支付;

(4)对于权利要求的选择概率,综合权利要求所含技术特征数以及是否为独立权利要求计算得到该权利要求选择概率。

5.如权利要求1所述基于博弈论的专利侵权检测方法,其特征在于,步骤二中,所述权利要求之间、专利之间的博弈具体包括:

1)利用节点a、b表示博弈参与人即博弈的权利要求或是博弈的专利;节点上的分支表示参与人的策略,对于每一个策略均有一个选择概率,叶子节点处表示的是参与人的支付;

2)基于对专利文本的分析,将技术的组成元素作为技术特征。

6.如权利要求5所述基于博弈论的专利侵权检测方法,其特征在于,步骤1)具体包括:

i)当t为技术特征f时,支付函数的计算式为:

其中,σi表示参与人i的混合策略;-i表示除参与人i之外的参与人;表示在混合策略σi和下参与人i的支付;表示参与人-i选择混合策略σ-i时参与人i选择策略的支付;表示之间的距离,使用word2vec将词表示为词向量,使用词向量的距离作为计算结果;

ii)当t为权利要求c时,支付函数的计算式为:

表示权利要求包含的技术特征数;表示独立权利要求;表示从属权利要求。

7.一种实施权利要求1所述基于博弈论的专利侵权检测方法的及基于博弈论的专利侵权检测系统,其特征在于,所述基于博弈论的专利侵权检测系统具体包括:

数据采集与预处理模块、风险计算模块、结果输出模块;

数据采集与预处理模块:与风险计算模块连接,用于选择数据源、爬取数据并对爬取数据进行处理;

风险计算模块:与数据采集与预处理模块、结果输出模块连接;用于计算技术特征的新颖性和非显而易见性,进行权利要求之间、专利之间的博弈;

结果输出模块:与风险计算模块连接,用于将博弈结果得到的支付作为专利侵权风险输出。

8.一种终端,其特征在于,所述终端实现权利要求1~6任意一项所述基于博弈论的专利侵权检测方法的处理器。

9.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如要求1-6任意一项所述的基于博弈论的专利侵权检测方法。

10.一种实现权利要求1~6任意一项所述基于博弈论的专利侵权检测方法的专利检索设备。

11.如权利要求1所述的基于博弈论的专利侵权检测方法,其特征在于,所述基于博弈论的专利侵权检测方法还包括:通过计算机技术对采集到的专利数据进行搜索和预处理;

对搜索和预处理后的专利数据使用word2vec得到的相似性作为技术特征之间的相似关系,基于专利结构和相似关系构建博弈树,并通过计算期望支付选定专利中的技术特征和权利要求,得到侵权风险数据;

汇总得到的所述侵权风险数据生成侵权风险检测报告。

12.如权利要求11所述的基于博弈论的专利侵权检测方法,其特征在于,所述基于博弈论的专利侵权检测方法进一步包括:

步骤一,进行专利数据采集,对上传的专利进行检索,对检索到的专利数据中的权利要求数据进行预处理;

步骤二,调用外部词向量数据库计算技术特征之间的相似关系作为技术特征的新颖性和创造性;

步骤三,构建以权利要求为节点,以技术特征为边的博弈树,权利要求之间进行博弈,博弈结果选中的技术特征间的支付作为权利要求侵权风险;

步骤四,构建以专利为节点,以权利要求为边的博弈树,专利之间进行博弈,博弈结果选中的权利要求间的支付作为专利侵权风险;

步骤五,汇总结果,生成侵权风险报告。

13.如权利要求12所述的基于博弈论的专利侵权检测方法,其特征在于,步骤一中,进行专利数据采集的方法包括:对下载的专利文本全文专利数据以xml格式保存为专利数据库;

解析上传的专利文本,根据xml格式文本中的标签提取专利的cpc分类号,根据提取到的cpc分类号在专利数据库中搜索潜在对手方专利;

通过对xml格式的上传专利和潜在对手方专利的文本数据进行提取得到专利文本中的权利要求书,然后对提取得到的权利要求书进行预处理操作,预处理后得到的文本以文档形式存储在计算机存储设备中;

对检索到的专利数据中的权利要求数据进行预处理方法包括:利用计算机文本处理技术对权利要求书中的单词进行分词、词性标注、去停用词,选取词性为名词的单词保存到计算机存储设备中。

14.如权利要求12所述的基于博弈论的专利侵权检测方法,其特征在于,在步骤二中,所述的外部词向量数据库包括:使用word2vec训练wiki英文语料库得到的词向量数据库,词向量数据库中的单词采用向量形式表示;选取的名词由从词向量数据库中查找到的词向量表示;

所述计算技术特征的新颖性和创造性的方法具体包括:(1)通过调用词向量数据库训练得到的模块和gensim库表示单词间的相似性,首先依次选取每个专利权利要求中的技术特征,技术特征为选取的名词,然后选取选定的技术特征和所述名词所在的权利要求中其他技术特征相似性最大的值,最后该值到1的距离为该技术特征的创造性;

(2)通过调用词向量数据库训练得到的模块和gensim库表示单词间的相似性,依次选取两个专利中权利要求中的技术特征,每次选中的两个技术特征的相似性到1的距离为对应的技术特征的新颖性;

(3)将计算得到的创造性和新颖性以文档形式存储到计算机存储设备中。

15.如权利要求12所述的基于博弈论的专利侵权检测方法,其特征在于,在步骤三中,以边所表示的技术特征的创造性作为博弈树中对应边的权值,以边所表示的技术特征之间的新颖性作为对应的前者技术特征的支付,新颖性的值到1的距离作为后者技术特征的支付;将计算得到的支付以文档形式存储到计算机存储设备中;

专利1表示上传专利,专利2表示潜在对手方专利中的一个专利,专利1中权利要求1和专利2中权利要求2进行博弈,根据博弈结果专利1权利要求1选中的技术特征通过以下过程得到:

v(s)表示专利1中权利要求的某个技术特征s的期望支付,其中σ(s)表示技术特征s对应边上的权值;v(s,s’)表示专利1申请人选择技术特征s,专利2申请人选择技术特征s’时的专利申请人的支付;s’表示专利2中权利要求2中的全部技术特征;

通过计算机运行得到专利1中权利要求1的每个技术特征的期望支付,选取该权利要求中期望支付最大的技术特征为该权利要求中的对专利申请人最有利的技术特征1;选取专利2中权利要求2的最有利技术特征2,技术特征1和技术特征2为专利1权利要求1和专利2权利要求2通过博弈选中的两个技术特征,并将结果以文档形式存储到计算机存储设备中。

16.如权利要求12所述的基于博弈论的专利侵权检测方法,其特征在于,在步骤四中,以边所表示的权利要求的权重作为边的权值,以边所表示的权利要求之间的博弈结果作为对应的权利要求的支付;权利要求之间的博弈结果为选定的最有利的技术特征1、最有利的技术特征2两个技术特征;

结合权利要求的类型以及权利要求所包含的技术特征个数作为权利要求的权重:

式中表示权利要求包含的技术特征数;表示独立权利要求;表示从属权利要求;并将权重以文档形式存储到计算机存储设备中。

17.如权利要求12所述的基于博弈论的专利侵权检测方法,其特征在于,在步骤四中,进行专利1和专利2之间的博弈,根据博弈结果专利1和专利2选中的权利要求通过以下过程得到:

v(c)表示专利1中某个权利要求的期望支付,其中σ(c)表示权利要求c对应边上的权值;v(c,c’)表示专利1申请人选择权利要求c,专利2申请人选择权利要求c’时的专利申请人1的支付;c’表示专利2中全部的权利要求。

计算出专利1中每个权利要求的期望支付,选取该专利中期望支付最大的权利要求为该专利中的对专利1申请人最有利的权利要求1,选取专利2中的最有利权利要求2,权利要求1和权利要求2即为专利1和专利2通过博弈选中的两个权利要求,两个权利要求对应的专利1的支付即为专利的侵权风险。计算过程通过计算机运行得到,结果将专利的侵权概率以百分比形式存储在计算机存储设备上;

在步骤五中,依次检测潜在对手方专利与用户上传专利的侵权风险,将所有结果以文档的形式保存到计算机存储设备中,并将文档作为检测报告返回,通过打印设备将检测报告打印出来。

18.一种实施权利要求11~17任意一项所述基于博弈论的专利侵权检测方法的基于博弈论的专利侵权检测系统,其特征在于,所述基于博弈论的专利侵权检测系统包括:

数据采集与预处理模块,用于进行专利数据采集,对上传的专利进行检索,对检索到的专利数据中的权利要求数据进行预处理;

技术特征间的相似关系获取模块,与数据采集与预处理模块连接,用于调用外部词向量数据库计算技术特征之间的相似关系作为技术特征的新颖性和创造性;

权利要求侵权风险分析模块,与技术特征间的相似关系获取模块连接,用于构建以权利要求为节点,以技术特征为边的博弈树,权利要求之间进行博弈,博弈结果选中的技术特征间的支付作为权利要求侵权风险;

专利侵权风险分析模块,与权利要求侵权风险分析模块连接,用于构建以专利为节点,以权利要求为边的博弈树,专利之间进行博弈,博弈结果选中的权利要求间的支付作为专利侵权风险;

侵权风险报告生成模块,用于汇总结果,生成侵权风险报告。

技术总结
本发明属于信息检索技术领域,公开了一种基于博弈论的专利侵权检测方法及系统,进行数据采集,并对采集的数据进行预处理;通过计算技术特征的新颖性、非显而易见性以及权利要求之间、专利之间的博弈进行侵权风险计算;博弈结果得到的支付即为专利侵权风险。本发明在侵权检测过程中同时对新颖性和非显而易见性进行检测,克服了技术偏见,结合精深的法律和专利的相关专业知识取得了很好的实验结果;本发明在侵权风险计算过程中考虑了专利申请人的理性决策过程,解决了人们一直渴望解决、但始终未能获得成功的,关于实际检测过程的技术难题;本发明填补了国内外空白,对于专利文本比较提出了新的策略。

技术研发人员:刘维东;刘小博;孔佑东
受保护的技术使用者:内蒙古大学
技术研发日:2020.01.17
技术公布日:2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-51486.html

最新回复(0)