一种科技专家资源虚拟化与语义推理检索方法,属于科技服务技术领域。
背景技术:
随着科教兴国战略的深入实施,在科技服务领域中科技专家信息是一类重要的科技资源,科技专家在项目评审、决策咨询、创业项目审核等方面发挥着重要作用。在科技区域一体化的不断推动下,跨区域、跨学科的科技专家匹配检索需求尤为迫切。但当前各城市区域的科技专家资源仍存在分散独立、资源信息不统一、信息平台间缺乏共享渠道等问题,科技专家资源已无法适应科技一体化发展需求,无法为科技创新发展提供便捷、高效的科技服务。为突破当前科技专家服务现状,促进科技专家服务向高端迈进,需构建新型科技专家服务资源检索匹配方法。
利用信息技术解决科技专家匹配检索的相关难点问题已有不少学者进行了研究。2005年,liup等人提出利用资源描述框架(resourcedescriptionframework,rdf)构建领域专家信息,实现异构数据专家信息融合。2007年,alemanmezab等人提出使用语义网络描述专家信息及其关系,然后进行专家语义检索提高检索精度。2010年,刘萍等人基于本体技术实现了专家定位原型系统,该系统可查询专家信息,能够满足选择专家的需求。2016年,protasiewicz等人研究了数据、信息、知识之间的关系,提出了一个基于内容的评审专家与研究文献匹配的推荐系统;ruiz-martínez等人为了给研究项目选择合适的评估专家,提出了一个专家管理的本体模型。该模型通过专家知识本体、语义关系设计实现了专家推荐系统;陈泽亚等人研究了评审项目与专家多重匹配策略,提出两种贪心匹配策略与一种传统最大流匹配组合策略。2017年,宋培彦等人构建了科技专家语义模型,将异构专家信息进行语义化描述,并采用rdf进行形式化描述,实现具有语义关系的专家信息库;陈丽丽等人给出了规范化专家信息的建议;蔡桂兰等人提出了构建包含向量空间模型与协同过滤模型的专家智能匹配技术。
从上述文献来看,针对专家信息模型、语义匹配等技术研究取得了较多的成果,但均缺少跨区域、跨学科、跨平台的资源共享集成方法,以及完整的科技资源虚拟化、专家库描述框架、语义推理逻辑或匹配等技术栈方法。因此,设计一种解决跨区域、跨平台的科技专家资源虚拟化,构建统一的科技专家信息模型,基于语义推理进行科技专家快速匹配方法,成为亟待解决的问题。
技术实现要素:
本发明要解决的技术问题是:克服现有技术的不足,提供一种-能够实现跨区域科技专家资源共享和集成,科技专家检索方法更便捷、信息更丰富,匹配结果更可靠、更智能,能够较好地满足选择科技专家需求的科技专家资源虚拟化与语义推理检索方法。
本发明解决其技术问题所采用的技术方案是:该科技专家资源虚拟化与语义推理检索方法,其特征在于:包括如下步骤:
步骤1001,形式化定义科技专家资源;
步骤1002,科技专家资源封装与虚拟化;
步骤1003,结合科技专家信息规范,分析专家信息规范概念及其实体之间的关系,构建基于owl描述的科技专家领域本体;
步骤1004,基于swrl语义推理规范,定义科技专家信息匹配的语义推理规则;
步骤1005,借助jena推理机实现科技专家匹配检索。
优选的,在步骤1001中,所述科技专家资源的形式化定义为:
eres={er_name,er_id,er_des,er_count,er_type,ermodel}
其中,科技专家资源eres的属性定义包括:er_name表示科技专家服务资源名称;er_id表示科技专家服务资源所属的服务提供单位的唯一标识;er_des对科技专家服务资源进行描述或说明;er_count表示了科技专家服务资源的个数;er_type描述了科技专家服务资源的学科类型;ermodel表示科技专家信息模型;
其中,科技专家信息模型ermodel表示为:
ermodel={baseinfo,eduexp,workexp,entrexp,achieve,other}
其中,baseinfo表示科技专家基本信息,包括专家姓名、性别、出生年月、证件号码、工作单位、现任职务;eduexp表示科技专家教育经历,包括高中、大学、研究生、国外访学的受教育历程信息;workexp表示工作经历,包括所工作过的单位信息;entrexp表示创业经历信息,包括创业领域、创业公司信息、创业成果;achieve表示科技专家主要业绩和专长,包括项目成果、论文成果、专利、奖励、领域专长;other表示备注信息。
优选的,在执行步骤1002中所述的科技专家资源封装与虚拟化时,科技专家资源模型使用xmlschema格式进行表达封装;然后在资源接口层,使用wsdl定义与web服务对应的操作接口。
优选的,在步骤1003中所述的科技专家领域本体中,顶层包括expert科技专家、search_field科技专家研究领域两个对象。
优选的,在步骤1004中,所述的swrl语义推理规则为:
规则1:相同研究领域sameprojectfield、相关研究方向samesearchdirection、状态正常expertstatus的专家可匹配sucessmatching;
规则2:相同研究领域sameprojectfield、相关研究方向samesearchdirection、回避单位avoidxorganization、回避专家avoidxexpert、状态正常expertstatus的专家可匹配sucessmatching;
规则3:不相同研究领域differentprojectfield、相关研究方向samesearchdirection、有领域相关项目havefieldproject、状态正常expertstatus的专家可匹配sucessmatching;
规则4:不相同研究领域differentprojectfield、相关研究方向samesearchdirection、有领域相关项目havefieldproject、回避单位avoidxorganization、回避专家avoidxexpert、状态正常expertstatus的专家可匹配sucessmatching;
规则5:不相同研究领域differentprojectfield、不同研究方向differentsearchdirection、相似的创业历经sameentrepreneurialexperience、状态正常expertstatus的专家可匹配sucessmatching;
规则6:不相同研究领域differentprojectfield、不同研究方向differentsearchdirection、相似的创业历经sameentrepreneurialexperience、回避单位avoidxorganization、回避专家avoidxexpert、状态正常expertstatus的专家可匹配sucessmatching。
优选的,在步骤1005中,借助jena推理机实现科技专家匹配检索包括:科技专家匹配规则文件读取、语义规则解析、jena推理、结果反馈四个阶段。
与现有技术相比,本发明所具有的有益效果是:
在本申请的科技专家资源虚拟化与语义推理检索方法中,利用科技专家资源形式化定义、科技专家资源封装实现科技专家资源虚拟化,构建了科技专家领域本体模型,定义了科技专家信息匹配语义推理规则,基于jena推理机实现科技专家匹配检索。利用本方法能够实现跨区域科技专家资源共享和集成,科技专家检索方法更便捷、信息更丰富,匹配结果更可靠、更智能,能够较好地满足选择科技专家的需求。
附图说明
图1为科技专家资源虚拟化与语义推理检索方法流程图。
图2为科技专家资源虚拟化与语义推理检索方法科技专家资源虚拟化层次结构图。
图3科技专家资源本体概念类图。
图4科技专家语义匹配检索过程。
具体实施方式
图1~4是本发明的最佳实施例,下面结合附图1~4对本发明做进一步说明。
如图1所示,一种科技专家资源虚拟化与语义推理检索方法,包括如下步骤:
步骤1001,形式化定义科技专家资源。
结合图2所示,本申请的科技专家资源虚拟化层次结构包括最底层的科技专家资源层、中间层的虚拟科技专家服务资源层以及最顶层的科技专家资源应用层。
其中,最底层的科技专家资源层具有跨区域物理实体,包括科技专家基本信息、教育经历、工作经历、创业经历、主要业绩与专长、其它信息等。中间层是虚拟科技专家服务资源层,根据科技专家服务资源描述规范对物理资源进行形式化定义。为便于统一化管理与调度,分析跨区域科技专家物理资源属性信息,抽象描述统一定义科技专家资源模型,实现科技专家虚拟资源的映射,构建服务资源库,封装专家搜索匹配算法,形成能够系统共享、统一管理的虚拟化科技专家资源库。最顶层的科技专家资源应用层,用户调用发布的web服务接口,借助jena推理机实现科技专家搜索匹配。
在科技专家资源虚拟化过程中,使用一组属性来描述专家资源,标识专家资源基本信息和提供者信息。对于跨区域科技专家科技资源有不同的描述属性,可通过对各区域科技专家资源的描述属性进行总结,找出资源间的共有属性,并对资源的专有属性使用一种统一化的描述方式进行描述,进而方便系统统一管理和调度服务资源。
科技专家资源是科技服务专家系统中搜索匹配的最小单元,其服务资源的定义是跨区域科技专家资源搜索匹配的基础,形式化定义科技专家资源为:
eres={er_name,er_id,er_des,er_count,er_type,ermodel}
其中,科技专家资源eres的属性定义包括:er_name表示科技专家服务资源名称;er_id表示科技专家服务资源所属的服务提供单位的唯一标识;er_des对科技专家服务资源进行描述或说明;er_count表示了科技专家服务资源的个数;er_type描述了科技专家服务资源的学科类型;ermodel表示科技专家信息模型。
其中,科技专家信息模型ermodel表示为:
ermodel={baseinfo,eduexp,workexp,entrexp,achieve,other}
其中,baseinfo表示科技专家基本信息,包括专家姓名、性别、出生年月、证件号码、工作单位、现任职务;eduexp表示科技专家教育经历,包括高中、大学、研究生、国外访学的受教育历程信息;workexp表示工作经历,包括所工作过的单位信息;entrexp表示创业经历信息,包括创业领域、创业公司信息、创业成果;achieve表示科技专家主要业绩和专长,包括项目成果、论文成果、专利、奖励、领域专长;other表示备注信息。
步骤1002,科技专家资源封装与虚拟化。
形式化定义科技专家资源后,科技专家资源模型使用xmlschema格式进行封装,其封装结构代码如下所示:
<xsd:schematargetnamespace="http://127.0.0.1/resource/lib/expertservice/scienceexpertlibresource"
xmlns:tns="http://127.0.0.1/resource/lib/expertservice/scienceexpertlibresource"
xmlns:xsd="http://www.w3.org/2000/10/xmlschema">
<xsd:elementname="matchingexpert"type="xsd:string"/>
<xsd:elementname="scienceexpertlibresource"">
<xsd:complextype>
<xsd:sequence>
<xsd:elementref="tns:expertinfor"/>
</xsd:sequence>
</xsd:complextype>
</xsd:element>
</xsd:schema>
然后在资源接口层,使用wsdl定义与web服务对应的操作接口,用于检索科技专家信息,包括学科、研究方向、回避单位等信息。
步骤1003,构建科技专家本体模块。
分析科技专家信息概念及其实体之间的关系,利用protégé本体设计工具构建科技专家领域本体。领域本体模型的构建不仅可以揭示科技专家信息数据的内在联系、明确表达实体含义,还增强信息内容的共享性和可重用性。使用斯坦福大学医学院生物信息研究中心开发的开源protégé软件构建科技专家本体,形成如图3所示的科技专家资源本体概念类图,表1为定义的科技专家资源实体属性。
表1
将定义的本体模型存储为采用w3c推荐的owl文本格式,owl包括本体类class和属性property两个元素,类与类之间的关系可通过三元组的方式来表达。
步骤1004,定义科技专家信息匹配的语义推理规则。
借助swrl语义推理规则,提出科技专家信息匹配的语义推理规则。基于本体的科技专家管理优势就是可以使用推理机进行语义判断和逻辑推理,从而可以进行专家关系探测、专家回避、专家发现等智能性应用,避免仅依靠字面匹配造成的误差,提高专家发现与服务能力。科技专家平台汇聚的专家对象通常都有不同的研究领域和研究方向,语义推理的目标就是为科技项目或创新项目挑选匹配的专家,确保专家研究领域正确匹配,研究方向相关联。例如,专家甲研究领域计算机科学,研究方向包括大数据、服务工程,而农业工程领域的项目所需要计算机科学领域的专家甲是否可以参评,需要推理专家甲是否在农业工程领域中有相关大数据或服务工程的研究。
以本体模型为基础的语义技术随着业务关系复杂程度的提高得到不断发展,语义网规则语言(semanticwebrulelanguage,swrl)以owl语言为基础,融合了多规则描述方式。利用swrl对科技专家多种匹配进行语义表达和规则建立,其形式描述规则如表2所示:
表2
表4中y表示邀请专家的项目对象,x表示被匹配对象。
规则1:相同研究领域sameprojectfield、相关研究方向samesearchdirection、状态正常expertstatus的专家可匹配sucessmatching;
规则2:相同研究领域sameprojectfield、相关研究方向samesearchdirection、回避单位avoidxorganization、回避专家avoidxexpert、状态正常expertstatus的专家可匹配sucessmatching;
规则3:不相同研究领域differentprojectfield、相关研究方向samesearchdirection、有领域相关项目havefieldproject、状态正常expertstatus的专家可匹配sucessmatching;
规则4:不相同研究领域differentprojectfield、相关研究方向samesearchdirection、有领域相关项目havefieldproject、回避单位avoidxorganization、回避专家avoidxexpert、状态正常expertstatus的专家可匹配sucessmatching;
规则5:不相同研究领域differentprojectfield、不同研究方向differentsearchdirection、相似的创业历经sameentrepreneurialexperience、状态正常expertstatus的专家可匹配sucessmatching;
规则6:不相同研究领域differentprojectfield、不同研究方向differentsearchdirection、相似的创业历经sameentrepreneurialexperience、回避单位avoidxorganization、回避专家avoidxexpert、状态正常expertstatus的专家可匹配sucessmatching。
步骤1005,基于jena推理机实现科技专家语义匹配检索。
结合图4所示,基于jena推理机实现科技专家语义匹配检索过程包括:科技专家匹配规则文件读取、语义规则解析、jena推理、结果反馈四个阶段。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。
1.一种科技专家资源虚拟化与语义推理检索方法,其特征在于:包括如下步骤:
步骤1001,形式化定义科技专家资源;
步骤1002,科技专家资源封装与虚拟化;
步骤1003,结合科技专家信息规范,分析专家信息规范概念及其实体之间的关系,构建基于owl描述的科技专家领域本体;
步骤1004,基于swrl语义推理规范,定义科技专家信息匹配的语义推理规则;
步骤1005,借助jena推理机实现科技专家匹配检索。
2.根据权利要求1所述的科技专家资源虚拟化与语义推理检索方法,其特征在于:在步骤1001中,所述科技专家资源的形式化定义为:
eres={er_name,er_id,er_des,er_count,er_type,ermodel}
其中,科技专家资源eres的属性定义包括:er_name表示科技专家服务资源名称;er_id表示科技专家服务资源所属的服务提供单位的唯一标识;er_des对科技专家服务资源进行描述或说明;er_count表示了科技专家服务资源的个数;er_type描述了科技专家服务资源的学科类型;ermodel表示科技专家信息模型;
其中,科技专家信息模型ermodel表示为:
ermodel={baseinfo,eduexp,workexp,entrexp,achieve,other}
其中,baseinfo表示科技专家基本信息,包括专家姓名、性别、出生年月、证件号码、工作单位、现任职务;eduexp表示科技专家教育经历,包括高中、大学、研究生、国外访学的受教育历程信息;workexp表示工作经历,包括所工作过的单位信息;entrexp表示创业经历信息,包括创业领域、创业公司信息、创业成果;achieve表示科技专家主要业绩和专长,包括项目成果、论文成果、专利、奖励、领域专长;other表示备注信息。
3.根据权利要求1所述的科技专家资源虚拟化与语义推理检索方法,其特征在于:在执行步骤1002中所述的科技专家资源封装与虚拟化时,科技专家资源模型使用xmlschema格式进行表达封装;然后在资源接口层,使用wsdl定义与web服务对应的操作接口。
4.根据权利要求1所述的科技专家资源虚拟化与语义推理检索方法,其特征在于:在步骤1003中所述的科技专家领域本体中,顶层包括expert科技专家、searchfield科技专家研究领域两个对象。
5.根据权利要求1所述的科技专家资源虚拟化与语义推理检索方法,其特征在于:在步骤1004中,所述的swrl语义推理规则为:
规则1:相同研究领域sameprojectfield、相关研究方向samesearchdirection、状态正常expertstatus的专家可匹配sucessmatching;
规则2:相同研究领域sameprojectfield、相关研究方向samesearchdirection、回避单位avoidxorganization、回避专家avoidxexpert、状态正常expertstatus的专家可匹配sucessmatching;
规则3:不相同研究领域differentprojectfield、相关研究方向samesearchdirection、有领域相关项目havefieldproject、状态正常expertstatus的专家可匹配sucessmatching;
规则4:不相同研究领域differentprojectfield、相关研究方向samesearchdirection、有领域相关项目havefieldproject、回避单位avoidxorganization、回避专家avoidxexpert、状态正常expertstatus的专家可匹配sucessmatching;
规则5:不相同研究领域differentprojectfield、不同研究方向differentsearchdirection、相似的创业历经sameentrepreneurialexperience、状态正常expertstatus的专家可匹配sucessmatching;
规则6:不相同研究领域differentprojectfield、不同研究方向differentsearchdirection、相似的创业历经sameentrepreneurialexperience、回避单位avoidxorganization、回避专家avoidxexpert、状态正常expertstatus的专家可匹配sucessmatching。
6.根据权利要求1所述的科技专家资源虚拟化与语义推理检索方法,其特征在于:在步骤1005中,借助jena推理机实现科技专家匹配检索包括:科技专家匹配规则文件读取、语义规则解析、jena推理、结果反馈四个阶段。
技术总结