本发明涉及数据处理,具体涉及一种图纸文件内容查询处理方法及装置。
背景技术:
1、工程建设项目首先要有设计方案和设计图纸才能进行后续施工,而优秀的设计方案会大大提高工程建设项目的执行效率和落地效果。建设工程涉及建筑、水、暖、风、热、电等众多专业,专业设计人员的经验积累常常通过老带新,或者大量查阅纸质文献、设计图纸等资料进行参考,传统的设计文件管理系统,是通过登记的字段查询和筛选,来定位文件名称。
2、目前设计文件版式复杂,知识的查询与获取的方法主要是通过查询图纸文件的基本信息,定位到具体的名称,用户通过打开文件,才能浏览图纸内容去判断所需要的知识,也有能够对文件内容进行全文检索并提取关键信息形成知识图谱的方法,但这项技术主要应用于政务、企事业公文、图书管理等较为规范的版式文件上,提取的是一些固定位置的属性值,但在科技档案诸如图纸、设计说明、方案及项目管理文件等版式复杂且无特定规律的文档类型方面,无法通过固定格式识别目标内容。
3、通过查询图纸条目的方法只能定位到文件,不利与了解图纸的详细内容,获取信息不够全面,而现有对内容的全文检索是将识别到的全部分词存储到一个词库,没有进行分库细化,管理颗粒度较粗糙,对不同专业的图纸和内容之间的关联关系未作梳理,挖掘深度不够,未形成工艺设计知识体系和框架,上述方法会导致用户查询时反馈的结果过载、系统响应时间长、消耗资源大、知识利用效果差、推荐结果与用户意愿匹配度较低。
技术实现思路
1、针对现有技术中的问题,本发明实施例提供一种图纸文件内容查询处理方法及装置,能够至少部分地解决现有技术中存在的问题。
2、一方面,本发明提出一种图纸文件内容查询处理方法,包括:
3、响应用户针对图纸文件执行的属性筛选动作,得到目标图纸文件,响应所述用户针对所述目标图纸文件执行的标签选择动作,得到所述目标图纸文件中的目标图纸目录和目标图纸页;
4、响应所述用户根据所述目标图纸目录和所述目标图纸页执行的输入检索词动作,得到待显示的图纸文件内容;
5、根据所述用户的历史信息数据对所述图纸文件内容进行知识粘度分析,得到按照与所述历史信息数据匹配度由高到低的顺序排列的所述图纸文件内容的查询结果。
6、其中,所述响应所述用户针对所述目标图纸文件执行的标签选择动作,得到所述目标图纸文件中的目标图纸目录和目标图纸页,包括:
7、响应所述用户针对所述目标图纸文件执行的标签选择动作,从目标分词库和质量审核问题库中调用数据得到所述目标图纸文件中的目标图纸目录和目标图纸页。
8、其中,所述响应所述用户根据所述目标图纸目录和所述目标图纸页执行的输入检索词动作,得到待显示的图纸文件内容,包括:
9、响应所述用户根据所述目标图纸目录和所述目标图纸页,并利用全文分词库和图形库执行的输入检索词动作,得到待显示的图纸文件内容。
10、其中,所述历史信息数据包括用户属性历史数据、用户输入内容历史数据和用户操作历史数据;相应的,所述根据所述用户的历史信息数据对所述图纸文件内容进行知识粘度分析,包括:
11、分别计算所述用户属性历史数据、所述用户输入内容历史数据和所述用户操作历史数据与所述图纸文件内容分别对应的匹配度得分;
12、根据各匹配度得分确定匹配度由高到低的排列顺序,得到所述查询结果。
13、其中,在所述响应用户针对图纸文件执行的属性筛选动作,得到目标图纸文件的步骤之前,所述图纸文件内容查询处理方法还包括:
14、获取图纸文件的信息登记;所述信息登记包括图纸文件和与其对应的质量审核表的属性信息;
15、对所述信息登记进行拆分,得到图纸目录属性信息、质量审核表属性信息和在图纸文件中除去图纸目录的其他图纸页属性信息;
16、根据所述图纸目录属性信息、所述质量审核表属性信息和所述其他图纸页属性信息进行知识梳理,建立分词与专业之间的第一对应关系、质量审核问题与图纸文件之间的第二对应关系、专业与图纸文件之间的第三对应关系,以及图纸目录与图纸支页之间的第四对应关系;
17、将图纸文件属性信息存储到图纸信息登记库中,将所述图纸目录属性信息中的分词标签存储到目录分词库中,将所述质量审核表属性信息中的分词标签存储在质量审核问题库中,将所述其他图纸页属性信息中的分词标签存储在全文检索库中,将所述其他图纸页属性信息中的图形信息存储在图形库中。
18、其中,获取所述图纸文件属性信息,包括:
19、若确定所述图纸文件属性信息为扫描文件,则通过ocr方式识别得到所述图纸文件属性信息。
20、其中,各分词标签为分级分词标签;相应的,所述图纸文件内容查询处理方法还包括:
21、通过遍历各分级分词标签所在的分级层级实现分词查询。
22、一方面,本发明提出一种图纸文件内容查询处理装置,包括:
23、第一获取单元,用于响应用户针对图纸文件执行的属性筛选动作,得到目标图纸文件,响应所述用户针对所述目标图纸文件执行的标签选择动作,得到所述目标图纸文件中的目标图纸目录和目标图纸页;
24、第二获取单元,用于响应所述用户根据所述目标图纸目录和所述目标图纸页执行的输入检索词动作,得到待显示的图纸文件内容;
25、查询单元,用于根据所述用户的历史信息数据对所述图纸文件内容进行知识粘度分析,得到按照与所述历史信息数据匹配度由高到低的顺序排列的所述图纸文件内容的查询结果。
26、再一方面,本发明实施例提供一种电子设备,包括:处理器、存储器和总线,其中,
27、所述处理器和所述存储器通过所述总线完成相互间的通信;
28、所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:
29、响应用户针对图纸文件执行的属性筛选动作,得到目标图纸文件,响应所述用户针对所述目标图纸文件执行的标签选择动作,得到所述目标图纸文件中的目标图纸目录和目标图纸页;
30、响应所述用户根据所述目标图纸目录和所述目标图纸页执行的输入检索词动作,得到待显示的图纸文件内容;
31、根据所述用户的历史信息数据对所述图纸文件内容进行知识粘度分析,得到按照与所述历史信息数据匹配度由高到低的顺序排列的所述图纸文件内容的查询结果。
32、本发明实施例提供一种非暂态计算机可读存储介质,包括:
33、所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如下方法:
34、响应用户针对图纸文件执行的属性筛选动作,得到目标图纸文件,响应所述用户针对所述目标图纸文件执行的标签选择动作,得到所述目标图纸文件中的目标图纸目录和目标图纸页;
35、响应所述用户根据所述目标图纸目录和所述目标图纸页执行的输入检索词动作,得到待显示的图纸文件内容;
36、根据所述用户的历史信息数据对所述图纸文件内容进行知识粘度分析,得到按照与所述历史信息数据匹配度由高到低的顺序排列的所述图纸文件内容的查询结果。
37、本发明实施例提供的图纸文件内容查询处理方法及装置,响应用户针对图纸文件执行的属性筛选动作,得到目标图纸文件,响应所述用户针对所述目标图纸文件执行的标签选择动作,得到所述目标图纸文件中的目标图纸目录和目标图纸页;响应所述用户根据所述目标图纸目录和所述目标图纸页执行的输入检索词动作,得到待显示的图纸文件内容;根据所述用户的历史信息数据对所述图纸文件内容进行知识粘度分析,得到按照与所述历史信息数据匹配度由高到低的顺序排列的所述图纸文件内容的查询结果,能够提高图纸文件内容查询效率,降低系统资源消耗,方便用户得到与自己查询意愿相对应的查询结果。
1.一种图纸文件内容查询处理方法,其特征在于,包括:
2.根据权利要求1所述的图纸文件内容查询处理方法,其特征在于,所述响应所述用户针对所述目标图纸文件执行的标签选择动作,得到所述目标图纸文件中的目标图纸目录和目标图纸页,包括:
3.根据权利要求1所述的图纸文件内容查询处理方法,其特征在于,所述响应所述用户根据所述目标图纸目录和所述目标图纸页执行的输入检索词动作,得到待显示的图纸文件内容,包括:
4.根据权利要求1所述的图纸文件内容查询处理方法,其特征在于,所述历史信息数据包括用户属性历史数据、用户输入内容历史数据和用户操作历史数据;相应的,所述根据所述用户的历史信息数据对所述图纸文件内容进行知识粘度分析,包括:
5.根据权利要求1至4任一所述的图纸文件内容查询处理方法,其特征在于,在所述响应用户针对图纸文件执行的属性筛选动作,得到目标图纸文件的步骤之前,所述图纸文件内容查询处理方法还包括:
6.根据权利要求5所述的图纸文件内容查询处理方法,其特征在于,获取所述图纸文件属性信息,包括:
7.根据权利要求5所述的图纸文件内容查询处理方法,其特征在于,各分词标签为分级分词标签;相应的,所述图纸文件内容查询处理方法还包括:
8.一种图纸文件内容查询处理装置,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述方法的步骤。
