一种获取病历文本对应标签的数据处理系统的制作方法

专利2025-12-12 24

本发明涉及文本处理，特别是涉及一种获取病历文本对应标签的数据处理系统。

背景技术：

1、目前，随着患病人数的增加，如制定病种路径的管理模式成为热门研究方式，通过确定病种对应的操作路径能够降低监护工作的复杂程度，提高工作效率，尽可能实现“同病同住”，然而在获取病种路径前，需要从病历文本中获取到对应的操作信息，如何从病历文本中高效且准确的获取相应标签成为热门研究方向。

2、现有技术中，确定病历文本对应标签的方法为：获取病历文本，将病历文本分成若干个字符数量低于预设阈值的文本，对拆分后的文本聚类，对聚类后每一类的病历文本进行人工标注，从而获取到病历文本对应的标签，综上，确定病历文本对应标签的方法存在的问题：人工对病历标注标签，提高了获取标签的成本，降低了获取病历文本对应标签的效率，未利用模型和基于模型输出结果对模型不断进行调整，局限于从单个角度获取目标标签，降低了获取到病历文本对应标签的准确性。

技术实现思路

1、针对上述技术问题，本发明采用的技术方案为：一种获取病历文本对应标签的数据处理系统，其特征在于，所述系统包括：存储有预设标签列表的存储介质、处理器和存储有计算机程序的存储器，其中，所述预设标签列表中包括若干个预设标签，所述预设标签为对产生疾病的用户身体进行处理过程中过程节点对应的词，当所述计算机程序被处理器执行时，实现以下步骤：

2、s100，根据预设标签列表，获取第一样本病历文本集，其中，所述第一样本病历文本集包括若干个第一样本病历文本列表，每个预设标签对应一个第一样本病历文本列表，所述第一样本病历文本列表包括若干个第一样本病历文本，所述第一样本病历文本为标注预设标签的病历文本。

3、s200，根据第一样本病历文本集，获取中间模型和中间模型对应的目标参数η，其中，所述中间模型为将第一样本病历文本集作为训练集输入至预设模型中进行训练获取到的模型。

4、s300，根据中间模型，获取第二样本病历文本列表对应的第一候选标签列表c＝{c1，……，cj，……，cm}和c对应的第一候选优先级列表c0＝{c01，……，c0j，……，c0m}，cj为第j个第二样本病历文本对应的第一候选标签，c0j为cj对应的第一候选优先级。

5、s400，根据c0和η，获取第一指定优先级λ1，其中，第一指定优先级λ1符合如下条件：

6、λ1＝λ0/m，λ0为c0中不小于η的第一候选优先级的数量。

7、s500，当λ1＜f0时，则η＝η-η0，重复执行s2～s4直到满足预设的循环截止条件，其中，所述预设的循环截止条件为：λ1≥f0，η0为预设的参数阈值，f0为预设的优先级阈值。

8、s600，当λ1≥f0时，获取目标模型，其中，所述目标模型为目标参数为η的中间模型。

9、s700，获取目标病历文本列表l＝{l1，……，lg，……，lh}，lg为第g个目标病历文本，g＝1……h，h为目标病历文本的数量，其中，所述目标病历文本为将待获取标签的原始病历文本按照预设分隔符进行拆分后获取到的病历文本。

10、s800，将l输入至目标模型中，获取l对应的第一目标标签列表l1＝{l11，……，l1g，……，l1h}，l1g为lg对应的第一目标标签。

11、本发明与现有技术相比具有明显的有益效果，借由上述技术方案，本发明提供的一种获取病历文本对应标签的数据处理系统可达到相当的技术进步性及实用性，并具有产业上的广泛利用价值，其至少具有以下有益效果：

12、一种获取病历文本对应标签的数据处理系统，系统包括：存储有预设标签列表的存储介质、处理器和存储有计算机程序的存储器，当计算机程序被处理器执行时，实现以下步骤：根据预设标签列表，获取第一样本病历文本集，根据第一样本病历文本集，获取中间模型和中间模型对应的目标参数，根据中间模型，获取第二样本病历文本列表对应的第一候选标签列表和第一候选标签列表对应的第一候选优先级列表，根据目标参数和第一候选优先级列表，获取第一指定优先级，当第一指令优先级小于预设的优先级阈值时，更新目标参数，重复执行上述步骤，直到满足预设的循环截止条件，当第一指令优先级不小于预设的优先级阈值时，获取目标模型，获取目标病历文本列表，将目标病历文本列表输入至目标模型中，获取目标病历文本列表对应的第一目标标签列表，本发明利用模型获取病历文本对应的标签，基于模型输出结果对模型不断进行调整，降低了获取标签的成本，提高了获取病历文本对应标签的效率，同时，从两个角度即模型和文本特性获取目标标签，基于标签的一致性和非一致性采用不同的方法，使得获取到的病历文本对应标签的准确性较高。

13、上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂，以下特举较佳实施例，并配合附图,详细说明如下。

技术特征：

1.一种获取病历文本对应标签的数据处理系统，其特征在于，所述系统包括：存储有预设标签列表的存储介质、处理器和存储有计算机程序的存储器，其中，所述预设标签列表中包括若干个预设标签，所述预设标签为对产生疾病的用户身体进行处理过程中过程节点对应的词，当所述计算机程序被处理器执行时，实现以下步骤：

2.根据权利要求1所述的获取病历文本对应标签的数据处理系统，其特征在于，η的取值范围为0.9～0.99。

3.根据权利要求1所述的获取病历文本对应标签的数据处理系统，其特征在于，所述第一候选标签为将第二样本病历文本集输入至中间模型中获取到的每个第二样本病历文本对应的预设标签。

4.根据权利要求1所述的获取病历文本对应标签的数据处理系统，其特征在于，所述第一候选优先级为将第二样本病历文本集输入至中间模型中获取到的每个第二样本病历文本对应的第一候选标签与预设标签列表中预设标签相匹配的程度。

5.根据权利要求1所述的获取病历文本对应标签的数据处理系统，其特征在于，在s800中通过如下步骤获取l1g：

6.根据权利要求1所述的获取病历文本对应标签的数据处理系统，其特征在于，在s800步骤之后还包括如下步骤：

7.根据权利要求6所述的获取病历文本对应标签的数据处理系统，其特征在于，在s1中还包括如下步骤：

8.根据权利要求6所述的获取病历文本对应标签的数据处理系统，其特征在于，在s3中通过如下步骤获取l0g：

9.根据权利要求1所述的获取病历文本对应标签的数据处理系统，其特征在于，η0的取值范围为0.01～0.1。

技术总结
本发明涉及一种获取病历文本对应标签的数据处理系统，系统包括：处理器和存储有计算机程序的存储器，当计算机程序被处理器执行时，实现以下步骤：获取第一样本病历文本集，获取中间模型和中间模型对应的目标参数，获取第二样本病历文本列表对应的第一候选标签列表和第一候选优先级列表，获取第一指定优先级，根据第一指令优先级调整目标参数以获取目标模型，根据目标模型，获取第一目标标签列表，本发明基于模型输出结果对模型不断进行调整，降低了获取标签的成本，提高了获取病历文本对应标签的效率，同时，从两个角度即模型和文本特性获取目标标签，基于标签的一致性和非一致性采用不同的方法，使得获取到的病历文本对应标签的准确性较高。

技术研发人员：李忠波,王军江,刘康康,陈阳,王志鹏
受保护的技术使用者：奇点智保（北京）科技有限公司
技术研发日：
技术公布日：2024/7/25

转载请注明原文地址: https://bbs.8miu.com/read-436216.html

专利

最新回复(0)