本公开涉及审判风险预警
技术领域:
:,特别涉及一种审判风险智能识别与预警方法、系统、介质及设备。
背景技术:
::本部分的陈述仅仅是提供了与本公开相关的
背景技术:
:,并不必然构成现有技术。随着我国全面依法治国的不断深入推进,法院审判工作的重要性愈加突出。目前,我国法院审判工作存在量大、面广、线长、点多的特点,法院面临着严重的案多人少的矛盾。在这种情况下,面对案情复杂的诉讼案件,审判工作中难免会出现一些疏漏。这些疏漏是引发社会舆情和信访事件的风险点,一旦引发舆情和信访事件,给法官和法院带来一系列负面影响,导致法院公信力的降低。因此,各级法院迫切需要建立有效的案件审判风险识别与预警系统,从而能够及早发现、及时预防、有效处置各类审判风险。本公开发明人发现,目前各级法院大都建设有立案管理系统、案件管理系统、审判管理系统、执行系统等业务系统,已经实现了审判业务的高度信息化。然而,在审判风险的防控方面,现有的业务信息系统尚不具备有效的风险识别和预警功能,具体体现在:首先,能够识别的审判风险类别单一,只能够对审限超时这一类风险进行提示或预警,而对于更加复杂的风险点,通常需要人工分析和评估,缺乏智能化的风险识别和预警工具;其次,识别方法简单,一般仅通过人工设定的简单规则来识别审限超时风险;第三,缺乏智能化的风险预警方式,未实现对审判风险的分类和分级预警。有鉴于上述不足,有必要提出一种覆盖面更广的、更为有效、更加智能的审判风险预警方案。技术实现要素:为了解决现有技术的不足,本公开提供了一种审判风险智能识别与预警方法、系统、介质及设备,能够自动识别审判过程中多个阶段和多种类别的复杂风险点,解决了目前复杂审判风险识别仍依赖于人工分析和评估的缺陷;同时实现了对审判风险的分类和分级智能化预警,能够帮助法院高效地对风险做出响应以降低风险危害。为了实现上述目的,本公开采用如下技术方案:本公开第一方面提供了一种审判风险智能识别与预警方法。一种审判风险智能识别与预警方法,包括以下步骤:获取案件要素并计算案件要素特征向量;将得到的案件要素特征向量输入训练好的多标记分类模型中,得到案件可能发生的风险类别集合;根据案件可能发生的风险类别集合,计算案件预警指数,根据预警指数的数值,选择预设的对应预警方式和预警对象进行预警。作为可能的一些实现方式,多标记分类模型的训练方法,具体为:以目标法院的名称为主题词设置主题爬虫,通过运行主题爬虫在互联网上收集与目标法院相关的舆情信息;采用情感分析算法对已爬取的每一条信息进行情感分析,得到舆情信息中的负向情感;在获取的负向情感中提取命名实体,以提取的命名实体为关键词,在法院业务系统数据库中检索相关的案件数据,如果存在与关键字匹配的案件,则视该案件审判流程中存在风险;如不存在匹配案件,则视舆情与审判流程风险无关;在法院信访系统中,提取与信访事件关联的案件编号;以案件编号为关键字,在法院业务系统中检索对应案件数据;在基于负向舆情信息和信访事件检索出的风险案件中,提取案件要素,形成风险案件的特征向量,对风险案件进行分类;随机选择一部分无风险案件并提取这些案件的案件要素,形成特征向量,风险案件集合和无风险案件集合共同构成审判风险预测模型的训练数据集;采用训练数据集训练多标记分类模型。作为进一步的限定,预警接收端在收到审判风险预警后,对风险预测的正确性和预警的合理性进行反馈,根据反馈结果调整预警策略,并将预警接收端标记为预测正确的案件加入训练集作为新的训练数据。作为进一步的限定,通过运行主题爬虫在互联网上收集与目标法院相关的舆情信息,具体为:步骤301设定一个入口url集合来指明信息采集的起始点;步骤302将入口url集合加入到爬虫的待采集链接列表;步骤303判断待采集链接表是否为空,如果不为空,执行步骤304,否则返回步骤301;步骤304从待采集链接列表取出队首的链接进行采集;步骤305对采集的页面进行解析,获取页面中的主题文本和url链接;步骤306判断主题文本中是否包含设定的主题词,如果包含,执行步骤306,否则舍弃并返回步骤301;步骤307将主题文本存入信息库;步骤308通过正则表达式判断页面中的url链接是否是需要进一步采集的页面链接,如果是,执行步骤309;步骤309将链接加入待采集链接列表的队尾;循环执行步骤303至步骤309直至链接库为空;作为进一步的限定,采用情感分析算法对已爬取的每一条信息进行情感分析,具体为:构造情感分析训练数据集,包括正向情感集合、负向情感集合和中性情感集合,每个集合包含多条文本;构建文本内容的向量表示模型,在经向量表示后的训练数据集上训练机器学习模型得到情感分类模型;将采集的舆情信息的向量表示输入情感分类模型到其情感类别。作为进一步的限定,在获取的负向情感中提取命名实体,具体为:定义提取的命名实体集合和语义角色词汇集合,以及语义角色词汇在法院业务系统数据库表中的对应字段;在命名实体识别模型定位命名实体在文本中的位置后,搜索命名实体的前向文本和后向文本中离其最近的语义角色词汇,以最近的语义角色词汇作为命名实体的角色类别。作为更进一步的限定,对命名实体集合中的所有命名实体,采用如下步骤实现相关案例数据的检索:步骤501初始化条件列表为空;步骤502在命名实体集合中选取一个命名实体加入条件队列作为当前条件,并将该命名实体从命名实体集合中删除;步骤503采用条件队列中的所有条件的合取在法院业务数据库中采用sql语句检索;步骤504如果返回不为空且命名实体集合不为空,则返回步骤502执行;如果返回为空且命名实体集合不为空,则执行步骤505;步骤505从条件队列中删除当前条件命名实体集合并返回步骤502继续执行;重复步骤502至505直至命名实体集合为空,以此时条件队列中的所有条件的合取为检索条件进行检索,如返回结果不为空,则得到与舆情信息最大匹配的案件数据;如返回结果为空,则视为不存在匹配案件,舆情与审判流程风险无关。作为可能的一些实现方式,根据案件要素的类型不同,采用不同的方法对其进行数值化,具体为:对于数值型的案件要素,以要素的原始数值作为对应特征的特征值;对于二值型的案件要素,如果该要素值为“是”,则其对应特征值为1;否则,对应特征值取0;对于多选项型要素,将各个选项进行编号,构建多维向量,且多维向量中只能有一个取值为1,其他均为0。本公开第二方面提供了一种审判风险智能识别与预警系统。一种审判风险智能识别与预警系统,其特征在于,包括:审判风险识别模块,被配置为:从法院业务系统接收到达的新立案案件数据,采用训练好的风险预测模型预测可能发生的风险类别集合,将预测结果发送至审判风险预警模块;审判风险预警模块,被配置为:从审判风险识别模块接收案件的风险预测结果,计算风险预警指数,根据预警指数确定风险的预警级别,输出给用户交互模块;用户交互模块,被配置为:用于根据审判风险预警模块输出的预警级别,确定预警对象和在系统界面的预警方式;接收用户对风险预警合理性和风险预测正确性的反馈,根据反馈向审判风险识别模块和审判风险预警模块发送更新调整指令。作为可能的一些实现方式,所述系统还包括:舆情信息采集模块,被配置为:从互联网收集与目标法院相关的舆情信息,在收集后,对舆情信息进行情感分析,保留负向情感的信息;信访系统交互模块,被配置为:从法院信访系统中查询和获取信访记录,提取信访记录的原案编号;业务数据检索模块,被配置为:用于根据舆情信息和信访记录在法院业务系统数据库中检索相关案件,并提取案件数据发送给模型训练模块;模型训练模块,被配置为:从业务数据检索模块接收与舆情、信访事件相关的风险案例数据和无风险案件数据,训练审判风险预测模型。本公开第三方面提供了一种介质,其上存储有程序,该程序被处理器执行时实现如本公开第一方面所述的审判风险智能识别与预警方法中的步骤。本公开第四方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开第一方面所述的审判风险智能识别与预警方法中的步骤。与现有技术相比,本公开的有益效果是:1、本公开能够基于网络舆情和信访记录反查相关的案件数据,训练机器学习模型来建立案件数据与多阶段、多类别审判之间的映射关系,实现对新立案案件的智能化风险预测与分类、分级预警,并根据用户反馈自动地对风险识别和预警模型调整。2、与现有技术相比,本公开提供的审判风险智能识别与预警方法和系统充分利用了网络舆情、信访信息和法院业务系统数据,基于机器学习的方法,能够自动识别审判过程中多个阶段、多种类别的复杂风险点,解决了目前复杂审判风险识别仍依赖于人工分析和评估的缺陷。3、本公开所述的内容实现了对审判风险的分类、分级智能化预警,能够帮助法院高效地对风险做出响应,降低风险危害,对增强社会对司法体系的信任度有正面和积极的效果。附图说明图1为本公开实施例1提供的审判风险智能识别和预警方法流程图。图2为本公开实施例1提供的审判风险智能识别和预警方法中步骤101的示意图。图3为本公开实施例1提供的审判风险智能识别和预警方法中步骤102的示意图。图4为本公开实施例1提供的审判风险智能识别和预警方法中步骤103的示意图。图5为本公开实施例1提供的审判风险预测模型构建流程示意图。图6为本公开实施例1提供的基于用户反馈对风险识别和预警模型调整过程的示意图。图7为本公开实施例2提供的审判风险智能识别和预警系统结构示意图。图8为本公开实施例2提供的审判风险智能识别和预警系统中用户反馈界面的示意图。具体实施方式应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文采用的所有技术和科学术语具有与本公开所属
技术领域:
:的普通技术人员通常理解的相同含义。需要注意的是,这里所采用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所采用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中采用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。实施例1:如图1所示,本公开实施例1提供了一种法院审判风险智能化预警方法。该方法首先收集与目标法院相关的互联网负面舆情信息和法院信访数据;然后在法院业务数据库中反查与负面舆情及信访事件关联的案件数据,通过人工进行风险标注构建风险案件训练集,使用训练集构建风险预测模型,用于对新的案件进行风险预测;当风险预测模型检测到风险后,以智能化的方式将预警推送至法院人员。法院人员通过反馈促进风险模型的调整优化。具体如下:步骤101:通过主题爬虫从互联网中收集与目标法院相关的舆情信息,舆情信息包括新闻、评论、博客、微博、论坛发帖等。网络爬虫是一种自动收集网页或其他网络资源的程序,而主题爬虫则根据设定的条件来限定收集范围,只收集与特定主题相关的网页或网络资源。本实施例提供的方法通过设定主题词的方式来限定主题爬虫的信息手机范围,例如,主题词设定为目标法院的机构名称来限定爬虫只采集与该法院相关的舆情信息。图2显示了按照本实施例的主题爬虫运行流程。步骤s101:设定一个入口url集合来指明信息采集的起始点(页面),这些起始点一般为新闻列表页、博客列表页、论坛帖子列表页、微博列表页等;步骤s102:将入口url集合加入到爬虫的待采集链接列表,该链表为一个先进先出队列。步骤s103:判断待采集链接表是否为空,如果不为空,执行步骤s104;步骤s104:从待采集链接列表取出队首的链接进行采集,完成后执行步骤s105;步骤s105:对采集的页面进行解析,获取页面中的主体文本和url链接。主题文本包括新闻标题和内容、博客标题和内容、论坛帖子标题和内容以及微博内容等。步骤s106:判断主体文本中是否包含设定的主题词,如果包含,执行步骤s107,如果不包含则舍弃;步骤s107:将主题文本存入信息库;步骤s108:通过正则表达式判断页面中的url链接是否是需要进一步采集的页面链接,如果是,执行步骤s109;步骤s109:将链接加入待采集链接列表的队尾。循环执行步骤s103至步骤s109直至链接库为空。步骤102:针对已经收集的每一条舆情信息使用机器学习的方法进行情感分析,根据内容将舆情信息划分为“正向情感”、“负向情感”和“中性”三个类别中的一个,具体流程如图3所示。按照图3,首先,步骤s201构造情感分析训练数据集t={t ,t-,t°},其中t 为正向情感样本集合,t-为负向情感样本集合,t°为中性情感样本集合;每一个训练样本可表示为<ti,sentii>,其中ti为第i条文本内容,sentii为ti的情感类别标签。训练数据可由人工进行标注,也可利用已公开的情感分类数据集作为训练集,如“weibo_senti_100k”数据集等。然后,步骤s202构建文本内容的向量表示模型,例如使用doc2vec模型将训练集中长度不一的文本内容转换成等长的向量表示。在经向量表示后的训练集t上训练机器学习模型models(如支持向量机svm,随机森林、逻辑回归等)来实现对新文本的情感分类。需要指出的是,其他向量表示方法(如tf-idf方法等)和机器学习分类模型、算法(如深度学习模型等)均可用于本步骤。在训练完成之后,步骤s203将采集的舆情信息的向量表示输入情感分类模型models得到其情感类别。由于负向情感的舆情一般折射了目标法院业务中存在的风险,应当保留这些信息进行后续分析。步骤103:进一步使用基于条件随机场(crf)的或基于隐马尔可夫模型(hmm)的等命名实体识别模型对情感分类结果为负向的舆情信息进行命名实体抽取,命名实体包括人名、机构名、时间、地点等,如“张三”、“xx市中级人民法院”、“2019年3月5日”、“xx市xx区”等。令提取的命名实体集合为ne={ne1,ne2,…,nek},进一步对ne中的元素进行语义角色识别,语义角色包括“当事人”、“受害人”、“原告”、“被告”、“法官”、“一审法院”等。首先,定义一个语义角色词汇集合以及语义角色词汇在法院业务系统数据库表中的对应字段,如“当事人”对应业务系统数据库的“dsr”字段,业务系统包括立案系统、案件管理系统、审判管理系统、执行系统等;然后,在命名实体识别模型定位命名实体nei在文本中的位置后,搜索nei的前向文本和后向文本中离其最近的语义角色词汇ri,以ri作为nei的角色类别。对于ne中的所有命名实体,采用图4中的步骤来实现相关案例数据的检索。在图4中,步骤s301初始化条件列表为空。步骤s302在ne中选取一个命名实体ne加入条件队列作为当前条件,并将ne在ne中删除;步骤s303使用条件队列中的所有条件的合取在法院业务数据库中使用sql语句检索,即:select*fromx.tablewherer1.field=ne1and…andrn.field=nen;其中x.table为某个数据表ne1,…,nen为条件队列中的所有命名实体,r1,…,rn为命名实体的语义角色,ri.field为语义角色ri对应的数据库字段。如果返回不为空且ne不为空,则返回步骤s302执行,继续在ne中选择一个命名实体作为条件加入条件队列作为当前条件进行检索,并将其从ne中删除;如果返回为空且ne不为空,步骤s305从条件队列中删除当前条件ne并返回步骤s302继续执行。重复步骤s302至s306直至ne为空,以此时条件队列中的所有条件的合取为检索条件进行检索,如返回结果不为空,则得到与舆情信息最大匹配的案件数据;如返回结果为空,则视为不存在匹配案件,舆情与审判流程风险无关。步骤104:在法院信访系统中,提取信访记录中的“原案编号”字段,即信访所反映问题涉及的审判案件编号;以原案编号为关键字,在法院业务系统中检索对应案件的数据。例如,假设法院信访数据库中“原案编号”字段的名称为yabh,法院业务系统数据库中的“案件编号”字段名称为ajbh,某一信访案件的原案编号为yabh='1000001',则可用以下sql语句在法院业务系统数据库中检索相关案例数据:select*fromx.tablewhereajbh='1000001';其中x.table为业务系统数据库中的某个数据表。步骤105:在基于舆情和信访信息检索出的风险案件数据中提取案件要素作为这些案件的特征表示。案件要素包括当时人信息、案件信息、案件审理信息、案件结案信息,表1显示了案件要素的示例。表1:案件要素示例在对案件进行特征表示时,根据案件要素的类型不同,采用不同的方法对其进行数值(a)对于数值型的案件要素,如“当事人数”、“男性当事人数量”、“女性当事人数量”等,以要素的原始数值作为对应特征的特征值。(b)对于二值型的案件要素,如“是否跨行政区域”、“是否附带民诉”等,如果该要素值为“是”,则其对应特征值为1;否则,对应特征值取1。(c)对于多选项型要素,如“案件来源”、“结案方式”等,使用多模向量将其取值数值化;以“收案途径”为例,假设业务系统中定义的案件来源有“当事人起诉”、“上级法院发回重审”、“上级法院指令受理”、“上级法院指定管辖”、“上级法院移交管辖”、“其他法院裁定移送管辖”、“本院提及管辖”、“因支付令失效转入”9个选项,则首先将9个选项进行编号(如编号为1-9),使用9维向量fk=(f1,f2,…,f9)t表示该案件要素的取值,其中fi取值为0或1,且f1~f9中只能有1个取值为1;当案件来源为第i个类别时,fi取值为1,其余为0;假设案件来源为“上诉法院发回重审”,则该要素的取值为(0,1,0,0,0,0,0,0,0)t。案件的最终向量表示为f=(f1,f2,f3,…,fk)t,维度为n1 n2 … nk维其中k为案件要素的个数,fi为第i个案件要素对应的特征或特征向量,ni为第i个案件要素特征向量的长度。在构建案件向量表示之后,由人工对案件的风险类别进行标注。本实施例定义的风险类别由三部分描述组成,即:<风险发生阶段,风险诱因,危害等级>。其中,风险发生阶段包括:“立案阶段”、“分案阶段”、“审判阶段”、“结案阶段”、“执行阶段”、“案件结束后”;表2显示了一个风险诱因的示例,包括:“当事人原因”、“律师/代理人原因”、“公诉机关原因”、“第三方原因”、“法官原因”、“案情原因”、“流程、程序原因”、“审判质量原因”,具体如表2所示;表3显示了一个危害等级划分示例,包括“轻微危害”、“低危害”、“中度危害”、“高度危害”。表2:风险诱因示例表3:风险危害等级划分示例每一个案件可与多个类别标记关联,如一个案件可能既发生<立案阶段,当事人原因,轻微危害>风险又发生<审判阶段,案情原因,中度危害风险>。令x 为人工标注后的风险案件数据集,则x 中每一个样本表示为:(xi,yi)其中xi为第i个风险案件的向量化表示,yi是与xi关联的风险类别集合。步骤106:随机在法院业务系统中选择一部分无风险案件,使用步骤105同样的方法抽取案件特征向量,形成无风险案件样本集合x-;风险案件样本集合x 和无风险案件样本集合x-构成风险预测模型的训练数据集x。步骤107:使用训练数据集训练审判风险预测模型,该模型为一个多标记分类器,能够同时将一个案件分类到多个可能的风险类别,具体流程如图5所示。本实施例通过基于神经网络的多标记分类模型来说明训练过程,而其他多标记分类算法亦可用于本步骤。令x={x1,x2,...,xn}为风险训练样本集合,则x中的所有样本表示为{(x1,y1),(x2,y2),...,(xn,yn)},其中xi为第i个样本的特征向量,yi是与xi关联的风险类别集合。通过反向传播多标记学习(back-propagationmulti-labellearning,简称bpmll)来构建风险预测的神经网络模型。模型有n个输入,对应样本向量表示的维度;有q个输出单元,对应事后风险类别的总数;设定该模型仅有单层前馈隐层,隐藏单元的数量为m。令输入层与隐藏层之间为全连接的方式,权重矩阵为v=[vhs](1≤h≤n,1≤s≤m);隐藏层与输出层之间为全连接的方式,权重矩阵为w=[wsj](1≤s≤m,1≤j≤q)。隐藏层的偏斜参数γs(1≤s≤m)作为一个额外的输入单元a0的参数,该单元固定取值为1;输出层偏斜参数θj(1≤j≤q)作为一个额外的隐藏单元b0的参数,该单元的激活值固定为1。由于多标签分类的目标是预测未知样本的标签集合,因此定义神经网络在训练集上的整体误差为:其中,ei为神经网络在样本xi上的误差,使用如下公式计算:其中输入样本为xi时神经网络在第j个类别上的实际输出;为输入样本为xi时神经网络在第j个类别上的期望输出(即真值),当j∈yi时,取值为 1,当时取值为-1。使用经典反向传播算法最小化全局误差来获得模型的参数值。令modelm表示训练好的多标签分类器,modelm建立了案件特征与风险类别之间的映射关系;当有新的立案cnew时,首先将该案件的数据按照步骤105表示为向量xnew,然后将xnew作为modelm的输入得到该案件可能发生的风险类别集合ynew。步骤108:根据对案件x的风险预测结果计算预警指数。令输入为x时风险预测模型modelm输出的风险标签集合为y={y1,y2,…,yt},l(yi)为风险类别yi的危害值,该值由人工预先定义,则x的预警指数为个风险类别的危害值之和:w(x)=l(y1) l(y2) … l(yt)步骤109:根据步骤108计算出的案件预警指数,选择合适的预警方式向有权限和责任处理该风险的业务人员进行预警。预警方式分为“轻度预警”、“中度预警”和“重度预警”。预先设定阈值α和β,当w(x)<α时,进行“轻度预警”;当α≤w(x)≤β时,进行“中度预警”;当w(x)>β时,进行“重度预警”。预先根据用户设定构建预警处理权限表,建立预警级别与法院人员之间的映射关系,当某一级别的预警触发时,从表中查询应该接收预警的法院人员。表4显示了一个预警处理权限表的具体实例。表5显示了一个风险级别、告警方式、告警频率对应关系的具体示例。表4预警处理权限表示例预警级别有权限处理人员轻度预警相关一线处室中度预警分管领导重度预警一把手及其他最高决策人员、上级机构表5预警级别与预警方式示例用户可以批量的对收到的风险预警进行反馈,包括对风险预测正确性的反馈及预警合理性的反馈。在风险预测正确性方面,每一条反馈包括两个互斥选项,即“正确”、“有误”;在预警合理性方面,每一条反馈包含三个互斥选项,即“过度预警”、“适度预警”、“预警偏弱”。步骤110:根据用户反馈对风险预测模型和风险预警模型进行调整。一方面,针对每一个风险类别的预警合理性进行分析,对于用户标注为“过度预警”或“预警偏弱”比例超过50%的风险类别,根据用户反馈中“过度预警”和“预警偏弱”的数量优势来确定调低(“过度预警”反馈数量大于“预警偏弱”的反馈数量)或提高(“预警偏弱”反馈数量大于“过度预警”的反馈数量)该风险类别的预警指数。另一方面,针对每一案件的风险预测正确性进行分析,将用户标注为风险预测“正确”的案件加入训练集作为新的训练数据来更新风险预测模型。具体流程如图6所示。实施例2:如图7所示,本公开实施例2提供了一种审判风险智能识别和预警系统,包括:(1)审判风险识别模块:从法院业务系统接收到达的新立案案件数据,使用风险预测模型预测可能发生的风险类别集合,将预测结果发送至审判风险预警模块。(2)审判风险预警模块:用于从审判风险识别模块接收案件的风险预测结果,计算风险预警指数,根据预警指数确定风险的预警级别,输出给用户交互模块。(3)用户交互模块:用于根据审判风险预警模块输出的预警级别,确定预警对象和在系统界面的预警方式;接收用户对风险预警合理性和风险预测正确性的反馈,用户交互反馈界面如图8所示;根据反馈向审判风险识别模块和审判风险预警模块发送更新调整指令。还包括以下几个模块,用于审判风险预测模型的训练,具体为:(4)舆情信息采集模块:用于从互联网收集与目标法院相关的舆情信息,舆情信息包括新闻、评论、博客、微博、论坛发帖等;在收集后,对舆情信息进行情感分析,保留负向情感的信息。(5)信访系统交互模块:用于从法院信访系统中查询和获取信访记录,提取信访记录的“原案编号”。(6)业务数据检索模块:用于根据舆情信息和信访记录在法院业务系统数据库中检索相关案件,并提取案件数据发送给风险识别模块。法院业务系统包括立案系统、案件管理系统、审判管理系统、执行系统等。对于舆情信息,首先进行命名实体抽取,命名实体包括人名、机构名、时间、地点等,以命名实体为检索条件在业务系统数据库中检索数据;对于信访记录,使用“原案编号”作为检索条件检索相关案件数据。(7)审判风险预测模型训练模块:用于从业务数据检索模块接收与舆情、信访事件相关的风险案例数据和无风险案件数据,训练审判风险预测模型。以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。当前第1页1 2 3 当前第1页1 2 3 
技术特征:1.一种审判风险智能识别与预警方法,其特征在于,包括以下步骤:
获取案件要素并计算案件要素特征向量;
将得到的案件要素特征向量输入训练好的多标记分类模型中,得到案件可能发生的风险类别集合;
根据案件可能发生的风险类别集合,计算案件预警指数,根据预警指数的数值,选择预设的对应预警方式和预警对象进行预警。
2.如权利要求1所述的审判风险智能识别与预警方法,其特征在于,多标记分类模型的训练方法,具体为:
以目标法院的名称为主题词设置主题爬虫,通过运行主题爬虫在互联网上收集与目标法院相关的舆情信息;
采用情感分析算法对已爬取的每一条信息进行情感分析,得到舆情信息中的负向情感;
在获取的负向情感中提取命名实体,以提取的命名实体为关键词,在法院业务系统数据库中检索相关的案件数据,如果存在与关键字匹配的案件,则视该案件审判流程中存在风险;如不存在匹配案件,则视舆情与审判流程风险无关;
在法院信访系统中,提取与信访事件关联的案件编号;以案件编号为关键字,在法院业务系统中检索对应案件数据;
在基于负向舆情信息和信访事件检索出的风险案件中,提取案件要素,形成风险案件的特征向量,对风险案件进行分类;
随机选择一部分无风险案件并提取这些案件的案件要素,形成特征向量,风险案件集合和无风险案件集合共同构成审判风险预测模型的训练数据集;
采用训练数据集训练多标记分类模型。
3.如权利要求2所述的审判风险智能识别与预警方法,其特征在于,预警接收端在收到审判风险预警后,对风险预测的正确性和预警的合理性进行反馈,根据反馈结果调整预警策略,并将预警接收端标记为预测正确的案件加入训练集作为新的训练数据;
或者,
通过运行主题爬虫在互联网上收集与目标法院相关的舆情信息,具体为:
步骤301设定一个入口url集合来指明信息采集的起始点;
步骤302将入口url集合加入到爬虫的待采集链接列表;
步骤303判断待采集链接表是否为空,如果不为空,执行步骤304,否则返回步骤301;
步骤304从待采集链接列表取出队首的链接进行采集;
步骤305对采集的页面进行解析,获取页面中的主题文本和url链接;
步骤306判断主题文本中是否包含设定的主题词,如果包含,执行步骤306,否则舍弃并返回步骤301;
步骤307将主题文本存入信息库;
步骤308通过正则表达式判断页面中的url链接是否是需要进一步采集的页面链接,如果是,执行步骤309;
步骤309将链接加入待采集链接列表的队尾;
循环执行步骤303至步骤309直至链接库为空;
或者,
采用情感分析算法对已爬取的每一条信息进行情感分析,具体为:
构造情感分析训练数据集,包括正向情感集合、负向情感集合和中性情感集合,每个集合包含多条文本;
构建文本内容的向量表示模型,在经向量表示后的训练数据集上训练机器学习模型得到情感分类模型;
将采集的舆情信息的向量表示输入情感分类模型到其情感类别。
4.如权利要求2所述的审判风险智能识别与预警方法,其特征在于,在获取的负向情感中提取命名实体,具体为:
定义提取的命名实体集合和语义角色词汇集合,以及语义角色词汇在法院业务系统数据库表中的对应字段;
在命名实体识别模型定位命名实体在文本中的位置后,搜索命名实体的前向文本和后向文本中离其最近的语义角色词汇,以最近的语义角色词汇作为命名实体的角色类别。
5.如权利要求4所述的审判风险智能识别与预警方法,其特征在于,对命名实体集合中的所有命名实体,采用如下步骤实现相关案例数据的检索:
步骤501初始化条件列表为空;
步骤502在命名实体集合中选取一个命名实体加入条件队列作为当前条件,并将该命名实体从命名实体集合中删除;
步骤503采用条件队列中的所有条件的合取在法院业务数据库中采用sql语句检索;
步骤504如果返回不为空且命名实体集合不为空,则返回步骤502执行;如果返回为空且命名实体集合不为空,则执行步骤505;
步骤505从条件队列中删除当前条件命名实体集合并返回步骤502继续执行;
重复步骤502至505直至命名实体集合为空,以此时条件队列中的所有条件的合取为检索条件进行检索,如返回结果不为空,则得到与舆情信息最大匹配的案件数据;如返回结果为空,则视为不存在匹配案件,舆情与审判流程风险无关。
6.如权利要求2所述的审判风险智能识别与预警方法,其特征在于,根据案件要素的类型不同,采用不同的方法对其进行数值化,具体为:
对于数值型的案件要素,以要素的原始数值作为对应特征的特征值;
对于二值型的案件要素,如果该要素值为“是”,则其对应特征值为1;否则,对应特征值取0;
对于多选项型要素,将各个选项进行编号,构建多维向量,且多维向量中只能有一个取值为1,其他均为0。
7.一种审判风险智能识别与预警系统,其特征在于,包括:
审判风险识别模块,被配置为:从法院业务系统接收到达的新立案案件数据,采用训练好的风险预测模型预测可能发生的风险类别集合,将预测结果发送至审判风险预警模块;
审判风险预警模块,被配置为:从审判风险识别模块接收案件的风险预测结果,计算风险预警指数,根据预警指数确定风险的预警级别,输出给用户交互模块;
用户交互模块,被配置为:用于根据审判风险预警模块输出的预警级别,确定预警对象和在系统界面的预警方式;接收用户对风险预警合理性和风险预测正确性的反馈,根据反馈向审判风险识别模块和审判风险预警模块发送更新调整指令。
8.如权利要求7所述的审判风险智能识别与预警系统,其特征在于,还包括:
舆情信息采集模块,被配置为:从互联网收集与目标法院相关的舆情信息,在收集后,对舆情信息进行情感分析,保留负向情感的信息;
信访系统交互模块,被配置为:从法院信访系统中查询和获取信访记录,提取信访记录的原案编号;
业务数据检索模块,被配置为:用于根据舆情信息和信访记录在法院业务系统数据库中检索相关案件,并提取案件数据发送给模型训练模块;
模型训练模块,被配置为:从业务数据检索模块接收与舆情、信访事件相关的风险案例数据和无风险案件数据,训练审判风险预测模型。
9.一种介质,其上存储有程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一项所述的审判风险智能识别与预警方法中的步骤。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7任一项所述的审判风险智能识别与预警方法中的步骤。
技术总结本公开提供了一种审判风险智能识别与预警方法,获取案件要素并计算案件要素特征向量;将得到的案件要素特征向量输入训练好的多标记分类模型中,得到案件可能发生的风险类别集合;根据案件可能发生的风险类别集合,计算案件预警指数,根据预警指数的数值,选择预设的对应预警方式和预警对象进行预警;本公开能够自动识别审判过程中多个阶段和多种类别的复杂风险点,解决了目前复杂审判风险识别仍依赖于人工分析和评估的缺陷;同时实现了对审判风险的分类和分级智能化预警,能够帮助法院高效地对风险做出响应以降低风险危害。
技术研发人员:韩晓晖;尹义龙;崔超然;孟庆钢;陆忠一;王连海;徐淑奖
受保护的技术使用者:山东省计算中心(国家超级计算济南中心)
技术研发日:2020.01.17
技术公布日:2020.06.09