一种风险控制方法、装置、计算机系统及可读存储介质与流程

专利2022-06-29  113


本发明涉及通信技术领域,尤其涉及一种风险控制方法、装置、计算机系统及可读存储介质。



背景技术:

互联网金融是传统金融机构与互联网企业利用互联网技术和信息通信技术实现资金融通、支付、投资和信息中介服务的新型金融业务模式。当前业内对基于互联网金融的小额贷款的贷款人的征信报告的审查,仍然通常采用人工核查方式,因此,通常一个客户经理每月需要审批几百上千份征信报告,不仅极大的耗费人力物力,容易出错,还很容易因评估征信报告时间过长,导致放贷效率降低;

而当前企业所使用的分类器仅仅能够对征信报告进行大致评估,其评估效率和评估效果在使用过程中并不理想,并且评估效率也较低。



技术实现要素:

本发明的目的是提供一种风险控制方法、装置、计算机系统及可读存储介质,用于解决现有技术存在的问题。

为实现上述目的,本发明提供一种风险控制方法,包括以下步骤:

s1:利用姓名身份正则表达式从征信服务器和贷款服务器中获取用户信息,并通过所述用户信息获得应还款金额;其中,将姓名身份正则表达式以通信信号的形式输出至征信服务器和贷款服务器,并且接受由征信服务器和贷款服务器以通信信号的形式输出的用户信息;

s2:根据所述用户信息和应还款金额生成多维负债信息,将所述多维负债信息录入负债聚类模型以判断其是否为风险负债信息;若是,则生成风险信号并结束;若否,则将其录入成熟风控模型以获得负债估算值并进入s3;

s3:根据所述用户信息生成多维收入信息,将所述多维收入信息录入收入聚类模型以判断其是否为风险收入信息;若是,则生成风险信号并结束;若否,则将其录入成熟收入风控模型以获得收入估算值并进入s4;

s4:将所述负债估算值和收入估算值通过编码及排序获得综合输入向量,并将所述综合输入向量录入成熟综合风控模型,以获得综合估算值;根据所述综合估算值生成风险信号或验证通过信号并结束。

上述方案中,所述s2中的负债聚类模型通过以下步骤训练获得:

s2-01:从信贷系统的黑名单中获取聚类样本,所述创建样本包括征信信息、贷款信息;

s2-02:根据用户信息和应还款金额生成多维负债样本信息;

s2-03:将多维负债样本信息录入所述初级负债聚类模型;

s2-04:按照s2-01-s0-03的方法获得多个创建样本的多维负债样本信息,并将其录入所述初级负债聚类模型;

s2-05:利用所述负债聚类模型获得所述多个多维负债样本信息的中心点,以获得负债聚类模型。

上述方案中,所述s2中将所述多维负债信息录入负债聚类模型以判断其是否为风险负债信息;若是,则生成风险信号并结束;若否,则将其录入成熟风控模型以获得负债估算值并进入s3包括:

将所述多维负债信息录入负债聚类模型,利用所述负债聚类模型计算所述多维负债信息与所述中心点的欧式距离,判断所述欧式距离是否小于风险阈值;

若是,则生成风险信号并结束;

若否,则将所述多维负债信息录入成熟风控模型以获得负债估算值并进入s3。

上述方案中,所述s2中的成熟负债风控模型通过以下步骤训练获得:

s2-11:从信贷系统的黑名单和白名单中获取创建样本,所述创建样本包括征信信息、贷款信息和负债标记;

s2-12:根据所述创建样本获得创建多维负债信息,并将其进行编码、排序得到创建负债输入向量;

s2-13:预设负债风险系数,将所述负债风险系数构建为负债输出向量;

s2-14:将所述创建负债输入向量构建成负债风控模型的负债输入层,将所述负债输出向量构建成负债风控模型的负债输出层;

s2-15:获取所述负债输入向量和负债输出向量之间的负债映射参数,并根据所述映射参数获得负债中间层;

s2-16:根据负债输入层、负债中间层和负债输出层构建得到初级负债风控模型;

s2-17:从信贷系统的黑名单和白名单中获取多个训练样本,所述训练样本包括征信信息、贷款信息和负债标记;

按照所述s2-12-s2-13的步骤依次获得各训练样本的负债输入向量和负债输出向量;

将各训练样本的负债输入向量和负债输出向量依次录入所述初级负债风控模型,使所述初级负债风控模型不断调整负债中间层,并最终获得成熟负债风控模型。

上述方案中,所述s3中的收入聚类模型通过以下步骤训练获得:

s3-01:从信贷系统的黑名单中获取聚类样本,所述创建样本包括征信信息、贷款信息;

s3-02:根据用户信息生成多维收入样本信息;

s3-03:将多维收入样本信息录入所述初级收入聚类模型;

s3-04:按照s3-01-s0-03的方法获得多个创建样本的多维收入样本信息,并将其录入所述初级收入聚类模型;

s3-05:利用所述收入聚类模型获得所述多个多维收入样本信息的中心点,以获得收入聚类模型。

上述方案中,所述s3中将所述多维收入信息录入收入聚类模型以判断其是否为风险收入信息;若是,则生成风险信号并结束;若否,则将其录入成熟风控模型以获得收入估算值并进入s4包括:

将所述多维收入信息录入收入聚类模型,利用所述收入聚类模型计算所述多维收入信息与所述中心点的欧式距离,判断所述欧式距离是否小于风险阈值;

若是,则生成风险信号并结束;

若否,则将所述多维收入信息录入成熟风控模型以获得收入估算值并进入s4。

上述方案中,所述s3中的成熟收入风控模型通过以下步骤训练获得:

s3-11:从信贷系统的黑名单和白名单中获取创建样本,所述创建样本包括征信信息、贷款信息和收入标记;

s3-12:根据所述创建样本获得创建多维收入信息,并将其进行编码、排序得到创建收入输入向量;

s3-13:预设收入风险系数,将所述收入风险系数构建为收入输出向量;

s3-14:将所述创建收入输入向量构建成收入风控模型的收入输入层,将所述收入输出向量构建成收入风控模型的收入输出层;

s3-15:获取所述收入输入向量和收入输出向量之间的收入映射参数,并根据所述映射参数获得收入中间层;

s3-16:根据收入输入层、收入中间层和收入输出层构建得到初级收入风控模型;

s3-17:从信贷系统的黑名单和白名单中获取多个训练样本,所述训练样本包括征信信息、贷款信息和收入标记;

按照所述s3-12-s3-13的步骤依次获得各训练样本的收入输入向量和收入输出向量;

将各训练样本的收入输入向量和收入输出向量依次录入所述初级收入风控模型,使所述初级收入风控模型不断调整收入中间层,并最终获得成熟收入风控模型。

为实现上述目的,本发明还提供一种风险控制装置,包括:

用户信息提取模块,用于利用姓名身份正则表达式从征信服务器和贷款服务器中获取用户信息,并通过所述用户信息获得应还款金额;其中,将姓名身份正则表达式以通信信号的形式输出至征信服务器和贷款服务器,并且接受由征信服务器和贷款服务器以通信信号的形式输出的用户信息;

负债估算模块,用于根据所述用户信息和应还款金额生成多维负债信息,将所述多维负债信息录入负债聚类模型以判断其是否为风险负债信息;若是,则生成风险信号并结束;若否,则将其录入成熟风控模型以获得负债估算值并调用收入估算模块;收入估算模块,用于根据所述用户信息生成多维收入信息,将所述多维收入信息录入收入聚类模型以判断其是否为风险收入信息;若是,则生成风险信号并结束;若否,则将其录入成熟收入风控模型以获得收入估算值并调用综合估算模块;

综合估算模块,用于将所述负债估算值和收入估算值通过编码及排序获得综合输入向量,并将所述综合输入向量录入成熟综合风控模型,以获得综合估算值;根据所述综合估算值生成风险信号或验证通过信号并结束。

为实现上述目的,本发明还提供一种计算机系统,其包括多个计算机设备,各计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述多个计算机设备的处理器执行所述计算机程序时共同实现上述风险控制方法的步骤。

为实现上述目的,本发明还提供一种计算机可读存储介质,其包括多个存储介质,各存储介质上存储有计算机程序,所述多个存储介质存储的所述计算机程序被处理器执行时共同实现上述风险控制方法的步骤。

本发明提供的一种风险控制方法、装置、计算机系统及可读存储介质,通过利用负债风控模型、收入风控模型和综合风控模型对用户信息进行运算,获得综合风控值;有助于工作人员快速直观判断该用户信息是否具有风险,以及风险大小;避免了当前业内所采用的人工核查方式对征信报告进行审批的情况出现,不仅极大的节省了人力物力,同时还提高了审批效率,避免了因评估征信报告时间过长,导致放贷效率降低的情况出现;同时还基于负债聚类模型和收入聚类模型对用户信息预先进行识别,以快速获取风险较大的用户信息并生成风险信号,极大的提高了风险评估效率和评估准确度。

附图说明

图1为本发明风险控制方法实施例一的流程图;

图2为本发明风险控制方法实施例一中风险控制装置与服务系统之间的工作流程图;

图3为本发明风险控制装置实施例二的程序模块示意图;

图4为本发明计算机系统实施例三中计算机设备的硬件结构示意图。

附图标记:

1、风险控制装置2、征信服务器3、贷款服务器

4、计算机设备11、用户信息提取模块12、负债估算模块

13、收入估算模块14、综合估算模块41、存储器42、处理器

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供的一种风险控制方法、装置、计算机系统及可读存储介质,适用于通信领域,为提供一种基于用户信息提取模块、负债估算模块、收入估算模块和综合估算模块的风险控制方法方法。本发明通过用户信息提取模块获取用户信息并获得应还款金额;通过负债估算模块利用风险评估规则获得负债估算输入向量,并将其录入成熟负债风控模型以获得负债估算值;通过收入估算模块利用风险评估规则获得收入估算输入向量,并将其录入成熟收入风控模型以获得收入估算值;再通过综合估算模块将所述负债估算值和收入估算值通过编码及排序获得综合输入向量,并将所述综合输入向量录入成熟综合风控模型,最终获得综合估算值;避免了当前业内所采用的人工核查方式对征信报告进行审批的情况出现,不仅极大的节省了人力物力,同时还提高了审批效率,避免了因评估征信报告时间过长,导致放贷效率降低的情况出现;同时还基于负债聚类模型和收入聚类模型对用户信息预先进行识别,以快速获取风险较大的用户信息并生成风险信号,极大的提高了风险评估效率和评估准确度。

实施例一

请参阅图1和图2,本实施例的一种风险控制方法,包括以下步骤:

s1:利用姓名身份正则表达式从征信服务器2和贷款服务器3中获取用户信息,并通过所述用户信息获得应还款金额;其中,将姓名身份正则表达式以通信信号的形式输出至征信服务器2和贷款服务器3,并且接受由征信服务器2和贷款服务器3以通信信号的形式输出的用户信息;

s2:根据所述用户信息和应还款金额生成多维负债信息,将所述多维负债信息录入负债聚类模型以判断其是否为风险负债信息;若是,则生成风险信号并结束;若否,则将其录入成熟风控模型以获得负债估算值并进入s3;

s3:根据所述用户信息生成多维收入信息,将所述多维收入信息录入收入聚类模型以判断其是否为风险收入信息;若是,则生成风险信号并结束;若否,则将其录入成熟收入风控模型以获得收入估算值并进入s4;

s4:将所述负债估算值和收入估算值通过编码及排序获得综合输入向量,并将所述综合输入向量录入成熟综合风控模型,以获得综合估算值;根据所述综合估算值生成风险信号或验证通过信号并结束。

具体的,所述步骤s1中的用户信息包括征信信息和贷款信息;

所述征信信息储存在征信服务器2中,利用姓名身份正则表达式在所述征信服务器2中获取征信信息;当成功获取所述征信信息时,将保存所述征信信息并生成征信成功信号;其中,将姓名身份正则表达式以通信信号的形式输出至征信服务器2,并且接受由征信服务器2以通信信号的形式输出的征信信息;

所述贷款信息在所述贷款服务器3中,根据所述征信成功信号利用姓名身份正则表达式在所述贷款服务器3中获取贷款信息;当成功获取所述贷款信息是,将保存所述贷款信息并生成贷款成功信号;根据所述贷款成功信号,通过所述用户信息获得应还款金额;其中,将姓名身份正则表达式以通信信号的形式输出至贷款服务器3,并且接受由贷款服务器3以通信信号的形式输出的贷款信息。

优选的,所述姓名身份正则表达式包括申请人的姓名和身份证号。

进一步的,所述征信信息中具有负债数据、呆账数据、贷记卡账户、准贷记卡账户、房贷信息、征信查询日期、账户类型和信用卡状态;所述负债数据中具有负债类型、剩余还款期数、剩余还款额度和月还款额,所述账户类型包括人民币账户和非人民币账户,所述信用卡状态包括在用、未激活和销户;

所述贷款信息包括贷款类型、贷款本金和实际贷款期限。

优选的,所述s1中,利用本金正则表达式和期限正则表达式提取所述贷款信息中的贷款本金和实际贷款期限,将贷款本金根据实际贷款期限以及实际年利率,以等额本息方式计算获得应还款金额;

其中,所述实际年利率可为不超过当前贷款利率的任一数值。

具体的,所述s2中的多维负债信息通过以下步骤获得:

s21:根据所述负债类型和贷款类型,生成第一负债信息;

本步骤包括:设定剩余限值并利用负债正则表达式获取所述征信信息中的负债数据,所述负债数据中具有负债类型、剩余还款期数、剩余还款额度和月还款额;

利用第一类型正则表达式从负债数据中获取负债类型,利用第二类型正则表达式从贷款信息中获取贷款类型;利用文本对比工具(textdiff)将所述负债类型与贷款类型进行比对;

若所述负债类型与所述贷款类型一致,则判断剩余还款期数是否小于剩余限值,若小于则生成内容为0的第一负债信息,若大于则生成内容为所述月还款额的第一负债信息;

若所述负债类型与所述贷款类型不一致,则生成内容为0的第一负债信息;

例如,负债类型为a银行房贷,贷款类型为a银行车贷,则负债类型与贷款类型不一致;

负债类型为a银行车贷,贷款类型为b银行车贷,则负债类型与贷款类型不一致;

负债类型为a银行车贷,贷款类型为a银行车贷,则负债类型与贷款类型一致。

优选的,剩余限值可定为6个月。

优选的,负债类型和贷款类型中还具有金融机构信息。

优选的,采用剩余期数正则表达式从所述负债数据中获取剩余还款期数,采用剩余额度正则表达式从所述负债数据中获取剩余还款额度,采用月还款正则表达式从所述负债数据中获取月还款额。

s22:根据所述呆账金额,生成第二负债信息;

本步骤包括:利用呆账正则表达式从所述征信信息中获取呆账金额;若所述呆账金额为零,则生成内容为0的第二负债信息并进入步骤s23;若所述呆账金额非零,则生成内容为呆账金额的第二负债信息进入步骤s23。

s23:设定贷款期限并根据所述贷款本金和应还款金额,生成第三负债信息;

所述s23包括以下步骤:

s23-1:设定贷款期限,并将贷款本金与贷款期限相除获得参考还款金额,并将应还款金额与参考还款金额进行对比;其中,所述贷款期限包括第一贷款期限和第二贷款期限;

若应还款金额大于所述参考还款金额,则生成内容为所述应还款金额的第三负债信息并进入步骤s24;

若应还款金额不大于所述参考还款金额,则获取贷款人的担保数据后,进入步骤s23-2;

s23-2:采用担保类型正则表达式获取所述征信信息中的担保类型;所述担保类型包括抵押担保和非抵押担保;

s23-3:若所述担保类型为抵押担保,则将贷款本金根据第一贷款期限及年利率,以等额本息方式计算获得第一月还款额,生成内容为所述第一月还款额的第三负债信息并进入步骤s24;

若所述担保类型为非抵押担保,则将贷款本金与第二贷款期限相除计算获得第二月还款额,生成内容为所述第二月还款额的第三负债信息并进入步骤s24;

其中,第一贷款期限可定为240期,即20年,年利率可定为4.9%;第二贷款期限可定为36期,即36个月。

s24:根据所述贷记卡账户的贷记已用额度,生成第四负债信息;

本步骤包括:利用贷记账户正则表达式获取所述征信信息中的贷记卡账户,利用贷记额度正则表达式获取所述贷记卡账户中的贷记已用额度;

若所述贷记已用额度为零,则生成内容为0的第四负债信息;

若所述贷记已用额度非零,则将所述贷记已用额度与贷记计提比例相乘,获得贷记月还款额;生成内容为所述贷记月还款额的第四负债信息。

s25:根据所述准贷记已用额度,生成第五负债信息;

本步骤包括:利用准贷记账户正则表达式获取所述征信信息中的准贷记卡账户,利用准贷记额度正则表达式获取所述准贷记卡账户中的准贷记已用额度;

若所述准贷记已用额度为零,则生成内容为0的第五负债信息;

若所述准贷记已用额度非零,则设定准贷记计提比例,并将所述准贷记已用额度与准贷记计提比例相乘,获得准贷记月还款额;生成内容为所述准贷记月还款额的第五负债信息;

其中,准贷记计提比例可定为10%。

s26:将所述第一负债信息、第二负债信息、第三负债信息、第四负债信息和第五负债信息汇总获得多维负债信息。

具体的,所述s2中的负债聚类模型通过以下步骤训练获得:

s2-01:从信贷系统的黑名单中获取聚类样本,所述创建样本包括征信信息、贷款信息;其中,所述负债标记用于表示创建样本的来源,即黑名单或白名单。

s2-02:根据用户信息和应还款金额生成多维负债样本信息;

本步骤中,利用所述步骤s21-s26的方法依次获得由所述创建样本的第一负债信息、第二负债信息、第三负债信息、第四负债信息和第五负债信息所构成的多维负债样本信息。

s2-03:将多维负债样本信息录入所述初级负债聚类模型;

s2-04:按照s2-01-s0-03的方法获得多个创建样本的多维负债样本信息,并将其录入所述初级负债聚类模型;

s2-05:利用所述负债聚类模型获得所述多个多维负债样本信息的中心点,以获得负债聚类模型;

本步骤中,利用均值漂移聚类算法使负债聚类模型对多个多维负债样本信息进行计算,通过将中心点的候选点更新为滑动窗口内点的均值来完成,来定位每个组/类的中心点。然后对这些候选窗口进行相似窗口进行去除,最终形成中心点集及相应的分组。

进一步的,所述s2中将所述多维负债信息录入负债聚类模型以判断其是否为风险负债信息;若是,则生成风险信号并结束;若否,则将其录入成熟风控模型以获得负债估算值并进入s3包括:

将所述多维负债信息录入负债聚类模型,利用所述负债聚类模型计算所述多维负债信息与所述中心点的欧式距离,判断所述欧式距离是否小于风险阈值;

若是,则生成风险信号并结束;

若否,则将所述多维负债信息录入成熟风控模型以获得负债估算值并进入s3。

其中,风险阈值可根据使用者的需要自行设置。

具体的,所述s2中的成熟负债风控模型通过以下步骤训练获得:

s2-11:从信贷系统的黑名单和白名单中获取创建样本,所述创建样本包括征信信息、贷款信息和负债标记;

s2-12:根据所述创建样本获得创建多维负债信息,并将其进行编码、排序得到创建负债输入向量;

s2-13:预设负债风险系数,将所述负债风险系数构建为负债输出向量;

s2-14:将所述创建负债输入向量构建成负债风控模型的负债输入层,将所述负债输出向量构建成负债风控模型的负债输出层;

本步骤中,可对负债风险系数进行量化,例如,对于黑名单中的用户,其负债风险系数可设为1,对于确定的绝对白名单中的用户,其负债风险系数可设为0;或者,根据黑名单的用户的风险程度的不同,将负债风险系数设为1-15不同的等级,而白名单的用户仍为0;

本步骤中,负债风控模型可以为svm模型,其本质为分类算法,原理为通过寻找分类平面将输入数据进行分类。

s2-15:获取所述负债输入向量和负债输出向量之间的负债映射参数,并根据所述映射参数获得负债中间层;

s2-16:根据负债输入层、负债中间层和负债输出层构建得到初级负债风控模型;

其中,在机器学习模型中,中间层为隐藏层,其中隐藏输入向量和输出向量之间映射关系,如映射参数。其中映射参数可以为权重比例、或函数式等,具体映射参数可以根据风险评估模型的结构进行设置。在构架风险评估模型时,可以设置初始化映射参数,并根据初始化映射参数得到中间层。在具体的应用中,风险评估模型为svm模型,其中间层的映射参数可以为rbf((radialbasisfunction,径向基函数)核函数、线性核函数、多项式核函数、sigmoid核函数等。当采用rbf核函数时,通过调整rbf核函数中惩罚因子c和核参数γ,可以调整中间层,最终得到适合的风险评估模型。

s2-17:从信贷系统的黑名单和白名单中获取多个训练样本,所述训练样本包括征信信息、贷款信息和负债标记;

按照所述s2-12-s2-13的步骤依次获得各训练样本的负债输入向量和负债输出向量;

将各训练样本的负债输入向量和负债输出向量依次录入所述初级负债风控模型,使所述初级负债风控模型不断调整负债中间层,并最终获得成熟负债风控模型;

本步骤中,得到初级负债风控模型后,对其进行训练,使负债风险评估模型学习已知的各种数据,通过不断调整负债中间层,找出负债输入层与负债输出层之间对应的关系,最终训练完成后得到所需的负债风控模型。对初级负债风控模型进行训练时,可以为监督学习和非监督学习,对于svm模型,可以采用监督学习,以提高模型训练效率。

具体的,所述s3中的多维收入信息通过以下步骤获得:

s31:根据所述房贷信息中的房贷月还款额生成第一收入信息;

本步骤包括:利用收入正则表达式获取所述征信信息中的房贷信息,所述房贷信息中具有房贷月还款额;

利用房贷月还款正则表达式获取所述房贷信息中的房贷月还款额;

若所述房贷月还款额为空,则生成内容为0的第一收入信息;

若所述房贷月还款额非零,将所述房贷月还款额与扩大倍数相乘,获得房贷收入指标值,并生成内容为所述房贷收入指标值的第一收入信息;

其中,扩大倍数可定为4。

s32:判断所述账户类型是否为人民币账户;若是,则进入步骤s33;若否则生成内容分别为零的第二收入信息和第三收入信息;

本步骤包括:设定征信阈值利用收入类型正则表达式获取征信信息中的账户类型;所述账户类型包括类型内容,所述类型内容包括人民币账户和非人民币账户;

若所述账户类型为人民币账户,则进入步骤s33;

若所述账户类型为非人民币账户,则生成内容为零的第二收入信息,以及内容为零的第三收入信息;

其中,采用内容为“账户类型”的正则表达式在所述征信信息中,获取与所述账户类型对应的类型内容,即人民币账户或非人民币账户。

s33:设定征信阈值并根据征信查询日期获得征信时间段,判断所述征信时间段是否小于征信阈值;

若是,则进入步骤s34;若否,则生成内容分别为零的第二收入信息和第三收入信息;

本步骤包括:设定征信阈值并利用日期正则表达式获取征信信息中的征信查询日期,将所述征信查询日期与当前日期进行相减,获得征信时间段;

若所述征信时间段小于征信阈值,则进入步骤s34;

若所述征信时间段大于征信阈值,则生成内容为零的第二收入信息,以及内容为零的第三收入信息;

其中,征信阈值可定为1年;

进一步的,采用内容为“征信查询日期”的正则表达式在所述征信信息中,获取与所述征信查询日期。

s34:判断所述信用卡状态是否为在用;若是,则进入步骤s35;若否,则生成内容分别为零的第二收入信息和第三收入信息;

本步骤包括:利用信用卡状态正则表达式获取征信信息中的信用卡状态;所述信用卡状态包括在用、销户和未激活;

若所述信用卡状态为在用,则进入步骤s35;

若所述信用卡状态为销户或未激活,则生成内容为零的第二收入信息,以及内容为零的第三收入信息;

其中,采用内容为“信用卡状态”的正则表达式在所述征信信息中,获取与所述信用卡状态对应的状态内容,即在用,或销户,或未激活。

s35:判断所述信用卡数据是否为空;若是,则生成内容分别为零的第二收入信息和第三收入信息;若否,则进入步骤s36;

本步骤包括:利用信用卡数据正则表达式获取征信信息中的信用卡数据,所述信用卡数据中具有授信机构名称、最高授信金额和本月还款额;

若所述信用卡数据为空,则直接输出为零的第二收入信息,以及为零的第三收入信息;

若所述信用卡数据至少具有一个,则进入步骤s36。

s36:设定限值倍数并将各所述信用卡数据的最高授信金额相加,再与所述信用卡数据的个数相除,获得平均授信金额;将各所述信用卡数据中额度最高的最高授信金额与平均授信金额相加后,与所述限制倍数相除,获得信用最高收入指标值;将所述信用最高收入指标值作为第二收入信息;

将各所述信用卡数据中的本月还款额相加获得信用还款收入指标值,将所述信用还款收入指标值作为第三收入信息;

其中,限值倍数可定为4。

s37:将所述第一收入信息、第二收入信息和第三收入信息汇总汇总获得多维收入信息。

具体的,所述s3中的收入聚类模型通过以下步骤训练获得:

s3-01:从信贷系统的黑名单中获取聚类样本,所述创建样本包括征信信息、贷款信息;其中,所述收入标记用于表示创建样本的来源,即黑名单或白名单。

s3-02:根据用户信息生成多维收入样本信息;

本步骤中,利用所述步骤s31-s37的方法依次获得由所述创建样本的第一收入信息、第二收入信息、第三收入信息、第四收入信息和第五收入信息所构成的多维收入样本信息。

s3-03:将多维收入样本信息录入所述初级收入聚类模型;

s3-04:按照s3-01-s0-03的方法获得多个创建样本的多维收入样本信息,并将其录入所述初级收入聚类模型;

s3-05:利用所述收入聚类模型获得所述多个多维收入样本信息的中心点,以获得收入聚类模型;

本步骤中,利用均值漂移聚类算法使收入聚类模型对多个多维收入样本信息进行计算,通过将中心点的候选点更新为滑动窗口内点的均值来完成,来定位每个组/类的中心点。然后对这些候选窗口进行相似窗口进行去除,最终形成中心点集及相应的分组。

进一步的,所述s3中将所述多维收入信息录入收入聚类模型以判断其是否为风险收入信息;若是,则生成风险信号并结束;若否,则将其录入成熟风控模型以获得收入估算值并进入s3包括:

将所述多维收入信息录入收入聚类模型,利用所述收入聚类模型计算所述多维收入信息与所述中心点的欧式距离,判断所述欧式距离是否小于风险阈值;

若是,则生成风险信号并结束;

若否,则将所述多维收入信息录入成熟风控模型以获得收入估算值并进入s3。

其中,风险阈值可根据使用者的需要自行设置。

具体的,所述s3中的成熟收入风控模型通过以下步骤训练获得:

s3-11:从信贷系统的黑名单和白名单中获取创建样本,所述创建样本包括征信信息、贷款信息和收入标记;

s3-12:根据所述创建样本获得创建多维收入信息,并将其进行编码、排序得到创建收入输入向量;

s3-13:预设收入风险系数,将所述收入风险系数构建为收入输出向量;

s3-14:将所述创建收入输入向量构建成收入风控模型的收入输入层,将所述收入输出向量构建成收入风控模型的收入输出层;

本步骤中,可对收入风险系数进行量化,例如,对于黑名单中的用户,其收入风险系数可设为1,对于确定的绝对白名单中的用户,其收入风险系数可设为0;或者,根据黑名单的用户的风险程度的不同,将收入风险系数设为1-15不同的等级,而白名单的用户仍为0;

本步骤中,收入风控模型可以为svm模型,其本质为分类算法,原理为通过寻找分类平面将输入数据进行分类。

s3-15:获取所述收入输入向量和收入输出向量之间的收入映射参数,并根据所述映射参数获得收入中间层;

s3-16:根据收入输入层、收入中间层和收入输出层构建得到初级收入风控模型;

其中,在机器学习模型中,中间层为隐藏层,其中隐藏输入向量和输出向量之间映射关系,如映射参数。其中映射参数可以为权重比例、或函数式等,具体映射参数可以根据风险评估模型的结构进行设置。在构架风险评估模型时,可以设置初始化映射参数,并根据初始化映射参数得到中间层。在具体的应用中,风险评估模型为svm模型,其中间层的映射参数可以为rbf((radialbasisfunction,径向基函数)核函数、线性核函数、多项式核函数、sigmoid核函数等。当采用rbf核函数时,通过调整rbf核函数中惩罚因子c和核参数γ,可以调整中间层,最终得到适合的风险评估模型。

s3-17:从信贷系统的黑名单和白名单中获取多个训练样本,所述训练样本包括征信信息、贷款信息和收入标记;

按照所述s3-12-s3-13的步骤依次获得各训练样本的收入输入向量和收入输出向量;

将各训练样本的收入输入向量和收入输出向量依次录入所述初级收入风控模型,使所述初级收入风控模型不断调整收入中间层,并最终获得成熟收入风控模型;

本步骤中,得到初级收入风控模型后,对其进行训练,使收入风险评估模型学习已知的各种数据,通过不断调整收入中间层,找出收入输入层与收入输出层之间对应的关系,最终训练完成后得到所需的收入风控模型。对初级收入风控模型进行训练时,可以为监督学习和非监督学习,对于svm模型,可以采用监督学习,以提高模型训练效率。

具体的,所述步骤s4中成熟综合风控模型通过以下步骤获得:

s4-11:从信贷系统的黑名单和白名单中获取创建样本,所述创建样本包括征信信息、贷款信息和综合标记;其中,所述综合标记用于表示创建样本的来源即黑名单或白名单。

s4-12:将所述创建样本录入成熟负债风控模型,并获得创建负债估算值;将所述创建样本录入成熟收入风控模型,并获得创建收入估算值。

s4-13:将创建负债估算值和创建收入估算值通过编码及排序,获得创建综合输入向量;将所述创建综合输入向量构建成综合风控模型的综合输入层;

本步骤中,综合风控模型可以为svm模型,其本质为分类算法,原理为通过寻找分类平面将输入数据进行分类。

s4-14:预设综合风险系数,将所述综合风险系数构建为创建综合输出向量;将所述创建综合输出向量构建成综合风控模型的综合输出层;

本步骤中,可对综合风险系数进行量化,例如,对于黑名单中的用户,其综合风险系数可设为1,对于确定的绝对白名单中的用户,其综合风险系数可设为0;或者,根据黑名单的用户的风险程度的不同,将综合风险系数设为1-15不同的等级,而白名单的用户仍为0。

s4-15:获取所述综合输入向量和综合输出向量之间的综合映射参数,并根据所述映射参数获得综合中间层;

s4-16:根据综合输入层、综合中间层和综合输出层构建得到初级综合风控模型;

其中,在机器学习模型中,中间层为隐藏层,其中隐藏输入向量和输出向量之间映射关系,如映射参数。其中映射参数可以为权重比例、或函数式等,具体映射参数可以根据风险评估模型的结构进行设置。在构架风险评估模型时,可以设置初始化映射参数,并根据初始化映射参数得到中间层。在具体的应用中,风险评估模型为svm模型,其中间层的映射参数可以为rbf((radialbasisfunction,径向基函数)核函数、线性核函数、多项式核函数、sigmoid核函数等。当采用rbf核函数时,通过调整rbf核函数中惩罚因子c和核参数γ,可以调整中间层,最终得到适合的风险评估模型。

s4-17:从信贷系统的黑名单和白名单中获取多个训练样本,所述训练样本包括征信信息、贷款信息和综合标记;

按照所述s4-12-s4-14的步骤依次获得各训练样本的综合输入向量和综合输出向量;将各训练样本的综合输出向量和综合输出向量依次录入所述初级综合风控模型,使所述初级综合风控模型不断调整综合中间层,并最终获得成熟综合风控模型;

本步骤中,得到初级综合风控模型后,对其进行训练,使综合风险评估模型学习已知的各种数据,通过不断调整综合中间层,找出综合输入层与综合输出层之间对应的关系,最终训练完成后得到所需的综合风控模型。对初级综合风控模型进行训练时,可以为监督学习和非监督学习,对于svm模型,可以采用监督学习,以提高模型训练效率;

同时本步骤中,由于综合估算值由综合输入向量经综合风控模型的中间层计算,并由综合风控模型的输出层输出的某一特定数值;因此,当综合估算值为0时,即为无风险,而随着综合估算值的数值增加,其风险性也在增加,因此有助于工作人员快速直观判断该用户信息是否具有风险,以及风险大小;

因此,本步骤可在综合估算值为0时,生成验证通过信号,在综合估算值为非0时生成风险信号;

同时,本步骤还可通过设置综合阈值,当综合估算值小于综合阈值时,生成验证通过信号,在综合估算值大于或等于综合阈值时,生成风险信号,其中,综合阈值可根据使用者需求自行调节。

不仅极大的节省了人力物力,同时还提高了审批效率,避免了因评估征信报告时间过长,导致放贷效率降低的情况出现;同时,由于通过计算最终估算月负债和最终估算月收入直接输出风险值,避免了贷款人的征信信息的评估结果受到主观臆断或恶意篡改,因此降低了银行所承担的风险,避免了银行出现无法挽回的损失。

实施例二

请参阅图3,本实施例的一种风险控制装置1,包括:

用户信息提取模块11,用于利用姓名身份正则表达式从征信服务器2和贷款服务器3中获取用户信息,并通过所述用户信息获得应还款金额;其中,将姓名身份正则表达式以通信信号的形式输出至征信服务器2和贷款服务器3,并且接受由征信服务器2和贷款服务器3以通信信号的形式输出的用户信息;

负债估算模块12,用于根据所述用户信息和应还款金额生成多维负债信息,将所述多维负债信息录入负债聚类模型以判断其是否为风险负债信息;若是,则生成风险信号并结束;若否,则将其录入成熟风控模型以获得负债估算值并调用收入估算模块;

收入估算模块13,用于根据所述用户信息生成多维收入信息,将所述多维收入信息录入收入聚类模型以判断其是否为风险收入信息;若是,则生成风险信号并结束;若否,则将其录入成熟收入风控模型以获得收入估算值并调用综合估算模块;

综合估算模块14,用于将所述负债估算值和收入估算值通过编码及排序获得综合输入向量,并将所述综合输入向量录入成熟综合风控模型,以获得综合估算值;根据所述综合估算值生成风险信号或验证通过信号并结束。

本发明属于互联网安全领域,是一种基于安全防护技术,利用风险评估规则对用户信息进行运算获得输入向量,并将输入向量录入风险评估模型获得综合估算值,以实现业务安全的技术。

实施例三:

为实现上述目的,本发明还提供一种计算机系统,该计算机系统包括多个计算机设备4,实施例二的风险控制装置1的组成部分可分散于不同的计算机设备4中,计算机设备4可以是执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。本实施例的计算机设备至少包括但不限于:可通过系统总线相互通信连接的存储器41、处理器42,如图4所示。需要指出的是,图4仅示出了具有组件-1的计算机设备,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。

本实施例中,存储器41(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器41可以是计算机设备的内部存储单元,例如该计算机设备的硬盘或内存。在另一些实施例中,存储器41也可以是计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。当然,存储器41还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中,存储器41通常用于存储安装于计算机设备的操作系统和各类应用软件,例如实施例一的风险控制装置的程序代码等。此外,存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器42在一些实施例中可以是中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制计算机设备的总体操作。本实施例中,处理器42用于运行存储器41中存储的程序代码或者处理数据,例如运行风险控制装置,以实现实施例一的风险控制方法。

实施例四:

为实现上述目的,本发明还提供一种计算机可读存储系统,其包括多个存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘、服务器、app应用商城等等,其上存储有计算机程序,程序被处理器42执行时实现相应功能。本实施例的计算机可读存储介质用于存储风险控制装置,被处理器42执行时实现实施例一的风险控制方法。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。


技术特征:

1.一种风险控制方法,其特征在于,包括以下步骤:

s1:利用姓名身份正则表达式从征信服务器和贷款服务器中获取用户信息,并通过所述用户信息获得应还款金额;其中,将姓名身份正则表达式以通信信号的形式输出至征信服务器和贷款服务器,并且接受由征信服务器和贷款服务器以通信信号的形式输出的用户信息;

s2:根据所述用户信息和应还款金额生成多维负债信息,将所述多维负债信息录入负债聚类模型以判断其是否为风险负债信息;若是,则生成风险信号并结束;若否,则将其录入成熟风控模型以获得负债估算值并进入s3;

s3:根据所述用户信息生成多维收入信息,将所述多维收入信息录入收入聚类模型以判断其是否为风险收入信息;若是,则生成风险信号并结束;若否,则将其录入成熟收入风控模型以获得收入估算值并进入s4;

s4:将所述负债估算值和收入估算值通过编码及排序获得综合输入向量,并将所述综合输入向量录入成熟综合风控模型,以获得综合估算值;根据所述综合估算值生成风险信号或验证通过信号并结束。

2.根据权利要求1所述的风险控制方法,其特征在于,所述s2中的负债聚类模型通过以下步骤训练获得:

s2-01:从信贷系统的黑名单中获取聚类样本,所述创建样本包括征信信息、贷款信息;

s2-02:根据用户信息和应还款金额生成多维负债样本信息;

s2-03:将多维负债样本信息录入所述初级负债聚类模型;

s2-04:按照s2-01-s0-03的方法获得多个创建样本的多维负债样本信息,并将其录入所述初级负债聚类模型;

s2-05:利用所述负债聚类模型获得所述多个多维负债样本信息的中心点,以获得负债聚类模型。

3.根据权利要求2所述的风险控制方法,其特征在于,所述s2中将所述多维负债信息录入负债聚类模型以判断其是否为风险负债信息;若是,则生成风险信号并结束;若否,则将其录入成熟风控模型以获得负债估算值并进入s3包括:

将所述多维负债信息录入负债聚类模型,利用所述负债聚类模型计算所述多维负债信息与所述中心点的欧式距离,判断所述欧式距离是否小于风险阈值;

若是,则生成风险信号并结束;

若否,则将所述多维负债信息录入成熟风控模型以获得负债估算值并进入s3。

4.根据权利要求1所述的风险控制方法,其特征在于,所述s2中的成熟负债风控模型通过以下步骤训练获得:

s2-11:从信贷系统的黑名单和白名单中获取创建样本,所述创建样本包括征信信息、贷款信息和负债标记;

s2-12:根据所述创建样本获得创建多维负债信息,并将其进行编码、排序得到创建负债输入向量;

s2-13:预设负债风险系数,将所述负债风险系数构建为负债输出向量;

s2-14:将所述创建负债输入向量构建成负债风控模型的负债输入层,将所述负债输出向量构建成负债风控模型的负债输出层;

s2-15:获取所述负债输入向量和负债输出向量之间的负债映射参数,并根据所述映射参数获得负债中间层;

s2-16:根据负债输入层、负债中间层和负债输出层构建得到初级负债风控模型;

s2-17:从信贷系统的黑名单和白名单中获取多个训练样本,所述训练样本包括征信信息、贷款信息和负债标记;

按照所述s2-12-s2-13的步骤依次获得各训练样本的负债输入向量和负债输出向量;

将各训练样本的负债输入向量和负债输出向量依次录入所述初级负债风控模型,使所述初级负债风控模型不断调整负债中间层,并最终获得成熟负债风控模型。

5.根据权利要求1所述的风险控制方法,其特征在于,所述s3中的收入聚类模型通过以下步骤训练获得:

s3-01:从信贷系统的黑名单中获取聚类样本,所述创建样本包括征信信息、贷款信息;

s3-02:根据用户信息生成多维收入样本信息;

s3-03:将多维收入样本信息录入所述初级收入聚类模型;

s3-04:按照s3-01-s0-03的方法获得多个创建样本的多维收入样本信息,并将其录入所述初级收入聚类模型;

s3-05:利用所述收入聚类模型获得所述多个多维收入样本信息的中心点,以获得收入聚类模型。

6.根据权利要求5所述的风险控制方法,其特征在于,所述s3中将所述多维收入信息录入收入聚类模型以判断其是否为风险收入信息;若是,则生成风险信号并结束;若否,则将其录入成熟风控模型以获得收入估算值并进入s4包括:

将所述多维收入信息录入收入聚类模型,利用所述收入聚类模型计算所述多维收入信息与所述中心点的欧式距离,判断所述欧式距离是否小于风险阈值;

若是,则生成风险信号并结束;

若否,则将所述多维收入信息录入成熟风控模型以获得收入估算值并进入s4。

7.根据权利要求1所述的风险控制方法,其特征在于,所述s3中的成熟收入风控模型通过以下步骤训练获得:

s3-11:从信贷系统的黑名单和白名单中获取创建样本,所述创建样本包括征信信息、贷款信息和收入标记;

s3-12:根据所述创建样本获得创建多维收入信息,并将其进行编码、排序得到创建收入输入向量;

s3-13:预设收入风险系数,将所述收入风险系数构建为收入输出向量;

s3-14:将所述创建收入输入向量构建成收入风控模型的收入输入层,将所述收入输出向量构建成收入风控模型的收入输出层;

s3-15:获取所述收入输入向量和收入输出向量之间的收入映射参数,并根据所述映射参数获得收入中间层;

s3-16:根据收入输入层、收入中间层和收入输出层构建得到初级收入风控模型;

s3-17:从信贷系统的黑名单和白名单中获取多个训练样本,所述训练样本包括征信信息、贷款信息和收入标记;

按照所述s3-12-s3-13的步骤依次获得各训练样本的收入输入向量和收入输出向量;

将各训练样本的收入输入向量和收入输出向量依次录入所述初级收入风控模型,使所述初级收入风控模型不断调整收入中间层,并最终获得成熟收入风控模型。

8.一种风险控制装置,其特征在于,包括:

用户信息提取模块,用于利用姓名身份正则表达式从征信服务器和贷款服务器中获取用户信息,并通过所述用户信息获得应还款金额;其中,将姓名身份正则表达式以通信信号的形式输出至征信服务器和贷款服务器,并且接受由征信服务器和贷款服务器以通信信号的形式输出的用户信息;

负债估算模块,用于根据所述用户信息和应还款金额生成多维负债信息,将所述多维负债信息录入负债聚类模型以判断其是否为风险负债信息;若是,则生成风险信号并结束;若否,则将其录入成熟风控模型以获得负债估算值并调用收入估算模块;

收入估算模块,用于根据所述用户信息生成多维收入信息,将所述多维收入信息录入收入聚类模型以判断其是否为风险收入信息;若是,则生成风险信号并结束;若否,则将其录入成熟收入风控模型以获得收入估算值并调用综合估算模块;

综合估算模块,用于将所述负债估算值和收入估算值通过编码及排序获得综合输入向量,并将所述综合输入向量录入成熟综合风控模型,以获得综合估算值;根据所述综合估算值生成风险信号或验证通过信号并结束。

9.一种计算机系统,其包括多个计算机设备,各计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述多个计算机设备的处理器执行所述计算机程序时共同实现权利要求1至7任一项所述风险控制方法的步骤。

10.一种计算机可读存储介质,其包括多个存储介质,各存储介质上存储有计算机程序,其特征在于,所述多个存储介质存储的所述计算机程序被处理器执行时共同实现权利要求1至7任一项所述风险控制方法的步骤。

技术总结
本发明公开了一种风险控制方法、装置、计算机系统及可读存储介质,属于互联网安全,包括以下步骤:从征信服务器和贷款服务器中获取用户信息,并获得应还款金额;将多维负债信息录入负债聚类模型以判断其是否为风险负债信息;若是,则生成风险信号;若否,则将其录入成熟风控模型获得负债估算值;将多维收入信息录入收入聚类模型以判断其是否为风险收入信息;若是,则生成风险信号并结束;若否,则将其录入成熟收入风控模型获得收入估算值;将负债估算值和收入估算值通过编码及排序获得综合输入向量,并将综合输入向量录入成熟综合风控模型获得综合估算值。本发明节省了人力物力,提高了审批效率,极大的提高了风险评估效率和评估准确度。

技术研发人员:张明
受保护的技术使用者:平安银行股份有限公司
技术研发日:2020.01.08
技术公布日:2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-14637.html

最新回复(0)