本申请涉及互联网技术领域,尤其涉及使用信用评估模型来进行信用评估的方法和装置。
背景技术:
传统的信用评估使用评分卡模型来确定用户的信用分值。评分卡模型可利用大数据计算来评估个人的信用状况。具体而言,可以通过分析大量的网络交易以及行为数据,对用户进行行为评估。评分卡模型实质上是一种二分类模型,构建该模型主要使用逻辑回归(logisticregression)算法来实现。评分卡模型是一种线性模型,最终的评分由多个评分维度累加获得。
在评分的群体庞大,用户群多样时,所有用户共用一个评分卡模型会存在评分标准不公平、评分不准确的问题。
技术实现要素:
为解决上述技术问题,本发明提供了一种信用评估方法,包括:
获取用户的样本数据集;
将所述样本数据集输入用于信用评估的深度神经网络,
其中所述深度神经网络使用隐藏层的各个节点的激活函数来实现对多个用户的样本数据集的分群处理,
其中所述深度神经网络的隐藏层的每个节点对从上一层的各节点接收到的一个或多个特征向量进行线性变换以得到经线性变换的特征向量,并且将所述经线性变换的特征向量输入激活函数,
其中所述激活函数被定义为:在激活函数的输入向量的各元素的总和大于或等于阈值时将所述输入向量传递到下一层的各节点,在所述输入向量的各元素的总和小于所述阈值时将所述输入向量的经缩放版本传递到下一层的各节点;以及
利用所述深度神经网络的输出来获取所述用户的信用分。
可任选地,所述深度神经网络的输出层接收最后一级隐藏层的一个或多个输出特征向量,并且对所述一个或多个输出特征向量进行线性变换,将经线性变换的输出特征向量的各个元素求和以获得所述用户的信用分。
可任选地,所述用户的样本数据集包括所述用户的多个特征变量,并且所述方法进一步包括:
输出关于所述多个特征变量中的每个特征变量的信用分。
可任选地,所述经线性变换的输出特征向量的各个元素分别对应于各个特征变量的信用分。
可任选地,每个节点对从上一层的各节点接收到的一个或多个特征向量进行线性变换包括:
对所述一个或多个特征向量进行加权求和,
其中每个特征向量的相关权重对应于该节点与传递该特征向量的上一级节点之间的连接权重。
可任选地,所述阈值和所述权重是通过对所述深度神经网络的训练得到的。
可任选地,所述激活函数包括relu函数、leakyrelu函数,和/或parametricrelu函数。
可任选地,所述方法进一步包括:
对所述用户的样本数据集中的每个变量进行分箱处理;以及
将经过分箱处理的变量输入所述深度神经网络。
可任选地,所述分箱处理包括等频分箱、等宽分箱、以及聚类分箱。
可任选地,如果所述深度神经网络的隐藏层的节点个数为n,则所述深度神经网络将所述多个用户分为2n个群。
本公开的另一方面提供了一种信用评估装置,包括:
用于获取用户的样本数据集的模块;
用于将所述样本数据集输入用于信用评估的深度神经网络的模块,
其中所述深度神经网络使用隐藏层的各个节点的激活函数来实现对多个用户的样本数据集的分群处理,
其中所述深度神经网络的隐藏层的每个节点对从上一层的各节点接收到的一个或多个特征向量进行线性变换以得到经线性变换的特征向量,并且将所述经线性变换的特征向量输入激活函数,
其中所述激活函数被定义为:在激活函数的输入向量的各元素的总和大于或等于阈值时将所述输入向量传递到下一层的各节点,在所述输入向量的各元素的总和小于所述阈值时将所述输入向量的经缩放版本传递到下一层的各节点;以及
用于利用所述深度神经网络的输出来获取所述用户的信用分的模块。
可任选地,所述深度神经网络的输出层接收最后一级隐藏层的一个或多个输出特征向量,并且对所述一个或多个输出特征向量进行线性变换,将经线性变换的输出特征向量的各个元素求和以获得所述用户的信用分。
可任选地,所述用户的样本数据集包括所述用户的多个特征变量,并且所述装置进一步包括:
用于输出关于所述多个特征变量中的每个特征变量的信用分的模块。
可任选地,所述经线性变换的输出特征向量的各个元素分别对应于各个特征变量的信用分。
可任选地,每个节点对从上一层的各节点接收到的一个或多个特征向量进行线性变换包括:
对所述一个或多个特征向量进行加权求和,
其中每个特征向量的相关权重对应于该节点与传递该特征向量的上一级节点之间的连接权重。
可任选地,所述阈值和所述权重是通过对所述深度神经网络的训练得到的。
可任选地,所述激活函数包括relu函数、leakyrelu函数,和/或parametricrelu函数。
可任选地,所述装置进一步包括:
用于对所述用户的样本数据集中的每个变量进行分箱处理的模块;以及
用于将经过分箱处理的变量输入所述深度神经网络的模块。
可任选地,所述分箱处理包括等频分箱、等宽分箱、以及聚类分箱。
可任选地,如果所述深度神经网络的隐藏层的节点个数为n,则所述深度神经网络将所述多个用户分为2n个群。
本公开的进一步方面提供了一种装置,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取用户的样本数据集;
将所述样本数据集输入用于信用评估的深度神经网络,
其中所述深度神经网络使用隐藏层的各个节点的激活函数来实现对多个用户的样本数据集的分群处理,
其中所述深度神经网络的隐藏层的每个节点对从上一层的各节点接收到的一个或多个特征向量进行线性变换以得到经线性变换的特征向量,并且将所述经线性变换的特征向量输入激活函数,
其中所述激活函数被定义为:在激活函数的输入向量的各元素的总和大于或等于阈值时将所述输入向量传递到下一层的各节点,在所述输入向量的各元素的总和小于所述阈值时将所述输入向量的经缩放版本传递到下一层的各节点;以及
利用所述深度神经网络的输出来获取所述用户的信用分。
与现有技术相比,本公开利用神经网络中隐藏层的各个节点的激活函数(激活状态)来实现对多个用户的样本数据集的分群处理,简化了信用评估的流程。进一步,使用本公开的方案,提高了信用评估的泛化性能。
附图说明
图1示出了现有技术中的使用评分卡进行信用评估的系统的框图。
图2示出了根据本公开的各方面的用于信用评估的系统的框图。
图3是深度神经网络的示意图。
图4是根据本发明的一个方面的用于信用评估的深度神经网络的示意图。
图5是根据本发明的另一方面的用于信用评估的深度神经网络的示意图。
图6是根据本发明的各方面的用于信用评估的方法的流程图。
具体实施方式
为让本发明的上述目的、特征和优点能更明显易懂,以下结合附图对本发明的具体实施方式作详细说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其它不同于在此描述的其它方式来实施,因此本发明不受下面公开的具体实施例的限制。
在传统的用于信用评估的评分卡模型中,所有用户都共用一个评分卡会导致评分不准确的问题。针对该问题,常规方法可以首先对多个用户进行分群(例如,使用决策树进行分群),随后针对每个用户群单独建模。
图1示出了现有技术中使用评分卡进行信用评估的系统的框图。如图1所示,系统100包括决策树分群模块102、以及多个评分卡模型104-1、104-2、……104-n。
决策树分群模块102可以利用决策树方法对每个用户的样本数据集中的各个特征(在本文也称为特征变量、变量)进行分析,将多个用户划分到不同的用户群中。用户的特征可以包括用户的收入、负债水平、年龄、性别、地域等等。可以将用户的多个特征组成该用户的样本数据集(x1,x2,……xn),其中xi为如上所述的用户的特征。每个样本数据集也可被认为是一个n维向量。
每个评分卡模型104可以对应于一个用户群。决策树分群模块102确定用户所属的用户群之后,将其样本数据集输出给相应的评分卡模型104进行信用评估。
评分卡模型104可以对用户的样本数据集中的各个特征变量(例如,如上所述的xi)进行分箱。分箱可以将连续变量离散化。分箱可包括等频分箱、等宽分箱、以及聚类分箱等。
等距分箱可将变量从最小值到最大值之间均分为n等份。即,如果a、b分别为变量的最小值和最大值,则每个区间的长度为w=(b-a)/n,可确定多个子区间,这多个子区间的边界值分别为a w、a 2w、……、a (n-1)w。等距分箱只考虑子区间的边界,每个区间里面的实例数量可能不相等。等频分箱区间的边界值被选择为使得每个区间包含大致相等的实例数量。例如,如果n=10,则每个区间应该包含大约10%的实例。
变量经过分箱之后,每个区间内的变量值将输出一个woe(weightofevidence,证据权重)值。
样本数据经过分箱处理之后,进入逻辑回归模型以预测信用分。逻辑回归模型是一种广义的线性回归分析模型。
如图1所示的信用评估的系统的建模流程较为繁琐,决策树分群模块的分群结果的各个样本是独立的。而分群越多,整体评分卡模型参数越有可能过拟合,导致模型泛化性能不强。
针对以上问题,本申请提出了一种改进的信用评估方法。
图2示出了根据本公开的各方面的用于信用评估的系统的框图。
如图2所示,用于信用评估的系统200包括变量分箱模块202、分箱转换模块204、分段线性神经网络(plnn,piecewiselinearneuralnetworks)模块206以及信用分输出模块208。
变量分箱模块202对样本数据中的各个变量进行分箱。
出于解说起见,在本示例中,每个用户的样本数据集包括特征向量(x1,x2,x3),特征向量包括三个变量x1、x2、x3,其中x1表示年龄,x2表示收入,x3表示历史信用分。
本领域技术人员将理解,这里仅是为了便于解说而举例说明,其它变量以及变量的数目也在本公开的构想中。
当用户的样本数据集被输入变量分箱模块202时,变量分箱模块202可确定该用户的每个变量在哪个区间(箱)内。
分箱转换模块204根据变量分箱模块202的处理结果将样本数据集的每个变量转换为对应的woe值。替换地,分箱转换模块204也可将样本集的每个变量转换为离散值。
替换地,变量分箱模块202和分箱转换模块204也可以是其它能够将用户的样本数据集转换为适于后续处理的模块。
plnn模型206是一个深度神经网络模型。图3是深度神经网络的示意图。
如图3所示,深度神经网络包括输入层、一个或多个隐藏层、以及输出层。一般而言,层与层之间是全连接的,即第i层的任何一个神经元与第i 1层的任何一个神经元相连。为了便于解说,神经元在本文也被称为节点。
输入层接收用户的样本数据集(x1,x2,……,xn)。
深度神经网络可包括一级或多级隐藏层。每个隐藏层可包括多个节点,每个节点接收前一层的n个节点传递而来的n个输入信号,这些输入信号通过带权重的连接进行传递。换言之,从一层的节点到下一层的节点之间的连接具有连接权重。
隐藏层中每个节点的操作可包括两个部分:
(1)对多个输入信号进行线性变换。
第二层以及后续隐藏层的节点可以计算
第一层隐藏节点可以计算
在一方面,第一层的隐藏节点可以首先将每个输入特征xi转换为n维向量(n为输入特征的个数)形式。例如,x1可被转换为向量x1=[x1,0,...,0],x2可被转换为x2=[0,x2,...,0],……,xi可被转换为xi=[0,...xi,...,0],其中xi为向量中的第i个元素,依此类推。随后可以进行向量的线性变换,计算
(2)对线性变换的结果(经线性变换的向量)应用激活函数。激活函数一般为非线性函数。
本公开的技术方案在评分卡模型中利用分段线性神经网络来实现对不同用户的分群。具体而言,本公开的技术方案将评分卡中常规的逻辑回归模型替换为深度神经网络,使用隐藏层的各个节点的激活函数来实现对多个用户的样本数据集的分群处理,由此省略了模型前的分群操作(例如,如上所述的决策树分群模块)。
具体而言,可以通过隐藏层中的各个节点的不同激活状态来实现不同用户的样本空间的划分。在每一隐藏层的每个节点都具有相同激活状态的用户可被视为分为一个群并共享一个评分卡模型(例如,具有相同的权重集合)。如果隐藏层具有n个节点,则用户可被分为2n个群,每个群共享一个评分卡模型。
本公开的激活函数可如下定义:
其中x为激活函数的输入(例如,经线性变换的特征值或特征向量),第一级隐藏层的激活函数的输入可以为用户的数据样本集的各特征变量的经线性变换值(加权求和值);第二级以及后续隐藏层的激活函数的输入可以为对来自上一级隐藏层的各向量进行线性变换(向量的加权求和)后得到的向量;t为阈值,α为缩放常数。
激活函数a(x)可以具有两个激活状态:x>t和x≤t。节点在不同的激活状态下具有不同的输出。
第二层以及后续隐藏层的各节点的激活函数可被定义为:在经线性变换的特征向量的各元素之和(经线性变换的特征的模的平方)大于阈值时将经线性变换的特征向量传递到下一层(包括下一级隐藏层和输出层)的各节点;在经线性变换的特征向量的各元素之和小于或等于该阈值时将经线性变换的特征向量的经缩放版本传递到下一层的各节点。
第一层的各节点的激活函数可被定义为:在经线性变换的特征值之和
在另一方面,如上所述,如果第一层隐藏节点将每个输入特征xi转换为n维向量(n为输入特征的个数)的形式并对这些向量进行线性变换,则第一层的每个隐藏节点也可被定位为:在经线性变换的特征向量的各元素之和大于阈值时将经线性变换的特征向量传递到下一层的各节点;在经线性变换的特征向量的各元素之和小于或等于该阈值时将经线性变换的特征向量的经缩放版本传递到下一层的各节点。
激活函数可以包括relu函数以及relu函数的变型,例如,leakyrelu函数,和/或parametricrelu函数。
relu函数的定义如下:
换言之,relu函数的参数α=0,并且t=0。
为了简明起见,下文以relu函数为激活函数对本发明的技术方案进行解说。
以下结合图4和5解说了根据本发明的各方面的用于信用评估的深度神经网络的两个示例。
图4是根据本发明的一个方面的用于信用评估的深度神经网络的示意图。
如图4所示,用于信用评估的深度神经网络400包括输入层、隐藏层和输出层。隐藏层仅包括一层,该层包括两个节点,分别具有激活函数g1(x)和g2(x)(本文以隐藏函数(例如,g1(x)与g2(x))分别指代对应节点)。
两级隐藏层之间的各节点之间的权重为wij,其中i为下一级节点在所处层的序号,j为上一级节点在所处层的序号。例如,x1与g1(x)之间的权重为w11,x2与g1(x)之间的权重为w12,x3与g1(x)之间的权重为w13,g1(x)的偏置为b11;x1与g2(x)之间的权重为w21,x2与g2(x)之间的权重为w22,x3与g2(x)之间的权重为w23,g2(x)的偏置为b12。
g1(x)与f(x)之间的连接权重为w1,g2(x)与f(x)之间的连接权重为w2,f(x)的偏置为b21。
隐藏层的两个节点的输出如下:
输出层的输出如下:
(1)如果
(2)如果
(3)如果
(4)如果
由此可见,通过g1(x)和g2(x)的不同激活状态,多个用户可被分为22=4群,这四个用户群分别满足如下条件:
第一用户群中的用户的特征(x1,x2,x3)满足条件:
第一用户群的模型输出为:
[(w1w11 w2w21)x1,(w1w12 w2w22)x2,(w1w13 w2w23)x3,w1b11 w2b12 b21]。
第二用户群中的用户的特征(x1,x2,x3)满足条件:
第二用户群的模型输出为[w1w11x1,w1w12x2,w1w13x3,w1b11 b21]。
第三用户群中的用户的特征(x1,x2,x3)满足条件:
第三用户群的模型输出为[w2w21x1,w2w22x2,w2w23x3,w2b12 b21]。
第四用户群中的用户的特征(x1,x2,x3)满足条件:
第四用户的模型输出为[0,0,0,b21]。
使用本公开的深度神经网络,用户可被划分为2n个不同的群,n为神经网络中各个隐藏层中的节点的总数,每个群中的各个用户共享相同的模型以及对应的参数。
以图4所示的包括一级隐藏层的深度神经网络为例,隐藏层具有两个节点,由此用户可被划分22个不同的群。每个用户群的各个变量使用相同的评分卡模型。
对于第一用户群,变量x1的参数为w1w11 w2w21,变量x2的参数为w1w12 w2w22,变量x3的参数为w1w13 w2w23。每个变量的参数为该变量所代表的输入节点与输出节点之间的权重乘积的总和,其中每个权重根据对应的节点的激活状态来确定。例如,变量x1的参数为w1w11 w2w21,其中w11为x1到g1(x)的权重,w1为g1(x)到f(x)的权重;w21为x1到g2(x)的权重,w2为g2(x)到f(x)的权重。
对于第二用户群,变量x1的参数为w1w11,变量x2的参数为w1w12,变量x3的参数为w1w13,这是因为第二用户群在第二个节点g2(x)的激活状态下的加权系数为0。
对于第三用户群,变量x1的参数为w2w21,变量x2的参数为w2w22,变量x3的参数为w2w23,这是因为第三用户群在第一个节点g1(x)的激活状态下的加权系数为0。
对于第四用户群,变量x1、x2和x3的参数均为0,这是因为第四群用户在第一个节点g1(x)和第二个节点g2(x)的激活状态下的加权系数均为0。
回到图2,信用分输出模块208接收plnn模型206的输出,并且输出用户的信用分以及可任选的各个特征变量维度的信用分。
以图3的深度神经网络为例,如果
[(w1w11 w2w21)x1,(w1w12 w2w22)x2,(w1w13 w2w23)x3,w1b11 w2b12 b21],
输出模块可以输出用户的信用分为:
(w1w11 w2w21)x1 (w1w12 w2w22)x2 (w1w13 w2w23)x3 w1b11 w2b12 b21。
进一步,f(x)的输出向量可表征用户的每个特征变量xi的对应信用分。例如,f(x)的输出向量的第一个元素对应于x1的信用分,f(x)的输出向量的第i个元素对应于xi的信用分,依此类推。
可任选地,信用分输出模块208还可以输出各个特征变量(维度)的信用分。例如,如果
对于根据隐藏层的各节点的激活函数来分群的每个用户群,每个特征变量的信用分也共享相同的参数。以x1为例,第一用户群的x1的信用分为(w1w11 w2w21)x1,第二用户群的x1的信用分为w1w11x1,第三用户群的x1的信用分为w2w21x1,并且第四用户群的x1的信用分为0。
图5示出了根据本发明的各方面的包括两层隐藏层的用于信用评估的深度神经网络的示意图。
如图5所示,用于信用评估的深度神经网络500包括输入层、隐藏层和输出层。
输入层包括四个节点,可以分别输入用户的样本数据中的特征(变量)x1、x2、x3、和x4。xi可以包括用户的年龄、收入、负债水平、年龄、性别、地域等等。
隐藏层包括两层,第一层包括三个节点,分别具有激活函数g1(x)、g2(x)和g3(x);第二层包括两个节点,分别具有激活函数h1(x)和h3(x)。
两层的两个节点之间的权重为
例如,x1与g1(x)之间的权重为
g1(x)与h1(x)之间的权重为
隐藏层的第一层的三个节点的输出如下:
隐藏层的第二层的节点的输出如下:
如果
输出层的输出为:
其中特征变量x1的信用分可以为
请注意,以上仅解说了一种激活状态(
图6是根据本公开的各方面的用于信用评估的方法的流程图。
在步骤602,可以获取用户的样本数据集。
可以将用户的多个特征组成该用户的样本数据集(x1,x2,……xn),其中xi是用户的特征。用户的特征可以包括用户的收入、负债水平、年龄、性别、地域等等。
可任选地,可以对用户的样本数据集中的每个变量进行分箱处理,分箱处理可包括等频分箱、等宽分箱、以及聚类分箱。
在步骤604,可以将样本数据集输入用于信用评估的深度神经网络。
本公开的用于信用评估的深度神经网络可以使用隐藏层的各个节点的激活函数来实现对多个用户的样本数据集的分群处理,具体而言,可以根据隐藏层的各个节点的激活状态(例如,x>t和x≤t)来实现对多个用户的样本数据集的分群处理。
深度神经网络的隐藏层的每个节点对从上一层的各节点接收到的一个或多个特征向量进行线性变换以得到经线性变换的特征向量。
每个节点对从上一层的各节点接收到的一个或多个特征向量进行线性变换包括:对所述一个或多个特征向量进行加权求和,其中每个特征向量的相关权重对应于该节点与传递该特征向量的上一级节点之间的连接权重。
对于第一级隐藏层,输入为来自输入层的各个节点的特征值x1、x2、……、xn。在一方面,可以将每个特征值转换为n维向量。例如,如果输入层包括三个节点,第一级隐藏层可从输入层接收特征值x1、x2、x3。这三个特征值可被分别转换为向量[x1,0,0]、[0,x2,0]和[0,0,x3]。
可以对从上一层的各节点接收到的一个或多个特征向量进行线性变换(加权求和)以得到经线性变换的特征向量,例如,图4中g1(x)节点的[w11x1,w12x2,w13x3,b11]。
经线性变换的特征向量可被输入激活函数,激活函数可被定义为:在激活函数的输入向量的各元素的总和大于或等于阈值时将该输入向量传递到下一层的各节点,在输入向量的各元素的总和小于所述阈值时将输入向量的经缩放版本传递到下一层的各节点。
本公开的激活函数可如下定义:
x为激活函数的输入(例如,经线性变换的特征值或特征向量),t为阈值,α为缩放常数。
例如,在图4的示例中,激活函数为relu函数,g1(x)的输出为:
本公开的每个节点的阈值和权重可以通过训练得到。例如,可以通过输入训练样本及其对应的标签来对神经网络进行训练,从而得到每个节点的阈值和权重。
在一方面,如果所述深度神经网络的隐藏层的节点个数为n,则所述深度神经网络将用户分为2n个群。例如,图4的神经网络的隐藏层包括2个节点,则可将用户分为4个用户群。图4的神经网络的隐藏层包括5个节点,则可将用户分为32个用户群。每个群共享一个评分卡模型。
在步骤606,可以利用深度神经网络的输出来获取用户的信用分。
可以使用图2中的信用分输出模块208来获取用户的信用分。
具体而言,深度神经网络的输出层可以接收最后一级隐藏层的一个或多个输出特征向量,并且对该一个或多个输出特征向量进行线性变换,结果得到的向量可传递给信用分输出模块208。信用分输出模块208可将经线性变换的输出特征向量的各个元素求和以获得所述用户的信用分。
进一步,信用分输出模块208还可以输出关于所述多个特征变量中的每个特征变量的信用分。具体而言,经线性变换的输出特征向量的各个元素可分别对应于各个特征变量的信用分。
本文结合附图阐述的说明描述了示例配置而不代表可被实现或者落在权利要求的范围内的所有示例。本文所使用的术语“示例性”意指“用作示例、实例或解说”,而并不意指“优于”或“胜过其他示例”。本详细描述包括具体细节以提供对所描述的技术的理解。然而,可以在没有这些具体细节的情况下实践这些技术。在一些实例中,众所周知的结构和设备以框图形式示出以避免模糊所描述的示例的概念。
在附图中,类似组件或特征可具有相同的附图标记。此外,相同类型的各个组件可通过在附图标记后跟随短划线以及在类似组件之间进行区分的第二标记来加以区分。如果在说明书中仅使用第一附图标记,则该描述可应用于具有相同的第一附图标记的类似组件中的任何一个组件而不论第二附图标记如何。
结合本文中的公开描述的各种解说性框以及模块可以用设计成执行本文中描述的功能的通用处理器、dsp、asic、fpga或其他可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可被实现为计算设备的组合(例如,dsp与微处理器的组合、多个微处理器、与dsp核心协同的一个或多个微处理器,或者任何其他此类配置)。
本文中所描述的功能可以在硬件、由处理器执行的软件、固件、或其任何组合中实现。如果在由处理器执行的软件中实现,则各功能可以作为一条或多条指令或代码存储在计算机可读介质上或藉其进行传送。其他示例和实现落在本公开及所附权利要求的范围内。例如,由于软件的本质,以上描述的功能可使用由处理器执行的软件、硬件、固件、硬连线或其任何组合来实现。实现功能的特征也可物理地位于各种位置,包括被分布以使得功能的各部分在不同的物理位置处实现。另外,如本文(包括权利要求中)所使用的,在项目列举(例如,以附有诸如“中的至少一个”或“中的一个或多个”之类的措辞的项目列举)中使用的“或”指示包含性列举,以使得例如a、b或c中的至少一个的列举意指a或b或c或ab或ac或bc或abc(即,a和b和c)。同样,如本文所使用的,短语“基于”不应被解读为引述封闭条件集。例如,被描述为“基于条件a”的示例性步骤可基于条件a和条件b两者而不脱离本公开的范围。换言之,如本文所使用的,短语“基于”应当以与短语“至少部分地基于”相同的方式来解读。
计算机可读介质包括非瞬态计算机存储介质和通信介质两者,其包括促成计算机程序从一地向另一地转移的任何介质。非瞬态存储介质可以是能被通用或专用计算机访问的任何可用介质。作为示例而非限定,非瞬态计算机可读介质可包括ram、rom、电可擦除可编程只读存储器(eeprom)、压缩盘(cd)rom或其他光盘存储、磁盘存储或其他磁存储设备、或能被用来携带或存储指令或数据结构形式的期望程序代码手段且能被通用或专用计算机、或者通用或专用处理器访问的任何其他非瞬态介质。任何连接也被正当地称为计算机可读介质。例如,如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(dsl)、或诸如红外、无线电、以及微波之类的无线技术从web网站、服务器、或其它远程源传送而来的,则该同轴电缆、光纤电缆、双绞线、数字订户线(dsl)、或诸如红外、无线电、以及微波之类的无线技术就被包括在介质的定义之中。如本文所使用的盘(disk)和碟(disc)包括cd、激光碟、光碟、数字通用碟(dvd)、软盘和蓝光碟,其中盘常常磁性地再现数据而碟用激光来光学地再现数据。以上介质的组合也被包括在计算机可读介质的范围内。
提供本文的描述是为了使得本领域技术人员能够制作或使用本公开。对本公开的各种修改对于本领域技术人员将是显而易见的,并且本文中定义的普适原理可被应用于其他变形而不会脱离本公开的范围。由此,本公开并非被限定于本文所描述的示例和设计,而是应被授予与本文所公开的原理和新颖特征相一致的最广范围。
1.一种信用评估方法,包括:
获取用户的样本数据集;
将所述样本数据集输入用于信用评估的深度神经网络,
其中所述深度神经网络使用隐藏层的各个节点的激活函数来实现对多个用户的样本数据集的分群处理,
其中所述深度神经网络的隐藏层的每个节点对从上一层的各节点接收到的一个或多个特征向量进行线性变换以得到经线性变换的特征向量,并且将所述经线性变换的特征向量输入激活函数,
其中所述激活函数被定义为:在激活函数的输入向量的各元素的总和大于或等于阈值时将所述输入向量传递到下一层的各节点,在所述输入向量的各元素的总和小于所述阈值时将所述输入向量的经缩放版本传递到下一层的各节点;以及
利用所述深度神经网络的输出来获取所述用户的信用分。
2.如权利要求1所述的方法,其特征在于,所述深度神经网络的输出层接收最后一级隐藏层的一个或多个输出特征向量,并且对所述一个或多个输出特征向量进行线性变换,将经线性变换的输出特征向量的各个元素求和以获得所述用户的信用分。
3.如权利要求2所述的方法,其特征在于,所述用户的样本数据集包括所述用户的多个特征变量,并且所述方法进一步包括:
输出关于所述多个特征变量中的每个特征变量的信用分。
4.如权利要求3所述的方法,其特征在于,所述经线性变换的输出特征向量的各个元素分别对应于各个特征变量的信用分。
5.如权利要求1所述的方法,其特征在于,每个节点对从上一层的各节点接收到的一个或多个特征向量进行线性变换包括:
对所述一个或多个特征向量进行加权求和,
其中每个特征向量的相关权重对应于该节点与传递该特征向量的上一级节点之间的连接权重。
6.如权利要求5所述的方法,其特征在于,所述阈值和所述权重是通过对所述深度神经网络的训练得到的。
7.如权利要求1所述的方法,其特征在于,所述激活函数包括relu函数、leakyrelu函数,和/或parametricrelu函数。
8.如权利要求1所述的方法,其特征在于,所述方法进一步包括:
对所述用户的样本数据集中的每个变量进行分箱处理;以及
将经过分箱处理的变量输入所述深度神经网络。
9.如权利要求8所述的方法,其特征在于,所述分箱处理包括等频分箱、等宽分箱、以及聚类分箱。
10.如权利要求1所述的方法,其特征在于,如果所述深度神经网络的隐藏层的节点个数为n,则所述深度神经网络将所述多个用户分为2n个群。
11.一种信用评估装置,包括:
用于获取用户的样本数据集的模块;
用于将所述样本数据集输入用于信用评估的深度神经网络的模块,
其中所述深度神经网络使用隐藏层的各个节点的激活函数来实现对多个用户的样本数据集的分群处理,
其中所述深度神经网络的隐藏层的每个节点对从上一层的各节点接收到的一个或多个特征向量进行线性变换以得到经线性变换的特征向量,并且将所述经线性变换的特征向量输入激活函数,
其中所述激活函数被定义为:在激活函数的输入向量的各元素的总和大于或等于阈值时将所述输入向量传递到下一层的各节点,在所述输入向量的各元素的总和小于所述阈值时将所述输入向量的经缩放版本传递到下一层的各节点;以及
用于利用所述深度神经网络的输出来获取所述用户的信用分的模块。
12.如权利要求11所述的装置,其特征在于,所述深度神经网络的输出层接收最后一级隐藏层的一个或多个输出特征向量,并且对所述一个或多个输出特征向量进行线性变换,将经线性变换的输出特征向量的各个元素求和以获得所述用户的信用分。
13.如权利要求12所述的装置,其特征在于,所述用户的样本数据集包括所述用户的多个特征变量,并且所述装置进一步包括:
用于输出关于所述多个特征变量中的每个特征变量的信用分的模块。
14.如权利要求13所述的装置,其特征在于,所述经线性变换的输出特征向量的各个元素分别对应于各个特征变量的信用分。
15.如权利要求11所述的装置,其特征在于,每个节点对从上一层的各节点接收到的一个或多个特征向量进行线性变换包括:
对所述一个或多个特征向量进行加权求和,
其中每个特征向量的相关权重对应于该节点与传递该特征向量的上一级节点之间的连接权重。
16.如权利要求15所述的装置,其特征在于,所述阈值和所述权重是通过对所述深度神经网络的训练得到的。
17.如权利要求11所述的装置,其特征在于,所述激活函数包括relu函数、leakyrelu函数,和/或parametricrelu函数。
18.如权利要求11所述的装置,其特征在于,所述装置进一步包括:
用于对所述用户的样本数据集中的每个变量进行分箱处理的模块;以及
用于将经过分箱处理的变量输入所述深度神经网络的模块。
19.如权利要求18所述的装置,其特征在于,所述分箱处理包括等频分箱、等宽分箱、以及聚类分箱。
20.如权利要求11所述的装置,其特征在于,如果所述深度神经网络的隐藏层的节点个数为n,则所述深度神经网络将所述多个用户分为2n个群。
21.一种装置,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取用户的样本数据集;
将所述样本数据集输入用于信用评估的深度神经网络,
其中所述深度神经网络使用隐藏层的各个节点的激活函数来实现对多个用户的样本数据集的分群处理,
其中所述深度神经网络的隐藏层的每个节点对从上一层的各节点接收到的一个或多个特征向量进行线性变换以得到经线性变换的特征向量,并且将所述经线性变换的特征向量输入激活函数,
其中所述激活函数被定义为:在激活函数的输入向量的各元素的总和大于或等于阈值时将所述输入向量传递到下一层的各节点,在所述输入向量的各元素的总和小于所述阈值时将所述输入向量的经缩放版本传递到下一层的各节点;以及
利用所述深度神经网络的输出来获取所述用户的信用分。
技术总结