自由瞬目条件下的眼表指标数据分类方法与流程

专利2022-06-29  126


本发明属于数据处理领域,具体涉及一种自由瞬目条件下的眼表指标数据分类方法。
背景技术
:随着经济技术的发展和人们生活水平的提高,眼睛相关的数据分类方法已经开始逐步受到人们的重视,也在相应的领域发挥着巨大的作用。目前眼睛数据相关的分类方法,已经广泛采用了机器学习技术和智能算法。例如,kim等人获取了各种算法候选特征,然后提出了四种有效的机器学习模型来诊断青光眼,分别为:c5.0,随机森林(rf),支持向量机(svm)和k最近邻(knn),结果表明rf具有最佳的诊断性能和可解释性。an等人从每只眼睛中提取91个参数,并使用四个机器学习分类器建立青光眼视盘的分类模型,包括:神经网络(nn),朴素贝叶斯(nb),支持向量机(svm)和梯度提升决策树(gbdt)。实验结果表明,nn算法具有最佳的分类性能。fageeri等人运用三种机器学习算法对眼病的类型进行分类,结果表明,j48决策树分类器的性能优于朴素贝叶斯和svm。眼表指标是眼睛数据中的一个重要部分,眼表指标的数据分类直接影响着眼表指标的数据应用。但是,目前并未见有相关的眼表指标数据分类方法出现,从而也直接影响了眼表指标的数据应用和进一步的数据挖掘工作。技术实现要素:本发明的目的在于提供一种可靠性高、实用性好且适用范围广的自由瞬目条件下的眼表指标数据分类方法。本发明提供的这种自由瞬目条件下的眼表指标数据分类方法,包括如下步骤:s1.获取历史数据中,自由瞬目条件下的眼表指标数据并进行数据处理;s2.将步骤s1进行处理后的数据进行混沌特性测试;s3.将步骤s1进行处理后的数据进行映射相关运算,从而得到样本数据;s4.对步骤s3得到的样本数据进行重要性权重排序和数据移除,从而得到模型输入特征数据;s5.将步骤s4获取的模型输入特征数据分为训练集和测试集,并对分类模型进行训练、测试和修正,从而得到自由瞬目条件下的眼表指标数据分类模型;s6.利用步骤s5得到的自由瞬目条件下的眼表指标数据分类模型,对待分类的自由瞬目条件下的眼表指标数据进行分类。步骤s1所述的获取历史数据中,自由瞬目条件下的眼表指标数据并进行数据处理,具体为获取历史数据中,自由瞬目条件下的眼表指标数据中的客观散射指数和泪河高度数据;然后计算周期内瞬目频率与最长睁眼时长,并选取周期内维持最大睁眼时间的客观散射指数;最后将所获取的数据进行标识;从而构成原始样本数据。步骤s2所述的将步骤s1进行处理后的数据进行混沌特性测试,具体为对步骤s1获取的客观散射指数,采用c-c法优化后的wolf算法,获取客观散射指数的最大李雅普诺夫指数。所述的采用c-c法优化后的wolf算法,获取客观散射指数的最大李雅普诺夫指数,具体为采用如下步骤计算客观散射指数的最大李雅普诺夫指数:a.获取输入的客观散射指数;b.计算输入的客观散射指数的标准差,并设置参数范围;c.通过算法函数disjointfunction和correlationfunction计算c(1,n,r,t);所述算法函数disjointfunction将时间序列分解成t个不相交的时间序列,算法函数correlationfunction为采用阶跃函数(heavisidefunction)和无穷范数(normfunction)计算关联积分值;结果c(1,n,r,t)的定义为原始时间序列的关联积分d.通过算法函数correlationfunction计算c(m,n,r,t);所述结果c(m,n,r,t)的定义为嵌入时间序列的关联积分e.计算c(m,n,r,t)与c(1,n,r,t)之间的差值;f.根据步骤e的计算结果,分别计算测试统计值和scor(τ);其中表示平均检验统计量;表示平均差量;scor(τ)表示与之和;g.获取最终参数值:延迟时间t和嵌入维度m;h.采用wolf算法计算客观散射指数的最大李雅普诺夫指数;i.判断客观散射指数的混沌特性,从而获取分类候选特征。步骤s3所述的将步骤s1进行处理后的数据进行映射相关运算,从而得到样本数据,具体为计算得到中间数据:客观散射指数的中值、客观散射指数的极差、客观散射指数的平均值、客观散射指数的标准差、客观散射指数的相对全距、客观散射指数的变化率、客观散射指数的稳定性指数和泪膜客观散射指数的平均值;然后原始样本数据、最大李雅普诺夫指数和上述计算得到的中间数据一同构成样本数据。所述的客观散射指数的相对全距为客观散射指数极差与客观散射指数平均值的比值;所述的客观散射指数的变化率的计算公式为所述的客观散射指数的稳定性指数为客观散射指数的线性回归直线的斜率;所述的泪膜客观散射指数的平均值为总体客观散射指数平均值与基础客观散射指数平均值的差值。步骤s4所述的对步骤s3得到的样本数据进行重要性权重排序和数据移除,从而得到模型输入特征数据,具体为利用工作特征曲线roc的曲线下面积auc对总体样本数据进行重要性权重排序,并移除权重小于预设阈值的特征,从而获得模型输入特征数据。步骤s5所述的分类模型,具体为优化后的集成极限学习机算法;优化后的集成极限学习机算法采用旋转森林集成策略,包括利用遍历法获取极限学习机的最优隐含层数目,使用bootstrap方法进行样本抽样,采用主成分分析法进行样本转换,并将集成数量设置为15。本发明提供的这种自由瞬目条件下的眼表指标数据分类方法,通过采集自由瞬目条件下的客观散射指数和泪河高度这两项眼表指标,并进行混沌特性测试和数据映射相关运算,得到全面的样本数据;其次,利用auc对其进行重要性权重排序,选择auc大于阈值的特征作为诊断模型输入变量;而后,采用旋转森林集成策略来提升特征多样性,以克服极限学习机的输出结果不稳定问题;再而,利用优化后的集成极限学习机算法对训练集中的每个样本进行训练,得到最优的集成极限学习机泪囊炎诊断训练模型;最后,利用训练模型对实际待测的眼表指标进行检测和分类,从而得到最终的分类结果。本发明方法可靠性高、实用性好、稳定性强且适用范围广。附图说明图1为本发明方法的方法流程示意图。图2为本发明方法的客观散射指数的测量结果示意图。图3为本发明方法的泪河高度的测量结果示意图。图4为本发明方法的旋转森林集成策略优化集成极限学习机的流程示意图。具体实施方式如图1所示为本发明方法的方法流程示意图:本发明提供的这种自由瞬目条件下的眼表指标数据分类方法,包括如下步骤:s1.获取历史数据中,自由瞬目条件下的眼表指标数据并进行数据处理;具体为获取历史数据中,自由瞬目条件下的眼表指标数据中的客观散射指数(包括基础客观散射指数和总体客观散射指数)和泪河高度数据(如图2和图3所示);然后计算周期内瞬目频率与最长睁眼时长,并选取周期内维持最大睁眼时间的客观散射指数;最后将所获取的数据进行标识;从而构成原始样本数据;s2.将步骤s1进行处理后的数据进行混沌特性测试;具体为对步骤s1获取的客观散射指数,采用c-c法优化后的wolf算法,获取客观散射指数的最大李雅普诺夫指数;在具体实施时,可以采用如下步骤计算客观散射指数的最大李雅普诺夫指数:a.获取输入的客观散射指数;b.计算输入的客观散射指数的标准差,并设置参数范围;c.通过算法函数disjointfunction和correlationfunction计算c(1,n,r,t);所述算法函数disjointfunction将时间序列分解成t个不相交的时间序列,算法函数correlationfunction为采用阶跃函数(heavisidefunction)和无穷范数(normfunction)计算关联积分值;结果c(1,n,r,t)的定义为原始时间序列的关联积分d.通过算法函数correlationfunction计算c(m,n,r,t);所述结果c(m,n,r,t)的定义为嵌入时间序列的关联积分e.计算c(m,n,r,t)与c(1,n,r,t)之间的差值;f.根据步骤e的计算结果,分别计算测试统计值和scor(τ);其中表示平均检验统计量;表示平均差量;scor(τ)表示与之和;g.获取最终参数值:延迟时间t和嵌入维度m;h.采用wolf算法计算客观散射指数的最大李雅普诺夫指数;i.判断客观散射指数的混沌特性,从而获取分类候选特征;s3.将步骤s1进行处理后的数据进行映射相关运算,从而得到样本数据;具体为计算得到中间数据:客观散射指数的中值、客观散射指数的极差、客观散射指数的平均值、客观散射指数的标准差、客观散射指数的相对全距、客观散射指数的变化率、客观散射指数的稳定性指数和泪膜客观散射指数的平均值;然后原始样本数据、最大李雅普诺夫指数和上述计算得到的中间数据一同构成样本数据;在具体实施时,所述的客观散射指数的相对全距为客观散射指数极差与客观散射指数平均值的比值;所述的客观散射指数的变化率的计算公式为所述的客观散射指数的稳定性指数为客观散射指数的线性回归直线的斜率;所述的泪膜客观散射指数的平均值为总体客观散射指数平均值与基础客观散射指数平均值的差值;s4.对步骤s3得到的样本数据进行重要性权重排序和数据移除,从而得到模型输入特征数据;具体为利用工作特征曲线roc的曲线下面积auc对总体样本数据进行重要性权重排序,并移除权重小于预设阈值的特征,从而获得模型输入特征数据;在具体实施时,重要性权重排序为对每个参数的auc结果大小进行排序;同时,预设阈值可以设定为0.5;s5.将步骤s4获取的模型输入特征数据分为训练集和测试集,并对分类模型进行训练、测试和修正,从而得到自由瞬目条件下的眼表指标数据分类模型;具体为优化后的集成极限学习机算法;优化后的集成极限学习机算法(如图4所示)采用旋转森林集成策略,包括利用遍历法获取极限学习机的最优隐含层数目,使用bootstrap方法进行样本抽样,采用主成分分析法进行样本转换,并将集成数量设置为15;此外,分类模型的输入数据为一个9维特征向量,具体包括基础客观散射指数、客观散射指数的中值、客观散射指数的平均值、客观散射指数的变化率、最长睁眼时间、瞬目频率、客观散射指数的最大李雅普诺夫指数、泪河高度、泪膜客观散射指数的平均值;s6.利用步骤s5得到的自由瞬目条件下的眼表指标数据分类模型,对待分类的自由瞬目条件下的眼表指标数据进行分类。以下结合一个具体实施时,对本发明方法进行进一步说明:采用108例历史数据,其中54例数据为正常数据,54例数据为异常数据;卡方检验用于性别分析,单因素方差分析(anova)用于年龄分析,人口学统计信息如表1所示,可以看出两组之间的性别和年龄没有统计学差异。表1108例历史数据的统计学计算结果然后,采集历史数据的具体数据:如图3所示的瞬目频率为3(作为候选特征被选择),睁眼时间为5.5秒、8秒(最大的睁眼时长将被选择以避免各种不自然瞬目情形)、3.5秒;继而以不同的标识符对异常情况进行标识,在本实施例中,以阿拉伯数字0至1分别标识两种状态,即54例异常数据的标识符设置为1,54例正常数据的标识符设置为0;因此108例历史数据的客观散射指数、泪河高度、瞬目频率、最长睁眼时间和类别标识符构成原始样本数据;然后,采用c-c法获得最优的延迟时间t和嵌入维度m,然后采用wolf算法,获取客观散射指数的最大李雅普诺夫指数;然后,计算得到样本数据,具体如表2所示:表2总体样本数据再然后,利用受试者工作特征曲线(roc)的曲线下面积(auc)对总体样本数据进行重要性权重排序,所述重要性权重排序为对每个参数的auc结果大小进行排序,如表3所示;权重小于预设阈值的特征将被移除,所述预设阈值设为0.5,即auc>0.5的特征会作为模型输入特征,从而获得最重要的模型输入特征;因此在本实施例中,一个9维的特征向量将作为诊断模型的输入变量,包括:osi_basic,osi_median,osi_mean,osi_cr,osi_tl,osi_nb,osi_mle,tmh,tf-osi_mean;表3每个参数的auc结果参数auc标准错误p值osi_basic0.54080.05560.2314osi_median0.55370.05540.1665osi_r0.44810.33950.8252osi_mean0.55040.05550.1817osi_sd0.45240.05550.8043osi_rr0.48510.37580.6050osi_cr0.52470.05570.3289osi_si0.47530.05570.6712osi_tl0.59860.05450.0352osi_nb0.58520.05480.0601osi_mle0.51310.05580.4075tf-osi_mean0.52130.05580.3516tmh0.83860.03880.0357然后,将计算出的模型输入特征数据随机分成训练集和测试集,在本实施例中,将所述样本数据随机选取100组作为训练样本集,剩余8组作为测试样本集;样本中每组数据的第1-9维作为集成极限学习机诊断模型的输入向量,第10维(正常或异常)作为集成极限学习机诊断模型的输出;利用优化后的集成极限学习机算法对训练集中的每个样本进行训练,包括使用bootstrap方法进行样本抽样,采用主成分分析法进行样本转换,较佳的,在本实施例中,集成数量设置为l=15,极限学习机的最优隐含层数目设置为30,最后得到集成极限学习机的数据分类模型。旋转森林集成策略优化集成极限学习机的流程示意图如图4所示;最后,将得到的分类模型进行运用,对待分类的数据进行分类即可。此外,在本实施例中,对旋转森林集成策略优化的极限学习机算法进行100次独立的运行,其平均训练精度和测试精度的结果如表4所示。除此之外,采用bagging集成策略优化的极限学习机、标准的极限学习机算法也同样经过100次独立的训练和测试,以进行三种算法的性能比较,其平均训练精度和测试精度的结果如表4所示。从表4中可以明显看出,本发明所提出的基于旋转森林集成策略的极限学习机的数据分类模型达到了最佳的测试精度,其在测试集上的总体分类准确率达到82.14%,正常组和异常组在测试集上的分类准确率分别达到87.48%和84.29%。值得注意的是,本发明提出方法的测试精度高于训练精度,这表明该模型在训练集上得到了很好的训练,并且训练后的模型具有很好的泛化能力。因此,本发明所提出的基于眼表指标与集成极限学习机的数据分类方法能够进行正确的数据分类,效果极好。表4三种算法在100次独立运行中的平均训练精度和测试精度在本发明的数据分类完毕后,使用者可以根据本发明最终给出的分类结果,结合自身的技术背景和技术水平,以及眼表指标的原始数据,对分类数据所对应的人员的眼睛健康程度作出判断。当前第1页1 2 3 
技术特征:

1.一种自由瞬目条件下的眼表指标数据分类方法,包括如下步骤:

s1.获取历史数据中,自由瞬目条件下的眼表指标数据并进行数据处理;

s2.将步骤s1进行处理后的数据进行混沌特性测试;

s3.将步骤s1进行处理后的数据进行映射相关运算,从而得到样本数据;

s4.对步骤s3得到的样本数据进行重要性权重排序和数据移除,从而得到模型输入特征数据;

s5.将步骤s4获取的模型输入特征数据分为训练集和测试集,并对分类模型进行训练、测试和修正,从而得到自由瞬目条件下的眼表指标数据分类模型;

s6.利用步骤s5得到的自由瞬目条件下的眼表指标数据分类模型,对待分类的自由瞬目条件下的眼表指标数据进行分类。

2.根据权利要求1所述的自由瞬目条件下的眼表指标数据分类方法,其特征在于步骤s1所述的获取历史数据中,自由瞬目条件下的眼表指标数据并进行数据处理,具体为获取历史数据中,自由瞬目条件下的眼表指标数据中的客观散射指数和泪河高度数据;然后计算周期内瞬目频率与最长睁眼时长,并选取周期内维持最大睁眼时间的客观散射指数;最后将所获取的数据进行标识;从而构成原始样本数据。

3.根据权利要求2所述的自由瞬目条件下的眼表指标数据分类方法,其特征在于步骤s2所述的将步骤s1进行处理后的数据进行混沌特性测试,具体为对步骤s1获取的客观散射指数,采用c-c法优化后的wolf算法,获取客观散射指数的最大李雅普诺夫指数。

4.根据权利要求3所述的自由瞬目条件下的眼表指标数据分类方法,其特征在于所述的采用c-c法优化后的wolf算法,获取客观散射指数的最大李雅普诺夫指数,具体为采用如下步骤计算客观散射指数的最大李雅普诺夫指数:

a.获取输入的客观散射指数;

b.计算输入的客观散射指数的标准差,并设置参数范围;

c.通过算法函数disjointfunction和correlationfunction计算c(1,n,r,t);所述算法函数disjointfunction将时间序列分解成t个不相交的时间序列,算法函数correlationfunction为采用阶跃函数(heavisidefunction)和无穷范数(normfunction)计算关联积分值;结果c(1,n,r,t)的定义为原始时间序列的关联积分

d.通过算法函数correlationfunction计算c(m,n,r,t);所述结果c(m,n,r,t)的定义为嵌入时间序列的关联积分

e.计算c(m,n,r,t)与c(1,n,r,t)之间的差值;

f.根据步骤e的计算结果,分别计算测试统计值和scor(τ);其中表示平均检验统计量;表示平均差量;scor(τ)表示之和;

g.获取最终参数值:延迟时间t和嵌入维度m;

h.采用wolf算法计算客观散射指数的最大李雅普诺夫指数;

i.判断客观散射指数的混沌特性,从而获取分类候选特征。

5.根据权利要求4所述的自由瞬目条件下的眼表指标数据分类方法,其特征在于步骤s3所述的将步骤s1进行处理后的数据进行映射相关运算,从而得到样本数据,具体为计算得到中间数据:客观散射指数的中值、客观散射指数的极差、客观散射指数的平均值、客观散射指数的标准差、客观散射指数的相对全距、客观散射指数的变化率、客观散射指数的稳定性指数和泪膜客观散射指数的平均值;然后原始样本数据、最大李雅普诺夫指数和上述计算得到的中间数据一同构成样本数据。

6.根据权利要求5所述的自由瞬目条件下的眼表指标数据分类方法,其特征在于所述的客观散射指数的相对全距为客观散射指数极差与客观散射指数平均值的比值;所述的客观散射指数的变化率的计算公式为所述的客观散射指数的稳定性指数为客观散射指数的线性回归直线的斜率;所述的泪膜客观散射指数的平均值为总体客观散射指数平均值与基础客观散射指数平均值的差值。

7.根据权利要求6所述的自由瞬目条件下的眼表指标数据分类方法,其特征在于步骤s4所述的对步骤s3得到的样本数据进行重要性权重排序和数据移除,从而得到模型输入特征数据,具体为利用工作特征曲线roc的曲线下面积auc对总体样本数据进行重要性权重排序,并移除权重小于预设阈值的特征,从而获得模型输入特征数据。

8.根据权利要求7所述的自由瞬目条件下的眼表指标数据分类方法,其特征在于步骤s5所述的分类模型,具体为优化后的集成极限学习机算法;优化后的集成极限学习机算法采用旋转森林集成策略,包括利用遍历法获取极限学习机的最优隐含层数目,使用bootstrap方法进行样本抽样,采用主成分分析法进行样本转换,并将集成数量设置为15。

技术总结
本发明公开了一种自由瞬目条件下的眼表指标数据分类方法,包括获取历史数据中自由瞬目条件下的眼表指标数据、进行数据处理、进行混沌特性测试和映射相关运算,得到样本数据;对样本数据进行重要性权重排序和数据移除得到模型输入特征数据;将模型输入特征数据分为训练集和测试集并对分类模型进行训练、测试和修正得到自由瞬目条件下的眼表指标数据分类模型;利用自由瞬目条件下的眼表指标数据分类模型对待分类数据分类。本发明方法可靠性高、实用性好、稳定性强且适用范围广。

技术研发人员:廖胜辉;韩付昌;蒋义勇;邹忠全;张凡荣;温小斌;刘姝;赵于前
受保护的技术使用者:中南大学
技术研发日:2020.02.20
技术公布日:2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-16372.html

最新回复(0)