本发明涉及一种基于机器学习算法的二手车估值方法与系统。
背景技术:
近年来,二手车交易市场繁荣发展,其销量日益增长,这为二手车市场积累了海量交易数据,然而,由于线上平台与线下中间商的存在,导致交易信息不够透明,及不对称。传统的二手车评估方法依靠评估师的个人经验,主观性很强。同时,通过寻找最相近的已成交案例进行修正估值的方法过分依赖引用的几个交易案例,而这些案例成交价格易受买卖双方的议价能力的影响。因此,传统估值方法缺乏客观性、合理性和科学性。
其次,在现有的智能估值方法中,不断出现评估二手车车况的环节过于复杂的情况,使得只有专业人员使用专业的检测工具才能完成,而不能将其推广至每位车主,于是出现评估车况过于简单以至于无法表示真实车况的现象。综上所述,现有的二手车评估方法无法满足当前市场需求。
技术实现要素:
针对上述问题,本发明的目的在于提供一种基于机器学习算法的二手车估值的方法,以及提供一种基于机器学习算法的二手车估值系统。
一种基于机器学习算法的二手车估值方法,包括以下步骤:
s1、获取用户输入的目标车辆的车型标识信息和状态信息;
s2、根据目标车辆的车辆信息获取同类车型的估值模型;
s3、将车辆信息输入到估值模型,计算目标车辆的估值价格。
其中,所述的目标车辆的车型标识信息包括汽车品牌、车系和车型;
所述目标车辆的状态信息包括上牌时间、行驶里程、过户次数和车况;
所述目标车辆的车辆信息包括车型标识信息、状态信息和配置信息;
所述目标车辆的配置信息包括气缸数量、驱动方式、变速箱类型、进气形式、最大功率、最大续航里程、车辆类型、车款年份和厂商指导价;
所述估值模型是基于海量交易案例数据结合机器学习算法训练获得机器学习模型。
进一步,所述估值模型通过以下步骤训练获得:
s2.1、根据用户输入的目标车辆的车型标识信息获取其所属车辆类型;
s2.2、根据车辆类型获取最近一段时间的二手车交易案例数据;
s2.3、对样本数据进行预处理和特征工程,将每个样本解析为价格为标签、车辆信息为特征;
s2.4、运用机器学习算法对特征工程处理后的数据进行学习训练,直至模型达到预设条件;
s2.5、将学得模型进行持久化;
其中,所述车辆类型,包括saloon、suv、mpv、minibus、ev和supercar;
所述预处理过程包括对缺失值、异常值的剔除和替换;
所述特征工程包括以下步骤:
s2.3.1、对行驶里程、厂商指导价、成交价格等特征进行数据变换;
s2.3.2、对行驶里程、上牌时间进行特征构造,生成行驶里程成新率和车龄;
s2.3.3、对气缸数量、最大功率、车龄、过户次数、车款年份、车况等特征进行离散化处理;
s2.3.4、对分类型特征,包括离散化得到的,进行one-hot编码;
其中,所述数据变换包括伸缩变换、对数变换和标准化;
所述分类型特征包括品牌、车系、气缸数量、驱动方式、变速箱类型、进气形式、最大功率、车龄、过户次数、车款年份、车况;
进一步,训练估值模型还包括如下的模型更新步骤:
s01、定期获取最近一段时间的二手车交易案例数据;
s02、分车辆类型分别对样本数据进行预处理和特征工程;
s03、分车辆类型分别训练每类车型的估值模型;
本发明解决其技术问题采用的第二技术方案是:
一种基于机器学习算法的二手车估值系统,包括:
接收模块,用于接收用户终端发送的目标车辆的车型标识信息和状态信息;
获取模块,用于根据目标车辆的标识信息获取同类车辆类型的交易案例数据;
数据处理模块,用于将案例数据进行处理以适合进行模型训练;
模型训练模块,用于将处理好的案例数据作为训练样本,输入到机器学习算法中进行学习训练,获取估值模型的参数信息;
模型持久化模块,用于将学得模型参数信息保存下来,供方便调用估值模型;
估值输出模块,用于根据目标车辆信息,调用估值模型,计算目标车辆估值价格;
展示模块,用于展示与目标车辆同款的二手车交易案例信息;
其中,所述获取模块还用于:
根据目标车辆的车型标识信息获取车辆所属类别和目标车辆的配置信息;
所述数据处理模块还用于:对目标车辆信息进行处理,以适合学得的估值模型;
所述模型参数信息,包括;模型权重、偏置和学得模型规则;
所述目标车辆信息,包括:车型标识信息、状态信息和配置信息;
所述车辆的车型标识信息,包括:品牌、车系和车型;
所述车辆的状态信息,包括:上牌时间、行驶里程、过户次数和车况;
所述车辆的配置信息,包括:气缸数量、驱动方式、进气形式、最大功率、最大续航里程、车款年份、车辆类型和厂商指导价;
所述交易案例信息,包括:品牌、车系、车型、上牌时间、行驶里程、过户次数、车况和案例时间。
与现有技术相比,本发明的有益效果是:本发明基于机器学习算法,结合历史交易案例,实现实时更新,满足日益变化的市场环境,做到科学预测,精准评估。本发明基于海量交易案例数据,利用大数据技术,总结了二手车市场潜在规律,实时反映市场变化情况,并综合评估车辆的车况,使估值系统更科学、合理、智能。
附图说明
图1是本发明的基于机器学习算法的二手车估值方法的流程图;
图2是本发明的机器学习估值模型的建立过程的流程图;
图3是本发明的基于机器学习算法的二手车估值系统的结构框架图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于机器学习算法的二手车估值方法,包括以下步骤:
s1、获取用户输入的目标车辆的车型标识信息和状态信息;
s2、根据目标车辆的车辆信息获取同类车型的估值模型;
s3、将车辆信息输入到估值模型,计算目标车辆的估值价格。
其中,所述的目标车辆的车型标识信息包括汽车品牌、车系和车型;
所述目标车辆的状态信息包括上牌时间、行驶里程、过户次数和车况;
所述目标车辆的车辆信息包括车型标识信息、状态信息和配置信息;
所述目标车辆的配置信息包括气缸数量、驱动方式、变速箱类型、进气形式、最大功率、最大续航里程、车辆类型、车款年份和厂商指导价;
所述估值模型是基于海量交易案例数据结合机器学习算法训练获得机器学习模型。
进一步,所述估值模型通过以下步骤训练获得:
s2.1、根据用户输入的目标车辆的车型标识信息获取其所属车辆类型;
s2.2、根据车辆类型获取最近一段时间的二手车交易案例数据;
s2.3、对样本数据进行预处理和特征工程,将每个样本解析为价格为标签、车辆信息为特征;
s2.4、运用机器学习算法对特征工程处理后的数据进行学习训练,直至模型达到预设条件;
s2.5、将学得模型进行持久化;
其中,所述车辆类型,包括saloon、suv、mpv、minibus、ev和supercar;
所述预处理过程包括对缺失值、异常值的剔除和替换;
所述特征工程包括以下步骤:
s2.3.1、对行驶里程、厂商指导价、成交价格等特征进行数据变换;
s2.3.2、对行驶里程、上牌时间进行特征构造,生成行驶里程成新率和车龄;
s2.3.3、对气缸数量、最大功率、车龄、过户次数、车款年份、车况等特征进行离散化处理;
s2.3.4、对分类型特征,包括离散化得到的,进行one-hot编码;
其中,所述数据变换包括伸缩变换、对数变换和标准化;
所述分类型特征包括品牌、车系、气缸数量、驱动方式、变速箱类型、进气形式、最大功率、车龄、过户次数、车款年份、车况;
进一步,训练估值模型还包括如下的模型更新步骤:
s01、定期获取最近一段时间的二手车交易案例数据;
s02、分车辆类型分别对样本数据进行预处理和特征工程;
s03、分车辆类型分别训练每类车型的估值模型;
本发明解决其技术问题采用的第二技术方案是:
一种基于机器学习算法的二手车估值系统,包括:
接收模块,用于接收用户终端发送的目标车辆的车型标识信息和状态信息;
获取模块,用于根据目标车辆的标识信息获取同类车辆类型的交易案例数据;
数据处理模块,用于将案例数据进行处理以适合进行模型训练;
模型训练模块,用于将处理好的案例数据作为训练样本,输入到机器学习算法中进行学习训练,获取估值模型的参数信息;
模型持久化模块,用于将学得模型参数信息保存下来,供方便调用估值模型;
估值输出模块,用于根据目标车辆信息,调用估值模型,计算目标车辆估值价格;
展示模块,用于展示与目标车辆同款的二手车交易案例信息;
其中,所述获取模块还用于:
根据目标车辆的车型标识信息获取车辆所属类别和目标车辆的配置信息;
所述数据处理模块还用于:对目标车辆信息进行处理,以适合学得的估值模型;
所述模型参数信息,包括;模型权重、偏置和学得模型规则;
所述目标车辆信息,包括:车型标识信息、状态信息和配置信息;
所述车辆的车型标识信息,包括:品牌、车系和车型;
所述车辆的状态信息,包括:上牌时间、行驶里程、过户次数和车况;
所述车辆的配置信息,包括:气缸数量、驱动方式、进气形式、最大功率、最大续航里程、车款年份、车辆类型和厂商指导价;
所述交易案例信息,包括:品牌、车系、车型、上牌时间、行驶里程、过户次数、车况和案例时间。
以上是对本发明的实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
1.一种基于机器学习算法的二手车估值方法,其特征在于,所述方法包括:
获取用户输入的目标车辆的车型标识信息和状态信息;
根据目标车辆信息获取对应的估值模型;
将目标车辆信息输入到估值模型,计算其估值价格。
2.如权利要求1所述的方法,其特征在于,所述车型标识信息和状态信息包括:品牌、车系、车型、上牌时间、行驶里程、车况。
3.如权利要求1所述方法,其特征在于,所述获取对应的估值模型包括:
根据目标车辆的车型标识信息确定目标车辆所属车辆类型;
根据车辆类型选择相同车辆类型的交易案例数据,并进行预处理和特征工程;
根据机器学习算法对处理后的样本数据进行学习训练,直至模型达到预设条件;
将学得模型进行持久化。
4.如权利要求1所述的方法,其特征在于,所述将目标车辆信息输入到模型,计算估值价格包括:
将目标车辆信息进行预处理和特征工程,所述目标车辆信息包括车辆标识信息、状态信息和配置信息;
将处理后的目标车辆信息代入模型进行估值计算。
5.如权利要求3所述的方法,其特征在于,所述根据车辆类型选择训练样本数据,并进行预处理和特征工程包括:
根据车辆类型从案例数据库中选择交易案例数据作为训练样本数据;
对训练样本数据进行预处理;
对预处理后的训练样本进行特征工程。
6.如权利要求5所述方法,其特征在于,所述对训练样本数据预处理包括:
所述预处理过程包括对缺失值、异常值的剔除和替换;
对行驶里程、厂商指导价、成交价格等特征进行数据变换,所述数据变换包括伸缩变换、对数变换和标准化。
7.如权利要求5所述方法,其特征在于,所述对训练样本数据特征工程包括:
对行驶里程、上牌时间等特征进行特征构造,生成行驶里程成新率和车龄;
对气缸数量、最大功率、车龄、过户次数、车款年份等特征进行离散化处理;
对品牌、车系、气缸数量、驱动方式、变速箱类型、进气形式、最大功率、车龄、过户次数、车款年份、车况等分类型特征进行one-hot编码。
8.如权利要求1-7任一所述方法,其特征在于,所述根据车辆信息确定车辆估值价格还包括:
向用户终端发送估值价格和相同车辆类型的交易案例,所述估值结果用于指示用户目标车辆的实际价值,所述交易案例用于为用户提供交易案例参考。
9.一种基于机器学习算法的二手车估值系统,其特征在于,包括:
接收模块,用于接收用户终端发送的目标车辆的车型标识信息和状态信息;
获取模块,用于根据目标车辆的标识信息获取同类车辆类型的交易案例数据;
数据处理模块,用于将案例数据进行处理以适合进行模型训练;
模型训练模块,用于将处理好的案例数据作为训练样本,输入到机器学习算法中进行学习训练,获取估值模型的参数信息;
模型持久化模块,用于将学得模型参数信息保存下来,供方便调用估值模型;
估值输出模块,用于根据目标车辆信息,调用估值模型,计算目标车辆估值价格;
展示模块,用于展示与目标车辆同款的二手车交易案例信息。
技术总结