本发明属于生态环境评价与治理,尤其涉及一种基于机器学习和环境dna宏条形码技术的浮游植物完整性评价方法。
背景技术:
1、浮游植物是水域生态环境系统里的重要初级生产者,也是水中溶解氧的主要供应者,它能够启动水域生态系统里的食物网,一般在水域生态环境系统里的能力流动,还有信息传递中起着重要作用,浮游植物的种类组成以及群落结构,直接影响水体水质和生物资源变动。对浮游植物进行全面系统的调查评估,构建浮游植物完整性评价指标体系,是当前水生态环境研究的重点。由生态环境部发布的《河流水生态环境质量监测与评价技术指南(征求意见稿)》和《湖库水生态环境质量监测与评价技术指南(征求意见稿)》中明确指出,浮游植物生物完整性指数是淡水生态系统健康评价中关键指标之一。浮游植物生物完整性指数评价方法为水体的质量提供了定量的、科学的衡量标准,然而,当前浮游植物生物完整性指数的构建主要依赖于显微镜下的形态学物种识别数据。这种方法不仅效率低下,而且耗时耗力。此外,它对鉴定人员的专业知识和经验有着极高的依赖性。更重要的是,这种方法所能识别的物种数目有限,这无疑限制了浮游植物生物完整性指数的全面性和准确性。此外,用于构建浮游植物生物完整性指数的候选参数相对较少,且缺乏代表性。这使得浮游植物生物完整性指数无法满足日益增长的生态环境监测和评价需求。当前,关于河流水体浮游植物传统调查鉴定方法和生物完整性评估存在以下四方面缺点:(1)效率低下:传统的基于显微镜的形态学物种识别方法通常需要耗费大量时间和人力进行样本收集、处理和鉴定。在快速变化的环境或大规模监测项目中,这种方法的效率无法满足及时评估的需求。(2)专业依赖性强:准确鉴定物种需要具备专业知识和经验的鉴定人员。鉴定人员的水平直接影响着物种识别的准确性和评估结果的可靠性。此外,这种方法的培训成本较高,且需要持续的技能更新。(3)物种识别有限:基于形态学的物种识别方法只能根据有限的形态特征进行鉴定,可能无法准确区分形态相近的物种。这限制了评估水生态健康状况的全面性,特别是在复杂或动态的环境中。(4)参数代表性不足:由于形态学物种识别的局限性,目前用于构建p-ibi的候选参数可能无法全面反映水生态系统的生物多样性和生态完整性。这些参数可能不足以代表整个水体的健康状况,导致评估结果存在偏差。
技术实现思路
1、为解决上述技术问题,本发明提出了一种基于机器学习和环境dna宏条形码技术的浮游植物完整性评价方法,提高浮游植物生物完整性指数的代表性,从而更精确地评估水生态健康状况。
2、为实现上述目的,本发明提供了一种基于机器学习和环境dna宏条形码技术的浮游植物完整性评价方法,包括:
3、确定采样位点并采集浮游植物edna样品;
4、基于所述采样位点选取参考点和受损点,对所述浮游植物edna样品扩增测序,获取扩增子序列信息;
5、根据所述扩增子序列信息注释浮游植物物种,获取评价候选指标,所述评价候选指标的类型包括物种丰富性和群落多样性;
6、通过判别能力分析与相关性分析对所述评价候选指标进行筛选,获得筛选后的评价候选指标;
7、基于所述筛选后的评价候选指标,构建浮游植物完整性指数;
8、采用机器学习确定重要物种指标,对所述评价候选指标加入所述重要物种指标,通过加入重要物种指标的评价候选指标对所述浮游植物完整性指数进行评价,获得评价结果。
9、根据本发明提供的基于机器学习和环境dna宏条形码技术的浮游植物完整性评价方法,所述群落多样性中chao1计算如下:
10、
11、其中,schao1为估计的otu数;sobs为实际观测到的otu数;n1为只含有一条序列的otu数目;n2为只含有两条序列的otu数目。
12、根据本发明提供的基于机器学习和环境dna宏条形码技术的浮游植物完整性评价方法,所述群落多样性中simpson计算如下:
13、
14、其中,sobs为实际观测到的otu数目;ni为第i个otu所含的序列数;n为所有的序列数。
15、根据本发明提供的基于机器学习和环境dna宏条形码技术的浮游植物完整性评价方法,所述群落多样性中shannon计算如下:
16、
17、其中,sobs为实际测量出的otu数目;ni为第i个otu所含的序列数;n为所有的序列数。
18、根据本发明提供的基于机器学习和环境dna宏条形码技术的浮游植物完整性评价方法,所述群落多样性中ace计算如下:
19、
20、其中,sabund为丰富物种数;srare为稀有物种数;f1为仅包含1个个体的物种数;为稀有物种变异系数的估算值,cace为稀有物种中非仅包含1个个体的物种数所占比例。
21、根据本发明提供的基于机器学习和环境dna宏条形码技术的浮游植物完整性评价方法,所述群落多样性中pielou(j)计算如下:
22、
23、其中,h为shannon指数;hmax为在物种丰富度相同的情况下,能够达到的最大shannon指数;s为群落物种丰富度指数;x为通常使用2、e作为底数。
24、根据本发明提供的基于机器学习和环境dna宏条形码技术的浮游植物完整性评价方法,通过判别能力分析与相关性分析对所述评价候选指标进行筛选,获得筛选后的评价候选指标的方法包括:
25、通过箱体图获取所述参考点与所述受损点的第一指标;
26、根据指标之间的重叠程度,剔除相关性较强、重复的指标,计算各参数之间的相关系数,获取所述参考点与所述受损点的第二指标;
27、基于所述第一指标和所述第二指标,获得筛选后的评价候选指标。
28、根据本发明提供的基于机器学习和环境dna宏条形码技术的浮游植物完整性评价方法,基于所述筛选后的评价候选指标,构建浮游植物完整性指数的方法包括:
29、通过比值法对所述筛选后的评价候选指标进行量纲统一;
30、根据参数分值计算方法获得所述筛选后的评价候选指标的参数分值;
31、将所有评价候选指标参数分值相加,获得浮游植物完整性指数。
32、本发明技术效果:本发明公开了一种基于机器学习和环境dna宏条形码技术的浮游植物完整性评价方法,旨在解决现有技术中关于河流水体浮游植物传统调查鉴定方法和生物完整性评估出现的效率低下、专业依赖性强、物种识别有限及参数代表性不足的问题,通过利用环境dna宏条形码技术和机器学习算法,覆盖更广泛的物种范围,提供更丰富、更准确、更具代表性的候选参数来构建浮游植物生物完整性指数,提高浮游植物生物完整性指数的代表性,从而更精确地评估水生态健康状况。本发明的方法将为水生生态系统的保护和恢复提供更科学、更有效的指导,满足日益增长的环境监测和评价需求。
1.一种基于机器学习和环境dna宏条形码技术的浮游植物完整性评价方法,其特征在于,包括:
2.如权利要求1所述的基于机器学习和环境dna宏条形码技术的浮游植物完整性评价方法,其特征在于,所述群落多样性中chao1计算如下:
3.如权利要求1所述的基于机器学习和环境dna宏条形码技术的浮游植物完整性评价方法,其特征在于,所述群落多样性中simpson计算如下:
4.如权利要求1所述的基于机器学习和环境dna宏条形码技术的浮游植物完整性评价方法,其特征在于,所述群落多样性中shannon计算如下:
5.如权利要求1所述的基于机器学习和环境dna宏条形码技术的浮游植物完整性评价方法,其特征在于,所述群落多样性中ace计算如下:
6.如权利要求1所述的基于机器学习和环境dna宏条形码技术的浮游植物完整性评价方法,其特征在于,所述群落多样性中pielou(j)计算如下:
7.如权利要求1所述的基于机器学习和环境dna宏条形码技术的浮游植物完整性评价方法,其特征在于,通过判别能力分析与相关性分析对所述评价候选指标进行筛选,获得筛选后的评价候选指标的方法包括:
8.如权利要求1所述的基于机器学习和环境dna宏条形码技术的浮游植物完整性评价方法,其特征在于,基于所述筛选后的评价候选指标,构建浮游植物完整性指数的方法包括:
