本公开涉页岩气预测,特别涉及一种页岩气储层含气饱和度预测方法及装置。
背景技术:
1、在页岩气储层含气饱和度预测的技术中存在许多挑战,尤其是在复杂的地质结构和有限的样本数据条件下进行精确预测的需求。随着页岩气开发技术的进步和能源需求的增长,准确评估页岩气储层的含气量成为了提高开采效率和经济效益的关键。然而,传统的预测方法往往受限于数据的不完整性、质量问题以及模型的泛化能力,无法满足高精度预测的需求。因此,开发一种能够有效利用现有测井数据,同时具备高准确性和泛化能力的新型预测方法成为了该领域的迫切需求。
2、现有技术中存在许多缺陷,包括:
3、1、现有技术可能在处理有限的训练样本时效果不佳,导致模型泛化能力弱,无法准确预测不同地质条件下的页岩气储层含气饱和度。
4、2、传统方法可能无法充分利用复杂测井数据中的信息,未能有效提取对含气饱和度预测关键的特征,影响预测的准确性。
5、3、现有技术在处理大规模数据或进行复杂模型计算时,可能存在计算效率低下的问题,延长了分析时间,降低了工作效率。
6、4、由于缺乏有效的数据增强和模型优化策略,现有的预测模型可能在面对不同地质条件或数据分布时表现出较弱的适应性和泛化能力。
7、5、现有方法在降维处理和模型参数优化方面可能不够高效或先进,导致模型未能充分学习数据中的内在关联,影响预测结果的可靠性。
技术实现思路
1、针对上述问题,本公开提供一种页岩气储层含气饱和度预测方法及装置。
2、第一方面,一种页岩气储层含气饱和度预测方法,所述方法包括:
3、采集测井曲线数据,并测量岩石样本含气饱和度,得到训练数据集;
4、基于量子编码的生成对抗网络对训练数据集进行数据扩充,得到扩充数据集;
5、对扩充数据集,通过基于注意力机制的卷积神经网络进行特征提取,得到特征向量;
6、通过自编码器对特征向量进行降维,得到降维特征向量;
7、通过降维特征向量对分类器进行训练,得到最终分类器;
8、通过最终分类器对新钻探的页岩气井的含气饱和度进行预测。
9、进一步的,采集测井曲线数据,包括:
10、利用测井仪器在钻井过程中实时获取地下岩层的物理和化学特性,采集的数据格式为结构化数据,以表格形式存储,其中每一行代表一个测量点的数据,每一列代表一个特定的物理或化学属性。
11、进一步的,采集测井曲线数据,并测量岩石样本含气饱和度,得到训练数据集,包括:
12、通过对岩石样本进行实验室分析,测量含气饱和度;
13、将含气饱和度测量值与对应的测井数据匹配,以深度和测量值通过测量欧氏距离进行对应匹配,得到训练数据集。
14、进一步的,基于量子编码的生成对抗网络的训练流程如下:
15、初始化量子位以表示输入的测井数据特征,每个量子位与测井参数对应,初始化生成器和判别器的网络参数;
16、将测井数据通过量子编码过程转换为量子位;
17、在参与度限制机制下,生成器接收随机噪声和量子编码后的真实数据样本,通过量子操作生成新的数据样本;判别器区分生成的数据样本和真实的数据样本;
18、通过迭代对抗训练优化生成器和判别器,直到模型达到稳定状态;
19、训练完成后,使用优化后的生成器产生新的测井数据样本,用于数据扩充。
20、进一步的,将测井数据通过量子编码过程转换为量子位,包括:
21、在将测井数据转换为量子位表示时,对于每个测井参数bi,如bgr,bkth,定义量子态|ψi>,量子态的编码通过以下公式表示:
22、
23、其中,bmax为测井参数bi的最大可能值,θi为相位因子,θi用于引入额外的编码信息;
24、相位因子θi根据测井参数的特性动态调整,计算方式表示如下:
25、
26、其中,brange为测井参数bi的取值范围,确保θi覆盖0到2π的整个范围。
27、进一步的,生成器g用于从随机噪声z生成数据,训练过程通过最小化以下损失函数lg来实现:
28、
29、其中,d为判别器,n为批次大小,zn为第n个噪声样本;
30、d(g(zn))表示判别器对生成器生成的数据样本的评分,通过判别器网络的前向传播过程计算得到,表示为:
31、d(g(zn))=sig(wd·g(zn)+bd)
32、其中,wd和bd分别是判别器网络的权重和偏置,sig()是sig激活函数,用于将输出限制在0到1之间。
33、进一步的,判别器d的训练通过最小化以下损失函数ld实现:
34、
35、其中,d为判别器,n为批次大小,zn为第n个噪声样本,xn为第n个真实数据样本;
36、d(xn)表示判别器对真实数据样本的评分,计算如下:
37、d(xn)=sig(wd·xn+bd)
38、其中,wd和bd分别为判别器网络的权重和偏置,sig()为sig激活函数,用于将输出限制在0到1之间。
39、进一步的,参与度限制机制,包括:
40、ωg和ωd分别为生成器和判别器中被限制更新的层集合,更新规则如下:
41、
42、
43、其中,ωg和ωd分别为生成器和判别器中的参数,η为学习率;
44、在每次迭代中,生成器和判别器按照训练流程进行更新,通过动态调整参与度限制集合ωg和ωd,以避免过早收敛。
45、进一步的,ωg和ωd动态更新基于生成数据与真实数据之间的kullback-leibler散度,动态调整更新频率,更新增量的计算如下:
46、δω=kl(pdata∥pmodel)
47、其中,pdata为真实数据分布,pmodel为模型生成数据分布,δω为根据kl散度调整的参与度限制集合的更新增量。
48、进一步的,基于注意力机制的卷积神经网络的训练流程如下:
49、对测井数据进行标准化处理,对于每个测井参数ci,其标准化处理的方式计算如下:
50、
51、其中,c'i为标准化后的参数值,和分别为测井参数ci的均值和标准差;
52、将预处理后的数据输入到基于注意力机制的卷积神经网络中;数据首先通过多个卷积层进行初步的特征提取,每个卷积层后都接一个注意力模块,用于增强模型对关键特征的聚焦;在基于注意力机制的卷积神经网络中,每个卷积层l的输出ol计算如下:
53、ol=re(wl*ol-1+bl)
54、其中,wl和bl分别为第l层的卷积核权重和偏置,*表示卷积操作,re()是relu激活函数,ol-1是前一层的输出;
55、基于注意力机制的卷积神经网络包含3个卷积层,每层卷积后接一个注意力模块以增强特征提取能力;
56、对于卷积层l中的权重wl,其初始化使用he初始化方法,计算如下:
57、
58、其中,nl为层l的输入单元数目,表示均值为0,标准差为1的正态分布;
59、对于每个注意力模块m,其输出am计算如下:
60、am=σ(wa*ol+ba)⊙ol
61、其中,wa和ba为注意力模块的权重和偏置,σ为sigmoid激活函数,用于生成注意力权重,⊙表示元素乘法;
62、在注意力模块中,权重wa的计算通过注意力学习机制来实现,自注意力机制如下:
63、
64、其中,q、k和v分别为查询query、键key和值value矩阵,dk为键向量的维度,softmax用于归一化计算得到的注意力权重;
65、在特征提取的过程中,采用动态采样,动态采样根据当前模型的表现调整采样策略,优先选择对模型训练更有益的数据样本进行处理;
66、提取的特征通过融合层进行整合,得到最终特征表示,最终特征表示用于后续的含气饱和度预测;
67、使用反向传播算法和梯度下降策略对基于注意力机制的卷积神经网络的参数进行优化;训练过程中,不断迭代更新网络参数,直到模型收敛。
68、进一步的,动态采样的权重dsw的调整基于模型在训练集上的性能,计算如下:
69、dsw=exp(-γ·losstrain)
70、其中,γ为超参数,γ表示控制采样权重对损失的敏感度,losstrain表示模型在训练集上的损失。
71、进一步的,提取的特征通过融合层进行整合,得到最终特征表示,包括:
72、特征融合层将所有注意力模块的输出整合,生成最终特征表示f,计算如下:
73、f=concat(a1,a2,…,am)wf+bf
74、其中,concat是连接操作,wf和bf是特征融合层的权重和偏置,m是注意力模块的数量;
75、特征融合层的权重wf通过多任务学习或其他融合策略来优化,采用加权融合策略,wf计算如下:
76、
77、其中,λi是第i个特征的权重,是对应于第i个特征的融合权重。
78、进一步的,基于注意力机制的卷积神经网络的参数的更新遵循梯度下降法,对于每个参数θ,更新公式计算如下:
79、
80、其中,ηa为学习率,loss为模型的总损失函数,包括分类损失和可能的正则化项。
81、进一步的,自编码器的训练流程如下:
82、对编码器权重we和解码器权重wd的初始化;
83、进行编码器训练,通过前向传播将输入数据压缩成低维特征表示,编码器部分采用多层全连接网络结构,每一层都通过激活函数引入非线性;编码器部分将输入数据e'i转换为低维特征表示z,其转换过程如下:
84、z=re(wee'i+be)
85、其中,we为自编码器的权重矩阵,be为偏置项,re()为relu激活函数;
86、解码器从低维特征表示中重构原始数据,其结构亦为多层全连接网络,最后一层的输出尺寸与输入数据相同;解码器从低维特征表示z重构输入数据,重构过程表示如下:
87、
88、其中,为重构的数据,wd为解码器的权重矩阵,bd为偏置项,sig()为sigmoid激活函数;
89、采用梯度下降法对模型参数进行优化,采用余弦退火策略调整学习率η,随着训练周期t的增加,学习率的调整表示如下:
90、
91、其中,η0是初始学习率,t是预定的训练周期总数;
92、训练完成后,通过贪心算法从编码器的输出中选择用于含气饱和度预测的特征。
93、进一步的,对编码器权重we和解码器权重wd的初始化,包括:
94、采用glorot初始化,计算如下:
95、
96、
97、其中,u(-1,1)表示从[-1,1]区间内均匀采样的值,nin为输入层的节点数,nout为输出层的节点数。
98、进一步的,自编码器采用均方误差mse作为损失函数,计算如下:
99、
100、其中,n是样本数量。
101、进一步的,通过贪心算法从编码器的输出中选择用于含气饱和度预测的特征,包括:
102、在编码器输出的特征z中,通过贪心算法选择最具信息量的特征进行保留,设选择的特征集为zselected,其选择过程简化为:
103、
104、其中,k为预先设定的特征数量上限,info(z)表示特征集z的信息量;信息量度量方法info(z)采用互信息量法,计算方式表示如下:
105、
106、其中,y为目标变量,p(z,y)为z和y的联合概率分布,p(z)和p(y)分别为z和y的边缘概率分布;通过计算特征集z和目标变量y之间的互信息量,评估z对预测y的贡献程度。
107、进一步的,分类器采用基于交替方向乘子法的极限学习机分类器;
108、基于交替方向乘子法的极限学习机分类器的训练流程如下:
109、输入降维特征向量到分类器,为降维后的第i个样本特征向量;
110、设置隐藏层的初始权重和偏置,权重和偏置初始化如下:
111、
112、
113、其中,wp为隐藏层的权重,bp为偏置;
114、通过隐藏层快速提取用于分类的特征,隐藏层特征提取如下:
115、
116、其中,为第i个样本在隐藏层的特征表示;
117、使用交替方向乘子法方法优化隐藏层的权重和偏置;
118、根据分类结果自动调整网络参数,调整方式表示如下:
119、
120、其中,为真实分类标签,adaptiveadjust为自适应调整函数;
121、自适应调整函数根据分类结果调整参数,计算方式表示如下:
122、
123、
124、其中,ladjust为自适应调整的损失函数,和为损失函数关于权重和偏置的梯度,β为调整率;
125、重复迭代,直到达到预定迭代次数;
126、分类器输出表示如下:
127、
128、其中,为基于隐藏层特征的分类预测。
129、进一步的,使用交替方向乘子法方法优化隐藏层的权重和偏置,包括:
130、交替方向乘子法优化的方式表示如下:
131、
132、其中,py为样本的目标分类标签,admmoptimize为基于交替方向乘子法的优化函数;
133、优化过程如下:
134、
135、
136、其中,l为分类的损失函数,和分别为损失函数关于权重和偏置的梯度,α为学习率。
137、进一步的,训练数据集根据阈值进行标注,高含气饱和度表示含气饱和度高于75%,中含气饱和度表示含气饱和度在50%到75%之间,低含气饱和度表示低于50%的含气饱和度;
138、分类器分类的对应类别,包括:
139、高含气饱和度、中含气饱和度和低含气饱和度。
140、第二方面,一种页岩气储层含气饱和度预测装置,包括:数据采集单元、数据扩充单元、特征提取单元、特征降维单元、分类器训练单元和预测单元;
141、数据采集单元,用于采集测井曲线数据,并测量岩石样本含气饱和度,得到训练数据集;
142、数据扩充单元,用于基于量子编码的生成对抗网络对训练数据集进行数据扩充,得到扩充数据集;
143、特征提取单元,用于对扩充数据集,通过基于注意力机制的卷积神经网络进行特征提取,得到特征向量;
144、特征降维单元,用于通过自编码器对特征向量进行降维,得到降维特征向量;
145、分类器训练单元,用于通过降维特征向量对分类器进行训练,得到最终分类器;
146、预测单元,用于通过最终分类器对新钻探的页岩气井的含气饱和度进行预测。
147、第三方面,一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;
148、存储器,存储有计算机程序;
149、处理器,用于执行存储器上所存储的计算机程序时,实现上述的一种页岩气储层含气饱和度预测方法。
150、第四方面,一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的一种页岩气储层含气饱和度预测方法。
151、本公开至少具备以下有益效果:
152、本公开提出一种高效且准确的页岩气储层含气饱和度预测方法,通过创新的数据增强技术解决了训练样本不足的问题,利用注意力机制优化了特征提取过程,同时通过改进的降维技术和优化的分类器设计提高了模型的泛化能力和预测效率,最终实现了对页岩气储层含气饱和度的高精度预测。
153、本公开的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本公开而了解。本公开的目的和其他优点可通过在说明书以及附图中所指出的结构来实现和获得。
1.一种页岩气储层含气饱和度预测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种页岩气储层含气饱和度预测方法,其特征在于,
3.根据权利要求1所述的一种页岩气储层含气饱和度预测方法,其特征在于,
4.根据权利要求1所述的一种页岩气储层含气饱和度预测方法,其特征在于,
5.根据权利要求4所述的一种页岩气储层含气饱和度预测方法,其特征在于,
6.根据权利要求4所述的一种页岩气储层含气饱和度预测方法,其特征在于,
7.根据权利要求4所述的一种页岩气储层含气饱和度预测方法,其特征在于,
8.根据权利要求4所述的一种页岩气储层含气饱和度预测方法,其特征在于,
9.根据权利要求8所述的一种页岩气储层含气饱和度预测方法,其特征在于,
10.根据权利要求1所述的一种页岩气储层含气饱和度预测方法,其特征在于,
11.根据权利要求10所述的一种页岩气储层含气饱和度预测方法,其特征在于,
12.根据权利要求10所述的一种页岩气储层含气饱和度预测方法,其特征在于,
13.根据权利要求10所述的一种页岩气储层含气饱和度预测方法,其特征在于,
14.根据权利要求1所述的一种页岩气储层含气饱和度预测方法,其特征在于,
15.根据权利要求14所述的一种页岩气储层含气饱和度预测方法,其特征在于,
16.根据权利要求14所述的一种页岩气储层含气饱和度预测方法,其特征在于,
17.根据权利要求14所述的一种页岩气储层含气饱和度预测方法,其特征在于,
18.根据权利要求1所述的一种页岩气储层含气饱和度预测方法,其特征在于,
19.根据权利要求18所述的一种页岩气储层含气饱和度预测方法,其特征在于,
20.根据权利要求1所述的一种页岩气储层含气饱和度预测方法,其特征在于,
21.一种页岩气储层含气饱和度预测装置,其特征在于,包括:数据采集单元、数据扩充单元、特征提取单元、特征降维单元、分类器训练单元和预测单元;
22.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;
23.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-20中任一项所述的一种页岩气储层含气饱和度预测方法。
