技术领域
[0001] 本发明涉及钻井工程优化技术领域,尤其涉及一种钻井机械钻速预测网络训练方法及应用方法。
相关背景技术
[0002] 钻井工程是油气勘探和开发过程中的关键环节,涉及从地表钻至目标地层的复杂操作。随着油气资源的日益枯竭和开采难度的增加,提升钻井效率、降低钻井成本、确保钻井作业安全性成为行业的主要关注点。在钻井工程中,机械钻速指钻头在单位时间内钻进的深度,是衡量钻井效率的重要指标。机械钻速的优化不仅能够提高钻井效率,还能有效降低钻井成本,减小井控风险,从而保证整个钻探作业的安全性。
[0003] 随着机器学习技术的发展,在机械钻速的预测上,数据驱动模型逐步应用于机械钻速预测领域,机器学习通过对大量历史数据的学习,能够自动识别复杂的非线性关系,并进行预测。然而由于机械钻速的影响因素复杂,例如钻头直径、钻头重量、钻头磨损、转速、钻井深度、地层强度、水力参数等许多因素都会对机械钻速产生影响,在预测过程中考虑多类影响因素可以在一定程度上提高模型的准确性,但与此同时在训练过程中数据量也会变得非常大,计算复杂。现有的训练方法例如随机梯度下降方法等,在面临着数据量庞大,计算复杂的情况下,往往难以高效准确地找到合适的网络参数。
[0004] 因此现有技术中存在着模型训练过程中数据量庞大,计算复杂,现有方法难以高效准确地找到合适的网络参数的技术问题,需要改进。
具体实施方式
[0019] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0020] 在本发明实施例的描述中,除非另有说明, “多个”的含义是两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如:A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
[0021] 本发明实施例中所涉及的“第一”“第二”等描述仅用于描述目的,而不能理解为指示或者暗示其相对重要性或者隐含指明所指示的技术特征的数量。因此,限定有“第一”“第二”的技术特征可以明示或者隐含的包括至少一个该特征。
[0022] 在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0023] 本发明提供了一种钻井机械钻速预测网络训练方法、应用方法电子设备及介质,以下分别进行说明。
[0024] 图1为本发明提供的钻井机械钻速预测网络训练方法的一个实施例的流程示意图,如图1所示,钻井机械钻速预测网络训练方法,包括:S101、对获取的钻井机械录井数据进行数据预处理得到钻速预测训练数据;
S102、将钻速预测训练数据输入初始钻井机械钻速预测网络中,根据初始钻井机械钻速预测网络的网络参数构建改进蜣螂算法的初始种群,对初始种群依次进行蜣螂行为模拟种群个体更新、黄金正弦算法种群个体更新和动态减法因子算法种群个体更新得到子代种群,根据子代种群确定种群个体适应度,根据种群个体适应度对子代种群进行种群筛选得到优化种群,迭代优化得到训练完备的钻井机械钻速预测网络。
[0025] 具体地,实施例基于双向长短期记忆网络来构建初始钻井机械钻速预测网络,长短期记忆网络是循环神经网络的一种特殊类型,它通过引入门控机制来解决传统RNN在处理长序列时容易出现的梯度消失或梯度爆炸问题。双向长短期记忆网络则是在长短期记忆网络基础上,通过同时运行两个长短期记忆网络层,一个前向长短期记忆网络层和一个后向长短期记忆网络层,来捕捉序列数据中的双向上下文信息。前向长短期记忆网络层按照序列的自然顺序从前向后处理数据,而后向长短期记忆网络层层则按照序列的逆序从后向前处理数据。这样,每个时间步的输出都包含了来自过去和未来两个方向的信息,从而能够更全面地捕捉序列中的上下文关系。
[0026] 同时,实施例还在双向长短期记忆网络基础上,融合自注意力机制,进一步提升模型性能。在钻井机械钻速预测中,神经网络接收的输入是很多大小不一的向量,向量之间都会有一定联系,但是在实际训练时无法充分学习到这些输入之间的关系,从而导致模型性能欠缺。自注意力机制就能解决这个问题,可以注意到输入特征及其之间的关系。
[0027] 此外,鉴于数据量大,双向长短期记忆网络的超参数较多,因此实施例选择使用具有搜索能力强和收敛速度快的蜣螂优化算法来自动寻找最佳参数。在优化过程中,由于模型复杂、参数量较大,如果选用很多蜣螂粒子进行很多次搜寻,会大幅增加优化时间,所以只能选择较为少量的粒子和迭代次数。在此前提下,就要保证初始种群分布均匀,全局探索和局部开发能力强,不易陷入局部最优解。因此考虑到这些问题,本发明对蜣螂优化算法进行了一系列改进,包括Sobol序列初始化种群位置、融合黄金正弦算法以及融合动态减法因子。
[0028] 与现有技术相比,本发明实施例提供的钻井机械钻速预测网络训练方法,首先对获取的钻井机械录井数据进行数据预处理得到钻速预测训练数据;然后将钻速预测训练数据输入初始钻井机械钻速预测网络中,根据初始钻井机械钻速预测网络的网络参数构建改进蜣螂算法的初始种群,对初始种群依次进行蜣螂行为模拟种群个体更新、黄金正弦算法种群个体更新和动态减法因子算法种群个体更新得到子代种群,根据子代种群确定种群个体适应度,根据种群个体适应度对子代种群进行种群筛选得到优化种群,迭代优化得到训练完备的钻井机械钻速预测网络。本发明通过蜣螂算法训练钻井机械钻速预测网络,可以减少训练过程中的计算量,提高模型训练的效率,通过黄金正弦算法和动态减法因子改进蜣螂算法,可以提高训练的准确性,提高钻井机械钻速预测网络训练的效率和准确性。
[0029] 在本发明的一些实施例中,对获取的钻井机械录井数据进行数据预处理得到钻速预测训练数据,包括:对获取的钻井机械录井数据依次进行剔除离群值、混合采样、数据平滑处理和数据归一化得到钻速预测训练数据。
[0030] 具体地,在建立训练数据过程中,实施例首先从油气田钻井施工现场获取大量钻井机械录井数据,整理后作为原始数据。
[0031] 然后为保证训练数据在训练模型过程的有效性,需要对原始数据进行预处理,构建钻速预测训练数据。预处理过程包括:首先采用四分位距法检测并剔除原始数据中的离群值。然后采用欠采样和过采样将数据进行混合采样,保证数据分布的均匀性和真实性。再采用Daubechies 4小波变换函数对数据进行平滑处理,使用标准差作为阈值,非线性阈值处理方法有效去除其中高频噪声,同时保留主要信号特征。同时考虑到不同类型数据的量纲差异,再通过最大最小归一化算法将所有的数据进行数据归一化处理。最后将处理后的数据分为训练集和测试集,得到钻速预测训练数据,其中每个特征属性里面所包含的相关数据作为输入变量X;待预测标签为机械钻速,作为输出变量Y。
[0032] 最大最小归一化公式可以表示为:
[0033] 其中, 为归一化后的数据, 表示归一化前的原始样本数据, 表示原始数据的最小值, 表示原始数据的最大值。
[0034] 在本发明的一些实施例中,图2为本发明实施例的构建改进蜣螂算法初始种群的流程示意图,如图2所示,根据初始钻井机械钻速预测网络的网络参数构建改进蜣螂算法的初始种群,包括:S201、将初始钻井机械钻速预测网络的网络参数作为改进蜣螂算法的优化目标,根据网络参数确定初始种群搜索空间范围;
S202、基于Sobol序列法在初始种群搜索空间范围生成改进蜣螂算法的初始种群。
[0035] 具体地,构建初始种群过程中,实施例将初始钻井机械钻速预测网络的网络参数作为改进蜣螂算法的优化目标,包括钻井机械钻速预测网络中隐藏层、初始学习率、批次大小、网络堆叠数量、L1正则化系数和Dropout系数等。此外,为使初始种群能有更好的分布效果,实施例采用Sobol序列法构建初始种群。Sobol序列是一种低差异的确定性数列,与传统的随机数生成器相比,Sobol序列有更好的均匀分布性质,可以在相同数量的点上提供更快的收敛速度。
[0036] 在本发明的一些实施例中,蜣螂行为模拟种群个体更新,包括:对初始种群依次进行滚球行为模拟、舞蹈行为模拟、觅食行为模拟、偷窃行为模拟和繁殖行为模拟更新初始种群的种群个体。
[0037] 具体地,蜣螂算法是一种受自然启发的群体智能优化算法,其灵感来自蜣螂的行为和生态习性。该算法具有强搜寻能力和快速收敛速度等优点,可以解决复杂问题。在蜣螂算法中,通过蜣螂行为模拟来进行种群个体更新,包括滚球行为模拟、舞蹈行为模拟、觅食行为模拟、偷窃行为模拟和繁殖行为模拟。
[0038] 其中,滚球行为模拟通过模拟蜣螂滚动粪球的行为。每个蜣螂个体沿给定的方向移动,更新其在搜索空间中的位置。这个步骤通过调整个体的位置来实现全局探索,以找到更好的解,公式表示为:
[0039] 其中,表示当前迭代次数、 表示第 次迭代时第 只蜣螂的位置信息,是偏转系数,是光强系数,是自然系数取值1或‑1, 是全局最差位置, 为模拟光强变化。
[0040] 舞蹈行为模拟是指当蜣螂遇到障碍物或者需要重新确定方向时,模拟其舞蹈行为。蜣螂会爬到粪球顶部,通过一系列旋转和暂停动作来重新确定移动方向,然后继续滚动粪球。这有助于避免局部最优解,增强算法的搜索能力,公式表示为:
[0041] 觅食行为模拟是模拟蜣螂寻找食物的过程。蜣螂个体会在搜索空间中移动,尝试找到更优的解。这个步骤结合全局探索和局部开发策略,进一步优化解的质量。
[0042] 偷窃行为模拟是模拟蜣螂偷窃其他蜣螂粪球的行为。在蜣螂种群中,一些蜣螂个体会尝试从其他个体中获取更好的解,从而增强整个种群的搜索能力。这种行为可以防止算法陷入局部最优,提升全局搜索性能,公式表示为:
[0043] 其中, 表示第 个小偷第 次迭代的位置信息,是大小服从正态分布的随机向量,是常量。
[0044] 繁殖行为模拟是模拟蜣螂的繁殖过程,通过选择、交叉和变异等操作生成新的蜣螂个体。这些新个体在种群中增加了多样性,有助于探索更多的搜索空间,避免陷入局部最优解。
[0045] 在本发明的一些实施例中,图3为本发明实施例的黄金正弦算法的流程示意图,如图3所示,基于黄金正弦算法更新初始种群的种群个体位置,包括:S301、基于黄金分割数缩小初始种群的搜索空间得到优化搜索空间;
S302、基于正弦函数在优化搜索空间中进行个体寻优更新初始种群的种群个体。
[0046] 具体地,为保证优化出更优的参数组合,减少优化时间,实施例还对蜣螂优化算法中加入了黄金正弦算法,黄金正弦算法通过正弦函数来寻找最优值,并使用黄金分割数来缩小搜索空间,提升搜索速度,公式表示为:
[0047] 其中, 表示第 个种群个体第 次迭代的位置, 表示第 个个体在第 次迭代的最优位置, 为 范围内的随机数, 为 范围内的随机数, 和 为黄金分割系数。
[0048] 在本发明的一些实施例中,图4为本发明实施例的动态减法因子算法的流程示意图,如图4所示,动态减法因子算法种群个体更新,包括:S401、在初始种群的种群个体优化范围内随机生成第一随机向量和第二随机向量;
S402、将第一随机向量和第二随机向量相减后与预设动态系数相乘得到动态减法因子;
S403、根据动态减法因子更新初始种群的种群个体。
[0049] 具体地,为防止在优化过程中陷入局部最优解,在蜣螂优化算法位置更新中融合了动态减法因子。即每次进行位置更新时,在原有的位置更新方法上再添加减法因子以获取更优的新位置。
[0050] 动态减法因子算法通过在优化范围内生成两个随机向量作差,并与预设动态系数相乘得到动态减法因子,通过将动态减法因子来更新种群个体位置。其中预设动态系数,可以动态调整减法因子大小,随着迭代次数增加,得到的参数更接近最佳参数,使用的减法因子逐渐减小。动态减法因子公式表示如下:
[0051]
[0052]
[0053] 其中,为随机向量, 和 表示需要优化参数的边界值, 为随机生成的向量,向量个数和需要优化的参数量相同,元素值从 区间随机采样得到,为减法因子系数,可以自定义设定,为动态系数,表示当前迭代次数, 为最大迭代次数。
[0054] 在本发明的一些实施例中,图5为本发明实施例的计算种群个体适应度的流程示意图,如图5所示,根据子代种群确定种群个体适应度,包括:S501、将子代种群代入初始钻井机械钻速预测网络得到优化钻井机械钻速预测网络;
S502、根据优化钻井机械钻速预测网络进行机械钻速预测得到预测机械钻速;
S503、将预测机械钻速反归一化后与钻速预测训练数据计算平均相对误差得到子代种群的种群个体适应度。
[0055] 具体地,在每轮种群更新后,需要计算每个个体的适应度值,对此,实施例通过将更新后的种群代入钻井机械钻速预测网络中,对机械钻速进行预测得到预测机械钻速,并将预测机械钻速反归一化后与训练数据集计算平均相对误差作为种群个体适应度。
[0056] 反归一化公式表示为:
[0057] 其中, 为模型输出的预测机械钻速, 为反归一化后得到的预测钻速值。
[0058] 平均相对误差公式表示为:
[0059] 其中, 为实际钻速值, 为预测钻速值。
[0060] 实施例通过计算得到的蜣螂个体适应度值,选择表现较好的个体保留在种群中,淘汰适应度较差的个体。通过这种方式,种群逐步向最优解收敛。
[0061] 综上,为了减少计算量,提高训练速度,本发明首先对获取的钻井机械录井数据进行数据预处理得到钻速预测训练数据;然后将钻速预测训练数据输入初始钻井机械钻速预测网络中,根据初始钻井机械钻速预测网络的网络参数构建改进蜣螂算法的初始种群,对初始种群依次进行蜣螂行为模拟种群个体更新、黄金正弦算法种群个体更新和动态减法因子算法种群个体更新得到子代种群,根据子代种群确定种群个体适应度,根据种群个体适应度对子代种群进行种群筛选得到优化种群,迭代优化得到训练完备的钻井机械钻速预测网络。本发明通过蜣螂算法训练钻井机械钻速预测网络,可以减少训练过程中的计算量,提高模型训练的效率,通过黄金正弦算法和动态减法因子改进蜣螂算法,可以提高训练的准确性,提高钻井机械钻速预测网络训练的效率和准确性。
[0062] 本发明还提供了一种钻井机械钻速预测网络应用方法,结合图6来看,图6为本发明提供的钻井机械钻速预测网络应用方法的一个实施例的流程示意图,如图6所示,钻井机械钻速预测网络应用方法,包括:S601、获取待预测钻井机械录井数据;
S602、将钻井机械录井数据输入到训练完备的钻井机械钻速预测网络,得到机械钻速预测结果;
其中,训练完备的钻井机械钻速预测网络根据上述的钻井机械钻速预测网络训练方法确定。
[0063] 在本发明的实施例中,首先,对待预测钻井机械录井数据进行有效获取,然后利用上述训练完备的钻井机械钻速预测网络对钻井机械钻速进行有效预测,即可输出得到机械钻速预测结果。
[0064] 如图7所示,本发明还相应提供了一种电子设备700。该电子设备700包括处理器701、存储器702及显示器703。图7仅示出了电子设备700的部分组件,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
[0065] 处理器701在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行存储器702中存储的程序代码或处理数据,例如本发明中的钻井机械钻速预测网络训练方法和/或钻井机械钻速预测网络应用方法。
[0066] 在一些实施例中,处理器701可以是单个服务器或服务器组。服务器组可为集中式或分布式的。在一些实施例中,处理器701可为本地的或远程的。在一些实施例中,处理器701可实施于云平台。在一实施例中,云平台可包括私有云、公共云、混合云、社区云、分布式云、内部云、多重云等,或以上的任意组合。
[0067] 存储器702在一些实施例中可以是电子设备700的内部存储单元,例如电子设备700的硬盘或内存。存储器702在另一些实施例中也可以是电子设备700的外部存储设备,例如电子设备700上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
[0068] 进一步地,存储器702还可既包括电子设备700的内部储存单元也包括外部存储设备。存储器702用于存储安装电子设备700的应用软件及各类数据。
[0069] 显示器703在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light‑Emitting Diode,有机发光二极管)触摸器等。显示器703用于显示电子设备700的信息以及用于显示可视化的用户界面。电子设备700的部件701‑703通过系统总线相互通信。
[0070] 在一实施例中,当处理器701执行存储器702中的钻井机械钻速预测网络训练程序时,可实现以下步骤:对获取的钻井机械录井数据进行数据预处理得到钻速预测训练数据;
将钻速预测训练数据输入初始钻井机械钻速预测网络中,根据初始钻井机械钻速预测网络的网络参数构建改进蜣螂算法的初始种群,对初始种群依次进行蜣螂行为模拟种群个体更新、黄金正弦算法种群个体更新和动态减法因子算法种群个体更新得到子代种群,根据子代种群确定种群个体适应度,根据种群个体适应度对子代种群进行种群筛选得到优化种群,迭代优化得到训练完备的钻井机械钻速预测网络。
[0071] 在一实施例中,当处理器701执行存储器702中的钻井机械钻速预测网络应用程序时,可实现以下步骤:获取待预测钻井机械录井数据;
将钻井机械录井数据输入到训练完备的钻井机械钻速预测网络,得到机械钻速预测结果。
[0072] 应当理解的是:处理器701在执行存储器702中的钻井机械钻速预测网络训练程序和/或钻井机械钻速预测网络应用程序时,除了上面的功能之外,还可实现其他功能,具体可参见前面相应方法实施例的描述。
[0073] 进一步地,本发明实施例对提及的电子设备700的类型不做具体限定,电子设备700可以为手机、平板电脑、个人数字助理(personaldigital assistant,PDA)、可穿戴设备、膝上型计算机(laptop)等便携式电子设备。便携式电子设备的示例性实施例包括但不限于搭载IOS、android、microsoft或者其他操作系统的便携式电子设备。上述便携式电子设备也可以是其他便携式电子设备,诸如具有触敏表面(例如触控面板)的膝上型计算机(laptop)等。还应当理解的是,在本发明其他一些实施例中,电子设备700也可以不是便携式电子设备,而是具有触敏表面(例如触控面板)的台式计算机。
[0074] 相应地,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质用于存储计算机可读取的程序或指令,程序或指令被处理器执行时,能够实现上述各方法实施例提供的钻井机械钻速预测网络训练方法和/或钻井机械钻速预测网络应用方法中的步骤或功能。
[0075] 本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件(如处理器,控制器等)来完成,计算机程序可存储于计算机可读存储介质中。其中,计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
[0076] 以上对本发明所提供的钻井机械钻速预测网络训练方法、应用方法、电子设备及介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。