首页 / 一种基于深度学习的厂房图像三维重建动态优化方法及系统

一种基于深度学习的厂房图像三维重建动态优化方法及系统实质审查 发明

技术领域

[0001] 本发明涉及人工智能建筑设计技术领域,特别涉及一种基于深度学习的厂房图像三维重建动态优化方法及系统。

相关背景技术

[0002] 在建筑行业,特别是厂房建设和维护中,三维建模技术发挥着至关重要的作用。随着图像识别技术的飞速发展,基于图像识别的厂房三维建模技术已成为行业内的研究热点。然而,尽管该技术已经取得了一定的进展,但现有的基于图像识别的厂房三维建模技术仍存在多方面的不足和挑战。
[0003] 首先,特征提取和匹配算法存在不足。在厂房三维建模中,特征提取和匹配是关键步骤。然而,现有的特征提取算法大多依赖于固定的模板或规则,难以适应不同厂房环境的复杂性和多样性。同时,匹配算法也面临着计算量大、匹配精度低等问题,导致重建结果中存在大量的错误匹配和误判。
[0004] 此外,现有的三维重建方法缺乏动态优化机制。在厂房三维建模过程中,由于图像数据、设备性能等因素的差异,重建结果往往存在较大的不确定性。而现有的方法大多采用固定的重建流程和参数设置,缺乏根据实际情况进行动态调整和优化的能力。这导致在面对不同厂房环境时,重建结果的精度和效率难以保证。
[0005] 综上所述,现有的基于图像识别的厂房三维建模技术仍存在诸多不足和挑战。为了克服这些不足,本发明提出了一种基于深度学习的厂房图像三维重建动态优化方法和系统,旨在通过深度学习技术提高图像数据预处理、特征提取和匹配的准确性,同时引入动态优化机制,实现厂房三维建模的精准、高效和自适应。

具体实施方式

[0115] 下面结合附图对本发明做进一步描述。
[0116] 如图1所示,一种基于深度学习的厂房图像三维重建动态优化方法,包括如下步骤:
[0117] (1)数据准备与预处理:收集厂房的多角度图像数据,确保图像覆盖厂房的各个重要部分,对图像进行预处理,包括去噪、增强对比度、校正色彩,以提高后续处理的准确性;
[0118] (2)构建随机特征学习器模型:依据不同的特定分布对输入权重矩阵进行初始化,以此对输入权重矩阵施加约束;根据各个基学习器的重要性程度,为它们分配相应的注意力权重。通过堆叠处理后形成的新分布能够更灵活地适应数据特性,进而显著提升分类模型的精确度和泛化能力。
[0119] (2.1)构建基学习器:创建各不相同、遵循正态分布和均匀分布的输入权重矩阵,构建隐含层输出,通过伪逆学习得到输出权重矩阵,获得基学习器输出;
[0120] (2.1.1)创建i个各不相同的、遵循特定分布的输入权重矩阵Ki,Ki为任意分布;设定i=3,生成3个不同特定分布的Ki;
[0121] K1为服从期望值为μ1,标准差为δ1的正态分布:
[0122]
[0123] K2为服从区间为[p,q]的均匀分布:
[0124] K2~U(p,q);
[0125] K3为服从期望值为μ2,标准差为δ2的正态分布:
[0126]
[0127] 其中U为均匀分布,N为正态分布;
[0128] (2.1.2)构建隐含层输出Ui:
[0129] Ui=ξ(L×Ki);
[0130] 其中L为输入矩阵,本发明中为输入的图像数据,ξ为激活函数;
[0131] (2.1.3)针对输入矩阵L,采集每张图像的标签,构建标签矩阵G,通过伪逆学习得到输出权重矩阵:
[0132]
[0133] (2.1.4)获得基学习器网络输出:
[0134] Mi=Oi×Ui;
[0135] (2.2)构建元学习器:通过计算标签矩阵和基学习器网络输出的相似度获得元学习器输入权重矩阵,根据元学习器输入权重矩阵和基学习器网络输出进行单隐层堆栈伪逆学习,得到堆栈后的隐藏层输出,通过堆栈后元学习器输出权重矩阵获得元学习器网络输出;
[0136] (2.2.1)计算标签矩阵G和基学习器网络输出Mi之间的相似度:
[0137]
[0138] (2.2.2)通过逻辑归一化函数获得元学习器输入权重矩阵:
[0139]
[0140] (2.2.3)进行单隐层堆栈伪逆学习,根据元学习器输入权重矩阵和基学习器网络输出得到堆栈后的隐藏层输出:
[0141]
[0142] (2.2.4)根据伪逆学习得到堆栈后元学习器输出权重矩阵:
[0143]
[0144] (2.2.5)获得元学习器网络输出:
[0145] Mf=Uf×Of;
[0146] 堆栈伪逆学习作为一种集成学习技术,其图像分类的成效高度依赖于其泛化能力。然而,当前多数堆栈伪逆学习方法在随机子空间中随机初始化输入权重矩阵,且未对初始值进行限制,这导致了训练结果的不稳定性及泛化性能的下滑。此外,一次性训练全体样本可能引发分类器冗余,进一步削弱模型的泛化能力。为解决这些问题,我们提出了一个新颖框架,旨在通过随机子空间中的样本主动选择策略来强化伪逆学习的泛化能力。具体而言,我们首先构建了一个随机特征伪逆学习模型,通过特定分布的随机初始化来约束输入权重矩阵在随机子空间中的表现,从而提升泛化性能。其次,我们设计了主动学习渐进式模型,通过迭代方式挑选有益样本以优化分类效果,逐步挖掘并利用训练样本信息,进而提升模型的泛化能力。
[0147] (3)进行主动式渐进学习的图像分类识别:
[0148] (3.1)将预处理后的厂房图像作为训练样本随机平均分为训练集Ltr和候选集Lca,通过训练集Ltr利用(2.1.1)‑(2.1.3)训练基学习器,得到初始化权重矩阵Oi‑tr,训练Lca得到元学习器输出Mf‑ca;对Mf‑ca进行样本选择,选择Ls个厂房图像样本重新加入训练集Ltr中进行迭代,再次得到元学习器输出Mf‑ca;
[0149] (3 .2) 对于 P类 、T个 候选 样本 的 元学 习器 输 出选取 中每一列最大值对应的索引值y,对 进
行随机化:
[0150]
[0151] rand(P,1)为P行1列的随机向量;
[0152] (3.3)重新分配每个工厂建筑选集第y类,得到类边缘概率分布矩阵:
[0153]
[0154] i=1,2,…,P,P表示工厂构造类别数,j=1,2,…,T,T表示候选样本数, 表示Mf‑ca的第i行和第j列;
[0155] (3.4)计算P类、T个候选样本的模糊度:
[0156]
[0157] (3.5)构建模糊度合集I:
[0158] I=[R(Mf‑ca),Mf‑ca,Gf‑ca];
[0159] Gf‑ca为Mf‑ca的实际类标;
[0160] (3.6)进行迭代分类:根据R(Mf‑ca)值对I进行降序排序,若Mf‑ca≠Gf‑ca,则为错误分类样本,选取前s个错误分类样本,加入到Ltr中,重新构建训练集和候选集,重复训练z次,直到迭代结束,得到最终的厂房图像分类结果;
[0161] 作为实验,我们在三个公共数据集上验证了本发明的泛化能力。实验在一台装有AMD Radeon RX 7900XT显卡和Intel Core i7‑14700KF处理器的计算机进行三个公开的数据集,分别是COCONut、SUN09和Pascal Panoptic Parts,COCONut包含50幅训练图像和7546幅测试图像,SUN09由60000张训练图像和80000张测试图像组成,Pascal Panoptic Parts训练图像800张,测试图像530张。
[0162] 如下表所示,在对比传统方法与本发明方法于三个公开数据集上的平均准确率时,我们发现以下规律:对于数据集1和数据集3,本发明方法的平均训练精度保持稳定;而对于数据集2,尽管随着迭代次数增加,训练样本量增大,导致平均训练精度略有下滑,但本发明的平均测试精度却实现了显著提升。这一结果表明,在所有三个数据集中,本发明的平均测试准确率均优于传统方法,有力验证了本算法的有效性和可靠性。
[0163] 表1.传统堆栈伪逆学习方法与本方法在不同数据集的测试结果对别
[0164]
[0165] 当前网络模型的效能取决于基学习器的具体设计。因此,最新研究聚焦于开发多样化的网络架构,旨在创造出结构各异的基学习器和堆栈模型。然而,这些研究在初始化输入权重矩阵时缺乏约束,随机化处理忽视了特征块分布的随机性对神经网络效能的潜在影响,进而削弱了模型的泛化能力。此外,一次性训练所有古建筑图像可能导致分类器出现不必要的重复,损害模型泛化效果。本发明首先通过特定分布来约束输入权重矩阵的初始化,然后依据基学习器的重要性差异分配不同的注意力权重。这种处理使得堆栈后的新分布能更灵活地适应建筑图像数据,显著提升了厂房分类模型的准确性和泛化能力。本发明还将厂房训练样本分为训练集和备选集,利用样本选择策略从备选集中筛选有用样本加入训练集,迭代优化模型。这种方法在不增加额外训练样本的前提下,高效利用了现有训练信息,减少了厂房样本选择中的偏差,并逐步增强了分类模型的泛化性能。
[0166] (4)进行厂房数据一致性特征匹配;
[0167] (4.1)对于同一栋厂房的三维场景相邻图像,利用ORB算法来检测和提取图像中的特征点及其对应的描述子,构成匹配集,遍历每个特征点,以每个特征点为中心寻找邻域半径r内的所有特征点并构成匹配对,所述的邻域为以特征点为中心构成的基本正方形单元格的外接圆区域;
[0168] (4.2)计算每个邻域内匹配对的总数Cj,计算邻域值:
[0169] Fmn=|Cj|‑I;
[0170] ‑I代表删除原始匹配对操作,(mj,nj)代表每个匹配对;
[0171] (4.3)将匹配对根据支持度进行分布区分,去除高相似重复纹理错误匹配:
[0172]
[0173] β匹配下限阈值参数、γ为匹配上限阈值参数,Z为邻域总特征数,RI代表匹配对为正确匹配对,E代表匹配对为错误匹配对,RE代表重复匹配对;如图3所示,n1为n的正确匹配对,n2为n的重复匹配对,n3为n的错误匹配对;
[0174] 最终获得正确匹配集合F(RI);
[0175] (4.4)初始匹配优化:
[0176] 对正确匹配集合F(RI)实施随机抽样一致算法剔除离群点,保留所有符合条件的匹配对:
[0177] DMS=RANSAC[F(RI)];
[0178] RANSAC为随机抽样一致算法;
[0179] 对DMS拟合出基本矩阵:
[0180] S1=s(DMS);
[0181] s代表拟合操作;
[0182] (4.5)对匹配集对每个特征点进行引导匹配:
[0183] GuMS=|s(Fmn,S1)|
[0184] s()表示距离,g为距离参数;
[0185] 保留满足引导匹配条件GuMS的特征点;
[0186] (4.6)进行阈值β内的运动一致性判断,删除点对线逻辑的错误匹配,保留判别后的匹配对:
[0187]
[0188] ←为验证计算;
[0189] 为了显著提升三维重建的成效,本发明引入了一种创新的特征匹配策略,该策略侧重于通过圆形邻域分割来增强运动一致性。首要步骤是实施一种圆形邻域分割技术,旨在增加初步特征点匹配的数目。接着,为了提升匹配的精确度,本发明采取了双重策略:一是通过强化真伪匹配点的辨识准则,降低了高相似特征点间的错误匹配率;二是实施异常值剔除,进一步精炼特征点匹配的准确性。此外,本发明还拓宽了特征点匹配的位置分布,从而增强了三维模型的稳固性。这一系列改进措施使得匹配性能得到显著提升,并在三维重建过程中展现出更高的稳定性。
[0190] (5)进行图像分类和特征点匹配动态优化;
[0191] (5.1)计算图像分类中被正确划分为正例的个数TP、被正确划分为负例的个数TN、被错误划分为正例的个数FP和被错误划分为负例的个数FN
[0192] (5.2)计算分类正确率Acc;
[0193]
[0194] (5.3)计算分类精确度Cr;
[0195]
[0196] (5.4)计算特征匹配精度PMS;
[0197]
[0198] TMS为正确匹配个数,FMS为错误匹配个数;
[0199] (5.5)参数动态调整:
[0200] 当Acc<ε时或Cr<∈时,重新执行步骤(3.1),重新进行训练样本随机平均分配并执行后续步骤;ε为分类正确率阈值,∈为分类精确度阈值;直到分类正确率和分类精确度控制在阈值范围内;
[0201] 当PMS<θ时,提高γ值,重新执行步骤(4.3)并执行后续步骤,直到特征匹配精度控制在阈值范围内;
[0202] 本发明通过计算分类正确率、分类精确度和特征匹配精度等指标,对图像分类和特征点匹配进行动态评估和优化。根据评估结果,动态调整参数,并重新执行相关步骤,直到分类正确率和分类精确度控制在阈值范围内,特征匹配精度也得到有效提升。
[0203] (6)三维图像重建:
[0204] (6.1)使用判别后的匹配对,通过三角测量方法计算每个特征点在三维空间中的位置;三角测量基于两个或多个视角中的匹配点,通过计算这些点在相机坐标系中的位置,进而确定它们在三维空间中的坐标;
[0205] (6.2)将所有通过三角测量得到的特征点位置组合起来,形成一个点云;点云是三维空间中一系列离散点的集合,代表了厂房表面的形状和结构。
[0206] (6.3)从点云出发,使用表面重建算法来生成厂房的三维表面模型;
[0207] 常用的表面重建算法包括Delaunay三角剖分、Poisson表面重建等。这些算法能够根据点云数据生成连续、平滑的三维表面;
[0208] (6.4)将原始图像中的纹理信息映射到重建的三维表面上,并提取该点的颜色信息来填充三维表面;
[0209] (6.5)将重建的厂房三维图像输出为适当的文件格式(如OBJ、PLY等)。
[0210] 对于三维重建过程,根据点云数据等现有技术手段即可实现,这里不再赘述。
[0211] 此外,如图2所示,本发明提供一种基于深度学习的厂房图像三维重建动态优化系统,包括:数据准备与预处理模块;随机特征学习器模型构建模块;图像分类识别模块;特征匹配模块;动态优化模块和三维图像重建模块。该系统,采用上述的基于深度学习的厂房图像三维重建动态优化方法执行厂房图像三维重建任务。该系统通过深度学习技术,实现了从数据准备到三维图像重建的全自动化流程。深度学习模型能够自动提取图像中的关键特征,并进行分类和识别,减少了人工干预的需求。随机特征学习器模型能够学习到图像中的复杂特征,提高了图像分类和识别的准确性。特征匹配模块通过精确的特征匹配算法,确保了三维重建的精度和稳定性。动态优化模块能够根据实际情况对重建过程进行实时调整,进一步提高了系统的鲁棒性。深度学习模型在训练过程中能够学习到高效的特征表示,从而加速了图像处理和三维重建的速度。系统采用模块化设计,各模块之间协同工作,提高了整体的处理效率。实时性方面,系统能够迅速响应输入数据,并生成高质量的三维图像,满足实际应用中的时间要求。该系统具有良好的可扩展性,可以根据实际需求增加新的功能模块或优化现有模块。深度学习模型具有强大的泛化能力,能够处理不同场景下的厂房图像三维重建任务。系统的灵活性还体现在对输入数据的适应性上,能够处理不同分辨率、不同光照条件下的图像。相比传统的三维重建方法,该系统降低了对专业设备和人工操作的需求,从而降低了成本。自动化和智能化的特点使得系统能够持续高效地运行,提高了工作效率和经济效益。
[0212] 以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根据本发明的技术方案和发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

当前第1页 第1页 第2页 第3页
相关技术
优化方法相关技术
动态优化相关技术
陈传忠发明人的其他相关专利技术