一种基于大模型的积木搭建教程生成方法及系统

一种基于大模型的积木搭建教程生成方法及系统实质审查发明

技术领域

[0001] 本发明涉及积木模型搭建技术领域，尤其涉及一种基于大模型的积木搭建教程生成方法及系统。

具体实施方式

[0050] 为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

[0051] 下面结合图1‑图6描述本发明的一种基于大模型的积木搭建教程生成方法，包括：

[0052] S100、获取用户输入的模型生成提示信息；

[0053] S200、根据所述模型生成提示信息通过预设的三维生成模型生成积木立体模型；

[0054] S300、基于所述积木立体模型通过分割算法进行体素化，离散为多个小立方体；

[0055] S400、基于多个小立方体通过运筹学进行优化设计，对积木砖块和板块的使用进行优化，生成优化模型；

[0056] S500、基于所述优化模型分层次生成整体的积木建造教程，用户基于积木建造教程进行交互。

[0057] 在本发明中，通过自动化生成积木建造教程的方法，能够激发用户的创造力，提高积木的再次使用率。通过使用先进的算法，可以根据用户的提示和现有积木块的限制，生成个性化、创新的积木建造方案。这不仅增加了积木作为教育和娱乐工具的价值，也促进了资源的有效利用和可持续性。

[0058] 获取用户输入的模型生成提示信息，具体包括：

[0059] S101、用户通过文本、语音、图片材料、绘制图形的方式描述模型的状态；

[0060] S102、将用户描述模型的状态进行处理生成提示信息。

[0061] 具体地，接收用户输入的生成提示信息能够确保用户需求的准确捕捉和后续处理的高效性。提示可以是关于所希望构建的物体的描述，例如建筑物、车辆或其他任何类型的结构。用户可以通过文本输入、语音命令或通过图像和图纸等视觉材料来提供这些提示。系统将这些输入解析为可以用于生成3D模型的指令。

[0062] 在实际输入生成提示信息过程中，能够进行文本输入，允许用户通过键盘输入他们的想法和描述。这可能包括对希望构建的乐高模型的简单描述，例如“建造一座桥梁”或“复制埃菲尔铁塔的模型”；或者通过语音输入，配备语音识别功能，允许用户通过语音输入他们的想法。用户只需说出他们的构建想法，如“我想制作一个海盗船模型”，系统则录制这些语音信息；或者图片材料的输入，用户可以上传相关的图像或图纸。例如，如果用户想要创建一个特定的建筑物模型，他们可以上传该建筑物的图片或设计图纸。系统能够接收各种格式的输入，包括文本文件、音频文件、图片或者PDF文件等，以便用户以最便捷的方式提供信息。一旦用户提供了输入，系统会将这些信息记录下来，以便在生成3D模型的下一步骤中使用。

[0063] 通过获取模型生成提示信息，系统能够精确地捕捉用户的意图，并将其转化为可以用于后续步骤的具体指令，从而为生成定制化的积木搭建教程奠定基础。

[0064] 根据所述模型生成提示信息通过预设的三维生成模型生成积木立体模型，具体包括：

[0065] S201、所述三维生成模型基于模型生成提示信息进行深度学习，提取关键特征；

[0066] S202、基于提取的关键特征生成对抗网络，通过对抗网络的生成器进行图像创建，通过对抗网络的判别器评估创建的图像与真实图像之间的区别；

[0067] S203、通过对抗网络的处理生成积木立体模型，同时三维生成模型不断训练迭代对生成的积木立体模型进行改进。

[0068] 在本发明中，使用三维生成模型根据用户的提示生成3D模型。大型模型通常基于深度学习框架构建，这意味着它们由多层的神经网络组成。这些网络能够从大量数据中学习复杂的模式和关系，逐渐提升其在特定任务上的性能。在生成3D模型的任务中，大模型首先需要从用户输入(如文本、图片)中提取关键特征。例如，如果用户上传了建筑物的图片，模型将识别出其结构、形状、细节等元素。生成对抗网络(GAN)在图像生成领域尤为突出。GAN包含两部分：生成器和判别器。生成器负责创建图像(或此处的3D模型)，而判别器评估生成的图像与真实图像之间的区别。通过这种对抗过程，模型能够生成越来越逼真的输出。
在生成3D模型时，大模型会使用其学到的特征和规则来构造三维空间中的物体。这通常涉及复杂的几何和空间关系处理，确保生成的模型既详细又精确。

[0069] 大模型通常需要大量的训练数据来优化其性能。在训练过程中，模型会不断调整其内部参数，以更好地完成任务。此外，模型通常还会通过不断的迭代和反馈来提升其生成3D模型的精确度和质量。在实际应用中，大模型还可以根据用户的具体需求进行调整。例如，可以根据用户拥有的乐高块种类和数量来调整生成的3D模型，确保其可构建性。通过运用这些高级的深度学习技术，大型模型能够有效地将用户的输入转换为复杂的3D模型，为积木建造提供详细和实用的指导。这种模型的强大之处在于其能够处理和解析复杂的数据，生成高质量和高度定制化的输出。

[0070] 基于所述积木立体模型通过分割算法进行体素化，离散为多个小立方体，具体包括：

[0071] S301、将所述积木立体模型通过分割算法进行体素化分割；

[0072] S302、所述分割算法在分割过程中根据用户所拥有的积木块数目来确定体素化的粒度；

[0073] S303、在分割过程中，对积木立体模型进行简化，最终离散为多个小立方体。

[0074] 具体地，生成的积木立体模型随后通过分割算法进行体素化。体素化是将连续的三维形状转换成由小立方体(体素)组成的离散形式的过程。这一步骤对于后续的运筹学优化至关重要，因为它简化了模型并使之能够以乐高块的形式表示。体素化可以类比于二维图像的像素化。像素是二维图像的基本单位，体素也是三维空间的基本单位。体素化过程中，连续的三维模型被分解成一系列小的、离散的立方体(体素)。

[0075] 为了进行体素化，系统使用分割算法将积木立体模型划分成小的立方体。这个过程涉及到确定体素化的粒度每个体素的大小和位置，以确保它们合起来能表示原始的积木立体模型。

[0076] 在积木结构建模的情景下，需要根据用户所拥有的乐高块数目来确定体素化的粒度(即每个体素的大小)。确保体素化模型可以用实际的乐高块来构建。体素化过程还包括对原始积木立体模型的简化。这可能涉及去除细小的细节，这些细节在乐高模型中难以或无法实现。同时，也要保证简化后的模型仍然忠实地反映原始设计的核心特征。系统能够将复杂的积木立体模型转换成可以用乐高块构建的离散形式，为实际的物理构建打下基础。体素化不仅使模型与乐高块的物理特性相兼容，而且还为运筹学优化提供了必要的数据结构。

[0077] 基于多个小立方体通过运筹学进行优化设计，对积木砖块和板块的使用进行优化，生成优化模型，具体包括：

[0078] S401、获取多个小立方体通过使用整数线性规划完成体素至砖块的转换；

[0079] S402、在获取每个砖块的成本后进行综合统筹，使结构稳定美观的同时最小化不同类型积木砖块的数量，生成优化模块。

[0080] 在本发明中，对体素化的模型进行运筹学优化考虑到用户所拥有的乐高块的类型和数量的限制，以及建造过程的可行性和效率。优化的目标是最小化所需不同类型乐高块的数量，同时确保结构的稳定性和美观性。涉及到使用整数线性规划(ILP)公式对乐高砖块和板块的使用进行优化。这个过程的目标是根据一些砖块粘合规则放置砖块，并使用罚分法来量化这些规则。

[0081] 通过复杂的运筹学优化，可以在考虑砖块类型和数量限制的同时，确保结构的稳定性和美观性，最小化不同类型乐高砖块的数量。

[0082] 基于所述优化模型分层次生成整体的积木建造教程，用户基于积木建造教程进行交互，具体包括：

[0083] S501、基于优化模块将优化结果中的数据转换为具体的构建步骤，包括砖块的放置顺序以及组合关系；

[0084] S502、创建逐层的构建步骤，生成图形说明和文字说明，并生成需要的积木清单，用户根据构建步骤进行积木的搭建。

[0085] 在本发明中，基于运筹学优化的结果，生成详细的乐高建造教程。教程还可以根据用户的技能水平进行调整，提供不同层次的指导和挑战。要将运筹学优化的方案转换为实际的乐高建造教程，需要经过一系列的步骤，以确保教程既准确又易于遵循。

[0086] 首先，将运筹学优化结果中的数据转换为具体的构建步骤。这包括确定砖块的放置顺序，以及如何将各个部分组合在一起。乐高模型通常是从底部开始逐层构建的，因此教程会按照这样的顺序呈现每一层的构建指令。这有助于保证整个模型的结构稳定性，并使构建过程条理清晰。为了使教程更加直观，每个构建步骤都应伴有详细的图形说明。这些图形描绘了每一层的具体布局，展示了如何放置不同颜色和尺寸的砖块。除了图形表示，教程还应包含详细的文字说明，指导用户完成每一个步骤。这些说明可能涉及特定砖块的放置技巧、层与层之间的连接方式，以及其他重要的操作细节。教程中应包含一份完整的乐高块清单，列出构建整个模型所需的砖块类型、数量和颜色，以便用户在开始之前确保拥有所有必要的材料。在制作教程时，考虑到不同用户的技能水平和经验，提供适当的指导和挑战。对于初学者，可以提供更多的基础构建技巧和详细的步骤说明；对于经验丰富的建造者，则可以增加更复杂的设计元素和挑战性任务。通过这些步骤，可以确保最终生成的乐高建造教程不仅准确无误，还易于理解和遵循，适应不同用户的需求和技能水平。

[0087] 并且，本发明还包括用户界面和交互设计的考虑，这是确保用户能够高效且愉快地使用系统的关键。良好的界面和交互设计不仅使用户易于操作系统，还能增强整体的用户体验。用户界面应该直观易懂，以便用户快速理解如何操作系统。这可能包括清晰的菜单、明确的图标表示和易于导航的布局。为了适应不同用户的需求，界面应该支持多种输入方法，包括文本输入、语音命令、图像上传等。这样，用户可以选择最适合他们的方式来提供信息。系统应该提供即时和清晰的反馈，告知用户他们的操作结果。这包括确认输入已被接收、提供错误消息和建议，以及在进行复杂操作时给出进度指示。用户应能够轻松查看和交互地探索3D模型。这包括旋转、缩放和视角变换功能，让用户从不同角度审视模型。用户界面应提供简便的方式来访问和遵循乐高建造教程。这可能包括步骤的逐层展示、图形和文字说明的组合，以及任何必要的互动元素。界面应允许用户根据自己的偏好和需求进行一定程度的自定义。这可能包括调整字体大小、选择主题颜色，甚至是自定义教程的细节。界面设计应考虑到不同用户的可访问性需求，包括适用于视觉或听力障碍人士的特性。此外，它应适应不同的设备和屏幕尺寸，无论是在电脑、平板还是手机上都能提供良好的体验。通过这样的用户界面和交互设计，系统不仅能够提供功能性，还能增强用户体验，确保用户在使用过程中感到满意和愉悦。

[0088] 在本发明中，还能够建立社区交流平台，用户能够发布问题、分享建议和技巧，以及讨论乐高相关的话题。这有助于形成一个活跃的知识分享环境；定期举办设计和构建挑战，鼓励用户创造独特的乐高模型，并分享他们的作品。这些活动可以激发创意思维，促进社区成员之间的交流；允许社区成员对系统的功能提供反馈，包括用户界面、教程的易懂程度和优化算法的效果。这种反馈对系统的持续改进至关重要；通过社区平台，用户可以分享他们的创意灵感和故事，激励其他成员尝试新的想法和方法；平台可以提供教程、视频和指南，帮助新用户学习如何使用系统，并提高他们的乐高建模技能。

[0089] 通过本发明提供的一种基于大模型的积木搭建教程生成方法，获取用户输入的生成提示信息后，通过三维生成模型生成积木立体模型，经过体素化和优化后，生成积木搭建教程；可以将用户的任何想法或设计转换成详细的3D积木模型，使用户能够创造出独一无二的积木搭建作品，无论是复杂的建筑模型还是个性化的创意设计；定制化的教程使得积木构建更加个性化和适应性强；运筹学优化确保了积木块的使用最大化效率，减少了不必要的浪费，同时也考虑到了结构的稳定性和美观性。

[0090] 参考图7，本发明还公开了一种基于大模型的积木搭建教程生成系统，所述系统包括：

[0091] 信息获取模块110，用于获取用户输入的模型生成提示信息；

[0092] 三维转化模块120，用于根据所述模型生成提示信息通过预设的三维生成模型生成积木立体模型；

[0093] 分割模块130，用于基于所述积木立体模型通过分割算法进行体素化，离散为多个小立方体；

[0094] 优化模块140，用于基于多个小立方体通过运筹学进行优化设计，对积木砖块和板块的使用进行优化，生成优化模型；

[0095] 交互模块150，用基于所述优化模型分层次生成整体的积木建造教程，用户基于积木建造教程进行交互。

[0096] 其中，信息获取模块，用户通过文本、语音、图片材料、绘制图形的方式描述模型的状态；

[0097] 将用户描述模型的状态进行处理生成提示信息。

[0098] 三维转化模块，所述三维生成模型基于模型生成提示信息进行深度学习，提取关键特征；

[0099] 基于提取的关键特征生成对抗网络，通过对抗网络的生成器进行图像创建，通过对抗网络的判别器评估创建的图像与真实图像之间的区别；

[0100] 通过对抗网络的处理生成积木立体模型，同时三维生成模型不断训练迭代对生成的积木立体模型进行改进。

[0101] 分割模块，将所述积木立体模型通过分割算法进行体素化分割；

[0102] 所述分割算法在分割过程中根据用户所拥有的积木块数目来确定体素化的粒度；

[0103] 在分割过程中，对积木立体模型进行简化，最终离散为多个小立方体。

[0104] 优化模块，获取多个小立方体通过使用整数线性规划完成体素至砖块的转换；

[0105] 在获取每个砖块的成本后进行综合统筹，使结构稳定美观的同时最小化不同类型积木砖块的数量，生成优化模块。

[0106] 交互模块，基于优化模块将优化结果中的数据转换为具体的构建步骤，包括砖块的放置顺序以及组合关系；

[0107] 创建逐层的构建步骤，生成图形说明和文字说明，并生成需要的积木清单，用户根据构建步骤进行积木的搭建。

[0108] 通过本发明提供的一种基于大模型的积木搭建教程生成系统，获取用户输入的生成提示信息后，通过三维生成模型生成积木立体模型，经过体素化和优化后，生成积木搭建教程；可以将用户的任何想法或设计转换成详细的3D积木模型，使用户能够创造出独一无二的积木搭建作品，无论是复杂的建筑模型还是个性化的创意设计；定制化的教程使得积木构建更加个性化和适应性强；运筹学优化确保了积木块的使用最大化效率，减少了不必要的浪费，同时也考虑到了结构的稳定性和美观性。

[0109] 图8示例了一种电子设备的实体结构示意图，如图8所示，该电子设备可以包括：处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840，其中，处理器810，通信接口820，存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令，以执行一种基于大模型的积木搭建教程生成方法，该方法包括：获取用户输入的模型生成提示信息；

[0110] 根据所述模型生成提示信息通过预设的三维生成模型生成积木立体模型；

[0111] 基于所述积木立体模型通过分割算法进行体素化，离散为多个小立方体；

[0112] 基于多个小立方体通过运筹学进行优化设计，对积木砖块和板块的使用进行优化，生成优化模型；

[0113] 基于所述优化模型分层次生成整体的积木建造教程，用户基于积木建造教程进行交互。

[0114] 此外，上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read‑Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

[0115] 另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的一种基于大模型的积木搭建教程生成方法，该方法包括：获取用户输入的模型生成提示信息；

[0116] 根据所述模型生成提示信息通过预设的三维生成模型生成积木立体模型；

[0117] 基于所述积木立体模型通过分割算法进行体素化，离散为多个小立方体；

[0118] 基于多个小立方体通过运筹学进行优化设计，对积木砖块和板块的使用进行优化，生成优化模型；

[0119] 基于所述优化模型分层次生成整体的积木建造教程，用户基于积木建造教程进行交互。

[0120] 又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的一种基于大模型的积木搭建教程生成方法，该方法包括：获取用户输入的模型生成提示信息；

[0121] 根据所述模型生成提示信息通过预设的三维生成模型生成积木立体模型；

[0122] 基于所述积木立体模型通过分割算法进行体素化，离散为多个小立方体；

[0123] 基于多个小立方体通过运筹学进行优化设计，对积木砖块和板块的使用进行优化，生成优化模型；

[0124] 基于所述优化模型分层次生成整体的积木建造教程，用户基于积木建造教程进行交互。

[0125] 以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

[0126] 通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

[0127] 最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

查看完整全部详细技术资料

当前第1页第1页第2页第3页