技术领域
[0001] 本发明属于智能文档撰写技术领域,特别涉及一种基于大语言模型的文档撰写方法、系统和设备。
相关背景技术
[0002] 随着信息技术和人工智能的快速发展,自然语言处理(NLP)已成为解决复杂语言数据处理问题的关键技术之一。特别是,大语言模型(LLM)如GPT,因其强大的语言理解和生成能力而被广泛应用于各种文本相关任务,包括聊天机器人、自动文档生成和内容摘要等。
[0003] 然而,尽管现有的大语言模型在文本生成方面表现出色,但在专业文档撰写,特别是科研和技术文档方面,仍面临一些挑战。这些挑战主要包括:1)缺乏与用户交互以动态生成和修正文档大纲的能力;2)在生成长文本时往往无法保持内容的一致性和准确性;3)容易产生幻觉且缺少对特定领域术语和概念的深入理解。此外,传统的文档撰写工具如文字处理软件虽然功能强大,但通常缺乏智能化的支持,如自动内容生成和结构优化等,使得用户在撰写涉及复杂结构和技术深度的文档时耗费大量的时间和精力。
具体实施方式
[0040] 为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
[0041] 实施例1
[0042] 本发明实施例1提供了一种基于大语言模型的文档撰写方法,用于解决现有技术中文档撰写存在的问题。本发明旨在通过智能化的文本生成和交互式编辑功能,提高文档撰写的效率和质量,尤其是在处理复杂文档、自动化内容生成和实时用户反馈调整方面。本发明能够显著提升文档的准确性和个性化,满足不同行业对高质量文档撰写的需求。
[0043] 本发明实施例1提供了一种基于大语言模型的文档撰写方法包括:
[0044] 接收文档主题和文档编写需求,利用大预言模型生成文档初始大纲;以及接收所述文档初始大纲的反馈意见,利用所述反馈意见实时修改后续版本的大纲内容;
[0045] 就用户和助手对后续版本的大纲是否达成一致性进行判断,在达成一致性时,得到最终的文档大纲;所述助手为负责判断大纲是否生成的助手;
[0046] 根据最终的文档大纲自动填充具体章节,生成逻辑连贯、语法正确的最终文本;
[0047] 对生成的最终文本进行格式化和润色,确保最终文本的准确性和一致性。
[0048] 图1为本发明实施例1提供的一种基于大语言模型的文档撰写方法流程图;
[0049] 在步骤S100中,接收文档主题和文档编写需求。
[0050] 接收用户输入的文档撰写请求,包括主题、类型及其他相关参数;
[0051] 比如输入:“我想生成图像去雾方面的背景技术介绍文档”,系统通过调用LLM,使其遵照指令使用其内在知识生成初始大纲。
[0052] 在步骤S101中,利用大预言模型生成文档初始大纲。文档初始大纲包括各个标题、每个标题下内容对应的描述和每个标题对应的子标题。
[0053] 在该步骤中使用的提示词为:“<指令>你是一个智能助手,负责通过用户的需求生成某个背景技术介绍或某项技术发展历程的大纲。生成后询问用户是否满意。
[0054] 每个大纲应包含以下结构:
[0055] 1.主题:研究报告的主题。
[0056] 2.大纲:包含多个部分,每部分应包括:
[0057] ‑标题:该部分的标题。
[0058] ‑描述:对该部分内容的简要描述。
[0059] ‑子标题(可选):如果该部分内容具有更细分的主题,每个子主题也应包括标题和描述。
[0060] 请根据用户提供的主题和讨论生成大纲,并以JSON格式返回结果。
[0061] 用户输入:{{用户需求}}指令>”。
[0062] 在步骤S102中,判断大纲是否满足一致性需求,如果满足,则执行步骤S105,否则执行步骤S103。
[0063] 在步骤S103中,进行联网搜索。
[0064] 在步骤S104中,迭代修改大纲。在本发明中用户反馈起着至关重要的作用。本发明设计了一个反馈机制,允许用户在每次生成的大纲后提出修改意见。这些反馈被系统解析,并用于调整后续版本的大纲内容。每条反馈都视为对系统当前输出的一次评价,指导下一步的内容调整。
[0065] 本申请中对每个大纲章节设置不同的权重,根据章节的权重和对当前章节的具体反馈调整后续版本的大纲内容;具体调节的公式为:
[0066]
[0067] 其中,Outlinen是第n次迭代的大纲;
[0068] ωi是第i个子章节在大纲中的权重;
[0069] Δi是一个针对第i个子章节的调整函数;
[0070] Feedbackn,i是用户针对第n次迭代中第i个子章节提供的反馈;
[0071] Outlinen,i是第n次迭代中第i个子章节的内容。
[0072] 通过上面隐式的期望函数对大纲进行了优化。每轮用户反馈都视为期望函数的一次实时评估,通过这种方式,系统不断逼近用户期望的最终报告结构。这种方法高效地将用户的直观反馈转化为算法调整的指导,从而迭代改进大纲的准确性和满意度。
[0073] 根据大纲和修改意见自动生成具体的搜索问题以确保获取最相关的信息,从而利用外部知识降低模型出现幻觉的可能性。本步骤系统需要调用LLM,使用的提示词为:
[0074] “<指令>你是一个智能助手,负责根据用户提供的当前研究大纲和修改意见,生成多个相应的搜索问题,以便通过浏览器获取外部可靠来源的知识。
[0075] 当前大纲:{{研究大纲}}
[0076] 修改意见:{{修改意见}}指令>”
[0077] 根据生成搜索问题查询浏览器网页并总结答案。本步骤系统需要调用LLM,使用的提示词为:
[0078] “<指令>你是一个智能助手,负责根据问题和相关网页内容总结答案,并将结果整理为字典格式。
[0079] 问题:{{问题}}
[0080] 网页内容:{{网页内容}}指令>”
[0081] 对于每个问题得到一个问答对字典,最后将字典合并得到外部知识字典[0082] 根据当前大纲为基准,遵循修改意见,参考联网搜索获取的外部参考知识对当前大纲进行修改。本步骤系统需要调用LLM,使用的提示词为:
[0083] “<指令>你是一个智能助手,负责根据用户提供的当前研究大纲和修改意见,参考外部知识对大纲进行修改,修改后的大纲保持和原大纲相同的组织格式。
[0084] 当前大纲:{{研究大纲}}
[0085] 修改意见:{{修改意见}}
[0086] 外部知识:{{外部知识字典}}指令>”
[0087] 询问用户大纲是否满足需求,是否需要进一步修改完善。
[0088] 在步骤S105中,生成各子标题的内容。
[0089] 根据用户回复和参照历史对话,就用户和助手对后续版本的大纲是否达成一致性进行判断;如果判断不一致,则重新进行修改大纲内容。如果判断一致,则生成各子标题的内容。
[0090] “<指令>你是一个负责判断大纲是否生成的助手。你的任务是根据用户和助手之间的最近一轮对话,确定是否已经就研究大纲达成一致。只有当用户明确表示已确定时,输出True,否则输出False,不要输出额外的分析。请在审查聊天历史时注意用户的语言和表达方式,以确定是否已达成共识。
[0091] 以下是聊天记录:{{历史消息}}指令>”
[0092] 在生成各子标题的内容时,系统将确定好的大纲进行拆分,对于每个子标题的标题和描述生成一个编写任务。
[0093] 在步骤S106中,对于每个编写任务,系统根据将根据该部分大纲和概括性描述自动生成具体的联网检索问题。本步骤系统需要调用LLM,使用的提示词为:
[0094] “<指令>你是一个智能助手,负责根据用户提供的段落标题和概括性描述,生成多个相应的搜索问题,以便通过浏览器获取外部可靠来源的知识。
[0095] 段落标题:{{子标题}}
[0096] 概括性描述:{{子标题描述}}指令>”
[0097] 重新返回步骤S105,根据生成的问题查询浏览器网页并总结答案。本步骤系统需要调用LLM,使用的提示词为:
[0098] “<指令>你是一个智能助手,负责根据问题和相关网页内容总结答案,并将结果整理为字典格式。
[0099] 问题:{{问题}}
[0100] 网页内容:{{网页内容}}指令>”
[0101] 对于每个问题得到一个问答对字典,最后将字典合并得到外部知识字典。
[0102] 根据子标题、概括性描述和外部知识字典撰写该部分内容。本步骤系统需要调用LLM,使用的提示词为:
[0103] “<指令>你是一个智能助手,负责撰写研究报告的某一部分。
[0104] 主题是:{主题}
[0105] 全文大纲如下:{全文大纲}
[0106] 当前需要编写的部分为:{子标题}
[0107] 请根据以下描述和参考知识进行编写:
[0108] 描述:{子标题描述}
[0109] 参考知识:{外部知识字典}指令>”
[0110] 循环进行各子标题的内容步骤,直到全文草稿撰写完成。
[0111] 在步骤S107中,对生成的最终文本进行格式化和润色,确保最终文本的准确性和一致性。
[0112] 系统根据全文草稿和大纲进行格式化和润色,确保标题按大纲结构组织,并润色修养不规范的句子和段落。步骤系统需要调用LLM,使用的提示词为:
[0113] “<指令>你是一位文案大师,你的任务是对用户输入的文档进行格式化润色优化。
[0114] 润色要求:
[0115] 1.参考大纲内容组织文档内容。
[0116] 2.修正任何语法、拼写或标点错误。
[0117] 3.保持文本的风格和语气一致。
[0118] 参考大纲:{{大纲内容}}
[0119] 用户输入:{{草稿内容}}指令>”
[0120] 经过润色后,输出最终文档。
[0121] 在步骤S108中,文章完成。
[0122] 图2为本发明实施例1提供的一种基于大语言模型的文档撰写方法流程走向图;本发明涵盖从大纲生成、大纲交互修改、大纲一致性判断、文档分段编写到文档润色及格式化的全过程。
[0123] 本发明实施例1提供了一种基于大语言模型的文档撰写方法,旨在通过智能化的文本生成和交互式编辑功能,提高文档撰写的效率和质量,尤其是在处理复杂文档、自动化内容生成和实时用户反馈调整方面。
[0124] 本发明实施例1提供了一种基于大语言模型的文档撰写方法,能够显著提升文档的准确性和个性化,满足不同行业对高质量文档撰写的需求。
[0125] 实施例2
[0126] 基于本发明实施例1提出的了一种基于大语言模型的文档撰写方法,本发明实施例2还提供了本发明实施例1提供了一种基于大语言模型的文档撰写系统,图2为本发明实施例1提供的一种基于大语言模型的文档撰写方法流程走向图;该系统包括:大纲生成模块、判断模块和文本生成模块;
[0127] 大纲生成模块用于接收文档主题和文档编写需求,利用大预言模型生成文档初始大纲;以及接收所述文档初始大纲的反馈意见,利用所述反馈意见实时修改后续版本的大纲内容;
[0128] 判断模块用于就用户和助手对后续版本的大纲是否达成一致性进行判断,在达成一致性时,得到最终的文档大纲;所述助手为负责判断大纲是否生成的助手;
[0129] 文本生成模块用于根据最终的文档大纲自动填充具体章节,生成逻辑连贯、语法正确的最终文本。
[0130] 本申请的大纲生成模块中,文档初始大纲包括各个标题、每个标题下内容对应的描述和每个标题对应的子标题
[0131] 利用所述反馈意见调整后续版本的大纲内容的具体过程包括:对每个大纲章节设置不同的权重,根据章节的权重和对当前章节的具体反馈调整后续版本的大纲内容;具体调节的公式为:
[0132]
[0133] 其中,Outlinen是第n次迭代的大纲;ωi是第i个子章节在大纲中的权重;Δi是一个针对第i个子章节的调整函数;Feedbackn,i是用户针对第n次迭代中第i个子章节提供的反馈;Outlinen,i是第n次迭代中第i个子章节的内容。
[0134] 接收所述文档初始大纲的反馈意见,利用所述反馈意见调整后续版本的大纲内容的具体包括:根据当前大纲和当前大纲的反馈意见生成搜索问题;所述当前大纲为利用初始大纲的反馈意见,调整后的正在运行的大纲。利用生成的搜索问题查询浏览器网页并总结答案;每个问题得到一个问答对字典,最后将问答对字典合并得到外部知识字典;以当前大纲为基准,遵循当前大纲的反馈意参考联网搜索获取的外部参考知识对当前大纲进行修改;直到最后输出的大纲满足要求。
[0135] 判断模块中,就用户和助手对后续版本的大纲是否达成一致性进行判断具体包括:根据用户回复和参照历史对话,就用户和助手对后续版本的大纲是否达成一致性进行判断;如果判断不一致,则重新进行修改大纲内容。
[0136] 文本生成模块中,根据最终的文档大纲自动填充具体章节,生成逻辑连贯、语法正确的最终文本的具体过程包括:将最终的文档大纲进行拆分,对于每个子标题的标题和描述生成一个编写任务;根据每个编写任务,根据所述编写任务对应的大纲和概括性描述生成联网检索问题;根据生成的所述联网检索问题查询浏览器网页并总结答案,将所述总结答案整理为字典格式得到知识字典;根据子标题、概括性描述和知识字典撰写最终文本。
[0137] 该系统还包括润色模块,润色模块用于对生成的最终文本进行格式化和润色,确保最终文本的准确性和一致性。对生成的最终文本进行格式化和润色,确保最终文本的准确性和一致性具体包括:参考大纲内容组织文档内容、修正任何语法、拼写或标点错误、以及保持文本的风格和语气一致。
[0138] 本发明实施例2提供了一种基于大语言模型的文档撰写系统,旨在通过智能化的文本生成和交互式编辑功能,提高文档撰写的效率和质量,尤其是在处理复杂文档、自动化内容生成和实时用户反馈调整方面。
[0139] 本发明实施例2提供了一种基于大语言模型的文档撰写系统,能够显著提升文档的准确性和个性化,满足不同行业对高质量文档撰写的需求。
[0140] 实施例3
[0141] 本发明还提出了一种基于大语言模型的文档撰写设备,图4为本发明实施例4提供的一种基于大语言模型的文档撰写设备示意图,包括:
[0142] 存储器,用于存储计算机程序;
[0143] 处理器,用于执行所述计算机程序时实现方法步骤如下:
[0144] 在步骤S100中,接收文档主题和文档编写需求。
[0145] 在步骤S101中,利用大预言模型生成文档初始大纲。文档初始大纲包括各个标题、每个标题下内容对应的描述和每个标题对应的子标题。
[0146] 在步骤S102中,判断大纲是否满足一致性需求,如果满足,则执行步骤S105,否则执行步骤S103。
[0147] 在步骤S103中,进行联网搜索。
[0148] 在步骤S104中,迭代修改大纲。
[0149] 在步骤S105中,生成各子标题的内容。
[0150] 在步骤S106中,对于每个编写任务,系统根据将根据该部分大纲和概括性描述自动生成具体的联网检索问题。
[0151] 重新返回步骤S105,根据生成的问题查询浏览器网页并总结答案;对于每个问题得到一个问答对字典,最后将字典合并得到外部知识字典;循环进行各子标题的内容步骤,直到全文草稿撰写完成。
[0152] 在步骤S107中,对生成的最终文本进行格式化和润色,确保最终文本的准确性和一致性。
[0153] 在步骤S108中,文章完成。
[0154] 本发明实施例3提供了一种基于大语言模型的文档撰写设备,旨在通过智能化的文本生成和交互式编辑功能,提高文档撰写的效率和质量,尤其是在处理复杂文档、自动化内容生成和实时用户反馈调整方面。
[0155] 本发明实施例3提供了一种基于大语言模型的文档撰写设备,能够显著提升文档的准确性和个性化,满足不同行业对高质量文档撰写的需求。
[0156] 需要说明:本发明技术方案还提供了一种电子设备,包括:通信接口,能够与其它设备比如网络设备等进行信息交互;处理器,与通信接口连接,以实现与其它设备进行信息交互,用于运行计算机程序时,执行上述一个或多个技术方案提供的一种基于大语言模型的文档撰写方法,而所述计算机程序存储在存储器上。当然,实际应用时,电子设备中的各个组件通过总线系统耦合在一起。可理解,总线系统用于实现这些组件之间的连接通信。总线系统除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。本申请实施例中的存储器用于存储各种类型的数据以支持电子设备的操作。这些数据的示例包括:用于在电子设备上操作的任何计算机程序。可以理解,存储器可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read‑Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read‑Only Memory)、电可擦除可编程只读存储器(EEPROM,Electrically Erasable Programmable Read‑Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD‑ROM,Compact Disc Read‑Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random AccessMemory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,SynchronousDynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本申请实施例描述的存储器旨在包括但不限于这些和任意其它适合类型的存储器。上述本申请实施例揭示的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、DSP(Digital Signal Processing,即指能够实现数字信号处理技术的芯片),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器,处理器读取存储器中的程序,结合其硬件完成前述方法的步骤。处理器执行所述程序时实现本申请实施例的各个方法中的相应流程,为了简洁,在此不再赘述。
[0157] 本申请实施例2和3提供的一种基于大语言模型的文档撰写系统和设备中相关部分的说明可以参见本申请实施例1提供的一种基于大语言模型的文档撰写方法中对应部分的详细说明,在此不再赘述。
[0158] 需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。另外,本申请实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明,以免过多赘述。
[0159] 上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制。对于所属领域的技术人员来说,在上述说明的基础上还可以做出其它不同形式的修改或变形。这里无需也无法对所有的实施方式予以穷举。在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。