技术领域
[0001] 本发明涉及人工智能技术领域,具体涉及一种基于情感大语言模型的学生早期表现预测方法。
相关背景技术
[0002] 在当今的信息时代,人工智能技术,尤其是大语言模型(Large Language Models, LLMs)技术,已经在多个领域取得了显著进展,并被广泛应用于自然语言处理、文本生成、情感分析等任务。然而,尽管大语言模型在通用任务中的表现优异,其在教育领域的应用仍然面临一系列挑战。尤其在智慧教育场景下,对学生学业表现的早期预测是一项复杂且关键的任务,现有的大语言模型技术在这一应用场景中仍存在诸多不足。
[0003] 首先,在教育领域,学生的学业表现受到众多因素的影响,其中不仅包括学术成绩等结构化数据,还涉及情感状态、学习互动等非结构化数据。然而,传统的大语言模型在处理这些多维度信息时,往往缺乏对情感因素的深入理解与准确提取。学生在学习过程中的情感状态,如焦虑、失望或积极情绪,往往对其学业表现有显著影响,但现有的模型在捕捉这些情感特征时,通常只能提供简单的情感分类,难以提供细粒度的情感状态分析,进而影响模型对学生表现的预测准确性。
[0004] 其次,现有的大语言模型多集中于对文本数据的处理,虽然能够处理一定的教育场景中的结构化数据(如成绩、出勤率等),但在学生学习行为和情感状态的综合分析上仍显得力不从心。例如,学生在学习平台上的互动文本,如论坛发言、作业反馈等,往往包含了丰富的情感信息和学习态度,这些数据对学生表现的预测至关重要。然而,现有模型在整合这类非结构化数据时,缺乏有效的机制来提取和利用这些信息,导致预测模型的性能不尽如人意。
[0005] 此外,尽管大语言模型在语义理解和生成方面表现出色,但在教育场景中的个性化支持和预测能力仍有待提升。教育场景下的预测任务需要模型能够综合考虑学生的结构化学习数据和非结构化的情感与行为特征,现有模型通常无法充分融合这两类数据,导致预测结果的精准度和实用性较低。而教师和教育管理者在实际教学中,亟需一种能够全面分析学生学业表现、情感状态以及学习行为的智能化工具,以便及时发现潜在问题,提供个性化的干预和支持。
[0006] 基于上述背景,本发明提出了一种智慧教育场景下基于情感大语言模型的学生早期表现预测方法,以解决现有技术中的不足。通过引入情感大语言模型(EmoLLM),本方法能够从学生的非结构化互动数据中提取细粒度的情感特征,并结合学生的结构化学习数据,形成多维特征融合,从而实现对学生学业表现的精准预测。此外,本发明采用多层感知机(MLP)对结构化数据进行特征提取,结合情感特征向量,通过多分类器模型进行预测,确保预测的准确性和稳定性。本发明能够帮助教师及早识别学业表现欠佳的学生,提供个性化的学习支持,提升智慧教育中的教学效果。
具体实施方式
[0024] 下面结合附图对本发明的一种优选实施方式作详细的说明。
[0025] 如图1所示,本发明中的一种基于情感大语言模型的学生早期表现预测方法,包括以下步骤:S1,构建学生数据;
S2,对所构建的学生数据进行预处理;
S3,使用情感大语言模型进行情感特征提取;
S4,使用多层感知机对结构化特征进行提取;
S5,将结构化特征与情感特征进行融合;
S6,将融合特征通过多分类器模型进行预测。
[0026] 下面分别对上述步骤进行详细说明。
[0027] 步骤S1,构建学生数据:在优选的实施例中,本发明从存储在CSV文件的数据源中提取与学生学业表现相关的结构化数据。结构化数据包括但不限于学生的个人属性数据(如年龄、性别、年级)以及学习行为数据(如各学科成绩、作业提交时间、累计学习时长等)。这些数据通过标准化的格式进行记录,能够确保数据的完整性和准确性,为后续的数据处理和模型训练奠定基础。
[0028] 此外,本发明进一步获取学生在学习平台上生成的非结构化数据,这些数据包括但不限于论坛发言记录、答疑互动和作业反馈等。这些非结构化数据反映了学生在学习过程中的情感状态及交流互动情况。通过情感大语言模型对这些非结构化数据进行情感分析,提取出情感特征,以作为学生学业表现预测模型的额外输入信息。
[0029] 该步骤为学生学业表现预测模型提供了全面的数据基础,涵盖了学生的行为和情感两个维度。假设学生数据集 包含 个学生,每个学生的结构化数据表示为 ,其中 是结构化数据中的特征数量,特征包括年龄、性别、年级、各学科成绩、作业完成率、作业提交时间、累计学习时长、出勤记录等;以上结构化数据的特征仅为举例,可以根据需要和实际情况进行增减。
[0030] 结构化数据集 ,其中,第i个学生的结 构化数据, 是结构化数据 中的第m个特征。
[0031] 个学生的非结构化数据集 表示为一组互动文本序列: ,为第i个学生在学习平台上的互动文本。
[0032] 步骤2,对所构建的学生数据进行预处理:首先,对结构化数据进行系统性清理,处理结构化数据中的缺失值(如各学科成绩缺失、出勤记录缺失等),通过插值法或均值填充确保数据的完整性。同时,对于不合理数据(如负数成绩或异常高分记录等),采取清理操作,确保数据逻辑合理且符合规范。在预处理过程中,本发明还通过特征重要性分析,筛选出与学生学业表现显著相关的关键特征(如出勤记录、作业完成率和各学科成绩等),以减少冗余特征,提高模型的训练效率。对数值型的特征数据进行标准化处理(如转换为均值为0、标准差为1的分布)或归一化处理(如将数据缩放至特定范围内),保证不同特征的尺度一致,增强模型对数据的适应性。
[0033] 对于非结构化数据中的互动文本,本发明通过去除停用词、标点符号和特殊字符等方式进行初步预处理,以减少噪声信息,确保情感大语言模型能够更准确地提取情感特征向量。
[0034] 步骤3,使用情感大语言模型进行情感特征提取:本发明将预处理后的非结构化数据输入情感大语言模型EmoLLM,进行情感特征提取。情感大语言模型能够对每条互动文本进行情感分类,生成积极、消极或中立的情感标签,并将其作为表现预测模型的重要输入特征之一,反映学生的情感状态。此外,情感大语言模型还能够生成情感强度得分,量化情感的具体表现,如焦虑、愤怒、失望等情感的强度。
这些情感强度得分作为多维情感特征的输入,为表现预测模型提供了细粒度的情感表示,帮助表现预测模型全面捕捉学生情感变化的动态。更进一步地,情感大语言模型将每条交互文本的情感状态映射为一个高维的情感特征向量,包含丰富的情感信息,表示复杂的情感关系结构。该嵌入向量将作为输入特征,为表现预测模型提供了额外的情感维度支持。
[0035] 情感特征包括情感标签(积极、消极、中立等)及其对应的情感强度分数,从而获得更为全面的学生情感状态。
[0036] 步骤4,使用多层感知机对结构化特征进行提取:本发明将结构化数据特征输入多层感知机(MLP)网络,逐层提取关键特征。多层感知机通过全连接神经网络对结构化数据进行非线性映射,逐步提取出与学生表现相关的深层次特征。在各隐藏层之间引入激活函数(如ReLU),增强多层感知机对结构化数据的非线性表达能力,确保表现预测模型在多层映射的过程中能够捕捉到学生个人属性与学业表现之间的潜在关系。多层感知机的输出是一组向量化的结构化特征,这些结构化特征反映了学生的学习行为概况,并为后续的特征融合过程搭建了基础。
[0037] 将标准化的结构化数据 输入至多层感知机进行非线性映射的过程如下:;
;
其中, 表示神经网络第 l 层对第 i 个学生的结构化数据的输出,即神经网络第 l 层的激活值, 表示从神经网络第 l 层到第 l+1 层的权重矩阵, 表示从神经网络第 l 层到第 l+1 层的偏置项,表示神经网络的总层数。
[0038] 将最终隐藏层输出作为结构化特征向量 :;
其中,表示第i个学生对应的结构化特征。
[0039] 步骤5,将结构化特征与情感特征进行融合:在该步骤中,本发明将结构化特征和情感特征输入融合层。融合层可以采用注意力机制,将两类特征进行交互融合,通过自适应地加权不同特征的贡献,注意力机制进一步增强了特征组合的表达效果。
[0040] ;其中, 为第i个学生对应的情感特征,和 为相关权重参数, 表示第i个学生对应的融合特征。
[0041] 最终得到融合特征矩阵: 。表示融合特征的维度。
[0042] 融合层通过对结构化特征与情感特征的进一步组合,生成最终的融合特征。此融合特征不仅包含了学生的结构化属性信息,还融合了情感维度的表达,使得表现预测模型能够综合分析学生的多维特征信息,从而提高预测的准确性。
[0043] 步骤6,将融合特征通过多分类器模型进行预测:在优选的实施例中,本发明提出了一种由支持向量机(SVM)分类器、K近邻(KNN)分类器和随机森林(RF)分类器组成的多分类器模型,即表现预测模型。每个分类器具有独特的决策机制,能够从不同角度进行学生学业表现的分类预测。通过Bagging方法来组合支持向量机分类器、K近邻分类器和随机森林分类器,该方法在每个分类器独立预测的基础上,采取投票的方式汇总各分类器的预测结果,以增强表现预测模型的稳健性和预测的准确性。最终,表现预测模型输出学生的学业表现分类预测结果。该结果可用于为学生提供个性化的学习支持,帮助教师及早识别表现欠佳的学生,进而采取针对性的干预措施,提高学生的学业表现。
[0044] 将融合特征输入到多个分类器(SVM、KNN、RF)组成的多分类器模型中:;
表示第j个分类器, 表示第i个学生对应的融合特征经过第j个分
类器后得到的学业表现分类预测结果;在优选的实施例中,共有三个分类器, 。
[0045] 使用贝叶斯平均法汇总分类结果:
[0046] 其中, 为表示第j个分类器的不确定性, 表示第i个学生最终的学业表现分类预测结果。
[0047] N个学生的学业表现分类预测结果的集合 。
[0048] 在优选的实施例中,本发明可以用于预测第i个学生能否通过最终的考试,若能够通过则 ,若不能通过则 。
[0049] 系统定期对知识库进行更新,以确保所用数据的准确性和时效性。随着情感大语言模型对学生互动数据的处理能力逐步增强,系统能够动态调整对学生表现的预测结果,并通过个性化反馈帮助教师及时掌握学生的学情动态。
[0050] Bagging 是 Bootstrap Aggregating 的缩写,是一种强大的集成学习方法,它结合了多个基本分类器,以提高预测准确性和鲁棒性。本实施例中提出的多分类器模型由三个基本分类器组成:支持向量机、K近邻和随机森林。集成学习方法使本发明能够利用这些分类器的多样性,并利用它们独特的决策能力来进行更全面的分类。下面本发明将简要概述集成中使用的基本分类器。
[0051] 支持向量机(Support Vector Machine,SVM) 是一种功能强大且广泛使用的分类器,适用于二元分类和多类分类任务。它寻求找到一个最佳超平面,最大限度地分离特征空间中的不同类,从而使其能够非常有效地捕获复杂的决策边界。
[0052] K近邻(K‑nearest neighbors,KNN)是一种非参数且基于实例的分类器。它通过考虑特征空间中 k 个最近邻的类标签来对实例进行分类。K近邻直观、易于实现,非常适合多类分类任务。
[0053] 随机森林是一种基于决策树的集成学习方法。它在训练过程中构建多个决策树,并通过投票结合它们的预测来得出最终的分类。随机森林非常强大,可以处理大型数据集,并有效地处理噪声数据。
[0054] 贝叶斯平均是一种集成学习技术,用于以原则和概率的方式组合多个模型的预测。与传统的平均方法不同,贝叶斯平均考虑了模型的预测及其不确定性。它根据每个模型的性能和可靠性为每个模型的预测分配权重,从而实现更加稳健和准确的整体预测。整体预测是通过计算各个模型预测的加权平均值获得的。贝叶斯平均方法不仅提高了集成的整体准确性,而且还为最终预测提供了不确定性的度量。在预测可靠性至关重要的情况下,这种不确定性估计非常有价值。
[0055] 本发明利用情感大语言模型EmoLLM提取非结构化的情感特征,结合结构化的个人属性数据和学习行为数据,经过特征融合和多分类器模型的多层分析,对学生的早期表现进行精准预测。
[0056] 本发明提供了一种有效的学生学业表现预测解决方案,具有高准确性和多维度特征支持,为智慧教育场景下的学生个性化支持和学业表现提升提供了重要依据。具有以下优势:1)情感理解更深入:情感大语言模型可以捕捉复杂的情感信息,生成高维的情感特征向量,提供比简单情感标签和强度更丰富的情感表示。
[0057] 2)简化建模过程:情感大语言模型提取出的情感特征可以直接作为模型输入,不需要额外的时间序列建模,简化了模型结构。
[0058] 3)高效的特征融合:通过融合结构化数据与情感特征,模型可以同时捕捉学生的学习行为和情感变化,从而更准确地预测是否退课或能否通过考试。
[0059] 这种基于情感大语言模型的情感分析方法能够为预测学生学习行为的模型提供更强的情感理解能力,提高了模型的准确性和实用性。
[0060] 对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内,不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
[0061] 此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立技术方案,说明书的这种叙述方式仅仅是为了清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。