技术领域
[0001] 本发明涉及智能推荐答题技术领域,具体为基于考点数据分布式总结的智能推荐答题系统。
相关背景技术
[0002] 传统的教学方法通常遵循着统一的教育模式,所有学生无论其个别的兴趣、能力或学习进度都会接受相同的教学内容。在传统教室设置中,教师依靠教科书、标准化的课程大纲和集体授课来传授知识,学生们需要适应这一固定流程,课堂互动通常受限于大班授课的格式,个别学生得到的关注有限,很少有机会根据个人需要来调整学习路径。这种模式缺乏有效的个性化学习支持,学习效果很大程度上取决于学生自身的适应能力和学习动机。
[0003] 由于资源和注意力的有限,教师很难即时了解每个学生对每个考点的掌握程度,因此无法为每个学生都提供定制化的指导和学习材料。反馈循环通常是缓慢而且间接的,教师可能只能通过定期的考试和测试来评估学生的学习状况,而这些评估通常发生在学期中或学期末,对于需要即时帮助或调整的学生来说,干预措施可能为时已晚。
[0004] 此外,在传统的学习模式中,学习资源通常比较固定,缺乏根据学生实际掌握情况进行动态优化的能力。学生的弱点可能得不到及时的补强,而强项也难以得到适时的挑战和深化,在响应学生多样化需求以及促进学生潜力充分发挥方面存在明显短板,这对学生的学习体验和最终的学习成果均可能产生负面影响。
具体实施方式
[0018] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0019] 请参阅图1‑图3,本发明提供一种技术方案:基于考点数据分布式总结的智能推荐答题系统,包括个性考点分析模块100和智能推荐模块200。
[0020] 个性考点分析模块100中的数据采集与处理单元101设置用户交互界面,数据采集与处理单元101通过用户交互界面收集用户的学习数据,收集过程包括:用户登录系统时,建立一个会话,并通过cookies跟踪每个用户的学习活动,用于对用户的身份进行验证,其中cookies指的是一种存储在用户计算机上的文本文件,由网站发送给用户浏览器的,文件包含着一些用户的数据,比如用户的会话信息、偏好设置等,当用户访问同一个网站时,网站可以读取这些cookies,以便在多个页面之间保持用户的特定状态和信息;
为用户界面中的各种元素(如按钮、表单、链接等)绑定事件监听器,从而当用户与这些元素交互时能够记录相应的数据,在用户与界面交互时,例如点击、答题、页面访问、材料阅读时间等,前端编程代码捕获这些行为;
捕获的数据通过HTTP请求(如AJAX调用)被发送到后端服务器,请求包含有关用户所做选择的信息和用户在平台上的导航路径,在答题期间,后端监控并记录用户的学习数据。
[0021] 学习数据具体包括:答题正确性:正确答案的数量与错误答案的数量;特定考点和知识点的对错情况;
随时间答题正确率的变化趋势;用于显示用户的知识掌握程度,帮助确定用户掌握哪些具体知识点良好哪些需要改进,反映学习效果是否提高,是否掌握了以前的错误概念,例如,如果用户在代数题目上的正确率为90%,而在几何题目上的正确率仅为60%,用户在几何方面需要更多的辅导和练习的结论;
答题时间:完成整个测试所需的总时间;解答每个问题所花费的时间;用于评估用户的作答效率和时间管理能力,了解用户在不同类型的问题上花费的时间,揭示对某个问题领域的掌握程度,例如,用户在计算题上花费比平均用户花费更长的时间,表明用户需要提高数学计算技巧或掌握更高效的解题方法;
答题模式:用户选择题目的顺序(是否按照顺序作答,是否跳跃作答);在不同类型题目(选择题、问答题和计算题等)上的表现;用于体现用户的作答策略,反映出对某些题型或主题的自信程度,分析用户在不同题型上的表现,诊断用户的优劣势和偏好;例如,用户在开始答题后经常回到先前的题目修改答案,表明用户在自信度或答题策略上的不确定性;
学习进度:用户完成的学习单元和章节;学习材料的阅读时间;章节测试和单元测试的分数;用于显示用户在课程中的进度,判断用户是否跟上课程节奏,反映出用户投入学习的时间和参与度,和学习效果之间的相关性,整体评估用户在课程不同阶段的掌握程度;
历史表现:用户过去的考试和测验分数;学习平台上历史答题数据的累积分析;用于通过用户过去的表现来预测未来的表现,指导教师如何帮助用户提高;了解用户的长期学习模式和进步曲线;
习题难度与表现:用户在不同难度级别的习题上的表现;错误题目的难度级别;用于估用户的能力水平,根据难度匹配合适的学习资源,帮助定位用户在哪个难度级别开始遇到问题,从而为其设计合适难度的学习计划;
答题频率与习惯:用户登录学习系统并进行答题的频率;学习活动的时间分布(早晨、下午、晚上等);用于体现用户的学习活跃度及持续性,揭示用户的学习习惯,比如他们更倾向于何时学习。
[0022] 数据采集与处理单元101对收集到的数据进行预处理,包括数据清洗:移除无效或异常的数据,例如不完整的答题记录;数据转换:将某些非数值数据(如答题模式)转换为数值型数据,以使其能够被随机森林算法处理;缺失值处理:填补或删除含有缺失值的数据点;特征工程:创建新的特征,如从答题时间和正确性数据中计算的平均答题时间和正确率。
[0023] 个性考点分析单元102将利用随机森林算法对收集的数据进行各个考点的掌握程度的预测,具体包括:历史数据收集和处理:利用日志记录收集用户的历史数据,包括数据采集与处理单元101收集的数据和用户对考点的掌握程度的数据,并将用户对考点的掌握程度作为目标变量,其余数据作为模型的输入特征,将目标变量和输入特征作为数据集,并划分数据集为训练集和测试集,在训练集上训练随机森林模型,算法将在训练过程中建立多棵决策树,每棵树使用数据集中的不同子样本和特征进行训练;
随机森林模型构建:从给定的训练集中随机选择部分样本,针对每个子样本集,随机选择部分特征用于建立决策树,有助于增加模型的多样性,降低模型之间的相关性,从而提高整体性能;针对每个子样本集和随机选择的特征,建立一个决策树模型,在构建决策树的过程中,采用信息增益指标确定节点的划分方式,直到达到节点中的样本属于同一类别,训练完成;
随机森林模型预测:当所有的决策树都建立完成后,对数据采集与处理单元101发送的数据进行预测,对每棵决策树的预测结果进行求和平均,最终得到随机森林的整体预测结果。
[0024] 个性考点分析单元102将预测结果发送给智能推荐模块200中的结果分析单元201。
[0025] 智能推荐模块200中的结果分析单元201接收个性考点分析单元102发送的预测结果,预测结果包括各个考点的掌握程度得分,其中0到60分为低掌握程度、60到80分为中掌握程度、80到100分为高掌握程度。
[0026] 结果分析单元201根据各个考点的掌握程度确定对应的学习策略,具体包括:对于低掌握程度的考点,提供基础知识的详细复习材料;推荐简单易懂的教学视频来加深理解基本概念;分发基础级别的练习题,逐步增加难度,以巩固知识点;提供一对一的导师辅导或同伴互助学习的机会;开展互动式学习活动,例如游戏或模拟,以提高参与度和理解水平;
对于中掌握程度的考点,提供中级难度的练习题和案例分析,帮助用户理解知识的实际应用;推荐讲解具有分析性和问题解决技巧的教材或工具;利用小组讨论和项目工作来促进深入理解和同伴学习;引导用户通过项目或案例学习,将知识与现实世界的情境相联系;
对于高掌握程度的考点,鼓励探究学习,引入高级和创新的概念,扩展知识边界;
推荐高难度的实战和综合性问题,挑战和提升用户的分析能力;启用领导力和教学项目,鼓励用户指导较低掌握程度的同伴;推荐参加竞赛、研讨会或其他相关的外部活动以获取更多学习机会。
[0027] 结果分析单元201将对应的学习策略发送给匹配学习资源单元202,根据学习策略中的考点和对应难度的关键字来确定对应的学习资源,通过自然语言处理技术中的BETR模型处理文本输入,抽取出考点关键词,并根据用户掌握程度匹配相应的难度标签,形成搜索查询的参数,搜索查询利用数据库管理系统;根据查询参数,利用协同过滤在数据库中寻找匹配的学习资源;对学习资源进行排序,形成推荐列表;生成的推荐列表通过应用程序接口返回前端应用,并动态渲染至用户界面。
[0028] 例如,用户在“三角形内角和”这个考点的掌握程度是中等水平,智能推荐系统的匹配学习资源单元202会接收到这个请求,分析用户的掌握程度得分,并为该考点分配适当的难度级别标签;基于接收到的关键字和掌握程度,系统会构建查询参数,比如"三角形内角和"和"中等"难度;随后,推荐系统会连接到教育资源数据库,执行查询操作,例如使用SQL语句:
SELECT FROMresources_tableWHERETopicLIKE‘%三角形内角和%’ANDDifficulty=‘中等’。
[0029] 数据库将返回符合这一查询条件的学习资源,例如教学视频、练习题、模拟实验等,将整理后的推荐资源列表以清单形式返回给用户界面,用户可以直接点击资源链接开始学习。
[0030] 另外,匹配学习资源单元通过自然语言处理技术中的BETR模型处理文本输入,抽取出考点关键词,具体包括:对输入的学习材料文本进行预处理,包括但不限于文本的分词、去除停用词、词性标注、以及词干提取和词形还原,用于将文本归一化和简化;
利用BERT模型对文本进行语义分析,理解单词在不同上下文中的含义,在关键词抽取的上下文中,BERT模型利用语义相似度量,区分关键词和其他语言噪声,确定词汇对于学习材料的重要程度;
BERT模型的输出生成候选关键词列表,在此步骤中识别出那些携带文本主要信息的词汇,并生成一个由潜在关键词组成的列表,利用算法词频‑逆文档频率算法结合BERT模型的上下文感知特征为每个候选关键词分配一个重要性得分,并根据重要性得分决定最终的关键词。
[0031] 用户根据匹配学习资源单元202推荐的学习资源进行学习之后,数据采集与处理单元101将再次采集用户对学习资源进行学习的学习数据,并进行再次的学习数据分析和学习资源的推荐,形成一个循环,以此不断贴近用户的个性化需求,提高用户学习效率。
[0032] 以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。