技术领域
[0001] 本发明涉及计算机视觉中的文字目标提取领域,尤其涉及一种高中英语阅读理解辅助学习方法及装置。
相关背景技术
[0002] 在英语学科中,阅读理解是十分重要的一部分,在考试中占据的比重尤其之高。想要完全理解、吃透一篇英语阅读理解,精读是十分具有必要的,大部分英语教师在进行授课时就会花费大把的时间为学生进行精度分析,便于学生理解。但是许多课外的优质阅读就无法得到教师的辅助,教师也对于每一位学生的其余文章精读分身乏术,因此辅助学习的这一个软件就显得十分重要,以应对广大学生群体的需求,在教师缺席的情况下扮演一个替代品的角色。
[0003] 当前市场中存在多种搜题、学习软件,如百度搜题、小袁搜题等,但是要么只能通过网上匹配提供答案,要么只能为用户提供数据库现存的阅读理解,无法对于现实中的纸质阅读理解进行机器辅助深入精读文章。在缺少老师讲解的情况下,学生只能选择抄袭答案或观看软件上不一定优质、不一定时新的文章,面对一篇好的纸质文章只能费时费力逐词搜索理解。而在这方面我们的英语阅读辅助学习软件存在于智能手机中,可以随时随地拍照进行机器辅助理解,在没有老师、没有同学的情况下迅速将一篇文章的精华和要点剖析。
具体实施方式
[0113] 本发明提供一种高中英语阅读理解辅助学习方法及装置,为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0114] 需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序,应该理解这样使用的数据在适当情况下可以互换。此外,术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0115] 实施例1:
[0116] 本申请实施例提供了一种高中英语阅读理解辅助学习方法,该方法的执行主体可以是智能终端,该智能终端可以是任意安装有学习类app的用户端设备,具体可以是智能手机、平板电脑和计算机。智能终端可以基于安装的学习类app辅助用户进行对高中英语学科阅读理解题目的学习。在执行上述处理的过程中,智能终端可以与学习类app的后台服务器进行通信,获取上述过程中所需的相关数据。当然,在另一可行的场景下,上述方法也可以由智能终端和学习类app的后台服务器协同完成,即智能终端可以用于与用户进行交互,并将交互相关数据传输至后台服务器进行处理,以及接收后台服务器发送的处理结果,后台服务器可以用于接收智能终端传输的交互相关数据,并基于预设数据处理逻辑,生成并反馈对应的处理结果。本实施例以执行主体为智能终端为例进行说明,智能终端和后台服务器的协同处理过程与之类似,本实施例不再赘述。
[0117] 下面将结合具体实施方式,对图1‑图2所示的处理流程进行详细的说明。如图1‑图2所示,本实施例所述的一种高中英语阅读理解辅助学习方法,具体包括如下步骤:
[0118] 步骤S1、询问用户的具体学习水平,获取用户输入的评估分数,根据所述评估分数对学习模式进行划分后,对不同难度的词句进行识别与解析。
[0119] 其中,所述难度模式包括“低”、“中”和“高”,其中,“低”对应四级单词,“中”对应六级单词,“高”对应雅思单词。
[0120] 可选的,步骤S1具体包括如下步骤:
[0121] 步骤S101、根据上传的阅读理解图片或文本,结合OCR识别技术,分割并提取文章主体和题目主体。
[0122] 可选的,步骤S101具体包括如下步骤:
[0123] 步骤S101a、对上传的阅读理解图片进行预处理,形成预处理后的阅读理解图片。
[0124] 其中,所述预处理包括对图像进行去噪、二值化、倾斜校正等操作,以提高识别率。
[0125] 步骤S101b、将预处理后的阅读理解图片输入神经网络模型,通过所述神经网络模型对图像中的字符进行分离,形成分离后的字符。
[0126] 步骤S101c、通过机器学习算法将分离后的字符进行转换,形成对阅读理解图片识别后得到的可编辑的文本。
[0127] 步骤S101d、根据对阅读理解图片识别后得到的可编辑的文本和上传的阅读理解文本,形成完整的文本内容。
[0128] 步骤S102、遍历文章中的英语单词,逐一与预先导入至数据库中的高中英语重点必考单词进行匹配,将匹配到的单词在文章中标红凸显,添加链接点击即打开窗口展示此单词的解析。
[0129] 步骤S103、遍历文章中的英语短语,逐一与预先导入至数据库中的高中英语重点必考短语进行匹配,将匹配到的短语在文章中标黄凸显,添加链接点击即打开窗口展示此短语的解析。
[0130] 步骤S104、遍历文章中的英语单词,根据用户选择的难度模式,分别与预先设置的不同的数据库进行匹配,将匹配到的单词在文章中标蓝凸显,添加链接点击即打开窗口展示此单词的解析;其中,数据库中预先导入有不同的数据库,分别存储四级、六级和雅思的单词,以对应不同的难度级别,当用户选择的难度模式为“低”时,程序查询四级数据库,当用户选择的难度模式为“中”时,程序查询六级数据库,当用户选择的难度模式为“高”时,程序查询雅思数据库。
[0131] 步骤S105、根据提取出的题目内容文本与文章的句子文本进行相似度匹配,将相似度最高的一到两个语句添加下划线凸显。
[0132] 可选的,步骤S105具体包括如下步骤:
[0133] 步骤S105a、通过jieba函数库对文本进行分词,得到每个文本的词汇列表。
[0134] 其中,所述每个文本的词汇列表包括该文本出现的次数、上下文等信息。
[0135] 步骤S105b、通过Word2Vec模型将每个词汇根据词汇列表中的值转换为向量。
[0136] 步骤S105c、对每个文本的词汇向量进行加权平均,形成每个文本的语义向量。
[0137] 步骤S105d、根据每个文本的语义向量,计算两个文本之间的语义相似度。
[0138] 其中,计算两个文本的语义向量之间的相似度,具体公式如下所示:
[0139]
[0140] 其中,similaritysemantic(texti,textj)表示文本texti和文本textj之间的语义相似度,vtexti表示文本texti的语义向量,||vtexti||×||vtextj||表示语义向量Vtexti和vtextj之间的内积,表示两个语义向量的内积。
[0141] 步骤S106、通过句号对文章中的所有语句进行分割,根据语法分析和字数匹配长难句,将其改为斜体凸显。
[0142] 可选的,通过基于最大间隔马尔可夫网络进行句法分析,具体包括如下步骤:
[0143] 步骤S106a、通过jieba函数库对输入的每个句子进行分词和词性标注。
[0144] 步骤S106b、从每个句子中提取和jieba函数库提供的当前词语、词性和依存关系数据,形成特征数据。
[0145] 步骤S106c、根据所述特征数据,构建图结构。
[0146] 其中,所述图结构包括节点和边;其中,节点表示句子中的每个词语,边表示词语之间的依存关系。
[0147] 步骤S106d、通过最大间隔马尔可夫模型计算每个依存关系的得分,并通过解码算法找到最优的依存树结构。
[0148] 其中,所述解码算法包括Viterbi算法,所述Viterbi算法的计算公式如下所示:
[0149] δt(i)=maxP(it=i,it‑1,…,i1,ot,…,o1|λ),i=1,2,…,N[0150] 其中,δt(i)表示t时刻到状态为i的所有结点最大概率值(即类似图结构中的从左到右最短路径),it表示最短路径,ot表示观测矩阵参数,ot为常数,λ表示概率矩阵参数,λ为常数。
[0151] 步骤S106e、将最优依存树结构转换成句法分析结果。
[0152] 其中,将最优依存树结构转换成句法分析结果,具体计算公式如下所示:
[0153]
[0154] 其中,Φ(x,y)表示与x相对应的句法树y的特征向量,w表示特征权重,G(x)表示x所属于的句法规则。
[0155] 步骤S2、进一步询问用户的学习兴趣,获取用户输入的学习兴趣特征词,将所述学习兴趣特征词通过接入ChatGPT的接口获取高质量的相关文章并对所述相关文章进行凸显处理。
[0156] 可选的,步骤S2具体包括如下步骤:
[0157] 步骤S201、获取学习兴趣特征词后,调用ChatGPT接口并向ChatGPT发送查询请求。
[0158] 其中,所述查询请求包括根据学习兴趣特征词形成的用于引导ChatGPT获取和所述学习兴趣特征词相关的高质量文章。
[0159] 步骤S202、ChatGPT在接收到所述查询请求后,对所述查询请求进行处理,得到与所述学习兴趣特征词相关的高质量文章并返回。
[0160] 步骤S203、通过接口获取通过ChatGPT得到的与所述学习兴趣特征词相关的高质量文章,对所述相关文章进行凸显处理。
[0161] 可选的,所述步骤S203,具体包括如下步骤:
[0162] 步骤S203a、遍历文章中的英语单词,逐一与预先导入至数据库中的高中英语重点必考单词进行匹配,将匹配到的单词在文章中标红凸显,添加链接点击即打开窗口展示此单词的解析。
[0163] 步骤S203b、遍历文章中的英语短语,逐一与预先导入至数据库中的高中英语重点必考短语进行匹配,将匹配到的短语在文章中标黄凸显,添加链接点击即打开窗口展示此短语的解析。
[0164] 步骤S203c、遍历文章中的英语单词,根据用户选择的难度模式,分别与预先设置的不同的数据库进行匹配,将匹配到的单词在文章中标蓝凸显,添加链接点击即打开窗口展示此单词的解析;其中,数据库中预先导入有不同的数据库,分别存储四级、六级和雅思的单词,以对应不同的难度级别,当用户选择的难度模式为“低”时,程序查询四级数据库,当用户选择的难度模式为“中”时,程序查询六级数据库,当用户选择的难度模式为“高”时,程序查询雅思数据库。
[0165] 步骤S3、对重要的词语和文章内容及其解析进行收藏。
[0166] 在实施例中,向用户提供收藏功能,以增强用户的学习与回顾体验。用户可以选择收藏必要的词语与文章,并在收藏夹中随时对收藏后的内容和解析进行查看。
[0167] 例如,当用户浏览过程中遇到需要特别关注的词语时,用户可直接点击该词语。随即,程序会在页面上方或指定位置跳出此词语的详细解析窗口。在解析窗口的右上角,设置有明显的五角星图标作为收藏按钮。用户点击此五角星图标后,该词语及其解析信息即被自动记录至专门的收藏词语数据库中,供后续查阅。
[0168] 类似的,用户要收藏文章时,用户点击文章标题或指定区域,程序会展示文章内容的完整窗口。在文章内容的右上角设有五角星收藏按钮。用户点击后,整篇文章及其相关信息即被记录至专门的收藏文章数据库中。
[0169] 为便于用户管理并查阅已收藏的内容,收藏夹被分为词语收藏夹与文章收藏夹两部分,以便用户区分查看。例如,在词语收藏夹中,可以以列表形式展示被收藏的词语本身,便于用户快速识别;在文章收藏夹中,则显示每篇文章的前5个单词作为预览,帮助用户快速回忆文章内容。用户如需查看某一词语或文章的完整信息,只需在收藏夹中点击对应项,程序会从相应的数据库中调用并展示收藏的内容。
[0170] 实施例2:
[0171] 基于相同的技术构思,本实施例还提供了一种高中英语阅读理解辅助学习装置,如图3所示,所述装置具体包括如下模块:
[0172] 语句识别与解析模块,用于获取评估分数,根据所述评估分数对学习模式进行划分后,对不同难度模式的词句进行识别与解析。
[0173] 其中,所述难度模式包括“低”、“中”和“高”,其中,“低”对应四级单词,“中”对应六级单词,“高”对应雅思单词。
[0174] 其中,语句识别与解析模块具体包括如下子模块:
[0175] 语句识别与解析第一子模块,用于根据上传的阅读理解图片或文本,结合OCR识别技术,分割并提取文章主体和题目主体。
[0176] 可选的,所述语句识别与解析第一子模块具体包括如下孙模块:
[0177] 第一处理孙模块,用于对上传的阅读理解图片进行预处理,形成预处理后的阅读理解图片。
[0178] 其中,所述预处理包括对图像进行去噪、二值化、倾斜校正等操作,以提高识别率。
[0179] 第二处理孙模块,用于将预处理后的阅读理解图片输入神经网络模型,通过所述神经网络模型对图像中的字符进行分离,形成分离后的字符。
[0180] 第三处理孙模块,用于通过机器学习算法将分离后的字符转换,形成对阅读理解图片识别后得到的可编辑的文本。
[0181] 第四处理孙模块,用于根据对阅读理解图片识别后得到的可编辑的文本和上传的阅读理解文本,形成完整的文本内容。
[0182] 语句识别与解析第二子模块,用于遍历文章中的英语单词,逐一与预先导入至数据库中的高中英语重点必考单词进行匹配,将匹配到的单词在文章中标红凸显,添加链接点击即打开窗口展示此单词的解析。
[0183] 语句识别与解析第三子模块,用于遍历文章中的英语短语,逐一与预先导入至数据库中的高中英语重点必考短语进行匹配,将匹配到的短语在文章中标黄凸显,添加链接点击即打开窗口展示此短语的解析。
[0184] 语句识别与解析第四子模块,用于获取四级单词、六级单词、雅思单词并分别导入不同的数据库中,遍历文章中的英语单词,根据用户选择的难度模式,分别与预先设置的不同的数据库进行匹配,将匹配到的单词在文章中标蓝凸显,添加链接点击即打开窗口展示此单词的解析;其中,数据库中预先导入有不同的数据库,分别存储四级、六级和雅思的单词,以对应不同的难度级别,当用户选择的难度模式为“低”时,程序查询四级数据库,当用户选择的难度模式为“中”时,程序查询六级数据库,当用户选择的难度模式为“高”时,程序查询雅思数据库。
[0185] 语句识别与解析第五子模块,用于根据提取出的题目内容文本与文章的句子文本进行相似度匹配,将相似度最高的一到两个语句添加下划线凸显。
[0186] 可选的,所述语句识别与解析第五子模块具体包括如下孙模块:
[0187] 第五处理孙模块,用于通过jieba函数库对文本进行分词,得到每个文本的词汇列表。
[0188] 其中,所述每个文本的词汇列表包括该文本出现的次数、上下文等信息。
[0189] 第六处理孙模块,用于通过Word2Vec模型将每个词汇根据词汇列表中的值转换为向量。
[0190] 第七处理孙模块,用于对每个文本的词汇向量进行加权平均,形成每个文本的语义向量。
[0191] 第八处理孙模块,用于根据每个文本的语义向量,计算两个文本之间的语义相似度。
[0192] 其中,计算两个文本的语义向量之间的相似度,具体公式如下所示:
[0193]
[0194] 其中,similaritysemantic(texti,textj)表示文本texti和文本textj之间的语义相似度,vtexti表示文本texti的语义向量,||vtexti||×||vtextj||表示语义向量Vtexti和vtextj之间的内积,表示两个语义向量的内积。
[0195] 语句识别与解析第六子模块,用于通过句号对文章中的所有语句进行分割,根据语法分析和字数匹配长难句,将其改为斜体凸显。
[0196] 可选的,所述语句识别与解析第六子模块具体包括如下孙模块:
[0197] 第九处理孙模块,用于通过jieba函数库对输入的每个句子进行分词和词性标注。
[0198] 第十处理孙模块,用于从每个句子中提取和jieba函数库提供的当前词语、词性和依存关系数据,形成特征数据。
[0199] 第十一处理孙模块,用于根据所述特征数据,构建图结构。
[0200] 优选地,第十一处理孙模块中,所述图结构包括节点和边;其中,节点表示句子中的每个词语,边表示词语之间的依存关系。
[0201] 第十二处理孙模块,用于通过最大间隔马尔可夫模型计算每个依存关系的得分,并通过解码算法找到最优的依存树结构。
[0202] 其中,所述解码算法包括Viterbi算法,所述Viterbi算法的计算公式如下所示:
[0203] δt(i)=max P(it=i,it‑1,…,i1,ot,…,o1|λ),i=1,2,…,N[0204] 其中,δt(i)表示t时刻到状态为i的所有结点最大概率值(即类似图结构中的从左到右最短路径),it表示最短路径,ot表示观测矩阵参数,ot为常数,λ表示概率矩阵参数,λ为常数。
[0205] 第十三处理孙模块,用于将最优依存树结构转换成句法分析结果。
[0206] 其中,将最优依存树结构转换成句法分析结果,具体计算公式如下所示:
[0207]
[0208] 其中,Φ(x,y)表示与x相对应的句法树y的特征向量,w表示特征权重,G(x)表示x所属于的句法规则。
[0209] 凸显处理模块,用于获取学习兴趣特征词,将所述学习兴趣特征词通过接入ChatGPT的接口获取高质量的相关文章并对所述相关文章进行凸显处理。
[0210] 可选的,所述凸显处理模块具体包括如下子模块:
[0211] 凸显处理第一子模块,用于获取学习兴趣特征词后,调用ChatGPT接口并向ChatGPT发送查询请求。
[0212] 其中,所述查询请求包括根据学习兴趣特征词形成的用于引导ChatGPT获取和所述学习兴趣特征词相关的高质量文章。
[0213] 凸显处理第二子模块,用于在ChatGPT接收到所述查询请求后,对所述查询请求进行处理,得到与所述学习兴趣特征词相关的高质量文章并返回。
[0214] 凸显处理第三子模块,用于通过接口获取通过ChatGPT得到的与所述学习兴趣特征词相关的高质量文章,对所述相关文章进行凸显处理。
[0215] 可选的,所述凸显处理第三子模块具体包括如下孙模块:
[0216] 凸显处理第一孙模块,用于获取高中英语重点必考单词并导入数据库中,遍历文章中的英语单词,逐一与数据库中的单词进行匹配,将匹配到的单词在文章中标红凸显,添加链接点击即打开窗口展示此单词的解析。
[0217] 凸显处理第二孙模块,用于获取高中英语重点必考短语并导入数据库中,遍历文章中的英语短语,逐一与数据库中的短语进行匹配,将匹配到的短语在文章中标黄凸显,添加链接点击即打开窗口展示此短语的解析。
[0218] 凸显处理第三孙模块,用于获取四级单词、六级单词、雅思单词并分别导入不同的数据库中,遍历文章中的英语单词,根据选择的难度模式,分别与不同的数据库进行匹配,将匹配到的单词在文章中标蓝凸显,添加链接点击即打开窗口展示此单词的解析。
[0219] 收藏处理模块,用于对重要的词语和文章内容及其解析进行收藏,可随时对所述收藏处理模块进行收藏处理后的内容和解析进行查看。
[0220] 本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本申请实施例1中所述的一种高中英语阅读理解辅助学习方法。
[0221] 本申请实施例还提供了一种电子设备,所述电子设备包括:存储器,存储有一计算机程序:处理器,与所述存储器通信相连,调用所述计算机程序时执行本申请实施例1中所述的一种高中英语阅读理解辅助学习方法。
[0222] 以上对本发明的具体实施例进行了详细描述,但其只是作为范例,本发明并不限制于以上描述的具体实施例。对于本领域技术人员而言,任何对本发明进行的等同修改和替代也都在本发明的范畴之中。因此,在不脱离本发明的精神和范围下所作的均等变换和修改,都应涵盖在本发明的范围内。