技术领域
[0001] 本发明涉及计算机技术领域,具体涉及一种天气图特征类型识别及相似度匹配系统和方法。
相关背景技术
[0002] 对于大气环境监测是一项艰巨和繁复的工作,需要全天候24小时不断的密切监测。现有的自动化监测站由于其自动化程度不高,往往还需要人工的监视,只能在一段较短的时间内根据采集的图像进行检测识别天气类型,如遇到意外情况,如遇到坏天气或图像数据较多等问题,都无法自行应对,需要人工处理。导致无法进行无完全自动化连续监测。
[0003] 针对大气环境行业现状,如何运用了大数据和人工智能技术进行图像识别天气类型,同时匹配到当时的历史案例,以达到调用历史案例并调整参数来进行污染防治是急需解决的问题。
具体实施方式
[0067] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0068] 在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
[0069] 下面将结合本发明示例性实施例中的附图,对本发明示例性实施例中的技术方案进行清楚、完整地描述,显然,所描述的示例性实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0070] 针对大气环境行业现状,如何运用了大数据和人工智能技术进行图像识别天气类型,同时匹配到当时的历史案例,以达到调用历史案例并调整参数来进行污染防治是急需解决的问题。。
[0071] 为解决上述问题,本发明实施例提供的一种适用于专门针对天气图天气类型识别和相似度匹配系统和方法,方便大气相关系统快速准确的对天气图天气类型进行识别和匹配,获取对应的天气图天气类型信息及匹配度得分,供大气污染防治减排措施参考;此通用组件可供相关业务系统灵活调用,大大减轻人为参于天气图识别带来的繁重工作。
[0072] 以下结合附图并通过具体实施方式来进一步说明本发明的技术方案。
[0073] 参阅图1所示,图1为本发明提供的一种天气图特征类型识别及相似度匹配系统的总体框架示意图。本发明的一个实施例提供了一种天气图特征类型识别及相似度匹配系统,主要包括微服务模块、以及与所述微服务模块的接口单独连接的天气图上传模块、天气图识别模块、相似度匹配模块和结果显示模块。
[0074] 在本实施例中,所述天气图上传模块用于上传导入的当前天气图和历史天气图。所述天气图识别模块用于对上传的当前天气图进行类型识别,获得天气图对应的天气类型识别结果。所述相似度匹配模块用于对识别后的当前天气图与历史天气图进行相似度匹配,获取匹配后的最优解天气图。所述结果显示模块用于输出天气图天气类型识别结果和历史匹配相似度最高的最优解天气图。
[0075] 本发明实施例的天气图特征类型识别及相似度匹配系统方便大气相关系统快速准确的对天气图天气类型进行识别和匹配,获取对应的天气图天气类型信息及匹配度得分,供大气污染防治减排措施参考;本发明可供相关业务系统灵活调用,大大减轻人为参于天气图识别带来的繁重工作。
[0076] 其中,所述微服务模块通过接口与所述天气图上传模块、天气图识别模块、相似度匹配模块以及结果显示模块单独连接。本发明实施例的天气图特征类型识别及相似度匹配系统运用微服务模块的架构管理相关接口,与微服务模块每个接口连接的模块独立存在,可以单独部署,不用每次发布某个功能都经历一次全服务发布;遵循单一功能原则,微服务模块接口连接的模块之间可以通过RESTFUL或者RPC调用,功能解藕;“细粒度”的高可扩展性,每个接口连接的模块都可以单独扩展,单独负载均衡;微服务可供相关业务系统灵活的调用,来来满足业务系统功能需求。
[0077] 所述天气图特征类型识别及相似度匹配系统还通过微服务模块连接大气预报预警系统,所述大气预报预警系统包括大气污染防治模块以及案例库;所述大气污染防治模块用于接收微服务模块上传的当前污染天气图,对当前污染天气图识别处理后返回当前天气类型至微服务模块,所述案例库用于将案例中对应的天气图上传至微服务模块,微服务模块进行相似度匹配后,返回相似度最高天气图至大气污染防治模块,由大气污染防治模块将成果数据形成典型案例生成大数据案例库。
[0078] 参见图1所示,在进行天气图特征类型识别及相似度匹配时,首先把当前天气图和历史天气图导入到天气图特征类型识别及相似度匹配系统的天气图上传模块中,然后在天气图识别模块中对天气图进行天气类型识别,识别后的当前天气图与历史天气图进行相似度匹配,最后获取匹配后的最优解;相关操作接口由微服务模块统一管理,该微服务可供其他业务系统调用。
[0079] 在本实施例中,大气预报预警系统可直接调用模块部署的微服务模块的接口,用于大气污染防治模块业务逻辑处理;成果数据可形成典型案例生成大数据案例库。
[0080] 本发明实施例中,天气图特征类型识别及相似度匹配系统的功能模块参见图2所示,所述功能模块包括天气图上传模块、天气图识别模块、相似度匹配模块和结果显示模块,分别用于天气图上传、天气图识别、相似度匹配以及结果显示。天气图上传模块负责对当前天气图和历史天气图进行上传;天气图识别模块负责对500hpa和surface_pres两种不同压力的天气图片进行识别,500hpa可识别出偏西气流、高空脊和副高天气,surface_pres可识别出高压、均压和台风天气;相似度匹配模块负责从历史天气图中匹配出和当前天气天气图最相似的图片;结果显示模块可以返回天气图天气类型识别结果和历史匹配最相似天气图。
[0081] 在本发明的一个实施例中,所述天气图上传模块包括天气图上传界面,天气图上传界面主要由三个按钮组成:上传历史天气图、上传当前天气图以及开始匹配。
[0082] 参见图3所示,上传历史天气图按钮用于上传历史天气图集(包括500hpa和surface_pres两种类型图片),用于匹配出与当前天气图最相似的图片。上传当前天气图按钮用于上传当前天气天气图(包括500hpa和surface_pres两种类型图片)。开始匹配按钮用于点击开始匹配按钮,首先解压历史污染事件天气图压缩文件和当前污染事件天气图压缩文件;然后对解压后的天气图进行识别,识别出相应的天气类型;最后对识别后的当前天气和历史事件天气图进行相似度匹配,找到最相似天气图。
[0083] 在本发明的一个实施例中,所述天气图识别模块用于天气图识别,天气图识别部分主要实现对解压后的天气图进行识别,识别出相应的天气类型。天气图识别模块的智能识别界面显示结果参见图4所示,优选地,本发明实施例中,用于识别的天气类型包括偏西气流、高空脊、副高、高压、均压和台风天气。
[0084] 在本发明的一个实施例中,相似度匹配模块用于匹配当前天气类型天气图和历史天气图中最相似的一张图片;匹配规则主要从图片天气类型、图片视觉相似度、气压大小及分布、温度大小及分布、风向及分布和降雨量大小及分布来判断图片整体相似度。
[0085] 在本发明的一个实施例中,结果显示模块的显示结果主界面主要由当前天气图展现界面、历史天气图展现界面和历史天气图开关按钮组成。参见图5所示,当前天气图展现界面区域用于展示当前天气图天气类型识别结果,所述当前天气图展现界面的左边为500hpa部分,所述当前天气图展现界面的右边为surface_pres部分;所述当前天气图展现界面中的图片上方显示天气类型识别结果,当前天气图识别结果。
[0086] 参见图6和图7所示,历史天气图展现界面区域用于展示历史天气图天气类型识别结果,所述历史天气图展现界面的左边为500hpa部分,所述历史天气图展现界面的右边为surface_pres部分;所述历史天气图展现界面中图片上方显示天气类型识别结果和排名得分,显示结果由得分从高到低进行排序。
[0087] 参见图8所示,所述天气图特征类型识别及相似度匹配系统还包括模型训练模块、AI模块以及数据存储服务模块。
[0088] 所述模型训练模块用于将气象图片像本输入TensorFlow模型进行训练生成气象模型,使用TensorFlow气象模型识别气象图片中的天气类型。
[0089] 所述AI模块包括:
[0090] 图像处理及计算机视觉处理单元,所述图像处理及计算机视觉处理单元采用OpenCv算法对天气图象进行处理;以及
[0091] 光学字符识别单元,所述光学字符识别单元为基于Tesseract的OCR图片识别,用于识别多种格式的图像文件并将其转换成文本。
[0092] 所述数据存储服务模块用于对天气图片进行存储管理。
[0093] 在本实施例中,模型训练模块使用的TensorFlow框架基于SSD算法训练模型。由于目标检测是AI的一项重要应用,通过目标检测模型能在图像中把人、动物、汽车、飞机等目标物体检测出来,甚至还能将物体的轮廓描绘出来,就像下面这组图,把台风作为目标检测对象识别出来。
[0094] 在本实施例中,基于SSD(Single Shot MultiBox Detector,单镜头多盒检测器)算法训练生成数据训练目标检测模型,可以用于识别图像中的台风等。其中,基于SSD算法训练目标检测模型的方法,包括:安装标注工具、标注数据、配置SSD、下载预训练模型、训练模型以及使用模型。
[0095] 其中,安装标注工具时,使用样本数据来训练模型,首先进行数据标注,标注图像中的物体、物体所在位置信息作为样本数据用于训练模型;标注数据后配置SSD参数,然后下载预训练模型,SSD‑Tensorflow提供了预训练好的模型,基于VGG模型,进行训练模型,根据标注文件以及SSD模型进行训练,并且所在batch_size值,值越大表示批量处理的数量越大,对机器性能的要求越高,其中,学习率learning_rate根据实际情况调整,学习率越小则越精确,训练的时间也越长,学习率越大则可缩短训练时间,降低精准度。SSD模型训练完成后,通过模型执行识别目标,通过以上步骤,使用样本数据完成目标检测模型的训练。
[0096] 在本发明实施例中,使用OpenCv算法对图象进行处理时,OpenCv算法提供了一套智能算法对图像进行处理,如图像相似度、轮廓检测、方向检测、直线检测等算法对图片进行处理。其中:
[0097] 图像相似度时,OpenCv算法提供了5种图像相似度算法,分别为哈希算法、差值哈希算法、感知哈希算法、三直方图和单通道直方图,所述哈希算法、差值哈希算法和感知哈希算法都是值越小,相似度越高,取值为0‑64,即汉明距离中,64位的hash值有多少不同。三直方图和单通道直方图的值为0‑1,值越大,相似度越高。
[0098] 轮廓检测时,OpenCV算法针对二值图像进行二值化,所以轮廓检测包含如下步骤:载入图像、灰度化、二值化、轮廓检测。
[0099] 方向检测时,分别获得每个工件的轮廓;处理每个轮廓,采用pca(主成分分析)方法,获得所有轮廓点的集合的中点,主要方向等信息;绘图并返回结果。
[0100] 线条检测时:霍夫变换(Hough Transform)霍夫变换是图像处理中从图像中识别几何形状的基本方法之一,应用很广泛,也有很多改进算法。主要用来从图像中分离出具有某种相同特征的几何形状(如,直线、曲线、线条、圆等)。最基本的霍夫变换是从黑白图像中检测线条(曲线)。
[0101] 在本发明的实施例中,基于Tesseract的OCR图片识别时,Tesseract是一款由HP实验室开发Google维护的开源OCR(Optical CharacterRecognition,光学字符识别)引擎,特点是开源、免费、支持多语言、多平台,可以识别多种格式的图像文件并将其转换成文本。
[0102] 在本发明的实施例中,500hp天气图识别时,500hpa可识别出偏西气流、高空脊和副高天气。其中,识别偏西气流时,参见图9所示,例如经过浙江的的风向从图片最左边开始自西向东,等温线、等压线和风向平行,整体趋势是水平的。参见图9所示,提取自西向东经过浙江的风标,参见图10所示,利用OpenCv方向检测算法计算出每个风标的风向,参见图11所示,最后根据每个风标的风向,综合评估该天气了图是否属于偏西气流天气。
[0103] 识别高空脊时,参见图12所示,风向自西北向东南,等温线、等压线和风向平行;离浙江最近的等压线开口向下,开口朝向角度大于180°小于360°。参见图12所示,提取等压线,参见图13所示,利用OpenCv直线检测算法计算出每个等压线的方向,参见图14所示,最后根据每个等压线向,综合评估天气图是否属于高空脊天气。
[0104] 识别副高天气时,参见图15所示,例如浙江范围内500hPa等压线大于等于588。识别方法是提取天气图中的等压线数值,基于Tesseract的OCR字符识别技术,识别出压力值,最后压力值及分布信息,综合评估该天气了图是否属于副高天气。
[0105] 在发明实施例中,surface_pres天气图识图时,surface_pres可识别出高压、均压和台风天气。识别台风天气时,参见图16所示,一般在台风内有降雨出现;风箭头比较长,从箭头的方向看,围绕着等值线,呈逆时针分布;线条数量密集、紧凑,中心值最小,向外逐渐增大;例如,台风中心在安徽以东,山东以南,剔除日本。
[0106] 识别台风天气的方法为:参见图17所示,由于台风特征明显,可用目标检测技术进行识别;使用TensorFlow框架基于SSD算法训练模型对台风进行检测,最后根据识别结果和台风位置信息,综合评估该天气图是否属于浙江影响范围内台风天气。
[0107] 识别高压时,参见图18所示,例如浙江处在高压中心(等压线值大于1012且依次递增)或浙江附近有高压中心。则识别高压的方法是:提取等压线值,基于Tesseract的OCR字符识别技术,识别出压力值,最后根据每个等压线向,综合评估该天气了图是否属于高空脊天气。
[0108] 识别均压时,参见图19所示,例如浙江附近等压线稀疏,没有或者只有一根等压线。提取浙江范围内压力线,利用OpenCv轮廓检测算法计算出轮廓数量及分布,最后根据浙江范围内轮廓数据,综合评估该天气了图是否属于均压天气。
[0109] 在本发明实施例中,在进行相似度智能匹配时,参见图20所示,首先判断对比的两张图是否是相同的天气类型,然后使用过Opencv相似度算法匹配图片相似度,进行偏西气流、高空脊、副高、高压、均压以及台风进行打分,再分别按不同天气图的规则进行打分。不同天气图的规则分别为:
[0110] 偏西气流:自西向东风标风向个数。
[0111] 高空脊:开口朝向角度大于180°小于360°。
[0112] 副高:浙江附近500hPa等压线大于584。
[0113] 高压:高压中心位置。
[0114] 均压:浙江范围内等压线个数。
[0115] 台风:台风相似度、台风强度、台风位置。
[0116] 最后,按得分排名获取最高分作为匹配度最高的图片。
[0117] 因此,本发明实施例的天气图特征类型识别及相似度匹配系统,运用微服务架构管理相关接口,该微服务可以独立部署并运行,可供相关业务系统灵活调用,使用TensorFlow在历史天气图数据集上训练深度学习模型,该模型可以识别出未来天气图天气类型(如台风天气),使用OpenCv提供的AI智能算法对天气图进行图像处理,获取天气图重要参数信息(如风向、等温等压线、降雨量),使用开源框架Tesseract做光学字符识别(OCR),可以识别出天气图温度数值、气压数值。
[0118] 而且,在本实施例的天气图特征类型识别及相似度匹配系统中,相关服务接口分别发布成图片上传服务、天气识别服务、智能匹配服务、获取结果服务四个微服务,微服务可供大气系统调用;每个微服务独立存在,可以单独部署,单独扩展,单独负载均衡,调用方便。
[0119] 本发明实施例的系统可以识别出偏西气流、高空脊、副高、高压、均压和台风天气等。
[0120] 在本发明提供的优选实施方式中,一种天气图特征类型识别及相似度匹配方法,包括以下步骤:
[0121] 步骤一、获取上传的天气图片数据集,所述天气图片数据集包括当前天气图数据集和历史天气图数据集;
[0122] 步骤二、遍历所述天气图片数据集中所有图片,对所述天气图片数据集中图片进行分类处理,分类处理后的不同类别图片单独处理,获得天气图对应的天气类型识别结果;
[0123] 步骤三、遍历历史天气图数据集,对当前天气天气图进行相似度匹配,获得与当前天气天气图匹配的历史匹配相似度最高的最优解天气图;
[0124] 步骤四、输出天气图天气类型识别结果和历史匹配相似度最高的最优解天气图。
[0125] 在本实施例中,所述获取上传的天气图片数据集之前,还包括:
[0126] 获取天气图片上传请求;
[0127] 响应所述天气图片上传请求,并接收当前天气图和历史天气图的数据压缩文件;
[0128] 对上传的当前天气图和历史天气图数据中的历史污染事件天气图压缩文件和当前污染事件天气图压缩文件解压;
[0129] 解压后的天气图通过Gateway网关分发匹配路由到相应的图像识识别服务模块进行识别处理,识别出相应的天气类型。
[0130] 其中,对所述天气图片数据集中图片进行分类处理时,还包括:判断所述天气图片数据集中天气图片的类型;所述天气图片的类型包括500hpa和surface_pres两种类型,分类处理后的天气图片复制到对应类型的文件夹找那个,并分别进行不同颜色提取,获得新图片。
[0131] 500hpa类型的新图片通过OpenCv训练模型处理提取出新图片中的特征信息,所述特征信息包括新图片中的曲线角度轮廓、风向角度、气压大小和相似度中的一种或多种;surface_pres类型的新图片通过预训练的TensorFlow天气模型识别出台风类型。
[0132] 在本发明提供的一个实施例中,参见图21所示,提供了一种天气图特征类型识别及相似度匹配方法,包括以下步骤:
[0133] 获取前端天气图片上传请求,通过Gateway网关分发匹配路由信息到相应的图像识别服务模块进行处理;
[0134] 所述天气图片分类为500hpa和surface_pres单独处理,提取各个分类天气图片中颜色生成新的图片;
[0135] 500hpa图片通过OpenCv算法处理提取出图片中的曲线角度轮廓、风向角度、气压大小以及相似度信息保存到特征文本数据;surface_pres图片经TensorFlow气象模型识别出台风类型保存到类型文本数据;
[0136] 获取500hpa和surface_pres两类图片的文本数据判断图片类型,通过数据计算出得分并排序,将最终结果返回给浏览器显示结果数据。
[0137] 在本实施例中,前端天气图片上传请求,经Gateway网关分发匹配路由到相应的图像识识别服务进行处理;然后图片分类为500hpa和surface_pres单独处理,提取各类颜色生成新的图片;500hpa通过OpenCv处理提取出图片中的曲线角度轮廓、风向角度、气压大小、相似度等信息保存文本;surface_pres图片经TensorFlow训练的天气模型运行调用识别出台风类型;两类图片根据文本数据判断图片类型,通过数据计算出得分并排序,将最终结果返回给浏览器。
[0138] 数据处理流程参见图22所示,天气图上传之后进行遍历,按500hpa和surface_pres两种类型进行分类处理,根据图片中的不同颜色提取出新的图片(等压图、等温图、风向图等);提取出的新图片使用OpenCv、Tesserac和Tensorflow训练模型识别出图片类型及参数信息(风向、压力、位置等);最后根据类型及参数信息进行相似度匹配排名,把结果数据进行返回显示。
[0139] 在本发明的天气图特征类型识别及相似度匹配系统在应用时,包括以下方式:
[0140] 1、天气类型识别。
[0141] 大气系统会根据因子超标等信息生成污染事件,并且获取当前污染事件时间段内的天气图,系统天气图生成对应的天气类型并显示。
[0142] 2、天气类型作为大气污染事件评价参数。
[0143] 天气类型作为大气污染事件重要评价参数用于大气污染事件防治。
[0144] 3、案例匹配获取最佳历史相似事件。
[0145] 当前污染事件评价参数与案例中历史污染事件评价参进行对比打分,其中天气类型作为重要一项评价指标。
[0146] 4、根据历史事件调整参数进行污染防治。
[0147] 从历史匹配中的污染事件案例中获取对应的历史减排安排,并可以减排方案进行优化调整,然后调用模型对减排后的方案进行模拟,获取未来因子浓度走势;通过不断的调整参数加模拟获取最优减排方案。
[0148] 5、案例库。
[0149] 完成后当前污染事件减排方案可以作为典型案例存入案例库中,可供未来相似污染事件减排参考,案例库中的案例可以查看详细,其中包括污染事件当时的天气图和识别出的天气类型。
[0150] 在本实施例中,天气图特征类型识别及相似度匹配方法实现如前述实施例的一种天气图特征类型识别及相似度匹配系统的特征类型识别及相似度匹配过程。因此,本实施例中对天气图特征类型识别及相似度匹配方法的运行过程不再详细介绍。
[0151] 综上所述,本发明提供的技术方案具有以下优点:
[0152] 1、本发明方便大气相关系统快速准确的对天气图天气类型进行识别和匹配,获取对应的天气图天气类型信息及匹配度得分,供大气污染防治减排措施参考;本发明可供相关业务系统灵活调用,大大减轻人为参于天气图识别带来的繁重工作。
[0153] 2、本发明的天气图特征类型识别及相似度匹配系统运用微服务管理模块的架构管理相关接口,与微服务管理模块每个接口连接的模块独立存在,可以单独部署,不用每次发布某个功能都经历一次全服务发布;遵循单一功能原则,微服务管理模块接口连接的模块之间可以通过RESTFUL或者RPC调用,功能解藕;“细粒度”的高可扩展性,每个接口连接的模块都可以单独扩展,单独负载均衡;微服务可供相关业务系统灵活的调用,来来满足业务系统功能需求。
[0154] 3、本发明通过污染防治图像识别技术自动识别空气质量重污染及重大事件天气类型案例及其关键特性,运用智能识图等人工智能技术,进行历史污染事件相似度的匹配,并对当前污染过程和历史案例进行污染过程和要素分析,实现减排措施的快速调取。从而根据实际减排情况得出最优的控制技术方案和工程措施,以达到区域大气环境质量控制目标。
[0155] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。