技术领域
[0001] 本发明涉及环境监测技术领域,具体涉及一种天气型相似性判断方法、装置、电子设备及可读存储介质。
相关背景技术
[0002] 近年来,我国对越来越重视对天气型的判断。通过对比当前气象要素与历史气象要素,实现利用历史天气型来预测未来一段时间的天气型。传统判断天气型相似的技术途
径是根据预报员经验对比历史天气型,进行主观分析,但是研究时缺乏对历史相似天气型
的归纳总结,且分析结果存在较大个体差异。
[0003] 目前,计算天气型相似度的方法是利用包含经纬度信息的多维气象要素数据,先转变为一维数据,再求得相关性系数,相关性最高视为相似度最高,天气型最相似,使得研
究结果客观性有了较大的提高,因此多次分析结果之间的差异较小。但是,在现有技术中,
计算天气型相似度的方法仅使用计算相关性系数R的方式求相似性。
[0004] 针对现有技术中判断天气型相似性只考虑了一维气象要素数据的相关性,导致天气型相似性判断准确度较低的问题,还未提出有效的解决方案。
具体实施方式
[0069] 下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于
本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施
例,都属于本申请保护的范围。
[0070] 在本申请的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,
因此不能理解为对本申请的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解
为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、
“第二”的特征可以明示或者隐含地包括一个或者更多个特征。在本申请的描述中,“多个”
的含义是两个或两个以上,除非另有明确具体的限定。
[0071] 在本申请中,“示例性”一词用来表示“用作例子、例证或说明”。本申请中被描述为“示例性”的任何实施例不一定被解释为比其它实施例更优选或更具优势。为了使本领域任
何技术人员能够实现和使用本申请,给出了以下描述。在以下描述中,为了解释的目的而列
出了细节。应当明白的是,本领域普通技术人员可以认识到,在不使用这些特定细节的情况
下也可以实现本申请。在其它实例中,不会对公知的结构和过程进行详细阐述,以避免不必
要的细节使本申请的描述变得晦涩。因此,本申请并非旨在限于所示的实施例,而是与符合
本申请所公开的原理和特征的最广范围相一致。
[0072] 根据本发明实施例,提供一种天气型相似性判断方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽
然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出
或描述的步骤。
[0073] 此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
[0074] 在本实施例中提供了一种天气型相似性判断方法实施例,可用于天气型预测系统,图1是根据本发明实施例的天气型相似性判断方法的流程图,如图1所示,该流程包括如
下步骤:
[0075] 步骤S101,获取第一气象要素数据在预测时段的第一数据和第一气象要数据素在指定历史时段的第二数据。具体地,第一数据可以通过网络下载或者通过气象预测模型计
算获得。第二数据来源于自建数据库或者网络下载历史气象数据。气象要素可以是位势高
度、等压面温度或风速等,并且通过气象要素来描述天气型。
[0076] 步骤S102,将第一数据的空间特征转换为第一向量,并将第二数据的空间特征转换为第二向量。具体地,天气型是具有时间空间信息的多维度结构,因此判断多维度的相似
性较为复杂。将第一数据与第二数据的空间特征转换为向量,使得天气型相似性的判断更
加方便,并且可以通过向量运算法则对其进行计算。
[0077] 步骤S103,计算第一向量和第二向量的第一余弦距离。
[0078] 步骤S104,根据第一余弦距离确定第一天气型与第二天气型的相似度;其中,该第一天气型与该预测时段对应,该第二天气型与该指定历史时段对应。具体地,通过余弦距离
来表征第一数据与第二数据的相似度可以充分的考虑天气型在空间上的相关性,进而使得
对天气型相似性的判断更加准确。所述第一余弦距离越大,表示第一数据与第二数据的相
似度越高,即第一天气型与第二天气型的相似度越高。根据研究目的,在研究区域中,选取
最能够代表该天气型的气象要素数据为第一数据,例如,研究目的是预测时段降雨情况,因
此选取预测时段大气湿度数据为第一数据,历史上的大气湿度数据为第二数据,因此通过
计算预测时段大气湿度数据与历史上大气湿度数据的余弦距离,并且通过余弦距离表征第
一天气型与第二天气型的相似度。其中,通常大气湿度达到露点,在遇到降温时就会产生降
雨,因此可以通过大气湿度来表降雨情况,即,预测时段大气湿度与历史大气湿度的相似度
相当于第一天气型与第二天气型的相似度。
[0079] 通过上述步骤,由于在现有技术中判断天气型相似性只考虑了一维气象要素数据的相关性,本发明实施例通过将气象要素空间特征转换成向量,计算向量之间的余弦距离
来表征气象要素的相似度,进而提高判断的准确率。这就解决了现有技术中判断天气型相
似性只考虑了一维气象要素数据的相关性,导致天气型相似性判断准确度较低的问题。在
本发明实施例中基于多维变量数据对天气型相似性判断,提高判断的准确率。
[0080] 上述步骤S103涉及计算第一向量和第二向量的第一余弦距离,在一个可选实施例中,
[0081] 通过如下公式计算该第一余弦距离:
[0082]
[0083] 向量A和B分别表示预测时段的第一气象要素数据与历史第一气象要素数据,S1、f(A,B)、cos(θ)表示所述第一余弦距离,Ak、Bk分别表示向量A和B的第k个分量,n表示向量A与
B的分量数。具体地,两个向量间的余弦值可以通过使用欧几里得点积公式推导,其中欧几
里得点积公式为:
[0084] A·B=|A||B|cosθ,
[0085] 因此由根据向量的运算可以较为简单的获取两向量之间的余弦相似度,并且由于向量具有空间特性,提高了判断天气相似性的准确率。
[0086] 为了说明将气象要素的空间特性转换为向量,在一个可选实施例中,第一气象要素为风速。对于空间上任意一点的风速都可以为沿着纬线方向吹的风,并且设定由西方吹
向东方的风为纬线正方向,同理沿着经线方向吹的风,并且设定由南方吹向北方的风为纬
线正方向,基于此可建立一个直角坐标系。取沿着纬线方向吹的风的大小为u,沿着经线方
向吹的风的大小为v,因此通过平行四边形法则可以获得一个代表空间中某点的矢量风速
F。因此u,v均为F的分量,也就是Fk。
[0087] 上述步骤S103涉及计算第一向量和第二向量的第一余弦距离,在上述步骤S103之后,在一个可选实施例中,获取第二气象要素数据在预测时段的第三数据和第二气象要素
数据在指定历史时段的第四数据。其中,第二气象要素数据包括一种或多种气象要素数据。
具体地,为了获得更高的判断天气相似性的准确率,增加能够表征该天气型的第二气象要
素。同时,通过对不同天气型相似性判断,确定第一气象要素与第二气象要素的类型。例如,
研究的天气型为沙尘暴,那么第一气象要素与第二气象要素为分别风,位势高度以及空气
湿度等;研究的天气型为大气污染,那么第一气象要素与第二气象要素分别为PM2.5、SO2以
及CO等。
[0088] 将第三数据的空间特征转换为第三向量,并将第四数据的空间特征转换为第四向量。计算第三向量和第四向量的第二余弦距离。为第一余弦距离分配第一权重,并为第二余
弦距离分配第二权重。通过如下公式,根据该第一余弦距离、该第二余弦距离、该第一权重
和该第二权重确定针对各个气象要素数据的第一综合余弦距离。
[0089]
[0090] ∑xv=1,
[0091] xv表示所述第一权重、第二权重,S11表示第11区域的第一综合余弦距离,m为气象要素数据的种类,SV表示所述第一余弦距离、第二余弦距离,v表示第v种气象要素,v∈[1,
m]。具体地,v为正整数。根据气象领域常规使用的经验系数,赋予不同气象要素权重。由于
不同的气象要素对天气型的影响程度不同,因此通过增加气象要素的权重,使得对天气型
相似性的描述更加全面准确。由于第二气象要素数据可以包括一种或多种气象要素数据,
因此计算出的第二余弦距离对应地包含一个或者多个余弦距离,第二权重也就对应地包含
一个或者多个权重系数。
[0092] 根据第一综合余弦距离确定第一天气型与第二天气型的相似度,有效地提高了判断的准确度。所述第一综合余弦距离越大,表示第三数据与第四数据的相似度越高,即第一
天气型与第二天气型的相似度越高。具体地,与根据第一余弦距离确定第一天气型与第二
天气型的相似度相同,但是有的天气型需要考虑多种气象要素,例如大气污染,因此第一数
据可以为预测时段PM2.5数据,第二数据可以为历史PM2.5数据;第三数据为预测时段的CO
或者SO2的数据,第四数据为历史CO或者SO2的数据,计算出PM2.5、CO以及SO2的余弦距离,
进而通过加权求和的方式获得第一综合余弦距离。其中,通常大气污染情况可由PM2.5、CO
以及SO2等气象要素表示,因此预测时段PM2.5、CO以及SO2与历史PM2.5、CO以及SO2的相似
度相当于第一天气型与第二天气型的相似度。
[0093] 在一个可选实施例中,根据经纬度将研究区域划分为M行N列个区域;其中M,N为正整数。通过将整体研究区域进行分区,考虑了天气型在小尺度区域的环流特征。
[0094] 获取该研究区域中的各个区域的第一综合余弦距离。为每个区域的第一综合余弦距离分配权重;具体地,根据不同区域的关注度来分配权重,以便于获取关注区域的较为准
确的天气型相似性的判断。
[0095] 通过如下公式,根据每个区域的第一综合余弦距离、每个区域的第一综合余弦距离的权重确定第二综合余弦距离。
[0096]
[0097] ∑yij=1,
[0098] yij表示每个区域的第一综合余弦距离的权重,S表示该第二综合余弦距离,Sij表示ij区域的第一综合余弦距离,i∈[1,M],j∈[1,N]。其中,i,j为整数。
[0099] 根据第一综合余弦距离和第二综合余弦距离确定第一天气型与第二天气型的相似度,充分考虑到局部空间范围气象场分布差异对研究区域的影响。
[0100] 为了进一步说明天气型相似性判断方法,在一个可选的实施例中,在对预测天气型进行天气型相似性判断时,需要对自建数据库内或者网络下载的全部历史气象数据或者
近几年的气象数据计算第二综合余弦距离,由此可以获取多个第二综合余弦距离,通过对
第二综合余弦距离进行比较排序,获得最大第二综合余弦距离所代表的日期以及天气型。
同时,对于自建数据库可以按照经验,根据研究天气型的不同建立多个数据库,或者建立一
个总数据库。如图2所示,通过对近些年天气型与预测天气型相似性的判断,获得了与河北
省2020年1月2日的最相似天气型的日期是2019‑01‑07,并且第二综合余弦距离为0.86,即
相似系数为0.86。
[0101] 在本实施例中还提供了一种天气型相似性判断装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定
功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬
件,或者软件和硬件的组合的实现也是可能并被构想的。
[0102] 本实施例提供一种天气型相似性判断装置,如图3所示,包括:
[0103] 第一获取模块31,用于获取第一气象要素数据在预测时段的第一数据和第一气象要数据素在指定历史时段的第二数据;
[0104] 第一转换模块32,用于将第一数据的空间特征转换为第一向量,并将第二数据的空间特征转换为第二向量;
[0105] 第一计算模块33,用于计算第一向量和第二向量的第一余弦距离;
[0106] 第一确定模块34,用于根据所述第一余弦距离确定第一天气型与第二天气型的相似度;其中,该第一天气型与所述预测时段对应,该第二天气型与所述指定历史时段对应。
[0107] 可选地,该装置中第一计算模块用于通过如下公式计算该第一余弦距离:
[0108]
[0109] 向量A和B分别表示预测时段的第一气象要素数据与历史第一气象要素数据,S1、f(A,B)、cos(θ)表示所述第一余弦距离,Ak、Bk分别表示向量A和B的第k个分量,n表示向量A与
B的分量数。可选地,该装置还包括:
[0110] 第二获取模块,用于获取第二气象要素数据在预测时段的第三数据和第二气象要素数据在所述指定历史时段的第四数据;其中,该第二气象要素数据包括一种或多种气象
要素数据;
[0111] 第二转换模块,用于将第三数据的空间特征转换为第三向量,并将第四数据的空间特征转换为第四向量;
[0112] 第二计算模块,用于计算第三向量和第四向量的第二余弦距离;
[0113] 第一分配模块,用于为第一余弦距离分配第一权重,并为第二余弦距离分配第二权重;
[0114] 第二确定模块,用于通过如下公式,根据该第一余弦距离、该第二余弦距离、该第一权重和该第二权重确定针对各个气象要素数据的第一综合余弦距离;
[0115]
[0116] ∑xv=1,
[0117] xv表示所述第一权重、第二权重,S11表示第11区域的第一综合余弦距离,m为气象要素数据的种类,SV表示所述第一余弦距离、第二余弦距离,v表示第v种气象要素,v∈[1,
m];
[0118] 第三确定模块,用于根据第一综合余弦距离确定第一天气型与第二天气型的相似度。
[0119] 可选地,该装置还包括:
[0120] 划分模块,用于根据经纬度将研究区域划分为M行N列个区域;其中M,N为正整数;
[0121] 第三获取模块,用于获取该研究区域中的各个区域的第一综合余弦距离;
[0122] 第二分配模块,用于为每个区域的第一综合余弦距离分配权重;
[0123] 第四确定模块,用于通过如下公式,根据每个区域的第一综合余弦距离、每个区域的第一综合余弦距离的权重确定第二综合余弦距离;
[0124]
[0125] ∑yij=1,
[0126] yij表示每个区域的第一综合余弦距离的权重,S表示所述第二综合余弦距离,Sij表示ij区域的第一综合余弦距离,i∈[1,M],j∈[1,N];
[0127] 第五确定模块,用于根据该第一综合余弦距离和该第二综合余弦距离确定第一天气型与第二天气型的相似度。
[0128] 本实施例中的天气型相似性判断装置是以功能单元的形式来呈现,这里的单元是指ASIC电路,执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述
功能的器件。
[0129] 上述各个模块的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
[0130] 本发明实施例还提供一种电子设备,具有上述图3所示的天气型相似性判断装置。
[0131] 请参阅图4,图4是本发明可选实施例提供的电子设备结构示意图,如图4所示,该电子设备可以包括:至少一个处理器401,例如CPU(Central Processing Unit,中央处理
器),至少一个通信接口403,存储器404,至少一个通信总线402。其中,通信总线402用于实
现这些组件之间的连接通信。其中,通信接口403可以包括显示屏(Display)、键盘
(Keyboard),可选通信接口403还可以包括标准的有线接口、无线接口。存储器404可以是高
速RAM存储器(Random Access Memory,随机存取存储器),也可以是非易失性存储器(non‑
volatile memory),例如至少一个磁盘存储器。存储器404可选的还可以是至少一个位于远
离前述处理器401的存储装置。其中处理器401可以结合图3所描述的装置,存储器404中存
储应用程序,且处理器401调用存储器404中存储的程序代码,以用于执行上述任一方法步
骤。
[0132] 其中,通信总线402可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard
architecture,简称EISA)总线等。通信总线402可以分为地址总线、数据总线、控制总线等。
为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0133] 其中,存储器404可以包括易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random‑access memory,缩写:RAM);存储器也可以包括非易失性存储器(英
文:non‑volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:hard disk
drive,缩写:HDD)或固态硬盘(英文:solid‑state drive,缩写:SSD);存储器404还可以包
括上述种类的存储器的组合。
[0134] 其中,处理器401可以是中央处理器(英文:central processing unit,缩写:CPU),网络处理器(英文:network processor,缩写:NP)或者CPU和NP的组合。
[0135] 其中,处理器401还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application‑specific integrated circuit,缩写:ASIC),可编程逻辑器件(英文:
programmable logic device,缩写:PLD)或其组合。上述PLD可以是复杂可编程逻辑器件
(英文:complex programmable logic device,缩写:CPLD),现场可编程逻辑门阵列(英文:
field‑programmable gate array,缩写:FPGA),通用阵列逻辑(英文:generic array
logic,缩写:GAL)或其任意组合。
[0136] 可选地,存储器404还用于存储程序指令。处理器401可以调用程序指令,实现如本申请图1实施例中所示的天气型相似性判断方法。
[0137] 本发明实施例还提供了一种非暂态计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的天气型相似性判
断方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read‑Only Memory,ROM)、随
机存取存储器(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard
Disk Drive,缩写:HDD)或固态硬盘(Solid‑State Drive,SSD)等;所述存储介质还可以包
括上述种类的存储器的组合。
[0138] 虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所
限定的范围之内。