首页 / 一种面向农产品的数据信息溯源方法及系统

一种面向农产品的数据信息溯源方法及系统实质审查 发明

技术领域

[0001] 本发明涉及数据处理技术领域,具体涉及一种面向农产品的数据信息溯源方法及系统。

相关背景技术

[0002] 引入区块链技术和智能合约等技术,可以有效解决农产品追溯系统存在的信息不透明、数传递困难和易篡改等问题,实现对农产品生产全过程的高效、准确、可信的溯源。
[0003] 农作物的生长过程需要花费相对漫长的时间,对于各种外部影响因素对农作物的质量所产生的影响,并不能进行简单的评估,同时,由于农作物本身对于外部条件的需求具有差异,并且其对于任意一种农作物来讲,外部条件需要保证在规定的范围内处于平衡状态,单一类型的外部因素的激增会导致农作物的质量出现问题,甚至导致整个批次的农作物直接死亡,若只是简单地采集农产品在外部条件产生的各项数据就进行数据上链,那么基于这些数据对农产品进行信息溯源的准确形和可信度是无法得到保证的。因此还需要基于农产品的各种外部因素的短期变化以及整体之间的平衡关系,进而对采集到的农作物各项数据做相应的处理后再进行上链,以此保证溯源方法及系统的准确性和可信度。
[0004] 因此,如何分析各种外部条件的短期变化以及整体之间的平衡关系对于农作物的农产品的影响,进而更好地对农产品进行信息溯源是目前业界亟待解决的课题。

具体实施方式

[0058] 为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种面向农产品的数据信息溯源方法及系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
[0059] 除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
[0060] 引入区块链技术和智能合约等技术,可以有效解决农产品追溯系统存在的信息不透明、数传递困难和易篡改等问题,实现对农产品生产全过程的高效、准确、可信的溯源。具体的,可以通过物联网等技术获取到农产品生长环境和生产过程中的各项数据以及农产品相关指标,然后对这些数据进行相应预处理后通过通信协议上传至区块链网络,再利用智能合约技术对区块链网络中的数据进行数据验证,保证数据传递的准确性,最后将生产过程中的数据进行上链,保证溯源方法及系统的准确性和可信度。
[0061] 然而,农作物的生长过程需要花费相对漫长的时间,对于各种外部影响因素对农作物的质量所产生的影响,不能进行简单评估。同时,由于农作物本身对于外部条件的需求具有差异,并且其对于任意一种农作物来讲,外部条件需要保证在规定的范围内处于平衡状态,单一类型的外部因素的激增会导致农作物的质量出现问题,甚至导致整个批次的农作物直接死亡。若只是简单地采集农产品在外部条件产生的各项数据就进行数据上链,那么基于这些数据对农产品进行信息溯源的准确形和可信度是无法得到保证的。
[0062] 相应的,农作物对应的农产品的数据信息涵盖了从生产到销售过程中的各种关键数据,这些关键数据对于确保农产品的质量、安全和可追溯性至关重要。同时,由于农产品在种植过程中,会将农产品种植在不同的区域内,对于不同区域内的不同农产品的实际环境需求、人工干预需求(例如肥料种类、肥料重量)都不同,在对不同外部条件下所产出的农产品其品质具有一定的差异,而后续的加工过程又具有相对规范的处理方式,因此对于最终出现在市面上的农产品,其最终质量的好坏与其历史生长过程中的生长条件息息相关,所以可以应对不同农产品历史生产过程中的各项关键生长条件进行数据溯源。
[0063] 因此,如何分析各种外部条件的短期变化以及整体之间的平衡关系对于农作物的农产品的影响,进而更好地对农产品进行信息溯源是目前业界亟待解决的课题。
[0064] 为了解决上述问题,在本说明书中提供了一种面向农产品的数据信息溯源方法及系统,下面结合附图具体地说明本发明所提供的一种面向农产品的数据信息溯源方法及系统的具体方案。
[0065] 请参阅图1,其示出了本发明一个实施例提供的面向农产品的数据信息溯源方法的流程图,该方法可以包括:
[0066] S10、获取每一批次待溯源农产品的质量评分,并确定不同批次待溯源农产品之间的质量评分差异。
[0067] 在本实施例中,上述的质量评分由训练好的质量评价模型得到,即,运用一个已经训练好的质量评价模型对每一区域对应批次的农产品实际质量进行分类网络训练,并输出该批次农产品的质量评分数值,该质量评价模型为目前已知的用于分类的神经网络模型,在此对该神经网络模型具体形式并不做任何限制,只需保证能够获取到农产品的质量评分数值即可。
[0068] 在本实施例中,会批次收获对应一个种植区域内的农产品,获取种植区域内农产品播撒到批量收货之间的历史周期内中每一预设采集间隔的关键生产条件并进行存储形成离线历史数据,方便后续操作。
[0069] 具体地,采集农产品在历史周期内的各项关键生产条件,为后续质量评价做数据支撑,其中,预设采集间隔是指需要进行数据采集的时间周期段,可以是1h、6h、24h、一周等,在此不做限制。此外,也可以采集特殊时间周期,如发芽期、成熟期等不同情形下的农产品数据,以确定各种情况下的关键生产条件,以便提供更好、更准确的质量评价。
[0070] 在本实施例中,上述的关键生产条件至少包括:光照总量、温度、降水量、土壤pH值、养分含量等多种多维数据。
[0071] 该方法中在对农产品进行加工处理之前,会预先对农产品进行初步的质量检测,并对每一区域对应批次的农产品实际质量进行预先评估。需要说明的是,考虑到单一批次中的农产品数量较大,为避免单一个例对整个批次农产品的影响,因此对一个批次中的所有农产品进行抽样的质量筛查及评估,例如抽取单批次农产品总数的20%作为样本农产品,之后对样本农产品进行质量检测并将样本农产品的实际质量作为该批次农产品对应的实际质量。
[0072] 优选的,该质量评价模型的训练过程为:
[0073] A10、获取影响单批次农产品中样本农产品质量的关键特征,在本实施例中,上述的关键特征即为影响农产品的感兴趣特征,关键特征至少可以包括:农产品对应的颜色、大小、完整度、口感等多种多维数据。
[0074] A20、确定上述的每一项关键特征的权重以及确定样本农产品在每一项关键特征的得分,可以理解的是,样本农产品在某项关键特征上的得分的数值越高,代表样本农产品在该项关键特征的特征信息越高(多)。
[0075] 在本实施例中,样本农产品在每一项关键特征上的得分可以是产业专家评定的,也可以是消费用户评定的,也可以是综合产业专家、消费用户等群体的评定综合得到的。
[0076] A30、将样本农产品的关键特征、关键特征的权重、关键特征的得分作为输入数据,输入至神经网络模型中并采用梯度下降法进行训练,得到用于输出农产品的质量评分的质量评价模型。该质量评价模型能够结合样本农产品在所有关键特征上的得分以及各项关键特征所占的权重,输出得到样本农产品的质量评分,农产品质量评分的取值为0‑1之间,同样的,质量评分越高代表样本农产品也即对应批次的农产品的质量越高,即经过漫长生长过程所获取到的农产品质量越好。
[0077] 以神经网络模型其网络结构为五层全连接神经网络模型,损失函数为交叉熵函数为例进行说明,训练时历史数据中设置的训练比例为7:3,通过选链接数据对神经网络模型进行训练,通过梯度下降法进行训练,直到损失函数收敛。
[0078] 通过输入每一批次待溯源农产品的关键特征以及关键特征的得分至质量评价模型,能够得到对应批次待溯源农产品的质量评分以及不同批次所述待溯源农产品之间的质量评分差异。
[0079] S20、获取待溯源农产品在各项关键生长条件下的生长数据,并确定生长数据中各个极值点的潜在影响趋势,其中,潜在影响趋势与农产品质量存在映射关系,更具体的,潜在影响趋势越大表征对农产品质量影响越大,反之,则越小。
[0080] 由于任意一项的关键生长条件对农作物生长状态和质量,在各项关键生长条件处于合理范围内,并且各自之间处于相对的动态平衡时,关键生长条件对农作物所产生的几乎为正向的促进作用,且这种促进作用在单个时间段例如一天内对由农产物得到的农产品质量产生的影响较小,即利用单个时间段例如一天来判断农产品是否处于动态平衡且对质量产生了正向或反向的影响是相对片面的。而根据分析可知,对于单一关键数据对农作物的影响,其反映在该条件的实际监测数据超出农作物的生长需求所对应范围(上限或下限)的多少,以及这种情况的持续时间;例如对于降水量而言,其在短时间内出现了大暴雨,虽然此时已超出了农作物的需求范围标准,但由于其持续时间较短,因此对于农产品的质量影响较小。
[0081] 步骤S20中潜在影响趋势是通过分析局部异常数据(包括局部超出量和缺失量),判断其局部异常状态获取得到的,这样可以避免了利用单个时间段的相关数据来判断农产品是否处于动态平衡且对质量影响的不准确,提高了不同农产品的特征代表性和准确性。
[0082] S30、根据待溯源农产品在不同关键生长条件下极值点之间的时序差异以及在相同关键生长条件下极值点之间的潜在影响趋势差异,确定不同关键生长条件之间的共性程度。
[0083] 在本实施例中,考虑到对于农作物的实际生产质量,取决于多项关键生长条件的共同影响,因此对于所谓动态平衡,即在一定时间内对于一项关键生长条件的增加,理论上若伴随其他一些具有强关联的关键生长条件即外部因素共同升高,则其对于农作物的影响会减小。由于部分关键生长条件之间存在必然的相互关系,例如降水与温度之间呈负相关,降水与光照之间的负相关,土壤pH值与降水之间的随机波动等等,因此首先获取任意两项关键生长条件的共性程度,这样避免了农产品其生长时间跨度较长所导致历史数据的短暂异常的影响弱化而使得不同批次的最终农产品具体区别差异较小,提高了最终聚簇的代表性以及准确性。
[0084] S40、根据共性程度以及质量评分差异,确定不同批次的待溯源农产品之间的相似性。
[0085] 对于任意批次的农产品,某一项关键生长条件与其他的关键生成条件之间的共性(值)越高,表明其自身的影响趋势本身相对较低,则此时说明当前关键生长条件所产生的实际数值波动对于农产品质量的影响较小,因此可基于潜在影响趋势、共性值这些特征对不同批次的农产品进行聚类,从而对于同一类的农产品赋予相同的溯源信息例如溯源码。
[0086] S50、根据相似性将不同批次待溯源农产品分类,并对同类别的待溯源农产品赋予相同的溯源信息,并对具有溯源信息的待溯源农产品进行数据上链。
[0087] 例如,基于kmeans聚类算法,利用手肘法获取最优k,并基于上述方法对农产品批次进行聚类,进行无监督学习的聚类运算,通过数据内部的相似性将数据划分为多个簇,并且使簇内的相似度尽可能大,而簇间的相似度尽可能小,对于上述所计算出的相同簇的农产品,基于品质评分的均值对不同簇的农产品赋予质量评分相关的信息,并赋予相同簇农产品溯源信息例如溯源码,对其进行信息上链。
[0088] 本发明的面向农产品的数据信息溯源方法,通过确定所述生长数据中各个极值点的潜在影响趋势,进而分析得到影响农产品质量的外部条件中的关键生长条件在历史数据中的局部超出量或者缺失量,判断其局部异常状态以获取任意一个极值点的潜在影响趋势,避免了利用单个时间段的历史数据来判断农作物是否处于动态平衡且对质量影响的不准确,提高了不同农产品的特征代表性和准确性,同时根据所述待溯源农产品在不同所述关键生长条件下极值点之间的时序差异以及在相同所述关键生长条件下极值点之间的潜在影响趋势差异,确定不同所述关键生长条件之间的共性程度,通过对比不同关键生长条件在历史数据中的变化一致性,获取关键生长条件的数据变化共性,避免了农作物生长时间跨度较长所导致历史数据的短暂异常的影响弱化而使得不同批次的最终农产品具体区别差异较小,提高了最终分类的代表性以及准确性,保证溯源方法及系统的准确性和可信度。
[0089] 请参阅图2,步骤S20具体包括:
[0090] S21、获取待溯源农产品在每项关键生长条件下的生长数据,按照时序对生长数据进行排序,并确定每项关键生长条件对应的生长数据中的极值点。
[0091] 对于任意一项的关键数据,使其先通过历史采集到的相关数据在坐标轴上按照时序排列,之后根据先验的关于当前任意一种农作物对于任意一种关键数据,其具有理论的最适宜的生产环境条件范围,该理论的最适宜的生产环境条件范围可以作为当前关键数据理想的适应范围。
[0092] S22、将具有相同特征的相邻极值点之间时间段作为极值时间段,得到若干极值时间段以及极值点对应的极值时间段,其中,相同特征为同为极大值或者同为极小值。
[0093] 此时对于历史采集到的关键生长条件的数据,对于任意时刻获取其与适应范围的最大值和最小值之间的差异,并且使最大值和最小值分别作为减数和被减数,使处在范围内的数据始终为负值,使超出范围的值为正,此时对于任意一个时刻的数据可以获取到两个差值。
[0094] 紧接着,对于任意一项关键生长条件,获取其采集到的历史数据中所有的极值点(极大值以及极小值),令任意一对相邻极大值点之间或相邻一对极小值之间作为一个极值时间段,使上述极值时间段分别表示对应其之间的极小值或极大值的突出程度,获取每一个极值时间段的长度Ni,其中i表示第i个极值点(极大值或者极小值)所对应的局部极值时间段。
[0095] S23、根据极值点所处的极值时间段与相应的关键生长条件的适宜范围的对应关系,得到极值点的潜在影响趋势,其中每一项关键生长条件均具有相对应的适宜范围。
[0096] 请参阅图3,以一对相邻极小值之间为一个极值时间段为例进行说明,步骤S23具体包括:
[0097] S231、确定极值点所处的极值时间段。
[0098] S232、获取极值时间段内的第一数量和第二数量,其中,第一数量为极值时间段内低于关键生长条件对应的适宜范围最小值的数据点的总数,第二数量为极值时间段内超过适宜范围最大值的数据点的总数。
[0099] 由于在两个极小值之间的极值时间段Ni内可能存在低于适宜范围最小值的数据点,获取该极值时间段Ni内低于适宜范围最小值的数据点的总个数Mmin即第一数量,同时获取该极值时间段Ni内超出适宜范围最大值的数据点的总个数Mmax即第二数量。
[0100] S233、确定该极值时间段Ni的极大值ΔTtmax。
[0101] S234、确定该极值时间段Ni超过适宜范围的数据点的超出量均值
[0102] S235、根据第一数量、第二数量、极值时间段内数据点的总数、极值时间段的极大值以及超出量均值,得到极值点的潜在影响趋势。
[0103] 由此,对于该项的关键生长条件,获取到其对的当前种类农产品的潜在影响趋势。
[0104]
[0105] 其中,Pi表示潜在影响趋势;Mmin表示极值时间段Ni内低于适宜范围最小值的数据点的总个数;Mmax表示极值时间段Ni内超出适宜范围最大值的数据点的总个数;Ni表示极值时间段Ni内数据点的总个数,即Ni‑Mmin表示极值时间段Ni内的除超出最低范围外的其他数据点总个数; 表示极值时间段Ni的极大值; 表示极值时间段Ni超过适宜范围的数据点的超出量均值; 即表示极值时间段Ni超出范围最大值的数据点占比,该值越大说明对于当前关键生长条件其所持续的可能存在的负面影响时间越长,潜在影响趋势越大,同时对于该超出范围最大值的数据点其均值和极大值点本身的大小越大,说明其超出的幅度越大,影响趋势越大,因此将上述二者相乘,由此得Pi,该值越大影响趋势越大。
[0106] 需要说明的是,对于极小值点的潜在影响趋势计算原理与上述相同,对于处在正常范围内的数据点,由于Mmax为0,因此潜在影响趋势为0。
[0107] 遍历某项关键生长条件所有极大值和极小值点,每个极值点或者说极值对应的极值时间段都可以对应一个潜在影响趋势,经过上述的处理,即可以获取到任意批次农产品对应的每一个极值点,同时对于这些极值点还可以获取其潜在影响趋势。
[0108] 请参阅图4,步骤S30具体包括:
[0109] S31、根据所述生长数据中的极值点,获取不同的两项所述关键生长条件之间的时序差异,并根据最小时序差异构建差异时间段,得到若干差异时间段。
[0110] 对于每一项关键生长条件都可以获取到若干个关于极大值和极小值之间的时间段,此时对于任意一项关键生长条件的任意一个极值点,其他的关键生长条件与该极值点存在时序差异(值),也能够获取其他的关键生长条件与该极值点之间时序差异最小的极值点。
[0111] 令上述的当前关键生长条件与时序差异最小的其他外部条件的极值点构建一个新的时间段即差异时间段。
[0112] S32、获取每个所述差异时间段内其中一项所述关键生长条件的极值点到另一项所述关键生长条件的极值点的时序差异。
[0113] S33、根据这两项所述关键生长条件极值点之间的时序差异以及相同所述关键生长条件下极值点之间的潜在影响趋势差异,确定该不同的两项所述关键生长条件之间的共性程度。
[0114] 更具体的,步骤S33具体包括:
[0115] S331、遍历当前关键生长条件的所有极大值点,分别获取该极大值点对应不同差异时间段内的另一项关键生长条件的极大值点和极小值点,再分别计算上述的另一项关键生长条件的极大值点和极小值点到当前关键生长条件的该极大值点之间的时序差异的数值变化的差异,得到Δti,max以及Δti,min,其中,Δti,max表示第一极大值时序差异,Δti,min表示第一极小值时序差异。
[0116] S332、获取当前关键生长条件各个极大值点之间的潜在影响趋势差异。
[0117] S333、根据当前项关键生长条件中各个极大值点的第一极大值时序差异、第一极小大值时序差异以及潜在影响趋势差异,得到不同关键生长条件之间的第一共性程度,第一共性程度为不同关键生长条件之间的关于极大值点之间的共性程度:
[0118]
[0119] 其中,Exm,yax表示当前关键生长条件x与另一项关键生长条件y之间的关于极大值点之间的共性程度即第一共性程度;nx,max表示当前关键生长条件x的极大值点总个数;Δti,max表示第一极大值时序差异即另一项关键生长条件y的极大值点到当前关键生长条件x的极大值点之间的时序差异的数值变化的差异,Δti,min表示第一极小值时序差异即另一项关键生长条件y的极小值点到当前关键生长条件x的极大值点之间的时序差异的数值变化的差异,Δti,max‑Δtj,max、Δti,min‑Δtj,min的值越小说明当前两个关键生长条件的极大值点之间的数值变化所产生的规律性较为相似,利用欧式范数联立,由此得Pi表示前关键生长条件x的极大值点i潜在影
响趋势差异,Pj表示前关键生长条件x的极大值点j潜在影响趋势差异,|Pi‑Pj|表示任意当前关键生长条件x的极大值点i和j的潜在影响趋势差异,该值越小说明所处的关键生长条件之间的相似性越高,上述计算的数值变化规律越相似,对于共性特征的判断的参考权重越大,并对后者的极大值规律性加权。
[0120] 遍历并累加所有极大值点,由此得 该值越小说明当前关键生长条件与其他关键生长条件之间的共性越高。
[0121] S334、遍历当前关键生长条件的所有极小值点,分别获取每个差异时间段内当前项所述关键生长条件的极大值点和极小值点到另一项关键生长条件的极小值点的时序差异,得到第二极大值时序差异和第二极小值差异。
[0122] S335、获取当前项所述关键生长条件各个极小值点之间的潜在影响趋势差异。
[0123] S336、根据当前项关键生长条件中各个极小值点的第二极大值时序差异、第二极小值时序差异以及潜在影响趋势差异,得到不同关键生长条件之间的第二共性程度;第二共性程度为不同关键生长条件之间的关于极小值点之间的共性程度。
[0124] 同理对于极小值点,由此得 表示当前关键生长条件x与另一项关键生长条件y之间的关于极小值点之间的共性程度。计算过程在此不做赘述。
[0125] S337、基于第一共性程度和第二共性程度,得到该不同的两项所述关键生长条件之间的共性程度,此时对于当前任意两个关键生长条件,可以此获取得到两者实际上的共性值:
[0126]
[0127] 其中,Ex,y表示当前关键生长条件x与另一项关键生长条件y之间共性值。
[0128] 遍历所有的关键生长条件,都可以获取对应的共性值,共性值越大,在历史数据中任意两项关键生长条件的变化具有规律的变化倾向,也说明当前批次农产品越符合实际农作物生长需求。
[0129] 请参阅图5,步骤S40具体包括:
[0130] S41、根据共性程度,确定每一项关键生长条件的相似性权重。
[0131] 对于任意批次的农产品,某一项关键生长条件与其他的关键生成条件之间的共性值越高,表明其自身的影响趋势本身相对较低,则此时说明当前关键生长条件所产生的实际数值波动对于农产品质量的影响较小,因此可基于潜在影响趋势、共性值这些特征对不同批次的农产品进行聚类,从而对于同一类的农产品赋予相同的溯源信息例如溯源码。
[0132] 在本实施例中,还会确定关键生长条件共性值的相似性权重:
[0133]
[0134] 其中,μx表示关键生长条件x的相似性权重;Ex,y表示当前关键生长条件x与另一项关键生长条件y之间共性值;nx,max表示当前关键生长条件x数据点的总个数。
[0135] S42、确定每一批次的待溯源农产品在相同的关键生长条件下潜在影响趋势超过0的极值点,并确定不同批次潜在影响趋势超过0的极值点之间的最小时序差异以及潜在影响趋势差异。
[0136] S43、根据相似性权重最小时序差异、潜在影响趋势差异以及质量评分差异,确定不同批次的待溯源农产品之间的相似性。
[0137] 因而,通过将当前批次农产品的历史外部条件数据变化以曲线的形式表现,对于所有批次的农产品,通过对比相同外部条件数据的曲线中,潜在影响趋势大于0的极值点相较于其他批次农产品极值点之间最小时序差异,使不同批次的上述数据点逐一进行对比,由此对于任意两个批次相同的外部生长条件的农产品,可以获取到Gx个数据对应组合,并记录最小时序差异Δdr和潜在影响趋势之间的差异ΔPr。同时获取相同关键生长条件整体之间的共性(值)差异,以及最终质检过程中的质量评分的差异ΔQa,b。
[0138] 由此得任意两个不同批次农产品数据之间的相似性:
[0139]
[0140] 其中,f表示批次a和批次b的某个农产品之间的相似性;ΔQa,b表示批次a和批次b的某个农产品质量评分差异;μa,x表示批次a的某个农产品在关键生长条件x的相似性权重;μb,x表示批次b的某个农产品在关键生长条件x的相似性权重;Gx表示批次a和批次b的某个农产品数据对应组合;Δdr表示批次a和批次b的某个农产品数据之间的最小时序差异;ΔPr表示批次a和批次b的某个农产品数据极值点的潜在影响趋势之间的差异;对于批次a和批次b的某个农产品,其共包含m个关键生长条件,对于其中相同的关键生长条件x,当该两个批次农产品潜在影响趋势大于0的数据点(极值点)相较于其他批次数据点之间最小时序差异Δdr越小,同时对应两个数据点之间潜在影响趋势之间的差异ΔPr越小,遍历所有潜在影响趋势大于0的数据点,得 该值越小说明两个批次在当前关键生长条件x
的变化特征越相似。
[0141] 同时对于任意一项关键生长条件,两个批次农产品之间的共性值差异越小,说明条件本身所产生的变化的特异性越低,当前两项关键生长条件之间的整体相似性越高,当前关键生长条件的相似性判别权重越大。通过遍历m个关键生长条件,结合质量评分差异,由此得批次a和批次b的某个农产品之间的相似性f,相似性越大表示这两次批次农产品的外部条件变化越相似。
[0142] 下面对本发明实施例提供的面向农产品的数据信息溯源系统进行描述,下文描述的面向农产品的数据信息溯源系统与上文描述的面向农产品的数据信息溯源方法可相互对应参照。
[0143] 请参阅图6,其示出了本发明一个实施例提供的面向农产品的数据信息溯源系统的结构示意图,该系统可以包括:
[0144] 质量评分模块10,用于获取每一批次待溯源农产品的质量评分,并确定不同批次待溯源农产品之间的质量评分差异。
[0145] 在本实施例中,上述的质量评分由训练好的质量评价模型得到,即,运用一个已经训练好的质量评价模型对每一区域对应批次的农产品实际质量进行分类网络训练,并输出该批次农产品的质量评分数值,该质量评价模型为目前已知的用于分类的神经网络模型,在此对该神经网络模型具体形式并不做任何限制,只需保证能够获取到农产品的质量评分数值即可。
[0146] 在本实施例中,会批次收获对应一个种植区域内的农产品,获取种植区域内农产品播撒到批量收货之间的历史周期内中每一预设采集间隔的关键生产条件并进行存储形成离线历史数据,方便后续操作。
[0147] 具体地,采集农产品在历史周期内的各项关键生产条件,为后续质量评价做数据支撑,其中,预设采集间隔是指需要进行数据采集的时间周期段,可以是1h、6h、24h、一周等,在此不做限制。此外,也可以采集特殊时间周期,如发芽期、成熟期等不同情形下的农产品数据,以确定各种情况下的关键生产条件,以便提供更好、更准确的质量评价。
[0148] 在本实施例中,上述的关键生产条件至少包括:光照总量、温度、降水量、土壤pH值、养分含量等多种多维数据。
[0149] 该系统中在对农产品进行加工处理之前,会预先对农产品进行初步的质量检测,并对每一区域对应批次的农产品实际质量进行预先评估。需要说明的是,考虑到单一批次中的农产品数量较大,为避免单一个例对整个批次农产品的影响,因此对一个批次中的所有农产品进行抽样的质量筛查及评估,例如抽取单批次农产品总数的20%作为样本农产品,之后对样本农产品进行质量检测并将样本农产品的实际质量作为该批次农产品对应的实际质量。
[0150] 通过输入每一批次待溯源农产品的关键特征以及关键特征的得分至质量评价模型,能够得到对应批次待溯源农产品的质量评分以及不同批次所述待溯源农产品之间的质量评分差异。
[0151] 潜在影响模块20,用于获取待溯源农产品在各项关键生长条件下的生长数据,并确定生长数据中各个极值点的潜在影响趋势,其中,潜在影响趋势与农产品质量存在映射关系,更具体的,潜在影响趋势越大表征对农产品质量影响越大,反之,则越小。
[0152] 由于任意一项的关键生长条件对农作物生长状态和质量,在各项关键生长条件处于合理范围内,并且各自之间处于相对的动态平衡时,关键生长条件对农作物所产生的几乎为正向的促进作用,且这种促进作用在单个时间段例如一天内对由农产物得到的农产品质量产生的影响较小,即利用单个时间段例如一天来判断农产品是否处于动态平衡且对质量产生了正向或反向的影响是相对片面的。而根据分析可知,对于单一关键数据对农作物的影响,其反映在该条件的实际监测数据超出农作物的生长需求所对应范围(上限或下限)的多少,以及这种情况的持续时间;例如对于降水量而言,其在短时间内出现了大暴雨,虽然此时已超出了农作物的需求范围标准,但由于其持续时间较短,因此对于农产品的质量影响较小。
[0153] 其中,潜在影响趋势是通过分析局部异常数据(包括局部超出量和缺失量),判断其局部异常状态获取得到的,这样可以避免了利用单个时间段的相关数据来判断农产品是否处于动态平衡且对质量影响的不准确,提高了不同农产品的特征代表性和准确性。
[0154] 共性确定模块30,用于根据待溯源农产品在不同关键生长条件下极值点之间的时序差异以及在相同关键生长条件下极值点之间的潜在影响趋势差异,确定不同关键生长条件之间的共性程度。
[0155] 在本实施例中,考虑到对于农作物的实际生产质量,取决于多项关键生长条件的共同影响,因此对于所谓动态平衡,即在一定时间内对于一项关键生长条件的增加,理论上若伴随其他一些具有强关联的关键生长条件即外部因素共同升高,则其对于农作物的影响会减小。由于部分关键生长条件之间存在必然的相互关系,例如降水与温度之间呈负相关,降水与光照之间的负相关,土壤pH值与降水之间的随机波动等等,因此首先获取任意两项关键生长条件的共性程度,这样避免了农产品其生长时间跨度较长所导致历史数据的短暂异常的影响弱化而使得不同批次的最终农产品具体区别差异较小,提高了最终聚簇的代表性以及准确性。
[0156] 相似确定模块40,用于根据共性程度以及质量评分差异,确定不同批次的待溯源农产品之间的相似性。
[0157] 对于任意批次的农产品,某一项关键生长条件与其他的关键生成条件之间的共性值越高,表明其自身的影响趋势本身相对较低,则此时说明当前关键生长条件所产生的实际数值波动对于农产品质量的影响较小,因此可基于潜在影响趋势、共性值这些特征对不同批次的农产品进行聚类,从而对于同一类的农产品赋予相同的溯源信息例如溯源码。
[0158] 分类上链模块50,用于根据相似性将不同批次待溯源农产品分类,并对同类别的待溯源农产品进行数据上链。
[0159] 例如,基于kmeans聚类算法,利用手肘法获取最优k,并基于上述方法对农产品批次进行聚类,进行无监督学习的聚类运算,通过数据内部的相似性将数据划分为多个簇,并且使簇内的相似度尽可能大,而簇间的相似度尽可能小,对于上述所计算出的相同簇的农产品,基于品质评分的均值对不同簇的农产品赋予质量评分相关的信息,并赋予相同簇农产品溯源信息例如溯源码,对其进行信息上链。
[0160] 本发明的面向农产品的数据信息溯源系统,通过确定所述生长数据中各个极值点的潜在影响趋势,进而分析得到影响农产品质量的外部条件中的关键生长条件在历史数据中的局部超出量或者缺失量,判断其局部异常状态以获取任意一个极值点的潜在影响趋势,避免了利用单个时间段的历史数据来判断农作物是否处于动态平衡且对质量影响的不准确,提高了不同农产品的特征代表性和准确性,同时根据所述待溯源农产品在不同所述关键生长条件下极值点之间的时序差异以及在相同所述关键生长条件下极值点之间的潜在影响趋势差异,确定不同所述关键生长条件之间的共性程度,通过对比不同关键生长条件在历史数据中的变化一致性,获取关键生长条件的数据变化共性,避免了农作物生长时间跨度较长所导致历史数据的短暂异常的影响弱化而使得不同批次的最终农产品具体区别差异较小,提高了最终分类的代表性以及准确性,保证溯源方法及系统的准确性和可信度。
[0161] 需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0162] 本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。

当前第1页 第1页 第2页 第3页
相关技术
农产品数据相关技术
数据信息相关技术
郑妍妍发明人的其他相关专利技术