技术领域
[0001] 本发明涉及一种生鲜乳检测方法,更具体地,涉及一种利用近红外光谱进行生鲜乳掺假识别的方法。
相关背景技术
[0002] 在生鲜乳中掺加水、糊精、植脂末、三聚氰胺等低成本物质以牟取商业利润是一种常见的违法行为。
[0003] 现有试纸、色谱检测方法通常是针对某一特定掺假物进行分离分析,因此识别不同掺假物需要经过不同的前处理步骤后再分别进行判定,比较费时费力。
[0004] 近期有学者采用商品奶进行了若干采用近红外技术对掺假牛奶的定性识别或定量分析的研究并取得了良好的结果。但商品奶经过了均质、灭菌等处理过程并加有添加剂及助剂等,其性状和生鲜乳有着较大差异。因此欲探索近红外技术对生鲜乳掺假识别的可行性,应以生鲜乳为基础,采用接近实际情况的方式配制掺假乳样品。
[0005] 本专利发明人曾收集了2010年6-7月期间上海市以及周边地区各个牧场未加工的生鲜乳162个,配制相同数目含氮量达标、掺水量为1%~20%的含三聚氰胺、尿素、硝酸铵的掺假乳溶液,分别采集生鲜乳样品和掺假乳样品的近红外光谱,通过比较不同光谱预处理方法及建模方法,确立最佳的近红外判别模型,结果表明采用近红外商业软件建立的判别模型对未知乳样品的判别正确率在40%左右,且无法对模型参量进行更新,而采用自开发的IS-KNN方法(改进与简化的K-最邻近法)建立的判别模型对已知掺假物类别的掺假乳的判别正确率最高可达100%,但对含有多种未知掺假物的掺假乳的判别正确率通常在80%~90%,因此,现有方法对于含有多种未知掺假物的掺假乳的判别正确率以及判别模型的参量更新维护还存在可提高的空间。
具体实施方式
[0027] 下面结合附图详细说明本发明的技术方案。
[0028] 本发明的利用近红外光谱进行生鲜乳掺假识别的方法,包括如下步骤:
[0029] 步骤(1):采集多种生鲜乳样品和掺假乳样品的近红外光谱,对应建立生鲜乳谱库和掺假乳谱库。
[0030] 通常,可以从监控区域内采集未经加工的生鲜乳样品200份左右,扫描其近红外光谱,建立生鲜乳谱库;在每份生鲜乳中加入不同类型或不同浓度的掺假溶液,作为掺假乳样品,扫描其近红外光谱,建立掺假乳谱库。
[0031] 由于放置一段时间的生鲜乳样品可能出现分层、固形物析出、脂肪析出等现象,为了得到均质的样品溶液以保证其近红外光谱的准确性,通常在光谱采集之前先将生鲜乳样品和掺假乳样品在40℃下超声处理10~20min,对于未出现分层、固形物析出、脂肪析出等现象的样品该步骤可省略。
[0032] 步骤(2):利用生鲜乳谱库和掺假乳谱库中的近红外光谱建立判别模型,校正判别模型以得到最优判别模型。
[0033] 步骤(2)的流程如图1所示,主要包括:首先,为提高判别正确率,需要剔除明显异常的近红外光谱,例如可使用T检验剔除离群的近红外光谱;然后,通过SNV、MSC或一阶导方法对剔除离群样本后的近红外光谱集进行预处理,以消除信号漂移、噪声等对光谱的干扰;接下来,采用SVM方法建立判别模型,并采用留三分之一或四分之一法对判别模型进行校正,从而得到最优判别模型。
[0034] SVM方法是Cortes和vapnik于1995年首先提出的一种基于统计学理论的机器学习方法,目前已被广泛用于模式识别、函数拟合、回归估计、密度估计、数据挖掘、三维识别、遥感图像分析和非线性控制等众多领域。本发明创造性地将其运用于生鲜乳的掺假识别中。具体步骤如下:
[0035] (1)训练前检查与空值处理;
[0036] (2)对由生鲜乳谱库和掺假乳谱库中的近红外光谱组成的建模集做主成分分析,选取主成分及其载荷向量;
[0037] (3)从建模集中选取训练集和检验集,轮流进行训练与检验;
[0038] (4)采用“一对一”方法进行训练,共产生n(n-1)/2个分类超平面,其中n为类别数;
[0039] (5)当n>2时,即用于多类识别问题时,需要对分类超平面引入模糊隶属函数,建立样本集的判别函数;
[0040] (6)统计判别正确率,校正判别模型参量。
[0041] 其中,可从建模集中选取三分之一或四分之一的光谱作为检验集,其余光谱作为训练集。例如,假设建模集中共有S1-S15共15个样本,每次取其中1/3作为检测集,第一次S1、S4、S7、S10、S13作为检测集,其它作为训练集;第二次S2、S5、S8、S11、S14作为检测集,其它作为训练集;第三次S3、S6、S9、S12、S15作为检测集,其它作为训练集;如此,每个样本都可轮流做一次检验集。利用训练集建立判别模型,利用检验集检验该判别模型的判别正确率,从而不断校正判别模型参量,得到最优判别模型。
[0042] 对于完全不同的两类物质,采用IS-KNN方法和采用SVM方法建立的判别模型的判别正确率相差并不大,这适用于未知乳样品中含有已知掺假物的情况,可以针对该具体掺假物进行判别。然而在实际检测中,未知乳样品中可能含有多种掺假物并且并不预先知道掺假物的具体成分,这种情况下,由于SVN方法的学习功能好,适应性宽,其中嵌入的模糊隶属函数对判别难以归类的样本有优势,因此采用SVM方法建立的判别模型的判别正确率较高,通常在90%以上,其中掺假乳被识别出的正确率更高一些,可达95%。
[0043] 步骤(3):采集未知是否掺假的未知乳样品的近红外光谱,利用最优判别模型对未知乳样品的近红外光谱进行判别,从而得到未知乳样品的判别结果。
[0044] 为了得到均质的未知乳样品,以保证其近红外光谱的准确性,当未知乳样品出现分层、固形物析出、脂肪析出等现象时,也需首先将该未知乳样品在40℃下超声处理10~20min。然后采集未知乳样品的近红外光谱,并利用最优判别模型进行判别,从而得到该未知乳样品的判别结果。
[0045] 如图2所示,若未知生鲜乳样品的判别结果为假,则需对该未知乳样品进行确证,例如采用液相色谱、质谱等方法进行确证。若确证结果为假,则可将该未知乳样品的近红外光谱加入掺假乳谱库,从而不断扩充掺假乳谱库中的光谱数量,以便更新和优化最优判别模型。优选地,当掺假乳谱库中每添加一个新的近红外光谱时,相应地从该谱库中删除一个采集日期最早的样品的近红外光谱,从而维持该谱库中光谱数量的稳定。若判别结果为假,而确证结果为真,则将该未知乳样品的近红外光谱单独置于一类假阳性谱库,作为特殊样本的比对参考。
[0046] 步骤(4):利用已知是否掺假的已知乳样品的近红外光谱对最优判别模型进行更新和维护。
[0047] 由于生鲜乳本身可能随着季节等因素变化而存在较大差异,用于生鲜乳掺假识别的最优判别模型需要进行更新和维护。可定期采集已知是否掺假的已知乳样品的近红外光谱,利用最优判别模型对已知乳样品的近红外光谱进行判别,得到已知乳样品的判别结果,若已知乳样品的判别结果与实际类别一致,则将已知乳样品的近红外光谱加入其判别结果对应的谱库;若已知乳样品的判别结果与实际类别不一致,则将已知乳样品的近红外光谱作为异常样本保存,当异常样本累积超过预设数目时,将异常样本加入其实际类别对应的谱库,从而更新和优化最优判别模型。优选地,当生鲜乳谱库或掺假乳谱库中每添加一个新的近红外光谱时,相应地从该谱库中删除一个采集日期最早的样品的近红外光谱,从而维持该谱库中光谱数量的稳定。
[0048] 以上所述的,仅为本发明的较佳实施例,并非用以限定本发明的范围,本发明的上述实施例还可以做出各种变化。即凡是依据本发明申请的权利要求书及说明书内容所作的简单、等效变化与修饰,皆落入本发明专利的权利要求保护范围。