技术领域
[0001] 本发明涉及光谱技术领域,具体地,涉及一种甜味剂无损快速检测方法。
相关背景技术
[0002] 甜味是人类的五种基本味觉感知之一,甜味感知在营养成分指导性摄取、情绪情感价值等方面有着重要的影响。甜味剂是甜味感知的主要来源,可分为天然甜味剂及人工甜味剂。甜味剂种类繁多,目前常见的甜味剂有20余种。不同种类的甜味剂甜度差异大、价格悬殊;人工合成的甜味剂营养价值较低,长期摄入人工合成甜味剂对人体健康存在潜在威胁。因此,对甜味剂的种类进行识别鉴定具有重要的意义。
[0003] 在外观上,甜味剂一般为白色或透明的晶体、粉末,难以通过肉眼进行直接区分。当前,甜味剂的检测方法主要有高效液相色谱、气相色谱法、质谱法等;这些方法精度高、适用范围广,但存在预处理步骤复杂、检测繁琐耗时、依赖大型昂贵设备等问题。
[0004] 经检索,申请公开号为CN113484300A的中国发明专利,公开一种测饮料中添加剂的方法,通过便携式拉曼仪进行检测,并结合表面增强拉曼光谱技术,对饮料中添加的甜味剂(阿斯巴甜、纽甜和糖精钠)和防腐剂(山梨酸钾、苯甲酸钠、2,4‑二氯苯氧乙酸和对羟基苯甲酸甲酯钠)进行定性和定量分析。该方法仅针对三种甜味剂(阿斯巴甜、纽甜和糖精钠)特定特征峰的强度值进行单变量分析,模型中只有一个特征峰强度值输入,忽略了甜味剂极其丰富的拉曼光谱特征峰信息,容易造成不同种类间相似光谱信息的混淆,抗干扰能力差,无法实现多种类甜味剂类别属性的智能识别。
具体实施方式
[0062] 下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
[0063] 参照图1,本发明一实施例提供的甜味剂无损快速检测方法,包括:
[0064] S1、获取甜味剂的拉曼光谱;
[0065] S2、对拉曼光谱进行预处理;
[0066] S3、对预处理后的拉曼光谱进行数据增强;
[0067] S4、利用主成分分析方法,对数据增强后的拉曼光谱进行特征提取及降维;
[0068] S5、基于特征提取及降维后的拉曼光谱,构建甜味剂的拉曼光谱‑支持向量机模型;
[0069] S6、根据模型,对待测样品进行甜味剂无损快速识别。
[0070] 本发明实施例中的方法,结合拉曼光谱法和支持向量机,可直接检测颗粒、粉末、晶体等性状甜味剂,无需改变甜味剂既有性状,从而实现无损、快速的甜味剂检测识别,克服了现有甜味剂检测方法难以适应快速化、现场化、低成本、大批量检测的问题。本发明实施例中的方法无需额外耗材,成本低廉、检测效率高,可以满足大批量样品检测识别的需求。
[0071] 在一些实施方式中,获取甜味剂的拉曼光谱,包括:开启拉曼光谱设备,开启激光,调节激光与样品的相对距离使激光光斑聚焦于甜味剂样品表面;对每个甜味剂样品采集多次拉曼光谱,优选地,对每个甜味剂样品采集三次光谱,每次光谱采集的积分时间为1‑10s;将多次采集的拉曼光谱求平均获得每个甜味剂样品的原始拉曼光谱,nsam个甜味剂样品的拉曼光谱构成原始光谱矩阵:nsam×nvar维S矩阵,其中nsam为甜味剂样品数量,nvar为输入变量数量。
[0072] 在一些实施方式中,对拉曼光谱进行预处理,包括:对拉曼光谱依次进行基线校正、平滑和标准化处理。
[0073] 基线校正采用多项式拟合方法,拟合公式为:
[0074] Scor=S‑B;
[0075]
[0076] 其中,Scor为经基线校正的拉曼光谱矩阵,S为原始拉曼光谱矩阵,B为多项式拟合基线对应的矩阵,B=[b1,…,bnsam],bnsam为第nsam个bj;x为光谱拉曼位移,ai为多项式系数,i=0,1,2,…,n,n为阶数,ai由最小二乘法确定,优选阶数为5,以降低由荧光效应主导的基线漂移影响。
[0077] 平滑采用Savitzky‑Golay滤波法,通过一个移动窗口对窗口内部元素做多项式最小二乘拟合,得到窗口中心位置处元素平滑后的值;优选地,窗口宽度为9,阶数为2,以降低噪声干扰并充分保留甜味剂光谱特征。
[0078] 标准化采用公式为:
[0079]
[0080] 其中,s0为原始光谱强度值,smin为对应光谱强度值的最小值,smax为对应光谱强度值的最大值,s为经标准化处理的光谱强度值。经过标准化处理的光谱数据数值在[0,1]区间,标准化处理可以减少量纲等因素对模型分析的影响。
[0081] 在一些实施方式中,对预处理后的拉曼光谱进行数据增强,其中:数据增强方法包括叠加平均法和噪声添加法,利用数据增强可以扩增甜味剂拉曼光谱数据,提高后续模型鲁棒性。
[0082] 叠加平均法采用的公式为:
[0083]
[0084] 其中,YAve为经过叠加平均后生成的拉曼光谱,m为随机选取的甜味剂拉曼光谱数量,Yi为随机选取的经预处理的甜味剂拉曼光谱;
[0085] 噪声添加法采用的公式为:
[0086] Ynos=Yj+noise;
[0087] 其中,Ynos为经过噪声添加后生成的拉曼光谱,Yj为随机选取的经预处理的甜味剂拉曼光谱,noise为高斯噪声、泊松噪声和叠加乘性噪声中的任意一种;优选地,noise为均值为0、标准差为0.01‑1的高斯噪声,以模拟光谱采集过程中仪器、测量等因素引起的随机噪声,从而提高模型的鲁棒性;
[0088] 经数据增强后,获得用于后续计算的甜味剂拉曼光谱矩阵Y为:naug×nvar维矩阵Y,矩阵Y的表达式为:
[0089]
[0090] 其中naug为经过数据增强扩增后的拉曼光谱数量,nvar为输入变量数量。
[0091] 在一些实施方式中,利用主成分分析方法,对数据增强后的拉曼光谱进行特征提取及降维,其中,主成分分析方法包括:
[0092] 将矩阵Y标准化并计算相关系数矩阵R:
[0093]
[0094] 其中,rij为相关系数(i,j=1,2,…,nvar),计算公式为:
[0095]
[0096] 计算特征值λi和特征向量ui;
[0097] 利用特征向量 组成新的主成分分量,第1至第nvar个主成分分量的表达式为:
[0098]
[0099] 计算累计贡献率,并根据累计贡献率确定主成分个数并生成降维后的输入变量矩阵Z,其中m个主成分分量的累计贡献率Cm的计算公式为:
[0100]
[0101] 根据累计贡献率Cm的值,确定选取主成分分量的数量,从而确定甜味剂拉曼光谱数据降维后的维度。优选地,选择主成分分量个数m使Cm大于等于70%,将nvar个输入变量的光谱矩阵 转换成仅有m个输入变量的主成分分量矩阵Z=[Z1,Z2,…,Zm],大大降低了计算量,同时尽量更大程度保留光谱矩阵Y的特征信息(70%以上)。
[0102] 上述实施例利用主成分分析进行甜味剂拉曼光谱特征提取及降维,可以大大降低计算量。
[0103] 在一些实施方式中,基于特征提取及降维后的拉曼光谱,构建甜味剂的拉曼光谱‑支持向量机模型,包括:
[0104] 以输入变量矩阵Z为输入变量,将naug个数据随机分为k份,每份含有naug/k组数据,其中k‑1份为训练集,1份为测试集;
[0105] 选择支持向量机Kernel核函数,将k‑1份数据输入支持向量机模型,训练Kernel核函数参数并在测试集中测试,确定模型判别准确率;
[0106] 交叉验证k次,确认Kernel核函数的参数,包括最优惩罚因子C、γ、多项式阶数等参数。
[0107] 在一些实施方式中,Kernel核函数为线性核函数(Linear Kernel)、高斯函数(Gaussian Kernel,又称径向基核函数,RBF Kernel)、多项式核函数(Polynomial 2
Kernel)、卡方核函数(X Kernel)和直方交叉核函数(Histogram Intersection Kernel)中的任意一种。
[0108] 在一些实施方式中,根据模型,对待测样品进行甜味剂无损快速识别,包括:封装光谱预处理、主成分分析、支持向量机模型Kernel核函数及相应参数;输入待测样品的拉曼光谱,实现待测样品中甜味剂无损快速检测,即甜味剂种类信息无损快速识别。
[0109] 上述实施例中的基于拉曼光谱法和支持向量机的甜味剂无损快速检测方法,首先检测获取甜味剂拉曼光谱;接着对原始拉曼光谱进行基线校正、平滑、标准化预处理;并采用随机叠加平均、噪声添加方法进行光谱数据增强,增强模型鲁棒性,提高模型泛化能力;然后采用主成分分析法对甜味剂拉曼光谱进行特征提取及降维,提高模型计算效率;再采用k折交叉验证法,利用经预处理、数据增强、降维的光谱数据集构建并训练支持向量机模型;最后根据所确定的模型参数封装模型,并利用该模型进行甜味剂无损快速识别。上述方法可以克服现有方法预处理步骤繁琐、检测耗时的缺点,实现无损、快速的甜味剂种类识别。
[0110] 拉曼光谱技术是一种快速、无损、非接触的分析手段,拉曼光谱可以反映待测样品的分子结构信息,即“分子指纹”,具有较高的特异性,上述实施例中的方法,结合拉曼光谱法和支持向量机,利用拉曼光谱法获取甜味剂的分子指纹信息,进一步利用机器学习模方法对甜味剂光谱特征(分子指纹信息)进行分析建模,可直接检测颗粒、粉末、晶体等性状甜味剂,无需改变甜味剂既有性状,实现非接触、非破坏的甜味剂种类鉴定,实现甜味剂的快速无损检测。由于采用小型便携式拉曼光谱设备获取甜味剂分子结构信息,无需复杂耗时的预处理步骤,从而能够胜任甜味剂现场化快速检测的需求。上述实施例中的方法无需额外耗材,成本低廉、检测效率高,可以胜任大批量样品检测识别的需求。上述实施例中的方法可以实现多类别(大于等于10类)甜味剂的快速检测识别,样本规模依赖性低、计算量小、准确率高。
[0111] 以更加具体的实施例对本申请的技术方案作更进一步地说明。
[0112] 本实施例提供一种甜味剂无损快速检测方法,具体包括以下步骤:
[0113] 首先进行甜味剂拉曼光谱检测;
[0114] 采用便携式小型拉曼光谱仪采集10类甜味剂:L‑阿拉伯糖、阿斯巴甜、安赛蜜、白砂糖、赤藓糖醇、甘露糖醇、海藻糖、麦芽糖醇、糖精钠、甜蜜素的拉曼光谱图。选取激发光波长为785nm,设定激发功率为200mw,积分时间为5s。将甜味剂样品平铺于测试玻片,调整激发光与样品之间的距离,使激光光斑聚焦于甜味剂样品表面。每个样品采集3次拉曼光谱并求平均,以降低随机噪声对甜味剂光谱获取的的影响。截取甜味剂拉曼光谱,使其光谱范围‑1在350‑1800cm 。测试10类甜味剂,每类30个样品,300组甜味剂拉曼光谱组成原始光谱矩阵S。图2为10类常见甜味剂拉曼光谱图,由图2可知,不同种类甜味剂拉曼光谱形态各异,具有较高的特异性。
[0115] 对甜味剂拉曼光谱依次进行预处理、数据增强、特征提取;
[0116] 采用多项式拟合法对原始光谱矩阵S中的光谱数据进行基线校正,设置多项式阶数为5,背景b的表达式为:
[0117] b=a0+a1x+a2x2+a3x3+a4x4+a5x5
[0118] 多项式系数a0,a1,a2,a3,a4,a5由最小二乘法确定,将原始光谱s减去背景b,即获得经过基线校正处理的甜味剂拉曼光谱数据。采用Savitzky‑Golay滤波法对经过基线校正的光谱数据进行平滑滤波,设定窗口宽度为9,阶数为2。采用Min‑Max标准化方法对经基线校正、平滑滤波的光谱数据进行标准化处理,Min‑Max标准化通过以下公式进行计算处理:
[0119]
[0120] 其中,s0为原始光谱强度值,smin为对应光谱强度值的最小值,smax为对应光谱强度值的最大值,s为经标准化处理的强度值。经过标准化处理的光谱数据数值在[0,1]区间,标准化处理可以减少量纲等因素对模型分析的影响。
[0121] 采用叠加平均法、噪声添加法对经预处理的甜味剂拉曼光谱进行扩充。叠加平均法通过以下公式进行计算处理:
[0122]
[0123] 其中,YAve为经过叠加平均后生成的拉曼光谱,m为随机选取的甜味剂拉曼光谱数量,Yi为随机选取的经预处理的甜味剂拉曼光谱。
[0124] 噪声添加法通过以下公式进行计算处理:
[0125] Ynos=Yj+noise;
[0126] 其中,Ynos为经过噪声添加后生成的拉曼光谱,Yj为随机选取的经预处理的甜味剂拉曼光谱。本实施例中noise为均值为0、标准差为0.01‑1的高斯噪声。在本实施例中,300组甜味剂拉曼光谱经随机叠加、噪声添加处理后扩增为600组,构成光谱数据矩阵Y。按照7:3的比例将矩阵Y拆分为Y1、Y2,分别作为训练集(含测试集)、验证集。
[0127] 计算矩阵Y1的相关系数矩阵,计算特征值、特征向量,计算主成分分量的累积贡献率。本实施例中,前5个主成分分量的累积贡献率为80.41%,选定主成分Z1,Z2,Z3,Z4,Z5为输入变量,构成如下所示矩阵Z。输入变量个数由878个减少为5个,大大降低了计算量,提升了计算效率。
[0128]
[0129] 图3为10类常见甜味剂在PC1‑PC2‑PC3三维主成分空间中的分布图,由图3可知,10类常见甜味剂在PC1‑PC2‑PC3三维主成分空间中呈现出明显的聚类特征。
[0130] 甜味剂拉曼光谱‑支持向量机模型构建与样品检测;
[0131] 以矩阵Z为输入变量,将Y1(420组数据)随机划分为10份,每份含有42组数据,其中9份为训练集,1份为测试集。本实施例中,选取高斯核函数构建甜味剂拉曼光谱‑支持向量机模型,高斯核函数的主要参数为C、γ。将9份数据输入支持向量机模型,训练高斯核函数参数并在测试集中测试,计算模型判别准确率。交叉验证10次,取平均准确率作为模型评价指标。以平均准确率为指标,采用网格搜索法,确定最优高斯核参数C、γ,实现甜味剂拉曼光谱‑支持向量机模型构建。本实施例中,选取C为0.1、γ为1,判别准确率为99.76%。
[0132] 将数据预处理(基线校正、平滑滤波、标准化处理)、特征提取(主成分分析)、甜味剂拉曼光谱‑支持向量机模型的各参数进行封装,对待测甜味剂进行拉曼光谱检测,输入封装模型中,输出甜味剂种类判别结果,实现甜味剂无损快速识别。本实施例中,以Y2(180组数据)作为验证数据集输入特征提取(主成分分析)、甜味剂拉曼光谱‑支持向量机模型,判别准确率为99.44%,从而证明了基于拉曼光谱法和支持向量机的甜味剂检测方法具有较高的准确率,可以用于甜味剂的无损、快速识别。
[0133] 以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。上述各优选特征在互不冲突的情况下,可以任意组合使用。