技术领域
[0001] 本发明涉及信号处理技术领域,特别是一种基于机器学习的无人机检测方法。
相关背景技术
[0002] 当前主要有三种检测无人机的方法:基于雷达的无人机检测法,基于音视频的无人机检测法以及基于无线电的无人机检测法,各种探测方法的优点与不足如表1所示。
[0003] 表1各种探测方法的优点与不足
[0004]
[0005] 使用雷达对无人机信号进行探测是目前最为完善的方案,但雷达探测系统成本过于昂贵,且仅对大且高速移动的目标有效,而无人机是低速低空飞行平台,具有较小的雷达截面,即低速小型(LSS)平台,雷达探测法对于无人机目标存在探测效能不足的问题,另外,雷达的另一个缺点是耗电量大,无法全天候工作;而由于音频视频的检测设备存在一定的局限性,使音视频探测法作用的距离较短,同时环境也会对音频和视频的检测产生较大的影响,如大雾天气时摄像头无法捕捉无人机的图像、嘈杂环境中麦克风无法捕捉无人机发出的音频等情况;无线电探测法通过频谱检测对无人机信号进行探测,使用射频传感器来采集无人机通信信号,其优点是成本较低,运算量较小,不会产生回波干扰。
具体实施方式
[0042] 下面结合附图对本发明的实施例进行详细说明。
[0043] 实施例
[0044] 如图1所示,一种基于机器学习的无人机检测方法,主要指对指定范围内的无人机图传信号进行检测的算法,包括:
[0045] S1、数据预处理:对接收机采集的2.4Ghz‑2.5Ghz无人机频段频谱数据进行数据滤波处理,去除噪声影响。常用的平滑滤波方法有低通滤波、中值滤波以及均值滤波,经过比较,平滑处理效果较好的是中值滤波法,因此选取中值滤波作为信号平滑处理的方案。
[0046] 具体的,定义原频谱序列为x(i‑N),…,x(i),x(i+N)。定义奇数长L的窗口,(L=2N+1,N为正整数)。对L个信号样本进行排序,取i处的样本值作为中值滤波的输出值,如y(i)=Med[x(i‑N),…,x(i),x(i+n)]。滤波前后仿真图如图2和图3所示:
[0047] 从图2和图3可知,滤波前信号毛刺过多,对后续信号提取造成干扰,经过中值滤波后信号曲线更加平滑。
[0048] S2、信号提取:对预处理后的数据进行信号提取操作,提取出与无人机信号带宽相似的所有信号。
[0049] 具体的,定义频段数据的频率步进step(Khz)从整个频段中找出带宽大于5Mhz的所有信号,定义频段内提取出的信号集合 其中n为频段内的带宽大于5Mhz的信号数量,单个信号表示为 其中,k为单个
信号总采样点数。提取出的无人机信号与非无人机信号仿真图如图4和图5所示。
[0050] 从图4和图5可得,无人机信号的频谱曲线相对非无人机信号包络在频谱两侧更加陡峭,带内平坦。
[0051] S3、数据标准化:为了统一比较的标准,保证结果的可靠性,所有提取出来的信号进行z‑score标准化处理。
[0052] 具体的,对输入信号数据进行标准化,需要使用其均值和标准差,将原始信号数据的标准差映射为1,经过处理后的数据符合正态分布(均值为0,标准差为1)。也叫标准差归一化。标准化公式如下:
[0053] 求得原序列 的平均值μ,原序列的标准差σ,求得标准化后的序列
[0054] S4、特征提取:通过在数据中提取足够数量的特征,可以最大限度地减少机器学习分类器过度拟合的问题。对标准化后的信号数据进行特征提取操作,包括信号带宽、变异系数、峰度、波动率,作为区分无人机与非无人机信号的不同数据特征。
[0055] 具体的,带宽是信号的基本特征;变异系数用来衡量数据的发散程度,是数据标准差与平均值的比值;峰度用来衡量数据分布相对于正态分布是否更尖或平坦,高峰度数据在均值附近有明显峰值,下降很快并且有重尾,低峰度在均值附近往往为平坦的顶部;波动率定义为某次数据标准化后的90分位值‑10分位值;
[0056] 变异系数、峰度、波动率的计算公式如下:
[0057] 定义μ为序列 的平均值,σ为序列 的标准差,n为序列总样点数:
[0058] 定义变异系数为CV:
[0059]
[0060] 定义峰度为K:
[0061]
[0062] 定义波动率为wave rate:
[0063]
[0064] 其中,Y=quantile(X,p)为百分位数计算,其中X是向量或矩阵,p是百分位数,取值范围为[0,1],数学意义为:对于向量X,P{X<=Y}=p。
[0065] 具体的特征图6‑图9所示,图6‑图9给出了无人机信号和非无人机信号的四种特征统计曲线。从图中可以看出单从一种特征对无人机信号进行检测是存在虚警的,因此需要联合多维度特征进行判别。
[0066] S5、无人机信号检测:根据所给出的信号的各特征值,使用机器学习算法进行无人机信号检测,若发现无人机信号则输出无人机信号参数。
[0067] 具体的,将提取到的无人机图传信号和非无人机的特征数据整合到一起,并给无人机信号和非无人机信号打上标签形成数据集。将数据集放入机器学习中的随机森林算法进行检测,得到检测结果。随机森林算法中树数目与袋外错误率分布如10所示。
[0068] 在机器学习中机器预测的和实际的还是会有所偏差,所以本实施例引入准确率,精确率和召回率来评价分类器的优良。将分类表示为两类,一类为正类,一类为负类,TP表示无人机被预测为无人机,TN表示非无人机被预测为非无人机,FP表示非无人机被预测为无人机,FN表示无人机被预测为非无人机。
[0069] 准确率(Accuracy):就是全部预测准确的(无人机被预测为无人机和非无人机被预测为非无人机的和)占所有预测的比重,公式定义如下所示:
[0070]
[0071] 精确率(Precision):也被称为查准率。无人机被预测为无人机占全部预测为无人机(无人机被预测为无人机和非无人机被预测为无人机的和)的比例。也就是真正预测为无人机的占所有预测为无人机的比例,公式定义如下所示:
[0072]
[0073] 召回率(Recall):也被称为查全率。即无人机被预测为无人机的占实际为无人机(无人机被预测为无人机和无人机被预测为非无人机的和)的比例。就是真正预测为无人机的占所有实际为无人机的比例,公式定义如下所示:
[0074]
[0075] 由于数据集中,非无人机的数据量远大于无人机的数据量,所以使用调和均值Fscore,公式定义如下所示:
[0076]
[0077] 使用统计指标检测概率(the probability of detection,POD),公式定义如下所示:
[0078]
[0079] 累计成功指数(cumulatives success index,CSI),公式定义如下所示:
[0080]
[0081]
[0082] 以上所述实施例仅表达了本发明的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。