(12)发明专利申请
(10)申请公布号 CN 112134634 A(43)申请公布日 2020.12.25
(21)申请号 202010930938.9(22)申请日 2020.09.07
(71)申请人 华东计算技术研究所(中国电子科
技集团公司第三十二研究所)
地址 201800 上海市嘉定区嘉罗路1485号(72)发明人 张靖雯 江波 赵华 徐悦 (74)专利代理机构 上海段和段律师事务所
31334
代理人 李佳俊 郭国中(51)Int.Cl.
H04B 17/382(2015.01)H04B 17/391(2015.01)
权利要求书2页 说明书5页 附图1页
CN 112134634 A()发明名称
基于随机森林算法的频谱感知方法、系统及介质(57)摘要
本发明提供了一种基于随机森林算法的频
步骤1:通过天线谱感知方法、系统及介质,包括:
接收信号,根据高阶累积量计算公式,将信号训练数据集转换成特征样本集;步骤2:构造决策树,对特征样本集进行筛选,形成子样本集和子特征集;步骤3:计算子特征集中每个特征在子样本集中的平均值;步骤4:根据特征和平均值计算信息增益率,将信息增益率最大的特征作为节点;步骤5:根据节点划分子样本集,构建决策树;步骤6:根据决策树构建随机森林;步骤7:使用待测试样本集对随机森林进行测试,得到测试样本信号的调制类型。本发明算法通过离线方式训练出信号分类器,集成到认知无线电系统的射频前端模块,减少了无线电系统的时间成本。
CN 112134634 A
权 利 要 求 书
1/2页
1.一种基于随机森林算法的频谱感知方法,其特征在于,包括:步骤1:通过天线接收信号,根据高阶累积量计算公式,将信号训练数据集转换成特征样本集;
步骤2:构造决策树,对特征样本集进行筛选,形成子样本集和子特征集;步骤3:计算子特征集中每个特征在子样本集中的平均值;步骤4:根据子特征集中每个特征和平均值计算信息增益率,将信息增益率最大的特征作为节点;
步骤5:根据节点划分子样本集,完成决策树的构建;步骤6:根据决策树构建随机森林,用于对后续接收信号的感知;步骤7:使用待测试样本集对随机森林进行测试,得到测试样本信号的调制类型。2.根据权利要求1所述的基于随机森林算法的频谱感知方法,其特征在于,高阶累积量计算公式为:
C20=cum(s[n],s[n])=M20C21=cum(s[n],s*[n])=M21
C41=cum(s[n],s[n],s[n],s*[n])=M41-3M20M21
其中C20表示接收信号的二阶累积量;M20表示接收信号的二阶矩;cum(x,x)表示接收信号的联合累积函数;s[n]表示主用户信号;n表示对主用户信号采样点数;s*[n]为s[n]的共轭形式;
任一接收信号的特征表示为:xi表示第i个接收信号的特征矩阵;i表示第i个接收信号;N表示接收信号样本的数量。3.根据权利要求1所述的基于随机森林算法的频谱感知方法,其特征在于,所述步骤2包括:从N个样本中有放回地随机抽取n次,从M个特征中有放回地随机抽取m次,剔除重复样本和重复特征,形成子样本集和子特征集。
2
CN 112134634 A
权 利 要 求 书
2/2页
4.根据权利要求1所述的基于随机森林算法的频谱感知方法,其特征在于,所述步骤5包括:若划分后的样本类别属于同一类,则节点化为叶子节点;若划分后的样本类别不纯,则重复执行步骤3和步骤4,直到无法划分,完成决策树构建。
5.根据权利要求1所述的基于随机森林算法的频谱感知方法,其特征在于,所述步骤6包括:判断决策树数目是否达到预先设定的棵树,若没有达到,则重复执行步骤2至步骤5;若达到设定数目,则随机森林构建完成。
6.根据权利要求1所述的基于随机森林算法的频谱感知方法,其特征在于,将经过测试得到的测试样本信号的调制类型与测试样本信号的实际调制类型比对,得到随机森林的算法准确率,根据准确率的大小调整决策森林的参数,包括决策树的个数,使算法准确率达到预设要求。
7.一种基于随机森林算法的频谱感知系统,其特征在于,采用权利要求1-6中任一种所述的基于随机森林算法的频谱感知方法,包括:
离线训练模块:记录历史接收信号的数据样本,并进行滤波、放大和频谱下搬移,将接收信号的数据样本转换为基带数据样本,计算数据的高阶累积量,得到用于机器学习训练的特征样本,使用随机森林算法训练学习得到信号分类器;
在线识别模块:接收信号后根据信号分类器判断信号类型,并输出结果进行信号处理。8.一种存储有计算机程序的计算机可读存储介质,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
3
CN 112134634 A
说 明 书
基于随机森林算法的频谱感知方法、系统及介质
1/5页
技术领域
[0001]本发明涉及频谱感知技术领域,具体地,涉及一种基于随机森林算法的频谱感知方法、系统及介质。背景技术
[0002]决策树:决策树是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。决策树是一种十分常用的分类方法。他是一种监管学习,所谓监管学习就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。[0003]随机森林:随机森林算法是一种集成多个弱分类器(决策树)的集成机器学习算法。在处理回归问题时,随机森林融合多个决策树的输出结果,取平均数作为算法的输出结果;在处理分类问题时采用投票机制,随机森林算法的结果为多个决策树输出结果中票数最多的类别。通过这种方式,随机森林算法克服了决策树的过拟合问题,大大提高了判决准确性
[0004]高阶累积量:高阶累积量是指阶数大于二阶的累积量。它的谱,即高阶累积量谱,是指相应的高阶累积量的傅立叶变换。高阶累积量不仅可以自动抑制高斯噪声的影响,而且也能够抑制对称分布噪声的影响。[0005]软件无线电:是一种无线电广播通信技术,它基于软件定义的无线通信协议而非通过硬连线实现。频带、空中接口协议和功能可通过软件下载和更新来升级,而不用完全更换硬件。
[0006]认知无线电:相对于软件定义无线电而言,拥有软件无线电不具备的智能功能如:通过人工智能技术从环境中感知信息、动态使用频谱、实时改变无线通信系统的传输功率等。
[0007]授权频段:国家对无线电频率是有管制的,授权频段一般是军方、航空等重要部门使用的,一般民众不得使用,如果私自使用可能会给航空、军事带来一定麻烦或损失,严重的要承担法律责任。[0008]主用户:认知无线电系统中,被授予资格能够使用授权频段的用户。[0009]频谱空洞:授权频段中主用户暂时未使用到的频段部分。[0010]现有的研究主要集中于探测授权频段中主用户的存在性,寻找频谱空洞,以此实现频谱资源的高效利用。但是随着软件无线电的进步,单纯地感知主用户存在与否已经无法满足通信领域中的多元发展需求,需要能够感知到更多的电磁信息,如接收信号的信号参数或者空间电磁环境参数。本发明解决了如何实时探测接收信号调制类型的问题。[0011]专利文献CN102611509A(申请号:201110021713.2)公开了一种频谱感知方法、频谱感知设备和数据库,其中,频谱感知方法包括:向数据库发送频谱感知请求消息,以使数据库获取目标感知频点信息和对应的目标感知软件标识,接收来自所述数据库的频谱感知
4
CN 112134634 A
说 明 书
2/5页
响应消息,获取所述目标感知软件标识对应的目标感知软件,运行所述目标感知软件,对目标感知频点进行频谱感知。
发明内容
[0012]针对现有技术中的缺陷,本发明的目的是提供一种基于随机森林算法的频谱感知方法、系统及介质。
[0013]根据本发明提供的基于随机森林算法的频谱感知方法,包括:[0014]步骤1:通过天线接收信号,根据高阶累积量计算公式,将信号训练数据集转换成特征样本集;[0015]步骤2:构造决策树,对特征样本集进行筛选,形成子样本集和子特征集;[0016]步骤3:计算子特征集中每个特征在子样本集中的平均值;[0017]步骤4:根据子特征集中每个特征和平均值计算信息增益率,将信息增益率最大的特征作为节点;[0018]步骤5:根据节点划分子样本集,完成决策树的构建;[0019]步骤6:根据决策树构建随机森林,用于对后续接收信号的感知;[0020]步骤7:使用待测试样本集对随机森林进行测试,得到测试样本信号的调制类型。[0021]优选的,高阶累积量计算公式为:[0022]C20=cum(s[n],s[n])=M20[0023]C21=cum(s[n],s*[n])=M21
[0024][0025][0026][0027]
C41=cum(s[n],s[n],s[n],s*[n])=M41-3M20M21
[0028]
[0029]
[0030][0031]
其中C20表示接收信号的二阶累积量;M20表示接收信号的二阶矩;cum(x,x)表示接
收信号的联合累积函数;s[n]表示主用户信号;n表示对主用户信号采样点数;s*[n]为s[n]的共轭形式;
[0033]任一接收信号的特征表示为:
[0034]
5
[0032]
CN 112134634 A[0035]
说 明 书
3/5页
xi表示第i个接收信号的特征矩阵;i表示第i个接收信号;N表示接收信号样本的
数量。
优选的,所述步骤2包括:从N个样本中有放回地随机抽取n次,从M个特征中有放回
地随机抽取m次,剔除重复样本和重复特征,形成子样本集和子特征集。[0037]优选的,所述步骤5包括:若划分后的样本类别属于同一类,则节点化为叶子节点;若划分后的样本类别不纯,则重复执行步骤3和步骤4,直到无法划分,完成决策树构建。
[0038]优选的,所述步骤6包括:判断决策树数目是否达到预先设定的棵树,若没有达到,则重复执行步骤2至步骤5;若达到设定数目,则随机森林构建完成。[0039]优选的,将经过测试得到的测试样本信号的调制类型与测试样本信号的实际调制类型比对,得到随机森林的算法准确率,根据准确率的大小调整决策森林的参数,包括决策树的个数,使算法准确率达到预设要求。
[0040]根据本发明提供的基于随机森林算法的频谱感知系统,包括:[0041]离线训练模块:记录历史接收信号的数据样本,并进行滤波、放大和频谱下搬移,将接收信号的数据样本转换为基带数据样本,计算数据的高阶累积量,得到用于机器学习训练的特征样本,使用随机森林算法训练学习得到信号分类器;[0042]在线识别模块:接收信号后根据信号分类器判断信号类型,并输出结果进行信号处理。
[0043]根据本发明提供的一种存储有计算机程序的计算机可读存储介质,所述计算机程序被处理器执行时实现上述的方法的步骤。[0044]与现有技术相比,本发明具有如下的有益效果:[0045]1、本发明算法能够通过离线方式训练出信号分类器,集成到认知无线电系统的射频前端模块,减少了无线电系统的时间成本;[0046]2、本发明经过仿真实验与分析,可以发现所提出的算法在低信噪比情况下依然能够较为准确地实现频谱感知。
附图说明
[0047]通过阅读参照以下附图对非性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:[0048]图1为感知系统模型图。
具体实施方式
[0049]下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。[0050]实施例:
[0051]本发明研究了一种基于随机森林的频谱感知算法,该算法利用高阶累积量形成感知信号的特征,作为判断主用户存在性和主用户信号调制方式的依据,使用C4.5算法训练
6
[0036]
CN 112134634 A
说 明 书
4/5页
形成随机森林分类器,克服了决策树算法的单分类器带来的过拟合问题。[0052]具体实施步骤:[0053]步骤1:根据高阶累积量计算公式,将信号训练数据集转换成高阶累积量特征样本集。
[00]高阶累积量计算公式如下:[0055]C20=cum(s[n],s[n])=M20[0056]C21=cum(s[n],s*[n])=M21
[0057][0058][0059][0060]
C41=cum(s[n],s[n],s[n],s*[n])=M41-3M20M21
[0061]
[0062]
[0063][00][0065][0066]
任一接收信号的特征可以表示为:
步骤2:构造一棵决策树。从N个特征样本中有放回地随机抽取n次,从M个特征中有
放回地随机抽取m次,并剔除重复样本和重复特征,形成子样本集和子特征集。[0068]步骤3:由于高阶累积量是连续变量,需要计算子特征集中每个特征在子样本集中的平均值,以此作为节点依据。[0069]步骤4:根据特征与abs(Cx)的大小关系和子样本集数据,计算类别信息熵、条件信息熵、信息增益、信息熵和信息增益率。选出最大信息增益率的特征作为本次节点依据。
[0070]步骤5:根据节点划分子样本集,若划分后的样本类别属于同一类,则该节点化为叶子节点。若划分后的样本类别不纯,则重复步骤3、4,直到无法划分,完成决策树构建。
[0071]步骤6:判断决策树数目是否达到预先设定的棵树,若没有达到,则重复步骤2至5;若达到设定数目,则随机森林构建完成。[0072]步骤7:使用测试样本集对构建的随机森林进行测试。[0073]图1为感知系统模型图,主要由离线训练模块和在线识别模块构成。离线训练模块首先记录历史接收信号的数据样本,接着对这些数据样本进行滤波、放大、频谱下搬移等数
7
[0067]
CN 112134634 A
说 明 书
5/5页
据预处理操作,将接收信号数据样本变为基带数据样本。接着计算数据的高阶累积量,得到用于机器学习训练的特征样本,最后使用随机森林算法训练学习得到信号分类器。在线识别模块接收到信号,经过一系列的数据处理后,可以使用信号分类器方便快捷地判断出信号类型,并输出结果用于后续的信号处理工作。[0074]本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
[0075]以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
8
CN 112134634 A
说 明 书 附 图
1/1页
9
图1
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- efsc.cn 版权所有 赣ICP备2024042792号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务