tag 标签: 域名筛选

相关资源
  • 所需E币: 3
    时间: 2019-6-2 10:19
    大小: 1.41MB
    上传者: royalark_912907664
    传统的流量识别方法主要有基于流量行为特征的指纹信息匹配技术、深层数据包检测技术、基于端口映射的流量识别技术等。基于机器学习的识别技术是目前较为先进的一种,它利用机器学习自学习、自组织和自适应的特性,可有效解决传统流量识别方法存在实现复杂、速率慢等问题,但是由于网络环境当中存在大量的背景流量,导致机器学习的精确率较低。本文针对传统的流量识别技术和单纯机器学习方法的缺陷,提出了一种使用XGBoost机器学习模型与域名信息结合的方式进行流量识别的技术,首先分别对HTTP协议数据和HTTPS协议数据构建机器学习模型进行流量的初步识别,然后构建应用与其二级域名的映射关系。对于模型识别为正类的数据提取域名信息(HTTP提取host字段、HTTPS提取SNI域),最后根据应用与二级域名的映射关系对模型识别的结果进行二次筛选,进一步提高准确率。