可以开始规划规划用哪些算法了
GNN?可以吗 感觉GNN的化应该是效果最好的那一批,但是时间上可能不会特别好 异常检测的算法? 先拿一个数据集来试一下
基本的算法有哪些?
UNSW-NB 15 数据集的原始网络数据包是由堪培拉新南威尔士大学网络靶场实验室的 IXIA PerfectStorm 工具创建的,用于生成真实的现代正常活动和合成的当代攻击行为的混合体。tcpdump 工具用于捕获 100 GB 的原始流量(例如,Pcap 文件)。该数据集有九种类型的攻击,即模糊器、分析、后门、DoS、漏洞利用、通用、侦察、Shellcode 和蠕虫。使用Argus、Bro-IDS工具并开发了12种算法来生成总共49个带有类别标签的特征。这些功能在UNSW-NB15_features.csv文件中进行了描述。
记录总数为 200 万条,540,044 条,存储在四个 CSV 文件中,即UNSW-NB15_1.csv、UNSW-NB15_2.csv、UNSW-NB15_3.csv和UNSW-NB15_4.csv。 地面真值表名为UNSW-NB15_GT.csv,事件文件列表名为UNSW-NB15_LIST_EVENTS.csv。 该数据集的一个分区被配置为训练集和测试集,分别为UNSW_NB15_training-set.csv 和 UNSW_NB15_testing-set.csv 。训练集中的记录数量为 175,341 条记录,测试集为不同类型、攻击和正常的 82,332 条记录。
简单看一下特征有哪些? ip有啥用?ip怎么特征化 -- IP用在搭建GNN上,但是对于普通的机器学习方法用不着
为了测试,首先把所有的特征都用上 目前做了些统计