恶意软件检测数据集

我的研究方向事安卓恶意软件检测,所以我说的恶意软件检测大多数情况下默认指安卓恶意软件检测(如果是windows、物联网恶意软件我会特别说明)

恶意软件检测这个研究方向的数据集和常规的深度学习应用研究方向(例如入侵检测、apt检测)基本采用标准数据集来进行科研工作不同。
恶意软件检测的数据集大多数论文都是自己构建,从各种公开良性、恶意的apk网站或者apk数据集网站下载并组合成自己的数据集。

所以构建自己的数据集是大部分人的科研第一步

目前所知的恶意软件检测的公开apk数据集和网站

Drebin

CIC-MalDroid2020

CIC-AndMal2017

VirusShare

androzoo

AMD

自己的数据集

  • CIC2020数据子集3800个apk
  • 数据集2012年(2010-2012)
    • drebin的恶意软件(5000)+ AndroZoo 良性软件(8000)
  • 数据集2013-2016
    • VirusShare 2016年 恶意软件 + 2016年 AndroZoo 良性软件
  • 数据集2020年(2017-2018)
    • CICMalware2020 恶意软件、良性软件
  • 数据集最新2019-2023


恶意软件检测数据集介绍


VirusShare下载了种子文件,从种子文件下载了部分apk数据集

使用筛选恶意软件检测引擎检测数=0(写一个筛选条件公式和下载伪代码)

其他研究方向

CIC IDS 2017

Virus-MNIST:基准恶意软件数据集 (图像分类数据集)