摘 要: | 基于入侵检测视角,选取服务器登录日志作为实验基础,将在分析服务器登陆日志入侵检测时常用的K-means、DBSCAN以及改进MajorClust等三种聚类算法进行原理分析,并从参数设置、运行效率以及准确度等方面进行综合比较,总结三种聚类算法在网络犯罪侦查中的适用情况。实验结果表明,就针对服务器登录日志的电子数据取证过程而言,K-means算法较重依赖于电子数据取证人员的经验及数据实际情况,适合于内容有明显差异的记录集;DBSCAN算法实现容易且效率较高,对稠密的数据有良好的运行能力,适用于时效性较强的侦查工作;而改进的Majorclust算法无需预先设置参数,可以适应各种文本数据集且准确度最优,适合针对犯罪的精准打击。
|