摘要:随着国内电子商务业务的快速进展,网络钓鱼对互联网金融以及支付领域的威胁不断增加,网络钓鱼检测技术日益受到安全人员的关注。现有对钓鱼网页的识别主要是依靠用户和黑白名单过滤机制完成的,目前的钓鱼网页识别技术还有着很多不足之处,本论文主要针对现有技术中的不足加以改善,设计并完成一个更加改善的钓鱼网页识别系统。首先介绍网络钓鱼攻击的危害以及现有针对网络钓鱼的防范技术,通过对网络钓鱼案例的具体浅析,细致地总结网络钓鱼攻击的主要特点和具体流程。然后介绍现有的网络钓鱼检测技术的具体实现历程,并浅析其不足之处。针对现有的检测策略的不足,借鉴后向选择算法的思想,在信息获取、网站特点提取、分类器训练以及对疑似网络钓鱼网页的检测等历程加以优化,提出了基于RFE-SVM算法的针对钓鱼网页检测的思路,并设计了一种改善的钓鱼网页识别策略,以实现更高效、更准确、更有针对性的检测。论文主要以钓鱼网站URL的特点和页面特点综合考虑,通过仔细比较钓鱼网站与合法网站的属性特点,以网站的URL及Web页面中提取特点参数,用特点函数表示每一维特点分量,结合SVM分类器的分类输出权重参数对特点子集进行选择,在不影响分类效果的前提下,消除不重要特点,降低特点向量的维度,提升分类效率。最后利用大量的合法网站以及钓鱼网站进行检测实验,并对实验数据进行了详细的浅析和比较,总结影响实验结果的各种因素。实验结果表明,改善后的钓鱼网页识别策略在一定程度上提升了对钓鱼网页的识别率,并具有较好的推广能力。关键词:网络钓鱼论文网络爬虫论文支持向量机论文特点向量论文
摘要4-5
Abstract5-8
1 绪论8-14
1.1 课题背景及探讨作用8-10
1.2 国内外探讨概况10-12
1.3 主要探讨内容12-13
1.4 论文组织结构13-14
2 相关的钓鱼攻击及检测论述技术14-25
2.1 网络钓鱼攻击14-18
2.2 现有网络钓鱼检测机制及不足18-20
2.3 SVM 分类算法20-24
2.4 本章小结24-25
3 钓鱼网页检测模型设计25-41
3.1 样本获取及网页分类信息抽取25-26
3.2 钓鱼网页的特点选择与提取26-32
3.3 特点函数算法表示32-34
3.4 钓鱼网页特点向量空间模型的算法设计34-40
3.5 本章小结40-41
4 钓鱼网页分类识别系统的设计与部分实现41-51
4.1 总体设计41-42
4.2 特点向量空间模型的建立和实现42-45
4.3 分类器模块的设计与实现45-47
4.4 其他功能模块实现47-50
4.5 本章小结50-51
5 实验及结果浅析51-56
5.1 实验环境51
5.2 实验历程51-52
5.3 实验结果与浅析52-55
5.4 本章小结55-56
6 总结与展望56-58
6.1 总结56-57
6.2 工作展望57-58
致谢58-59