您的位置: turnitin查重官网> 工程 >> 网络工程 >收集新闻收集体系设计和实现结论

收集新闻收集体系设计和实现结论

收藏本文 2024-01-25 点赞:6052 浏览:20451 作者:网友投稿原创标记本站原创

摘要:为了使用户更加方便地查看新闻信息,不受时间或是网络资源等条件的制约,也可以做为自动生成新闻网页的新闻类网站提供信息来源,该系统以面象对象的设计思想,采用Ja语言,凭借Eclipse3.1的开发工具,对新浪网站新闻信息进行了搜集。在可移植性和可维护性等方面有较好的体现。其中运用了多线程的方法对新闻信息进行了快速的下载、整理与收集,为用户查阅新闻信息提供了方便,节省了大量时间。
关键词:面象对象;多线程;新闻搜集;正则表达式
1009-3044(2013)20-4620-04
随着信息交流的发展,人们对信息的需求量不断增大,需求速度不断提升,然而,人们对于信息获取的途径主要停留在以往的那些方式。无非就是来源于各种媒介,但是,这些方式已经远远不能满足需求。从经济性和实用性等多方面考虑,开发一个新闻搜集系统很有必要。
该系统对新浪网站的有用新闻进行了搜集,从方便性和实用性的角度为用户考虑,完成了对有用信息的搜集和整理,大大节省了用户宝贵的时间。

1 设计背景

1.1 获取信息的现状

面对芜杂的信息海洋,如何获取想要的信息,这对于每个人来说都是一个大问题。我们平时怎么接触信息的呢?平面媒体是获取信息的重要来源,如报纸、书刊、电视、网络等等。但是这些在时间范围、地域范围或是内容范围都存在一定的缺陷。

1.2 提高效率

目前,信息获取存在很多的弊端,收听广播不知道什么时候有新闻节目;看电视,浏览时间长,缺乏系统性;打电话,费用贵,不合算;所以上网是最好的方法了,网上信息非常丰富,但是,上网固然可以获取信息,但如果只是一味的没有目的的看,浪费时间。所以,为了提高获取网络信息的效率,该文以新浪网站为例,开发了对新浪网站的新闻搜集系统。

1.3 新闻信息搜集系统

1.3.1 定义

新闻信息搜集系统(News information collection system)是将新闻信息作为信息搜索对象,按一定的标准进行收集、分类、加工以及存储。

1.

3.2 功能

1)在本地机上建立相应路径; 2)实现对新闻信息的收集与下载;
3)对收集的信息进行分类、加工以用存储。

2 系统设计与实现

系统的设计分为五个类和两个接口,用多线程的方法实现了对新浪新闻网站的分析与下载。

2.1接口的设计

1) Directory接口:提供一个静态的公用字符串变量和两个抽象的没有返回值方法。以供MkDir类实现,用来创建下载页面所存放的目录和路径。
2) DownLoad接口:提供三个抽象的没有返回值的公用方法和一个boolean类型的抽象方法。以供ThreadLoadPage类、AnalyzeDown类和 ThreadLoadIndex类实现,

源于:毕业论文指导记录www.udooo.com

完成不同的下载任务。

2.2 类的设计

MainProgram类: 主程序的启点,也是Main()方法的所在。首先,创建MkDir类的实例,完成对下载路径的建立;然后,实例线程ThreadLoadIndex并启动它。
MkDir类:实现了Directory接口,主要负责保存路径的创建。
ThreadLoadIndex类:继承于Thread类,实现了DownLoad接口,下载新浪网站的首页。等待首页下载完成之后,创建AnalyzeDown的实例。
AnalyzeDown类:实现了DownLoad接口,对下载的首页进行分析,得到需求新闻的URL,保存到URL.txt文件中。分析URL.txt文件,得到相关字符串和保存路径字符串,然后实例线程ThreadLoadPage并传入以上得到的两个字符串,再能过Start()方法启动线程。
ThreadLoadPage类:实现了DownLoad接口,下载网页。

3 总流程图

3.1 主程序类

程序引入了两个包ja.util.* 和jax.swing.JOptionPane,Main()方法一开始,首先,创建MkDir类的实例,完成对下载路径的建立;然后,实例线程ThreadLoadIndex并启动它。接着,是一个条件永远为真的死循环,作用是每隔一秒查看ThreadLoadIndex线程是否已经执行完毕,如果完毕则弹出一个信息提示,显示对新浪网站的下载与分析完毕,否则,继续每隔一秒查看一下。

3.2 路径的建立

该功能主要由MkDir类实现。引入了ja.io.*包、ja.util.* 包和 ja.text.SimpleDateFormat包,实现了Directory接口,继承接口中的静态变量HOME_PATH和方法。

3.3 首页的下载

该功能主要由ThreadLoadIndex线程类实现。引入了ja.io.*包和ja.util.*,继承于Thread类,并且实现了DownLoad接口,主要功能是下载新浪网站的首页。等待首页下载完成之后,创建AnalyzeDown的实例。
流程图如图2。
该类有一个构造函数public ThreadLoadIndex(String ThreadName)、一个Run()方法和一个Down()方法,构造函数实现对变量的初始化。在Run()方法,内,调用Down()方法对新浪网站的首页进行下载,等待下载完成,再实例化AnalyzeDown类。
对流的操作要有相应的异常处理。最后关闭输入流和输出流。返回Run()方法。完成首页下载。

源于:论文封面www.udooo.com

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号