数字图书馆Web数据挖掘技术在数字图书馆中运用查抄袭率-turnitin论文查重

摘要：随着信息技术的高速发展，人们积累的数据量也急剧增加，Web数据挖掘技术作为处理数据的专项技术，其优越性能在许多领域都有所体现。针对Web数据挖掘技术在数字图书馆中的应用进行研究，分别从Web数据挖掘的难点、XML在Web数据挖掘中的应用以及Web数据挖掘技术在数字图书馆个性化怎么写作中的应用三个方面展开分析，以促进Web数据挖掘技术的不断完善，使它能够为数字图书馆提供更好的怎么写作。
关键词：XML；Web；数据库；数据挖掘；数字图书馆
1672-7800（2013）001-0131-03
0引言
信息时代带动了网络技术的高速发展，随着人们对数据知识量需求的增大，图书馆的功能也逐渐趋向于多元化，数字图书馆是一种建立在传统图书馆基础上的信息环境。图书馆的信息化及网络化使得图书馆可以将知识和信息进行分布式储存，它除了具备传统图书馆的功能外还能向用户提供各种智能化的访问怎么写作。分布数据存储是利用站点的存储功能，将数据信息储存在多个站点当中，用户只需利用网络的搜索功能就能实现信息的搜索。网络数据挖掘就是根据人们对网络信息怎么写作需求的原理制作而成，它能为用户快速提供网络信息检索及信息怎么写作等。
1Web数据挖掘的难点

1.1Web信息量大且更新迅速

数据仓库中的数据相对其它数据而言更加稳定，随着网页信息容量的不断增大，信息的更新速度使得搜索引擎无法发挥其功能。尽管搜索引擎的规模在不断扩大，但仍无法适应网页的更新速度，在信息的跟踪、管理和收集上都存在一定的局限性。虽然网络带宽也在逐渐扩大，相关处理技术也不断更新，但在网页搜索引擎方面仍达不到快速、全面的要求，相对特定用户而言，绝大部分网络信息都属于垃圾信息，因此，对网页的数据挖掘应根据用户需求设定一个范围。

1.2Web信息获取困难

早期的网页信息多以HTML文件的形式存在，简单的HTML文件使得Web挖掘工具能够轻而易举地获取到信息，且Web站点并未设置相关防护措施。随着数据库技术和语言的不断拓展，网络页面信息也从静态发展成动态，大部分信息和数据都是直接从数据库中调用，因此，网页抓取工具对网页的访问受到了限制。另外，还有部分站点可以对网页抓取工具进行分辨，一旦被认定为不友好的访问即禁止该工具的访问权限或转向其它页面。

1.3异构数据库环境

相对数据仓库而言，可以将Web看成一个信息复杂且容量巨大的大型数据库，网页上的一个站点就相当于一个数据源，站点与站点之间的组织方式和信息各不相同，因此，Web就成了一个容量巨大的异构数据库环境。根据用户需求可对本地数据库的数据来源进行设置，但Web上的数据来源则无法实现统一，若要挖掘Web上的数据，首先应解决站点之间异构数据库环境的集成问题，只有集成站点数据才能统一数据来源。
2XML在Web数据挖掘中的应用

2.1实现异构数据的集成管理

XML是一种数据模型，它具有结构性，因而用户很容易就能将其与关系数据库的属性相互对应，所以在模型的查询和抽取方面都能进行精确的记录。针对站点之间的组织方式和信息的不同，XML都可以有效地解决，即使数据不具备结构性也不处于同一站点，XML也能将其规范到一个统一的数据库上。在中间层的怎么写作处理器上安装软件写作技巧，使得数据可以在后端数据库上集成。

2.2将大部分处理负载从Web怎么写作器转到Web客户端

无论是在数据挖掘过程中还是在Web挖掘过程中，数据处理都是一个很重要的环节。怎么写作器端是对数据进行预处理的主要部分，其开发环境是参照传统的C/S模式，根据客户向怎么写作器发送的请求，怎么写作器进行处理后给予不同的响应，大量的数据处理使得怎么写作器的负荷不断加重，同时也增加了网络管理者的工作量。显然，这种处理方式只适合简单的用户需求，一旦用户需求繁杂而多变，怎么写作器端就可能陷入瘫痪状态。XML可让客户端根据自身需求选择相应的程序，用户在接收数据的同时，系统也解析了数据的含义与结构，使得分布式计算在图书馆中的运用成为可能。

2.3促进数据交换

在Web数据挖掘中，结构不同的数据源之间通常需要传递业务数据，基于XML的数据自带描述功能，不需要借助系统内部的描述就能完成数据的交换与处理。借助XML用户对本地数据的计算和处理就更为简便，将数据用XML格式发送给用户，用户通过应用软件解析数据即可实现对数据的编辑和再处理。不同的数据具有不同的传递标准，而XML并没有具体的数据传递规范，因而XML具有自动理解功能。

2.4需要Web智能写作技巧根据个人用户的需求裁减信息内容

传统的HTML主要是通过对数据的外

源于：查抄袭率本科论文www.udooo.com

观进行描述，XML则是通过对数据的类别进行描述。XML具有选择数据显示方式的功能，而数据的显示方式决定了数据的表现能力，因而XML在数据显示中具有较大影响。另外，XML还具有裁减和编辑信息的功能，具体的处理方式需根据用户的不同需求进行处理。在数据传递标准方面，XML并没有对数据进行具体的规范，因而程序能自动理解XML传递数据的规范。
3Web数据挖掘技术在数字图书馆个性化怎么写作中的应用

3.1发现用户的兴趣爱好

Web站点的设计具有一定的结构，页面与子页面之间的组织通常是按照子页面的类别进行排列的，从用户访问的Web站点就能得知用户的兴趣爱好。通过分析用户浏览页面所用的时间及页面字符数目就能得知用户的喜好，当用户对某个页面内容感兴趣时，花费的时间就越长，反之就越短，因此，可以通过挖掘用户浏览时间信息及路径信息来统计页面或商品的受欢迎程度。具体算法如下：
Step1：在Web网页中选取一定范围内的Weblog文件，将文件进行预处理；

源于：毕业设计论文模板www.udooo.com

数字图书馆Web数据挖掘技术在数字图书馆中运用查抄袭率

1.1Web信息量大且更新迅速

1.2Web信息获取困难

1.3异构数据库环境

2.1实现异构数据的集成管理

2.2将大部分处理负载从Web怎么写作器转到Web客户端

2.3促进数据交换

2.4需要Web智能写作技巧根据个人用户的需求裁减信息内容

3.1发现用户的兴趣爱好

相关论文

频道推荐

热门论文阅读

排行榜

猜你喜欢