您的位置: turnitin查重官网> 教育 >> 健康教育 >简述数据挖掘数据挖掘技术在网上招聘系统中和运用站

简述数据挖掘数据挖掘技术在网上招聘系统中和运用站

收藏本文 2024-03-17 点赞:10512 浏览:37457 作者:网友投稿原创标记本站原创

摘要本文将数据挖掘技术应用于名智网上招聘系统之中,通过对名智网上招聘系统数据库中的数据进行分析、对比,并对挖掘的结果作出了解释,从中发现应聘者的被录用规律,克服大家在选择专业时的盲目性,优化专业结构,提高就业效率,为有关部门的决策提供有用的信息,在一定程度上应用数据挖掘技术解决了现实问题,对本研究领域具有一定的帮助。
关键词数据挖掘关联规则网上招聘系统数据
随着网上招聘系统的日趋完善,通过网上招聘系统为用人单位提供优质人才,为应聘者提供合适职位,已成为当今社会招聘的主要形式之一。因此对网上招聘系统的研究与分析就显得尤为重要。本文通过引入数据挖掘中的的关联规则对网上招聘系统中的数据进行分析、对比,从中发现求职者的被录用规律。例如:学习什么专业的求职者更受国有企业的欢迎,学习什么专业的求职者更受独资企业的欢迎;大多数公司或者职位会优先考虑有什么特长的求职者;有工作经验的求职者是否更容易被优先录取;学习什么专业的求职者更容易找工作等等。
1数据挖掘技术概述

1.1数据挖掘概述

1995年国际第一届知识发现与数据挖掘学术会议明确提出了数据挖掘(DM,Data Mining)的概念,数据挖掘 (Data Mining)是指从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、却又潜在有用的信息和知识的过程。数据挖掘涉及到的领域广、学科多。数据挖掘引起很多领域的关注,例如数据库技术、人工智能技术、可视化技术、并行计算、数理统计等领域。数据挖掘过程可分为以下几个步骤如图1所示:

1.2数据挖掘的应用

据挖掘能够发现以前未知的模式,预测未来的趋势和行为[4]。从数据库中发现出来的知识可以应用于过程控制、信息管理、科学研究、决策支持等多个方面以及市场营销、化工、金融、医药、信用保险等多个领域,帮助企事业单位定位市场、监督交易活动、预测销售趋势、发现交易规则、优化营销策略。
数据挖掘的研究方向
数据挖掘未来的研究方向可能会集中在以下三个方面:
⑴网站的数据挖掘(Web site data mining)
⑵生物信息或基因的数据挖掘
⑶文本的数据挖掘(Textual mining)
2网上招聘系统原型

2.1网上招聘系统的数据准备

本文收集了名智网上招聘系统2年的数据,这是数据挖掘工作中相当重要的工作。此系统中可供挖掘的模块包括四个分别为:公司信息模块、招聘信息模块、人材信息模块和应聘信息模块。模块的主要信息如下:
⑴公司信息模块
公司相关信息主要包括公司名称、企业性质、公司类型、企业人数、地点等信息。
⑵招聘信息模块
公司发布的招聘信息主要包括招聘人才的性别要求、学历、工作经验、外语语种、外语等级、职位类型、职位种类、专等信息。
⑶人材信息模块
人才的相关信息主要包括姓名、学历、专业、年龄、工作经验、薪金要求等信息。
⑷应聘信息模块
记录人才对公司发布的招聘信息发布的求职信息或公司对人才发出的应聘信息。

2.2网上招聘系统的数据预处理

原始的数据虽然包含本文研究所需要的主要内容,然而它们还存在一些不足的地方,所以我们在进行数据挖掘前必须进行数据的预处理。
⑴删除无效数据
删除无效数据主要包括以下两个方面:第一,删除无用的属性;第二,删除脏的、不完整的、不一致的、无用的记录,有些用户在注册时填报的信息为错误的、不完整的、不一致的或无用的信息,这些字段都应忽略不计。
⑵数据转换
原始数据所使用的数据表不是布尔型的,与数据挖掘算法不符,所以需要对原始数据进行相应的转化,过程如下:第一,量化属性离散化:有些属性是数值属性,需要将其划分为几个区间。如公司信息表中的“公司人数”字段就是数值属性,根据取值的分布规律,我们将其划分为四个组,分别是7(50人以下)、8(

中国论文中心www.udooo.com

50到100人)、9(100到500人)和10(500人以上)。其它的数值属性可以按照此方法,将其合理的分成若干个区间,并用相应的数字表示,从而将数值属性转化为布尔类型;第二,类别属性转化:有些属性值是从备选项中选取的,如顾客信息表中的“性别”字段,将其转化为布尔型:46(女)和47(男)。其他类别属性如此类推转化为布尔类型。
3网上招聘系统挖掘结果
运用数据挖掘算法对企业的招聘过程进行数据挖掘,并得出结论。
9
从表1的规则A中得出的结论为:国有企业招聘人员中,大学本科学历的人数较多;规则B与C说明在独资企业和三资企业中,大专学历的应聘者被录用的比例较高;规则D说明有2~5年工作经验的人更容易找到工作;规则E说明有英语特长的应聘者更受企业的欢迎;规则F说明招聘市场销售人员的企业较多;规则G与H说明本科学历的应聘者比专科学历的应聘者更易找到工作。
4结束语
我们在使用数据挖掘技术对网上招聘系统的数据库进行挖掘的过程中,发现了一些平时不能引起我们注意的因素及规则,为有关部门在招生过程中对学生选择专业的方向予以正确引导,克服选择专业时的盲目性,优化专业结构,提高学生的就业率提供了帮助。选择不同的数据库进行挖掘,运用不同的阈值,挖掘出的规则不同,具体可以根据各个数据库的实际情况、挖掘的任务、目的的不同来设定,对挖掘出来的数据进行分析、总结,得出有意义的规则。
参考文献:
JIAWEI Han,MICHELINE Kamber.数据挖掘概念与技术[M].范明,孟小峰,译.北京:机械工业出版社,200

1.160—16

赵卫绩,赵文正,刘井莲.基于SQL的Apriori改进算法[J].科学技术与工程,2006,96 (17): 2759—2761.
[3]吉根林,杨明,宋余庆,孙志挥.最大频繁项目集的快速更新[J].计算机学报,2005,1(1):128—135.
[4]LIU Da—you,LIU Ya—bo,YIN Zhi—dong. Fast algorithm for discovering maximum frequent itemsets of association rules[J]. Acta Scientiarium Naturalium Universitatis Jilinensis.2004,(4):212~215.
[5]林杰斌,刘明德,陈湘.数据挖掘与OLAP理论与实务[M].北京:清华大学出版社,200

3.156—170.

[6] 桂海霞,孟祥瑞.一种基于Apriori的高效关联规则挖掘算法的研究[J]. 安徽理工大学学报(自然科学版), 2009(04):55~58.
[7] TUO Wen—li; YAO Yong. Incremental updating algorithm of maximum frequent itemsets based on FP_tree[J]. Computer Engineering and Applications.2009(19).
作者简介:
陈君(1982—),女,陕西西安人,硕士,研究方向为数据挖掘与数据库技术。
基金项目:
国家统计局课题项目(2011LY092)
渭南师范学院科研计划项目(12YKZ044)

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号