试议遵义市遵义市农产品市场银行和预测系统开发-turnitin论文查重

摘要：银行与预测系统的支持技术主要是数据挖掘技术。该文应用基于粗糙集理论的数据挖掘技术，研究遵义市农产品市场银行与预测系统的开发。
关键词：农产品；市场；预测系统；数据挖掘；粗糙集
1009-3044(2012)27-6488-04
1概述
遵义,地处贵州北部，地理环境与气候条件优良，农产品丰富，是贵州省重要的农业基地之一。近些年来，随着市场经济的发展，遵义农产品市场竞争呈现一定的激烈现象。因此，开发区域性的农产品市场银行与预测系统，预测农产品的走势，明确农产品生产计划，组织农业生产，对于提高遵义农产品的竞争力，进而对遵义地区特色农产品有序的发展意义非凡。应用基于粗糙集理论的数据挖掘技术，建立完善的农产品市场银行与预测系统，可以科学、有效的预测农产品的走势，为遵义农业的发展提供一定的决策依据。
2开发农产品市场银行与预测系统的理论基础
农产品市场银行与预测系统的理论基础是数据挖掘技术理论。数据挖掘（Data Mining），就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。将数据挖掘应用到农产品市场的预测中，就是指在大量的农产品数据中，运用一定的算法，计算以往的数据，分析变化的趋势，预测未来一段时期内农产品的。
3遵义市农产品市场银行与预测系统的开发

3.1建立农产品信息数据仓库

建农产品信息数据仓库，主要是对农产品信息数据的处理和集成，它为预测提供了一个数据环境，是数据挖掘的预处理，是预测系统的基础。建立区域性农产品信息数据仓库，主要是建立区域性农产品信息的概念、逻辑和物理等数据模型，一般数据仓库建立过程如图1所示。
1）设计概念模型
设计概念模型是一个具体到抽象的过程，它为数据仓库的建立提供一个概念性的工具。首先是对农产品预测需求的分析。遵义市农产品预测系统的基础是对遵义市农产品在最近一段时间内的数据进行分析，确立相应的数学模型，预测农产品未来的需求量等；然后，对支持预测的数据需求分析，它主要是确定农产品预测需要的信息种类，例如，确定农产品预测需要的生产、销售、或者是库存的信息等。
图1一般数据仓库建立过程
2）设计逻辑模型
在数据仓库中逻辑模型是物理模型与概念模型之间的纽带。遵义市农产品预测系统数据仓库的逻辑模型采用的是关系数据库中的关系模型，它依据农产品的实际情况，建立一个星形架构的关系型逻辑模型，它以事实数据表和维度表，体现数据仓库的属性内容。
图2数据模型
3）设计物理模型
物理模型是整个数据仓库的具体体现形式，比如在Microsoft公司的SQL－Server 2005平台上，设计字段属性、数据的非规范化处理及数据的存放位置等，进而得到的有机体就是数据仓库的物理模型。

3.2基于数据挖掘粗糙集技术的遵义市农产品市场银行与预测

1）粗糙集(Rough Set)的概述
粗糙集是数据挖掘的方法技术之一。在1982年波兰科学家Z.Pawlak提出了粗糙集(Rough Set)理论，和传统的数据挖掘技术相比，它采用集合理论来处理不精确性和模糊性的数据，把数据根据一定的属性划分成几个论域，然后利用等价关系来分别讨论，分析内含的规律，预测未来发展的情况[3]。
2）基于粗糙集的数据挖掘算法
数据属性约简是基于粗糙集的数据挖掘算法的本质，下面，从一个二维表来简单说明这种算法。检测设某个数据仓库中的某个二维表中的记录如表1所示。
在这个记录中，论域R={s1,s2,s3,s4,s5,s6,s7,s8}，每一列都表示了一个属性，是R中一个Element的一个划分。在这里，Colour、Size及Shape是条件属性，而决策属性是通过是否稳定来表示的。这里要考虑每一个条件属性对于决策属性是否有影响，有影响的要保留下来，无影响的要去掉，也就是对条件属性进行约简。决策属性都是“Yes”的是集合{s1，s2，s5}中的元素，它在整个二维表知识系统中的前后相似也是它本身，同理“No”集合也是如此。接下来，进一步验证记录中决策属性所受到每个条件属性的影响情况。我们可以将“Colour”这个条件属性去掉，那么表1就变成表2。
用表2来表示稳定性这个概念，可以得到，决策属性都是“Yes”的是集合还是{s1,s2,s5}，它的前后相似还是它本身，同理，“No”集合也没有变化。所以，“Colour”属性不影响决策属性“Regular”，可以将它删除。然后再考虑一下去掉“Size”这个条件属性对于决策属性有没有影响。按照上述的方法，可以发现，去掉“Size”这个条件属性后，可以得到决策属性都是“Yes”的是集合是{s1,s2,s5}，但是它的前后相似集合却是{s1,s2}，说明“Size”这一条件属性对于决定属性是有影响的，不能删除，我们也把这种不可以删除的属性叫做“核”。相同道理，可得“Shape”这个条件属性也是“核”。经过简约，最终可以得到表3。
根据最终得到的表格（即表3），可以得出以下的规律：大的三角和大的方块是正常的，中、小的圆和中的方块是非正常的。这也是这个二维知识表包含的真正有用的信息。
通过基于粗糙集的数据挖掘算法对信息数据表格进行约简，从而发现规律趋势的过程，过程的步骤是：首先清理数据表中重复的记录,然后清理多余的条件属性,进一步清理每个记录中多余的属性值,得到最小约简,最后从最小约简确立具体的逻辑规则.
3）下面我们将应用这个算法，来具体的预测遵义农产品的趋势。
表4是对遵义近年九种农产品进行观察记录的结果：
能影响农产品的因素有很多，在这里我们主要讨论以下几种：a：；b：气候等外部灾害；c：宏观政策调控；d：外省农产品冲击；e：疾病等内部灾害；从上表可以发现，4和5是矛盾的，7和8是矛盾的，其它的是一致的；条件属性c和d等价，这里可以删除条件属性c或者d来讨论。另外，为了计算核，我们可以先试着去掉e来讨论，得下表5。
我们发现2和3是矛盾的，所以e是核，不能删除，同理对b和c进行检验，都属于核，不可删除。从上表可知，条件属性b、c、e是独立的，它构成了简化，于是，我们可以得到表6。
于是，我们可以得到以下的规律，对于农产品1，如果

摘自：毕业论文提纲范文www.udooo.com

没有灾害，它的是正常的，或者没有内部灾害，没有宏观调控，它的也是正常的。其它的农产品依次类推。
4结束语
农产品市场是遵义市场经济重要的组成部分之一，准确的预测农产品的市场均势，对于遵义市农产品市场健康、持续的发展，具有重大的意义。基于粗糙集理论的数据挖掘技术，与其它传统的数据挖掘技术相比，它以坚实的数学理论为基础，具有简单易操作，无需其它大量繁冗信息的特点。可以预见，基于粗糙集理论的数据挖掘技术，在遵义市的应用前景非常的广阔。
参考文献：
李艳,刘军.农产品预测系统设计与实现[J].湖北农业科学,2011(7):2976-2978.
任伟宏.农产品市场预测方法探析[J].中国农学通报,2011(27):210-212.
[3]刘洪艳，王万军.基于粗糙集的数据挖掘[J].甘肃教育学院学报:自然科学版,2012(7):17-20.
[4]王.粗糙集理论在铁路行车调度指挥系统中应用的研究[J].中国铁道科学,2004,25(4),103-107.

试议遵义市遵义市农产品市场银行和预测系统开发

3.1建立农产品信息数据仓库

3.2基于数据挖掘粗糙集技术的遵义市农产品市场银行与预测

相关论文

频道推荐

热门论文阅读

排行榜

猜你喜欢