您的位置: turnitin查重官网> 工程 >> 电气工程 >> 电气化铁道 >关联图像数据库关联规则挖掘策略址

关联图像数据库关联规则挖掘策略址

收藏本文 2024-03-04 点赞:4199 浏览:11203 作者:网友投稿原创标记本站原创

摘要:在多媒体应用中,图像数据库的使用日趋广泛,为了更有效地使用图像数据库,许多数据挖掘技术被用于图像数据库中。本文使用数据挖掘中的关联规则方法来进一步提高图像数据库的性能,基于此构建了一个图像数据库系统,在这个系统中使用了FP增长算法挖掘图像数据的关联规则。
关键词:图像数据库数据挖掘 FP增长算法
1007-9416(2012)10-0083-02
1、引言
随着计算机网络的发达及多媒体应用的日益广泛,各种图像、音频、视频数据在信息交互中成为出现最多的信息载体,尤其是图像信息,能使用直观的画面呈现出丰富的信息。然而在庞大的图像数据库中查找出相关数据,将图像画面内容与非图像内容特征建立联系,是高效使用图像数据的保障。近年来,为了提高图像数据库的性能,数据挖掘技术被应用到图像数据库中。本文使用数据挖掘中的关联规则方法来进一步提高图像数据库的性能,并基于此构建了一个图像数据库系统,在这个系统中使用了FP增长算法挖掘图像数据的关联规则。

2、图像数据库中的关联

数据挖掘是知识发现过程的一个步骤,从存放在数据库、数据仓库或其他信息库中的大量数据中发现有用的知识的过程。面对图像数据库里庞大的数据量,如何高效地查询出有用的数据,简单的字段匹配方法无法应用于图像数据的匹配,无法作出是否关联的判断。而数据挖掘技术能通过相应的方法将图像数据的特征与存储的数据联系在一起,挖掘出两者的关联规则。因此,使用数据挖掘技术能有效找出图像数据的关联规则,从而查询出有用图像数据。
数据的关联主要关注的是满足最小支持度阈值和最小置信度阈值的关联规则。图像数据与一般的数据相比,其特征都是包含在图片信息中,因此,在图像数据库中可以挖掘涉及多媒体对象的关联规则,至少要包含以下三类:
第一,图像内容和非图像内容特征间的关联。图像内容是图片上体现的具体内容,而非图像内容特征则是对具体内容的描述或分类的描述。在进行图像搜索等处理过程中需要把这两者建立有效的关联。

二、与空间联系无关的图像内容间的关联。此关联考虑的都是图像内容。

三、与空间联系有关的图像内容间的关联。此关联把图像中的对象与空间联系关联在一起。

3、基于图像数据的FP增长算法

FP增长算法是可以避免重复地扫描数据库,不使用候选集,采取分治的策略,直接压缩数据库成一个频繁模式树,但仍保留项集关联信息。然后将压缩后的数据库划分成一组条件数据库,每个关联一个频繁项,并分别挖掘每个条件数据库,最后生成关联规则。
首先将每个图像数据的属性设计为图像内容项、非图像内容项描述。其中图像内容项描述包括与空间联系有关的图像内容项和与空间联系无关的图像内容项。其次,完成图像数据的输入和存储操作,形成图像数据库D;一副图像用Ts表示,一个属性项用item_name表示;设最小支持度阈值为min_sup1,具体算法步骤如下:
步骤1:按以下步骤构造FP树:
(a)扫描图像数据库D一次。收集频繁项的集合F和它们的支持度计数。对F按支持度计数降序排序,结果为频繁项列表L。例如:图像内容项里有50%为蓝色而非图像内容特征描述为“天空”,则只要满足这种关联的图像作为一次计数。
(b)创建FP树的根节点,以“null”标记。对于D中的每个数据Ts(即一副图像),执行:选择Ts中的频繁项,并按L中的次序排序。设排序后的Ts中频繁项列表为[p|P],其中,p是第一个元素,而P是剩余元素列表。调用insert_tree([p|P],T)。该过程执行情况如下:如果T有一个子女N使得N.item_name=p.item_name,则N的计数增加1;否则创建一个新节点N,将其计数设置为1,链接到它的父节点T,并且通过节点链结构将其链接到具有相同item_name的节点。如果P非空,递归地调用insert_tree(P,N)。
步骤2:FP树的挖掘通过调用FP_growth(FP_tree,null)实现。该过程实现如下:
procedure FP_growth(Tree,α)
(1) ifTree含单个路径Pthen
(2) for each路径P中节点的每个组合(记作β)
(3) 产生模式β∪α,其支持度计数support_count等于β中节点的最小支持度计数;
(4) else for Tree的头表中的每个ai{
(5) 产生模式β=ai∪α,其支持度计数support_count=ai. support_count;
(6) 构造β的条件模式基,然后构造β的条件FP树Treeβ;
(7) ifTreeβ≠? then
(8) 调用FP_growth(Treeβ,β);}

4、图像数据库系统

为了挖掘图像数据特征之间的关联,在FP增长算法中将每一个图像看作一个事务,找出在不同图像中频繁出现的模式。在图像数据库中挖掘关联规则主要注意以下几方面:
第一,挖掘特征描述之间的关联规则。在数据库建立阶段将一个图像包含的多个对象以及每个对象包含的多个特征都进行特征的描述,当做一个图像的属性。如颜色、形状、纹理、关键词和空间位置,这些特征之间可能存在许多的关联。在很多情况下,两个图像的某个特征在某种分辨率下是相同的,但在更细的分辨率下则是不同的。所以在此步骤还采用一种推进分辨率逐步求精的方法。即可以首先在一个相对较粗的分辨率下挖掘频繁出现的模式;然后,在更细的分辨率下挖掘时仅关注那些满足最小支持度阈值的图像。这是因为在粗分辨率下不频繁的模式,不可能在细分辨率下频繁。这种多分辨率挖掘策略显著降低了总体数据挖掘的代价,而又不损害数据挖掘结果的质量和完全性。这种方法也通常应用于大规模图像数据库中挖掘频繁项集和关联。
第二,挖掘一个图片内部对象重复出现的关联规则。由于包含多个重复出现对象的图片是图像分析的一个重要特征,在关联分析中不应忽视同一对象的重复出现问题。例如,一幅包含两个金色圆形的图片与只有一个圆形的图片是截然不同的。这就需要对支持度和置信度做好定义。
第三,挖掘图像数据对象间空间数据的关联规则。在图像数据对象间通常存在着重要的空间联系,如之上、之下、之间、附近、左右边等。这些特征对于探查对象关联和相关非常有用。空间联系与其他基于内容的图像特征,如颜色、形状、纹理和关键词等一起,可以形成重要的关联。这样,空间数据挖掘方法和拓扑空间联系特征对图像数据挖掘显得十分重要。
本文采用较常使用的扩充关系数据库方式建立图像数据库,这种方式能为后续将要进行的关联规则挖掘提供相应图像数据属性项,同时避免数据查询和演播的限制[3]。建立的图像数据库系统结构图如下图1所示。
关联规则挖

源于:论文格式字体要求www.udooo.com

掘模块使用FP增长算法挖掘出图像数据库中的关联规则,形成图像数据关联规则库,进行查询时,将条件与关联规则库中的关联规则结合使用,从而在图像数据库中查找出符合条件的图像数据,通过输出模块显示出结果[4]。
5、结语
图像数据的特殊性决定了对图像数据操作方法与一般事务数据不同,在对图像数据进行查询使用时,有效的关联规则可以极大地节约对图像数据库处理的时间。在数据挖掘方面目前也有很多不同的方法,如FP增长算法也有不同的改进算法[5],因此,对图像数据库的关联规则挖掘方法也存在很多有待改进的地方。
参考文献
Jiawei Han,Micheline Kamber,范明,孟小峰译.数据挖掘概念与技术[M].机械工业出版 社,2007,7:156-159.
王新宇,杜孝平,谢昆青.FP_growth算法的实现方法研究[J].计算机工程与应用,2004,9.
[3]郭京,徐海燕.多媒体数据库技术[J].科技信息,2009,11.
[4]曾步衢,孔银昌.浅谈多媒体数据库系统的设计和实现[J].福建电脑,2008,8.
[5]陈志强.对FP-增长算法的一种优化改进[J].科技资讯,2008,10.

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号