结构关系序列模式挖掘 |
陈伟如 计算机科学系 技术 沈阳化工学院 技术 沈阳中国 Welc@ Cina网站 鄯善陈 计算机科学系 技术 沈阳化工学院 技术 沈阳中国 54 C33 @ 163.com 张扬 计算机科学系 技术 沈阳化工学院 技术 沈阳中国 苏家洋@163.com 抽象-结构关系模式(SRP)挖掘是 建议挖掘序列之间的关系, 关系通常隐藏在序列模式后面。 并发序列模式(CSP)和排他模式 序列模式(ESP)是SRP的两个重要组成部分, 称为结构关系顺序模式(SRSP)。在 在前人的研究中,重新定义了SRSP的概念; 讨论了SRSP的性质; 对SRSP的挖掘进行了研究。所有这些构成了一个理论。 结构关系模式的进一步研究基础 以及相关的挖掘算法。SRSPs挖掘具有重要意义 在实际应用中与序列模式挖掘一样。 关键词顺序模式挖掘;结构关系 模式;结构关系顺序模式;并发 关系;排他关系 一、引言 结构关系模式(SRPs)挖掘[1]是一种新的挖掘方法。 基于 序列模式挖掘[2]用于寻找 通常隐藏的新结构关系模式 在顺序模式之后。SRP挖掘在 实际应用与序列模式挖掘相同。 图挖掘[4.5]、树挖掘[6]和偏序 采矿[7-9]都类似于SRP采矿。从 挖掘对象,偏序挖掘更类似于 SRP挖掘,但其结构关系有限; 偏序的扩展。 并发序列模式(CSP)和排他模式 序列模式(ESP)是SRP[1]的两个重要组成部分。 总的来说,以前的研究已经奠定了良好的基础。 进一步研究SRP的基础。但是,为了 并发和排除的定义 忽略了序列之间的关系。因此,一些 用相对关系重新定义概念,以便 海量对序列间关系的影响 可以避免客户序列数据库,并且 序列间关系模式较少,但 可以发现更多的相关性。然后,采矿 结果更全面、更有意义。 二。结构关系模式的定义 A.序列之间的结构关系 序列之间的结构关系包括 并行关系、排他关系、有序关系 以及迭代关系。并发关系与独占 下面讨论这种关系。 定义1:并发关系 相对于序列c,序列α1,α2,…,αn形成a 并发关系,如果它们可以同时出现在 序列c,由[α1+α2+...+αn]c表示。特别地, 序列α和β可以同时按顺序出现 c,用[α+β]c表示。 定义2:排他关系 相对于序列c,序列α1,α2,…,αn形成一个 排他关系,如果 序列α1,α2,…,αn出现在序列c中,表示为 [α1-α2-...-αn]c。特别地,只有一个α和β序列 以序列c出现,由[α-β]c表示。 例1。 对于给定的客户序列数据库(CSDB) CSDB={<a(a,b,c)(a,c)d(c,f)>,<(a,d)c(b,c)(a,c)>,<(e,f)(a,b) (d,f)cb>,<eg(a,f)cbc>}, a.序列<dcb>和<fbc>按顺序包含 <(e,f)(a,b)(d,f)cb>和<eg(a,f)cbc>,即: <cb><(e,f)(a,b)(d,f)cb>和 <fbc><(e,f)(a,b)(d,f)cb>, 然后[<cb>+<fbc>]<(e,f)(a,b)(d,f)cb>。 和 <fbc><eg(a,f)cbc>, 然后[<cb>+<fbc>]<eg(a,f)cbc> 同样地, b)[<fbc>-<a(b,c)(a,c)>]<(a,d)c(b,c)(a,c)>, [<f b c>-<a(b,c)(a,c)>]<eg(a,f)c b c> 上面讨论的每个结构关系都基于 序列,例如序列c。 B.结构关系顺序模式 假设序列模式集(SP)是 在给定的CSDB中进行序列模式挖掘,请考虑 SP序列模式之间的结构关系, 一些称为Str.al的序列模式集 关系顺序模式(SRSP),包括 顺序模式,并发顺序模式, 独占序列模式,将在给定条件下构建 条件。 在下面的小节中,CSDB是给定的客户 序列数据库,SP是序列模式集 在CSDB中挖掘,表达式|{...}表示以下内容的大小 收藏。 定义3:并发度 序列模式α和β的并发度 在SP中定义为客户数量的分数 使α和β满足并发关系的序列 包含α或β的客户序列的数量。 公式是: 2009年计算机科学研究挑战国际会议 978-0-7695-3927-0/09$26.00_2009 IEEE DOI 1 |