ImageVerifierCode 换一换
格式:PPT , 页数:56 ,大小:1.64MB ,
资源ID:322202     下载积分:13.98 金币    免费下载
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付 微信扫码支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.aqrzj.com/docdown/322202.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(机器学习-FPGROWTH算法(56页).ppt)为本站会员(人民至上)主动上传,安全人之家仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知安全人之家(发送邮件至316976779@qq.com或直接QQ联系客服),我们立即给予删除!

机器学习-FPGROWTH算法(56页).ppt

1、机器学习-FP-GROWTH算法,李家豪,1,目录,2,回忆Apriori算法,3,项集:项的集合称为项集,即商品的组合。k项集:k件商品的组合,不关心商品件数,仅商品的种类。频繁项集:如果项集的相对支持度满足给定的最小支持度阈值,则该项集是频繁项集。强关联规则:满足给定支持度和置信度阈值的关联规则支持度:support(A-B)=P(AB)置信度:confidence(A-B)=P(A|B),回忆Apriori算法,4,回忆Apriori算法,5,Apriori算法的挑战,6,挑战 多次数据库扫描 巨大数量的候补项集 繁琐的支持度计算改善Apriori:基本想法 减少扫描数据库的次数 减少候

2、选项集的数量 简化候选项集的支持度计算,FP-GROWTH算法优点,相比Apriori算法需要多次扫描数据库,FPGrowth只需要对数据库扫描2次。第1次扫描事务数据库获得频繁1项集。第2次扫描建立一颗FP-Tree树。,7,FP-GROWTH算法原理-实例1,要找总是一起购买的商品,比如薯片,鸡蛋就是一条频繁模式(规律)。,8,FP-GROWTH算法原理-实例1-统计频次,Step1:先扫描数据库,统计所有商品的出现次数(频数),然后按照频数递减排序,删除频数小于最小支持度的商品。设最小支持度数为:minsup=4统计频数:牛奶6,鸡蛋7,面包7,薯片7,爆米花2,啤酒4,黄油2.降序排序

3、:薯片7,鸡蛋7,面包7,牛奶6,啤酒4(删除小于minsup的商品),9,频繁1项集,记为F1,FP-GROWTH算法原理-实例1-重新排序,10,Step2:对每一条数据记录,按照F1重新排序。,FP-GROWTH算法原理-实例1-建立FP树,10,Step3:把第二步重新排序后的记录,插入到fp-tree中Step3.1:插入第一条(第一步有一个虚的根节点),FP-GROWTH算法原理-实例1-建立FP树,10,Step3.2:插入第二条。根结点不管,然后插入薯片,在step3.1的基础上+1,则记为2;同理鸡蛋记为2;啤酒在step3.1的树上是没有的,那么就开一个分支。,FP-GRO

4、WTH算法原理-实例1-建立FP树,10,Step3.3:插入第三条,FP-GROWTH算法原理-实例1-建立FP树,10,同理,剩余记录依次插入fp-tree中。,FP-GROWTH算法原理-实例1-建立FP树,10,图中左边的一列叫做头指针表,树中相同名称的节点要链接起来,链表的第一个元素就是头指针表里的元素。,虚线连接起来的表示同一个商品,各个连接的数字加起来就是该商品出现的总次数。,FP-GROWTH算法原理-实例1-挖掘频繁项集,Step4:从FP-Tree中找出频繁项集。遍历表头项中的每一项(以“牛奶:6”为例),从FP-Tree中找到所有的“牛奶”结点,向上遍历它的祖先结点,得到

5、4条路径,如表所示。,10,FP-GROWTH算法原理-实例1-挖掘频繁项集,Step4:从FP-Tree中找出频繁项集。对于每一条路径上的节点,其count都设置为牛奶的count(路径中最末尾的商品数),10,FP-GROWTH算法原理-实例1-挖掘频繁项集,Step4:从FP-Tree中找出频繁项集。因为每一项末尾都是牛奶,可以把牛奶去掉,得到条件模式基,此时的后缀模式是:牛奶。,10,FP-GROWTH算法原理-实例2,把例子简化一下,请看以下实例2,10,FP-GROWTH算法原理-实例2-统计频次,先扫描数据库,统计所有商品的出现次数(频数)定义min_sup=2,按照频数递减排序

6、,删除频数小于最小支持度的商品。重新排列得到频繁1-项目集F,10,FP-GROWTH算法原理-实例2-重新排序,10,FP-GROWTH算法原理-实例2-创建根结点和频繁项目表,10,Null,FP-GROWTH算法原理-实例2-加入第一个事务(I2,I1,I5),10,FP-GROWTH算法原理-实例2-加入第二个事务(I2,I4),10,FP-GROWTH算法原理-实例2-加入第三个事务(I2,I3),10,FP-GROWTH算法原理-实例2-加入第四个事务(I2,I1,I4),10,FP-GROWTH算法原理-实例2-加入第五个事务(I1,I3),10,FP-GROWTH算法原理-实例2-加入第六个事务(I2,I3),10,FP-GROWTH算法原理-实例2-加入第七个事务(I1,I3),10,FP-GROWTH算法原理-实例2-加入第八个事务(I2,I1,I3,I5),10,FP-GROWTH算法原理-实例2-加入第九个事务(I2,I1,I3),10,FP-GROWTH算法原理-实例2-挖掘频繁项集,首先考虑I5,得到条件模式基:、构造条件FP-Tree,10,得到I5频繁项

copyright@ 2010-2024 安全人之家版权所有

经营许可证编号:冀ICP备2022015913号-6