编码实现对给定的数据库进行关联规则挖掘

来源:百度知道 编辑:UC知道 时间:2024/06/14 16:37:20
给了一个数据文档(.TXT文件),里面有上千万条顾客购买商品的商品号数据,要编程找出每个顾客购买一商品时往往还会买哪另一商品,也就是找商品关联度高的编号,最好是能找出关联度高的前100--1000条信息。(若现场改变数据库,比如删掉一些或修改一些,运行结果能体现出来)
数据文件部分数据如下:
顾客1:326 403 526 626 950 (商品的编号)
顾客2:12 39 69 173 394 522 775 792 825 981 992
顾客3:41 116 120 208 541 590 606 638 885
顾客4:75 120 136 240 262 470 538 546 568 597 665 878 981
顾客5:183 283 348 710 766 831 912 972
顾客6:78 242 427 461 576 758
43 160 162 571 593 878
39 43 362 368 440 522 591 692 742

找出如: 326 403 这两个商品号同时出现的次数。
谢谢啦!~

一楼的可不可以发源码给我 啊~!

二楼的谢谢啦,我要的就是全部的,“要查询出全部的话可以用临时表或者树遍历”我就是对遍历树感到头痛啊~!

select count(*) from table as t where t.goodid=326 and t.customid in
(select o.customid from table as o where o.goodid=403)
对于326 403这具体的数据可以这样。。要查询出全部的话可以用临时表或者树遍历 但是 具体怎么做会非常复杂 而且更主要是性能方面的考虑

PS:一楼那家伙肯定要钱的