快捷搜索:  汽车  科技

python 关联规则 库(Python关联规则6.1)

python 关联规则 库(Python关联规则6.1)I8:土豆、鸡蛋、袜子、香蕉、苹果、水果刀I7:排骨、鸡蛋、茄子、水果刀、苹果I4:西红柿、排骨、茄子、毛巾、水果刀I5:西红柿、排骨、酸奶、苹果I6:鸡蛋、茄子、酸奶、肥皂、苹果、香蕉

6.1 将以下超市的购买记录:

I1:西红柿、排骨、鸡蛋、毛巾、水果刀、苹果

I2:西红柿、茄子、水果刀、香蕉

I3:鸡蛋、袜子、毛巾、肥皂、苹果、水果刀

I4:西红柿、排骨、茄子、毛巾、水果刀

I5:西红柿、排骨、酸奶、苹果

I6:鸡蛋、茄子、酸奶、肥皂、苹果、香蕉

I7:排骨、鸡蛋、茄子、水果刀、苹果

I8:土豆、鸡蛋、袜子、香蕉、苹果、水果刀

I9:西红柿、排骨、鞋子、土豆、香蕉、苹果

转换为布尔数据集,其中数据集用数据框来表示,数据框中的字段名称即为商品名称,如果商品在某个购买记录中出现用1来表示,否则为0

[知识点及要求]布尔数据集构建

示例代码如下:

tiem=['西红柿' '排骨' '鸡蛋' '茄子' '袜子' '酸奶' '土豆' '鞋子'] import pandas as pd import numpy as np data = pd.read_excel('tr.xlsx' header = None) #data=data.iloc[: 1:] D=dict() for t in range(len(tiem)): z=np.zeros((len(data))) li=list() for k in range(len(data.iloc[0 :])): s=data.iloc[: k]==tiem[t] li.extend(list(s[s.values==True].index)) print(li) z[li]=1 #print(z) D.setdefault(tiem[t] z) Data=pd.DataFrame(D) #布尔值数据表

运行结果如下图:

python 关联规则 库(Python关联规则6.1)(1)

更多内容请见网易云课堂Python大数据学习吧:

https://study.163.com/provider/480000002230206/index.htm?share=2&shareId=480000002230206

猜您喜欢: