python 关联规则 库(Python关联规则6.1)
python 关联规则 库(Python关联规则6.1)I8:土豆、鸡蛋、袜子、香蕉、苹果、水果刀I7:排骨、鸡蛋、茄子、水果刀、苹果I4:西红柿、排骨、茄子、毛巾、水果刀I5:西红柿、排骨、酸奶、苹果I6:鸡蛋、茄子、酸奶、肥皂、苹果、香蕉
6.1 将以下超市的购买记录:
I1:西红柿、排骨、鸡蛋、毛巾、水果刀、苹果
I2:西红柿、茄子、水果刀、香蕉
I3:鸡蛋、袜子、毛巾、肥皂、苹果、水果刀
I4:西红柿、排骨、茄子、毛巾、水果刀
I5:西红柿、排骨、酸奶、苹果
I6:鸡蛋、茄子、酸奶、肥皂、苹果、香蕉
I7:排骨、鸡蛋、茄子、水果刀、苹果
I8:土豆、鸡蛋、袜子、香蕉、苹果、水果刀
I9:西红柿、排骨、鞋子、土豆、香蕉、苹果
转换为布尔数据集,其中数据集用数据框来表示,数据框中的字段名称即为商品名称,如果商品在某个购买记录中出现用1来表示,否则为0
[知识点及要求]布尔数据集构建
示例代码如下:
tiem=['西红柿' '排骨' '鸡蛋' '茄子' '袜子' '酸奶' '土豆' '鞋子']
import pandas as pd
import numpy as np
data = pd.read_excel('tr.xlsx' header = None)
#data=data.iloc[: 1:]
D=dict()
for t in range(len(tiem)):
z=np.zeros((len(data)))
li=list()
for k in range(len(data.iloc[0 :])):
s=data.iloc[: k]==tiem[t]
li.extend(list(s[s.values==True].index))
print(li)
z[li]=1
#print(z)
D.setdefault(tiem[t] z)
Data=pd.DataFrame(D) #布尔值数据表
运行结果如下图:
更多内容请见网易云课堂Python大数据学习吧:
https://study.163.com/provider/480000002230206/index.htm?share=2&shareId=480000002230206