博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
关于啤酒和尿布故事的真相
阅读量:5214 次
发布时间:2019-06-14

本文共 1091 字,大约阅读时间需要 3 分钟。

数据刚刚兴起时,常常听厂商或大数据倡导者说这个啤酒和尿片的故事,鲜活、形象地说明大数据分析给商业带来的无限商机。如果你没有听过的话,我们再讲一遍:

“尿布和啤酒,听起来风马牛不相及,但这是对历史数据进行挖掘的结果,反映的是数据层面的规律。这种关系令人费解,这是一个真正的规律吗?经过跟踪调查, 研究人员终于发现事出有因:一些年轻的爸爸经常要到超市去购买婴儿尿布,有30%到40%的新爸爸会顺便买点啤酒犒劳自己。沃尔玛随后对啤酒和尿布进行了 捆绑销售,不出意料,销售量双双增加。”
——摘自涂子沛的《大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活》
第一次听到这个故事时,其实心中有惑 。以笔者对美国社会的有限理解,美国很多州的法律是不允许超市卖酒类商品,仅在最近几年才开始陆续有些州通过法律,允许超市申请酒的销售执照。但当时被大数据的热潮所吸引,也就无暇深究。最近参加了一些和大数据相关的活动,这个故事又不绝于耳。终于决定探探这个故事的源头。
原来这个故事在欧美国家也被传唱,出现的版本还不尽相同。但对此质疑的声音也不少,其中有一位叫Daniel J. Power的教授特此撰文,应该是最全面地有理有据揭开这个故事后面的真相。有兴趣的同学可以详细阅读英文全文:What is the "true story" about using data mining to identify a relation between sales of beer and diapers? (http://www.dssresources.com/newsletters/66.php)。主旨内容如下:
· 这家连锁店不是沃尔玛,而是Osco Drugs,一家主要在美国中西部经营的药房和便利店。
· 该公司于1992年就着手进行数据挖掘项目,算是数据挖掘的先驱者。
· 当时的项目收集了来自25家分店、一千两百多万个购物车的信息。
· 数据的确发现:下午5点到7点之间,客户购买了啤酒和尿片。
· 商店管理层的确对此发现表示兴趣。但现实中,并没有重新设计商品的摆放,没有把啤酒和尿布进行捆绑销售。不过,公司保守地对销售流程进行了改造,即在正确的时间放正确数量的正确商品。
这就是啤酒和尿片的故事真相,所以,这其实并不是数据挖掘的好故事。大家对此故事津津乐道,无外乎希望表达:数据挖掘技术是商业决策的好帮手!(作者:Shirley Xie来源:TechTarget中国)

转载于:https://www.cnblogs.com/chengzikelo/p/5478145.html

你可能感兴趣的文章
字符的相加输出
查看>>
bitnami openedx安装的各种坑及痛苦经历
查看>>
用CMake设置Visual Studio工程中第三方库
查看>>
Python Django连接(听明白了是连接不是创建!)Mysql已存在的数据库
查看>>
PYTHON 基本运算符及编码发展简史
查看>>
poj 1741 树的分治
查看>>
最长递增子序列的数量 51Nod - 1376
查看>>
Ubuntu17.04下安装vmware虚拟机
查看>>
软件开发方法
查看>>
数据结构&算法实践—【排序|插入排序】插入排序
查看>>
linux下配置固定ip
查看>>
MsSql 游标 修改字段两个表关联 表向另个表插入记录
查看>>
Atlas命名空间Sys.Data下控件介绍——DataColumn,DataRow和DataTable
查看>>
一个简单驱动的makefile
查看>>
《宁夏文学六十年》读后
查看>>
几款实力很强的小工具,提高Windows使用效率
查看>>
【Nutch2.2.1基础教程之6】Nutch2.2.1抓取流程 分类: H...
查看>>
JS 之匿名函数
查看>>
使用js设置input标签只读 readonly 属性
查看>>
C#开发微信门户及应用(19)-微信企业号的消息发送(文本、图片、文件、语音、视频、图文消息等)...
查看>>