首页 > 文章中心 > 正文

关联规则及协同过滤在汽车电子中的应用

关联规则及协同过滤在汽车电子中的应用

摘要:以电子商城销售数据为基础,对已有网上购车用户行为特征进行分析。先采用关联规则分析样本,找出网上购车用户的特点;后基于用户的协同过滤算法寻找网上购车用户的邻居用户,从而发掘潜在客户。

关键词:关联规则;协同过滤;潜在客户

1引言

“双11”和“汽车之家”的发展是电子商务的成功案例。面对日趋激烈的竞争,开启汽车电子商务之路迫在眉睫。然而,互联网时代的信息海量而无组织,汽车厂家很难用传统手段获取客户信息,进行精准营销和客户发掘。将数据挖掘技术引入汽车电子商务,将是巨大突破。

2理论基础

2.1关联规则

关联规则又称购物篮分析,因传统案例多发生在超市,如“啤酒与尿布”。其主要指标:支持度、置信度。前者用于衡量关联规则在整个数据集的统计重要性,后者用于衡量关联规则的可信程度。Apriori和F-P是常用算法,本文采用Apriori算法。

2.2Apriori算法

Agrawal等在前人基础上,完善了Apriori的关联规则算法,核心是基于两阶段频集思想的递推算法[1]。基本思想:先找出所有的频集,其出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,必须满足最小支持度和最小可信度。然后使用第一步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用中规则定义。一旦规则被生成,只有大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用递推法[2]。

2.3协同过滤

协同过滤有两种定义。在电商网站应用广泛的是狭义定义,即通过收集群体用户的偏好信息,过滤个体用户可能感兴趣的内容。协同是群体行为,过滤针对个人行为。基于的假设理论:为用户找到真正感兴趣商品的方法是找到与用户有共同兴趣爱好的相似用户,并将相似用户感兴趣的商品推荐给该用户。

3实证分析

3.1关联规则寻找用户特征

3.1.1数据采集

以电子商城某车为例,采集50个样本,包含用户性别、年龄、职业、地区、有无小孩5类信息。数据进行标识,性别男:A1,女:A2;年龄小于30岁:B1,大于:B2;个体商户:C1,公司员工:C2,事业单位、公务员:C3,自由职业:C4;一线城市:D1,二线:D2、其余:D3;有小孩:E1,无:E2。

3.1.2计算

令最小支持度min_sup=0.3经由apriori算法算出3-项集,如表1.同样可计算出L4和L5,L5为{A2,B1,C2,D2,E1}。

3.1.3结果分析

从3-项集L3可以看出,支持度最高为{A2,B1,E1},达0.44,对应特征为(A2,B1,E1)。即有小孩的年轻妈妈是该款车型的主要用户群。同样分析L5:女性、小于30岁、公司白领、在二线城市生活,有小孩是该车型网上购买者主要特征。

3.2协同过滤算法寻找潜在客户

3.2.1潜在客户定义

潜在客户指企业为将自己的产品顺利地推销到消费者的手中,在进行推销之前对客户的心理、消费方式、习惯、需求的分析,实质是进行可行性分析,最终挖掘符合自己的可能性客户[3]。

3.2.2寻找潜在客户

协同过滤寻找潜在客户,实质是寻找与老客户特质相似的客户群。通过挖掘Web系统中与老客户客户相关的信息,后利用数据挖掘中的协同过滤可以找寻网上各类潜在客户,再向潜在客户展示特定的、有联系的、个性化的内容,进行特定营销。当用户访问网站时,在商品上停留时间可以反映出用户兴趣度,长表示感兴趣,短则不感兴趣。可用用户访问时间作为协同过滤所需的评价,以此来衡量用户之间的相似性。整理数据后得到用户-页面矩阵表,表中所有数据的定义同一般矩阵类似。用户之间的相似度可采用常用的向量空间相似度计算和Person相关度等方法,可算出两个用户的相似程度,将与老客户的相似性程度按大小排序,取前n个用户作为最相邻用户,可推测相邻用户和已购车用户行为特征最为相似,作为潜在客户发展。

4结论

汽车电子商务为汽车企业带来了丰厚利润,作为电子商务新星,正焕发蓬勃生机。将基于关联规则和协同过滤应用于汽车电子商务的潜在客户挖掘,具有十分重要的意义。如今在海量的数据包围的信息时代,数据挖掘必将推进汽车电子商务的长远发展。

参考文献:

[1]毛国君,等.数据挖掘原理与算法[M].北京:清华大学出版社,2005.

[2]MichaelJ.A.Berry,GordonS.Linoff.数据挖掘[M].北京:中国财政经济出版社,2004.

[3]乌文波.利用Apriori关联规则挖掘电子商务平台潜在客户[J].科技创新与应用,2011(24).

作者:郭林雪 单位:武汉理工大学