首页 > 文章中心 > 正文

数据挖掘技术在电子商务领域的应用

数据挖掘技术在电子商务领域的应用

摘要:随着互联网技术的发展,电子商务应运而生且越来越多的交易活动从传统的线下式交易转到线上交易。而随着交易量和时间的累计,相关的交易数据则越来越多。面对如此浩大的数据,如何从中提取有价值的信息,受到了广大电子商务商家以及电子商务平台的重视。文章针对电子商务这一领域,结合数据挖掘相关技术,阐述了如何利用数据挖掘技术针对电子商务中存在的问题以及需求进行解决。

关键词:数据挖掘;电子商务;知识发现

1概述

电子商务(E-Commerce)是一种在互联网发展的背景下出现的一种新的商业模式。是对传统的商务交易模式的一种互联网化的运作。其主要将传统商务中的操作流程进行互联网化而产生的产物。具体是指在互联网环境下,基于浏览器/服务器的方式,商家与消费者进行跨地域虚拟的商务活动,实现网上购物、网上交易、在线支付和物流配送等一系列的综合服务活动的一种新型商业运营模式。其具有以下特点:

(1)普遍性。

商品交易充斥着人们的日常生活,衣食住行,柴米油盐均无不和商品交易挂钩。电子商务作为一个新兴的商业运营模式,它不是一个完全的新生事物,其主要是利用互联网将我们平时的商品交易行为放到了网络上。

(2)跨地域性。

传统商品交易,消费者需要到商家的实体店铺中进行选购和消费,往往受到地域的限制。而电子商务,通过互联网解决了地域性的问题。通过互联网,身处海南的人可以毫不费力的购买到来自内蒙古甚至西藏的商品。

(3)虚拟性。

与传统的商品交易不同,电子商务中消费者无法直观的感受到商品的优劣及好坏。其因为网络的虚拟性,对商铺中所提供的消费品缺少直观的感受。

(4)协调性。

一个普通的交易是多个环节环环相扣的结果,从消费者进入网站选购商品,到消费者确认购买,通过网上银行支付货币,商家通过物流环节将消费品送到消费者手中。往往要经历4-5个环节的操作。数据挖掘(Datamining)是在数据大量存储的背景下应需求而产生的一个技术。它融合统计学、机器学习、模式识别、计算机科学等诸多领域相关技术,解决在大量数据中挖掘有价值信息的问题。与诸多的学科诞生的过程一样,市场的需求催生新领域的探索,新领域的探索产生新的学科和技术。数据挖掘应用领域十分广泛,如银行、电信、保险、交通、零售等领域。这类领域均存在大量的数据存储,并亟待从存储的大量数据中发现有价值的信息,以用到实际的销售与决策中。随着互联网的发展,新兴产业伴随互联网而生,互联网用户的广泛性促使了大量的数据积累,大量的网上日志类数据的积累成为了数据挖掘在互联网环境下应用的温床。而电子商务作为互联网大环境下的一个典型且有竞争力的行业,其与数据挖掘技术的结合最为迫切。

2数据挖掘的主要方法

数据挖掘是多个学科的结合,其中主要包括统计学、机器学习、数据库、计算机科学等多个领域。其主要方法及技术也多是几个领域中的典型方法。其中比较常用的数据挖掘方法有关联分析、分类分析、聚类分析和异常检测等。

2.1关联分析

关联规则分析用于发现数据集中高频繁出现的记录之间的关系。最初的提出动机是针对商品销售中的购物篮分析问题提出的。其主要过程分为两个阶段:第一个阶段先从数据集中挖掘出高频繁同时出现的记录组,第二个阶段再从这些记录组中发现关联规则。

2.2分类分析

分类分析是数据挖掘中一种常用技术,可用于预测或者描述二元和标定类型的数据集。实际上就是通过分析样本数据中的数据,确定每个类别,并对每个类别做出精确的描述或建立分类分析模型,然后利用该模型对其他给定的数据进行分类。因为在算法中需要有标定数据,故其属于有监督学习。

2.3聚类分析

与分类类似,聚类分析同样是对待测定数据集进行归类。但是与分类分析不同的是,聚类分析没有标定数据,其利用数据记录间的关系来对待测定数据进行归类。其不需要标定数据,往往需要专业领域的行业经验来确定分类的数量等相关参数。

2.4异常检测

数据集中常存在着少数的记录,他们与其他数据的行为或者趋向不一致,这些数据被称为异常点或者离群点。数据集中的异常点往往包含重要信息,对数据集的了解以及特定的问题领域有着重要的研究价值。例如,银行业中的欺诈行为检测,就是其在具体领域极其重要的应用。

3电子商务背景下的数据挖掘

数据挖掘在传统行业的应用十分广泛,能解决的典型问题包括数据库营销(DatabaseMarketing)、客户群体划分(CustomerSegmen-tation&Classification)、背景分析(ProfileAnalysis)、交叉销售(Cross-selling)、客户流失性分析(ChurnAnalysis)、客户信用记分(CreditScoring)和欺诈检测(FraudDetection)等。针对电子商务行业的特点,数据挖掘在其领域可以有以下几个主要方面的应用:3.1寻找潜在的客户群体客户是企业的根本,电子商务中同样需要积累大量的客户。因此如何不断挖掘出新的客户,增大其客户量是其为生的根本。利用消费者的注册以及消费倾向可以帮助电子商务平台吸引更多的消费者群体。常用的方法,有客户分类,并根据消费者的信息来将其归类。并对其按类别进行管理和营销。主要应用方法:分类分析,聚类分析。

3.2推荐系统

电子商务平台容纳了大量的商品,消费者往往在琳琅满目的商品中无法选择一个适合自己的商品,陷入了选择危机的境地。电子商务平台出于用户体验良好的原则,应该为消费者解决此类问题。针对不同消费者历史的消费信息并结合消费者注册信息以及最近的店铺推销手段,电子商务平台可以利用挖掘技术从上述特征中挖掘出哪些商品适合指定的消费者,并将其按照不同消费者的需求合理推荐给不同消费者。主要应用方法:关联分析,聚类分析。

3.3欺诈检测

欺诈问题不单单是银行业及保险业中常见的问题,在新兴的电子商务领域此问题也成为了一个大大阻碍行业发展的不利因素。因为电子商务的跨地域性和虚拟性的特点,消费者无法了解商品质量的优劣,仅能通过其他购买过该商品的消费者对商品的评价来间接断定商品的好坏。很多商家针对此特点,雇佣网络水军对其所销售商品进行不实的评论,来隐藏其商品中的缺点夸大其质量。对此行为的视而不见会造成电子商务平台信誉和声誉的下降,进而阻碍产业发展。主要应用方法:异常检测,聚类分析。

4结束语

文章对电子商务的相关发展和数据挖掘的主要方法进行了介绍,并针对电子商务行业的特点结合数据挖掘的技术,对数据挖掘技术在电子商务领域的应用做了简要分析。电子商务是现代信息技术发展的必然结果,也是未来商业运作模式的发展方向。企业数据量的日益增大,利用数据挖掘技术针对其行业中存在的问题进行解决是必不可少的选择。

参考文献

[1]韩治.数据挖掘技术及其应用研究[J].信息通信报,2013(6).

[2]钱贺斌.数据挖掘一大数据时代的重要工具[J].2013,10.

[3]陈娜.数据挖掘技术的研究现状及发展方向[J].电脑与信息技术报,2006,2.

[4]杨智明.数据挖掘技术的研究方向及其常用方法[J].科技信息报,2006.

[5]范文广.数据挖掘技术的研究[J].佛山科学技术学院学报,2011,11.

作者:宋大为 侯婷婷 顾松敏 赵相楠 单位:沈阳理工大学信息科学与工程学院