首页 > 文章中心 > 正文

关联规则模型的创建及规则分析

关联规则模型的创建及规则分析

我国资本市场自20世纪90年代以来经历了多次改革,市场的放开使得国内资本市场与国际金融市场的联系愈发紧密。2007年由美国次贷危机引起的金融危机席卷全球,各国股市均陷入金融风暴的漩涡之中,在股市低迷的影响下,国内股市也难以独善其身,上证综指一度跌至1500点,市值缩水近1/3。2007年2月27日全球股市暴跌,沪指创十年内单日最大跌幅。2008年至今,欧洲各国相继出现债务危机,全球股市屡现大幅震荡,国际金融市场形势更加扑朔迷离,国内股市则不时表现出投资者信心不足。2011年9月5日,受到国际主要股市大跌影响,上证综指跌破2500点,在7个交易日内跌幅超过5%。危机的传导预示着全球经济一体化下主要股票市场之间存在着联动关系,深入分析股票市场间的联动效应,对股市波动预测和投资决策都具有重要参考价值。本文采用关联规则模型,特别关注了股指间联动的时间顺序,从欧美主要股票价格指数对亚洲股指的联动影响、亚洲主要股指对欧美股指的联动影响和我国股指在国际股指联动效应中的表现三个方面进行分析。

一、数据选取及处理

本文选取上证综合指数、日经225指数、香港恒生指数、道琼斯指数、伦敦金融时报指数五个具有代表性的股票价格指数2005年8月15日至2011年10月31日数据作为研究对象,分析数据来源于CSMAR数据库,其变化趋势见图1。上述五种主要股票价格指数之间存在一些联动趋势,如在2006年5月-2007年9月及2009年4月-2010年2月间,股指普遍经历了上涨趋势,而在2007年9月-2009年4月间,各指数又普遍经历了向下的波动。对上述原始数据进行预处理,首先计算各指数日涨跌幅,上涨标记为1,下跌标记为0,形成布尔型关系数据库。同时考虑到股票市场和其他市场的联动效应不同,其特点是反应速度快,某一股指受到其他指数影响的反应时间往往不会超过一个滞后交易日。因此,各国股市开盘时间的不同会对联动效应的观察产生较大影响。以北京时间为准,各股市开盘时间顺序如下:日本股市→沪市→香港股市→欧洲股市→美国股市所以,欧美股市对亚洲股市的影响会滞后一天,研究欧美股市的影响时,需将其数据向前平移一天,即将欧美股指在前一交易日t-1的数据与亚洲股指在当日t的数据组成一条记录,并剔除各股票市场未同天开市的数据(数据库1)。而亚洲股市对欧美股市的影响不存在滞后,在研究亚洲股市的影响时需将五个指数在同一交易日t的数据组成一条记录,并剔除未同天开市数据(数据库2)。笔者按照上述思路分别整理出两个数据库,反映欧美股市和亚洲股市之间的相互联动。

二、关联规则模型的建立及规则分析

关联规则模型是一种应用于挖掘不同数据项集之间隐藏的关联关系的数据挖掘方法。其主要概念包括:(1)支持度sup:关联规则XY的支持度指同时包含项集X和项集Y的事件在所有事件中所占的比重,可用于发现出现频率较大的项集。(2)置信度conf:表示项集X出现的条件下,项集Y也出现这一事件在总事务中出现的频率。置信度应用于在出现频率较大的项集中发现出现频率较大的关联规则。conf(Y|X)=P(Y|X)=P(XY)/P(X)=sup(XY)/sup(X)(3)提升lift:关联规则XY的提升描述了项集X对项集Y的影响力大小,提升数值越大表示项集Y受到项集X的影响越大。本文采用Apriori算法循环扫描上述布尔型关系数据库产生候选项集,从而挖掘出频繁项集,并通过系统客观层面和研究主观层面来评价所得规则。系统客观层面要求所得关联规则要大于指定的最小支持度和最小置信度;研究主观层面则要求所得关联规则符合实际股市运行情况。

(一)在欧美股市带动下的联动效应考察欧美股市对亚洲股市的联动影响采用数据库1中数据。在建模时指定上证综合指数、日经指数和香港恒生指数作为规则后项,设定支持度阈值为0.2,置信度阈值为0.5,并按照各股市的实际开盘时间顺序进行主观筛选。同时生成网络图(控制最小连接频数为400,以简化图中关系),结果见表1。由表1可知,道琼斯指数和伦敦金融时报指数之间在涨跌行情中都存在着较强的联动效应。以“伦敦金融时报指数上涨道琼斯指数上涨”为例,该规则的支持度为51.37%,置信度为71.94%,表示伦敦金融时报指数上涨同时道琼斯指数也上涨的情况占到所有记录总数的51.37%,同时在伦敦金融时报指数上涨的条件下,道琼斯指数上涨的可能性有71.94%,该规则的提升系数为1.3,表示伦敦金融时报指数上涨对道琼斯指数上涨的影响力相对较大。其次,欧美股市的前一交易日的行情会对亚洲股市产生影响。在道琼斯指数和伦敦金融时报指数前一交易日双双下挫情况下,日经指数也下跌的可能性有61.18%;而两指数双双上扬时,日经指数上涨的可能性有52%,并且较大的提升系数说明规则前项对后项影响力较大。在道琼斯指数和伦敦金融时报指数前一交易日均上涨时,香港恒生指数上涨的可能性有58%。在道琼斯指数前一交易日上涨的条件下,沪市当日上涨的概率为54.59%。但值得注意的是,提升系数的大小反映出欧美股市对香港和日本股市行情的影响要大于其对内地股市的影响,见图2。图2为经过“连接频数>400”筛选的网络图。连接线条越粗代表关联越强,最强关联出现在两个欧美股指之间;香港恒生指数与上证指数及日经指数之间存在强关联,表明亚洲股市间存在明显联动效应。同时,道琼斯指数前一交易日上涨上证指数也上涨的频数较大,说明我国股市受到美国股市一定程度的影响。

(二)在亚洲股市带动下的联动效应考察亚洲股市对欧美股市的联动影响采用数据库2中数据。在建模时将道琼斯指数和伦敦金融时报指数指定为后项,采用同样分析方法和阈值设定,得到结果见表2。观察上表,三种亚洲股票指数在上涨和下跌行情中均表现出较强的关联。以关联规则“上证综合指数下跌香港恒生指数下跌”为例,该规则的支持度为43.44%,置信度为64.69%,表示上证综合指数下跌同时香港恒生指数下跌的情况占记录总数的43.44%,在上证综合指数下跌的条件下,香港恒生指数下跌的可能性有64.69%,并且这条关联具有较大的提升系数。其次,亚洲股市当日的波动会对当日晚些时间开市的欧美股票市场产生影响。在日经指数和香港恒生指数当日均上涨条件下,伦敦金融时报指数上涨的可能性有62.6%,道琼斯指数上涨的可能性有62.59%;在日经指数和香港恒生指数当日均下跌条件下,伦敦金融时报指数也下跌的可能性有61.61%,道琼斯指数也下跌的可能性有53.79%;在香港恒生指数和上证综合指数当日上涨条件下,伦敦金融时报指数也上涨的可能性有59.91%,道琼斯指数也上涨的可能性有62.58%。但比较表1和表2的平均支持度,表1的平均支持度高于表2的平均支持度,显示出欧美股市对亚洲股市产生联动效应的频率高于亚洲股市对欧美股市产生联动效应的频率,即欧美股市产生的国际联动影响大于亚洲股市。

(三)上证综指在国际股指联动效应中的表现观察上述涉及上证综指的关联规则,上证综指与香港恒生指数和日经225指数在涨跌行情中都有较强的同向联动表现,上证指数的波动受到亚洲周边股市波动的影响十分明显。但相较于日本和香港股市,上证综指受到远距离市场行情波动的直接影响较小,在上证指数单独作为前项或后项的关联中,仅仅提炼出其与道琼斯指数之间存在联动关系,反映出其与欧美股票发生联动的频率较低。上证综指行情走势不完全与国际联动,仍具有一定的独立特征。另一方面,虽然分析结果显示上证指数受到欧美远距离市场波动的直接影响相对较小,但是香港和日本股市与欧美股市的联动效应较强,因此上证指数可能受到欧美股指较大的间接影响。

三、结论

本文基于关联规则挖掘方法对上证综合指数、日经225指数、香港恒生指数、道琼斯指数、伦敦金融时报指数五种主要股票价格指数间的联动效应进行分析。在分析中特别关注了股指间联动的时间顺序,得到结论如下:(1)以道琼斯指数和伦敦金融时报指数为代表的欧美股票市场间在涨跌行情中均存在较强的联动效应。以上证综指、香港恒生指数、日经225指数为代表的亚洲各股票市场间也存在较强的联动效应。(2)考虑开市时差,欧美股票市场前一交易日的涨跌行情与亚洲股票市场波动之间具有较强关联,表明亚洲股票市场走势受到欧美股票市场影响。亚洲股票市场当日涨跌情况与欧美股票市场当日涨跌情况之间也存在关联,但亚洲股票市场对欧美股票市场的影响程度不如欧美股票市场对亚洲股票市场的影响程度大。(3)国内股市行情走势具有相对独立特征。相较于香港和日本股票市场,沪市表现出的国际联动效应较弱。其受到周边近距离市场的直接影响较大,受到欧美远距离市场直接影响较小。但欧美股票市场对亚洲其他股票市场的影响会间接影响上证指数。