山东大学硕上学位论文第1章引1.1选题的背景和目的言中国的股票市场从无到有己经走过了十七年的发展历程。作为一个新兴的股票市场,在短短的十七年中得到了迅速的发展,市场容量高速扩张,投资者队伍不断壮大,到目前为止,股票A股帐户已经接近1亿户。我国股民在股市中冲浪,辛苦几年没有赚到什么钱,究其原因:·由于我国股市目前还不规范,一些上市公司信息渠道不够畅通,缺乏良好的企业经营理念,漠视股东利益,在财务上造假帐,欺骗了广大投资者,致使股价大大超过其自身价值。·由于主力机构和庄家兴风作浪,误导股民,使绩优个股受冷落,ST、PT股成为股市追逐的热点。·最直接的原因是广大股民的投资理念有问题,投机风盛行,急于暴富,热衷于短线,冷淡了长线,盲目跟庄。这些问题汇集在一起,导致绝大多数股民赔钱,少数人暴利,极大地挫伤了广大股民的积极性,严重影响了股票市场健康有序地发展。尽管目前中国股市还不够成熟,西方一些价值型投资方法还难以广泛应用,但是未来中国股市必然要走上了理性发展的道路。如何改变目前的困境,不仅是部门需要规范管理,而且广大股民也需要向理性投资方向努力,共同促进市场的健康发展。每支股票的涨跌,从长期来看,是某些因素共同作用的结果。本文选题的背景和目的是构建股票的涨跌及其影响因素的典型相关分析模型,定量判断各影响因素的变动对股票涨跌的作用程度,并对计算结果进行实证分析,找出影响股票涨跌的主要因素,以指导股票投资。1.2研究方法和主要结论本文的研究方法和思路是构建股票的涨跌及其影响因素的典型相关分析模型,定量判断各影响因素的变动对股票涨跌的作用程度,并对计算结果进行实证分析,从而找出影响股票涨跌的主要因素。研究中借助股票分析软件获取股票的开盘价、收盘价、最高价、最低价等山东大学硕士学位论文常用交易数据;利用VF语言编程,对这些数据进行初步处理,得到了大量的股票衍生数据,如:日K线上影线长度、日K线下影线长度等;借助SPSS软件,将这些股票交易数据与股票的涨跌进行相关分析;对相关性大的数据,再采用典型相关分析的方法,对股票的涨跌及其影响因素进行分析。本文以中国银行(601988)为例,对影响股票涨跌的部分因素进行了分析,选取了股票的日涨跌幅、日最大升幅、日最大降幅、日涨跌幅的100日均值作为因变量组变量,选取上证指数日涨跌幅、股票的昨收盘价、股票的日成交量、股票的收盘价减去股票的平均成本价、股票日K线上影线长度、股票日K线下影线长度、股票的日高开低开率等作为自变量组变量,以2006年7月5日到2007年8月10日共270个交易日的数据为样本,进行了典型相关分析,构建了股票的涨跌及其影响因素的典型相关分析模型,找出了影响股票涨跌的主要因素,并将该模型应用于股票工商银行(601398)采用典型相关分析方法可以揭示股票的涨跌及其影响因素的相互关系,分析结果与实际情况基本吻合,这为正确投资股票提供了科学的依据。2山东大学硕士学位论文第2章典型相关分析概述2.1典型相关分析的基本思想典型相关分析是主成分分析和因子分析的进一步发展,是研究两组变量间的相互依赖关系,把两组变量之间的相互关系变为研究两个新的变量之间的相关,而且又不抛弃原来变量的信息,这两个新的变量分别由第一组变量和第二组变量的线性组合构成。由于两组变量的个数可以是不同的,两组变量所代表的内容也可以是不同的。因此,典型相关分析在实际问题中应用是十分广泛的。典型性相关分析与简单相关分析相比,典型性相关分析有其独特的作用。现在要研究两组变量之间的相关性,1936年,Hotelling提出了典型相关分析。基于复相关系数的定义方法,这里自然考虑到两组变量的线性组合:』批2q‘+口2‘+…+口,%【V=也咒+红儿+…+6∞并研究它们之间的相关系数p(u,v)。在所有的线性组合中,找一对相关系数最大的线性组合,用这个组合的单相关系数来表不两组变量的相关性,叫做两组变量的典型相关系数,而这两个线性组合叫做一对典型变量。在两组多变量的情形下,需要用若干对典型变量才能完全反映出它们之间的相关性。设己求到的第一对典型变量为:』%2q-‘+q·毛+…+郎.却【vl=6l,咒+62,只+…+%。)々下一步,再在两组变量的与ub,v.不相关的线性组合中,找一对相关系数最大的线性组合,设为:』“22412工1+‘kx2+…+唧2却【v2=612yl+622y2+…6叮2%它就是第二对典型变量,满足条件:p(%,心)=O,p(H,v2)=O而且p(u。v:)就是第二个典型相关系数。这样下去,可以得到若干对典型变量,从而提取出两组变量间的全部信息。典型相关分析的实质就是在两组随机变量中选取若干个有代表性的综合指标,用这些指标的相关关系来表示原来的两组变量的相关关系。这在两组变量3山东大学硕士学位论文的相关性分析中,可以起到合理的简化变量的作用:当典型相关系数足够大时,可以像回归分析那样,由一组变量的数值预测另一组变量的线性组合的数值。2.2典型相关分析的步骤典型相关分析的步骤有:(1)确定典型相关分析的目标;(2)设计典型相关分析;(3)检验典型相关分析的基本假设;“)估计典型模型,评价模型拟合程度;(5)解释典型变量;(6)验证模型。4围2-1典型相关分析的逻辑框图研究的问题选取目标。确定两组变量的相关关系,达到最大相关,解释两组变量之间的关系,定义自变量组和因变量组i设计典型相关分析每个变量的观测值全部的样本量j基本假设线性相关多元正态性J典型函数的估计和识别推导典型函数,选取用语解释的函数统计显著性、相关程度、共同方差的冗余度测量J解释典型函数和变量典型权重、典型载荷典型交义载荷』验证因变量分割样本构成典型变量的灵敏度分析山东大学硕士学位论文2.2.1确定典型相关分析的目标典型相关分析所适用的数据是两组变量。假定每组变量都能赋予一定的理论意义,通常一组可以定义为自变量,另一组可以定义为因变量.典型相关分析可以达到以下目标:(1)确定两组变量相互,或者相反,确定两组变量间存在关系的大小。(2)为每组变量推导出一组权重,使得每组变量的线性组合达到最大程度相关。最大化余下的相关关系的其他的线性函数是与前面的线性函数的。(3)解释自变量与因变量组中存在的相关关系,通常是通过测量每个变量对典型函数的相对贡献来衡量。2.2.2设计典型相关分析典型相关分析作为一种多元分析方法,与其他的多元分析技术有共同的基本要求。其他方法(尤其是多元回归、判别分析和方差分析)所讨论的测量误差的影响、变量类型及变换也与典型相关分析有很大关系。样本大小的影响和每个变量需要足够的观测都是典型相关分析经常遇到的。研究者容易使自变量组和因变量组包含很多的变量,而没有认识到样本量的含义。小的样本不能很好地代表相关关系,这样掩盖了有意义的相关关系。建议研究者至少保持每个变量10个观测,以避免数据的“过度拟合”。2.2.3典型相关分析的基本假定线性假定影响典型相关分析的两个方面。首先,任意两个变量间的相关系数是基于线性关系的。如果这个关系不是线性的,一个或者两个变量需要变换。其次,典型相关是变量间的相关。如果关系不是线性的,典型相关分析将不能测量到这种关系。2.2.4推导典型函数、评价整体拟合程度每个典型函数都包括一对变量,通常一个代表自变量,另一个代表因变量。可从变量组中提取的典型变量(函数)的最大数目等于最小数据组中的变量数目。比如,一个研究问题包含5个自变量和3个因变量、可提取的典型函数的最大数目是3。.推导典型函数典型相关函数的推导类似于没有旋转的因子分析的过程。典型相关分析集中山东大学硕士学位论文说明两组变量问的最大相互关系。第一对典型变量在两组变量中有最大的相互关系。第二对典型变量得到第一对典型变量没有解释的两组变量间的最大相互关系。简言之,随着典型变量的提取,接下来的典型变量是基于剩余残差,并且典型相关系数会越来越少。每对典型变量是正交的,并且与其它变量是的。典型相关程度是通过相关系数的大小来衡量的。典型相关系数的平方表示一间共同方差的比例。典型相关系数的平方值称作典型根或者特征值。.典型函数的解释数中,每组中的变量都对共同方差有较大贡献。海尔(Hai三荐推人等)4891’r函的关相为认即,设假的样这于基是释解的量变型典的著显对。数函的著显上)50.O如比(平水个某在数系关相型典是都数函型典的取提际实,讲来般一个准则结合使用来解释典型函数。这三个准则是:(1)函数的统计显著性水平;(2)。量测余冗的释解差方中集据数个两)3(:小大的关相型典每个典型函数分别进行检验以外,全部典型根的多元检验也可以用来评价典型gnilletoH,ad猢L’skliW括包,量测的性著显数函别判价评多许。性著显的根sgcro。’yoR和迹ialliP、迹的共同方差比例乘以平方典型相关系数,可以得到每个典型函数可以解释的共是典型相关系数的平方。(3)冗余指数。一个典型变量的冗余指数就是这个变量同方差部分。要得到较高的冗余指数,必须有较高的典型相关系数和由因变量6山东大学硕上学位论文解决这个问题,引入拉格朗日乘数6’^/2、五/2构呼一垡羹鹳2lj|酲;鋈ll‘攀;;;一萋嚣耄曼一|i一蓁}篓,;鹱』驰i!圭塑;影。¨的蒴韩:丽冗象搏熬。型晕引型i罪弱酗涮空召繁Z型罩萄?i壹;,恪粤涪坚型霄编豢;冀。翼i;霉一豢萎重,薹螽的解释。这些解释包括研究典型函数中原始变量的相对重要性。主要使用以下三种方法:(1)典型权重(标准相关系数):(2)典型囊|蛊孝;一孝g参载荷(结构系数):(3)典型交叉载荷(交叉结构系数)。霎笺!鳇萎二二鬣坦嗡;嚣赫斡¨|.典型权重传统的解释典型函数的方法包括观察每个原始变量在它的典型变量中的典i辇i;堡一謇蚕l|_}¨一蓁量大做果结对需仍毫;;羹型权重,即标准化相关系数(standardizedCanonicalCoefficients)的符号和大小。有较大的典型权重,则说明原始变量对它的典型变量贡献较大,反之则相反。原始变量的典型权重有相反的符号说明变量之间存在一种反面关系,反之则有正面关系。但是这种解释遭到了很多批评。这些问题说明在解释典型相关的时候应慎用典型权重。.典型载荷由于典型权重的缺陷,典型载荷逐步成为解释典型相关分析结果的基础。典型载荷分析,即典型结构分析((canonicalstructureAnalysis),是原始变量(自变量或者因变量)与它的典型变量间的简单线性相关系数。典型载荷反映原始变量与典型变量的共同方差,它的解释类似于因子载荷,就是每个原始变量对典型函数的相对贡献。山东大学硕士学位论文第3章自变量组和因变量组的选取我们将影响股票涨跌的变量称做自变量,反映股票涨跌的变量称做因变量。由于股票的日涨跌幅、日最大升幅、日最大降幅、股票日涨跌幅的均值能从不同的方面反映股票的涨跌情况,故本文选取股票的日涨跌幅、日最大升幅、日最大降幅、日涨跌幅的均值作为典型相关分析的因变量组。影响股票涨跌的因素按大类来分,主要有:股票日K线的基本数据、股票所属板块指数的日涨跌幅及其名次、股票日K线基本数据的衍生数据以及其它影响股票涨跌的因素数据等。这样一来,可选的自变量有很多。由于可选的自变量有很多,因此,需要在众多变量中挑选出自变量,选取自变量的标准有两条:一是选取出来的自变量,应与因变量组的相关性大;二是选取出来的自变量之间的相关性不大。本章将给出自变量的含义,自变量值的获得方法,和自变量的选取方法。文中所用的股票基本数据全部从“齐鲁证券集成版股票分析交易软件”中获得。中国银行(601988)股票部分日K线图,见图3—1。图3—1中国银行股票部分日K线图山东大学硕士学位论文3.1自变量和因变量数据的获得获取变量的数据,是进行数据统计和分析的基础。这里以“齐鲁证券集成版股票分析交易软件”为工具,介绍使用股票日K线获取变量数据的方法,其它获取变量数据的方法见附录。股票日K线的基本数据包括:.股票的昨收盘价、开盘价、最高价、最低价、收盘价.股票的日成交量.股票的平均成本价等。运行“齐鲁证券集成版股票分析交易软件”,调出中国银行(601988)的日K线图,见前面的图3—1。在该界面,执行菜单:[系统][数据导出];在弹出的“数据导出”窗口,选“ExcEL文件”;点“导出”按钮,即在默认路径:c:\docu鹏ntsandsettings\user\桌面,生成了601988.xLs文件。其中,路径和文件名也可以另行指定。这样获取的数据包括:日期、开盘、最高、最低、收盘、成交量等十余个数据项。这些数据项随日K线技术指标的不同而不同,见表3一l。衰3-1中国银行股票日K线基本数据山东大学硕士学位论文下面对使用股票“日K线图”获取数据再做几点说明:1.选取不同的技术指标,可以获得不同的基本数据,如:l(DJ指标、姒cD指标等。2.在获取数据前,应先对日K线做复权处理。3.使用“齐鲁证券集成版股票分析交易软件”,既可以获取Excel文件,也可以获取文本文件,甚至还可以获取图形文件。4.除了使用“齐鲁证券集成版股票分析交易软件”获取股票基本数据外,也可以使用其它股票分析软件,如:国泰君安大智慧分析软件等,或通过有关网站,如:中国上市企业资讯网等。5.可以将601988.xLS文件中的某些空白行进行删除,如:第1、2、3、5行;可以将601988.xLs文件中的某些无关列(数据项)进行删除,如:第7—14列;为了今后使用这些数据的方便,可以将601988。xLs文件中的列进行单元格格式设置,如:将时间设为文本格式,将开盘价、最高价、最低价、收盘价、成交量设为数值格式(保留两位小数)等。6.本文选取2006年7月5日至2007年8月10日之间的数据作为统计样本。要选择其它样本,可以删除某些行,选取一段时间的数据,作为统计样本。7.可以将601988.XLS文件转换成其它格式文件,如:VF数据库表文件,以利用VF编程进行数据处理。经过以上处理后的中国银行股票部分基本数据见表3—2。裹3-2中国银行股票部分基本数据列表3.2因变量组的选取本文选取了四个因变量:y。代表股票的日涨跌幅,y:代表股票的日最大升幅,y3代表股票的日最大降幅,n代表股票日涨跌幅的100日均值。股票日涨13山东大学硕士学位论文跌幅的均值选取了股票的loo日涨跌幅均值。3.2.1因变量组变量值的计算1、股票的日涨跌幅、日最大升幅、日最大降幅的计算公式如下:日涨跌幅=(收盘价一昨收盘价)/昨收盘价日最大升幅=(最高价一昨收盘价)/昨收盘价曰最大降幅=(昨收盘价一最低价)/昨收盘价这三个变量的计算,比较简单,可以在ExCEL表中进行,也可以利用V编程计算,这里不在累述。2、股票日涨跌幅的均值计算本文利用VF程序tj.prg,,计算股票日涨跌幅的均值。它可以一次计算股票的多种日涨跌幅均值,即可以一次计算m日的均值、m+1日的均值…n日均值,这里设m<n。股票日涨跌幅均值的计算程序清单及使用说明如下:clearclearallsetFtalkoffm=100n=100国10,20国12,20readusesay”INPUTM:say”INPUTN:“getmn“gettjt0scOuntdimea(s),b(s,n)go1tosfOri暑1a(i)=日涨跌skipendforgo1nfOri窖血toforj11toi一1b(j,i)掌Oendforfof14jIitos山东大学硕士学位论文b(j,i)暑Ofork暑j—i+1tojb(j,i)-b(j,i)+a(k)endforendfofendfoffOfi置1tosforj;mtonst一”ma“+alltrim(str(j—m+1))ifi<{reDl&stwith1000elserepl&stwithb(i,j)/jendifendfOrskipendforretUrn本程序中用到的数据库名称为:tj.dbf,数据库字段有:日期、股票的日涨跌、m1、m2、…、陋20等字段。ml、腿2、…、眦20中分别存放股票日涨跌幅的m日均值、m+1日均值….n日均值。其中,日均值的缺省值为1000。使用sPss统计分析软件的相关分析,得知:股票的日涨跌幅100日均值既与因变量日涨跌幅的相关性较小,又与自变量组的相关性大,故选取股票的日涨跌幅100日均值作为因变量组变量。相关分析的过程,这里不再累述。因变量组变量值的部分数据列表见表3—3。表3-3因变量组的部分数据列表日期yly2y3y4吲11/28-o.280.831.39-o.1吲11,290.560.562.23-0.04O“11/300.831.1lO.55-o.Ol06,12/01_o.550.271.65.o.0l06,12,0|42.2l3.3l1.10O.0106/07/12.1.33_o.271.3310003.3自变量组的选取自变量可从下列四类数据选取:股票日K线的基本数据、股票所属板块指山东大学硕士学位论文数的日涨跌幅及其名次、股票日K线基本数据的衍生数据以及其它影响股票涨跌的因素数据等。3.3.1股票日K线基本数据中自变量的选取.股票日K线基本数据这些数据包括:(1)股票价格:昨收盘价、开盘价、最高价、最低价、收盘价等;(2)股票的日成交量;(3)股票的平均成本价等。平均成本价可从股票日K线上获得,其它数据的获得方法前面已经给出。.股票日K线基本数据的自变量选取使用SPSS软件,对中国银行2006年7月5日至2007年8月10日共270个交易日的数据进行相关分析,得到如下结论:(1)昨收盘价与因变量(日涨跌幅、日最大升幅、日最大降幅、日涨跌幅的loo日均值)的相关系数在0.995以上,且在0.01的水平上显著相关。因此,在这5个变量中,我们将昨收盘价作为自变量组变量。(2)股票的日成交量与因变量(日涨跌幅、日最大升幅、日最大降幅、日涨跌幅的100日均值)的在0.01的水平上显著相关,我们将成交量也作为自变量组变量。3.3.2股票所属板块指数日涨跌幅中自变量的选取中国银行(601988)是上海证券交易所的股票,隶属于上证指数板块,且隶属于北京板块、金融行业、沪深300、300金融、上证100、上证50、中证100、道琼斯88、含H股、奥运概念、基金重仓等行业和概念板块。股票所属板块指数的日涨跌幅是指这些板块指数的日涨跌幅;股票所属板块指数日涨跌幅的名次是指这些板块指数在所有板块指数日涨跌幅中的名次。使用sPSS,对中国银行2006年7月5日至2007年8月10日共270个交易日的数据进行相关分析,得到如下结论:在这些行业和概念板块指数中,上证指数的日涨跌幅与因变量(日涨跌幅、日最大升幅、日最大降幅、日涨跌幅的loo日均值)的相关性最大。因此,我们只选取上证指数日涨跌幅作为自变量组变量。这里用到的道琼斯88、含H股、奥运概念、基金重仓等4个行业和概念板块指数的日涨跌幅用vF语言程序计算获得,程序清单及使用说明如下,其它行16山东大学硕士学位论文业和概念板块指数的日涨跌幅由它们的日K线图获得基本数据,再经过简单计算得到。股票所属板块指数日涨跌幅的计算程序包括一个主程序bktj.prg和一个子程序sub.prg。它可以计算股票所属板块指数的日涨跌幅,及其在所有板块中的涨跌名次。其中,日期板块库要求按板块的日涨跌幅由大到小次序排列。Bkmc.prg程序清单如下:clearcleara11settalkoffst=date()et=date()@lO,20say’input@12,20say’inputreadn=et—st+1dimensionstardate:”getstdate:’getetenda(n),ti(n)use上证指数t=stk=0fori=1ton1s=dtoc(t)ls=”20”+substr(1s,7,2)+substr(1s,1,2)+substr(1s,4,2)10caallfor日期=lsiffound()k=k+1a(k)=”bk’+1sti(k)=a11trim(日期)endift=t+1endforcleardocasecasek=0@10,20waitcasesay’该段时间无交易.’k=l@10,20waitdosubotherwjsesay”该段时问只有一个交易日,板块统计数据存在bktj.dbf中”17山东大学硕上学位论文第4章实例分析本章将使用sPSS关相型典的)889106(行银国中立建,件软析分计统O.014.1典型相关实例分析的日数据进行典型相关分析,其它时间段的统计分析见附录。易交个072工NCLUDE。D:\progr硼files\SPSS\canonical共日Ol月8年7002至日5月7年6002行银国中取选里这SPSSCANCORRcorrelation.sps’.SETl皇x1,x2,x3,x4,x5,x6,x7/sET2=y1,y2,y3,y4/.执行典型相关分析宏命令,得到各种统计数据,下面给出这些数据和对这些数据的分析。统计中所有变量的缺省值均为1000。4.1.1自变量组与因变量组的相关性分析见表4一l襄4-1自变量组与因变量组的相关系数由表4—1可知,自变量组与因变量组各指标之间都有很强的相关性,只是由于各指标具体内容不同,造成相关程度上存在一定程度的差异性,总体上能够用自变量组的指标来解释因变量组。4.1.2典型相关系数及其显著性检验2l山东大学硕士学位论文从表4—2可以看出,这四个典型相关系数均较高,表明相应的典型变量之间密切相关,高度相关,自变量组变量对因变量组变量的影响明显。通过比较他们各自的z2统计量计算值、临界值及p值,4对典型变量通过了z2统计量的检验,且p值都小于O.05。这表明,这4对典型变量之间相关系数显著,能够用自变量组的典型变量来解释因变量组的典型变量。4.1.3典型相关变量鉴于原始变量的计量单位不同,不宜直接比较,这里采用标准化的典型变量系数,构建典型变量,见表4—3。裹4_3典型相关变量宝曼1墨型塑茎錾量%;却.11“五+O.19。毛一O.37。恐一O.92。%K=一l·01×兑一O·9l×乃2屹:O.78。而+O.13。毛+O.18。_+O.33“而’,2=O.73×乃一0.39。乃+O.2。乃3吩:加.5。而+0.34。而+O.44。恐一O.5’‘旄+O.65。而vj=乏.5×M+1.8×乃一1.2×乃4‰:—O.2。葺+O.74×屯+0.48。而+O.38×-一O.43’‘%一O.24。毛v4=加.260乃+O.990儿4.1.4冗余度分析冗余度分析是对构建的典型相关变量解释能力的判断,见表4—4。山东大学硕士学位论文表4-4典型冗余度分析从表4—4可知,前4对典型变量的解释能力均较强。典型相关系数的平方数据显示,因变量组变量中分别有99%、76%、74%、50%的信息可由相应的自变量组变量予以解释。但方差比率只反映出因变量组和自变量组对第1、第2对典型变量具有较高的解释能力。4.1.5影响分析根据典型变量的重要程度及系数大小,从建立的典型相关变量可以看出,股票的涨跌及其影响因素的关系可以用4对典型相关变量予以综合描述。第1对典型变量中,对自变量典型变量中起主要作用的是‰日K线下影线长度、x5日K线上影线长度,它们与自变量典型变量皆为负相关;对因变量典型变量中起主要作用的是y2日最大升幅、y3日最大降幅,它们与因变量典型变量皆为负相关。第1对典型变量反映的是股票日K线的上、日K线下影线长度和股票升、日最大降幅之间的关系,它们之间成正相关。第2对典型变量中,对自变量典型变量中起主要作用的是x。上证指数涨跌幅,它与白变量典型变量皆为正相关;对因变量典型变量中起主要作用的是y。股票的日涨跌幅,它与因变量典型变量正相关。第2对典型变量反映的是上证指数的日涨跌幅、股票的日涨跌幅之间的关系,它们之间成正相关。因此,进行股票投资,必须对大势要有正确的预测,要善于在行业和概念中把握个股。第3对典型变量中,对自变量典型变量中起主要作用的是x,股票的高开低开,它与自变量典型变量正相关;对因变量典型变量中起主要作用的是股票的日涨跌幅,它与因变量典型变量负相关。第3对典型变量反映的是股票的高开低开和股票日涨跌之间的关系,它们之间成负相关。山东大学硕士学位论文由表4—5可知,对工商银行而言,自变量组与因变量组各指标之间也有很强的相关性,只是由于各指标具体内容不同,造成相关程度上存在一定程度的差异性,总体上能够用自变量组的指标来解释因变量组。4.2.2典型相关系数及其显著性检验裹4-6典型相关系数及其显著性检验从表4—6可以看出,这四个典型相关系数均较高,表明相应的典型变量之间密切相关,高度相关,自变量组变量对因变量组变量的影响明显。通过比较他们各自的z2统计量计算值、临界值及p值,4对典型变量通过了Z2统计量的检验,且p值都小于0.05。这表明,这4对典型变量之间相关系数显著,能够用自变量组的典型变量来解释因变量组的典型变量。4.2.3典型相关变量构建鉴于原始变量的计量单位不同,不宜直接比较,这里采用标准化的典型变山东大学硕士学位论文量系数,构建典型相关变量。见表4—7寰4-7典型相关变量序号l典型相关变量M:.o.6)‘而+O.52。‰一O.6。而H=l·’75×M—l·45×儿+l·14乃2屹:-o.74。五+O.63'‘而一O.64。而一O.77。‘屹=一1.13×乃一0.54×乃3嵋=一o.65×而一0.45吒+O.65×而+O.56×_一O.35×民码=-o.57M+1.07儿+O.75“乃+O.44儿4‰;1.2。_%=-o.87M—O.64×弘+O.73×儿4.2.4冗余度分析冗余度分析是对构建的典型相关变量解释能力的判断,见表4—8。裹4-8典型冗余度分析从表4—8可知,前4对典型变量的解释能力均较强。典型相关系数的平方数据显示,因变量组变量中分别有96%、86%、74%、37%的信息可由相应的自变26山东大学硕士学位论文量组变量予以解释。但方差比率只反映出因变量组和自变量组对第l、第2对典型变量具有较高的解释能力。4.2.5影响分析根据典型变量的重要程度及系数大小,从建立的典型相关变量可以看出,股票的涨跌及其影响因素的关系可以用4对典型相关变量予以综合描述.第1对典型变量中,对自变量典型变量中起主要作用的是x5日K线上影线长度、】【e日K线下影线长度、x,股票的日高开低开率;对因变量典型变量中起主要作用的是y。日涨跌幅、y:日最大升幅、y3日最大降幅。第1对典型变量反映的是股票日K线的日高开低开率、上下影线长度和股票涨跌之间的关系。第2对典型变量中,对自变量典型变量中起主要作用的是x。上证指数涨跌幅、x。股票的昨收盘价、x3股票的日成交量,抽股票的收盘价减去股票的平均成本价;对因变量典型变量中起主要作用的是yl股票的日涨跌幅、y4股票日涨跌幅均值。第2对典型变量反映的是上证指数涨跌幅、股票的昨收盘价、股票的日成交量,股票的收盘价减去股票的平均成本价与股票的日涨跌幅、股票日涨跌幅的均值之间的关系。第3对典型变量中,对自变量典型变量中起主要作用的是x。上证指数的日涨跌幅、x。股票的昨收盘价、x。股票的日成交量、轴股票的收盘价减去股票的平均成本价、粕股票日K线下影线长度;对因变量典型变量中起主要作用的是股票的y2股票的日最大升幅、y3股票的日最大降幅。第3对典型变量反映的是上证指数的日涨跌幅、股票的昨收盘价、股票的日成交量、股票的收盘价减去股票的平均成本价、股票日K线下影线长度与股票的日最大升幅、股票的日最大降幅之间的关系。第4对典型变量中,对自变量典型变量中起主要作用的是x;股票的收盘价减去股票的平均成本价,它们与自变量典型变量皆为正相关;对因变量典型变量中起主要作用的是y。股票的日涨跌幅、y3股票的日最大降幅、乳股票日涨跌幅的均值。第4对典型变量反映的是股票的收盘价减去股票的平均成本价和股票的均涨跌幅、股票的日最大降幅、股票日涨跌幅的均值之间的关系。山东大学硕士学位论文附录一、中国银行其它时间段样本的统计分析这里以中国银行(601988)具有代表性的股票价格上升期、下降期和盘整期三个时间段进行统计分析。l、上升期的统计分析这里以中国银行2006年11月15日至2007年1月4日,上升期共34个交易日的统计结果为例,进行数据统计分析。统计结果见附表1、附表2、附表3。附裹1自变量组与因变量组的相关系数上证指数涨跌X1股票的昨收盘价x2股票的日成交量№0.78股票的收盘价.平均成本价X』股票K线股票的日股票的K线下影线长度x6上影线长度X5日高开低开率№0.35股票的日涨跌幅yl股票的日最大升幅y2股票的日最大降幅y3股票的100日涨跌幅均值y4O.63O.58O.750.080.91O.5O.74O.940.850.48O.91O.58.o,54—o.25.o.54.o.4O.00.o.42以290.65O.410.960.860.98’O.5O.82附表2典型相关系数及其显著性检验典型变量数典型相关系数Wilk’sChis-SqDFSig山东大学硕士学位论文具有较高的解释能力。(5)影响分析第l对典型变量中,对自变量典型变量中起主要作用的是x:昨收盘价、】【B日K线下影线长度,它们与自变量典型变量分别为负、正相关;对因变量典型变量中起主要作用的是y2日最大升幅,它们与因变量典型变量为正相关。第l对典型变量反映的是股票的昨收盘价、日K线下影线长度和股票日最大升幅之间的关系。第2对典型变量中,对自变量典型变量中起主要作用的是x2昨收盘价、x.股票的收盘价减去平均成本价的差,它们与自变量典型变量分别为正、负相关;对因变量典型变量中起主要作用的是y。涨跌幅、y|日均涨跌幅,它们与因变量典型变量分别为负、正相关。第2对典型变量反映的是昨收盘价、股票的收盘价减去平均成本价的差和股票的日涨跌幅之间的关系。第3对典型变量中,对自变量典型变量中起主要作用的是】【4股票的收盘价减去平均成本价的差,它与自变量典型变量正相关;对因变量典型变量中起主要作用的是y:股票日最大升幅,它与因变量典型变量负相关。第3对典型变量反映的是股票的收盘价减去平均成本价的差和股票日最大升幅之间的关系,它们之间成负相关。第4对典型变量中,对自变量典型变量中起主要作用的是x。股票的收盘价减去平均成本价的差,它与自变量典型变量正相关;对因变量典型变量中起主要作用的是y。股票的日涨跌幅,它与因变量典型变量负相关。第4对典型变量反映的是股票的收盘价减去平均成本价的差和股票日涨跌幅之间的关系,它们之间成负相关。2、下降期的统计分析这里以中国银行2007年5月10日至2007年7月15日,下降期共40个交易日的统计结果为例,进行数据统计分析。统计结果见附表5、附表6、附表7、附表8。3l山东大学硕士学位论文附表6典型相关系数及其显著性检验附表7典型相关变量序号%=_o.39弓一O.89‰M=O.1M—O.74"一0.91乃2典型相关变量%=_o.23耳+1.O而一O.22而+O.15矗v2=-0.4乃+O.92乃3蚝:-0.63五+O.57恐一0.87_一O.37%一O.36%一O.16而屹=-o.71咒一O.35儿一O.37儿4心:—O.63而+0.15而+O.14而一O.28黾+0.54毛一0.49矗+O.79而v4=一1.99M+1.28M—1.36乃一O.1几山东大学硕士学位论文附衰”典型相关变量序号%=—O.64%一氏典型相关变量毪=一1.32仍一O.9《魄2地=-o.35而+O.46屯+O.14而一0.29_一O.7l屯+O.23%一032而v2=-o.77。乃一O.55儿+L18乃3坞=_o.59而+0,5置+O.12矗+0.22毛一0.17%+O.27而码=一1.83乃+O.8奶一0.58乃+O.53乃4‰:.o.34^+0.99_一O.33而一O.18心+O.1l而v4=O.96M—O.74弘+0.17乃+0.88儿附表12典型冗余度分析数据分析(略)。二、股票行情和报表基本数据的获取和使用方法这里以“齐鲁证券集成版股票分析交易软件”为工具,介绍股票行情和报表基本数据的获取和使用方法。1、股票行情和报表基本数据的获取运行“齐鲁证券集成版股票分析交易软件”,调出股票行情或报表界面,如附图l、附图2。山东大学硕士学位论文附图l上海证券交易所股票当日行情界面附图2所有板块热门板块报表