会计年报信息在股价运动趋势预测中的应用

更新时间:2024-01-30 作者:用户投稿原创标记本站原创 点赞:4628 浏览:11393

[摘 要] 本文运用基于统计学习理论的新型机器学习方法――支持向量机(SVM),通过我国上市公司年报信息对股价运动趋 势进行预测.实证结果显示,支持向量机对股价运动趋势具有良好的预测能力,特别是表现出对小样本的适应性.然 而,支持向量在股价运动趋势预测中也存在着一定的误识率,证明某些上市公司的年报信息存在着某种程度的粉饰 和虚检测,从而误导投资者的决策行为.

[关 键 词 ] 年报信息;股价运动趋势;支持向量机

[中图分类号] F830.91 [文献标识码] A [文章编号] 1006-5024(2008)01-0169-03

[作者简介] 黄 梅,重庆市女劳教所会计师,研究方向为财务管理;(重庆 400021)

唐德祥,重庆工学院经济与贸易学院副教授,研究方向为证券投资;

邓成超,重庆工学院教务处副研究员,研究方向为教育管理.(重庆 400050)

一、引言

股票运动预测,一直是投资界和理论界倍感兴趣和努力探索的问题.但是,股票市场是一种影响因素众多的复杂系统,导致股价运动规律难以测定和预测结果难尽人意.有效市场理论认为,证券在市场有效条件下随机游走,是不可预测的.然而,大量研究发现股价运动存在着某种规律,具有一定的可预测性,所以国内、外学者对股价预测的研究从未间断过.由于传统时间序列预测技术很难揭示股价运动内在规律,近年来发展并形成了一些非线性动态系统的预测新理论,如机器学习理论、混沌和分形理论、系统理论等方法.

支持向量机(Support Vector Machine,SVM)是近年来发展起来的一种新型机器学习方法,目前国外对支持向量机的研究方兴未艾、发展迅猛,已经成功应用于人脸识别、语音识别、医疗诊断、数据挖掘等方面.国内对支持向量机的研究是最近几年开始的,然而在经济管理中的应用研究(特别是复杂的股票市场)甚少.本文目的在于运用支持向量机通过上市公司年报信息对其股价运动趋势进行预测,从而对股票投资决策和股市政策制定起到一定的参考作用.

二、支持向量机的基本思想及其模式识别模型

传统机器学习方法(如神经网络等)的重要理论基础是传统统计学的样本数目趋于无穷大的渐近理论,采用经验风险最小化(ERM)准则,结果不可避免地产生经验依赖性、局部最优解和“过拟合”现象,从而导致学习性和推广性弱化等缺陷.针对此缺陷,以研究小样本机器学习规律的统计学习理论(SLT)应运而生.20世纪60、70年代,Vapnik等人系统地研究了机器学习问题,尤其是在有限样本情况下的统计学习问题,于1995年形成了较为成熟的理论框架《统计学习理论的本质》,其核心概念是VC维(VC维越大则学习机器越复杂),并由此得出了统计学习的一致性、收敛速度、泛化能力等重要结论.


对于有限样本的两分类问题,预测函数集中所有函数的经验风险Remp(w)和实际风险R(w)之间以至少1-η的概率满足:R(w)≤Remp(w)+(h/n),其中w为机器学习参数,h是函数集的VC维,n是样本数,为置信函数.可见,学习机器的实际风险R(w)是由经验风险Remp(w)(训练误差)和置信范围(h/n)两部分组成.传统的经验风险最小化(ERM)准则因无法计算期望风险,只有通过样本定义经验风险,并设计算法使其最小化.针对该缺陷,

统计学习理论提出了结构风险最小化(SRM)准则,目标是使经验风险与置信范围之和最小化,并采用有序风险最小化策略,来实现实际风险R(w)最小化.

支持向量机采用结构风险最小化准则,具有良好推广性和分类精确性,在小样本学习中优势更为突出,能够较好地解决小样本、非线性和高维数等实际问题,可以广泛应用于模式识别、回归分析和函数逼近等领域,其基本思想是:通过输入训练样本,寻找尽可能将两类样本正确分类(分类识别标号分别为“+1”和“-1”),同时使分类间隔最大的分类超平面作为最优分类超平面,同时将最优化问题转化为存在全局唯一最优解的凸二次规划问题,再将得到的最优分类超平面转化为分类符号函数以实现对预测样本的正确分类.支持向量机包括模式识别模型和回归估计模型.由于本文是运用公司年报信息对股票运动趋势进行预测,所以属于模式识别问题.

支持向量机的模式识别模型一般分为三种情形:①样本集线性可分情形;②样本集线性不可分情形;③样本集非线性情形.由于现实社会经济现象的复杂性,其关系一般表现为非线性情形,它通过非线性变换将输入空间变换到一个高维特征空间,并构建最优分类超平面,通过引入核函数(Kerner Function)方法来避免“维数灾难”.目前主要常用4类核函数K(xi,xj):①线性核函数:K(xi,xj)等于xiTxj;②多项式核函数:K(xi,xj)等于(γxiTxj+r)d,γ>0;③径向基核函数(RBF):K(xi,xj)等于exp(-γ‖xi-xj‖2),γ>0;④两层神经网络核函数(Sigmoid):K(xi,xj)等于tanh(γxiTxj+r).其中,γ、r、d是对应核函数的参数,可以根据测试要求进行调试.

三、实证检验

(一)指标选择与样本设定

样本输入集{xi}的信息识别指标选择:基于可比性,本文经过反复试算遴选出五个方面的13个年报信息指标作为股价运动趋势的识别指标:盈利能力指标(包括主营业务利润率、总资产利润率、净资产收益率和每股收益)、偿债能力指标(包括资产负债率和流动比率)、资产管理能力指标(包括总资产周转率)、成长能力指标(包括总资产增长率、主营业务收入增长率和净利润增长率)和股本扩张能力指标(包括每股净资产、每股公积金和每股未分配利润).以上指标数据由上海证券交易所网站http://.省略之上市公司2004年年度报告相关数据计算而得,之所以选择2004年披露的年度报告为样本是因为该时间段股市相对比较平稳,能够更好地反映年报信息对股价变动的作用.

样本输出集{xj}的股价运动趋势识别标号确定:根据上市公司年报信息披露前、后股票是否发生显著变化来确定股价运动趋势的识别标号,如果股票在年报信息披露前后显著上升,则识别标号取“+1”;反之,识别标号取“-1”.本文利用Wilcoxon符号平均秩方法对股价是否显著变动进行检验,检验时间取年报披露日的前、后各20天.

样本设定:基于代表性考虑,本文选择2004年7月1日起正式生效的上证180指数的样本股.前面股价运动趋势检验中,在10%显著性水平下有149支股票通过了显著性检验,故样本{xik,xjk}的总容量i等于149.为了对比研究需要,本文选择了两组样本:第一组样本输入集{xi}是前面的13个信息识别指标,即输入集维数m等于13;第二组样本输入集{xi}是在前面13个指标遴选出投资者最关注的3个信息识别指标(每股收益、每股净资产和每股未分配利润),即输入集维数m等于3,与其对应的样本输出集{yi}形成两组样本{xik,yik}(k等于1,2).与此同时,为了检验支持向量机对小样本的适应性,再在两组样本基础上对每组样本细分成6小组进行对比实验,分组方法以样本股代码顺序为准,分别取占总样本20%、33.3%、40%、50%、60%和80%的样本股为训练样本,对应剩余的80%、66.7%、60%、50%、40%和20%的样本股为预测样本,由此在两组样本基础上再次形成了6个小组.


(二)支持向量机的核函数和对应参数选择及其预测结果

最优核函数的选择:本文运用的支持向量机实验软件是Libsvm-2.8.基于各个核函数都与惩罚因子C有关,所以我们先固定C等于100,反复调试各个核函数中的其它对应参数,来对比不同核函数对年报信息的识别效果.对比实验结果显示:径向基核函数(RBF)的平均正确识别率最高,因此我们选择径向基核函数作为最优核函数.

最优核函数(RBF)的最优参数选择及预测结果:在径向基核函数(RBF)中涉及两个最重要参数:一是惩罚因子C,一是参数γ.为了解决训练样本的“过拟合”问题,我们利用交叉比对过程(Cross Validation)来实现最优惩罚因子C和参数γ的自动搜索,交叉比对过程由网格搜索法(grid-search)来实现.上表对应列出其最优参数、CV率及样本正确预测(识别)率.

四、结论与政策建议

本文通过支持向量机技术对股权属性、董事会特征与绩效识别的实证支持,得出以下结论与政策建议:

第一、支持向量机在股票运动趋势预测中的实证效果良好,各组样本(不论训练样本占总样本比例大与小)的平均正确识别率基本都在80%以上,表现出支持向量机对有限样本的良好泛化能力(特别是对小样本的适应性),从而印证了公司年报信息是投资者的重要投资决策依据.因此,证券监管部门要不断完善股市的信息披露制度,保护投资者利益;

第二、通过训练样本和预测样本实验结果的对比分析发现,训练样本正确识别率均高于预测样本正确识别率,说明支持向量机的推广能力有待进一步改善.支持向量机的识别效果取决于核函数及其最优参数的选择,因此应针对金融应用领域对支持向量机作进一步深入研究,以便为投资决策发挥更大作用;

第三、通过两组样本(输入集维数分别为m等于3和m等于13)的对比研究发现,3个信息识别指标比13个信息识别指标的识别效果更好,证实我国投资者对公司发展前景判断的片面性.因此,要大力开展投资者教育,增加投资知识存量,构建股票市场的理性微观基础;

第四、通过分析少数错误识别结果的信息识别指标发现,这些财务指标存在着一定的异常值,这些异常值往往与公司经营的微观因素有关.因此,构建更全面、更科学股价运动的信息识别指标体系,进一步改善支持向量机的预测效果;

第五、支持向量机在股价运动趋势预测中存在着一定的误识率,证明由于信息不对称某些上市公司的年报信息存在着一定程度的粉饰和虚检测,误导投资决策行为.同时也证实我国股票市场存在着一定程度的违规或非法行为,干扰了支持向量机的识别能力.因此,证券监管部门要不断完善证券市场的规章制度,促进股市健康发展.

ng,2002(46),31-159.

[责任编辑:徐国庆]

注:“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文.”