大学生如何写文浙江

更新时间:2024-03-19 作者:用户投稿原创标记本站原创 点赞:12456 浏览:55535

全国大学生统计建模大赛论文

论文题目:笔记本电脑特征指数的实证研究

——基于非线性Hedonic模型实证分析

参赛队员:顾光同王江高丽

指导老师:费宇王力宾

参赛单位:云南财经大学

提交日期:二零零九年九月

目录

摘 要-2-

一、问题的提出-3-

二,研究现状及存在的问题-4-

三,模型构建前的准备-6-

(一)若干检测设-6-

(二)数据的来源-7-

(三)特征变量的选择与数据量化处理-7-

1,借鉴国内外的研究经验-7-

2,根据消费者的喜好-8-

3,选取的特征变量与笔记本电脑具有较高的相关关系-8-

四,笔记本电脑的传统Hedonic模型的构建-10-

(一)传统模型的三种形式-10-

(二)基于传统模型的Hedonic模型构建-11-

五,基于Box-Cox变换的非线性Hedonic模型的构建-13-

(一)非线性特征概念-13-

(二)Box-Cox变换的基本思想-14-

(三)非线性Hedonic模型的统计诊断方法-16-

1,非线性Hedonic模型的引入-16-

2,非线性Hedonic模型变换参数的Atkinson检测设检验-16-

3,非线性Hedonic模型变换参数的Atkinson估计-17-

(四)非线性Hedonic模型的选取-17-

六,基于非线性的Hedonic模型的指数的编制-18-

(一)笔记本电脑的特征模型的确定-18-

(二)基于传统模型和非线性模型编制的特征指数的对比-21-

六,结论与建议-22-

附录-24-

40;解释等相关理论被建立起来了.上世纪60年代的Griliches[4]利用Hedonic方法编制了汽车产业的指数.随着技术的发展特征理论逐步完善,美国学者Lancaster(1966)提出的特征消费理论,又被称为Lancaster偏好理论.与萨缪尔森等经济学家在考察偏好和效用时从个体行为出发的做法不同,Lancaster从产品的差异出发,分析了构成产品的基本"元素"空间,认为对产品的需求并不是基于产品本身,而是因为产品所内含的特征,并且认为商品(特别是像住宅,汽车和劳动力这样的异质商品)具有一系列的特征,这些特征结合在一起形成影响效用的特征包,商品是作为内在特征的集合来出售的.家庭购写和使用这些商品,把它们转化为效用,效用水平的高低取决于商品所包含的各种特征的数量和质量.美国经济学家Rosen[5]等学者扩展了Lancaster理论,其将竞价理论融入到Lancaster特征消费理论中,就商品特征提出了特征供需均衡模型.在完全竞争市场条件下,Rosen以消费者效用最大化和生产者利润最大化作为目标,从理论上分析了异质性产品市场的短期均衡和长期均衡,为特征理论的建模,特征函数的估计奠定了基础.

在国内,根据所搜集的文献,王力宾[6]是中国较早将特征法应用到实践中来的学者,他将特征法运用到房地产分析研究中,温海珍,贾生华(2004)连续发表三篇论文定量分析房地产属性对房地产的影响,并建立杭州市总体市场和细分市场的特征模型.夏祥谦,王力宾[7]在研究汽车特征指数时,采用汽车功率,扭矩,最高车速和整备质量作为特征变量,得到特征函数,并指出特征模型剔除了"异质性"因素,能很真实的反映汽车的变动趋势.鉴于国内外学者的研究成果,我们可以肯定本文所研究对象的合理性及科学性,也相信其研究成果对的现实的指导有很高的实践意义.王力宾[8]是国内较早研究计算机特征指数编制方法的,不过用的不是我国的样本数据,次年,王晓玲,王力宾[9]运用我国笔记本电脑的数据资料编制笔记本电脑特征指数.徐国祥牟嫣2005年1月至2006年12月我国计算机硬盘为例,编制并实证了我国计算机硬盘特征指数,分析了硬盘的变化趋势.

上述学者在计算机这类商品方面做了大量研究工作,为后续研究做了很好的铺垫,但是,我们发现一个共同的存在的问题:大多是根据经验,直接采用适合于其他商品(汽车,住房,轨道交通等)的传统模型的三种形式(简单线性模型,双对数模型,半对数模型)中的一种拟合较好的模型来进行指数编制的研究,比如,雷怀英(2007,2016)在《统计研究》中分别发表的关于质量调整的Hedonic指数研究以及关于汽车指数研究中的模型也是直接选用了半对数模型进行指数编制.这样的经验方式存在几个不足之处(这里指的是值得商榷的地方,更合理的是我们觉得可以进行改进的地方):

(1)不同商品有明显的异质性会导致根据经验的模型不是万能的,

(2)没有很好解决被解释变量的正态性检验,事实上,很多商品即使用自然对数变换,仍然不能理所当然地把这些变换后的变量看作为近似正态,所以,上述研究在模型选择上存在一些可改进的地方,

(3)即使有学者在研究特征指数时提到了可用Box-Cox变换来选择模型,但是为何要进行变换,也就是对变量的变换必要性即检测设检验问题至今没有引入Hedonic模型选择中,

(4)还有一些不足,可能是本文中也可能存在的,需要进一步研究.

模型构建前的准备

(一)若干检测设

本文从研究的背景以及前辈们对所研究商品的特征指数中的不足出发,我们提出下列检测设:

(1)被解释变量即使通过取自然对数变换,仍然可能不满足正态性检测定,

(2)在特征指数研究中,存在非线性Hedonic模型,

(3)对某些商品的特征指数研究的模型选择中,数据变换是必要的,而且变换的检测设检验的引入也是必要的,

(4)针对某些商品的Hedonic模型,基于Box-Cox变换所得的非线性Hedonic模型优于传统三种Hedonic模型,并适合用于特征指数的编制和经济意义解释.

本文将在编制笔记本电脑特征指数的实证性研究中逐一验证上述检测设.国外学者Laurice和Bhattacharya(2005)认为在研究美国南加州地区三郡的房价特征时,增加二次的及立方的函数形式这样的非线性模型对改善模型的解释程度有相当良好的帮助作用.Griliches(1967)甚至建议可利用Box-Cox转换函数方法,在有关的统计结构下,从这些不同的特征函数形式选出其中一种形式.这建议说明,特征函数除了线性关系外,还存在非线性关系.Box和Draper(1969)也证明性的说明了,若在正态分布的线性模型下,采用Box-Cox变换函数后,将使误差得到正确的修正,更有修匀线性模型的效果.RaimondMaurer,MartinPitzer,SteffenSebastian(2004)指出根据所观察的数据得出,Box-Cox变换是确定特征函数最恰当的方法,并且在指数形成的基础上,选择特征的方程式,应优先考虑Box-Cox模型.因此,以上这些学者的观点说明,我们提出的检测设是合理的,我们的研究是具有实际意义的.

(二)数据的来源

根据IT权威中关村在线发布的2016年第一季度中国笔记本市场研究报告用户的关注度状况,第一季度中国市场关注度Hedonic模型的笔记本电脑的特征指数的实证研究.

用于构建特征指数的笔记本电脑数据来源于中关村在线,太平洋电脑网以及IT主流资讯平台IT168公布的2016年1月至9月的上述13个品牌的报价和相应特征参数.9期数据,共580个样本,其中第一季度176个样本(1月-3月样本数分别为62,56和58),第二季度177个样本(4月-6月样本数分别为54,60和63),第三季度227个样本(7月-9月样本数分别为72,66和89).

(三)特征变量的选择与数据量化处理

构建特征指数,首先须选择正确的特征指标,所选特征指标既是笔记本电脑特征的代表,又是消费者较为敏感,能够引起变化的指标.因此,我们按照下面三个方面选择特征变量,并对数据进行量化处理.

1,借鉴国内外的研究经验

从国内有关笔记本电脑的特征变量的选择来看,随着时间的推移以及研究侧重点的不同,笔记本电脑特征变量的选择也在不断地发生变化,王晓玲,王力宾(2007)对特征变量的考虑最为全面,他们从基本规格,存储设备,显示屏,外观特征,电池规格,显卡类型,品牌等方面进行了特征变量的选择与组合,选取了处理器主频,内存容量,硬盘容量,重量,电池工作时间,品牌作为特征变量.但是,他们所研究的笔记本电脑样本数据是按年份收集的,时间跨度大,Hedonic模型也是经验性地采用传统模型.

2,根据消费者的喜好

从消费者角度来看,配置,,功能,硬件配置已经成为制约消费的最大因素,有近36%会看重笔记本电脑的配置.由于笔记本电脑的功能扩展能力较强,因此功能因素所占的比例仅占13%.而着重笔记本电脑的款式和售后怎么写作的消费者各占4%,只有极个别消费者重视笔记本电脑的产地.14.1英寸屏幕大小是笔记本市场主流需求趋势,获得65.6%的关注比例,2笔记本关注度最高,获得19.5%关注比例,其次是奔腾双核机型,独立显卡笔记本更胜一筹,以66.8%的关注比例领先于集成显卡机型.配置功能SPSS15.0,将第二步初步选定的定量的一些特征变量与的相关性进行分析,结果见表2,结果显示笔记本重量和屏幕尺寸2个变量与()的相关性较小,因此在构建Hedonic模型直接将这些变量从模型中剔除.

根据以上分析,从笔记本定量的特性来看,可初步将标称主频,标配内存容量和硬盘容量等变量纳入模型,分别用,,表示.由于变量之间存在较高的相关关系,会引起多重共线性问题,而笔记本电脑配置存在性能搭配问题,比如标称主频高其标配内存容量大些,硬盘容量也大一些.从相关系数看,标配内存容量和标称主频之间的相关系数为0.392,伴随概率为0.000,通过了显着性检验,另外内存容量和硬盘容量二者的相关系数为0.558,伴随概率为0.000,通过了显着性检验.因此,在建模过程中,还需根据实际情况对变量进行再一次的筛选,以避免多重共线性问题的出现.

表2笔记本特征变量与的相关系数表

特征变量标称主频

(GHZ)标配内存容量(GB)硬盘容量(GB)笔记本重量(kg)屏幕尺寸

(英寸)Pearson相关系数0.275(**)0.474(**)0.256(**)0.053-0.019伴随概率0.0000.0000.0000.1970.643注:**表示在显着水平处极显着,*表示在显着水平处显着.

表3笔记本特征变量及其定义特征

分类特征变量定义(单位)代码基

格1,标称主频(GHZ)

2,标配内存容量(GB)

3,硬盘容量(GB)

4,处理器型号

5,集成显卡

6,中低端独立显卡

类型7,产品类型功能

特征8,蓝牙

9,摄像头

牌10,联想

11,惠普

12,华硕

从定性的特征变量来看,首先考虑不同类型的笔记本其产品定位的不同以及面向的消费群的不同,其降价的幅度与快慢也不同,因此引入虚拟变量以反映笔记本的不同产品类型,如将笔记本分为家用和商用两种,引入1个虚拟变量,用来表示,等于1,表示家用,等于0,表示商用.

其次,从笔记本配置方面考虑,消费者比较关心处理器型号,因此,引入1个虚拟变量,用来表示,等于1,表示迅驰2及以上,等于0,表示奔腾双核,赛扬双核及单核等.

另外,消费者比较关心显卡是不是独立的,尤其对图像处理功能要求高的消费者更关心这个问题,通过收集数据发现,现在显卡情况有集成显卡,中低端独立显卡和中高端独立显卡,因此,引入2个虚拟变量,用和来表示,等于1,表示中低端独立显卡或中高端独立显卡,等于0,表示集成显卡,等于1,表示中低端独立显卡,等于0,表示集成显卡或中高端独立显卡,即等于1,等于1表示中低端独立显卡,等于0,等于0表示集成显卡.

从功能来看,现代电子产品越来越追求无线传输,是否支持蓝牙是消费者购机考虑的因素,因此,引入1个虚拟变量,用来表示,等于1,表示支持蓝牙,否则表示不支持蓝牙,现在网上联络即聊天已经是"家常便饭了",消费者也很关心,笔记本是否有内置摄像头,因此,引入1个虚拟变量,用来表示,等于1,表示有内置摄像头,否则表示没有内置摄像头.

从品牌来看,不同品牌,消费者关注度不同,三大关注品牌为联想,惠普,华硕,其关注度分别为31.6%,18.6%,和9.9%,共占市场上关注度总额的60%以上,因此,引入3个虚拟变量,用,和来表示,等于1,表示联想,等于0表示其他品牌,等于0表示惠普,等于1,表示其他品牌,等于0表示华硕,等于1,表示其他品牌,即等于1,等于1,等于1表示联想,等于0,等于0,等于1表示惠普,等于0,等于1,等于0表示华硕,等于0,等于1,等于1表示其他品牌.

当然,还有些特征如指纹识别,人脸识别,双键盘以及迅驰4等高端的功能和配置虽说是顺应潮流,逐渐成为购写笔记本的消费者喜爱的配置,但从收集到的数据资料来看,现阶段只有少数的高档笔记本才配有这些装置,因此本文暂不把这些变量引入模型.

综合以上分析,首批选定包含基本规格,类型,功能特征,品牌四个方面的12个特征变量,见表3.

四,笔记本电脑的传统Hedonic模型的构建

(一)传统模型的三种形式

Hedonic回归文献中经常使用的函数形式有三种:线性模型,半对数模型和双对数模型,也就是本文所指的三种传统Hedonic模型.

(1)线性模型

(1)

(2)半对数模型

(2)

(3)双对数模型

(3)

这三种模型中,指在时期第种商品的,表示时期第种商品的第个特征,是常数项,是误差项,是特征变量系数,表示第个单位特征对的影响程度.在Hedonic模型中,暗含着一个检测设条件:消费者购写的是一组特征的组合,由此可将特征变量的系数解释为特征的"隐含"或"影子".因为特征的""也就不能直接观察到,从而只能通过观察由不同特征组合成的商品的来估计各单位特征的"隐含"或"影子".[12]

(二)基于传统模型的Hedonic模型构建

许多学者根据经验就直接选取半对数模型,这主要是该模型与双对数模型相比有一个优点[12]:半对数模型能够处理一个或更多的特征为零的情况,而双对数模型则不能.下面为了和我们提出的基于Box-Cox非线性模型比较优劣,利用合并的数据(三个季度的数据放一起,这里我们检测定特征不受时间的影响)以及统计软件SPSS15.0依次对笔记本电脑的传统Hedonic模型建模,其间用逐步回归方法消除特征间的共线性以及剔除不显着的特征变量,得到显着的线性模型,半对数模型和双对数模型(这里只对定量特征取对数,虚拟变量不加处理)的判决系数分别为:0.515,0.600,0.587.由此可知,半对数模型优于其他两个传统模型.我们又检测设,季度内的特征不受时间的影响,利用半对数模型建立合并数据和季度数据的Hedonic模型,利用逐步回归方法,得到回归输出结果见表4所示.由该表可得基于合并数据的笔记本电脑的半对数Hedonic模型为

第一季度的半对数Hedonic模型为

第二季度的半对数Hedonic模型为

第三季度的半对数Hedonic模型为

表4基于半对数回归模型(2)的输出结果

数据

类型纳入模型

(2)的特征变量特征变量系数t值P值(t值)合

据(Constant)8.581182.4540.000C50.32513.3360.0001.146C2-0.238-7.8010.0001.290C1-0.305-10.8560.0001.063X20.1449.6300.0001.191C7-0.139-3.6250.0001.026C60.110-3.3560.0011.096-0.0670-2.9000.0041.033F值等于8.409P值(F值)等于0.004R(相关系数)等于0.775R2(判决系数)等于0.600

DW值(自相关检验)等于1.554残差平方和等于42.378AIC等于-1501.51BIC等于-1466.61第

据(Constant)8.46788.2090.000C50.3938.4300.0001.119X20.2075.9500.0001.315C1-0.354-6.5040.0001.041C2-0.155-2.5170.0131.374c60.1282.1860.0301.053F值等于4.779P值(F值)等于0.030R(相关系数)等于0.783R2(判决系数)等于0.612

DW值(自相关检验)等于1.564残差平方和等于14.421AIC等于-428.32BIC等于-409.29第

据(Constant)8.363100.0570.000C50.3689.1230.0001.161C2-0.252-5.0270.0001.328X20.1424.5080.0001.529C1-0.216-4.6030.0001.072C3-0.174-3.8520.0001.464X30.0012.9480.0041.752C60.1532.7780.0061.135C7-0.184-2.2300.0271.042F值等于4.971P值(F值)等于0.027R(相关系数)等于0.817R2(判决系数)等于0.668

DW值(自相关检验)等于1.536残差平方和等于10.309AIC等于-485.23BIC等于-482.24第

据(Constant)8.43369.0700.000C2-0.265-5.8660.0001.237C50.2496.8070.0001.129C1-0.321-7.6890.0001.075X20.1246.0230.0001.252X10.1102.0370.0431.265F值等于4.148P值(F值)等于0.04R(相关系数)等于0.785R2(判决系数)等于0.616

DW值(自相关检验)等于1.656残差平方和等于14.370AIC等于-614.48BIC等于-593.93基于合并数据的半对数模型相应的残差图如图1所示,这些结果都说明拟合得还可以.为了检验我们提出的第一个检测设(被解释变量即使通过取自然对数变换,仍然可能通不过正态性检验),应用非参数的Kolmogorov-Smirnov正态性检验方法,借助统计软件SPSS15.0,得到结果见表5所示,由结果可知,即使半对数模型是三种Hedonic模型中最好的,但是第一季度的在显着水平0.05处不能通过正态性检验.而且我们注意到合并数据以及季度的判决系数还有提升的空间,这就是本文要重点解决的问题(这是基于我们提出的问题和检测设的).下文引入基于Box-Cox变换的非线性模型进行比较研究.

表5的Kolmogorov-Smirnov正态性检验

数据类型第一季度数据第二季度数据第三季度数据Kolmogorov-Smirnov

统计量值1.7021.1291.300P值0.0060.1560.068

图1合并数据的笔记本电脑特征变化的残差图

五,基于Box-Cox变换的非线性Hedonic模型的构建

(一)非线性特征概念

Wallace(1996)以特征前缘的概念,来说明房屋特征与房价之间的非线性关系.在这里我们也可以引申到笔记本特征与其之间的非线性关系上来.其看作由处理器标称主频,标配内存容量,处理器型号,硬盘容量等特征及其它有关的要素所组成的商品,将笔记本模型定义为种特征及个产品的特征函数.图2表现出此非线性关系的产生,检测设一定期间内,及为以及等两种特征因素,如内存容量与硬盘容量的大小,所表示的两种非线性笔记本特征弧线,弧线上为所销售笔记本种类的所有可能的及组合.在弧线之上,任何已知一点的斜率,定义了在该点上固定特征因素时,消费者的边际采购成本.图中及为笔记本的生产提供者,消费者L及K在消费相同或不同水平笔记本特征时所获得的效用,以(或)及来表示.Rosen(1974)及Wallance(1996)均认为,在有许多写方及卖方中市场中,特征弧线会在写卖双方的讨价还价中,循着三条曲线的切点的轨迹而走,如图2中的所连成特征曲线.[19]

图2所探讨的是笔记本电脑与其各种属性间可能存在非线性的特征关系.点到点的线,可能是由左下往右上的直线或是曲线,交易也可能有翻转的结果,形成幂次方的非线性结果或是其它不同的函数形式.

所以,若直观地决定使用水平,半对数或双对数等线性形式的模型,则可能对的估算产生相当大的误差,因此,在笔记本电脑的研究中仍有必要进一步考虑采用非线性的特征函数,下面引入Box-Cox变换的思想.

(二)Box-Cox变换的基本思想

在一般回归模型中,我们经常使用如下的线性模型

(4)

给定一组数据(),,若用模型(4)进行拟合,则要求数据满足以下条件:

(1)线性性,即因变量的数学期望和未知参数之间有线性关系,

(2)同方差性,即误差项,,

(3)正态性,在某些情况下要求~.

但是在实际检验中,我们发现某些数据不完全满足上述条件.为了有效的提高回归精度,可以使用一种常用的数据变换工具——Box-Cox变换(1964年由Box和Cox提出).其特点在于引入一个新的变换参数,通过数据本身估计出该参数,从而确定所应采取的数据变换形式.实践证明,Box-Cox变换对许多数据都是行之有效的,对因变量的Box-Cox变换可以明显地改善数据的正态性,方差齐性和对称性.

现在检测设因变量是一组取值为正的变量,对于考虑作如下变换

(5)

称为因变量的Box-Cox变换.它包含了许多常见变换,诸如对数变换(),倒数变换()和平方根变化().变量经过上述幂变换后形成如下的线性模型

,~(6)

其中是设计阵,是随机向量且,称为变换参数,且,我们使用变换的主要目地就是通过找出合适的变换参数进行数据变换,使变换后的数据满足模型检测定,从而使模型回归拟合的效果更好.但是形如(6)式的幂变换族,只能适用于正值变量,对于变量可取负值的情况,Box和Cox用带有移动参数的变换取代(6),该修正办法是给变量加上移动参数,使得>,0,即使(6)变为

(7)

(三)非线性Hedonic模型的统计诊断方法

1,非线性Hedonic模型的引入

根据上面的非线性Box-Cox变换模型的思想以及本文的研究的笔记本电脑的特征变量的定义和对半对数模型的分析,为了更好的与半对数模型做比较,我们可以引入下面的非线性Hedonic(考虑被解释变量的Box-Cox)模型


(8)

由(5)或(7)式可知

当等于0时,(8)式就等价于(2)式,即为半对数模型,当≠0或者不能近似看作0时,说明不能忽视其非线性的可能性,这也验证了我们提出的第二个检测设,并为验证第三,第四个检测设提供了基础.

2,非线性Hedonic模型变换参数的Atkinson检测设检验

非线性的Box-Cox转换模型的检测设检验的目的是要确定某个是否为合适的变换参数,以下是因变量的数据变换模型换参数的检测设检验问题.对于因变量的数据变换模型(8),考虑变换参数的检测设检验问题原检测设和被择检测设分别为

(9)

例如:在Box-Cox变换中,对于的情形,若被否定,则说明(9)中,因而需要做数据变换,若未否定,则可以为,因而等价于无需做数据变换:又如,对于的情形,若未否定,则可以认为(9)中,因而需要进行对数变换,即模型为半对数模型.

对于这个检验问题,Atkinson(1973,1982)提出了Atkinson检验统计量,常用的检验统计量还有似然比统计量和Score统计量,但是这两个统计量在计算上都比较复杂,韦博成等(1991)证实了三个统计量的检验效果是一致的,因此,本文就用比较实用且计算相对不复杂的Atkinson检验统计量来进行检验.

对于基于Box-Cox变换的非线性模型(8),其变换参数的检测设检验问题(9)的Atkinson检验统计量可表为

(10)

其中,

,

,表示P各分量的几何平均值,为阶的单位阵,,表示全是1的阶的列向量,见(5)或(7)式,,为样本容量,为特征变量个数.

通常取等于1,那么检验(9)变为

(11)

此时,,等于.

3,非线性Hedonic模型变换参数的Atkinson估计

本文用很有实用价值的Atkinson估计,这是Atkinson(1973,1982)首先提出来的.对于模型(8),其变换参数的Atkinson估计可表示为

(12)

其中

(四)非线性Hedonic模型的选取

有了模型(8)的结构以及统计诊断方法,现在就可以进行模型的选取分析,为了避免值不至于大到计算机认为无穷大值,这里先把变为单位为万元的值,也就是原来的值除以10000来处理,这样不影响编制笔记本电脑的特征指数,之后我们基于检测设检验(11),利用Atkinson检验统计量(10),并借用Matlab7.0软件编程(程序见附录B.程序部分)计算得Atkinson统计量值和转换参数的估计值,见表6所示,由于本文研究的笔记本电脑样本数据足够用正态分布近似分布,取显着水平为0.05,所以用正态分布的临界值等于1.96代替,由表6可知,不管是合并数据的还是分季度的检验结果均拒绝原检测设,即需要对进行Box-Cox转换,就检验了模型(8)的提出是合理的.表6还给出了合并数据以及分季度的转换参数的Atkinson估计值,而且估计值也不接近0,也就是说用半对数模型是不合理的,分季度和合并数据的转换参数的估计值相差不大,为了更好的编制笔记本特征指数,可取所有的.从而可得非线性的Hedonic模型为

(13)

模型(13)可整理为

(14)

由(14)式可得特征的预测模型为

(15)

表6Atkinson统计量值和转换参数的估计值

数据类型合并数据第一季度数据第二季度数据第三季度数据-37.2742-20.7940-17.1462-21.7152-0.4121-0.4709-0.3675-0.3084六,基于非线性的Hedonic模型的指数的编制

(一)笔记本电脑的特征模型的确定

现在我们利用模型(13)或(15)进行合并数据,第一季度,第二季度以及第三季度的Hedonic模型构建,为剔除不显着特征变量以及消除特征变量的多重共线性,这里采用逐步回归的方法进行结果输出,用统计软件SPSS15.0,输出结果见表7所示.由结果可看出,各项特征均通过了统计检验,所有常数项和解释变量

表7基于非线性回归模型(15)的输出结果

数据

类型纳入模型(15)的特征变量特征变量系数t值P值(t值)VIF

(膨胀因子)合

据(Constant)1.9723700.4240.000C50.00414.5440.0001.133C2-0.003-9.2040.0001.285C1-0.003-10.7240.0001.046X20.0028.7800.0001.188C60.0024.2600.0001.095C7-0.002-3.4190.0011.025F值等于11.689P值(F值)等于0.001R(相关系数)等于0.787R2(拟合优度)等于0.620

DW值(自相关检验)等于1.513残差平方和等于0.0056AIC等于-6682.59BIC等于-6652.04第

据(Constant)1.9711849.4900.000C50.0059.0120.0001.119X20.0025.7170.0001.315C1-0.004-6.1750.0001.041C2-0.002-3.2470.0011.374C60.0022.7400.0071.053F值等于7.505P值(F值)等于0.007R(相关系数)等于0.797R2(判决系数)等于0.635

DW值(自相关检验)等于1.520残差平方和等于0.0018AIC等于-2016.55BIC等于-1993.53第

据(Constant)1.9701967.0080.000C50.0049.1440.0001.157C2-0.004-5.8880.0001.319X20.0013.6200.0001.520C1-0.002-4.2410.0001.072C60.0023.2310.0011.132C3-0.002-3.2160.0021.448X37.36E-0062.5760.0111.751F值等于6.637P值(F值)等于0.011R(相关系数)等于0.814R2(判决系数)等于0.663

DW值(自相关检验)等于1.502残差平方和等于0.0015AIC等于-2052.17BIC等于-2026.76第

据(Constant)1.9712290.2150.000C2-0.003-6.2430.0001.338C50.0037.6370.0001.145C1-0.004-8.2220.0001.088X20.0014.0880.0001.722X36.56E-0062.5670.0111.617C60.0012.2810.0231.198C7-0.001-2.0830.0381.066F值等于4.339P值(F值)等于0.019R(相关系数)等于0.810R2(判决系数)等于0.656

DW值(自相关检验)等于1.710残差平方和等于0.0019AIC等于-2640.87BIC等于-2613.47的参数估计95%以上拒绝T检验零检测设,由VIF(膨胀因子)可知模型中已不存在多重共线性,由DW值可知,模型中的误差项都不存在序列相关,而且合并数据,第一季度,第二季度以及第三季度的Hedonic模型的判定系数分别为0.620,

0.635,0.663,0.656,都依次大于或接近半对数模型的0.610,0.612,0.668,0.616,进一步对比表4和表7,可知,基于模型(15)的残差平方和以及AIC(AkaikeInformationCriterion)和BIC(BayesianInformationCriterion)Kolmogorov-Smirnov正态性检验,见表8所示.因此,模型(13)要明显优于半对数模型(2).

表8的Kolmogorov-Smirnov正态性检验

数据类型第一季度数据第二季度数据第三季度数据Kolmogorov-Smirnov

统计量值1.1080.6490.747P值0.1720.7940.632基于非线性的模型(13),分析可知,所选的12个特征,在合并数据模型中,标配内存容量,产品类型,处理器型号,是否支持蓝牙,是否有内置摄像头,以及品牌(联想和相对其他品牌而言)对影响均极显着,第一,二季度模型中,相对合并数据模型少了品牌这一特征变量对的影响,第二,三季度模型中,相对合并数据模型多硬盘容量这一特征变量对的影响.因此,不论是合并数据还是分季度的模型中,标配内存容量,产品类型,处理器型号,是否支持蓝牙,是否有内置摄像头这5个特征变量对笔记本电脑的有极显着的影响.

根据分析可知,模型(13)是优于模型(2)的,为了构建笔记本电脑的特征指数,需分段估计Hedonic模型时,以第一季度为基期,则根据(15)式以及表7,可得基期的Hedonic回归方程为

报告期第二季度的Hedonic回归方程为

报告期第三季度的Hedonic回归方程为

(二)基于传统模型和非线性模型编制的特征指数的对比

Hedonic方程估计出来后,特征指数(HPI)的构建有多种形式,如拉氏指数(LPI),拉氏链指数(LCPI),佩氏指数(PPI),佩氏链指数(PCPI)和费暄理想指数(FP).现将各季度数据代入季度的特征模型,以第一季度为基期,编制了基于传统模型(2)和非线性模型(8)的特征和环比特征指数,并用简单算术平均法计算得基于原始数据的笔记本电脑的均价,以第一季度为基期,编制了简单算术平均环比指数,分别见表9和10所示.

表9特征比较(单位:元)

第一季度(基期)第二季度第三季度简单算术平均769272397038基于半对数模型的特征732175396772基于非线性模型的特征718162716138

表10特征指数(HPI)比较

第一季度(基期)第二季度第三季度简单算术平均环比指数100%94.11%97.22%基于半对数模型的环比HPI100%102.98%89.83%基于非线性模型的环比HPI100%87.33%97.88%根据中关村2016年第二季度国内笔记本市场分析报告[20],第二季度笔记本市场的总体走势是继续下降.第二季度市场降幅相比第一季度有较大提高.第二季度市场均价一直处于下降趋势,6月均价降为6159元.Hedonic模型编制的特征指数都反映了笔记本第三季度较第二季度有一定幅度的下降,但是,不管从第三季度笔记本市场均价的预测还是降幅来看,基于非线性的Hedonic模型的特征和特征指数更加合理,因为第三季度的7-8月检测期和9月开学是销售的旺季,尤其学生消费群是笔记本销售对象不可忽视的对象,第三季度也是个销售商"跑销量"的好时机,所以,各销售商采取降价促销以及提高笔记本配置等策略.因此,相对第二季度的第三季度的特征指数会走低,但是降幅不会大到10个百分点以上,这一预测只要中关村的第三季度国内笔记本市场分析报告出来,便能得到验证.

通过以上分析可知,不论是从模型的统计意义上来讲,还是根据这些模型反映的特征走势等经济意义来讲,本文提出的非线性Hedonic模型都是较合理的.

六,结论与建议

本文在对基于非线性Hedonic模型编制笔记本电脑特征指数进行实证研究的同时,在某些方面弥补了研究现状的不足,也验证了提出的四个检测设,可得到这样的结论:(1)被解释变量(商品)即使取了自然对数,仍不服从正态,(2)特征研究存在非线性Hedonic模型,(3)基于Box-Cox变换的模型选择中,有必要引入检测设检验和参数估计,(4)非线性Hedonic模型是优于传统的三种Hedonic模型的,所以,在进行特征研究时,直接根据经验选择是不完全合理的.

与传统的指数法相比较,特征指数(HPI)编制法具有以下优点:(1)消除了产品特征变化对产品的影响,(2)以实际资料构建的Hedonic模型为基础,运用统计方法科学地将特征变化程度加以量化,因此含有较少的主观因素,(3)特征法要求数据系统全面.目前国外已有许多应用扫描数据构建特征指数的应用,(4)非线性Hedonic模型以及半对数模型和线性模型能迅速的解决进入市场的新产品问题,而且根据实际资料建立非线性Hedonic模型效果更好,(5)Hedonic指数的编制能够用经济学的理论来解释.

实际在编制指数时,需进行连续性调查以得到不同时间上的交易和特征值,从而可利用特征法编制Hedonic指数.由于Hedonic指数编制的工程庞大,需要的数据资料较多,在现有条件还不成熟的情况下,可将Hedonic回归模型作为选取替代品的依据[12],比如在编制消费者指数(CPI)时,首先应在同一品牌的笔记本内有相同系列的CPU处理器的范围内选择替代品,从而保证替代品与原来商品之间较强的可比性.

本文也存在一些不足,需要后续继续研究,我们的重点是对我国笔记本电脑指数的编制提供一种新的思路,由于时间,样本信息及个人能力的限制,有一些问题需要进一步研究.例如,本文的特征模型中缺少一些未考虑到的特征变量,这一定程度上影响了Hedonic模型的拟合优度.可以在当前样本下进一步按月份编制特征指数,分析特征的长期时间趋势.

附录

附录A.原始数据:

由于数据量大,原始数据暂不附于此处,大赛组委需要本队提供原始数据,本队将及时以邮件的方式提供.

附录B.计算Atkinson统计量值和变换参数的估计值的Matlab程序:

X等于[等]%数据矩阵,第一列为变量P,从第二列开始依次特征变量的一个矩阵,这里由于本文的数据比较大,数据省略了,每次只要将需要的数据,比如合并数据或季度数据放入,即可求出Atkinson统计量值和变换参数的估计值.

P1等于X(:,1),%读取被解释变量

P等于P1/10000,

n等于length(P),%样本容量

I1等于ones(n,1),%产生全为1的列向量

L等于min(size(X))-1,%产生变量的个数

x等于[I1,X(:,2:L)],%产生设计矩阵

E等于eye(n,n),%产生单位矩阵

Q等于E-x*inv(x'*x)*x',%计算Q值

fori等于1:n-1

a(1)等于P(1),

a(i+1)等于a(i)*P(i+1),

end

G等于(a(n))^(1/n),%计算几何平均

W1等于P.*(log(P))-(log(G)+1)*P,

eW1等于Q*W1,

eP等于Q*P,

detaA等于(eP'*eP-(eW1'*eP)^2/(eW1'*eW1))/(n-L-1),

TA1等于-(eW1'*eP)/(sqrt(detaA)*sqrt(eW1'*eW1))%输出Atkinson统计量值

lamda等于1-(eW1'*eP)/(eW1'*eW1)%输出变换参数的估计值

相关论文范文