基于APSO—SVR的山岳风景区短期客流量预测

更新时间:2024-03-27 作者:用户投稿原创标记本站原创 点赞:21691 浏览:95585

摘 要:根据山岳风景区短期客流量小样本、非线性等特征,本文提出基于自适应粒子群算法(Adaptive Particle Swarm Optimization,APSO)的支持向量回归(Support Vector Regression,SVR)模型,融合SVR处理小样本、非线性预测特性和APSO优化SVR参数的能力对山岳风景区短期客流量进行预测.来自山岳风景区黄山2008年~2011年暑期相关日数据的验证结果表明:与PSO-SVR、GA-SVR和BPNN等模型相比,APSO-SVR模型的预测准确性更高、误差更小,是进行山岳风景区短期客流量预测的有效工具.

关 键 词 :短期客流量; 山岳风景区; 支持向量回归; 自适应粒子群算法; 预测模型

山岳风景区是以山地为主要风景资源和构景要素的具有美感的地域综合体(周维权,2006).一些山岳风景区由于其独特的地形地貌、植被景观、人文景观成为热点旅游目的地,客流量经常处于超饱和状态,尤其在旅游旺季.这对景区接待容纳能力提出了严峻考验.准确地预测短期客流量,可以使景区管理部门提前规划、科学决策.然而,由于受到各种因素如历史客流量、天气等影响,短期客流量往往呈现复杂的非线性特征,同时由于国内大部分景区信息化起步较晚,有记录的客流量数据较少(小样本),造成客流量预测值和真实值之间存在较大偏差,这给景区的资源调度等工作带来一定的难度.因此建立一个科学准确的、能反映与历史客流量、天气等要素有定量关系的短期客流量预测模型,对山岳风景区乃至整个旅游行业意义重大.

早期的旅游客流量预测方法起源于上世纪30年代,以传统时间序列预测方法为主,如指数平滑模型(Exponential Smoothing,ES)(Christiaanse,1971)、自回归滑动平均模型(Autoregressive Moving Average,ARMA)、自回归求和滑动平均模型(Autoregressive Integrated Moving Average,ARIMA)等(Box,Piercd,1970;Box,Jenkins,1976).传统时间序列预测方法重在时间趋势的外推,对具有线性特征的旅游客流量有很好的预测效果,但往往难以实现复杂的非线性旅游客流量预测.人工神经网络(Artificial Neural Network,ANN)作为一种新的智能算法,具有良好的非线性数据的处理能力(Rob,2000),为非线性旅游客流量预测提供了一种选择,但由于受“收敛速度慢、难以确定网络结构、局部最优”等缺点的制约(牛东晓,邢棉,1999),也难以达到所需预测效果.上世纪90年代中期,Vapnik等(2009)提出了支持向量回归(Support Vector Regression,SVR)(Vapnik,2009).该方法在解决小样本、非线性旅游客流量预测方面表现出许多特有的优势,逐渐成为学者们预测旅游客流量的一种重要工具.Hong(2006)使用SVR预测巴巴多斯岛(Barbados)的旅游客流量,对比方法为ARIMA、ANN;Chen和Wang(2007)使用SVR预测2000年~2001年中国入境游客流量,并与ARIMA、反向传播神经网络(Back-Propagation Neural Networks,BPNN)进行对比;Cai等(2009)将SVR与BPNN对比预测陕西省客流量;Chen(2011)在预测台湾的出游人数时,将SVR与ES、ARIMA和BPNN进行比较.上述文献最终预测结果均显示:SVR预测效果优于ES、ARIMA等传统时间序列预测方法和BPNN等ANN算法,原因在于它克服了传统时间序列预测方法和ANN的上述缺点.

SVR良好的预测效果依赖于自由参数的正确选择.因此,根据实际的数据模型选择恰当的自由参数成为关键问题.自适应粒子群算法(Adaptive Particle Swarm Optimization,APSO)(Kennedy,Eberhart,1995)是在粒子群算法的基础发展起来的一种进化算法,它通过惯性权重的自动更新,克服了PSO的早熟、振荡现象.目前APSO已经被广泛应用于非线性及复杂优化问题的参数寻优等领域.

基于上述分析,本文提出APSO-SVR短期客流量预测模型,并将这种模型与山岳风景区短期客流量的特点相结合,得到一种短期客流量的智能预测方法.最后以黄山风景区为例,通过对其每日客流量影响因素的分析,建立了一个与历史客流量、电子商务网上订票客流量、人体舒适度等影响因素有定量关系的APSO-SVR短期客流量预测模型.该模型相对于目前国内大部分旅游景区以感性管理经验为主的预测方式,及目前文献以月数据(Kulendran,Shan,2002)、季数据(Lim,McAleer,2002)和年数据(Papatheodorou,Song,2005)为主体中长期客流量预测来说,是一个突破.

1.APSO-SVR方法

1.1 SVR原理

SVR通过非线性变换将输入向量变换到一个高维的特征空间,然后在这个特征空间中求取最优线性分类面,使分类边界即分类平面与最近点(支持向量)之间的距离最大;并且这种非线性变换是通过定义合适的核函数来实现,然后将SVR问题转化为一个二次规划问题,从而求解(刘涵,等,2005).

2.应用实例分析

2.1 数据来源及内容

如无特别说明,本文有关黄山风景区的统计数据均来自黄山风景区管理委员会信息中心.

作为我国著名的5山岳风景区,黄山以“奇松、怪石、云海、温泉”著称于世.每年的暑期(7月、8月)为黄山景区的旅游旺季.2008年~2011年,黄山风景区暑期客流总量占全年客流总量的百分比分别为24.62%、25.29%、24.76%和25.70%.客流量多而集中,持续时间长,给景区的资源和调度等工作造成很大的压力,因此本文选取黄山风景区2008年~2011年暑期每日数据作为APSO-SVR模型的研究对象,具有一定的代表性.数据包括:每日客流量、昨日客流量、每日上午8点前客流量、每日 通过电子商务(网上)订票的客流量和每日人体舒适度指数,其中每日

黄山风景区暑期每日数据包括:每日客流量、昨日客流量、每日上午8点前客流量、每日通过电子商务(网上)订票的客流量和每日人体舒适度指数,其中每日人体舒适度指数通过每日温度、湿度、风向和风速等的值转化而来(秦海超,等,2006).具体如图1、图2所示(昨日客流量因与每日客流量只差1天,故图1未列出).

2.2 暑期短期客流量影响因素的确定

暑期短期客流量影响因素作为SVR模型的输入,其正确选择对预测的准确性起着至关重要的作用.图1、图2显示:每日上午8点前客流量、每日通过电子商务订票客流量、昨日客流量、每日人体舒适度指数和每日客流量的变化几乎同周期,说明它们对每日客流量产生一定影响.为了进一步确定这4个因素对每日客流量的影响程度,分别将它们与每日客流量进行两两相关性分析(孙满英,等,2008;周巍,等,2004).具体结果见表1.

2.4 预测结果比较

为了进一步验证APSO-SVR模型的准确性和有效性,将其与PSO-SVR 、遗传算法(Geic Algorithm,GA)-SVR和BPNN方法对比.预测结果比较分析如下:

(1) 拟合能力与预测能力.训练集和测试集的预测值分别反映模型的拟合能力和预测能力,拟合和预测能力越强,模型预测的准确性就越高.图4(a)~(c)反映了各模型对2008年~2010年数据的拟合能力,结果显示APSO-SVR的拟合能力强于其他3个模型.图5和表2反映了各模型2011年暑期预测值与实际值的比较结果:APSO-SVR较其他3个模型的预测效果更优(图5);2011年暑期62天中,APSO-SVR预测值最接近实际值的天数为41天,而PSO-SVR、GA -SVR和BPNN分别为14天、5天和2天(表2).上述结果进一步说明APSO-SVR预测准确性更高,其次是PSO-SVR和GA-SVR,BPNN预测效果较差.

(2) 预测性能指标评价.平均绝对误差(Mean Absolute Error,MAE)、平均绝对百分误差(Mean Absolute Percentage Error,MAPE)、均方根误差(Root Mean Square Error,RMSE)和相关系数R等指标常被人们用来评价模型预测优劣:MAE 、MAPE 和RMSE反映了实际值和预测值之间的偏差,它们的值越低,表明实际值和预测值越接近;R反映了实际值和预测值之间的相关程度,R值越接近于1,实际值和预测值相关程度越高,预测的准确性越高.表3的指标值表明,APSO-SVR的所有指标均好于其他三个模型,其次为PSO-SVR和GA-SVR,BPNN预测效果较差.再次证明APSO-SVR模型效果最优.

(3) 原因分析.出现上述情况可能有两方面的原因:第一,目前所获取的短期客流量数据小样本、非线性的特征,符合了SVR对小样本、非线性数据预测有效的特点;BPNN是大样本分析方法,对小样本数据泛化能力较差,而且当输入变量,即客流量影响因素较多时会使得神经网络模型面临“维数灾难”问题,往往达不到所需的预测精度,因此以SVR为基础的模型整体预测效果优于BPNN模型.第二,在和PSO、GA算法的比较中,APSO可根据适应值与粒子群平均适应值的变化自动调整权重.这种特点使得该算法具有更优的全局搜索能力,有效地避免了PSO、GA的早熟收敛、振荡等问题,因此APSO参数选优效果好于PSO 和GA.

基于以上原因,APSO-SVR模型预测准确性更高,误差更小,是进行山岳风景区短期客流量预测的一种有效的工具.

3.结论

准确预测山岳风景区短期客流量可以为其资源统一管理和合理调度提供直接信息,为管理者科学决策提供直接依据,对山岳风景区乃至整个旅游行业具有重要的指导价值和实践意义.

山岳风景区短期客流量具有小样本、非线性等特点,使用传统时间序列预测方法及ANN等对其进行预测,难以得到有效的结果.

本文提出的APSO-SVR预测模型,融合SVR小样本、非线性预测的能力及APSO算法收敛速度快、自适应全局搜索能力强的优势,将模型应用于黄山风景区2011年暑期每日客流量预测,并将预测结果与PSO-SVR、GA-SVR和BPNN进行对比,结果表明:相对于其他模型,APSO-SVR模型更有效地实现了每日客流量的预测,准确性更高,误差更小,是进行山岳风景区短期客流量预测的一种有效工具.模型真实反映出每日客流量预测值与历史客流量、电子商务订票客流量、人体舒适度等要素之间的定量关系,易于执行,其预测结果简单可视,除了应用于景区游客预测,还可以推广到交通、酒店等相似领域的客流量预测.


致谢:感谢黄山风景区管理委员会信息中心为本文提供了研究数据.

mand[J].Touri Management,2007(28):215-226.

[6] Christiaanse W R.Short-term load forecasting using general exponential oothing[J].IEEE Transactions on Power Apparatus and Systems,1971,90(2):900-911.

[7] Han F,Ling Q H.A new approach for function approximation incorporating adaptive particle swarm optimization and a priori information[J].Applied Mathematics and Computation,2008,205(2):792-798.

[8] Hong W C.The application of support vector machines to forecast tourist arrivals in Barbados:an empirical study[J].International Journal of Management,2006,23(2):375-385.

[9] Hong W C.Chaotic particle swarm optimization algorithm in a support vector regression electric load forecasting model[J].Energy Conversion and Management,2009,50(1):105-117.

[10] Kennedy J,Eberhart R C.Particle swarm optimization[C].Proceedings of IEEE international conference neural works,1995:1942-1948.

[11] Kulendran N,Shan J.Forecasting China’s monthly in bound trel demand[J].Journal of Trel & Touri Marketing,2002,13(1-2):5-19.

[12] Lim C,McAleer M.Time-series forecasts of international trel demand for Australia[J].Touri Management,2002,23(4):389-396.

[13] Pai P F,Hong W C,Chang P T,et al.The application of support vector machines to forecast tourist arrivals in Barbados:an empirical study[J].International Journal of Management,2006,123(2):375-385.

[14] Papatheodorou A,Song H Y.International touri forecasts:time-series analysis of world regional data[J].Touri Economics,2005,11(1):11-23.

[15] Rob L.Back-propagation learning in improving the accuracy of neural work-based touri demand forecasting[J].Touri Management,2000,21(4):331-340.

[16] Vapnik V N.The Nature of Statistical Learning Theory[M].许建华,张学工,译.北京:电子工业出版社,2009.

[17] 陈荔,马荣国.基于支持向量机的都市圈客运量预测模型[J].交通运输工程学报,2010(6):75-81.

[18] 杜京义,侯媛彬.基于遗传算法的支持向量回归机参数选取[J].系统工程与电子技术,2006(9):1430-1433.

[19] 刘涵,刘丁,李琦.基于支持向量机的混沌时间序列非线性预测[J].系统工程理论与实践,2005(9):94-99.

[20] 牛东晓,邢棉.时间序列的小波神经网络预测模型的研究[J].系统工程理论与实践,1999(5):89-92.

[21] 秦海超,王玮,周晖,等.人体舒适度指数在短期电力负荷预测中的应用[J].电力系统及其自动化学报,2006(2):63-66.

[22] 周巍,陈秋红,肖晶,卢毅.人体舒适度指数对用电负荷的影响[J].电力需求侧管理,2004(3):54-56.

[23] 周维权.园林.风景.建筑[M].天津:百花文艺出版社,2006.

[24] 孙满英,周秉根,程晓丽.九华山旅游气候适宜性及其对客流量影响[J].池州学院学报,2008(5):104-107.