您的当前位置:首页正文

基于k-means聚类算法下安徽省各地级市经济差异的比较分析

2024-04-23 来源:独旅网
基于k-means聚类算法下安徽省各地级市经济差异的比较分

马永梅;胡传双

【摘 要】针对安徽省16个地级市,采用k-means聚类分析法在6个不同指标下进行聚类分析,为了保证聚类的有效性,首先对K值的选取进行了优化处理.经过综合分析,最终把16个地级市分成五类,即经济发达地区、经济比较发达地区、经济一般发达地区、经济发展较缓慢地区和经济发展缓慢地区.最后,针对不同类别地区经济发展进行差异比较分析,并结合各地区域经济发展特色,分类给出相应发展政策建议. 【期刊名称】《统计与管理》 【年(卷),期】2019(000)003 【总页数】5页(P55-59)

【关键词】k-means聚类算法;经济差异;区域经济;经济指标 【作 者】马永梅;胡传双

【作者单位】巢湖学院 数学与统计学院,安徽 巢湖 238000;中国科学技术大学 管理学院,安徽 合肥 230038;巢湖学院 数学与统计学院,安徽 巢湖 238000;中国科学技术大学 公共事务学院,安徽 合肥 230038 【正文语种】中 文 【中图分类】G424.1

一、引言

安徽省位于我国东南部,地跨长江,淮河,新安江三大流域,紧靠以上海为中心的长江三角洲经济区,是临江近水的内陆省份。安徽省在西部大开发战略中具有独特的承东启西,连南接北的区位优势。近年来,伴随着我国经济翻天覆地的变化,安徽省的经济也大大提高,人民生活水平明显改善。但是安徽省各地区发展不平衡不充分的问题仍比较突出,面临不少困难和挑战[1]。胡俊等[2]认为安徽省区域经济差异处在增速不断的扩大的增长过程中,且造成这种差异主要是由各个区域内部差异构成。王可侠和彭玉婷[3]研究发现安徽省总体经济实力增强,区域经济呈现出良好的发展态势和特征,但仍存在中心城市规模较小、地区发展差距加大、结构性问题突出等问题。闫化强[4]以安徽省各地级市为研究单元,运用过去10年的数据,测算了安徽省的区域经济发展差异及其演变过程,研究结果发现安徽省区域经济差异总体上呈现逐年扩大的趋势。然而2011年8月安徽省重新进行了市县行政区域划分,并且前期研究大都在行政区域划分之前,现实参考价值不大,因此重新对安徽省各地级市区域经济的差异分析是必要的。

目前安徽省下设16个地级市,6个县级市,55个县,44个市辖区,255个街道办事处,1249个乡镇(详见图1)。 二、指标的选取、数据整理

衡量一个地区经济发展的指标有很多,不同的经济指标反映了不同的经济特征,本研究以安徽省16个地级市为研究对象,选取以下指标:

地区人均生产总值(GDP)X1(单位:元):人均地区生产总值指总产出(GDP总额,即本地区社会产品和服务的产出总额)除以总人口,是人们了解和把握一个地区的宏观经济运行状况的有效工具。 图1:安徽省行政区域划分图

年平均工资X2(单位:元):指各市城镇地区全部非私营法人单位,具体包括国有单位、城镇集体单位、联营经济、股份制经济、外商投资经济、港澳台商投资经济等单位。工资统计是统计单位的就业人员,而个体就业人员、自由职业者等非单位就业人员不在工资统计范围内。

地方财政收入X3(单位:元):是指地方财政年度收入,包括地方本级收入、中央税收返还和转移支付,由本地区的财政收入组成。

各市农村居民人均可支配收入X4(单位:元):是指各市农民家庭全年人均总收入,包括实物收入,扣除家庭经营费用支出、生产用固定资产折旧、税收、上交集体承包任务和调查补贴等归农民所有的收入。

各市城镇居民平均每人全年家庭收入X5(单位:元):指调查户可用于最终消费支出和其它非义务性支出以及储蓄的总和,即居民家庭可以用来自由支配的收入。它是家庭总收入扣除交纳的所得税、个人交纳的社会保障费以及调查户的记账补贴后的收入。

各市城镇居民家庭平均每人全年消费性支出X6(单位:元):指调查住户用于本家庭日常生活的全部支出,包括食品、衣着、家庭设备用品及服务、医疗保健、交通和通信、教育文化娱乐服务、居住、杂项商品和服务八大类等。

为了更好地对比安徽省各地级市区域经济的差异性,分别搜集整理了2012年和2017年各地区的指标数据,拟通过对比两组数据的聚类结果,客观地对各地区经济的发展进行系统分析。

表1:2012年安徽省各地级市经济指标取值(单位:元)注:以上数据来自《安徽统计年鉴2013》?

表2:2017年安徽省各地级市经济指标取值(单位:元)注:以上数据来自《安徽统计年鉴2018》?

为了更好地观察各指标的变化,进一步计算出2017年相对于2012年各个指标的

增长率如表3所示。

表3:2017年相对于2012年各指标增长率统计表?

三、基于k-means聚类算法下的安徽省各地级市经济差异分析

k-means算法是聚类分析中最常用的方法之一,最早由MacQueen提出[5],此方法目前已经被应用到很多领域。为方便叙述首先给出相关知识: (一)相关定义

假设A = {ai |a i ∈ Rm,i = 1,2,…,n} 为给定的数据集,Ti(i = 1,2,…,k)代表k个类别,c(T1 ) ,c (T 2)… ,c (Tk)分别是k个聚类中心。

定义1 设向量xi =(xi 1 ,xi 2 ,…,xim )和向量yj =(yj1 ,yj2 ,…,y jm )分别表示两个数据的对象,那么它们之间的欧式距离为:

其中是Ti中数据对象的个数。 (二)k-means算法

k-means算法的主要思想是通过迭代的过程把数据集划分为不同的类别,使得评价聚类性能的准则函数达到最优。算法描述如下: 1、根据经验给定聚类数目k; 2、确定k个初始的聚类中心;

3、根据欧式距离原则进行聚类:计算每个样本到各个聚类中心的距离,将数据对象分配到距离最近的簇中;

4、计算每个类中的样本数据均值,作为新的k个聚类的中心; 5、重复步骤3和步骤4,当质心不发生变化时停止并输出聚类结果. (三)基于2012年和2017年安徽省各地级市的 k-means聚类分析

根据评价类间的差异性和类内的相似性,利用R软件分析当聚类个数时,类间解释的离差平方和占总平方和的86.3%,聚类效果较好。

图2:2012年各地级市k-means聚类结果图

为消除数据数量级的影响,先用scale()函数进行标准化处理,然后用kmeans()函数作动态聚类,这里选择“Hartigan-Wong”算法。首先对2012年各地级市进行聚类分析,结果如下:

第一类:亳州、宿州、蚌埠、阜阳、六安、安庆 第二类:滁州、宣城、池州、黄山 第三类:合肥

第四类:马鞍山、芜湖、铜陵 第五类:淮北、淮南

同理得到2017年安徽省各地级市聚类结果,如下所示: 第一类:马鞍山、芜湖 第二类:合肥

第三类:亳州、宿州、阜阳、六安、安庆 第四类:淮北、淮南、滁州、池州、黄山、蚌埠 第五类:宣城、铜陵

图3:2017年各地级市k-means聚类结果图

为了更加形象直观地分析聚类结果,下面把2012年和2017年的聚类结果以地图形式给出,如图4、图5所示: 图4:2012年各地级市聚类结果分布图 图5:2017年各地级市聚类结果分布图

合肥市在两次聚类结果中均被单独划为一类,合肥作为安徽省的省会,是本省政治、经济、文化中心。但在2012年之前,也就是行政区域划分之前,本地区的经济发展相对比较缓慢,个别经济指标较落后于马鞍山、芜湖、铜陵, 2012年之后,合肥的经济呈持续快速发展趋势。随着地方财政收入的不断增加,人均地区生产总值

不断上升,人民的消费水平发生较大改善,人民的生活水平不断提高,到2017年合肥的各项经济指标在安徽省各地级市中处于领先地位,另外合肥市在工业、农业、建筑业等行业的发展也非常迅速。因此合肥被划分为第一类城市,称为经济发达地区。

马鞍山、芜湖、铜陵三地位于长江中下游,地理位置优越,常年降水充足,形成许多河流和湖泊。马鞍山不仅拥有丰富的矿产资源和水产品,而且还具有风光秀丽的旅游资源,因此马鞍山的经济增速一直比较稳定,由表1和表2可以看到,马鞍山的城乡居民人均收支均一直处于领先地位,但是随着其它地级市的飞速发展,马鞍山和周边地级市的收入差距逐步缩小,总之,从两次聚类结果中来看马鞍山未出现较大变化。芜湖,作为安徽省的第二大城市,是安徽省域副中心城市,与合肥并称为安徽省的“双核”城市。另外,芜湖地处皖南旅游示范区,是安徽省最大的货运、外贸、集装箱中转港。2012年和2017年芜湖市的地区生产总值和城乡居民收支仅次于合肥,在两次聚类结果中也未呈现较大变化。铜陵位于安徽省南部,因铜得名,以铜而兴。铜陵的矿产资源丰富,工业经济发展对全市经济增长的贡献率达到70%左右。然而由表3看到,铜陵的人均地区生产总值较2012年呈现负增长,农村居民人均可支配收入相对增加较少,另外从其它经济指标综合分析,铜陵的发展已经落后于马鞍山、芜湖两地。因此第二类经济比较发达地区由三个城市变为两个城市。

第三类城市为经济一般发达地区。2012年由淮北和淮南两个城市构成。淮北和淮南地处淮河北面和南面。淮北的矿产资源较为丰富,拥有较多的植物资源和动物资源。淮北近几年的经济不断发展,但增长缓慢,尤其在年平均工资指标中,增幅达到最低。另外在地方财政收入中增长率也比较低,淮北甚至达到最低增幅2.75%。因此淮北相较于其它城市,发展相对比较缓慢。淮南在合肥的北边,是沿淮城市群的重要节点,是合肥都市圈的核心城市。淮南作为中国能源之都、华东工业粮仓,

是安徽省重要的工业城市。淮南的矿产资源、电力资源、水资源等都比较丰富。2012年淮南和淮北的经济发展仅次于马鞍山、芜湖和铜陵。但是2017年,淮南的人均地区生产总值的增长率出现负数,说明本地区的经济发展趋于下滑状态。对比分析发现,宣城在近几年的发展比较明显,除二类城市之外,在人均地区生产总值中稍落后于黄山市,其它指标均高于其它城市。宣城位于安徽省东南部,与江浙两省接壤。宣城物产丰饶。国民经济增长快速,市场物价持续上涨,民营经济发展势头良好,企业景气指数持续看好。因此在各指标增长率中均有较大增幅。综上,2017年处于一般发达地区的城市由铜陵和宣城构成比较合适,而淮北和淮南的经济发展相对比较迟缓,划分到第四类地区。

第四类城市为经济增长较缓慢地区。2012年的聚类城市为滁州、宣城、池州和黄山,此四类地区位于安徽省东部和南部。池州和黄山拥有丰富的旅游资源。池州是长江南岸重要的滨江港口城市,有比较丰富的自然资源。黄山市位于安徽省最南端,地形地貌多种多样。工业对本市经济增长的贡献率在38%左右。滁州市位于安徽省的东部,是南京市江北门户。滁州以第二产业结构占比最高,通过对外贸易,拉动内需促进本地经济发展。滁州、黄山、池州近几年的经济虽有所增长,但是增长速度相较于三类城市,仍然发展比较缓慢。因此仍被划分为经济增长较缓慢地区。进一步对比分析2012年和2017年的聚类结果,并结合表1、表2、表3,发现蚌埠近几年的发展较快,尤其在人均地区生产总值增幅中达到65.12%,位居各地级市第一,另外在其它指标增幅中也处于较大幅度增长,因此蚌埠由原来经济发展缓慢地区逐渐过渡到经济发展较缓慢地区。综上,第四类地区目前包括淮北、淮南、滁州、黄山、池州和蚌埠。

第五类城市为经济增长缓慢地区。两次聚类结果均显示亳州、宿州、阜阳、六安、安庆划为一类。这五个城市位于安徽省的西部和北部,历史比较悠久,大都以第二、第三产业为主。其中,亳州的中药产业比较闻名。这五个城市的人均地区生产总值

相较于其它城市取值较低,但是增幅相对稳定。为了加快本地经济发展,各地政府通过增加地区财政收入以缩小与其它地级市的差距,其中阜阳在财政收入指标中的增幅为127.40%,达到最高。亳州和宿州的增幅分别为98.27%和87.87%,明显高于其它城市,但是由于地区生产总值排名靠后,因此这五个城市依然被划分为经济增长缓慢城市。 四、结论与建议

由k-means聚类分析发现合肥通过近几年的飞速发展,各项指标位居各地级市经济发展的前列,综合分析称为第一类城市;芜湖、马鞍山的发展仅次于合肥,个别指标甚至高于合肥,被称为第二类城市;铜陵近几年经济发展有所下滑,宣城经济大幅提升,这两个城市目前的各项经济指标比较接近,且取值小于二类城市,因此被称为三类城市;第四类城市为淮北、淮南、蚌埠、池州、黄山、滁州。由于淮北、淮南的发展减缓和原四类城市池州、黄山、滁州的经济指标取值逐步靠拢,因此被划为四类城市。蚌埠在近几年的发展较快,2017年实现地区生产总值(GDP)1550亿元,位居全省第七位,但是蚌埠的工资收入均值较低,全市城镇居民家庭平均每人全年消费性支出较低,因此综合分析划为四类城市。第五类城市为亳州、宿州、阜阳、六安、安庆。这几个地区的人均地区生产总值排名靠后,虽然此地区财政收入增幅较大,但仍无法扭转经济增长迟缓的局面。

由表3看到,随着地方财政收入的增加,各市城乡居民的可支配收入均呈现增长趋势,最大增幅达到108.02%,最低增幅为22.80%,与收入相对的人均消费性支出显著性提高,说明人民的消费水平得到较大改善,各地区的经济差异正在逐步缩小。为了更好地推动安徽省整体经济的发展,针对五类城市提出以下建议: 对于第一类城市,应继续发展第三产业,从而使现代服务业集体发力,稳固工业产业结构,打造合肥经济圈,借助雄厚的科研基础,发挥地区科技创新能力,加快生态发展,促使区域经济协调稳定发展[6]。

对于第二类城市,应加快产业结构转型升级,向IT、互联网、高端制造、人工智能、未来科技等尖端领域发展,发挥区域优势,利用本土资源,发展区域产业,减少对省会合肥的依赖,加快城市化进程。

对于第三类城市,应充分利用本地自然资源,推进工业转型升级[7],完善创新支撑体系,推动服务业集聚发展,加快推进地区经济协调发展,健全城乡统筹新格局。逐步提升绿色发展的水平,打造生态文明的新样板。

对于第四类城市,要实施省会经济圈发展战略。淮河两岸城市,积极发展农业产业,加大工业发展力度,通过生态经济带动各项建设,偿还历史欠账,努力将淮河流域建设成为“美丽淮河”,使其生态文明、产业现代、环境友好、资源节约、城乡和谐,建立黄淮海经济区。合肥南部城市黄山和池州要发展本土旅游服务产业[9],继续发挥徽州文化产业发展的优势,从而提高区域经济的发展速度。

对于第五类城市,由于地理位置处于安徽西部和北部,城市建立时代久远,个别城市位置相对偏僻,经济发展相对迟缓。建议此类城市要以科技兴市、科教兴农的为发展理念,重新调整产业结构,发挥县域经济优势,招商引资,努力发展适合本地区的产业[10]。后期的发展要注意北部对接中原城市群,西南对接长江中游城市群,中部和东南对接长三角经济区,促进区域平衡发展。

综上分析,安徽具有独特的区位优势,连通南北、承东启西,是中国几个最重要城市群的交汇地带,南北西东四面逢源,合肥成为中国最重要的高铁枢纽,安徽的地理优势不容小觑。2017年以来,全省主要经济指标增速位次稳居全国和中部前列,经济运行的质量效益趋优。安徽省各地级市在不同经济指标下的发展势头迅猛,区域经济协同联动发展的新格局加快形成。皖北地区自主发展能力持续提升,部分经济指标增速领跑全省。未来发展中,地方政府要致力解决经济发展中的突出矛盾和问题,加快地方经济发展速度,缩减区域经济差异,从而保证安徽省的经济稳中有进。

【相关文献】

[1]徐旭初,熊康.安徽省经济发展区域平衡性研究[J].黑龙江工业学院学报(综合版),2019,19(03):76-80.

[2]胡俊,张宜红,朱建军.安徽区域经济差异分析——基于泰尔指数的分解分析[J].安徽农业大学学报(社会科学版),2007,34(03):56-60.

[3]王可侠,彭玉婷.安徽“十二五”区域经济协调发展研究[J].学术界,2010,15(3):135-141. [4]闫化强.安徽区域经济差异与协调发展研究[D].安徽大学,2013.

[5]袁利永,王基一.一种改进的半监督k-means聚类算法[J].计算机工程与科学,2011,33(6):138-143.

[6]钱进.安徽经济发展战略的选择[J].安徽工业大学学报(社会科学版),2009,26(5):15-17. [7]李华,周建龙,胡成.金融危机下铜陵有色产业转型思路与对策研究[J].铜陵学院学报,2009,8(05):28-30.

[8]李平原.淮南实施省会经济圈发展战略的SWOT分析[J].安徽理工大学学报(社会科学版),2012,14(04):27-30.

[9]万龙飞.新时期黄山市旅游经济的发展策略[J].新经济,2015(28):34-38. [10]朱能飞.安庆市县域经济发展策略研究[J].黑龙江对外经贸,2010(12):62-64.

因篇幅问题不能全部显示,请点此查看更多更全内容