第二节 研究方法

一 样本选择

本书选择的样本城市包括两个方面:一是已经确定为国家中心城市的城市;二是行政级别比较高的区域中心和经济发展比较快的新崛起城市。具体来说,已经成为国家中心城市的城市有:北京、上海、广州、重庆、天津、武汉、成都、郑州和西安。从总体城市格局来看,北京、天津、上海、广州应当引领环渤海、长三角和珠三角区域;重庆地处内陆腹地,居承东启西重要战略地位;武汉辐射带动中部和长江中游地区;成都以建设国家中心城市为目标,增强其在西部地区重要的经济中心、科技中心、文创中心、对外交往中心和综合交通枢纽功能;郑州承担中国东中西部地区交通的枢纽作用;西安立足古丝绸之路起点,发挥区位交通连接东西、经济发展承东启西、文化交流东西互鉴的独特优势。本书选择的国家中心城市对照组包括剩余的11个副省级城市和4个区域中心城市。本书选择副省级城市和区域中心城市的原因:一是考虑大多数副省级城市都具有较高的城市竞争力;二是考虑到这些副省级城市都为区域中心城市,很有可能成为国家中心城市;三是新崛起城市的发展势头都比较好,经过发展也可能具有成为国家中心城市的能力。因此本书把这些城市设为对照组。其中,11个副省级城市为:哈尔滨、沈阳、南京、长春、济南、杭州、大连、青岛、深圳、厦门、宁波;4个重要的区域中心城市为苏州、无锡、合肥、长沙。

二 研究方法

(一)指标数据标准化方法

城市中心性由集聚度和联系度构成,而集聚度和联系度又由各项不同的指标构成,由于各项指标数据的量纲不同,因此首先对所有指标数据进行无量纲化处理。客观指标分为单一客观指标和综合客观指标。对于单一客观指标原始数据无量纲处理,本书主要采取标准化、指数法、阈值法和百分比等级法四种方法。

(1)标准化计算公式为:Xixi转换后的值,xi为原始数据,为平均值,Q2为方差,Xi为标准化后数据。

(2)指数法的计算公式为:Xixi转换后的值,xi为原始值,x0i为最大值,Xi为指数。

(3)阈值法的计算公式为:Xixi转换后的值,xi为原始值,xMax为最大样本值,xMin为最小样本值。

(4)百分比等级法的计算公式为:Xixi转换后的值,xi为原始值,ni为小于xi的样本值数量,Ni为除xi外大于等于xi的样本值数量。

综合客观指标原始数据的无量纲化处理是:先对构成中的各单个指标进行量化处理,再用等权法加权求得综合的指标值。

(二)城市综合中心性计量方法

包括原始指标在内,课题设计的解释性城市中心性指标为三级:一级指标为城市总中心性;二级指标为城市集聚度指数和城市联系度指数,三级指标为各项具体指标。在将三级指标合成二级指标时,采用先标准化再等权相加的办法,标准化方法如前所述。其公式为:

其中,zil表示各二级指标,zilj表示各三级指标。

在将二级指标合成一级指标时,本书运行非线性加权综合法将上述得到的城市集聚度指数和联系度指数综合在一起。

其中,Zi表示各一级指标,wl表示各二级指标的权重,此处表示城市集聚度和联系度的权重,zil表示各二级指标的合成值,此处表示城市集聚度和城市联系度。运用非线性加权综合法进行城市综合发展水平的计量,能够更全面、科学地反映综合指标值。

(三)城市对标分析方法

采用基准对标分析法(见图2—1),选择关键对标城市。研究郑州与目标城市、竞争城市、合作城市和追赶城市之间的关系,突出郑州的优势和发现郑州需要注意的问题。通过研究郑州与对标城市之间的合作性和竞争性,从而为郑州寻求与对标城市错位发展,实现良性竞争,避免恶性竞争,精准并放大互补关系上的合作,达至协同效应和互利共赢的创造条件,为郑州建设国家中心城市提供必要的路径和建议。

图2—1 对标分析模型

(四)聚类分析方法

本书试图主要使用聚类分析(Cluster analysis)郑州国家中心指数,从而对国家中心的格局、类型和层级进行分析。聚类分析是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集(subset),这样让在同一个子集中的成员对象都有相似的一些属性,聚类分析就是分析如何对样品(或变量)进行量化分类的问题。系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。

系统聚类的过程是:假设总共有n个样品(或变量),第一步将每个样品(或变量)独自聚成一类,共有n类;第二步根据所确定的样品(或变量)“距离”公式,把距离较近的两个样品(或变量)聚合为一类,其他的样品(或变量)仍各自聚为一类,共聚成n-1类;第三步将“距离”最近的两个类进一步聚成一类,共聚成n-2类……以上步骤一直进行下去,最后将所有的样品(或变量)全聚成一类。为了直观地反映以上的系统聚类过程,可以把整个分类系统画成一张谱系图。所以有时系统聚类也称为谱系分析。

线性聚类分析(LDA)的目的是最大化类间距离、最小化类的距离。使用SSDR方法后得到的聚类标号向量Labels和数据集Y作为LDA方法的输入,进行有监督的维数约简处理,得到降维过后的新数据集X’,用于下一步K-means聚类算法的输入。LDA是监督维数约减方法,它寻找一个最优的投影方向,使得在投影空间中的不同类数据对象之间距离远,而相同类数据对象之间距离近。LDA的目标函数如下:

公式(3)中类间散布矩阵SB和类内散布矩阵SW可以分别表示如下:

公式(4)和公式(5)中,L是类数,m是全部样本的均值,mi是第i类样本均值,ni是第i类样本数。

(五)耦合协调度计算方法

此外,本书利用耦合协调度的计算方法来判断国家中心城市各分项的总体耦合性和协调性。多变量耦合协调度计算公式为:

其中,fix)表示一个城市的第i个变量的数值,Cv表示一个城市n个变量之间的协调度,αi表示评价体系中赋予第i个变量的权重,D表示n个变量之间的协调耦合度。

(执笔人:倪鹏飞、王雨飞、徐海东)


[1] 根据本书的研究机理,国家中心城市的具体功能分为政治、金融、科技、交通、教育、医疗、文化、信息、贸易(物流)、国际交往功能。鉴于北京是中国的唯一政治中心,国家政治中心城市不再单独设置指标体系。