为了与元胞自动机(CA)模型对离散网格输入的要求相匹配,我们将站点级别的邻域结构映射到了 1 公里的网格中。这种空间转换捕捉到了元胞之间的移动情况。
人类移动性的空间分布表明,在区域层面上,人口的流入和流出总体上是不均匀的。当聚焦于高流动性城市进行观察时,这种空间异质性便显现出来。例如,广州、佛山和深圳都呈现出高人口流入的特征。总体而言,人类移动性的强度从广州和深圳的核心区域向外逐渐递减。值得注意的是,小城市的移动性在空间上表现出更强的局限性,其流动主要集中在各自的城市核心区。这种空间形态与既有的城市功能区理论相吻合,因为人类活动自然会向中心区域汇聚,例如中央商务区、商业中心、医疗设施以及主要的交通枢纽节点。
(2)利用人类移动性进行经济与人口模拟
本文提出的 HME-CA 模型在城市经济和人口模拟方面展现出了强大的性能。其中,GDP 模拟的准确度达到了 24.00% 的平均绝对百分比误差(MAPE)和 2.96 的均方根误差(RMSE),而人口模拟的 MAPE 为 16.00%,RMSE 为 1.02。
图 5 不同环路范围内公共设施的供需匹配情况
如图 5 所示,该模型有效地捕捉到了珠三角(PRD)地区经济和人口的空间格局,即经济发达和人口稠密的区域集中在主要城市(如广州、深圳、佛山和珠海),并由这些核心向外围城市辐射发展。具体而言,HME-CA 模型在模拟集中区域的经济分布模式方面表现尤为出色,例如东莞的东部工业区、广州北部的接壤地区以及惠州西部地区。在这些区域,HME-CA 模型准确预测了向更高密度经济形态的转变,而传统的空间邻域效应和静态驱动因素在短时间跨度内对此类转变的预测能力较为有限。这些结果证明,将人类移动性纳入元胞演化规则中,显著提升了城市经济和人口模拟的准确性。
尽管如此,HME-CA 模型在模拟广州和深圳的 GDP 时仍存在低估现象,而在模拟肇庆、江门和东莞等城市时则出现了高估(图 5c)。这种模式可能与 HME-CA 模型中的邻域效应有关,即 GDP 数值主要受到周边网格单元的影响。对于广州和深圳这样的核心城市,其经济增长不仅由局部邻域效应驱动,还受到内部因素(如创新能力)的推动,而这些因素并未被相邻单元完全捕捉到。相反,欠发达城市(如肇庆)的 GDP 则更依赖于邻近单元的空间邻域效应,这可能会被模型过度放大,从而导致高估。
在人口模拟方面,HME-CA 模型对珠三角地区的人口总体呈现低估趋势(图 5f)。这很可能是因为人口分布不仅受局部邻域效应驱动,还受到住房容量、规划政策以及长距离迁移等更广泛因素的影响。尽管模型中引入了人类移动性来捕捉远程耦合的相互作用,但基于元胞自动机(CA)的转换规则可能仍无法完全囊括这些大规模且非局部的人口动态,进而导致了整体的低估。
(3)模型性能与对比分析
为了系统评估人类移动性对城市模拟的影响,实验构建了四种元胞自动机(CA)模型:a. RF-CA:不含人类移动性变量的基准模型;b. RF-CA-A:加入了人类流动信息因子的 RF-CA 模型;c. RF-CA-N:引入了基于人类移动性的邻域结构的RF-CA模型;d. HME-CA:同时加入了人类流动信息因子和基于移动性的邻域结构的 RF-CA 模型。
基于珠三角(PRD)地区 2010 年至 2020 年的经济和人口数据,实验通过空间叠加分析识别出了发生土地利用转换的网格。随后,对这些网格及其相关的驱动因子进行采样,用于训练包含 30 棵决策树、采样率为10%的随机森林模型,并进行了模型性能与对比分析。
表2 HME-CA 与 RF-CA 模型在经济和人口模拟上的 MAPE 对比
图6 珠三角地区城市经济与人口模拟中HEM-CA、RF-CA、RF-CA-A 与
RF-CA-N 模型的对比
表3 珠三角地区经济与人口模拟的模型性能
总体而言,本文提出的 HME-CA 模型在城市模拟中取得了最优的性能(表 2,图 6)。在 GDP 模拟方面,HME-CA 模型的平均绝对百分比误差(MAPE)为 24.00%,而 RF-CA 模型为 31.61%。HME-CA 模型对应的均方根误差(RMSE)为 2.96,比 RF-CA 模型降低了近 41%。同样,在人口模拟方面,HME-CA 模型的 MAPE 最低,仅为 16.00%,远低于 RF-CA 模型的 22.32%(表 3)。这些结果表明,本文提出的 HME-CA 模型显著提高了城市群经济与人口模拟的准确性。此外,HME-CA 模型在 GDP 模拟方面的表现显著优于 RF-CA 模型,尤其是在东莞、佛山、惠州和深圳,其准确度提升了 15% 以上(表 2)。该模型更准确地捕捉了连片区域(包括广州从化区以及惠州龙门县和惠东县)的经济分布模式,在这些区域,经济密度趋势正向更高价值的类别转变(图 6)。在人口动态方面,HME-CA 模型相比 RF-CA 模型也展现出显著的提升,尤其是在深圳和中山等城市,模拟准确度提高了 10% 以上(表 2)。这些提升在低密度的外围区域以及从高密度城市中心向外辐射的过渡地带尤为明显。这些结果表明,通过纳入动态的人类移动性因子,HME-CA 模型能够有效识别区域发展潜力、优化元胞演化规则,从而最终提升城市模拟的整体性能。
进一步通过对比分析 RF-CA-A 和 RF-CA-N 模型,探究了人类流动信息变量和基于移动性的邻域结构各自的独立贡献。如表 3 所示,RF-CA-N 模型在经济和人口模拟中均更为准确。具体而言,RF-CA-N 模型在 GDP 和人口模拟中的 MAPE 分别为 25.80% 和 17.05%。这些数值比 RF-CA-A 模型降低了近 1%。这种提升可能与基于人类移动性的邻域结构有关。总体而言,RF-CA-N 模型纳入了流入与流出网格单元之间的相互作用关系,从而更精确、更全面地利用了人类移动性数据。通过融入更丰富的基于人类移动性的邻域结构信息,RF-CA-N 模型能有效提升经济和人口模拟的模型性能。
图7 基于 RF-CA-A 与 RF-CA-N 的城市经济与人口模拟
RF-CA-A 模型在珠三角地区的 GDP 模拟中呈现出整体高估的趋势,且与经济欠发达地区相比,这种高估在经济发达区域表现得更为明显(图 7b)。相比之下,RF-CA-N 模型在珠三角地区的 GDP 模拟中普遍存在低估现象,仅在城市边界附近区域表现出轻微的高估(图 7c)。值得注意的是,RF-CA-N 模型在经济欠发达地区能够产生更为准确的模拟结果。
在人口模拟方面,两个模型在珠三角地区均呈现出整体低估的趋势。然而,RF-CA-N 模型在人口规模较小的城市中展现出了更优越的准确性。这种性能的提升很可能源于基于人类移动性的邻域结构,因为它能够有效捕捉人类的移动模式,尤其是在人口稀疏的地区。