城市街道网中POI点分布知识提取与可视化

2014-10-16 08:43:22    来源:中国地理信息产业协会

摘要:本研究通过三维密度“墙”的可视化形式,讨论了实际多种POI点分布模式(随机型、稀疏型、区域密集型、线状密集型)的影响因素、服务功能。

    城市POI点的分布模式、分布密度等空间知识在基础设施规划、城市空间分析中具有重要意义, 表达该特征的核密度法而往往基于二维延展的欧氏空间,忽略了城市空间通达、连接是沿着街道路径的事实。本研究针对该缺陷,给出了基于路径距离而非欧式距离的网络空间核密度计算模型与算法,讨论了衰减阈值及高度极值对核密度特征表达的影响。通过三维密度“墙”的可视化形式,讨论了实际多种POI点分布模式(随机型、稀疏型、区域密集型、线状密集型)的影响因素、服务功能。


1.引言

    城市基础设施数据库中,社会经济现象的空间表达往往降维为简单的点模式,该类POI数据涵盖了城市各类设施的位置信息与关联的属性信息,利用城市空间分析方法研究这些数据点的地理分布特征,可以为城市规划、决策以及向社会提供社会经济、文化等统计数据分析服务方面发挥重要作用[1-4]。

    核密度法(Kernel Density Estimation)是设施POI空间分布知识提取的重要统计方法[3-4]。比较常规密度方法,即样方密度法及基于V图的密度方法,以地理学第一定律为理论依据的核密度法对空间细部特征更敏感,揭示的空间分布现象更平滑,适合于连续性地理现象的模拟与表达。

    传统的核密度分析大多是基于欧氏距离,认为平面空间是均质的、各向同性的空间。然而现实情况是多数城市设施以及人为导致的现象是限制于二维欧氏空间内的网络部分,如ATM,停车场以及交通事故等。如果采用传统的平面空间核密度分析方法对像商场、ATM之类的设施进行空间分布特征分析,忽略了城市网络空间中设施点的服务功能及相互联系发生于网络路径距离而非欧氏距离的事实[5-7]。为此,网络空间中点的分布特征分析需要有更多考虑。

    针对城市POI设施分布特征的分析方法,本文提出一种基于“路径距离衰减效应”的网络核密度法。该方法顾及了城市设施服务影响的地理意义,适合于通行、交通、导航以及寻径等应用。通过实际POI点网络分布密度的三维可视化,核密度法可以为不同性质POI基础设施在城市空间分布上的空间特征、分布模式、影响因素、服务功能提供重要的决策分析工具。


2.核密度分析的网络扩展

2.1 空间点的密度计算

    核密度分析是基于空间平滑及空间内插技术的统计分析过程,在没有任何先验密度假设的情况下,只要给定一个合适的带宽,核密度方法就能得出一个质量高的概率密度估计值。另外,核密度方法在保持整体结构的同时能平滑数据,验证聚集或规律的空间分布特征。

    核密度方程定义为:


城市街道网中POI点分布知识提取与可视化
                          

    式中,f(s)为空间位置s处的核密度计算函数,h为距离衰减阈值,n为与位置s的距离小于或等于h的要素点数,k函数则表示空间权重函数。核密度函数中存在两个关键参量,即空间权重函数k与距离衰减阈值h。这一方程的几何意义为密度分布在每个点中心处ci最高,向外不断降低,当距离中心达到衰减阈值范围h处时密度为0。衰减阈值范围内的局部空间属于地理现象空间影响域,在欧氏空间,“影响域”就是二维平面,在网络空间“影响域”是扩散的路径集。

    图1为核密度方法与其他两种常用密度估计方法的比较示意图,由图可见,核密度以一种光滑曲面的形式渐进式传输中心强度,顾及和体现了空间位置的差异性以及中心强度随距离衰减的特性,符合地理学第一定律。因此在实际应用中,核密度法多用于对诸如城市设施服务影响、交通路段风险评估等连续性地理现象的密度估计[2]。


城市街道网中POI点分布知识提取与可视化


2.2 网络空间下核密度估计方法

    传统核密度方法将空间分析区域视作均质空间,然而在城市空间的度量中,距离与旅行代价不呈线性关系而且各向异性,表现出明显的非欧几何特点。尤其是对于大量依附于泛在的城市道路网络空间分布的城市基础设施,比如学校、医院、银行、超市等,这些基础设施的入口均与道路相邻,它们的服务功能以及相互联系均依赖于网络路径的传导方式。因此,引入路径距离可以使核密度分析更准确地表达设施功能分布的细部特征,我们称这种网络约束下的核密度方法为网络核密度法(Network Kernel Density Estimation)。

    平面核密度估计产生的是二维的结果,网络核密度产生的是一维的量测,如图1所示,在选取同样的距离衰减阈值的情况下,我们发现平面核密度法有可能会高估空间现象的聚集程度,如图2中三角形符号表示的设施在平面空间下对三个正方形所处位置产生密度计算,而基于网络路径距离时,所有正方形位置均没有密度影响。


城市街道网中POI点分布知识提取与可视化


    与样方密度法对划分单元内密度的均一化估值不同,核密度的计算方法是基于地理学第一定律,即距离越近的事物关联越紧密,与核心要素越近的位置获取的密度扩张值越大。在密度分布模式上,我们称这种空间特征为“距离衰减效应”[5-7]。为了体现要素服务强度在空间分布上存在的衰减效应,一些研究给出如高斯方程、四次方程、负指数方程、最小方差方程等空间权重计算函数。虽然不同的权重函数对远近位置的空间加权计算有所差别,但是都基于同一过程,即权重值从中心向周围位置按距离衰减。大量相关的研究和实践也表明权重方程的选择对点模式分布结果的影响不大,变量中可以产生影响的主要是距离衰减阈值的确定(即式1中参数h)[8-11]。所以,本研究采用式(2)所示的四次权重方程,另外根据应用尺度及实验需求来具体讨论衰减阈值的大小。


城市街道网中POI点分布知识提取与可视化

  

    网络核密度空间分布的光滑程度由距离衰减阈值h决定。h值越大,密度分布就越光滑。h阈值的确定取决于以下三个因素:(1)核密度的应用尺度,较大的距离衰减阈值适合表示全局视角下设施分布的一般聚类特征,若采用较小的衰减阈值,密度分布的局部差异更突出,适合表示设施分布的局部特征;(2)设施点之间的距离,衰减阈值的大小应与设施数据的离散程度呈正相关关系,若采用较小的衰减阈值来分析呈稀疏型分布的设施数据,核密度图可以提供的信息量与原始散点图将没有差别;(3)设施POI的性质,不同性质设施在空间所表现的特征尺度不一样,如大型商场的服务范围比小型便利店的服务范围更大,可以使用较大的影响范围,获取客观的服务空间分布特征。


3.算法实现与可视化表达

    考虑到密度空间分布的连续性以及受平面核密度的三维曲面可视化方法的启示,本研究提出了一种网络核密度计算方法,方便密度的三维可视化:

    1)首先将所有道路交叉点和不同等级道路的分界点等特征点定义为网络结点,利用网络结点自动分割道路,生成网络弧段,然后将弧段等分为一定长度的基础线性单元集,这里称基础线性单元为网络栅格,建立网络结点-弧段拓扑关系以及网络栅格-栅格拓扑关系、网络结点-栅格拓扑关系,构建完整的栅格数据结构;

    2)将网络上离设施点欧氏距离最近的栅格单元定义为发生元,初始化发生元,定义网络核密度计算的距离阈值h;

    3)搜索与发生元中心点的最短路径距离小于h的邻域栅格,并计算发生元与所有邻域栅格中心点的最短路径距离,基于选择的核密度方程,计算发生元在各邻域栅格处的密度辐射值;

    4)重复执行步骤3),直至所有发生元的邻域栅格的密度值计算完毕;

    5)计算栅格的所有邻域发生元在该位置的密度值之和,并将其作为该栅格的核密度值,若栅格邻域范围内不存在任何发生元,则该栅格的核密度值默认为0。

    道路网络空间下的点设施密度数据需要采用不同可视化策略以反映网络空间的线性特征。通常与线性要素相关的可视化参量包括三种,即线的颜色、线的宽度和高度。可视化表达可以通过其中一种参量、两种参量或者三种参量的结合来共同实现。考虑到以上算法已将街道网打散为基础空间单元(网络栅格),若以计算的密度属性值为z值,原始道路网络便可竖立为三维墙。如图3所示,读者可以观察墙的空间延展特征来直观地获取设施的聚类分布情况。高墙竖立的局部空间往往是设施聚集的中心区域,而谷地出现较多的区域一般为某设施服务影响较小的区域。通过不同类型设施的密度图,我们可以分析城市发展的全局规划及局部区域中设施分布的地理特点。


城市街道网中POI点分布知识提取与可视化


4.实验与讨论

    基于以上方法,本研究对深圳市街道网中具有四类不同分布特征(随机型、稀疏型、区域密集型以及线状密集型)的设施点进行密度计算。参与分析的道路网络由37977条道路链段组成,不同分布特征的设施类分别为垃圾污水处理站、图书馆、银行以及加油站,它们的数量为476、215、1575、300。图4、5为各类设施的散点图以及网络栅格剖分尺度为40m时的核密度三维立体图。

    本研究是从一个宏观的视角分析点设施在道路网下的分布特征,所以核密度实验均采用了较大的衰减阈值,如图5a、b、c、d中阈值分别为3000m、4000m、3000m、3000m。图4a、c、d中设施的密集程度要高于图4b中的图书馆类设施,而且图书馆的服务范围较广,以较大的空间影响区域分析设施的分布特征更符合客观情况,所以在图5b中密度衰减阈值要大于其余三类设施点。

    从实验中可以看出,基于网络核密度的方法可以描述不同性质设施点在城市空间分布上的空间特征、分布模式、影响因素、服务功能等。如图5a所示的呈随机分布的垃圾污水处理站的密度图,城市网络空间中主要几个区域(即西北、西南、南、北以及东北方)的密度墙高度近似相同,不存在突兀的高墙或低谷等非随机分布特征。这类密度分布结果说明垃圾污水处理站在网络上各位置出现的概率相当,属于随机型分布模式。从城市规划的角度,这类现象可以解释为:垃圾污水站与人们生活密切相关,随机型分布可以照顾到居住在不同区域的城市人口,有利于垃圾的及时清理和回收,保证城市环境的整洁。对于图5b中的稀疏型分布密度图,主要区域内墙的高度均比较低,不存在高墙类型的局部特征。产生这类现象的原因可能是图书馆属于城市基础服务设施,集中分布会导致资源浪费,它的建设选址应能满足城市各社区居民的文化需求,顾及整个城市空间。图5c所示的密度分布模式则属于区域密集型,其中西南、南部区域存在突出的高墙密度特征。通常,银行网点分布集中的区域可视为城市发展的金融热点,从密度图中我们可以看到深圳市的经济活动具有块状集聚、轴状延伸的格局,与深圳市总体规划内容吻合。加油站在图5d中的密度分布属于线状密集型,其密度高墙主要是沿深圳市区的主干道排列。加油站为经营类设施,它的建设选址以局部交通量为依据,由于深圳市内机荷高速等主干路是交通量最大的几个路段,所以加油站呈线状密集的分布模式符合市场竞争规律。


城市街道网中POI点分布知识提取与可视化


5.结论

    本文研究了基于最短路径距离的核密度计算方法,并以深圳市四类不同分布特点的设施为例,实现了基于网络核密度的设施分布密度三维可视化。通过对实验结果的分析,得到下面的结论。

    (1)核密度法以地理学第一定律为理论依据探讨点集的空间分布规律,适合于分析设施服务空间分布的连续性特征。

    (2)网络核密度法中距离衰减阈值取决于数据的离散程度、POI设施性质、以及设施分布分析的应用尺度。

    (3)网络核密度法是城市空间应用中的一个重要的统计分析方法,它可以对城市POI设施分布特征进行分析,并用三维立体可视化形式展示分布热点、分布密度、分布趋势等特征,为城市规划及城市管理提供决策支持。

    然而在城市空间中,设施服务的密度分布不仅受地理实体的位置影响,还需要考虑设施吸引力、价格优势、街道通行能力以及通行方向等非空间属性限制,后续研究将进一步完善模型、算法的适应性。

 

参考文献:

[1] LI Deren, 1999, NII, NSDI and Digital Earth[J]. Acta Geodaetica et Cartographica Sinica.1999,28(1):32-37.(李德仁. 信息高速公路、空间数据基础设施与数字地球[J].测绘学报,1999,28(1): 1-5.)

[2] Xu Xueqiang, Zhou Yixing, Ning Yuemin. Urban Geography[M]. Beijing: Higher Education Press, 1997.(许学强,周一星,宁越敏.城市地理学[M].北京:高等教育出版社,1997.)

[3] Bailey, T., & Gatrell, A. (1995). Interactive spatial data analysis. Harlow: Longman.

[4] Schabenberger, O., & Gotway, C. A. (2005). Statistical methods for spatial data analysis. Boca Raton, Florida: Chapman & Hall/CRC.

[5] MILLER,H.J.,1994,Market area delimitation within networks using geographic information systems.Geographical Systems,1, pp.157–173.

[6] OKABE A,SATOH T,FURUTA T. A kernel density estimation method for networks, its computational method and a GIS‐based tool[J].International Journal of Geographical Information Science,2009,23(1): 7-32.

[7] Borruso G. Network density estimation: a GIS approach for analysing point patterns in a network space[J]. Transactions in GIS, 2008, 12(3): 377-402.

[8] Sheather S J, Jones M C. A reliable data-based bandwidth selection method for kernel density estimation[J]. Journal of the Royal Statistical Society. Series B (Methodological), 1991: 683-690.

[9] Elgammal A, Duraiswami R, Harwood D, et al. Background and foreground modeling using nonparametric kernel density estimation for visual surveillance[J]. Proceedings of the IEEE, 2002, 90(7): 1151-1163.

[10] Eck J, Chainey S, Cameron J, et al. Mapping crime: Understanding hotspots[J]. 2005.

[11] O'Sullivan D, Unwin D J. Geographic information analysis[M]. John Wiley & Sons, 2003.


作者:艾廷华 禹文豪 武汉大学 资源与环境科学学院


声明:中国勘测联合网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考。