李德仁:展望大数据时代的地球空间信息学

2017-04-26 10:52:56    来源:测绘学报

摘要:地球空间信息学将在构建智慧地球和智慧城市的大数据时代面临更多的发展机遇和艰巨的任务,必将为人类社会的进步和可持续发展作出更大的贡献。

  摘要:20世纪90年代,随着全球信息化和互联网的推进,地球空间信息学应运而生,推动了数字地球和数字城市的建设。21世纪以来,随着全球信息化与工业化的高度集成发展,出现了物联网和云计算,人类进入了大数据时代。本文论述大数据时代地球空间信息学的特点(无所不在、多维动态、互联网+网络化、全自动与实时化、从感知到认知、众包与自发地理信息、面向服务)和必须解决的主要关键技术问题(全球空天地一体化的非线性地球参考框架构建技术、星基导航增强技术、天地一体化网络通信技术、多源成像数据在轨处理技术、天基信息智能终端服务技术、天基资源调度与网络安全、基于载荷的多功能卫星平台设计与研制)。本文最后给出大数据时代地球空间信息学的新定义,即地球空间信息学是用各种手段和集成各种方法对地球及地球上的实体目标(physical objects)和人类活动(human activities)进行时空数据采集、信息提取、网络管理、知识发现、空间感知认知和智能位置服务的一门多学科交叉的科学和技术。从这个新定义出发,地球空间信息学将在构建智慧地球和智慧城市的大数据时代面临更多的发展机遇和艰巨的任务,必将为人类社会的进步和可持续发展作出更大的贡献。

  关键词: 大数据 地球空间信息学 云计算 物联网 空间感知与认知 智慧地球


   1 人类进入大数据时代

  1993年9月,美国启动“信息高速公路”计划,即国家信息基础设施(NII),引发了席卷全球的信息化革命[1]。1994年,美国启动了国家空间数据基础设施(NSDI)的建设,得到了包括我国在内的各国的积极响应。1995年,中国启动了推动全国信息化的“八金”工程,标志着我国信息化建设开始起步。利用基于全球地心坐标系的卫星导航定位技术、卫星遥感技术、网络地理信息技术和计算机虚拟现实技术,大量的表述地球自然形态和人类活动的几何与社会属性数据和信息被送入电脑,并在互联网上流通,形成虚拟的网络空间(cyber space)。

  1998年,美国副总统戈尔提出“数字地球”概念,标志着全球开始步入数字地球和数字城市建设新阶段[1, 2]。目前,我国已建成数字中国基础框架,已有600多个城市初步建成数字城市基础框架,国家测绘地理信息局发布在互联网上的“天地图”[3]成了数字中国和数字城市的载体,已有数亿网民使用。

  2006年,物联网、云计算等新一代信息技术正式推出,实现了工业化与信息化的综合集成。通过无所不在的传感网将网络世界与现实世界关联起来,形成虚实一体化的空间(cyber physical space)。在这个空间内,将自动和实时地感知现实世界中人和物的各种状态和变化,由云计算中心处理其中海量和复杂的计算、控制并产生智能反馈,为人类生存繁衍、经济发展、社会交往和文化享受等诸多方面提供各种智能化的服务。到2009年,全世界大多数国家正式提出建设智慧地球和智慧城市。

  Nature和Science分别于2008年、2011年出版了《Big Data》、《Dealing with data》专辑,指出大数据时代已到来[4, 5];2012年3月,美国奥巴马政府宣布正式发布“大数据研究和发展倡议”,并正式启动该计划,该计划的意义堪比20世纪的信息高速公路计划。从科学界到政界,都逐渐意识到大数据将是挖掘信息和知识的一个宝藏。而随着智慧地球和智慧城市的建设和应用,无所不在的亿万个各类传感器将产生越来越多的数据,数据量级将从现在的GB(giga byte)级和TB(tera byte)级逐步增长到PB(peta byte)级、EB(exa byte)级甚至ZB(zetta byte)级。若能透彻分析这些结构复杂、数量庞大的数据[6, 7],以云端运算整合分析,便能快速地将之转化成有价值的信息,从中探索和挖掘自然和社会的变化规律,人们的生活及行为,社会的潮流、思维和舆论趋向[8],推断市场对产品、服务甚至政策等各方面的反应。利用大规模有效数据分析预测建模、可视化和发现新规律的时代就要到来[9, 10]。大数据具有以下5大特征。

  (1) Volume(体量大): 大量TB、PB、EB、ZB级以上的数据等待处理。

  (2) Velocity(速度快):需要响应不断产生的以时、分、秒甚至毫秒计的流数据。

  (3) Variety(模态多样): 数据来源和类型繁多,文本、图片、视频等结构化和非结构化数据并存,多测度、多平台、多传感器。

  (4) Veracity(真伪难辨): 由于数据的噪音、缺失、不一致性、歧义等引起的数据不确定性。

  (5) Value(价值巨大): 大数据使得人们以前所未有的维度量化和理解世界,蕴含了巨大的价值,大数据的终极目标在于从数据中挖掘价值。

  面对大数据的到来,目前的问题是,由于体量大、速度快、模态多样和真伪难辨,很难有效地从大数据中挖掘出它的巨大价值,就会形成“数据海量、信息缺失、知识难觅”的局面。于是,时空数据挖掘的理论和算法成为当前一个十分重要的研究命题[11,12, 13]。

  笔者认为,时空数据挖掘是从海量、多源时空大数据中自动发现和提取隐含的、非显见的模式、规则和知识的过程。显然,数据挖掘比数据处理和信息提取有更大的难度,需要基于大数据和知识库的智能推理。

  2 大数据时代地球空间信息学的时代特点

  20世纪90年代的信息革命和网络革命催生了地球空间信息学。地球空间信息学是测绘遥感科学与信息科学技术的交叉、渗透与融合,它作为地球信息科学的一个重要分支学科,可为地球科学问题的研究提供空间信息框架、数学基础和信息处理的技术方法;同时,它又通过多平台、多尺度、多分辨率、多时相的空、天、地对地观测、感知和认知手段改善和提高人们观察地球的能力,为人们全面精确判断与决策提供大量可靠的时空信息。地球空间信息学已在过去20年的数字地球和数字城市建设中发挥了重要作用。

  当前,我们需要关心的是,人类正进入建设智慧地球和智慧城市的大数据时代,这将对地球空间信息学提出新的要求,使之具有新的时代特点。这些特点可以概括为以下7个方面。

  (1) 无所不在(ubiquitous)。在大数据时代,地球空间信息学的数据获取将从空天地专用传感器扩展到物联网中上亿个无所不在的非专用传感器。譬如智能手机,它就是一个具有通信、导航、定位、摄影、摄像和传输功能的时空数据传感器;又如城市中具有空间位置的上千万个视频传感器,它能提供PB和EB级连续图像。这些传感器将显著提高地球空间信息学的数据获取能力。另一方面,在大数据时代,地球空间信息学的应用也是无所不在的,它已从专业用户扩大到全球大众用户。

  (2) 多维动态(multi-dimension and dynamics)。大数据时代无所不在的传感器网以日、时、分、秒甚至毫秒计产生时空数据,使得人们能以前所未有的速度获得多维动态数据来描述和研究地球上的各种实体和人类活动。智慧城市需要从室外到室内、从地上到地下的真三维高精度建模,基于时空动态数据的感知、分析、认知和变化检测在人类社会可持续发展中将发挥越来越大的作用。通过这些研究,地球空间信息学将对模式识别和人工智能做出更大的贡献。

  (3) 互联网+网络化(internet+networking)。在越来越强大的天地一体化网络通信技术和云计算技术支持下,地球空间信息学的空天地专用传感器将完全融入到智慧地球的物联网中,形成互联网+空间信息系统,将地球空间信息学从专业应用向大众化应用扩展。原先分散的、各自独立进行的数据处理、信息提取和知识发现等将在网络上由云计算为用户来完成。目前正在研究中的遥感云和室内外一体化高精度导航定位云就是其中的例子[14]。

  (4) 全自动与实时化(full automation and real time)。在网络化、大数据和云计算的支持下,地球空间信息学有可能利用模式识别和人工智能的新成果来全自动和实时地满足军民应急响应用户和诸如飞机与汽车自动驾驶等实时用户的要求。目前正在进行中的“空间信息网络”国家自然科学基金重大专项,就是要研究面向应急任务的空天信息资源自动组网、通信传输、在轨处理和实时服务的理论和关键技术。遵照“一星多用、多星组网、多网融合”的原则,可由若干颗(60~80颗)同时具有遥感、导航与通信功能的低轨卫星组成的天基网与现有地面互联网、移动网整体集成,与北斗系统密切协同,实现对全球表面分米级空间分辨率、小时级时间分辨率的影像与视频数据采集和优于米级精度的实时导航定位服务,在时空大数据、云计算和天基信息服务智能终端支持下,通过天地通信网络全球无缝的互联互通,实时地为国民经济各部门、各行业和广大手机用户提供快速、精确、智能化的PNTRC(定位、导航、授时、遥感、通信)服务,构建产业化运营的、军民深度融合的我国天基信息实时服务系统[15, 16]。

  (5) 从感知到认知(from sensing to recognizing)。长期以来,地球空间信息学具有较强的测量、定位、目标感知能力,而往往缺乏认知能力。在大数据时代,通过对时空大数据的数据处理、分析、融合和挖掘,可以大大地提高空间认知能力。例如,利用多时相夜光遥感卫星数据可以对人类社会活动如城镇化、经济发展、战争与和平的规律进行空间认知[17, 18]。又如,利用智能手机中连续记录的位置数据、多媒体数据和电子地图数据,可以研究手机持有人的行为学和心理学。笔者相信,地球空间信息学的空间认知将对脑认知和人工智能科学作出应有的贡献。

  (6) 众包与自发地理信息(crowdsourcing and VGI)。在大数据时代,基于无所不在的 非专用时空数据传感器(如智能手机)和互联网云计算技术,通过网上众包方式,将会产生大量的自发地理信息(VGI)来丰富时空信息资源,形成人人都是地球空间信息员的新局面。但由于他们的非专业特点,使得所提供的数据具有较大的噪音、缺失、不一致性、歧义等问题,引起数据有较大的不确定性,需要自动进行数据清理、归化、融合与挖掘。当然,如能在网上提供更多的智能软件和开发工具,将会产生好的效果[19, 20]。

  (7) 面向服务(service oriented)。地球空间信息学是一门面向经济建设、国防建设和大众民生应用需求的服务科学。它需要从理解用户的自然语言入手,搜索可用来回答用户需求的数据,优选提取信息和知识的工具,形成合理的数据流与服务链,通过网络通信的聚焦服务方式,将有用的信息和知识及时送达给用户。从这个意义上看,地球空间信息服务的最高标准是在规定的时间(right time)将所需位置(right place)上的正确数据/信息/知识(right data/information/knowledge)送到需要的人手上(right person)。面向任务的地球空间信息聚焦服务,将长期以来数据导引的产品制作和分发模式转变成需求导引的聚焦服务模式,从而解决目前对地观测数据又多、又少的矛盾,实现服务代替产品,以适应大数据时代的需求(图 1、图 2)。

图 1 地球空间信息资源网络服务模型

  图 1 地球空间信息资源网络服务模型

图 2 天地一体化实时空间信息服务系统

  图 2 天地一体化实时空间信息服务系统

声明:中国勘测联合网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考。