基于元数据的社会经济 GIS 设计与实现

吴建玲,安凯,梁军

中国科学院地理信息产业发展中心 北京 100101

论文来源:《中国地理信息系统协会第八届年会论文集》 2004-11-01

摘要:概述了社会经济 GIS 的现状,分析我国社会经济 GIS 建设中的不足,提出基于元数据驱动技术解决社会经济统计数据管理中信息资源难以综合开发利用、数据更新困难等问题,并以青山区社会经济地理信息系统为例,阐述了元数据驱动技术在社会经济 GIS 系统建设中的应用。

关键词: 元数据,社会经济,GIS

1. 引言

  社会经济信息是指记录国家和社会状况的数据,是一个国家和地区最重要、最基础的信息资源,是认识国情(区情)、制定国策(地区政策)的重要依据。统计部门作为社会经济数据的主要收集部门,其本质是一个利用社会经济数据为社会提供信息服务的部门,因此实现统计行业的信息化、确保社会经济统计数据和统计信息服务的“快、精、准”,为政府和社会提供更好、内容更为丰富的信息服务,是统计行业自身发展的内在要求,也是社会经济信息化发展尤其是政府宏观决策的必然需要。

  然而传统的统计数据采集、处理、管理、分析、开发利用所涉及的技术、方法和相关体制形成的 “条块分割”的局面已经成为统计行业信息化建设和发展的瓶颈,尤其表现在统计信息资源的整合与综合开发利用方面。

  目前,我国社会经济统计信息系统存在的主要问题表现在如下几个方面:(1)社会经济信息资源按照专业呈现各自为政、难以综合开发利用的局面。我国的社会经济信息资源分别归属于公安部、计生委、统计局、工商局等不同的行政部门,由于缺乏有效的信息集成手段,同时受到政治等因素的影响,各个部门的社会经济数据一直没有得到有效整合,进而引起信息的综合分析困难等资源开发问题。(2)各个社会经济信息资源管理系统的建设缺乏统一标准,数据结构差异较大,系统功能组织比较混乱。(3)现有的系统难以适应社会经济统计数据指标变动频繁、数据经常更新的特点,造成了用重做系统来解决数据更新的不合理更新方式,大大增加了统计部门在软件开发方面的经费开支。

  本文论述了社会经济统计数据的特点,提出通过 GIS 来整合社会经济数据是由社会经济数据本身的特点决定,并以社会经济 GIS 的查询和汇总两个模块详细说明元数据驱动技术在系统建设中的组织与实现,最后以青山区经济与社会统计地理信息系统为例,展示了系统的功能组织与运行界面。

2. 元数据

  驱动技术在社会经济 GIS 的应用

2.1. 元数据在社会经济 GIS 系统的必要性论证

  社会经济统计数据实质上是社会经济组成要素(如人口、基本单位等)在现实世界的时间与空间框架中运动与变化过程的反映,社会经济统计数据普遍具有空间属性,以时间和空间的框架实现统计信息资源的整合和集成,是突破目前统计信息化瓶颈最有效的技术手段,而利用元数据驱动技术更新社会经济底层数据库又是解决统计信息化课题的有力保证。社会经济统计数据主要具有如下特点:

  (1)社会经济数据是由时间、空间、分类、指标唯一确定的一个四元组。社会经济数据的多维特性,迫使数据存储的过程不能按照一般的关系型数据库数据入库的过程来进行,解决办法之一是利用数据冗余进行数据降维,另一个方法就是采用元数据来描述数据之间的层次关系。无论从数据维护工作量方面考虑,还是从数据开发利用的方便程度来说,元数据在社会经济数据存储中的使用带来的经济效益都具有其他方法无法比拟的优势。

  (2)社会经济统计数据指标繁多、更新频繁。社会经济数据是一类非常追求现势性的信息资源,数据更新工作繁重,而数据的复杂程度又加重了数据更新的操作难度,因此在统计部门中,“死库” (数据入库后没有得到及时更新而导致数据过时,最终变得无用)现象时有发生,将元数据融入数据更新过程将对改善这种现状发挥重要作用。

2.2. 社会经济 GIS 元数据库设计

  社会经济 GIS 元数据由社会经济元数据和空间元数据两个部分构成。空间元数据描述了空间数据库的结构和空间数据之间的关系,由地址码表、空间对象分类表等组成;社会经济元数据分成四个层次,自上而下分别是报表元数据、指标元数据、域元数据和域字典元数据。用户从地图或行政单元树获取感兴趣的行政单元,地址码以参数的形式传递给系统,系统通过元数据解析与物理数据相连,从而达到访问数据本身的目的。

  在基于元数据的社会经济 GIS 中,只有在增加新数据表、修改数据表结构的情况下才需要维护元数据库,因此元数据库的维护工作量相对较小。而增加新数据表、修改数据表结构对于一个信息系统的灵活性挑战是最大的,当一个新的数据表出现在数据库中,如何在信息系统中不用修改代码实现对其操作,是许多系统建设过程中的难点所在。

3. 应用案例-青山区经济与社会统计地理信息系统

3.1. 系统建设背景

  青山区是内蒙古包头市下属的一个县级行政单元。近年来,青山区凭借其雄厚的工业基础、良好的投资环境、便利的交通等软硬件条件走在了包头市经济发展的前列。如何进一步持续、快速、稳定、健康地发展是青山区政府首要关心的问题,建设社会经济信息管理和分析系统、有效及时掌握地区社会经济动向是区域发展规划的关键,为此,2004 年 6 月初,青山区统计局与北京超图地理信息技术有限公司合作开发了青山区经济与社会统计地理信息系统。

  青山区经济与社会统计地理信息系统采用全组件式 GIS 软件 SuperMap Object 2003 为 GIS 平台、SQL Server 2000 数据库为数据管理系统,是以空间单元为核心的、集成了行政空间单元、人口、基本单位、商贸个体、市场等数据的信息挖掘和提取工具。通过数据汇总、分析等方法,图表和专题图等多种方式展现与青山区经济发展相关的各项统计经济与社会指标,为区政府了解和掌握本区经济和社会发展的方方面面提供了有效的参考,为政策的制定与验证提供了依据。

3.2. 系统主要功能

  (1)地图浏览包括 地图显示、放大、缩小、漫游、全幅显示、刷新、导航图、量算距离、量算面积等功能。

  (2)统计空间单元选择提供点选、框选、圆选、多边形选、按照行政区划树选择等统计空间单元选择方式。

  (3)图上点击查询系统提供了灵活的点击查询功能,以三个层次组织。点击街道、居委会,则弹出“区域简介”和 “区域经济”快捷菜单,分别可以快速浏览和查询一个区域的简要介绍和经济汇总情况。点击建筑物,则根据建筑物的不同属性列出查询和汇总结果,如点击居民楼得到建筑物的基本属性和人口汇总信息,点击商用楼可以看到该楼内的基本单位和个体基本信息等。

  (4)统计数据通用个体 SQL 查询和统计数据 SQL 汇总社会经济统计 GIS 系统采用元数据驱动技术,灵活构架查询和汇总模块,程序操纵元数据、元数据描述基础数据的三层查询组织模式,允许灵活定制要查询的数据表而不受程序代码的限制。

  (5)统计图表与专题图功能对街道、居委会的各种汇总属性提供点密度图、单值专题图、分段专题图和统计专题图等表现功能。用户可以将自己感兴趣的区域属性做成专题图,在数据或者质量上对比区域之间的差异,了解区域发展状况与布局。

  (6)输出功能提供个体查询和汇总查询结果可以保存成 Excel 和文本格式的功能,同时地图窗口、专题图窗口可以输出为图片或者直接打印。

3.3. 系统特色与创新

  (1)采用元数据对系统与数据表进行隔离,易于数据更新。

  (2)空间数据、社会统计数据、经济数据集成。系统集成了青山区的空间数据、人口数据、基本单位、商业个体数据和市场等不同性质和来源的数据,实现了空间数据与统计数据基于关系型数据库的一体化集成。

  (3)利用 GIS 表现建筑物级别的人口、基本单位、商业个体、重点企业等微观经济数据。

  (4)个性化的建筑物查询方式,能根据建筑物性质的提供不同的查询结果。

4. 结论

  我国社会经济统计 GIS 市场正在处于起步阶段,各个系统开发单位自成体系,没有统一的数据交换标准,在功能组织上没有在业界内达成共识,造成系统之间水平参差不齐、数据组织方式各异等问题,这些问题给后续系统集成、数据共享等带来了极大困难。本文采用元数据描述社会经济数据表结构、表与表之间的关系、空间数据与社会经济统计数据的基本属性等信息,并将之应用到了系统实现中,以通用查询和汇总模块为例,展示了启用元数据库后,系统与数据组织方式相隔离,实现数据修改与更新的程序无关性。从青山经济与社会地理信息系统建设所取得的成果看,这种元数据库的结构和组织方式构成了实现各类社会经济数据共享的技术原型,是在目前没有数据交换、共享和维护标准的情况下实施数据交换、共享和维护的一种较好方式。

参考文献

[1] 郭志红,元数据的多角度透视,《图书馆》杂志,2002 年第五期, http://www.library.hn.cn/tsg/20021122/Content/00009180.htm.

[2] 郑有材,蔡希尧.元数据驱动的可重用通信软件的设计.西安电子科技大学学报,1998,25(6):779

[3] 李清山,陈平,褚华.支持柔性机制的元数据驱动模型的研究与应用.西安电子科技大学学报,2002, 29(3):320

[4] 王新州,柳宗伟,陈顺清,城市人口地理信息系统建设模式探讨,武汉大学学报,信息科学版, 2001.26(3):226-230

[5] 喻贵银,地图的“革命”,中国测绘:6-8

[6] 王树德,地图在数字地球建设和应用中的几个问题,青岛职业技术学院学报,2003,16(2):38-41

[7] 赵伟华,黄晓,章复嘉,基于 GIS 的人口管理信息系统的设计与实现,计算机工程与设计,2004,15 (1):139-141

[8] 张瑞菊,陶华, GIS 与空间数据挖掘技术集成问题的研究,勘察科学技术,2003(2).21-23.

[9] 周子斌,客户/服务器(client/server) 结构统计数据库的设计与实现,中国统计,1997.10,189.35-37.

[10] TIGER/Line Files Technical Documentation 108th CD 2000, U.S. Department of Commerce, Geography Division U.S. Census Bureau

[11] Jane Traynham, Community Statistical Systems, Maryland State Data Center