基于 GIS 的统计数据可视化研究

陈生,曾行吉,梁军

(1. 中国科学院 遥感应用研究所,北京 100101;2. 广西师范学院 资源与环境科学学院,广西 南宁 530001; 3. 中国科学院 地理科学与资源研究所,北京 100101)

论文来源:计算机工程与设计第 29 卷 第 14 期

摘要:阐述了地理空间数据可视化的含义、内容以及统计数据的时空特性和传统的统计数据可视化方法,结合统计数据和 GIS 的特点,提出了基于 GIS 的统计数据可视化体系和可视化功能流程模式。最后以国家社会经济统计地理信息系统为例,研究基于 GIS 的统计数据可视化的各种方法和应用…

关键词: GIS,统计数据,时空特性,可视化,三层结构

0 引 言

统计数据是一个国家和地区最基本、最重要的信息资源,是国家进行国民经济宏观调控的决策依据,是社会公众了解国情国力、社会经济发展情况的主要信息来源。传统的统计数据分析可视化表达方式侧重于图表分析与概括性的计算分析,往往忽略或简化了统计信息的空间分布特征。随着计算机技术的发展,基于地理空间数据整合多来源、多部门的统计数据资源,利用 GIS 的空间可视化技术来表达统计数据包含的信息已经成为统计数据资源利用的新途径。

地理信息系统(geographic information system,GIS)是用于采集、模拟、处理、检索、分析和表达地理空间数据的计算机系统 [1]。在地理信息系统中,空间信息可视化从表现内容上来分,有地图 (图形)、多媒体、虚拟现实等;从空间维数上来分有二维可视化、三维可视化、多维动态可视化等[2]。目前,地理信息系统已经广泛应用于资源调查、灾害、环境监测、规划、电力、商业等领域,应用日趋广泛,已形成为一门新兴的独立产业[3]。

1 GIS 可视化技术

可视化,也称作科学计算可视化(visualization in scientifical computer,VISC),是 20 世纪 80 年代后期随着计算机技术的迅速发展而出现的一门新兴技术。1987 年美国国家科学基金会给 VISC 下的定义为:“VISC 是一种计算方法,它将符号或数据转换为直观的几何图形,便于研究人员观察其模拟和计算过程,是用来解释输入到计算机中的图像数据,并从复杂的多维数据中生成图像的一种工具”[4]。科学计算可视化一般包括模拟、预处理、映射、绘图、解释等 5 个过程,可以支持后处理、跟踪处理、驾驭处理。根据空间的特点等方面的应用与应用实际需要,空间信息可视化完整的过程应包括数据组织与调度、静态可视化、过程模拟、探索性分析等 4 个过程[5]。

GIS可视化技术是目前信息领域中广泛应用的一项技术,以地理信息科学、计算机科学、地图学、认知科学、信息传输学与地理信息系统为基础,并通过计算机技术、数字技术、多媒体技术动态、直观、形象地表现、解释、传输地理空间信息并揭示其规律。地理信息系统的多维可视化是指采用 2.5 维、三维和四维等地图表现形式来反映地理客观的多维特征[5]。在 GIS中,地理信息可视化的内容主要包括[6]:

(1)地图数据的可视化表示。其最基本的含义是地图数据的屏幕显示。我们可以根据数字地图数据分类、分级特点,选择相应的视觉变量(如形状、尺寸和颜色等),制作全要素或分要素表示的可阅读的地图,如屏幕地图、纸质地图或印刷胶片等。

(2)地理信息的可视化表示。这是利用各种数学模型,把各类统计数据、实验数据、观察数据和地理调查资料等进行分级处理,然后选择适当的视觉变量以专题地图的形式表示出来,如分级统计图、分区统计图和直方图等。这种类型的可视化正体现了科学计算可视化的初始含义。

(3)空间分析结果的可视化表示。地理信息系统的一个很重要的功能就是空间分析,包括网络分析、缓冲区分析、叠加分析等,分析的结果往往以专题地图的形式来描述。

2 传统的统计数据可视化

传统的统计信息系统其数据可视化表达比较单一,主要通过对统计数据库的指标查询,以二维表格的形式表达查询结果,其数据分析结果的表现方式也比较简单,主要有报表、统计图表和用文本描述传统常用统计分析 (如升序、降序、最大值、最小值、平均值、中值、方差、协方差标准差、四分数、主成分分析、聚类分析、多元线性分析)的结果等。其中,报表是将统计分析的指标或分析结果以二维表的形式表现出来,由行、列单元表格组成,内容包括统计指标数据或分析结果数据,包括文字和图片,如 Excel 格式的报表。统计图表一般用来表示有关数量之间的关系,以点、线、面等形式来表达统计数据的特点、变化趋势等,比单纯的二维数据表格报表更加形象具体,使人一目了然,印象深刻。常用的统计图有点状统计图、条形统计图、折线统计图、面积统计图、饼状统计图、雷达统计图等。

3 统计数据时空特性

在我国,国家统计数据是以行政区位为基本单元来收集的统计型数据集,统计数据的每个指标都有一个地理统计单元与之对应,不同的年份统计指标有所变化而且统计指标的值也会发生变化,即统计数据有统计指标(体系)、时间、空间等属性,可以概括为统计数据的指标维、时间维、空间维 3 个维度[7],如图 1 所示。

更多内容请查看pdf