(1中国科学院地理科学与资源研究所,北京 100101; 2北京超图地理信息技术有限公司,北京100101)
论文来源:地球信息科学
摘要:数据是土地信息系统运转的基础,实施数据检查以产生符合系统需要的数据,是土地信息系统建设的关键环节。目前的土地信息系统工程中,数据检查过程不规范,且无法重用。本文探讨了一种通用的土地数据检查方法,在分析通常的土地数据错误类型的基础上,提出建立元数据库和质量规…
关键词: 数据检查;土地数据;元数据;质量规则;土地信息系统
1引言
数据是土地信息系统运转的基础,保证土地数据的规范性和正确性,是土地信息系统建设成功的必然要求。目前各级国土资源管理局建立了多套不同比例尺和地区的土地信息数据库I町,但这些基础数据来源复杂, 采集和收集数据的部门和目的、技术水平不同;采用的软件和数据存储方式不同及对数据质量的要求和专题要素分层的编码规则不同等①。所以,在整合这些土地信息数据库,为土地信息系统建立标准化的土地信息系统数据库时,需要进行大量的数据检查工作,以保证数据库的质量。
目前, 在数据检查实施过程中存在如下问题: ①无法自定义检查数据集内或数据集间较复杂的逻辑关系,检查功能有限;②检查过程通常针对单个数据源或单个数据集,检查步骤单项执行,效率较低。③数据检查过程针对具体工程, 不具通用性,无法重用于其他工程。
为了解决传统土地数据中面临的重复而繁琐的手工检查工作, 引入了元数据和质量规则的概念, 通过建立土地信息的元数据库和质量规则库,确立了一套通用的土地数据自动批量检查的机制和流程。
元数据是关于数据的描述和说明,一般是用于给用户提供一个了解数据的接口。 然而,在本文中利用了元数据可以定义和规范数据的特点,通过建立详细的土地信息多级元数据表,为土地信息系统提供了以数据规范为标准的数据检查方法。
质量规则是关于数据在质量方面内部逻辑关系的描述,它一般体现了行业数据中隐藏的数据逻辑规则,更具有一般性。对此,研究通过建立数据质 量规则库,提供了一套可以表达土地数据内部逻辑规则的数据检查方法。
更多内容请查看pdf