0 引言
第三次全国国土调查是依法、统一、科学开展,摸清我国自然资源基础家底的第三次国土调查.本次调查的基本单位为村,汇交的成果单元为县.此次调查的数据处理主要有数据的预处理、影像矢量化、数据合并、数据接边处理、属性检查5个步骤.其中,数据预处理是重要环节.传统方法是在数据的属性表中按属性选择选中数据并导出,在对大量空间数据进行处理时,效率就会大大降低且容易出错.为减少重复劳动,提高工作效率,需要创建能够自动化、批量化处理数据的工具【1】.ArcGIS中的ModelBuilder(模型构建器)是一个用来创建、编辑和管理模型的应用程序【2】.在创建模型时,可按照一定的次序将所需的工具和数据连接起来构成一个工作流,通过迭代器可使工作流重复运行.模型能够实现数据处理的自动化、流程化,将复杂的流程简化为一个工具【3】.
1ModelBuilder简介
ModelBuilder为设计和实现空间数据批量处理提供了一个图形化的建模框架.模型中工作流的基本单元为"输入数据→工具或脚本→输出数据",构建单元包括变量、工具和连接符三种模型元素.
(1)变量
变量是模型中用于保存值或对磁盘数据进行引用的元素,包括数据变量和值变量两种.数据变量是对磁盘中的数据进行表述的一种模型类元素.值变量包括磁盘数据之外的所有信息【5】.
(2)工具
模型中工作流的基本组成部分是地理处理工具.模型中包括内置工具、脚本工具和模型工具三种.迭代器是实现数据批量处理的重要工具,ModelBuilder支持12种迭代器,根据实际问题选择不同的迭代器.在本次数据分块提取中,选择的迭代器是"要素选择".
(3)连接符
连接符的作用就是将数据与值连接到一起的工具,其箭头方形表明了地理处理的执行方向.模型构建器中包含数据、环境、前提条件和反馈四种连接符.
2 数据来源
本次调查的基础数据是国家下发的重庆市某区县空间地理数据,坐标系采用的是CGCS2000大地坐标系.根据重庆地区的特殊情况,数据等级由高到低依次为县、镇、村和社.3 数据提取处理
3.1 数据提取的要求
数据提取就是将整体数据按照要求分成小块数据.在"三调"中,原始数据是以县为单位的,在矢量化之前,为了工作人员处理方便,需要将原始数据分割成以村为单位的shape文件.3.2 数据提取的方法
在ArcGIS中数据的提取主要有两种方式:一是根据字段名提取,即将属性表中的字段作为关键字,如:权属单位代码,权属单位名称等,然后将需要的要素通过属性选择导出到文件夹中得到各个村的shape文件;二是根据几何要素裁剪提取,利用已有村界范围的几何要素对整体要素进行裁剪,然后将裁剪结果保存到文件夹中.由于重庆地区的特殊性,数据的最小单元为社,因此在数据提取前需要对数据进行融合,融合的字段为"社",将融合后的数据依据字段名"村"提取出每个村的shp数据.
3.3 数据提取模型
此次数据提取处理一是要得到各村的shp数据;二是要得到各村缓冲100米的shp数据.模型如图所示:
数据提取缓冲模型
4 实验结果
经过实验,利用模型提取数据用时大约为14分钟,用传统方法提取数据用时大约300分钟.结果表明,使用模型处理数据缩短了时间,提高了效率,且人工干预少,数据的质量高.5结束语
本文以第三次全国国土调查项目中区县的数据为例,探讨了ModelBuilder在数据分块提取中的应用,实现了数据的批量提取.模型将复杂的数据处理流程一体化,大大简化了操作步骤;模型中的工具、参数均可修改,能更好地满足实际要求.
