基于ModelBuilder的数据批量处理方法应用_新生代_杂文_网络文摘

杜宁重庆交通大学重庆 400074

0 引言

第三次全国国土调查是依法、统一、科学开展,摸清我国自然资源基础家底的第三次国土调查.本次调查的基本单位为村,汇交的成果单元为县.此次调查的数据处理主要有数据的预处理、影像矢量化、数据合并、数据接边处理、属性检查5个步骤.其中,数据预处理是重要环节.传统方法是在数据的属性表中按属性选择选中数据并导出,在对大量空间数据进行处理时,效率就会大大降低且容易出错.为减少重复劳动,提高工作效率,需要创建能够自动化、批量化处理数据的工具【1】.

　　ArcGIS中的ModelBuilder(模型构建器)是一个用来创建、编辑和管理模型的应用程序【2】.在创建模型时,可按照一定的次序将所需的工具和数据连接起来构成一个工作流,通过迭代器可使工作流重复运行.模型能够实现数据处理的自动化、流程化,将复杂的流程简化为一个工具【3】.

　　1ModelBuilder简介

　　ModelBuilder为设计和实现空间数据批量处理提供了一个图形化的建模框架.模型中工作流的基本单元为"输入数据→工具或脚本→输出数据",构建单元包括变量、工具和连接符三种模型元素.

　　(1)变量

　　变量是模型中用于保存值或对磁盘数据进行引用的元素,包括数据变量和值变量两种.数据变量是对磁盘中的数据进行表述的一种模型类元素.值变量包括磁盘数据之外的所有信息【5】.

　　(2)工具

　　模型中工作流的基本组成部分是地理处理工具.模型中包括内置工具、脚本工具和模型工具三种.迭代器是实现数据批量处理的重要工具,ModelBuilder支持12种迭代器,根据实际问题选择不同的迭代器.在本次数据分块提取中,选择的迭代器是"要素选择".

　　(3)连接符

　　连接符的作用就是将数据与值连接到一起的工具,其箭头方形表明了地理处理的执行方向.模型构建器中包含数据、环境、前提条件和反馈四种连接符.

2 数据来源

本次调查的基础数据是国家下发的重庆市某区县空间地理数据,坐标系采用的是CGCS2000大地坐标系.根据重庆地区的特殊情况,数据等级由高到低依次为县、镇、村和社.

3 数据提取处理

3.1 数据提取的要求

数据提取就是将整体数据按照要求分成小块数据.在"三调"中,原始数据是以县为单位的,在矢量化之前,为了工作人员处理方便,需要将原始数据分割成以村为单位的shape文件.

3.2 数据提取的方法

在ArcGIS中数据的提取主要有两种方式:一是根据字段名提取,即将属性表中的字段作为关键字,如:权属单位代码,权属单位名称等,然后将需要的要素通过属性选择导出到文件夹中得到各个村的shape文件;二是根据几何要素裁剪提取,利用已有村界范围的几何要素对整体要素进行裁剪,然后将裁剪结果保存到文件夹中.

　　由于重庆地区的特殊性,数据的最小单元为社,因此在数据提取前需要对数据进行融合,融合的字段为"社",将融合后的数据依据字段名"村"提取出每个村的shp数据.