一、专业术语:
1.数据是指对某一目标定性、定量描述的原始资料,包括数值、字符、图像、图形、声音、视频等。在计算机中数据按符号进行存储和处理。
2.信息狭义信息论的定义:两次不定性之差,即指人们获得信息前后对事物认识的差别。广义信息论的定义:指主体(人、生物、机器)与客体(环境、其他人、生物或机器)之间相互联系的一种形式,是主体和客体之间的一切有用的消息或知识,是表征事物性质、特征和状态的一种普遍形式。
3.地理信息系统:是计算机硬件、软件、地理数据和人的有机组合,用来有效地获取、存储、更新、处理、分析和显示所有与地理(空间)有关的各类信息
二、基础部分
1.地理特征和现象的数据描述包括空间位置,属性特征及时域特征三部分。
2.GIS的基本功能:1、数据采集、编辑和处理2、数据存储和数据库管理3、空间信息的处理和变换4、
空间信息的浏览和查询5、信息显示和输出6、空间分析和空间模拟7、二次开发功能
3.GIS的基本组成部分:计算机硬件系统、软件系统、网络、空间数据、应用模型管理与应用人员。
4.介绍几款常用的工具型GIS平台:介绍几款常用的工具型GIS平台:ESRI (ARCGIS、Arc view) 美国环境系统研究所公司ESRI Inc.产品。ArcGIS提供了用于地理数据的自动输入、处理、分析和显示的强大功能MapInfo Professional,
Map 。 MAPINFO Inc.桌面型GIS,由于其数据结构,空间分析功能相对较弱。但由于造价低,在国内市场占有率较高。AutoCAD Map 3D 。创建与管理空间数据的主要的工程GIS平台。通过使用强大的AutoCAD?工具使工作流程化,提高工作效率。SuperMap:科学院超图公司。GEOSTAR:武汉测绘大学GIS研究中心。MAPGIS:中国地质大学(武汉)信息工程学院
三、拓展部分
1.谈谈你对地理信息系统的理解:1地理信息系统是传统科学与现代技术相结合而产生的边缘学科,因此它明显的体现出多学科交叉的特征,这些交叉学科的基础理论同样构成地理信息系统的基础理论体系;2地理信息系统通常是指计算机化的信息系统,需要得到计算机硬件和软件系统的支持。地理信息系统中,信息的流动及信息流动的结果,完全由计算机程序的运行和数据的交换来仿真;3.处理的对象为地理空间信息。地理信息系统用于处理地球表层这一特定空间内各种地理现象的信息。系统中的数据组织均以地理坐标为参照系,地理信息系统中还必须考虑各地理要素的空间关系;4. 地理信息系统的核心组成是地理数据库,包括属性数据库,图形数据库和遥感影像数据库,地理信息系统提供在统一的平台综合处理这些信息的能力,这是地理信息系统不同于其他信息系统的重要一点。5.地理信息系统具有强大的制图功能,完全可以代检查传统制图和一般意义上的机助制图技术,地理信息系统可以根据实际需要设计生产产各种地图、图表、文字等信息;6. 地理信息系统必须具有空间分析功能,正是空间分析功能,是地理信息系统区别于机助制图系统,也正是空间分析功能赋予地理信息系统以强大的生命力;7.空间模拟:地理信息系统是整个地球或部分区域的资源、环境在计算机中的缩影。地理信息系统可以依据系统应用模型,快速模拟自然过程的演变和过程,取得地理预测和实验的结果;8. 通过GIS选择优化方案,避免不合理的决策,解决与资源、环境、社会、经济和人口有关的实际应用课题,构成决策支持系统。
2简述GIS与其他学科的关系:数学:主要有几何学和图论等; 统计学:统计方法是GIS空间分析的基本方法,统计检验也利于GIS空间数据不确定性和误差检验;其它相关应用学科:如城市规划,土地管理等。
第三章空间数据模型
一、专业术语:
1拓扑关系是指基本要素点、线、面和体之间具有邻接、关联和包含关系。在平面拓扑的基础上加上“上下”构成三维拓扑。
2概念模型地理空间中地理事物和现象的抽象概念集,是地理数据的语义解释,从计算机系统的角度来看,他是系统抽象的最高层.
3对象模型,对象模型,也称作要素模型,将研究的整个地理空间看成是一个空域,地理现象和空间实体作为独立的对象分布在该空域中。
4场模型,也称作域模型,是把地理空间中的现象作为连续的变量或体来看待,如大气污染程度、地表湿度、地形高度等。
5矢量数据模型,用欧几里得(Euclid)几何学中的点、线、多边形及其组合表示地理实体空间位置和分布特征的一种数据组织形式。
6栅格数据模型,栅格数据模型指将分析空间划分成多个规则的网格单元(多为矩形区域,也偶有表示为三角形或六边形的),然后给各个格网单元赋以相应空间对象的属性值,用这多个格网单元组成的规则格网(GRID)来表示地理现象的空间位置和属性特征。比较适宜用场模型抽象表达的空间对象。
7.TIN模型使用彼此相邻而不重叠的三角形组成的表面,由于每个三角形顶点的xyz坐标已知,所以通过在一个三角形表面使用简单的线性插值和多项式插值,可以估计任何位置的表面值;
二、基础部分
1.主要的空间关系有哪些?1.空间拓扑关系
2.顺序空间关系
3.度量空间关系
2.地理空间数据的拓扑关系主要包括?拓扑邻接,拓扑关联,拓扑包含
3.举例说明决定栅格单元代码的主要方式:
中心点法
a)处理方法:用处于栅格中心处的地物类型或现象特性决定栅格代码
b)常用于具有连续分布特性的地理要素,如降雨量分布、人口密度图等。
面积占优法
c)处理方法:以占栅格区域面积比例最大的地物类型或现象特性决定栅格单元的代码
d)面积占优法常用于分类较细,地物类别斑块较小的情况
重要性法
e)处理方法:根据栅格内不同地物的重要性,选取最重要的地物类型决定相应的栅格单元代码
f)重要性法常用于具有特殊意义而面积较小的地理要素,特别是点、线状地理要素,如城镇、交通枢
纽、交通线、河流水系等,在栅格中代码应尽量表示这些重要地物
百分比法
i.处理方法:根据栅格区域内各地理要素所占面积的百分比数确定栅格单元的代码
ii.适用于地物面积具有重要意义的分类体系
4.Delaunay三角网具有以下特性:1)其Delaunay三角网是唯一的;2)三角网的外边界构成了点集P的
凸多边形“外壳”;3)没有任何点在三角形的外接圆内部,反之,如果一个三角网满足此条件,那么它就是Delaunay三角网。4)如果将三角网中的每个三角形的最小角进行升序排列,则Delaunay三角网的排列得到的数值最大,从这个意义上讲,Delaunay三角网是“最接近规则化”的三角网。
第四章空间数据结构
一、专业术语:
1空间数据结构,空间数据结构是空间逻辑数据模型在计算机中的组织关系和编排方式
2矢量数据结构,是对矢量数据模型进行数据的组织,通过记录坐标的方式尽可能精确地表示点、线、多边形等地理实体,坐标空间设为连续,允许任意位置、长度和面积的精确定义
3栅格数据结构,是指将地球表面划分为大小均匀紧密相邻的网格阵列,每个网格作为一个象元或象素由行、列定义,并包含一个代码表示该象素的属性类型或量值,或仅仅包括指向其属性记录的指针。
4拓扑数据结构,具有拓扑关系的矢量数据结构
5链式编码,该编码方法将数据表示为由某一原点开始并按某些基本方向确定的单位矢量链。
6游程,是指栅格矩阵内相邻同值栅格的数量。
7常规四叉树,常规四叉树:除了记录叶结点之外,还要记录中间结点。结点之间借助指针联系,每个结点需要用六个量表达:四个叶结点指针,一个父结点指针和一个结点的属性或灰度值
8线性四叉树,只存贮最后叶结点的信息。包括叶结点的位置(莫顿码值)、深度和本结点的属性或灰度值二维行程编码,
9矢量-栅格一体化结构,通过同时记录多边形边界和边界中间包含的栅格地址,实现既保持矢量数据的特征又具有栅格数据的性质。
10.TIN数据结构,它不仅要存储每个点的高程,还要存储其平面坐标、节点连接的拓扑关系,三角形及邻接三角形等关系。
11图像二值化是在一个设定的灰度阙值的基础上,对扫描获得的灰度图像(如256级灰度)进行0或1的简化处理,即有无判断。
二、基础部分
1.矢量数据结构按其是否明确表示地理实体间的空间关系分为实体数据结构和拓扑数据结构
2.拓扑数据结构包括:索引式结构,双重独立编码结构,链式双重独立编码结构等。
3.主要的栅格数据压缩编码方式有:链码、游程长度编码、块码、四叉树、二维行程编码
4.采用四叉树编码时,为了保证四叉树分解能不断地进行下去,要求图像必须为2n×2 n尺寸的栅格阵列。
5.四叉树结构按其编码的方法不同分为常规四叉树和线性四叉树
6.主要的三维空间数据结构有八叉树数据结构和四面体格网
7.多边形矢量格式向栅格格式的转换的主要算法有:内部点扩散算法、射线算法和扫描算法、边界代数
算法
8.栅格数据向矢量数据转换的目的有三:①数据入库;②数据压缩;③矢量制图;
9.矢量数据结构特点:定位明显,属性隐含。
三、拓展部分
1.拓扑结构的特点是: 1.除结点外,每个空间对象都是由更基本的对象组成的。只有点的坐标是被实际
存储的,其他复杂空间对象的坐标信息实际上是逻辑构成的。任一复杂对象能分解为一组结点及其拓扑关系的定义。2.这样,一个图层中存储的全部坐标信息就是结点的坐标,建立其他对象只是建立对这些坐标的引用。虽然建立拓扑结构需要额外的存储数据,但对坐标数据的存储却没有数据冗余的问题。3.
拓扑结构编码是某些空间分析的基础。
2.链码(Chain Codes)优缺点:优点:链式编码对多边形的表示具有很强的数据压缩能力,且具有一定
的运算功能,如面积和周长计算等,探测边界急弯和凹进部分等都比较容易,比较适于存储图形数据。
缺点:对叠置运算如组合、相交等则很难实施,对局部修改将改变整体结构,效率较低,而且由于链码以每个区域为单位存储边界,相邻区域的公共边界被重复存储会产生冗余。
3.游程长度编码优缺点:优点压缩效率较高,且易于进行检索,叠加合并等操作,运算简单,适用于机器
存储容量小,数据需大量压缩,而又要避免复杂的编码解码运算增加处理和操作时间的情况缺点:对于图斑破碎,属性和边界多变的数据压缩效率较低,甚至压缩后的数据量比原始数据还大。
4.对几种常见栅格压缩编码方法进行评价; 1.链码的压缩效率较高,已经近矢量结构,对边界的运算比较
方便,但不具有区域的性质,区域空间分析运算困难。2.游程长度编码既可以在很大程度上压缩数据,又最大限度地保留了原始栅格结构,编码解码十分容易。但对破碎数据处理效果不好。3.块码和四叉树编码具有区域性质,又具有可变的分辨率,有较高的压缩效率,但运算效率是其瓶颈。其中四叉树编码可以直接进行大量图形图像运算,效率较高,是很有前途的方法。
5 矢量数据结构与栅格数据结构比较::栅格数据优点(1)数据结构简单;(2)空间数据的叠置和组合
十分容易方便;(3)各类空间分析都很易于进行;(4)数学模拟方便;(5)技术开发费用低。缺点:
(1)图形数据量大;(2)用大像元减少数据量时,可识别的现象结构将损失大量信息;(3)地图输
出不精美(4)难以建立网络连接关系;5)投影变换花的时间多。矢量模型:优点:(1)表示地理数据的精度较高;(2)严密的数据结构,数据量小;(3)用网络连接法能完整地描述拓扑关系;(4)图形输出精确美观;(5)图形数据和属性数据的恢复、更新、综合都能实现。缺点:1)数据结构复杂;
(2)矢量多边形地图或多边形网很难用叠置方法与栅格图进行组合;(3)显示和绘图费用高,特别是
高质量绘图、彩色绘图和晕线图等;(4)数学模拟比较困难;(5)技术复杂,多边形内的空间分析不容易实现。
6 在GIS 建立过程中矢量数据结构与栅格数据结构的选择;1.从应用领域来看——栅格结构和矢量结
构都有一定的局限性。一般来说,大范围小比例尺的自然资源、环境、农业、林业、地质等区域问题的研究,城市总体规划阶段的战略性布局研究等使用栅格模型比较合适;城市分区或详细规划、土地管理、公共事业管理等方面应用矢量模型比较合适。2.从数据来源来看——对于一个与遥感相结合的地理信息系统来说,栅格结构是必不可少的,因为遥感影像是以像元为单位的,可以直接将原始数据或经处理的影像数据纳入栅格结构的地理信息系统;而对地图数字化、拓扑检测、矢量绘图等,矢量数据结构又是必不可少的。
7 栅格数据模型和TIN数据模型的比较:1对地理空间的划分:TIN 模型为不规则三角形;而栅格模型
为规则格网;2空间对象的表示:栅格数据模型既可以描述连续变化的地理现象,又可以表示离散的地理现象(点、线、面),而TIN模型只能表示联系变化的地理
现象;但TIN 能精确地表示曲面类型地理现象的形状以及特殊的地形要素,比如山脊、山峰等,而栅格模型不能精确表示;3表面模型的精度:栅格使用统一的CELL大小来表示,在地形平坦的地方,存在大量的数据冗余,而TIN具有随坡度变化而不同的点密度,在坡度变化大的地区点密度较高;4栅格模型适合进行空间一致性分析、近邻分析、离散度分析及表面最低成本分析,TIN模型适合进行坡度、坡向、体积计算和视线分析等
8 栅格格式向矢量格式的转换的一般步骤:1)多边形边界提取:(二值化,平滑,细化)2)边界线追踪3)
拓扑关系生成4)去除多余点及曲线圆滑
第五章空间数据组织与管理
第六章空间数据的采集与处理
一、专业术语
栅格数据重采样进行空间分析时,用来分析的数据资料由于来源不同,经常会出现不同栅格大小问题,这时为了便于分析,就需要做同一栅格大小的转换处理,即栅格数据的重采样过程。
空间数据质量指空间数据对特定用途的分析和操作适用的程度。即数据质量是指数据适用于不同应用的能力空间数据质量控制,指在空间数据采集和分析过程中,对这些步骤和过程的一些指标和参数予以规定,对可能引入误差的步骤和过程加以控制,对检查出的误差和错误进行纠正,以达到提高空间数据质量和提高空间分析应用水平的目的。
准确度,指测量值、计算值或估计值与真实值(或可视为真实值的值)的接近程度,用误差来表示;
不确定性,表示真实值不能被精确测量或肯定的程度;
精度,指数据表示的精密程度,亦即数据表示的有效位数
一致性,指对同一现象或同类现象在表达上一致程度, 包括数据内容、数据结构、属性的一致性,也包括拓扑结构上的一致性;
数据完整性,指具有同一准确度和精度的空间数据在范围、内容及结构等方面的完整程度;
相容性,指不同来源的数据在同一个应用中匹配的程度;
数据质量间接评价法,指通过外部知识或信息(元数据,地理相关分析)进行推理来确定空间数据的质量的方法。
元数据描述数据的数据。
二、基础部分
1.野外数据采集的特点机动性高,精度高,成本高
2.在数字化后的地图上,经常出现的错误有以下几种:伪节点、悬挂节点、碎屑多边形、不正规多边形
3.GIS软件提供的数学基础变换方法一般有仿射变换、相似变换、二次和高次变换等。
4.栅格数据重采样主要包括三种方法:最邻近法采样(NEAREST),双线性采样(BILINEAR)和三次卷
积采样(CUBIC)。
5.实现空间数据共享大体上有四种方案:数据格式转换方案、数据直接访问方案、数据互操作方案和开放
式数据库互接模式。
6.矢量数据压缩的几种方法:间隔取点法、垂距法和偏角法、分裂法
7.数据质量评价方法主要有:直接评价法和间接评价法
8.常见的空间数据的误差类型有:逻辑误差、几何误差、属性误差、时间误差
9.空间数据质量控制的主要方法:传统的手工方法、元数据方法、地理相关法
三、拓展部分
简述GIS主要的数据源及其特点:⑴地图:各种类型的地图是GIS最主要的数据源,因为地图是地理数据的传统描述形式。⑵遥感影像数据:遥感影象是GIS中一个极其重要的信息源。通过遥感影象可以快速、准确地获得大面积的、综合的各种专题信息,航天遥感影象还可以取得周期性的资料,这些都为GIS提供了丰富的信息。⑶统计数据:国民经济的各种统计数据常常也是GIS的数据源。如人口数量、人口构成、国民生产总值等等。⑷实测数据:各种实测数据特别是一些GPS点位数据、地籍测量数据常常是GIS 的一个很准确和很现势的资料。⑸数字数据:目前,随着各种专题图件的制作和各种GIS系统的建立,直接获取数字图形数据和属性数据的可能性越来越大。数字数据也成为GIS信息源不可缺少的一部分。⑹各种文字报告和立法文件:对于一个多用途的或综合型的系统,一般都要建立一个大而灵活的数据库,以支持其非常广泛的应用范围。
1.空间数据采集与处理的基本流程1数据源的选择2采集方法的确定3数据的编辑与处理4数据质量控制
与评价5数据入库
2.数据源的选择条件1是否能满足项目或系统功能的需要2所选数据源是否是已有使用经验3系统成本,
数据源的选择对与系统整体的成本控制至关重要
3.空间数据采集的主要方法1野外数据采集:平板测量、全野外数字测量、GPS、全野外数字测图:全站
仪+PDA 2.地图数字化:跟踪数字化方式、扫描矢量化方式
4.空间数据质量分析的目的在于分析和了解空间数据误差的性质、类型、大小和来源以及产生原因,对系
统数据和处理结果中的不确定性因素进行模拟和估计,从而了解空间数据的可靠性和可信度。在此基础上,实现空间数据质量控制。
5.元数据的作用1帮助用户了解和分析数据2空间数据质量控制3在数据集成中应用4数据存贮和功能实
现
第七章第八章空间分析
一、专业术语:
空间分析,就是对空间对象的形态特征、空间分布、空间关系和空间行为进行描述,解决地理理论的空间格局或空间关系问题,并进行空间现象的解释和预测。
几何量算,是指对空间信息的自动化量算,是地理信息系统所具有的重要功能,也是进行其它空间分析的定量化基础。
再分类,就是根据不同的需要对原始数据再次进行分类和提取的过程.
叠加分析,将有关主题层组成的数据层面,进行叠加产生一个新数据层面的操作,其结果综合了原来两层或多层要素所具有的属性。
栅格计算,栅格数据分析中的单个单元运算; 对应栅格单元运算,不涉及位置运算; 不受邻域单元影响;产生新的栅格地图;
缓冲区,地理空间目标的一种影响范围或服务范围。
缓冲区分析,缓冲区分析是研究根据数据库的点、线、面实体,自动建立其周围一定宽度范围内的缓冲区多边形实体,从而实现空间数据在水平方向得以扩展的信息分析方法,是地理信息系统重要的和基本的空间操作功能之一。
窗口分析,(邻域变换)是指在计算新图层图元值时,不仅考虑原始图层上相应图元本身的值,而且还要考虑与该图元有邻域关联的其他图元值的影响。
网络分析,是指依据网络拓扑关系(结点与弧段拓扑、弧段的连通性),通过考察网络元素的空间及属性数据,以数学理论模型为基础,对网络的性能特征进行多方面研究的一种分析计算。
地理网络,由一系列相互连通的点和线组成,用来描述地理要素(资源)的流动情况。
链,网络中流动的管线,如街道、河流、水管等,其状态属性包括阻力和需求。
障碍,禁止网络中链上流动的点。
拐角点,出现在网络链中的分割结点上,状态属性有阻力,如拐弯的时间和限制
节点,网络中链的结点,如港口、车站、电站等,其状态属性包括阻力和需求等。结点中又有下面几种特殊的类型。
中心,是接受或分配资源的位置,如水库、商业中心、电站等
站点,在路径选择中资源增减的结点
阻强:指资源在网络流动中的阻力大小,如所花的时间、费用等。它是描述链与拐角点所具有的属性。
二、基础部分
1.GIS中提供的空间查询方式主要有基于空间关系的查询和基于属性数据的查询
2.非均质空间的距离在量算时要考虑其他的因素,如耗时,费用,通达度,路况等等,这时就需要给各个
不同的方向赋予不同的权重,计算成本距离
3.形状量算的主要参数有:欧拉函数,形状系数和凸度数
4.叠置分析根据操作形式的不同可以分为:图层擦除(Erase)、识别叠加(Identify)、交集操作(Intersect)、
对称识别(symmetrical difference)、图层合并(Union)和修正更新(Updata)。
5.线要素缓冲区的建立是以线要素的边线作为参考线,来做其平行线,并考虑其端点处建立原则,即可建
立缓冲区。常用的端点处建立原则有:角平分线法和凸角圆弧算法。
6.窗口分析中的3要素分别是:中心点,分析窗口大小与类型,运算方式。
7.窗口分析中图层根据窗口分析类型运算,依据不同的运算方式获得新的图层。其中常用的统计运算类
型有:平均值统计、最大值统计、最小值统计、中值统计、求和统计、标准差统计等
8.窗口分析中图层根据窗口分析类型运算,依据不同的运算方式获得新的图层。其中常用的测度运算类
型有:范围统计、多数统计、少数统计、种类统计等
9.网络数据集中通常通过设置高程字段来表达线要素的高度起伏关系。
10.ArcGIS支持的网络数据类型有:几何网络和网络数据集
三、拓展部分
1.空间查询特性:回答用户的简单问题;不改变空间数据库数据;不产生新的空间实体和数据
2.数据再分类的方式:图层擦除(Erase)、识别叠加(Identify)、交集操作(Intersect)、对称识别(symmetrical
difference)、图层合并(Union)和修正更新(Updata)。;
3.简述缓冲区的主要应用:求交通沿线和河流沿线的地物特征;公共设施的服务半径;水库建设引起的搬
迁;铁路公路以及河道对所经区域经济发展的重要性;城市的噪音污染源所影响的一定空间范围;根据污染源求敏感区范围;
4.空间分析的基本步骤: 1. 确定问题并建立分析的目标和要满足的条件
2. 针对空间问题选择合适的分析工具
3. 准备空间操作中要用到的数据。
4. 定制一个分析计划然后执行分析操作。
5. 显示并评价分析结果
5.简述窗口分析中的3个要素:中心点;邻域大小与类型;邻域运算函数;中心点:在单个窗口中的
中心点可能就是一个栅格点,或者是分析窗口的最中间的栅格点,窗口分析运算后的数值赋予它。
6.举例说明网络分析的应用:1 路径分析:最短路径分析和最低消费路径,点对点最优路径多目标点访
问。2 资源分配:资源分配主要是优化配置网络资源的问题,资源分配的目的是对若干服务中心进行优化,划定每个中心的服务范围,把所有连通链都分配到某一中心,并把中心饿资源分配给这些链以满足要求,筛选出租价布局和布局中心位置。资源分配网络模型由中心点(分配中心或收集中心)及其属性和网络组成。分配有两种形式,一种是由分配中心向四周分配,另一种是由四周向收集中心分配。7.分析窗口的大小与类型:依据的单个窗口中的栅格分布状况。
第九章DEM与数字地形分析
专业术语:
1.DEM:是表示区域D上地形三维向量的有限序列
2.DTM:就是地形表面形态属性信息的数字表达,是带有空间位置特征和地形属性特征的数字描述
3坡度:水平面与地形面的夹角。
4坡向:法线在水以平面投影与正北方向之夹角
5曲率:剖面曲率与平面曲率之差
6平面曲率:与最大坡度方向呈直角方向的估算值
7剖面曲率:沿最大坡度方向的估值
8地形起伏度:指在所指定的分析窗口内所有栅格中最大高程与最小高程的差。Max-min
9地形粗糙度:地表单元的曲面面积与其在水平面上的投影的面积的比。
10地表切割深度:地面的某点的邻域范围的平均高程与最小高程的差。
基础部分
1.国家空间数据基础设施(NSDI)的框架数据包括:数字高程模型(DEM)、数字正射影像图(Digital
OrthoimageMap,DOM)、数字线划图(Digital Line Graphic, DLG) 。
2.格网DEM转换为TIN的算法主要有:保留重要点法、启发丢弃法
3.三角形穿越等高线是指满足DT三角剖分准则的三角形与等高线相交,会导致TIN所模拟的地形在高处
被消掉,而低洼处被填平引起地形的扭曲。克服这类情况的办法是将等高线作为TIN的特征约束条件,从而形成约束TIN。
4.主要的地形因子包括:坡度,坡向,曲率,地形起伏度,地形粗糙度,地表切割深度等等。
5.实际应用中坡度有两种表达方式:坡度百分数(percent of slope)、坡度(degree of slope):
6.坡度变率在一定程度上可以很好反映剖面曲率信息,坡度变率表征了地表面高程相对于水平面变化的二
阶导数,又可称为坡度之坡度。
7.坡向变率则比较好的反映平面曲率信息,坡向变率又可称为坡向之坡度,可以很好的反映等高线的弯曲
程度。
8.基于DEM计算宏观地形因子时,关键是确定分析半径的大小。
9.通视分析是对地形进行最优化处理,如设置雷达站、电视台的发射站、道路选择、航海导航等,军事上
如布设阵地、设置观察哨所、铺架通信线路等。包括两类通视线分析和可视域(viewshed)分析
拓展部分
1.DEM的主要表示模型规则格网模型等高线模型不规则格网模型
2简述构建Delaunay三角形网的通用算法-逐点插入算法:1构造初始三角形。2将点集中的其它散点依次插入,如插入点P,在三角形链表中找出其外接圆包含插入点P的三角形(称为该点的影响三角形),删除影响三角形的公共边,将插入点同影响三角形的全部顶点连接起来,从而完成一个点在Delaunay三角形链表中的插入。3根据优化准则对局部新形成的三角形进行优化(如互换对角线等)。将形成的三角形放入Delaunay三角形链表。4循环执行上述第2步,直到所有散点插入完毕。
3简述DEM的主要数据来源:1地图数字化是DEM的主要数据源
2影像数据:包括航空摄影和卫星影像数据,是大范围、高精度、高分辨率DEM建立的最有价值的数据源。3野外测量:野外测量可以获得最精确的高程和平面数据,但野外测量工作量大、周期长、成本高,一般不适合大范围的DEM数据采集
4举例说明坡度、坡向的主要应用:1坡度表明了该局部地表坡面的倾斜程度,坡度大小直接影响着地表物质流动与能量转换的规模与强度,是制约生产力空间布局的重要因子。2根据坡度起伏变化,确定崩塌、泥石流区域或严重的土壤侵蚀区,作为灾害防治与水土保持工作的基础。3提取平坦区域,为大型商业中心或房屋建筑选址。1坡向是决定地表面局部地面接收阳光和重新分配太阳辐射量的重要因子之一,直接造成局部地区气候特征的差异.2可以通过计算研究区域内的每一点的太阳光照量,从而测定每一点的生物量
5简述数字高程模型的应用领域与发展前景:首先,地学分析应用。数字高程模型作为等高线地形图的替代
数据和有力工具,又是地学分析、生物学等区域性科学基本参数的提供和和研究成果的表达形式其次,非地形特性应用。数字高程模型是在二维平面位置上叠加地形高程数据,亦即DEM是地理空间定位的数据集合。因此,用来进行数字高程模型建立的各种技术也可以移植到非高程数据的地学建模和分析上。第三,产业化和社
会服务。随着地理信息系统、数字地球等空间信息技术的发展,数字高程模型成为空间信息系统的重要组成部分,是各种地学分析应用的最为主要的基础数据。
6基于DEM的流域地形分析的基本步骤:DEM→无洼地DEM生成→水流方向确定→水流累计矩阵计算→流域特征分→特征地貌分析▏山脊线、山谷线提取▏流域网络提取▏流域分割▏流域参数统计计算
第十章空间统计分析
专业术语:空间数据的统计分析,着重于空间物体和现象的非空间特性的统计分析,而空间数据所描述的事物的空间位置在这些分析中不起制约作用。数据的空间统计分析,是直接从空间物体的空间位置、联系等方面出发,研究既具有随机性又具有结构性,或具有空间相关性和依赖性的自然现象。数据的空间统计分析,其核心就是认识与地理位置相关的数据间的空间依赖、空间关联或空间自相关,通过空间位置建立数据间的统计关系。空间统计分析的任务就是运用有关的统计分析方法,建立空间统计模型,从凌乱的数据中挖掘空间自相关和空间变异规律。
偏度系数:是刻画数据在均值两侧的对称程度的参数。
峰度系数:是刻画数据在均值两侧的集中程度的参数。
块金值,当间隔距离h=0时,γ(0)= C0,该值称为块金值或块金方差(nugget variance)。
基台值,当采样点间的距离h增大时,半变异函数从初始的块金值达到一个相对稳定的常数时,该常数值称为基台值。sill=C0+C
变程,当半变异函数的取值由初始的块金值达到基台值时,采样点的间隔距离称为变程。变程表示了在某种观测尺度下,空间相关性的作用范围,其大小受观测尺度的限定。
偏基台值,基台值与块金值的差值: partial sill=C
全局趋势,(空间趋势)反映了空间物体在空间区域上的变化的主题特征,它主要揭示了空间物体的总体规律,而忽略局部变异。
全局空间自相关:反映的是整个研究区域内属性是否具有自相关性。
局部空间自相关:反应特定的局部地点属性是否具有自相关性。
数据分级,是根据一定的方法和标准把数据分成不同的级别,也就是把一个数据集划分为不同的子集,在此过程中,还可以设置分级精度和分级数目等。
空间插值,是进行数据外推的基本方法。或句话说空间插值是一种由已知来推知未知的一种空间分析方法。内插,已有某研究区的某项数据,根据这些观测数据来估算研究区内位置点的数值的过程.
外推,估算研究区外未知点的数据值得过程
整体插值,用研究区所有采样点的数据进行全区特征拟合。
局部插值,是仅仅用邻近的数据点来估计未知点的值。
基础部分
1.空间统计分析包括空间数据的统计分析及数据的空间统计分析。
2.在使用任何统计分析分析方法分析和空间位置有关的数据之前,我们都必须先测度和检验空间自相关的
显著性。
3.代表数据集中趋势的统计量包括平均数、中位数、众数,它们都可以用来表示数据的分布位置和一般水
平。
4.列举四种代表数据离散程度的统计量(最大值、最小值、分位数、极差、离差、平均离差、离差平方和、
方差、标准差、变差系数等)。
5.代表数据离散程度的统计量主要有偏度系数和峰度系数。
6.
探索性数据分析的基本分析工具包括 直方图,QQPlot 图,方差变异分析工具,Voronoi 图。 7.
QQPlot 图分为 正态QQPlot 图(Normal QQPlot )和普通QQPlot 图(general QQPlot ) 8.
正态QQPlot 图(Normal QQPlot )主要用来检验数据是否符合正态分布。 9.
普通QQPlot 图(general QQPlot )主要用来评估两个数据集分布的相似性。 10.
V oronoi 图中多边形值的分配方式和计算方法(简化,平均,模式,聚类,熵,中值,标准差)。 11. 全局空间自相关系数反映的是研究区域内所有区域单元的整体空间关系。Moran 指数和Geary 系数是最
常用的两种测度全局自相关的指标。
12. 局部空间自相关分析方法包括3种:空间联系的局部指标(LISA) 、G 统计量 、Moran 散点图。
13. 模式分级法主要有:分位数分级、等间距分级,等面积分级、标准差分级、自然裂点法分级等。
14. 常用的局部插值方法:最邻近点法 /泰森多边形法、反距离加权法IDW 、样条插值spline 、克里金插值
法kriging
15. 常用的插值验证方法有:交叉验证和实际验证。
拓展部分
1. 简述空间统计分析的主要任务,统计分析是空间分析的主要手段,贯穿于空间分析的各个主要环节。空
间统计分析方法不仅仅限于常规统计方法,还包括利用空间位置的空间自相关分析。本章主要介绍常用统计量、数据特征分析(即探索性数据分析)、分级统计分析、空间插值和空间回归分析5方面内容。 2. 数据的空间统计分析与经典统计分析方法的关系,共同点:都是在大量采样的基础上,通过对样本的属
性值的频率分布、均值、方差等关系及其相应规则分析,确定其空间分布格局与相关关系。不同点:数据的空间统计分析既考虑到样本的大小,又重视样本空间位置及样本间的距离。空间数据具有空间依赖性(空间自相关)和空间异质性,扭曲了经典统计分析的假设条件,使得经典统计分析对空间数据的分析会产生虚假的解释。经典统计分析模型是在观测结果相互独立的假设基础上建立的,但实际上地理现象之间大都不具有独立性。
3. 代表数据集中趋势统计量的选择:代表数据集中趋势的统计量包括平均数、中位数、众数,它们都可以用来表示数据的分布位置和一般水平。
4. 描述代表数据分布形态的统计量及其分布图:代表数据离散程度的统计量主要有 偏度系数和峰度系数。
5. 绘制变异函数曲线图和协方差函数图,并做简要说明:
偏度系数的三种情形
正
正偏态
负偏态 标准峰度系数的三种情形
简要说明:
6. 简述产生离群值的两种情况及处理方式:全局离群值,局部离群值; 离群值的出现可能是真实异常值,也可能是由于不正确的测量或记录引起的。如果是真实异常值,这个点可能就是研究和理解这个现象的最重要的点。反之,如果它是由于测量或数据输入的明显错误引起的,在生成表面之前,应对它们进行修正或剔除。
7. 简述寻找离群值的主要方式:1.利用直方图查找离群值 2.用半变异/协方差函数云图识别离群值
3.用V oronoi 图查找局部离群值
8. 空间统计分析中检验数据分布的意义和主要方法:在空间统计分析中,许多统计分析模型,如地统计分析,都是建立在平稳假设的基础上的,这种假设一定程度上要求所有数据具有相同的变异性。另外,克里金插值都假设数据服从正态分布。如果数据不服从正态分布,需要进行一定的数据变换,从而使其服从正态分布。因此
在进行地统计分析之前,检验数据分布特征,了解和认识数据具有非常重要的意义。 数据的检验可以通过直方图和Normal QQplot 图来完成。 9. 简述在使用Moran’s I 指数时需要注意的问题: 1)不存在空间自相关时,Moran ’s I 的值不是0,而是E (I ) 2)从某些实证研究的结果来看, Moran ’s I 的取值范围并不局限于(-1,1)
,尤其是上限并不局限于1。 10. 简述空间自相关系数显著性检验过程:空间自相关指标的显著性检验是通过标准化Z 值来实现的。 Moran ’s I 的显著性检验为:
Geary ’s C 的显著性检验Z 值公式为:
)()(I VAR I E I Z -= 式中E(I)=1/n-1; 22
22212)]([)1()3()(I E n W W nS S n I VAR N --+-=∑∑∑∑∑∑=+=+==--+-======j
ij i n i j i n i n j ji ij n i n j ij N N w w w w S w w S w W I E n W W nS S n I VAR .12..21121112222212;)(2)(;)]([)
1()3()( )()(C VAR C E C Z -=
11. 简述数据分级的目的:数据分级的根本目的在于区分数据集中个体的差别,分级统计的过程就是区别个体性质的过程。分级的应用目的有两点:一是为了分级后,图面制图效果好,有利于读图;二是用不同的分级方法来突出显示制图区域内不同地貌特征。
12. 空间插值的适用范围:现有离散曲面的分辨率、像元大小或方向与所要求不符的情况,需要重新插值。现有连续曲面的数据模型与所需的数据模型不符,需要重新插值。如从TIN模型, 到栅格数据模型、栅格到TIN模型。现有数据不能完全覆盖所要求的区域范围,需要插值。
13. 整体插值注意的问题:整体插值方法将短尺度的、局部的变化看作随机和非结构的噪声,从而丢失了这一部分信息。局部插值方法恰好能弥补整体插值方法的缺陷,可用于局部异常值,而且不受插值表面上其它点的内插值影响。整体插值方法通常不直接用于空间插值,而是用来检测不同于总趋势的最大偏离部分,在去除了宏观地物特征后,可用剩余残差来进行局部插值。
14. 局部插值的一般步骤:1.定义一个邻域或搜索范围。2.搜索落在此邻域范围的数据点。3.选择表达这有限个点的空间变化的数学函数;4.为落在规则格网单元上的数据点赋值。
15. 空间插值的一般过程:1.内插方法(模型)的选择;2.空间数据的探索分析,包括对数据的均值、方差、协方差、独立性和变异函数的估计等;3进行内插;4内插结果评价;5重新选择内插方法,直到合理;
6.内插生成最后结果。
16. 插值方法的选择标准:1)精确性:(2)参数的敏感性:3)耗时4)存储要求5)可视化、可操作性(插值软件选择)
17. 简述主要的插值验证方法:
(1)交叉验证
交叉验证法(cross-validation),首先假定每一测点的要素值未知,而采用周围样点的值来估算,然后计算所有样点实际观测值与内插值的误差,以此来评判估值方法的优劣。各种插值方法得到的插值结果与样本点数据比较。
(2)“实际”验证
将部分已知变量值的样本点作为“训练数据集”,用于插值计算;另一部分样点“验证数据集”,该部分站点不参加插值计算。然后利用“训练数据集”样点进行内插,插值结果与“验证数据集”验证样点的观测值对比,比较插值的效果。
因篇幅问题不能全部显示,请点此查看更多更全内容