R语言在地统计学中的应用-原作强
原作强原作强 中国科学院沈阳应用生态研究所 yuanzq825@ 中国科学院沈阳应用生态研究所 yuanzq825@ R语言在地统计学中的应用 R语言在地统计学中的应用 Using R to implement geostatical analysis in open source environment 地统计方法的基本原理地统计方法的基本原理 前提假设前提假设 区域化变量区域化变量 变异分析变异分析 空间估值空间估值 应用实例应用实例 以geoR包为例以geoR包为例 概念和应用范围概念和应用范围 地统计(Geostatistics)又称地质统计,是在法国著名统 计学家 G. Matheron 大量理论研究的基础上逐渐形成的 一门新的统计学分支。它是以区域化变量为基础, 借助 变异函数, 研究既具有随机性又具有结构性,或空间相 关性和依赖性的自然现象的一门科学 凡是与空间数据的结构性和随机性, 或空间相关性和 依赖性,或空间格局与变异有关的研究,并对这些数据进 行最优无偏内插估计, 或模拟这些数据的离散性、波动 性时,皆可应用地统计学的理论与方法 生态学研究中的生物或非生物因子的时空依赖性是普 遍存在的,如种群梯度分析、种群格局、环境因子的时 空分布的异质性等等 地统计学与经典统计学地统计学与经典统计学 相同点相同点:它们都是在大量采样的基础上,通过对样 本属性值的频率分布或均值、方差关系及其相应 规则的分析, 确定其空间分布格局与相关关系 不同点不同点:地统计学既考虑到样本值的大小,又重视 样本空间位置及样本间的距离,弥补了经典统计 学忽略空间方位空间方位的缺陷,能够对研究对象的空间 格局进行检验、模拟和估计 地统计分析理论基础 地统计分析理论基础 —前提假设前提假设 (1) 随机过程随机过程 所有样本值都不是相互独立 (2) 正态分布正态分布 若不符合正态分布的假设,应对数据进行变换,并尽 量选取可逆的变换形式 (3) 平稳性平稳性 (a)均值平稳 (b)与协方差函数有关的二阶平稳和与半变异函 数有关的内蕴平稳 当一个变量呈现为空间分布时,就称之为区域化变量 (regionalized variable). 这种变量常常反映某种空间现象的特 征,用区域化变量来描述的现象称之为区域化现象. 区域化变量,亦称区域化随机变量,G. Mathero(1963)将 它定义为以空间点x的三个直角坐标为自变量的随机场. 区域化变量具有两个最显著,而且也是最重要的特征, 即随机性随机性和结构性结构性. 地统计分析理论基础 地统计分析理论基础 —区域化变量—区域化变量 协方差又称半方差,表示两随机变量之间的差异。在概 率论中,随机变量 X 与Y的协方差定义为: 协方差函数协方差函数 式中:h为两样本点空间分隔距离;Z(xi )为xi处的实 测值; Z(xi+h )为Z (xi )在xi处距离偏离h的实测值; N(h) 为分割距离是h时样本点的对数 地统计分析理论基础 地统计分析理论基础 —变异分析—变异分析 半变异函数又称半变差函数、半变异矩,是地统计分析的 特有函数。区域化变量 Z(x)在点 x 和 x+h 处的值 Z(x)与 Z(x+h)差的方差的一半称为区域化变量 Z(x)的半变异函 数,记为 r(h),2r(h)称为变异函数。 协方差函数协方差函数 地统计分析理论基础 地统计分析理论基础 —变异分析—变异分析 半变异函数和协方差函数把统计相关系数的大 小作为一个距离的函数,是地理学相近相似定理 定量量化 地统计分析理论基础 地统计分析理论基础 —变异分析—变异分析 Title • . 块金值块金值(Nugget):由于测量误差和空间变异由于测量误差和空间变异,得两采样点非常接近时,它们的半 变异函数值不为 得两采样点非常接近时,它们的半 变异函数值不为 0 基台值(基台值(Sill)):即函数值不随采样点间隔距离而改变时,空间相关性不存在即函数值不随采样点间隔距离而改变时,空间相关性不存在 偏基台值偏基台值(partial Sill):基台值与块金值的差值基台值与块金值的差值 变程变程(range): 当半变异函数的取值由初始的块金值达到基台值时,采样点的间 隔距离 空间相关性的强弱可由 当半变异函数的取值由初始的块金值达到基台值时,采样点的间 隔距离 空间相关性的强弱可由 Partial Sill/Sill 来反映来反映, 越大越大,间相关性越强间相关性越强 Nugget/Sill 称为基底效应,表示样本间的变异特征,该值越大,更多得是由随 机因素引起的 变异函数的理论模型变异函数的理论模型 地统计学将变异函数理论模型分为3大类: 第1类是有基台值模型,包括球状模型、指数 模型、高斯模型、线性有基台值模型和纯块金效 应模型; 第2类是无基台值模型,包括幂函数模型、线 性无基台值模型、抛物线模型; 第3类是孔穴效应模型。 下面有代表性地介绍几种常见的变异函数理论 模型。 克立格(Kriging)插值法,又称空间局部估计或空间 局部插值法,是地统计学的主要内容之一。克立格法是建 立在变异函数理论及结构分析基础之上的,它是在有限区 域内对区域化变量的取值进行无偏最优估计的一种方法。 克立格法适用的条件是,如果变异函数和相关分析的 结果表明区域化变量存在空间相关性空间相关性。 其实质其实质是利用区域化变量的原始数据和变异函数的结 构特点,对未采样点的区域化变量的取值进行线性无偏、 最优估计。 地统计分析理论基础 地统计分析理论基础 —空间估值—空间估值 克立格插值K克立格插值K(riging interpolation)是根据 变异函数模型而发展起来的一系列地统计 的空间插值方法,包括: 是根据 变异函数模型而发展起来的一系列地统计 的空间插值方法,包括: 普通克立格法普通克立格法(Ordinary Kriging); 泛克立格法泛克立格法(Universal Kriging); 指示克立格法指示克立格法(Indicator Kriging); 析取克立格法析取克立格法(Disjunctive Kriging); 协同克立格法协同克立格法(Cokriging)等等 Kriging & stochastic simulation Kriging and stochastic simulation are geostatistical s which are commonly used to create continuous maps. The two s have opposing goals: 1. kriging aims at local accuracy through minimizing a covariance-based error variance, kriging produces one output map. kriging is preferred for local estimation 2. simulation aims at reproducing spatial structure