显式统计预警模型方法

如题所述

应用地质灾害显式统计预警的基本原理,根据5.4节中南山地丘陵区试运算工作实践,并对5.4节中相关权重计算等问题进行进一步的思考和修正,逐步摸索了一条地质灾害预警预报的实现途径。主要包括如下几个步骤:

1)地质环境条件的定量化表达(潜势度计算);

2)地质灾害与地质环境、降雨资料统计分析参数选择;

3)显式统计预警模型选取;

4)地质灾害预警指数计算;

5)地质灾害预警产品生成等。

5.5.1 地质灾害“潜势度”计算方法

地质灾害潜势度是指区域地质灾害发生的潜在条件组合的评价指标,具体反映一个地区是否具备发生地质灾害的地质环境背景条件。

一般采用综合指数模型进行评价:

中国地质灾害区域预警方法与应用

式中:Qn为第i个单元的潜势度指数;j为评价因子;ai为第j个评价因子在第i个评价单元中的赋值;bj为第j个评价因子的权重。

因此,地质灾害潜势度计算结果的合理与否,主要取决于两个方面:一是评价因子选取与定量化;二是评价因子权重的确定。5.5.1.1评价因子定量化

采用广泛使用的确定性系数模型(CF)进行因子图层的量化。基本假定是地质环境的优劣可以根据过去地质灾害(滑坡)的易发程度来确定。即过去地质灾害多发的地方,地质环境条件也较差。

确定性系数模型(CF)最早由Shortliffe和Buchanan(1975)提出,由Heckerman(1986)进行了改进,表示为下式:

中国地质灾害区域预警方法与应用

式中:PPa为滑坡在数据类a中发生的条件概率,应用时为数据类a中存在的滑坡个数与数据类a面积的比值;PPs为滑坡在整个研究区A中发生的先验概率,可以表示为整个研究区的滑坡的个数与研究区面积的比值。

将各因子图层分别按公式计算,CF的变化区间为[-1,1]。正值代表事件发生确定性的增长,即滑坡发生的确定性高,地质环境条件差;负值代表确定性的降低,即滑坡发生的确定性低,地质环境条件好;CF值接近于0,说明确定性居中,不能确定地质环境的优劣。

选取各因子图层量化结果(CF值)作为评价因子的赋值(公式中ai值)参加计算。5.5.1.2评价因子权重的确定

根据中南山地丘陵区试运算情况,对权重计算方法做了相应的改进。首先采用上节计算所得的各因子CF值进行变换来计算各因子的权重,具体计算权重的方法为本项目的一个创新的方法。具体计算方法如下:

(1)所有因子图层CF值合并计算

首先将各因子图层全部合并计算。假定要合并两个因子图层的CF值分别为x和y,合并后的结果为Z,则合并公式如下式:

中国地质灾害区域预警方法与应用

先选定岩土体类型因子,根据上式逐步叠加合并各因子图层。为使合并结果易于解释,将合并的图层的CF值进行分类,分为5个级别,合并后各级别的百分比用Zall-i(i=1,2,…,5)表示(表5.9)。

表5.9 CF级别划分

(2)某因子图层CF值的贡献计算

当计算某因子图层的CF值的贡献时,首先计算除该因子图层外,其他所有图层叠加合并的Z值分段百分比,得到Z某图层-i(i=1,2,…,5);然后根据式(5.8)计算该图层的CF值贡献。

中国地质灾害区域预警方法与应用

式中:△Z某图层-i为某图层CF分段贡献值;Zall-i为所有图层CF合并分段结果值;Z某图层-i为除该图层其他所有图层CF合并分段结果值;i为CF分段级别,i=1,2,…,5。

(3)计算各因子图层权重

根据式(5.9),计算每个因子图层的相对贡献大小,经归一化后得到各因子的权重。即

中国地质灾害区域预警方法与应用

式中:T为某因子图层的权重;△Z-i为某图层CF分段贡献值,即△Z某图层-i;i为CF分段级别,i=1,2,…,5。

5.5.2 地质灾害显式统计预警模型选取

5.5.2.1 模型选取原则

在统计模型的选择上,选定两种模型进行对比分析计算。一是多元线性回归模型,该模型是传统的数学统计的代表方法,具备简单直观的特点;二是神经网络模型,该模型是黑箱模型模仿推理计算的代表方法。两种代表性的方法可以进行相互校验。

5.5.2.2 多元线性回归模型

多元线性回归模型反映一种结果与另外多种原因的依存关系,即是另外多种因素共同对一种结果产生影响,作为影响其分布与发展的重要因素。

设变量Y与变量X1,X2,…,Xm存在着线性回归关系,它的m个样本观测值为Y,X1,X2,…,Xm,于是多元线性回归的数学模型可以写为

中国地质灾害区域预警方法与应用

可采用最小二乘法对上式中的待定回归系数β0,β1,…,βm进行估计,求得β值后,即可利用多元线性回归模型进行预测了。

计算了多元线性回归方程之后,为了将它用于解决实际预测问题,还必须进行数学检验。多元线性回归分析的数学检验,包括回归方程和回归系数的显著性检验。

回归方程的显著性检验,采用统计量:

中国地质灾害区域预警方法与应用

式中: ,为回归平方和,其自由度为m; ,为剩余平方和,其自由度为(n-m-1)。

利用上式计算出F值后,再利用F分布表进行检验。给定显著性水平α,在F分布表中查出自由度为m和(n-m-1)的值Fα,如果F≥Fα,则说明Y与X1,X2,…,Xm的线性相关密切;反之,则说明两者线性关系不密切。

回归系数的显著性检验,采用统计量:

中国地质灾害区域预警方法与应用

式中:Cii为相关矩阵C=A-1的对角线上的元素。

对于给定的置信水平α,查F分布表得Fα(n-m-1),若计算值Fi≥Fα,则拒绝原假设,即认为Xi是重要变量,反之,则认为Xi变量可以剔除。

多元线性回归模型的精度,可以利用剩余标准差(S)来衡量。S越小,则用回归方程预测Y越精确;反之亦然。

中国地质灾害区域预警方法与应用

5.5.2.3 BP神经网络

人工神经网络(ArtificialNeuralNetwork,简称ANN)是基于模仿大脑神经网络结构和功能而建立的一种信息处理系统。BP神经网络是目前应用最广泛也是发展最成熟的一种神经网络模型。BP神经网络也即误差逆传播网络(Back-PropagationNeuralNetwork),由Rumelhart和Mclland等1985年提出。它为神经网络的一种重要方法,它由三部分组成:感知单元组成的输入层、一层或者多层的计算节点为隐藏层和一层计算节点的输出层(图5.19)。

BP神经网络计算步骤:

1)首先初始化,给各连接权{Wij}、{Vjt}及前置值{Qj}、{Rt},并赋予(-1,+1)间的随机值。

2)随机选取一模式对Ak=(a1k,a2k,…,ank),yk=(y1k,y2k,…,ynk)提供给网络,(k=1,2,…,m)。

3)用输入模式Ak=(a1k,a2k,…,ank),连接权{Wij}和前置值{Qj}计算中间层各单元的输入sj;然后用{sj}通过Sigmoid函数f(sj)计算中间层各单元的输出{bj}。

中国地质灾害区域预警方法与应用

图5.19 BP神经网络结构示意图

4)用中间层的输出{bj},连接权{Vjt}和前置值{Rt}计算输出层各单元的输入{Lt},然后用{Lt}通过Sigmoid函数计算输出层各单元的响应{Ct}:

中国地质灾害区域预警方法与应用

5)用希望输出模式yk=(y1k,y2k,…,ynk),网络实际输出层各单元的一般误差{dt}:

中国地质灾害区域预警方法与应用

6)用连接权{Vjt}、输出层一般化误差{dt}、中间层输出{bj}计算中间层单元的一般化误差{ej}:

中国地质灾害区域预警方法与应用

7)用输出层各单元的一般化误差{dt}、中间层各单元的输出{bj}修正连接权{Vjt}和前置值{Rt}:

中国地质灾害区域预警方法与应用

8)用中间层各单元的一般化误差{ej}、输入层各单元的输入Ak=(a1k,a2k,…,ank)修正连接权{Wij}和前置值{Qj}:

中国地质灾害区域预警方法与应用

9)随机选取下一个学习模式对提供给网络,返回到步骤3,直到m个模式对训练完毕。最后使网络全局误差函数E小于预先设定的一个极小值ε。

中国地质灾害区域预警方法与应用

误差反向传播算法是基于误差修正学习规则的。误差反向传播学习由两次经过网络不同层的通过组成:一次前向通过和一次反向通过。在前向通过中,一个活动模式(输入向量)作用于网络感知节点,它的影响经过网络一层接一层传播。最后,产生一个输出作为网络的实际响应。在前向通过中网络突触权值是固定的,而在反向通过中,突触权值全部根据网络误差修正规则来调整。网络误差为目标期望响应减去网络实际响应。当突触权值被调整到从统计意义上实际响应接近目标期望响应时,网络已经训练成功。用训练好的网络就能够预测未知的目标响应。

综合上述,有监督学习的神经网络应用于模式识别问题中,主要包括两个阶段,即网络训练阶段和工作阶段。网络训练阶段主要任务是调整网络权值减小网络的误差;网络工作阶段,将网络调整好的权值固定不变,对实验数据或者实际数据进行预测识别,达到分类预报目的。

温馨提示:答案为网友推荐,仅供参考