全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111483212.6 (22)申请日 2021.12.07 (71)申请人 成都理工大 学 地址 610000 四川省成 都市二仙桥 东三路1 号 (72)发明人 王健  (74)专利代理 机构 成都四合天行知识产权代理 有限公司 51274 代理人 郭受刚 (51)Int.Cl. G06Q 10/04(2012.01) G06N 5/00(2006.01) G06K 9/62(2022.01) G06F 17/18(2006.01) G06F 17/12(2006.01) (54)发明名称 基于地统计加权随机森林的地球化学变量 空间预测方法 (57)摘要 本发明公开了一种基于地统计加权随机森 林的地球化学变量空间预测方法, 包括以下步 骤: S1、 获取训练随机森林模型所需的训练数据, 训练数据包括输入变量和模型输出变量, 输入变 量包括地质要素和遥感要素, 模 型输出变量为已 知地球化学元素含量观测数据; S2、 根据输入变 量与已知地球化学元素含量观测数据之间的相 关系数及输入变量之间的相关性筛选输入变量 作为预测因子, 将已知地球化学元素含量观测数 据与预测 因子作为训练样本; S3、 基于训练样本 训练随机森 林模型, 并采用训练好的随机森 林模 型对待预测位置的地球化学元素含量进行预测。 本发明应用时同时考虑地学现象的空间相关性 和异质性, 能提升预测精度。 权利要求书3页 说明书9页 附图2页 CN 114139819 A 2022.03.04 CN 114139819 A 1.基于地统计加权随机森林的地球化学变量空间预测方法, 其特征在于, 包括以下步 骤: S1、 获取训练随机森林模型所需的训练数据, 所述训练数据包括输入变量和模型输出 变量, 输入变量包括地质要素和遥感要素, 地质要素包括从区域地质数据提取 的岩性类别 数据和从区域地质数据提取的线环构 造矢量数据转换的断裂密度, 遥感要 素包括地形坡度 和植被覆盖度, 模型输出变量为已知地球化学元素含量观测数据; 其中, 输入变量和输出变 量采用栅格 格式存储; S2、 根据输入变量与已知地球化学元素含量观测数据之间的相关系数及输入变量之间 的相关性筛选输入变量作为预测因子, 将已知地球化学元素含量观测数据与预测因子作为 训练样本; S3、 基于训练样本训练随机森林模型, 并采用训练好的随机森林模型对待预测位置的 地球化学 元素含量进行 预测。 2.根据权利要求1所述的基于地统计加权随机森林的地球化学变量空间预测方法, 其 特征在于, 所述 步骤S1中将线环构造 矢量数据转换为断裂密度的转换公式为: 其中, i表示栅格的行, j表示栅格的列, ρij为第i行第j列栅格的断裂密度, Lij为对应栅 格内线性断裂和环形断裂的总长度, S为 栅格的面积; 所述步骤S1中岩性类别数据为将区域 地质数据中的岩性分布数据转换的类别变量, 即 cij∈{Ck, k=1, 2,…n} 其中, n为岩性类别总数, Ck表示n种岩性类别中的第k种岩性, cij代表栅格位置(i, j)处 的岩性类别。 3.根据权利要求1所述的基于地统计加权随机森林的地球化学变量空间预测方法, 其 特征在于, 所述步骤S1还包括对遥感数据进行辐射校正处理, 并利用以下公式计算归一化 植被指数: 其中, i表示栅格的行, j表示栅格的列, NDVIij为栅格位置(i, j)处的植被指数, 为 近红外波段处的反射 率, 为红光波段处的反射 率。 4.根据权利要求1所述的基于地统计加权随机森林的地球化学变量空间预测方法, 其 特征在于, 所述 步骤S1还 包括以下已知地球化学 元素含量观测数据处 理步骤: 迭代剔除位于区间[ μm‑3σm, μm+3σm]之外的已知观测值, 其中, μm为第m个元素的均值, σm 为迭代过程中第m个元 素的标准差; 对低于检测限的观测值用相应元 素检测限的一半代替; 对缺失值用对应元 素的均值补全; 采用中心对数比变换法对已知多元地球化学元素含量观测数据进行处理, 处理公式如 下:权 利 要 求 书 1/3 页 2 CN 114139819 A 2其中, xm和zm分别代表第m个元 素变换前后的值, D代 表元素个数。 5.根据权利要求1所述的基于地统计加权随机森林的地球化学变量空间预测方法, 其 特征在于, 所述 步骤S1在获取训练随机森林模型 所需的训练数据后还 包括以下步骤: 采用待预测区域掩膜文件 对栅格数据进行裁 剪, 并统一数据的坐标系。 6.根据权利要求1所述的基于地统计加权随机森林的地球化学变量空间预测方法, 其 特征在于, 所述步骤S2中根据输入变量与已知地球化学元素含量观测数据之间的相关系数 及输入变量之间的相关性筛 选输入变量包括以下步骤: 计算各个输入变量与已知地球化学元素含量观测数据之间的相关系数并剔除弱相关 性输入变量, 再计算各个输入变量之间的相关性, 任意两个输入变量之间相关性大于设定 阈值时保留其 一。 7.根据权利要求6所述的基于地统计加权随机森林的地球化学变量空间预测方法, 其 特征在于, 所述计算各个输入变量与已知地球化学元素含量观测数据之间的相关系 数、 计 算各个输入变量之间的相关性均包括以下步骤: 对于连续型数据, 计算Pearson相关系数, 对于离散型数据, 计算Spearman秩相关系数; 计算各个输入变量与已知地球化学元素含量观测数据之间的相关系数时若相关系数 绝对值|r| <0.3, 则剔除该属性特 征。 8.根据权利要求1所述的基于地统计加权随机森林的地球化学变量空间预测方法, 其 特征在于, 所述 步骤S3包括以下步骤: S31、 定义模拟栅格图层和滑动窗口半径序列, 以及确定随机森林模型中决策树的数目 和决策树节点划分时属性的数目; S32、 按照从左到右, 从上到下的顺序遍历栅格单元, 对于当前需预测地球化学元素含 量值的栅格位置, 利用紧凑度指数确定最佳滑动窗口半径; S33、 计算空间邻域观测点的空间权重: 提取最佳窗口内的训练样本, 通过全局变差函 数模型和克立格方程组求 解训练样本的权 重; S34、 训练地统计加权随机森林模型: 采用地统计加权的均方根误差函数作为改进的目 标函数, 训练随机森林回归 模型; S35、 预测地球化学元素含量未知点处的取值: 将待预测位置s处的预测因子值输入步 骤S34训练好的随机森林模型, 预测地球化学 元素含量值; S36、 重复步骤S32 ~步骤S3 5, 遍历结束即得完整的地球化学 元素含量空间分布图。 9.根据权利要求8所述的基于地统计加权随机森林的地球化学变量空间预测方法, 其 特征在于, 所述步骤S31 中定义滑动窗口半径序列为 ε1≤ ε2≤…εT, 滑动窗口采用方形窗口, 当窗口半径为 εt(1≤t≤T)时, 滑动窗口 的大小为(2 εt+1)×(2 εt+1); 所述步骤S32中利用紧凑度指数确定最佳滑动窗口半径包括以下步骤: 对于当前需预测地球化学元素含量值的栅格位置s, 计算滑动窗口半径为 εt时的紧凑度 指数, 紧凑度指数计算公式如下: 权 利 要 求 书 2/3 页 3 CN 114139819 A 3

.PDF文档 专利 基于地统计加权随机森林的地球化学变量空间预测方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于地统计加权随机森林的地球化学变量空间预测方法 第 1 页 专利 基于地统计加权随机森林的地球化学变量空间预测方法 第 2 页 专利 基于地统计加权随机森林的地球化学变量空间预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:43:42上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。