全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202111399651.9 (22)申请日 2021.11.24 (65)同一申请的已公布的文献号 申请公布号 CN 114093448 A (43)申请公布日 2022.02.25 (73)专利权人 首都医科 大学附属北京 天坛医院 地址 100070 北京市丰台区南四环西路1 19 号 (72)发明人 聂曦明 王龙 刘丽萍  (74)专利代理 机构 北京预立 生科知识产权代理 有限公司 1 1736 专利代理师 李红伟 孟祥斌 (51)Int.Cl. G16H 10/60(2018.01) G16H 50/50(2018.01)G06N 20/00(2019.01) G06K 9/62(2022.01) (56)对比文件 CN 112786204 A,2021.0 5.11 US 20193 54814 A1,2019.1 1.21 US 2021327540 A1,2021.10.21 CN 108509982 A,2018.09.07 CN 110825819 A,2020.02.21 CN 113380413 A,2021.09.10 李琳等.基 于临床数据集的缺失值处 理方法 比较. 《中国数字医学》 .2018,(第04期),全 文. 曾一婕 等.基 于Jaya-DA算法的太阳电池 模 型参数辨识. 《太阳能学报》 .202 2,第43卷(第2 期),第198-201页. 审查员 郭彬瑜 (54)发明名称 一种疾病风险预测模型的构建方法 (57)摘要 本发明涉及一种疾病风险预测模型的构建 方法。 本发 明提供一种新的疾病风险预测模型的 构建方法, 利用机器学习来进行数据缺失值填 补, 并对疾病预测模型参数进行有效优化, 从而 构建形成适用于临床的疾病风险预测模型。 针对 目前人工智能在医学数据处理中存在的预测结 果不可靠的问题, 本发明提供了一种新的模型构 建方法, 具有重要的应用价 值。 权利要求书3页 说明书12页 附图3页 CN 114093448 B 2022.07.01 CN 114093448 B 1.一种疾病风险预测模型的构建方法, 包括: 获取训练样本集, 其中, 每 个样本包括患者的临床数据及标签; 对所述临床数据进行预处理, 所述预处理包括对临床数据中存在的缺失值进行数据缺 失值处理, 所述数据缺失值处 理是采用机器学习算法进行填补; 将上述预处理后的临床数据输入分类器中, 得到预测的分类结果, 将所述预测的分类 结果与实际结果进 行比对, 根据对比结果优化分类器, 得到疾病风险预测模型; 所述优化分 类器包括对分类器的参数进行调优; 所述对分类器的参数进行调优为采用Jaya ‑DA算法对 分类器的参数进行调优, 包括: 首先使用Jaya算法进行全局 搜索, 计算得出初步的最优解; 然后将初步的最优解作为初始解带入蜻蜓算法进行局部搜索, 更新最优解; 所述使用Jaya 算法进行全局搜索, 计算得出初步的最优解, 包括: 依据参数的上界和下界进行随机生成, 计算初步的参数最优解和最差解, 迭代更新初步的最优解和最差解, 使 得目标函数最小化; 所述将初步的最优解作为初始 解带入蜻蜓算法进 行局部搜索, 更新最优解, 包括: 将迭代更 新后的初步的最优解带入蜻蜓算法进 行局部搜索, 蜻蜓算法依据静态和 动态的群体行为进 行探索和开发, 更新 最优解。 2.根据权利要求1所述的疾病风险预测模型的构建方法, 其特征在于, 所述采用机器学 习算法进 行填补将根据数据类型不同采用不同的机器学习算法进 行填补: 所述数据为连续 值时, 采用回归算法进行填补, 所述数据为离 散值时, 采用分类算法进行填补。 3.根据权利要求2所述的疾病风险预测模型的构建方法, 其特征在于, 所述 回归算法包 括SVR、 LinearSVR、 RF R、 BayRid、 GBM中的一种或 几种; 所述 分类算法包括kNN、 LR、 RF、 DecT中 的一种或几种。 4.根据权利要求1所述的疾病风险预测模型的构建方法, 其特征在于, 所述预处理还包 括对临床数据中存在的数据类不平衡采用不同采样策略, 所述采样策略包括欠采样策略和 过采样策略。 5.根据权利要求1所述的疾病风险预测模型的构建方法, 其特征在于, 所述预处理还包 括对临床数据中存在的异常值进行剔除处 理。 6.根据权利要求1所述的疾病风 险预测模型的构建方法, 其特征在于, 所述Jaya ‑DA算 法具体步骤 包括: 第1步: 依据参数的上界和下界进行随机生成; 第2步: 计算初步的最优解和最差解; 第3步: 使用式(3)迭代更新初步的最优解和最差解; 式中A(i,j,k)— —第i次迭代中, 第k个候选解的第j个 变量; r1——[0,1]范围内的随机数; r2——[0,1]范围内的随机数; A(i,j,b)— —当前的最优解; A(i,j,w)— —当前的最差解; A(i+1,j,k)— —更新的解;权 利 要 求 书 1/3 页 2 CN 114093448 B 2第4步: 判断是否达到预设迭代次数, 若没有达到迭代次数则回到第2步, 若满足则进行 第5步; 第5步: 将第4 步的结果, 作为初值并初始化 步长、 w、 s、 a、 c、 f和e; s——分离权重; c——凝聚权 重; f——猎物权 重; e——天敌权 重因子; w——惯性权 重; a——对齐权 重; 第6步: 计算所有蜻蜓的目标值; 第7步: 更新 最优解和最差解; 第8步: 分别使用式(4)、 式(5)、 式(6)、 式(7)、 式(8)计算Si、 Ai、 Ci、 Fi和Ei; 式中N——附近个 体数; X——个体当前位置; Xj——第j个附近个 体位置; 式中Vj——第j个附近个 体速度; Fi=X+‑X                                    式(7) 式中X+——食物的位置; X——个体当前位置; Ei=X‑+X                                     式(8) 式中X‑——食物的位置; X——个体当前位置 第9步: 如果蜻蜓至少有一个相邻的个体, 则使用式(9)更新个体速度并使用式(10)更 新位置向量, 若没有相邻个 体则使用式(1 1)更新位置; ΔXt+1=(sSi+aAi+cCi+fFi+eEi)+wΔXt             式(9) 式中s——分离权重; c——凝聚权 重; f——猎物权 重; e——天敌权 重因子; w——惯性权 重; a——对齐权 重; t——当前迭代次数;权 利 要 求 书 2/3 页 3 CN 114093448 B 3

.PDF文档 专利 一种疾病风险预测模型的构建方法

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种疾病风险预测模型的构建方法 第 1 页 专利 一种疾病风险预测模型的构建方法 第 2 页 专利 一种疾病风险预测模型的构建方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 01:20:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。