(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211546988.2
(22)申请日 2022.12.05
(71)申请人 中国医学 科学院医学信息 研究所
地址 100020 北京市朝阳区雅宝路3号
(72)发明人 孙海霞 钱庆 郝洁 李姣 沈柳
郭臻
(74)专利代理 机构 北京睿智保诚专利代理事务
所(普通合伙) 11732
专利代理师 韩迎之
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/34(2019.01)
G06F 16/35(2019.01)
G06F 40/30(2020.01)
G06F 40/284(2020.01)
(54)发明名称
一种医学量表语义关联网络构建方法及系
统
(57)摘要
本发明公开了一种医学量表语义关联网络
构建方法及系统, 涉及大数据资源共享服务技术
领域。 包括以下步骤: 定义医学量表内容框架, 并
将实例文档映射到医学量表内容框架中, 得到初
始医学量表; 提取初始医学量表中的文本, 生成
测量概念集合; 利用医学量表领域、 维度项语义
对应的测量概念集合计算领域、 维度项的第一语
义关联标签赋值; 提取医学量表条目、 问题标签
的文本取值, 计算同类内容的第二语义关联标签
赋值; 结合第一语义关联标签赋值、 第二语义关
联标签赋值, 进行相关关联推导, 获得第三语义
关联标签赋值; 根据第一、 二、 三语义关联标签赋
值结果, 完成量表语义关联网络可视化。 本发明
提高了医学量表资源知识服务效率和智能化水
平。
权利要求书2页 说明书7页 附图2页
CN 115544278 A
2022.12.30
CN 115544278 A
1.一种医学量表语义关联网络构建方法, 其特 征在于, 包括以下步骤:
获取医学量表参数, 基于医学量表参数定义医学量表内容框架, 并将实例文档映射到
医学量表内容框架中, 得到初始医学量表;
提取初始医学量表中的文本, 生成测量 概念集合;
利用医学量表领域、 维度项语义对应的测量概念集合计算领域、 维度项的第一语义关
联标签赋值;
提取医学量表条目、 问题标签的文本取值, 计算同类内容的第二语义关联 标签赋值;
结合第一语义关联标签赋值、 第 二语义关联标签赋值, 进行相关关联推导, 获得第三语
义关联标签赋值;
根据第一语义关联标签赋值结果、 第二语义关联标签赋值结果、 第三语义关联标签赋
值结果, 完成量表语义关联网络可视化。
2.根据权利要求1所述的一种医学量表语义关联网络构建方法, 其特征在于, 定义医学
量表内容包括: 内容标签、 内容标签的属性、 内容标签间的关系 、 形成标准 量表内容标签库。
3.根据权利要求1所述的一种医学量表语义关联网络构建方法, 其特征在于, 将实例文
档映射到医学量表内容框架中, 具体包括:
逐行扫描实例文档数据, 采用基于规则的方法提取量表 原始内容结构标签;
通过Jaccard相似系数字符串匹配算法计算原始内容结构标签与标准标签的相似度,
将大于阈值的标准标签通过表单 方式推荐给用户;
用户通过表单进行确认或者修改, 如果没有语义相同的标准标签, 在标准量表内容标
签库中新增标准标签。
4.根据权利要求1所述的一种医学量表语义关联网络构建方法, 其特征在于, 生成测量
概念集合具体为: 提取医学量表的领域标签和维度标签对应的文本, 运用领域文本分词算
法对提取的原始文本进 行分词, 分词结果即为量表自由词汇; 通过术语标准化算法, 将自由
词汇映射至指定医学术语系统中的概念; 对映射获得的概念进行去重, 形成测量 概念集合。
5.根据权利要求1所述的一种医学量表语义关联网络构建方法, 其特征在于, 利用医学
量表领域、 维度项语义对应的测量概念集合计算领域、 维度项的第一语义关联标签赋值, 具
体包括:
对于任意两个领域或维度项a和b, 获得自由词汇集合分别为Ta和Tb, 测量概念集合分别
为概念集合Ca和概念集 合Cb, 语义关联计算方法如下:
若概念集 合Ca和概念集 合Cb中都不为空, 则执 行下述步骤:
通过字符串精确匹配算法判断概念集合Ca和概念集合Cb是否有相同测量概念: 如果没
有, 进入下一步; 如果有, 进一步判断是否完全相同, 完全相同时, a和b的语义关联标签赋值
“等同测量 概念”, 否则赋值 “有相同测量 概念”;
判断概念集合Ca和概念集合Cb中是否有测量概念在指定医学术语系统中处于同一层级
关系路径中, 且路径长度小于指定阈值; 如果有, 则a和b的语义关联标签赋值 “广义相关 ”;
否则进入下一 步;
运用字符串匹配算法计算概念集合Ca和概念集合Cb中测量概念所有术语对的相似度;
如果任一 术语对相似度大于指定阈值, 则a和b的语义关联 标签赋值“相似测量 概念”。
6.根据权利要求5所述的一种医学量表语义关联网络构建方法, 其特征在于, 若概念集权 利 要 求 书 1/2 页
2
CN 115544278 A
2合Ca和概念集合Cb中都为空, 则执行下述步骤: 将Ta和Tb转化为词向量空间, 通过余弦向量
空间计算Ta和Tb的相似度; 如果相似度 大于指定 阈值, 则a和b的语义关联标签赋值 “相似测
量概念”。
7.根据权利要求1所述的一种医学量表语义关联网络构建方法, 其特征在于, 结合第 一
语义关联标签赋值、 第二语义关联标签赋值, 进 行相关关联推导, 获得第三语义关联标签赋
值, 具体规则如下:
如果两个问题项之间的语义关联标签取值 “相同”或“相似”, 则其对应的条目项和维度
项之间的语义关联 标签取值“问题相关 ”;
如果两个条目项之间的语义关联标签取值 “相同”或“相似”, 则其对应的维度项之间的
语义关联 标签取值“条目相关 ”;
如果两个维度项或领域项之间的语义关联标签取值 “等同测量概念 ”或“有相同测量概
念”, 则其组成的条目项、 问题项之间的语义关联 标签取值“测量概念相关 ”。
8.一种医学量表语义关联网络构建系统, 其特征在于, 包括量表文档获取模块, 量表结
构标签定义模块, 量表内容结构映射模块, 量表 量测概念标注模块, 量表语义关联分类计算
模块, 量表语义关联网络可视化模块;
其中, 量表文档获取模块, 用于获取实例文档;
量表结构标签定义模块, 用于 定义医学量表内容框架;
量表内容结构映射模块, 用于将实例文档映射到医学量表内容框架中, 得到初始医学
量表;
量表量测概念标注模块, 用于提取初始医学量表中的文本, 生成测量 概念集合;
量表语义关联分类计算模块, 用于利用医学量表领域、 维度项语义对应的测量概念集
合计算领域、 维度项的第一语义关联标签赋值; 提取医学量表条目、 问题标签的文本取值,
计算同类内容的第二语义关联标签赋值; 结合第一语义关联标签赋值、 第二语义关联标签
赋值, 进行相关 关联推导, 获得第三语义关联 标签赋值;
量表语义关联网络可视化模块, 用于根据第一语义关联标签赋值结果、 第二语义关联
标签赋值结果、 第三语义关联 标签赋值结果, 完成量表语义关联网络可视化。权 利 要 求 书 2/2 页
3
CN 115544278 A
3
专利 一种医学量表语义关联网络构建方法及系统
安全报告 >
其他 >
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-03-03 20:13:35上传分享