(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211382679.6
(22)申请日 2022.11.07
(71)申请人 南京众智维信息科技有限公司
地址 211300 江苏省南京市高淳区龙井路3
号
(72)发明人 车洵 孙捷 胡牧 程佳 孙瀚墨
(74)专利代理 机构 南京知识律师事务所 32 207
专利代理师 张苏沛
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/35(2019.01)
G06F 40/30(2020.01)
(54)发明名称
基于知识图谱复合嵌入的网络安全事件溯
源剧本生成方法
(57)摘要
本发明公开了一种基于知识图谱复合嵌入
的网络安全事件溯源剧本生 成方法, 包括以下步
骤: S1: 通过引入文本语料库对实体关系进行扩
展, 用于丰富实体关系, 扩充知识图谱; S2: 提取
知识图谱中的公共特征, 使用公共提取层提取出
全部输入的公共特征; S3: 提取知识图谱中的关
系特征, 对于不同的嵌入关系使用相应的关系提
取层; S4: 将公共特征和关系特征投影到嵌入空
间, 对知识图谱进行补全; S5: 对步骤S4得到的知
识图谱进行排序, 通过对应模块获取POS令牌嵌
入和语义上下文得分, 词复制概率预测模块通过
获取的POS令牌嵌入和语义上下文得分生成 网络
安全溯源剧本; 本方法构建的网络安全事件溯源
剧本具有极高的适用性与准确性。
权利要求书5页 说明书14页 附图1页
CN 115422376 A
2022.12.02
CN 115422376 A
1.一种基于知识图谱复合嵌入的网络安全事件溯源剧本生成方法, 其特征在于, 包括
以下步骤:
S1: 通过引入文本语料库对实体关系进行扩展, 用于 丰富实体关系, 扩充知识图谱;
S2: 提取知识图谱中的公共特 征, 使用公共提取层提取 出全部输入的公共特 征;
S3: 提取知识图谱中的关系特 征, 对于不同的嵌入关系使用相应的关系提取层;
S4: 将公共特 征和关系特 征投影到嵌入空间, 对知识图谱进行补全;
S5: 对步骤S4得到的知识图谱进行排序, 通过对应模块获取P OS令牌嵌入和语义上下文
得分, 词复制概率预测模块通过获取 的POS令牌嵌入和 语义上下文得分生成网络安全溯源
剧本。
2.根据权利要求1所述的方法, 其特 征在于, 所述S1步骤 包括以下步骤:
给定一个未提及实体对
, 对从文本语料库中提取的带有提及实体对 的LDP进
行排名, 对主 体向量
、 客体向量
学习由
参数化的实体对的编码器
, 通过编码器
将
实体对
编码为
; 其中编码器
的输入为:
其中,
表示向量的串联,
表示两个 向量按元素相乘,
表示主体 向量
减去客体向量
;
对于连接
和
的LDP集合
, 使用预训练的句子编码器 SBERT通过向量
来表示
;
使得和实体对
共现的LDP与
相似, 使用与
和
都相关联的LDP作为
正训练实例
, 与单独的
或
相关联的 LDP 被用作负训练实例
,
表达式为:
其中
和
分别表示不等于t和h的客体向量与主体向量,
表示负训练实例的关系,
表示主体向量和客体向量 集合;
通过最小化
和
的边际损失来学习
的参数, 表达式为:
权 利 要 求 书 1/5 页
2
CN 115422376 A
2其中,
表示边际, 使用最小化上式得到的
来计算
, 然后使用内积
对每个
进行评分, 选 择与
内积得分最高的前k个LDP
来扩充知识图谱, 其中k 为超参数。
3.根据权利要求2所述的方法, 其特 征在于, 所述S2步骤 包括以下步骤:
在进行知识图谱扩充后, 设
, 其中
表示主体向量、
表示客体向
量,
表示关系向量, 连接主体向量和关系向量, 表达式为:
其中,
, 而
表示向量a和 b的向量连接, 连接后的嵌入向量表示
所有后续层的输入;
通过公共密集层提取向量的共 同特征, 公共密集层的宽度为密集层的过滤器数量, 其
中每个过滤器包含的内核大小等于 输入嵌入的内核大小;
在公共密集层中, 将仿射 函数
应用于给 出的输入嵌入, 公共密集层的表达式为:
其中,
、
, 公共密集层的宽度由
给出,
表示
的倍数, 其中n 为超参数;
通过将非线性激活函数
应用于
获得共同特 征提取的输出。
4.根据权利要求3所述的方法, 其特 征在于, 所述S3步骤 包括以下步骤:
对于关系 r, 编码函数由
表示, 使用关系密集层进行关系感知特征提取, 编码函数
是仿射函数, 表达式为:
其中,
、
, 而
表示
的输出长度;
将
应用于输入嵌入
, 然后应用非线性激活函数
, 关系密集
层面对不同关系会有不同的编码器, 用于提取关系特 征。
5.根据权利要求 4所述的方法, 其特 征在于, 所述S4 步骤包括以下步骤:
在从关系密集层和公共密集层获得潜在 向量后, 将这些向量连接起来, 连接过的向量
通过投影矩阵, 投影到嵌入空间, 表达式为:
权 利 要 求 书 2/5 页
3
CN 115422376 A
3
专利 基于知识图谱复合嵌入的网络安全事件溯源剧本生成方法
安全报告 >
其他 >
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-03-03 20:13:35上传分享