(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111517944.2
(22)申请日 2021.12.13
(71)申请人 北京交通大 学
地址 100044 北京市海淀区上园村 3号
(72)发明人 鲍鹏 闫荣
(74)专利代理 机构 北京卫平智业专利代理事务
所(普通合伙) 11392
代理人 闫萍
(51)Int.Cl.
G06N 20/00(2019.01)
G06F 16/901(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于基序粗化的图表示学习方法
(57)摘要
本发明涉及一种基于基序粗化的图表示学
习方法, 包括: 对原始图进行预处理, 统计各个基
序的数量, 选择该数据中频繁出现的一种或多种
基序模式组成基序集合; 利用基序集合进行矩阵
运算, 将原始图转化为基序粗化图; 利用图编码
器对原始图和基序粗化图进行编码, 得到节点表
示和基序表 示; 利用权重重分配策略将基序粗化
图中的基序表示转化为基于基序结构的节点表
示; 将节点表示和基于基序结构的节 点表示拼接
作为最终的节 点表示, 并将其应用到图模型类应
用场景中分类、 推荐、 预测等任务中。 本发明融合
了不同粒度的结构信息, 增强了传统节点表示方
法的性能; 具有良好的可解释性、 可验证性、 表征
性能和可迁移性, 具有重要的理论研究价值和应
用价值。
权利要求书2页 说明书6页 附图1页
CN 114386617 A
2022.04.22
CN 114386617 A
1.一种基于基序粗 化的图表示学习方法, 其特 征在于, 包括以下步骤:
S1、 对原始图进行预处理, 统计各个基序的数量, 选择原始图中频繁出现的一种或多种
基序模式组成基序集 合;
S2、 利用图粗化的方法聚合原始图中一种或多种固定模式的基序结构, 获得对应的基
序粗化图;
S3、 利用图编码器分别对原始图和基序粗化图的节点表示进行编码, 得到对应的节点
表示h′i和基序表示mi;
S4、 利用权重重分配策略, 计算基序粗化图中每个节点受各个基序影响的权重, 进而将
基序表示 转化为基于基序结构的节点表示h ″i;
S5、 将节点表示h ′i和基于基序结构的节点表示h ″i拼接作为最终的节点表示hi={h1,
h2,...,hn}。
2.如权利要求1所述的基于基序粗化的图表示学习方法, 其特征在于, 步骤S1的具体步
骤为: 给定原始图G=(A,X), 对原始图进行预处理以便统计原始图G中各个基序的数量, 并
选择原始图中频繁出现的一种或多种基序模式组成基序集合
G(k)为基序
集合GM中的一张基序图, K代 表基序图的数量, k表示基序的序号。
3.如权利要求2所述的基于基序粗化的图表示学习方法, 其特征在于, 步骤S2的具体步
骤为: 给定原始图的邻接矩阵A和 特征矩阵X, 基序集合
定义如式(1)所示
的采样算子 C(k)和标识算子Γ(k),
其中, i,j是节点序 号, C(k)表示基序结构内部节点之间的连通情况, Γ(k)是由基序中的
节点所组成的列表; 若节点vi在节点vj的基序序列中, 则C(k)[i,j]值为1, 表明节点vi和节点
vj属于同一个 基序结构, 且二 者之间有连边;
利用采样算子C(k)和原始图的邻接矩阵A, 得到与原始图的邻接矩阵等维度的基序邻接
矩阵A(k), 如式(2)所示,
A(k)=(C(k))TAC(k) (2)
对基序邻接矩阵A(k)进行异或操作, 将基序集合中不同规模的基序结构内部的连通情
况映射到原 始图的邻接矩阵中, 如式(3)所示,
计算原始图的邻接矩阵A与基序内部邻接矩阵Aint之间的差值, 得到原始图中各个基序
之间的连通情况, Aext=A‑Aint;
为了得到基序粗化图的邻接矩阵, 定义基序分配矩阵M, 若节点vi属于给定的基序节点
列表Γ(j), 则M[i,j]值 为1, 若当前节点 不属于任何基序结构, 则M[i,j]值 为0;
分别计算基序 粗化图中各个基序之间的粗化邻接矩阵Ae‑coar和基序内部的粗化邻接矩
阵Ai‑coar, 如式(4)所示,权 利 要 求 书 1/2 页
2
CN 114386617 A
2基序粗化图的邻接矩阵为Acoar=Ai‑coar+Ae‑coar;
对于每个基序图G(k), 其对应的拉普拉斯矩阵定义为L(k), 拉普拉斯特征向量为
其中, nk为基序图G(k)的节点数量; 对拉普拉斯特征 向量进行上采样得
到单个基序图的特 征向量
K个基序图的特 征集合为
那么, 基序图G(l)的特征矩阵为
基序
粗化图的特 征如式(5)所示,
Xcoar=[X0,X1,...,XH] (5)。
4.如权利要求3所述的基于基序粗化的图表示学习方法, 其特征在于, 步骤S3中, 节点
表示h′i和基序表示mi如式(6)所示:
其中,
IN为单位矩阵,
为原始图的邻接矩阵A的度矩阵,
等于
基序粗化图的邻接矩阵Acoar加上单位矩阵,
为
的度矩阵; σ 为激活函数, 能够确保
每个神经元的输出在合理阈值内。
5.如权利要求4所述的基于基序粗化的图表示学习方法, 其特征在于, 步骤S4的具体步
骤为: 定义权重重分配策略, 计算基序粗化图中每个节点基于基序结构的节点表示h ″i; 所
述权重重分配策略如式(7)所示, 权重矩阵W记录了各个节点属于某个基序结构的概率, 表
示不同模式的基序对 该节点的影响力, 权重矩阵W分为基序内部的权重Wi‑coar和基序之间的
权重We‑coar,
W=Wi‑coar+We‑coar (7)
其中, aij为原始图的邻接矩阵A中具体的值;
基于基序结构的节点表示如式(8)所示,
其中, ωij为权重矩阵W中具体的值,
表示包含节点vj的基序图的数量。权 利 要 求 书 2/2 页
3
CN 114386617 A
3
专利 一种基于基序粗化的图表示学习方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 23:13:52上传分享