全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111539357.3 (22)申请日 2021.12.15 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 何子龙 黄珊珊 胡逸天  (74)专利代理 机构 上海汉之律师事务所 31378 代理人 周婷婷 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/216(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 企业关联关系识别方法、 装置、 设备及 介质 (57)摘要 本发明涉及数据处理领域, 提出一种企业关 联关系识别方法、 装置、 设备及介质, 该方法包 括: 获取多方监管体系所提供的待识别企业对应 的全量工商数据; 确定全量工商数据中实体关系 的关系三元 组, 根据图形数据库内关系三元组的 实体、 关系以及属性的概念构建知识图谱; 利用 股权穿透算法计算知识 图谱中各个企业所形成 节点的占股关系,根据各个企业之间占股关系计 算节点之间的控制系数; 根据控制系数识别知识 图谱中各个节 点, 并按照各个节 点之间的关系生 成企业及其 关联方之间的多条关联方真实路径; 根据外部监管规则处理各个企业节点生成关联 方规则路径, 按照关联方规则路径整合多条关联 方真实路径 生成的企业关联关系, 提高了识别的 准确度与效率。 权利要求书2页 说明书14页 附图5页 CN 114238655 A 2022.03.25 CN 114238655 A 1.一种企业关联关系识别方法, 其特 征在于, 所述方法包括: 获取多方监管体系所提供的待识别企业所对应的全量工商数据; 确定所述全量工商数据中实体关系的关系三元组, 根据图形数据库内所述关系三元组 的实体、 关系以及属性构建所述待识别企业的知识图谱; 利用股权穿透算法计算所述知识图谱中各个企业节点之间的占股关系,根据 各个所述 企业节点之间的占股关系确定各个企业节点之间的控制系数; 根据所述控制系数识别所述知识图谱中各个企业节点所属类型, 按照各个所述企业节 点所属类型生成企业及其关联 方之间的多条关联 方真实路径; 根据外部监管规则处理所述知识图谱中各个企业节点生成关联方规则路径, 按照所述 关联方规则路径整合多条 所述关联 方真实路径生成企业及其关联 方之间的企业关联关系。 2.如权利要求1所述的企业关联关系识别方法, 其特征在于, 所述确定所述全量工商数 据中实体关系的关系三元组, 根据图形数据库内所述关系三元组的实体、 关系以及属 性构 建所述待识别企业的知识图谱的步骤, 包括: 根据工商知识体系构建知识图谱数据, 利用知识图谱数据从下至上的概念构建初始数 据库; 根据初始数据库中的实体和关系转换得到图形数据库中的各实体关系三元组, 按照所 述实体关系三元组构建所述待识别企业的 的知识图谱。 3.如权利要求1所述的企业关联关系识别方法, 其特征在于, 所述利用股权穿透算法计 算所述知识图谱中各个企业节点之 间的占股关系,根据各个所述 企业节点之间的占股关系 确定各个企业节点之间的控制系数的步骤, 包括: 基于SparkGraphX 图计算架构处理知识图谱中关系三元组数据, 生成多节点分布式的 股权穿透计算引擎; 利用所述股权穿透计算引擎确定所述知识图谱中各个企业节点的占股关系; 在所述知识图谱中沿着控股关系的方向, 根据各个所述企业之间占股关系确定各个企 业所对应节点之间的控制系数。 4.如权利要求1 ‑3任一项的企业关联关系识别方法, 其特征在于, 所述根据所述控制系 数识别所述知识图谱中各个企业节点所属类型, 按照各个所述企业节点所属类型生成企业 及其关联 方之间的多条关联 方真实路径的步骤, 包括: 根据所述知识图谱中各个企业节点之间的控制系数确定各个企业节点所属类型, 该类 型至少包括子公司、 联 营公司与合营公司; 按照各个所述企业节点之间所属类型以及控股关系生成企业及其关联方之间的多条 关联方真实路径。 5.如权利要求1 ‑3任一项所述的企业关联关系识别方法, 其特征在于, 所述根据外部监 管规则处理所述知识图谱中各个企业节点生成关联方规则路径, 按照所述关联方规则路径 整合多条 所述关联 方真实路径生成企业及其关联 方之间的企业关联关系的步骤, 包括: 梳理外部监管体系的监管规则, 将其拆分多个最小且不重复的规则单 元; 根据规则单 元处理所述知识图谱中各个企业节点 生成相应的关联 方规则路径; 根据关联方规则路径整合多条关联方真实路径生成企业的及其关联方之间的企业关 联关系。权 利 要 求 书 1/2 页 2 CN 114238655 A 26.如权利要求1 ‑3所述的企业关联关系识别方法, 其特 征在于, 还 包括: 获取规则匹配样本与外部清单样本, 将两种样本数据以相互补充的方式进行融合, 得 到实体分类样本; 利用多种机器学习模型分别提取图拓扑特征、 词频 ‑逆文本频率指数特征、 预训练语义 特征, 根据所述全量工商数据的属性标签进行 特征选择得到实体分类特 征库; 结合所述实体分类样本与实体分类特 征库进行训练, 得到实体多分类模型; 通过实体多分类模型识别知识图谱中事业单位、 政府机构所对应的企业节点, 按照白 名单剔除实体所对应的企业节点以及所述关联 方中关联路径。 7.如权利要求1所述的企业关联关系识别方法, 其特征在于, 所述确定所述全量工商数 据中实体关系的关系三元组的步骤之前, 还 包括: 对全量工商数据中进行一次过 滤, 过滤掉特殊符号或表情符号得到一次过 滤数据; 对所述一次过滤数据进行 预处理, 得到预处 理后的全量工商数据信息; 对所述预处理后的全量工商数据信 息进行二 次过滤, 筛选掉异常工商数据信 息得到二 次过滤数据; 识别所述二 次过滤数据中的全量工商数据中的类别, 得到标识有类别信 息的全量工商 数据。 8.一种企业关联关系识别装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取多方监管体系所提供的待识别企业所对应全量工商数据; 知识图谱构建模块, 用于确定所述全量工商数据中实体关系的关系三元组, 根据图形 数据库内所述关系三元组的实体、 关系以及属性构建所述待识别企业的知识图谱; 控制系数计算模块, 利用股权穿透算法计算所述知识图谱中各个企业节点之间的占股 关系,根据各个所述企业节点之间的占股关系确定各个企业节点之间的控制系数; 真实路径生成模块, 用于根据 所述控制系数识别所述知识图谱中各个企业节点所属类 型, 按照各个所述企业节点所属类型生成企业及其关联 方之间的多条关联 方真实路径; 企业关联关系识别模块, 用于根据外部监管规则处理所述知识图谱中各个企业节点生 成关联方规则路径, 按照所述关联方规则路径整合多 条所述关联方真实路径生成企业及其 关联方之间的企业关联关系。 9.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至7任一项所述 的方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 114238655 A 3

.PDF文档 专利 企业关联关系识别方法、装置、设备及介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 企业关联关系识别方法、装置、设备及介质 第 1 页 专利 企业关联关系识别方法、装置、设备及介质 第 2 页 专利 企业关联关系识别方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:16:16上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。