(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211216100.9 (22)申请日 2022.09.30 (71)申请人 上海浦东发展银行股份有限公司 地址 200002 上海市黄浦区中山 东一路12 号 (72)发明人 倪佳乐 陈嘉 孙良平 李侠飞  (74)专利代理 机构 上海科盛知识产权代理有限 公司 312 25 专利代理师 廖程 (51)Int.Cl. G06Q 40/02(2012.01) G06F 16/215(2019.01) G06F 16/22(2019.01) G06F 21/62(2013.01) G06F 16/33(2019.01) (54)发明名称 一种基于业务数据构造的测试数据管控方 法 (57)摘要 本发明涉及一种基于业务数据构造的测试 数据管控方法, 包括: 建立业务基础数据结构模 型; 建立业务基础测试数据链路模型; 根据测试 数据造数服务, 生成原生测试数据; 基于原生测 试数据, 设置关键字段识别敏感信息; 非原生测 试数据申报及申报审核; 实际测试数据申请管 控, 对实际测试数据依次进行敏感信息识别、 原 生校验和非原生校验, 确定出校验通过测试数据 以及校验不通过测试数据; 基于业务基础测试数 据链路模型, 对 校验不通过测试数据进行全链路 追溯及销 毁。 与现有技术相比, 本发明能够主动 准确识别涉敏测试数据, 并对涉敏测试数据链路 进行追溯、 处理, 以提高业务测试数据的持久化 和可用性。 权利要求书2页 说明书7页 附图2页 CN 115545891 A 2022.12.30 CN 115545891 A 1.一种基于业 务数据构造的测试 数据管控方法, 其特 征在于, 包括以下步骤: S1、 建立业务基础数据结构模型; S2、 建立业务基础测试 数据链路模型; S3、 根据测试 数据造数服 务, 生成原生测试 数据; S4、 基于原生测试 数据, 设置关键 字段识别敏感信息; S5、 非原生测试 数据申报及申报 审核; S6、 实际测试数据申请管控, 对实际测试数据依次进行敏感信息识别、 原生校验和非原 生校验, 确定出 校验通过测试 数据以及校验不 通过测试 数据; S7、 基于业 务基础测试 数据链路模型, 对校验不 通过测试 数据进行全链路追溯及销毁。 2.根据权利要求1所述的一种基于业务数据构造的测试数据 管控方法, 其特征在于, 所 述步骤S1 中业务基础数据结构模型具体是围绕客户层、 账户层、 卡片层三层关系为主 结构, 其中, 客户层涉及客户维度的基础信息, 包括客户姓名、 证件号码、 手机号、 风险征信、 家庭 住址、 职业信息; 账户层涉及账户信息, 包括账户类别、 账户号、 账户层额度、 账 单日; 卡片层涉及客户具体卡介质信息, 与账户存在从属关系, 包括卡产品、 卡号、 有效期、 安 全码、 磁道。 3.根据权利要求1所述的一种基于业务数据构造的测试数据 管控方法, 其特征在于, 所 述步骤S2中业务基础测试数据链路模型的数据流向具体为: 渠道>进件>审批>核卡>激活> 用卡>获贷 >贷后>大数据, 其中, 渠道包括线 上渠道和线 下渠道, 用于获取业务基础客户数 据信息; 进件用于进行获客至预审之间的预筛处 理以及进行路由分流; 审批用于调用外部征信及风险控制策略, 结合设置的审批节点及路由规则, 完成审批 处理; 核卡用于对客户提供的相关 资料进行审核; 大数据用于根据历史查询、 监管报送以及数据分析需要, 以将相关数据表传输至大数 据系统。 4.根据权利要求1所述的一种基于业务数据构造的测试数据 管控方法, 其特征在于, 所 述步骤S3具体是通过包装API的方式进行业务基础测试数据申请及维护, 针对相关入参出 参进行格式化包 装; 针对关键字段, 采用 “随机生成身份证号码、 设置固定测试标识字段、 指定测试环境卡 号池卡号”的方式, 以避免敏感数据进入测试环境, 并将关键 字段信息记录 于数据库内。 5.根据权利要求2所述的一种基于业务数据构造的测试数据 管控方法, 其特征在于, 所 述步骤S4具体是对业 务基础测试 数据结构模型中的关键敏感字段信息进行识别及标记。 6.根据权利要求3所述的一种基于业务数据构造的测试数据 管控方法, 其特征在于, 所 述步骤S5中非原生测试 数据包括 三类: 第1类、 测试 数据服务原生数据, 因测试需要 进行修改, 且非敏感数据; 第2类、 因特殊原因未通过测试 数据服务制作的测试 数据, 且非敏感数据; 第3类、 因特殊原因必须使用非外 部客户的所属项目员工信息 。 7.根据权利要求1所述的一种基于业务数据构造的测试数据 管控方法, 其特征在于, 所权 利 要 求 书 1/2 页 2 CN 115545891 A 2述步骤S6具体包括以下步骤: S61、 实际测试数据申请管控, 判断当前 申请字段是否命中设置的关键字段识别敏感信 息, 若判断为是, 则执 行步骤S62, 否则结束当前 过程; S62、 判断当前申请字段是否为造数服务提供的原生测试数据, 若判断为是, 则表明命 中白名单、 提交测试 数据申请, 否则执 行步骤S6 3; S63、 判断当前申请字段是否为非原生测试数据、 且非敏感数据, 经过报备审核范围, 若 判断为是, 则表明命中白名单、 提交测试数据申请, 否则结束当前过程、 不予提交测试数据 申请。 8.根据权利要求7所述的一种基于业务数据构造的测试数据 管控方法, 其特征在于, 所 述步骤S62和S63具体是采用精确识别和模糊识别两种模式进 行校验判断, 当精确识别判断 均未通过 校验时, 则触发模糊识别。 9.根据权利要求8所述的一种基于业务数据构造的测试数据 管控方法, 其特征在于, 所 述精确识别的具体过程 为: 第一步, 通过基于数据生成规则的方式进行识别, 如果匹配命中规则, 则判定为测试数 据; 第二步, 通过hash算法对多种测试数据组合进行识别, 在生成测试数据时, 将测试数据 组合成文本后, 通过hash算法生成hash  code作为数据组合标识key存储在测试数据库中; 在识别过程中, 计算目标数据组合的hash  code, 然后扫描测试数据库, 如果命中, 则判定为 测试数据; 所述模糊识别具体是采用Word  Embeddin g算法构建测试数据文本特征向量, 通过训练 word2vec的AI模型进行识别, 其中, 训练w ord2vec的AI模型的过程 为: 第一步, 对测试数据集进行文本分句处理, 然后通过Jieba分词工具切词, 并且去掉停 用词; 第二步, 将处理后的测试数据集作为word2vec模型的训练集进行训练, 其结果是将数 据集中的词数据映射成词向量, 该向量中包 含了上下文信息; 第三步, 将训练后的word2vec模型用于计算目标数据与预期数据的相似度, 相似度越 高, 则为测试 数据的概 率越高; 第四步, 将训练后的w ord2vec模型用于查找和筛 选高风险的测试 数据。 10.根据权利要求6所述的一种基于业务数据构造的测试数据管控方法, 其特征在于, 所述步骤S7具体是针对步骤S 5中第3类非原 生测试数据, 在明确使用完毕后, 基于业务基础 测试数据链路, 围绕以 “渠道>进件>审批>核卡>激活>用卡>获贷>贷后 ”为主数据流进行级 联删除相关测试 数据; 此外, 针对步骤S6确定出的校验不通过测试数据, 基于业务基础测试数据链路进行追 溯及销毁; 针对现有存量测试 数据进一 步进行智能识别及检查。权 利 要 求 书 2/2 页 3 CN 115545891 A 3

.PDF文档 专利 一种基于业务数据构造的测试数据管控方法

安全报告 > 其他 > 文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于业务数据构造的测试数据管控方法 第 1 页 专利 一种基于业务数据构造的测试数据管控方法 第 2 页 专利 一种基于业务数据构造的测试数据管控方法 第 3 页
下载文档到电脑,方便使用
本文档由 思考人生2024-03-03 20:13:28上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。