(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211216100.9
(22)申请日 2022.09.30
(71)申请人 上海浦东发展银行股份有限公司
地址 200002 上海市黄浦区中山 东一路12
号
(72)发明人 倪佳乐 陈嘉 孙良平 李侠飞
(74)专利代理 机构 上海科盛知识产权代理有限
公司 312 25
专利代理师 廖程
(51)Int.Cl.
G06Q 40/02(2012.01)
G06F 16/215(2019.01)
G06F 16/22(2019.01)
G06F 21/62(2013.01)
G06F 16/33(2019.01)
(54)发明名称
一种基于业务数据构造的测试数据管控方
法
(57)摘要
本发明涉及一种基于业务数据构造的测试
数据管控方法, 包括: 建立业务基础数据结构模
型; 建立业务基础测试数据链路模型; 根据测试
数据造数服务, 生成原生测试数据; 基于原生测
试数据, 设置关键字段识别敏感信息; 非原生测
试数据申报及申报审核; 实际测试数据申请管
控, 对实际测试数据依次进行敏感信息识别、 原
生校验和非原生校验, 确定出校验通过测试数据
以及校验不通过测试数据; 基于业务基础测试数
据链路模型, 对 校验不通过测试数据进行全链路
追溯及销 毁。 与现有技术相比, 本发明能够主动
准确识别涉敏测试数据, 并对涉敏测试数据链路
进行追溯、 处理, 以提高业务测试数据的持久化
和可用性。
权利要求书2页 说明书7页 附图2页
CN 115545891 A
2022.12.30
CN 115545891 A
1.一种基于业 务数据构造的测试 数据管控方法, 其特 征在于, 包括以下步骤:
S1、 建立业务基础数据结构模型;
S2、 建立业务基础测试 数据链路模型;
S3、 根据测试 数据造数服 务, 生成原生测试 数据;
S4、 基于原生测试 数据, 设置关键 字段识别敏感信息;
S5、 非原生测试 数据申报及申报 审核;
S6、 实际测试数据申请管控, 对实际测试数据依次进行敏感信息识别、 原生校验和非原
生校验, 确定出 校验通过测试 数据以及校验不 通过测试 数据;
S7、 基于业 务基础测试 数据链路模型, 对校验不 通过测试 数据进行全链路追溯及销毁。
2.根据权利要求1所述的一种基于业务数据构造的测试数据 管控方法, 其特征在于, 所
述步骤S1 中业务基础数据结构模型具体是围绕客户层、 账户层、 卡片层三层关系为主 结构,
其中, 客户层涉及客户维度的基础信息, 包括客户姓名、 证件号码、 手机号、 风险征信、 家庭
住址、 职业信息;
账户层涉及账户信息, 包括账户类别、 账户号、 账户层额度、 账 单日;
卡片层涉及客户具体卡介质信息, 与账户存在从属关系, 包括卡产品、 卡号、 有效期、 安
全码、 磁道。
3.根据权利要求1所述的一种基于业务数据构造的测试数据 管控方法, 其特征在于, 所
述步骤S2中业务基础测试数据链路模型的数据流向具体为: 渠道>进件>审批>核卡>激活>
用卡>获贷 >贷后>大数据, 其中, 渠道包括线 上渠道和线 下渠道, 用于获取业务基础客户数
据信息;
进件用于进行获客至预审之间的预筛处 理以及进行路由分流;
审批用于调用外部征信及风险控制策略, 结合设置的审批节点及路由规则, 完成审批
处理;
核卡用于对客户提供的相关 资料进行审核;
大数据用于根据历史查询、 监管报送以及数据分析需要, 以将相关数据表传输至大数
据系统。
4.根据权利要求1所述的一种基于业务数据构造的测试数据 管控方法, 其特征在于, 所
述步骤S3具体是通过包装API的方式进行业务基础测试数据申请及维护, 针对相关入参出
参进行格式化包 装;
针对关键字段, 采用 “随机生成身份证号码、 设置固定测试标识字段、 指定测试环境卡
号池卡号”的方式, 以避免敏感数据进入测试环境, 并将关键 字段信息记录 于数据库内。
5.根据权利要求2所述的一种基于业务数据构造的测试数据 管控方法, 其特征在于, 所
述步骤S4具体是对业 务基础测试 数据结构模型中的关键敏感字段信息进行识别及标记。
6.根据权利要求3所述的一种基于业务数据构造的测试数据 管控方法, 其特征在于, 所
述步骤S5中非原生测试 数据包括 三类:
第1类、 测试 数据服务原生数据, 因测试需要 进行修改, 且非敏感数据;
第2类、 因特殊原因未通过测试 数据服务制作的测试 数据, 且非敏感数据;
第3类、 因特殊原因必须使用非外 部客户的所属项目员工信息 。
7.根据权利要求1所述的一种基于业务数据构造的测试数据 管控方法, 其特征在于, 所权 利 要 求 书 1/2 页
2
CN 115545891 A
2述步骤S6具体包括以下步骤:
S61、 实际测试数据申请管控, 判断当前 申请字段是否命中设置的关键字段识别敏感信
息, 若判断为是, 则执 行步骤S62, 否则结束当前 过程;
S62、 判断当前申请字段是否为造数服务提供的原生测试数据, 若判断为是, 则表明命
中白名单、 提交测试 数据申请, 否则执 行步骤S6 3;
S63、 判断当前申请字段是否为非原生测试数据、 且非敏感数据, 经过报备审核范围, 若
判断为是, 则表明命中白名单、 提交测试数据申请, 否则结束当前过程、 不予提交测试数据
申请。
8.根据权利要求7所述的一种基于业务数据构造的测试数据 管控方法, 其特征在于, 所
述步骤S62和S63具体是采用精确识别和模糊识别两种模式进 行校验判断, 当精确识别判断
均未通过 校验时, 则触发模糊识别。
9.根据权利要求8所述的一种基于业务数据构造的测试数据 管控方法, 其特征在于, 所
述精确识别的具体过程 为:
第一步, 通过基于数据生成规则的方式进行识别, 如果匹配命中规则, 则判定为测试数
据;
第二步, 通过hash算法对多种测试数据组合进行识别, 在生成测试数据时, 将测试数据
组合成文本后, 通过hash算法生成hash code作为数据组合标识key存储在测试数据库中;
在识别过程中, 计算目标数据组合的hash code, 然后扫描测试数据库, 如果命中, 则判定为
测试数据;
所述模糊识别具体是采用Word Embeddin g算法构建测试数据文本特征向量, 通过训练
word2vec的AI模型进行识别, 其中, 训练w ord2vec的AI模型的过程 为:
第一步, 对测试数据集进行文本分句处理, 然后通过Jieba分词工具切词, 并且去掉停
用词;
第二步, 将处理后的测试数据集作为word2vec模型的训练集进行训练, 其结果是将数
据集中的词数据映射成词向量, 该向量中包 含了上下文信息;
第三步, 将训练后的word2vec模型用于计算目标数据与预期数据的相似度, 相似度越
高, 则为测试 数据的概 率越高;
第四步, 将训练后的w ord2vec模型用于查找和筛 选高风险的测试 数据。
10.根据权利要求6所述的一种基于业务数据构造的测试数据管控方法, 其特征在于,
所述步骤S7具体是针对步骤S 5中第3类非原 生测试数据, 在明确使用完毕后, 基于业务基础
测试数据链路, 围绕以 “渠道>进件>审批>核卡>激活>用卡>获贷>贷后 ”为主数据流进行级
联删除相关测试 数据;
此外, 针对步骤S6确定出的校验不通过测试数据, 基于业务基础测试数据链路进行追
溯及销毁;
针对现有存量测试 数据进一 步进行智能识别及检查。权 利 要 求 书 2/2 页
3
CN 115545891 A
3
专利 一种基于业务数据构造的测试数据管控方法
安全报告 >
其他 >
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-03-03 20:13:28上传分享