专利 一种基于业务数据构造的测试数据管控方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211216100.9 (22)申请日 2022.09.30 (71)申请人上海浦东发展银行股份有限公司地址 200002 上海市黄浦区中山东一路12 号 (72)发明人倪佳乐　陈嘉　孙良平　李侠飞　 (74)专利代理机构上海科盛知识产权代理有限公司 312 25 专利代理师廖程 (51)Int.Cl. G06Q 40/02(2012.01) G06F 16/215(2019.01) G06F 16/22(2019.01) G06F 21/62(2013.01) G06F 16/33(2019.01) (54)发明名称一种基于业务数据构造的测试数据管控方法 (57)摘要本发明涉及一种基于业务数据构造的测试数据管控方法，包括：建立业务基础数据结构模型；建立业务基础测试数据链路模型；根据测试数据造数服务，生成原生测试数据；基于原生测试数据，设置关键字段识别敏感信息；非原生测试数据申报及申报审核；实际测试数据申请管控，对实际测试数据依次进行敏感信息识别、原生校验和非原生校验，确定出校验通过测试数据以及校验不通过测试数据；基于业务基础测试数据链路模型，对校验不通过测试数据进行全链路追溯及销毁。与现有技术相比，本发明能够主动准确识别涉敏测试数据，并对涉敏测试数据链路进行追溯、处理，以提高业务测试数据的持久化和可用性。权利要求书2页说明书7页附图2页 CN 115545891 A 2022.12.30 CN 115545891 A 1.一种基于业务数据构造的测试数据管控方法，其特征在于，包括以下步骤： S1、建立业务基础数据结构模型； S2、建立业务基础测试数据链路模型； S3、根据测试数据造数服务，生成原生测试数据； S4、基于原生测试数据，设置关键字段识别敏感信息； S5、非原生测试数据申报及申报审核； S6、实际测试数据申请管控，对实际测试数据依次进行敏感信息识别、原生校验和非原生校验，确定出校验通过测试数据以及校验不通过测试数据； S7、基于业务基础测试数据链路模型，对校验不通过测试数据进行全链路追溯及销毁。 2.根据权利要求1所述的一种基于业务数据构造的测试数据管控方法，其特征在于，所述步骤S1 中业务基础数据结构模型具体是围绕客户层、账户层、卡片层三层关系为主结构，其中，客户层涉及客户维度的基础信息，包括客户姓名、证件号码、手机号、风险征信、家庭住址、职业信息；账户层涉及账户信息，包括账户类别、账户号、账户层额度、账单日；卡片层涉及客户具体卡介质信息，与账户存在从属关系，包括卡产品、卡号、有效期、安全码、磁道。 3.根据权利要求1所述的一种基于业务数据构造的测试数据管控方法，其特征在于，所述步骤S2中业务基础测试数据链路模型的数据流向具体为：渠道>进件>审批>核卡>激活> 用卡>获贷 >贷后＞大数据，其中，渠道包括线上渠道和线下渠道，用于获取业务基础客户数据信息；进件用于进行获客至预审之间的预筛处理以及进行路由分流；审批用于调用外部征信及风险控制策略，结合设置的审批节点及路由规则，完成审批处理；核卡用于对客户提供的相关资料进行审核；大数据用于根据历史查询、监管报送以及数据分析需要，以将相关数据表传输至大数据系统。 4.根据权利要求1所述的一种基于业务数据构造的测试数据管控方法，其特征在于，所述步骤S3具体是通过包装API的方式进行业务基础测试数据申请及维护，针对相关入参出参进行格式化包装；针对关键字段，采用 “随机生成身份证号码、设置固定测试标识字段、指定测试环境卡号池卡号”的方式，以避免敏感数据进入测试环境，并将关键字段信息记录于数据库内。 5.根据权利要求2所述的一种基于业务数据构造的测试数据管控方法，其特征在于，所述步骤S4具体是对业务基础测试数据结构模型中的关键敏感字段信息进行识别及标记。 6.根据权利要求3所述的一种基于业务数据构造的测试数据管控方法，其特征在于，所述步骤S5中非原生测试数据包括三类：第1类、测试数据服务原生数据，因测试需要进行修改，且非敏感数据；第2类、因特殊原因未通过测试数据服务制作的测试数据，且非敏感数据；第3类、因特殊原因必须使用非外部客户的所属项目员工信息。 7.根据权利要求1所述的一种基于业务数据构造的测试数据管控方法，其特征在于，所权　利　要　求　书 1/2 页 2 CN 115545891 A 2述步骤S6具体包括以下步骤： S61、实际测试数据申请管控，判断当前申请字段是否命中设置的关键字段识别敏感信息，若判断为是，则执行步骤S62，否则结束当前过程； S62、判断当前申请字段是否为造数服务提供的原生测试数据，若判断为是，则表明命中白名单、提交测试数据申请，否则执行步骤S6 3； S63、判断当前申请字段是否为非原生测试数据、且非敏感数据，经过报备审核范围，若判断为是，则表明命中白名单、提交测试数据申请，否则结束当前过程、不予提交测试数据申请。 8.根据权利要求7所述的一种基于业务数据构造的测试数据管控方法，其特征在于，所述步骤S62和S63具体是采用精确识别和模糊识别两种模式进行校验判断，当精确识别判断均未通过校验时，则触发模糊识别。 9.根据权利要求8所述的一种基于业务数据构造的测试数据管控方法，其特征在于，所述精确识别的具体过程为：第一步，通过基于数据生成规则的方式进行识别，如果匹配命中规则，则判定为测试数据；第二步，通过hash算法对多种测试数据组合进行识别，在生成测试数据时，将测试数据组合成文本后，通过hash算法生成hash code作为数据组合标识key存储在测试数据库中；在识别过程中，计算目标数据组合的hash code，然后扫描测试数据库，如果命中，则判定为测试数据；所述模糊识别具体是采用Word Embeddin g算法构建测试数据文本特征向量，通过训练 word2vec的AI模型进行识别，其中，训练w ord2vec的AI模型的过程为：第一步，对测试数据集进行文本分句处理，然后通过Jieba分词工具切词，并且去掉停用词；第二步，将处理后的测试数据集作为word2vec模型的训练集进行训练，其结果是将数据集中的词数据映射成词向量，该向量中包含了上下文信息；第三步，将训练后的word2vec模型用于计算目标数据与预期数据的相似度，相似度越高，则为测试数据的概率越高；第四步，将训练后的w ord2vec模型用于查找和筛选高风险的测试数据。 10.根据权利要求6所述的一种基于业务数据构造的测试数据管控方法，其特征在于，所述步骤S7具体是针对步骤S 5中第3类非原生测试数据，在明确使用完毕后，基于业务基础测试数据链路，围绕以 “渠道>进件>审批>核卡>激活>用卡>获贷>贷后 ”为主数据流进行级联删除相关测试数据；此外，针对步骤S6确定出的校验不通过测试数据，基于业务基础测试数据链路进行追溯及销毁；针对现有存量测试数据进一步进行智能识别及检查。权　利　要　求　书 2/2 页 3 CN 115545891 A 3

专利 一种基于业务数据构造的测试数据管控方法

专利一种基于业务数据构造的测试数据管控方法