说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111589482.5 (22)申请日 2021.12.23 (71)申请人 四川新网银行股份有限公司 地址 610094 四川省成 都市成都高新区吉 泰三路8号1栋1单 元26楼1-8号 (72)发明人 罗俊超 罗文  (74)专利代理 机构 成都智言知识产权代理有限 公司 51282 代理人 蒋秀清 (51)Int.Cl. G06Q 40/02(2012.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 基于半监督学习的企业信用评级 方法、 系统 及存储介质 (57)摘要 本发明公开了一种基于半监督学习的企业 信用评级方法、 系统及存储介质, 属于信用评级 技术领域。 本发明包括: 步骤1: 收集企业征信特 征, 并对企业征信特征进行预处理, 所述预处理 包括对企业征信特征的数据类型识别、 数据内容 识别以及数据类型转换; 步骤2: 利用预处理后的 企业征信特征对GBDT模型进行训练, 得到初始预 测模型; 步骤3: 对初始预测模型进行调优, 得到 最终预测模型; 步骤4: 将待评估企业的企业征信 特征根据步骤1预处理后的数据输入到最终预测 模型中, 得到该企业的信用等级。 本发明可以根 据每一个企业征信信息数据输出评分值, 能够更 为准确的判定每个企业的信用程度, 从而根据信 用程度确定企业的信用评级。 权利要求书2页 说明书6页 附图1页 CN 114429395 A 2022.05.03 CN 114429395 A 1.一种基于半监 督学习的企业信用评级方法, 其特 征在于, 包括以下步骤: 步骤1: 收集企业征信特征, 并对企业征信特征进行预处理, 所述预处理包括对企业征 信特征的数据类型识别、 数据内容识别以及数据类型转换, 并在存储空间中建立对应的用 于保存预处 理后的企业征信特 征的存储结构; 步骤2: 利用预处 理后的企业征信特 征对GBDT模型进行训练, 得到初始预测模型; 步骤3: 对初始预测模型进行调优, 得到最终预测模型, 将所述最终预测模型保存在特 定的存储结构中; 步骤4: 从所述特定的存储结构中读取出所述最终预测模型, 并将待评估企业的企业征 信特征根据步骤1预处 理后的数据输入到最终预测模型中, 得到该企业的信用等级。 2.根据权利要求1所述的一种基于半监督学习的企业信用评级方法, 其特征在于: 所述 企业征信特征包括 企业的基本概况信息特征、 借贷交易记录数据特征、 信贷逾期数据特征、 担保账户数据特 征、 相关还款责任数据特 征和欠税记录信息特 征。 3.根据权利要求1所述的一种基于半监督学习的企业信用评级方法, 其特征在于: 步骤 1中所述的预 处理包括对数值的结构类型及 对应的存储方式进 行变换、 对数据分箱、 对各数 据的内容按预设的分隔符进行识别后, 对各数据进行截断、 对各数据进行标准化和归一化 处理。 4.根据权利要求1所述的一种基于半监督学习的企业信用评级方法, 其特征在于: 步骤 3具体包括以下步骤: 步骤3.1: 将 没有逾期记录的客户按8:2的比例进行随机拆分, 分别记为P1和 P2, 将未授 信的客户记为U; 步骤3.2: 使用P1+U客户的企业征信 特征生成一棵CART决策树Ti(x, θ1),用以拟合客户 是否被授信并标记的y; x为企业征信特征, θ表 示模型最优参数, y代表是否为已知好客户, y =0或1, y=0代表未放过款的客户, y=1代表通过现有信息能够明确判定为没有逾期记录 的客户; 步骤3.3: 根据CART决策树的输出值 outputgbdt1与y计算交叉熵损失L ossgbdt1: Lossgbdt1=Crossentropy(y,outputgbdt1); 计算损失函数的梯度grad1: 步骤3.4: 使用企业征信特征x生成一棵CART决策树Ti(x, θi), 用以拟 合上一步的损失函 数梯度gradi‑1; 步骤3.5: 将新 生成的CART决策树Ti(x, θi)乘以学习率 μ累加到模型中, 构成新的模型; 步骤3.6: 计算 新模型的损失函数梯度gradi 步骤3.7: 重复执行步骤3.4 ‑3.6, 直到CART决策树的迭代次数达到预先设定的次数M, 得到训练好的模型; 步骤3.8: 将P2客户的企业征信特征输入训练好的模型, 计算没有逾期记录的客户被标 记的概率c:权 利 要 求 书 1/2 页 2 CN 114429395 A 2步骤3.9: 调整初始模型值,得到最终预测模型, 记为model: 5.一种用于权利要求1至4之一所述方法的基于半监督学习的企业信用评级系统, 其特 征在于, 包括: 特征收集模块: 用于收集企业征信特 征; 特征加工模块: 用于对企业征信特 征进行预处理; 模型训练模块: 用于根据预处理后的企业征信特征对GBDT模型进行训练, 得到初始预 测模型; 模型调优 模块: 用于对初始预测模型进行调优, 得到最终预测模型; 信用等级输出模块: 用于将预处理后的待评估企业的企业征信特征输入到最终预测模 型中, 输出待评估企业的信用等级。 6.一种计算机存储介质, 其特征在于: 所述计算机存储介质存储有执行如权利要求1 ‑4 任一项所述的基于半监 督学习的企业信用评级方法的计算机程序。权 利 要 求 书 2/2 页 3 CN 114429395 A 3

.PDF文档 专利 基于半监督学习的企业信用评级方法、系统及存储介质

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于半监督学习的企业信用评级方法、系统及存储介质 第 1 页 专利 基于半监督学习的企业信用评级方法、系统及存储介质 第 2 页 专利 基于半监督学习的企业信用评级方法、系统及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:16:49上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。