(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111589482.5
(22)申请日 2021.12.23
(71)申请人 四川新网银行股份有限公司
地址 610094 四川省成 都市成都高新区吉
泰三路8号1栋1单 元26楼1-8号
(72)发明人 罗俊超 罗文
(74)专利代理 机构 成都智言知识产权代理有限
公司 51282
代理人 蒋秀清
(51)Int.Cl.
G06Q 40/02(2012.01)
G06K 9/62(2022.01)
G06N 20/00(2019.01)
(54)发明名称
基于半监督学习的企业信用评级 方法、 系统
及存储介质
(57)摘要
本发明公开了一种基于半监督学习的企业
信用评级方法、 系统及存储介质, 属于信用评级
技术领域。 本发明包括: 步骤1: 收集企业征信特
征, 并对企业征信特征进行预处理, 所述预处理
包括对企业征信特征的数据类型识别、 数据内容
识别以及数据类型转换; 步骤2: 利用预处理后的
企业征信特征对GBDT模型进行训练, 得到初始预
测模型; 步骤3: 对初始预测模型进行调优, 得到
最终预测模型; 步骤4: 将待评估企业的企业征信
特征根据步骤1预处理后的数据输入到最终预测
模型中, 得到该企业的信用等级。 本发明可以根
据每一个企业征信信息数据输出评分值, 能够更
为准确的判定每个企业的信用程度, 从而根据信
用程度确定企业的信用评级。
权利要求书2页 说明书6页 附图1页
CN 114429395 A
2022.05.03
CN 114429395 A
1.一种基于半监 督学习的企业信用评级方法, 其特 征在于, 包括以下步骤:
步骤1: 收集企业征信特征, 并对企业征信特征进行预处理, 所述预处理包括对企业征
信特征的数据类型识别、 数据内容识别以及数据类型转换, 并在存储空间中建立对应的用
于保存预处 理后的企业征信特 征的存储结构;
步骤2: 利用预处 理后的企业征信特 征对GBDT模型进行训练, 得到初始预测模型;
步骤3: 对初始预测模型进行调优, 得到最终预测模型, 将所述最终预测模型保存在特
定的存储结构中;
步骤4: 从所述特定的存储结构中读取出所述最终预测模型, 并将待评估企业的企业征
信特征根据步骤1预处 理后的数据输入到最终预测模型中, 得到该企业的信用等级。
2.根据权利要求1所述的一种基于半监督学习的企业信用评级方法, 其特征在于: 所述
企业征信特征包括 企业的基本概况信息特征、 借贷交易记录数据特征、 信贷逾期数据特征、
担保账户数据特 征、 相关还款责任数据特 征和欠税记录信息特 征。
3.根据权利要求1所述的一种基于半监督学习的企业信用评级方法, 其特征在于: 步骤
1中所述的预 处理包括对数值的结构类型及 对应的存储方式进 行变换、 对数据分箱、 对各数
据的内容按预设的分隔符进行识别后, 对各数据进行截断、 对各数据进行标准化和归一化
处理。
4.根据权利要求1所述的一种基于半监督学习的企业信用评级方法, 其特征在于: 步骤
3具体包括以下步骤:
步骤3.1: 将 没有逾期记录的客户按8:2的比例进行随机拆分, 分别记为P1和 P2, 将未授
信的客户记为U;
步骤3.2: 使用P1+U客户的企业征信 特征生成一棵CART决策树Ti(x, θ1),用以拟合客户
是否被授信并标记的y; x为企业征信特征, θ表 示模型最优参数, y代表是否为已知好客户, y
=0或1, y=0代表未放过款的客户, y=1代表通过现有信息能够明确判定为没有逾期记录
的客户;
步骤3.3: 根据CART决策树的输出值 outputgbdt1与y计算交叉熵损失L ossgbdt1:
Lossgbdt1=Crossentropy(y,outputgbdt1);
计算损失函数的梯度grad1:
步骤3.4: 使用企业征信特征x生成一棵CART决策树Ti(x, θi), 用以拟 合上一步的损失函
数梯度gradi‑1;
步骤3.5: 将新 生成的CART决策树Ti(x, θi)乘以学习率 μ累加到模型中, 构成新的模型;
步骤3.6: 计算 新模型的损失函数梯度gradi
步骤3.7: 重复执行步骤3.4 ‑3.6, 直到CART决策树的迭代次数达到预先设定的次数M,
得到训练好的模型;
步骤3.8: 将P2客户的企业征信特征输入训练好的模型, 计算没有逾期记录的客户被标
记的概率c:权 利 要 求 书 1/2 页
2
CN 114429395 A
2步骤3.9: 调整初始模型值,得到最终预测模型, 记为model:
5.一种用于权利要求1至4之一所述方法的基于半监督学习的企业信用评级系统, 其特
征在于, 包括:
特征收集模块: 用于收集企业征信特 征;
特征加工模块: 用于对企业征信特 征进行预处理;
模型训练模块: 用于根据预处理后的企业征信特征对GBDT模型进行训练, 得到初始预
测模型;
模型调优 模块: 用于对初始预测模型进行调优, 得到最终预测模型;
信用等级输出模块: 用于将预处理后的待评估企业的企业征信特征输入到最终预测模
型中, 输出待评估企业的信用等级。
6.一种计算机存储介质, 其特征在于: 所述计算机存储介质存储有执行如权利要求1 ‑4
任一项所述的基于半监 督学习的企业信用评级方法的计算机程序。权 利 要 求 书 2/2 页
3
CN 114429395 A
3
专利 基于半监督学习的企业信用评级方法、系统及存储介质
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 23:16:49上传分享