说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111529424.3 (22)申请日 2021.12.14 (71)申请人 平安银行股份有限公司 地址 518000 广东省深圳市罗湖区深南 东 路5047号 (72)发明人 张利兵  (74)专利代理 机构 深圳市赛恩倍吉知识产权代 理有限公司 4 4334 代理人 陈海云 严林 (51)Int.Cl. G06F 16/901(2019.01) G06F 16/9032(2019.01) G06N 20/00(2019.01) (54)发明名称 基于人工智能的数据库索引创建方法及相 关设备 (57)摘要 本发明涉及人工智能技术领域, 提供一种基 于人工智能的数据库索引创建方法及相关设备, 通过植入埋点捕获应用访问数据库的查询语句, 对所述查询语句进行解析, 得到多个搜索关键词 和要查询的数据表, 根据所述数据表计算多个预 设指标的特征值, 将所述多个预设指标的特征值 及所述多个搜索关键词输入至第一随机森林模 型中进行预测, 得到每个所述搜索关键词对应的 第一索引标签, 根据每个所述搜索关键词对应的 第一索引标签为所述数据表创建第一索引。 本发 明能够自动添加索引, 不仅减少了索引设计的工 作量, 提高了索引的创建效率, 还提高了索引创 建的时效性和准确性。 权利要求书2页 说明书13页 附图2页 CN 114238698 A 2022.03.25 CN 114238698 A 1.一种基于人工智能的数据库索引创建方法, 其特 征在于, 所述方法包括: 植入埋点并通过 所述埋点捕获应用访问数据库的查询语句; 对所述查询语句进行解析, 得到多个搜索关键词和要查询的数据表; 根据所述数据表计算多个预设指标的特 征值; 将所述多个预设指标的特征值及所述多个搜索关键词输入至第一随机森林模型中进 行预测, 得到每 个所述搜索关键词对应的第一索引标签; 根据每个所述搜索关键词对应的第一索引标签为所述数据表创建第一索引。 2.如权利要求1所述的基于人工智能的数据库索引创建方法, 其特征在于, 所述植入埋 点并通过 所述埋点捕获应用访问数据库的查询语句包括: 在后台应用服 务中设置埋 点服务SDK; 通过所述埋点服务SDK对外暴露一个数据埋 点服务接口; 当侦测到所述应用对所述数据库的访问信号 时, 调用所述数据埋点服务接口获取所述 应用访问所述数据库的查询语句。 3.如权利要求1所述的基于人工智能的数据库索引创建方法, 其特征在于, 所述第 一随 机森林模型的训练过程包括: 获取多个所述预设指标的历史特 征值及多个历史搜索关键词, 作为第一训练数据集; 从所述第一训练数据集中随机抽取k1个训练样本集; 对所述k1个训练样本集进行学习, 以此生成k1个决策树, 并在所述k1个决策树的生成 过程中, 从k1个决策树的特征变量中随机抽取F1个特征变量, 各个内部节点利用所述F1个 特征变量上最优的分裂方式来分支, 且F1值在随机森林模型的形成过程中设定为恒定常 数; 当满足分支规则时, 停止所述 k1个决策树的生成过程, 得到所述第一随机森林模型。 4.如权利要求3所述的基于人工智能的数据库索引创建方法, 其特征在于, 所述k1个决 策树的生成过程包括: 随机地给每 个所述特 征变量加入噪声干扰; 依据准确率降低的程度来确定每 个所述特 征变量的重要度; 依据所述重要度对所述 k1个决策树的生成过程进行优化。 5.如权利要求1至4中任意一项所述的基于人工智能的数据库索引创建方法, 其特征在 于, 所述方法还 包括: 将所述多个搜索关键词进行两 两组合, 得到多个组合搜索关键词; 将所述多个预设指标的特征值及所述多个组合搜索关键词输入至第二随机森林模型 中进行预测, 得到每 个所述组合搜索关键词对应的第二索引标签; 根据每个所述组合搜索关键词对应的第二索引标签为所述数据表创建第二索引; 计算多个所述第一索引标签中为预设目标 标签值的索引标签的第一数量; 计算多个所述第二索引标签中为所述预设目标 标签值的索引标签的第二数量; 对所述第一数量及所述第二数量进行比较, 得到比较结果; 根据所述比较结果, 确定为所述数据表创建所述第一索引或者所述第二索引。 6.如权利要求5所述的基于人工智能的数据库索引创建方法, 其特征在于, 所述第 二随 机森林模型的训练过程包括:权 利 要 求 书 1/2 页 2 CN 114238698 A 2将所述多个历史搜索关键词进行两 两组合, 得到多个组合历史搜索关键词; 将多个所述预设指标的历史特征值及所述多个组合历史搜索关键词作为第二训练数 据集; 基于所述第二训练数据集训练所述第二随机森林模型。 7.如权利要求5所述的基于人工智能的数据库索引创建方法, 其特征在于, 所述根据 所 述比较结果, 确定为所述数据表创建所述第一索引或者所述第二索引包括: 当所述比较结果为所述第 一数量小于所述第 二数量时, 确定为所述数据表创建所述第 一索引; 当所述比较结果为所述第 一数量大于所述第 二数量时, 确定为所述数据表创建所述第 二索引。 8.一种基于人工智能的数据库索引创建装置, 其特 征在于, 所述装置包括: 获取模块, 用于植入埋 点并通过 所述埋点捕获应用访问数据库的查询语句; 解析模块, 用于对所述 查询语句进行解析, 得到多个搜索关键词和要查询的数据表; 计算模块, 用于根据所述数据表计算多个预设指标的特 征值; 预测模块, 用于将所述多个预设指标的特征值及所述多个搜索 关键词输入至第 一随机 森林模型中进行 预测, 得到每 个所述搜索关键词对应的第一索引标签; 创建模块, 用于根据每个所述搜索 关键词对应的第 一索引标签为所述数据表创建第 一 索引。 9.一种电子设备, 其特征在于, 所述电子设备包括处理器和存储器, 所述处理器用于执 行所述存储器中存储的计算机程序时实现如权利要求1至7中任意一项所述基于人工智能 的数据库索引创建方法。 10.一种计算机可读存储介质, 所述计算机可读存储介质上存储有计算机程序, 其特征 在于, 所述计算机程序被处理器执行时实现如权利要求 1至7中任意一项 所述基于人工智能 的数据库索引创建方法。权 利 要 求 书 2/2 页 3 CN 114238698 A 3

.PDF文档 专利 基于人工智能的数据库索引创建方法及相关设备

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于人工智能的数据库索引创建方法及相关设备 第 1 页 专利 基于人工智能的数据库索引创建方法及相关设备 第 2 页 专利 基于人工智能的数据库索引创建方法及相关设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:16:45上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。