说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111529424.3 (22)申请日 2021.12.14 (71)申请人 平安银行股份有限公司 地址 518000 广东省深圳市罗湖区深南 东 路5047号 (72)发明人 张利兵 (74)专利代理 机构 深圳市赛恩倍吉知识产权代 理有限公司 4 4334 代理人 陈海云 严林 (51)Int.Cl. G06F 16/901(2019.01) G06F 16/9032(2019.01) G06N 20/00(2019.01) (54)发明名称 基于人工智能的数据库索引创建方法及相 关设备 (57)摘要 本发明涉及人工智能技术领域, 提供一种基 于人工智能的数据库索引创建方法及相关设备, 通过植入埋点捕获应用访问数据库的查询语句, 对所述查询语句进行解析, 得到多个搜索关键词 和要查询的数据表, 根据所述数据表计算多个预 设指标的特征值, 将所述多个预设指标的特征值 及所述多个搜索关键词输入至第一随机森林模 型中进行预测, 得到每个所述搜索关键词对应的 第一索引标签, 根据每个所述搜索关键词对应的 第一索引标签为所述数据表创建第一索引。 本发 明能够自动添加索引, 不仅减少了索引设计的工 作量, 提高了索引的创建效率, 还提高了索引创 建的时效性和准确性。 权利要求书2页 说明书13页 附图2页 CN 114238698 A 2022.03.25 CN 114238698 A 1.一种基于人工智能的数据库索引创建方法, 其特 征在于, 所述方法包括: 植入埋点并通过 所述埋点捕获应用访问数据库的查询语句; 对所述查询语句进行解析, 得到多个搜索关键词和要查询的数据表; 根据所述数据表计算多个预设指标的特 征值; 将所述多个预设指标的特征值及所述多个搜索关键词输入至第一随机森林模型中进 行预测, 得到每 个所述搜索关键词对应的第一索引标签; 根据每个所述搜索关键词对应的第一索引标签为所述数据表创建第一索引。 2.如权利要求1所述的基于人工智能的数据库索引创建方法, 其特征在于, 所述植入埋 点并通过 所述埋点捕获应用访问数据库的查询语句包括: 在后台应用服 务中设置埋 点服务SDK; 通过所述埋点服务SDK对外暴露一个数据埋 点服务接口; 当侦测到所述应用对所述数据库的访问信号 时, 调用所述数据埋点服务接口获取所述 应用访问所述数据库的查询语句。 3.如权利要求1所述的基于人工智能的数据库索引创建方法, 其特征在于, 所述第 一随 机森林模型的训练过程包括: 获取多个所述预设指标的历史特 征值及多个历史搜索关键词, 作为第一训练数据集; 从所述第一训练数据集中随机抽取k1个训练样本集; 对所述k1个训练样本集进行学习, 以此生成k1个决策树, 并在所述k1个决策树的生成 过程中, 从k1个决策树的特征变量中随机抽取F1个特征变量, 各个内部节点利用所述F1个 特征变量上最优的分裂方式来分支, 且F1值在随机森林模型的形成过程中设定为恒定常 数; 当满足分支规则时, 停止所述 k1个决策树的生成过程, 得到所述第一随机森林模型。 4.如权利要求3所述的基于人工智能的数据库索引创建方法, 其特征在于, 所述k1个决 策树的生成过程包括: 随机地给每 个所述特 征变量加入噪声干扰; 依据准确率降低的程度来确定每 个所述特 征变量的重要度; 依据所述重要度对所述 k1个决策树的生成过程进行优化。 5.如权利要求1至4中任意一项所述的基于人工智能的数据库索引创建方法, 其特征在 于, 所述方法还 包括: 将所述多个搜索关键词进行两 两组合, 得到多个组合搜索关键词; 将所述多个预设指标的特征值及所述多个组合搜索关键词输入至第二随机森林模型 中进行预测, 得到每 个所述组合搜索关键词对应的第二索引标签; 根据每个所述组合搜索关键词对应的第二索引标签为所述数据表创建第二索引; 计算多个所述第一索引标签中为预设目标 标签值的索引标签的第一数量; 计算多个所述第二索引标签中为所述预设目标 标签值的索引标签的第二数量; 对所述第一数量及所述第二数量进行比较, 得到比较结果; 根据所述比较结果, 确定为所述数据表创建所述第一索引或者所述第二索引。 6.如权利要求5所述的基于人工智能的数据库索引创建方法, 其特征在于, 所述第 二随 机森林模型的训练过程包括:权 利 要 求 书 1/2 页 2 CN 114238698 A 2将所述多个历史搜索关键词进行两 两组合, 得到多个组合历史搜索关键词; 将多个所述预设指标的历史特征值及所述多个组合历史搜索关键词作为第二训练数 据集; 基于所述第二训练数据集训练所述第二随机森林模型。 7.如权利要求5所述的基于人工智能的数据库索引创建方法, 其特征在于, 所述根据 所 述比较结果, 确定为所述数据表创建所述第一索引或者所述第二索引包括: 当所述比较结果为所述第 一数量小于所述第 二数量时, 确定为所述数据表创建所述第 一索引; 当所述比较结果为所述第 一数量大于所述第 二数量时, 确定为所述数据表创建所述第 二索引。 8.一种基于人工智能的数据库索引创建装置, 其特 征在于, 所述装置包括: 获取模块, 用于植入埋 点并通过 所述埋点捕获应用访问数据库的查询语句; 解析模块, 用于对所述 查询语句进行解析, 得到多个搜索关键词和要查询的数据表; 计算模块, 用于根据所述数据表计算多个预设指标的特 征值; 预测模块, 用于将所述多个预设指标的特征值及所述多个搜索 关键词输入至第 一随机 森林模型中进行 预测, 得到每 个所述搜索关键词对应的第一索引标签; 创建模块, 用于根据每个所述搜索 关键词对应的第 一索引标签为所述数据表创建第 一 索引。 9.一种电子设备, 其特征在于, 所述电子设备包括处理器和存储器, 所述处理器用于执 行所述存储器中存储的计算机程序时实现如权利要求1至7中任意一项所述基于人工智能 的数据库索引创建方法。 10.一种计算机可读存储介质, 所述计算机可读存储介质上存储有计算机程序, 其特征 在于, 所述计算机程序被处理器执行时实现如权利要求 1至7中任意一项 所述基于人工智能 的数据库索引创建方法。权 利 要 求 书 2/2 页 3 CN 114238698 A 3
专利 基于人工智能的数据库索引创建方法及相关设备
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 23:16:45
上传分享
举报
下载
原文档
(504.4 KB)
分享
友情链接
GB-T 43528-2023 电化学储能电池管理通信技术要求.pdf
GB-T 41817-2022 信息安全技术 个人信息安全工程指南.pdf
GB-T 38204-2019 岩土工程仪器 测斜仪.pdf
青藤云安全 威胁狩猎实践指南.pdf
DB61-T 1505-2021 数字化转型 企业新型能力识别技术规范 陕西省.pdf
SY-T 7617-2021 海相页岩地质力学评价规范.pdf
LD-T 08-2022 人力资源社会保障灾备中心建设和运维管理规范.pdf
GB-T 35381.1-2017 农林拖拉机和机械 串行控制和通信数据网络 第1部分:数据通信通用标准.pdf
GB-T 7931-2008 1500 11 000 12 000 地形图航空摄影测量外业规范.pdf
GB-T 37606-2019 钛-钢复合管.pdf
GB-T 36324-2018 信息安全技术 工业控制系统信息安全分级规范.pdf
NIST评估信息安全持续监控项目指南评估方法一 .pdf
GB/T 30428.8-2020 数字化城市管理信息系统 第8部分:立案、处置和结案.pdf
GB/T 39975-2021 氮化铝陶瓷散热基片.pdf
DB41-T 2665-2024 大气挥发性有机物走航自动监测技术规范 河南省.pdf
T-CEC 611—2022 变电站设备声成像测试技术导则.pdf
GB-T 33200-2016 社会治安综合治理 综治中心建设与管理规范.pdf
专利 一种具有温控功能的配电箱.PDF
信通院 移动互联网应用程序-APP个人信息保护治理白皮书.pdf
OWASP ASVS应用安全验证标准 4.0.3 中文版.pdf
1
/
3
18
评价文档
赞助2.5元 点击下载(504.4 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。