(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211064625.5 (22)申请日 2022.08.31 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 段高华  (74)专利代理 机构 北京同立钧成知识产权代理 有限公司 1 1205 专利代理师 刘文娜 黄健 (51)Int.Cl. G06F 16/951(2019.01) G06F 16/9532(2019.01) G06F 8/53(2018.01) G06V 20/62(2022.01) G06T 1/00(2006.01)H04L 9/40(2022.01) (54)发明名称 数据处理方法及装置 (57)摘要 本公开提供了一种数据处理方法及装置, 涉 及数据处理领域, 尤其涉及智 能搜索领域。 具体 实现方案为: 根据试题搜索日志和试题获取日 志, 确定待处理试题的试题信息。 根据试题信息 访问第一客户端的查询接口, 得到试题信息对应 的第一返回结果, 其中, 第一返回结果是经过加 密处理的。 获取第一客户端的解密函数, 并根据 解密函数对第一返回结果进行解密处理, 得到解 密后的第二返回结果。 根据第二返回结果, 得到 待处理试题对应的解题视频。 本公开的技术方案 可以快速有效的获取到试题所对应的解题视频, 进而可以提升构建解题视频资料库的速度和效 率。 权利要求书4页 说明书16页 附图7页 CN 115357772 A 2022.11.18 CN 115357772 A 1.一种数据处 理方法, 包括: 根据试题搜索日志和试题获取日志, 确定待处 理试题的试题信息; 根据所述试题信 息访问第 一客户端的查询接口, 得到所述试题信 息对应的第 一返回结 果, 其中, 所述第一返回结果是 经过加密处 理的; 获取所述第 一客户端的解密函数, 并根据 所述解密函数对所述第 一返回结果进行解密 处理, 得到解密后的第二返回结果; 根据所述第二返回结果, 得到所述待处 理试题对应的解题视频。 2.根据权利要求1所述的方法, 其中, 所述根据试题搜索日志和试题获取日志, 确定待 处理试题的试题信息, 包括: 根据所述试题搜索日志中的文本搜索日志, 确定所述文本搜索日志中所包括的至少一 个第一试题的第一访问量; 根据所述试题搜索日志中的图片搜索日志, 确定所述图片搜索日志中所包括的至少一 个第二试题的第二访问量; 根据所述试题获取日志, 确定所述试题获取日志中所包括的至少一个第三试题; 根据所述第一访问量、 所述第 二访问量、 所述第 三试题, 确定至少一个待处理试题的试 题信息。 3.根据权利要求2所述的方法, 其中, 所述根据 所述第一访问量、 所述第 二访问量、 所述 第三试题, 确定 至少一个待处 理试题的试题信息, 包括: 在所述至少一个第一试题中, 获取 所述第一访问量高于第一阈值的第一目标 试题; 在所述至少一个第二试题中, 获取 所述第二访问量高于第二阈值的第二目标 试题; 将所述第一目标试题的试题内容、 所述第 二目标试题的试题内容以及所述第 三试题的 试题内容, 确定为所述待处 理试题的试题信息 。 4.根据权利要求1 ‑3任一项所述的方法, 其中, 所述根据所述试题信 息访问第 一客户端 的查询接口, 得到所述试题信息对应的第一返回结果, 包括: 根据所述试题信息, 生成所述试题信息对应的查询图像; 根据所述查询图像访问所述第 一客户端的查询接口, 得到所述查询接口返回的所述试 题信息对应的第一返回结果。 5.根据权利要求1所述的方法, 其中, 所述获取 所述第一 客户端的解密函数, 包括: 获取所述第一 客户端的安装程序; 对所述安装程序进行反编译处 理, 得到所述第一 客户端的反编译 文件; 在所述反编译 文件中获取 所述解密函数。 6.根据权利要求1 ‑5任一项所述的方法, 其中, 所述第 二返回结果中包括第 一格式的视 频文件; 所述根据所述第二返回结果, 得到所述待处 理试题对应的解题视频, 包括: 对所述第一格式的视频文件进行文件解析, 得到 至少一个视频片段; 对所述至少一个视频片段进行合并, 得到初始视频; 对所述初始视频进行视频处理, 得到所述待处理试题对应的解题视频, 所述视频处理 包括如下中的至少一种: 去水印处 理、 裁剪处理、 视频质量调整处 理、 编码信息调整处 理。 7.根据权利要求6所述的方法, 其中, 所述去水印处 理包括:权 利 要 求 书 1/4 页 2 CN 115357772 A 2获取所述初始视频的第一帧图像, 并在所述第一帧图像中识别图像水印, 并确定所述 图像水印在所述第一帧图像中的水印位置; 根据所述水印位置, 对所述初始视频中的各个图像帧依次进行去水印处 理。 8.根据权利要求6所述的方法, 其中, 所述裁 剪处理包括: 获取所述初始视频中第一时段对应的第一音频, 其中, 所述第一时段为所述初始视频 的开始时刻之后的第一预设时长内的时段, 和/或, 所述第一时段为所述视频的结束时刻之 前的第二预设时长内的时段; 对所述第一音频进行语音识别, 得到所述第一音频对应的第一文本; 将所述第一文本和预设文本进行匹配处理, 确定所述第 一文本中和所述预设文本相匹 配的文本片段; 确定所述文本片段在所述初始视频中所对应的匹配时段; 在所述初始视频中, 将所述匹配时段对应的视频片段删除。 9.根据权利要求6所述的方法, 其中, 所述视频质量调整处 理包括: 获取所述第一 客户端对应的预设视频参数; 将所述初始视频的视频参数调整为所述预设视频参数。 10.根据权利要求6 ‑9任一项所述的方法, 其中, 所述第二返回结果中还包括所述视频 文件对应的描述信息; 所述根据所述第二返回结果, 得到所述待处理试题对应的解题视频之后, 所述方法还 包括: 根据所述描述信息, 在数据库中确定和所述描述信息相匹配的目标 试题; 将所述解题视频存储至所述数据库中, 并建立所述解题视频和所述目标试题的关联关 系。 11.一种数据处 理装置, 包括: 确定模块, 用于根据试题搜索日志和试题获取日志, 确定待处 理试题的试题信息; 访问模块, 用于根据所述试题信息访 问第一客户端的查询接口, 得到所述试题信息对 应的第一返回结果, 其中, 所述第一返回结果是 经过加密处 理的; 获取模块, 用于获取所述第一客户端的解密函数, 并根据所述解密函数对所述第一返 回结果进行解密处 理, 得到解密后的第二返回结果; 处理模块, 用于根据所述第二返回结果, 得到所述待处 理试题对应的解题视频。 12.根据权利要求1 1所述的装置, 其中, 所述确定模块具体用于: 根据所述试题搜索日志中的文本搜索日志, 确定所述文本搜索日志中所包括的至少一 个第一试题的第一访问量; 根据所述试题搜索日志中的图片搜索日志, 确定所述图片搜索日志中所包括的至少一 个第二试题的第二访问量; 根据所述试题获取日志, 确定所述试题获取日志中所包括的至少一个第三试题; 根据所述第一访问量、 所述第 二访问量、 所述第 三试题, 确定至少一个待处理试题的试 题信息。 13.根据权利要求12所述的装置, 其中, 所述确定模块具体用于: 在所述至少一个第一试题中, 获取 所述第一访问量高于第一阈值的第一目标 试题;权 利 要 求 书 2/4 页 3 CN 115357772 A 3

.PDF文档 专利 数据处理方法及装置

安全报告 > 其他 > 文档预览
中文文档 28 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据处理方法及装置 第 1 页 专利 数据处理方法及装置 第 2 页 专利 数据处理方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常2024-03-18 03:03:03上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。