说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111602632.1 (22)申请日 2021.12.24 (71)申请人 阿里巴巴 (中国) 有限公司 地址 310052 浙江省杭州市滨江区长河街 道网商路69 9号4号楼5楼5 08室 (72)发明人 李朝 林超 邹朋成 章嘉伦  胡始昌  (74)专利代理 机构 北京太合九思知识产权代理 有限公司 1 1610 代理人 刘戈 柴艳波 (51)Int.Cl. G06F 3/01(2006.01) G06F 3/04845(2022.01) G06N 20/00(2019.01) G06Q 30/06(2012.01) (54)发明名称 图像处理方法、 系统及电子设备 (57)摘要 本申请实施例提供一种图像处理方法、 系统 及电子设备。 其中, 方法包括如下的步骤: 响应于 用户通过客户端针对一商品触发的请求, 确定商 品图及模特图; 对所述商品图及所述模特图进行 处理, 得到模特展示所述商品的展示图; 获取反 映所述商品特点的描述信息; 基于所述展示图及 所述描述信息, 生成所述商品对应的多媒体展示 信息。 采用本申请提供的技术方案, 能够实现集 商品对应的展示图、 商品对应的描述信息(或称 为商品卖点)、 商品对应的多媒体展示信息为一 体化的自动生成方案, 这利于帮助用户及时上新 商品、 并有效帮助用户减低经营成本和维度时 间。 权利要求书3页 说明书22页 附图8页 CN 114356084 A 2022.04.15 CN 114356084 A 1.一种图像处 理方法, 其特 征在于, 包括: 响应于用户通过客户端针对一商品触发的请求, 确定商品图及模特图; 对所述商品图及所述模特图进行处 理, 得到模特展示所述商品的展示图; 获取反映所述商品特点的描述信息; 基于所述展示图及所述描述信息, 生成所述商品对应的多媒体展示信息 。 2.根据权利要求1所述的方法, 其特征在于, 对所述商品图及所述模特图进行处理, 得 到模特展示所述商品的展示图, 包括: 获取图像处 理模型, 其中, 所述图像处 理模型包括形变网络和合成网络; 将所述商 品图及所述模特图输入所述形变网络, 输出按照所述模特图中模特姿态对所 述商品图进行 形变后的商品形变图; 将所述商品形变图及所述模特图输入所述合成网络, 输出模特展示所述商品的展示 图。 3.根据权利要求2所述的方法, 其特 征在于, 还 包括: 利用第一训练集, 对所述图像处 理模型进行第一阶段训练; 确定模特样本图及所述模特样本图中模特展示第一样本商品对应的样本商品图; 利用完成第 一阶段训练 的所述图像处理模型, 生成所述模特样本图中模特展示第 二样 本商品的样本展示图; 将所述模特样本图、 所述第 一样本商 品对应的样本商 品图及所述样本展示图作为第 二 训练样本集中的训练样本; 利用第二训练集, 对所述图像处 理模型进行第二阶段训练。 4.根据权利要求1至3中任一项所述的方法, 其特征在于, 获取反映所述商品特点的描 述信息, 包括: 从所述商品图中提取图像特 征; 获取所述商品图对应商品的商品信息; 基于所述商品信息, 确定与所述商品相关的文本特 征; 融合所述图像特 征及文本特 征, 得到融合信息; 根据所述融合信息, 确定所述描述信息 。 5.根据权利要求4所述的方法, 其特征在于, 基于所述商品信息, 确定与所述商品相关 的文本特 征, 包括: 从所述商品信息中提取第一文本特 征; 从知识图谱中选取与所述商品相关的词条; 基于选取出的词条, 确定第二文本特 征。 6.根据权利要求5所述的方法, 其特征在于, 融合所述图像特征及文本特征, 得到融合 信息, 包括: 利用编码网络模型, 分别对所述图像特征、 所述第一文本特征及所述第二文本特征进 行编码, 得到对应的图像特 征向量、 第一文本特 征向量及第二文本特 征向量; 基于注意力 机制融合所述图像特征向量、 所述第 一文本特征向量和所述第 二文本特征 向量, 得到所述融合信息 。 7.根据权利要求1至3中任一项所述的方法, 其特征在于, 基于所述展示图及所述描述权 利 要 求 书 1/3 页 2 CN 114356084 A 2信息, 生成所述商品对应的多媒体展示信息, 包括: 根据所述描述信息, 生成音频; 获取预设视频; 将所述音频及所述预设视频输入驱动模型, 输出所述预设视频中目标对象嘴部按照所 述音频做出发音动作、 面部按照所述音频做出表情动作的驱动视频; 利用所述驱动视频, 驱动所述展示图中模特做出相应动作, 得到展示动画; 基于所述展示动画及所述音频, 生成所述商品对应的多媒体展示信息 。 8.根据权利要求7所述的方法, 其特征在于, 利用所述驱动视频, 驱动所述展示图中模 特做出相应动作得到所述展示动画, 包括: 对所述驱动视频的图像帧中的运动关键点进行提取; 根据提取出的各图像帧的运动关键点信 息及图像帧的顺序, 确定相邻图像帧间的运动 信息; 基于相邻图像帧间的运动信息, 对所述展示图中模特相应区域的像素点进行形变, 得 到一帧形变图; 按照所述驱动视频中图像帧的顺序, 顺序播 放多帧形变图, 得到所述展示动画。 9.一种图像处 理方法, 其特 征在于, 包括: 获取用户输入的模特展示商品的展示图像; 获取所述展示商品的描述信息; 根据所述描述信息及所述展示图像, 生成模特展示所述商品的展示视频。 10.根据权利要求9所述的方法, 其特征在于, 根据 所述描述信 息及所述展示图像, 生成 模特展示所述商品的展示视频, 包括: 根据所述描述信息, 生成音频; 按照所述音频, 驱动所述展示图像中模特的嘴部及面部动作, 生成所述展示视频。 11.一种图像处 理方法, 其特 征在于, 包括: 响应于用户针对一商品触发的请求, 获取商品图; 确定模特图; 对所述商品图及所述模特图进行处 理, 得到模特展示所述商品的展示图; 获取反映所述商品特点的描述信息; 基于所述展示图及所述描述信息, 生成所述商品对应的多媒体展示信息, 便于用户将 所述多媒体展示信息作为展示内容展示在所述商品对应的展示页内。 12.一种图像处 理息系统, 其特 征在于, 包括: 客户端, 用于响应于用户针对一商品触发的请求, 向服 务端发送相应的请求信息; 服务端, 用于接收到所述请求信息后, 确定商品图及模特图; 对所述商品图及所述模特 图进行处理, 得到模 特展示所述商品的展示图; 获取反映所述商品特点的描述信息; 基于所 述展示图及所述描述信息, 生成所述商品对应的多媒体展示信息; 将所述多媒体展示信息 发送至客户端; 所述客户端, 还用于播 放所述多媒体展示信息 。 13.根据权利要求12所述的系统, 其特 征在于, 所述服务端, 还用于训练多个模型;权 利 要 求 书 2/3 页 3 CN 114356084 A 3

.PDF文档 专利 图像处理方法、系统及电子设备

文档预览
中文文档 34 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共34页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像处理方法、系统及电子设备 第 1 页 专利 图像处理方法、系统及电子设备 第 2 页 专利 图像处理方法、系统及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:16:32上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。