全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210255933.X (22)申请日 2022.03.15 (71)申请人 平安国际智慧城市科技股份有限公 司 地址 518000 广东省深圳市前海深港合作 区妈湾兴海 大道3048号前海自贸大厦 1-34层 (72)发明人 杨婉琪  (74)专利代理 机构 深圳市赛恩倍吉知识产权代 理有限公司 4 4334 专利代理师 常云敏 陈海云 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/30(2020.01) G06F 16/583(2019.01)G06V 30/10(2022.01) G06V 30/19(2022.01) G06V 10/74(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06Q 30/02(2012.01) (54)发明名称 评价画像生成方法、 装置、 设备及存 储介质 (57)摘要 本发明涉及人工智能, 提供一种评价画像生 成方法、 装置、 设备及存储介质。 该方法获取评论 文本, 包括表情图标及文本字符, 识别表情图标 的图标情感及文本字符的字 符含义, 基于图标情 感及字符含义对评论文本进行转换处理, 得到初 始文本, 对初始文本进行文本纠错处理, 得到目 标文本, 基于文本编码网络对目标文本进行处 理, 得到文本向量, 基于文本解码网络对文本向 量识别, 能够准确的得到评价画 像。 此外, 本发明 还涉及区块链 技术, 所述评价画 像可存储于区块 链中。 权利要求书3页 说明书17页 附图2页 CN 114637856 A 2022.06.17 CN 114637856 A 1.一种评价画像生成方法, 其特 征在于, 所述评价画像生成方法包括: 当接收到评价画像生成请求时, 根据所述评价画像生成请求获取评论文本, 所述评论 文本中包括预设字符, 所述预设字符包括表情图标及文本 字符; 识别所述表情图标的图标情感, 并识别所述文本 字符的字符含义; 基于所述图标情感及所述字符含义对所述评论文本进行转换处 理, 得到初始文本; 基于预先训练好的文本纠错模型对所述初始文本进行文本纠错处 理, 得到目标文本; 获取预先训练好的文本标签识别模型, 所述文本标签识别模型包括文本编码网络及文 本解码网络; 基于所述文本编码网络对所述目标文本进行处 理, 得到文本向量; 基于所述文本解码网络对所述文本向量识别, 得到所述评论文本的评价画像。 2.如权利要求1所述的评价画像生成方法, 其特征在于, 所述识别所述表情图标的图标 情感包括: 获取所述表情图标的像素信息; 根据所述像素信息生成所述表情图标的图标向量; 基于所述图标向量及预设向量计算所述表情图标与预设图标的图标相似度; 将所述图标相似度大于预设图标相似度阈值所对应的预设图标确定为目标图标, 并将 所述目标图标 所对应的情感信息确定为所述图标情感。 3.如权利要求1所述的评价画像生成方法, 其特征在于, 所述识别所述文本字符的字符 含义包括: 统计所述文本 字符的字符长度; 从预设字符库中筛 选出与所述字符长度对应的初始字符; 比较所述文本 字符与所述初始字符; 若所述文本字符与 所述初始字符不同, 则从所述预设字符库中获取与 所述文本字符中 的连续字符相同的目标字符; 获取与所述目标字符所对应的语义信 息, 并依照所述目标字符在所述文本字符中的字 符位置拼接所述语义信息, 得到所述字符含义。 4.如权利要求1所述的评价画像生成方法, 其特征在于, 所述基于所述图标情感及所述 字符含义对所述评论文本进行转换处 理, 得到初始文本包括: 获取所述图标情感的情绪 值; 将情绪值处于预设区间的图标情 感作为第 一情感, 并将情绪值不处于预设区间的图标 情感作为第二情感; 获取所述评论文本中的地址路径; 基于所述字符含义检测所述文本 字符是否属于广告信息; 若所述文本字符属于广告信息, 则基于所述地址路径、 所述文本字符及所述第一情感 所对应的表情图标对所述评论文本进行清洗处 理, 得到清洗后的文本; 基于所述第二情感对所述清洗后的文本中的表情图标进行替换, 得到所述初始文本 。 5.如权利要求1所述的评价画像生成方法, 其特征在于, 所述文本纠错模型包括文本划 分网络及合法性预测网络, 所述基于预先训练好的文本纠错模型对所述初始文本进行文本 纠错处理, 得到目标文本包括:权 利 要 求 书 1/3 页 2 CN 114637856 A 2统计所述初始文本的文本 长度; 根据所述文本长度从所述文本划分网络中选取目标字符数量对所述初始文本依次进 行划分, 得到多个初始词组; 基于所述 合法性预测网络计算每 个初始词组的合法概 率; 获取所述文本纠错模型的预设合法阈值; 将所述合法概率小于所述预设合法阈值的初始词组确定为目标词组; 获取与所述目标词组的词组相似度大于预设相似度阈值的预设词组作为 替换词组; 基于所述 替换词组对所述初始文本中的目标词组进行替换, 得到所述目标文本 。 6.如权利要求1所述的评价画像生成方法, 其特征在于, 所述基于所述文本编码网络对 所述目标文本进行处 理, 得到文本向量包括: 对所述目标文本中每个文本词汇进行词嵌入编码, 得到每个文本词汇的初始向量, 并 定位每个文本词汇在所述目标文本中的词汇顺序; 对于任意第 一文本词汇, 获取所述词汇顺序小于所述第 一文本词汇的邻 近文本词汇作 为第二文本词汇, 并获取所述词汇顺序大于所述第一文本词汇的邻近文本词汇作为第三文 本词汇; 基于所述第 二文本词汇的初始向量对所述第 二文本词汇的状态向量进行初始化处理, 并基于所述第三文本词汇的初始向量对所述第三文本词汇的状态向量进行初始化处 理; 基于所述文本编码网络对所述第一文本词汇的初始向量及所述第二文本词汇的状态 向量进行处理, 得到所述第一文本词汇的第一状态向量, 并基于所述文本编码网络对所述 第一文本词汇的初始向量及所述第三文本词汇的状态向量进 行处理, 得到所述第一文本词 汇的第二状态向量; 拼接所述第一状态向量及所述第二状态向量, 得到所述第一文本词汇的目标状态向 量; 获取所述文本编码网络的注意力权值; 基于所述注意力权值对所述目标状态向量进行加权平均运算处理, 得到所述文本向 量。 7.如权利要求6所述的评价画像生成方法, 其特征在于, 所述基于所述文本解码网络对 所述文本向量识别, 得到所述评论文本的评价画像包括: 对于任一文本词汇, 获取所述任一文本词汇的目标状态向量作为第一向量, 并获取所 述词汇顺序小于所述任一文本词汇的目标词汇所对应的目标状态向量作为第二向量; 基于所述文本解码网络对所述第一向量及所述第二向量进行处理, 得到解码状态向 量; 获取所述文本解码网络的预设网络矩阵; 基于所述预设网络矩阵对所述文本向量及所述解码状态向量拼接后的向量进行处理, 得到所述任一文本词汇的概 率向量; 计算所述 概率向量中所有元 素的总和, 得到所述任一文本词汇的词汇分数; 将所述词汇分数 大于预设 分数阈值的文本词汇确定为所述评价画像。 8.一种评价画像生成装置, 其特 征在于, 所述评价画像生成装置包括: 获取单元, 用于当接收到评价画像生成请求时, 根据所述评价画像生成请求获取评论权 利 要 求 书 2/3 页 3 CN 114637856 A 3

.PDF文档 专利 评价画像生成方法、装置、设备及存储介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 评价画像生成方法、装置、设备及存储介质 第 1 页 专利 评价画像生成方法、装置、设备及存储介质 第 2 页 专利 评价画像生成方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 09:00:14上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。