专利评价画像生成方法、装置、设备及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210255933.X (22)申请日 2022.03.15 (71)申请人平安国际智慧城市科技股份有限公司地址 518000 广东省深圳市前海深港合作区妈湾兴海大道3048号前海自贸大厦 1-34层 (72)发明人杨婉琪　 (74)专利代理机构深圳市赛恩倍吉知识产权代理有限公司 4 4334 专利代理师常云敏　陈海云 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/30(2020.01) G06F 16/583(2019.01)G06V 30/10(2022.01) G06V 30/19(2022.01) G06V 10/74(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06Q 30/02(2012.01) (54)发明名称评价画像生成方法、装置、设备及存储介质 (57)摘要本发明涉及人工智能，提供一种评价画像生成方法、装置、设备及存储介质。该方法获取评论文本，包括表情图标及文本字符，识别表情图标的图标情感及文本字符的字符含义，基于图标情感及字符含义对评论文本进行转换处理，得到初始文本，对初始文本进行文本纠错处理，得到目标文本，基于文本编码网络对目标文本进行处理，得到文本向量，基于文本解码网络对文本向量识别，能够准确的得到评价画像。此外，本发明还涉及区块链技术，所述评价画像可存储于区块链中。权利要求书3页说明书17页附图2页 CN 114637856 A 2022.06.17 CN 114637856 A 1.一种评价画像生成方法，其特征在于，所述评价画像生成方法包括：当接收到评价画像生成请求时，根据所述评价画像生成请求获取评论文本，所述评论文本中包括预设字符，所述预设字符包括表情图标及文本字符；识别所述表情图标的图标情感，并识别所述文本字符的字符含义；基于所述图标情感及所述字符含义对所述评论文本进行转换处理，得到初始文本；基于预先训练好的文本纠错模型对所述初始文本进行文本纠错处理，得到目标文本；获取预先训练好的文本标签识别模型，所述文本标签识别模型包括文本编码网络及文本解码网络；基于所述文本编码网络对所述目标文本进行处理，得到文本向量；基于所述文本解码网络对所述文本向量识别，得到所述评论文本的评价画像。 2.如权利要求1所述的评价画像生成方法，其特征在于，所述识别所述表情图标的图标情感包括：获取所述表情图标的像素信息；根据所述像素信息生成所述表情图标的图标向量；基于所述图标向量及预设向量计算所述表情图标与预设图标的图标相似度；将所述图标相似度大于预设图标相似度阈值所对应的预设图标确定为目标图标，并将所述目标图标所对应的情感信息确定为所述图标情感。 3.如权利要求1所述的评价画像生成方法，其特征在于，所述识别所述文本字符的字符含义包括：统计所述文本字符的字符长度；从预设字符库中筛选出与所述字符长度对应的初始字符；比较所述文本字符与所述初始字符；若所述文本字符与所述初始字符不同，则从所述预设字符库中获取与所述文本字符中的连续字符相同的目标字符；获取与所述目标字符所对应的语义信息，并依照所述目标字符在所述文本字符中的字符位置拼接所述语义信息，得到所述字符含义。 4.如权利要求1所述的评价画像生成方法，其特征在于，所述基于所述图标情感及所述字符含义对所述评论文本进行转换处理，得到初始文本包括：获取所述图标情感的情绪值；将情绪值处于预设区间的图标情感作为第一情感，并将情绪值不处于预设区间的图标情感作为第二情感；获取所述评论文本中的地址路径；基于所述字符含义检测所述文本字符是否属于广告信息；若所述文本字符属于广告信息，则基于所述地址路径、所述文本字符及所述第一情感所对应的表情图标对所述评论文本进行清洗处理，得到清洗后的文本；基于所述第二情感对所述清洗后的文本中的表情图标进行替换，得到所述初始文本。 5.如权利要求1所述的评价画像生成方法，其特征在于，所述文本纠错模型包括文本划分网络及合法性预测网络，所述基于预先训练好的文本纠错模型对所述初始文本进行文本纠错处理，得到目标文本包括：权　利　要　求　书 1/3 页 2 CN 114637856 A 2统计所述初始文本的文本长度；根据所述文本长度从所述文本划分网络中选取目标字符数量对所述初始文本依次进行划分，得到多个初始词组；基于所述合法性预测网络计算每个初始词组的合法概率；获取所述文本纠错模型的预设合法阈值；将所述合法概率小于所述预设合法阈值的初始词组确定为目标词组；获取与所述目标词组的词组相似度大于预设相似度阈值的预设词组作为替换词组；基于所述替换词组对所述初始文本中的目标词组进行替换，得到所述目标文本。 6.如权利要求1所述的评价画像生成方法，其特征在于，所述基于所述文本编码网络对所述目标文本进行处理，得到文本向量包括：对所述目标文本中每个文本词汇进行词嵌入编码，得到每个文本词汇的初始向量，并定位每个文本词汇在所述目标文本中的词汇顺序；对于任意第一文本词汇，获取所述词汇顺序小于所述第一文本词汇的邻近文本词汇作为第二文本词汇，并获取所述词汇顺序大于所述第一文本词汇的邻近文本词汇作为第三文本词汇；基于所述第二文本词汇的初始向量对所述第二文本词汇的状态向量进行初始化处理，并基于所述第三文本词汇的初始向量对所述第三文本词汇的状态向量进行初始化处理；基于所述文本编码网络对所述第一文本词汇的初始向量及所述第二文本词汇的状态向量进行处理，得到所述第一文本词汇的第一状态向量，并基于所述文本编码网络对所述第一文本词汇的初始向量及所述第三文本词汇的状态向量进行处理，得到所述第一文本词汇的第二状态向量；拼接所述第一状态向量及所述第二状态向量，得到所述第一文本词汇的目标状态向量；获取所述文本编码网络的注意力权值；基于所述注意力权值对所述目标状态向量进行加权平均运算处理，得到所述文本向量。 7.如权利要求6所述的评价画像生成方法，其特征在于，所述基于所述文本解码网络对所述文本向量识别，得到所述评论文本的评价画像包括：对于任一文本词汇，获取所述任一文本词汇的目标状态向量作为第一向量，并获取所述词汇顺序小于所述任一文本词汇的目标词汇所对应的目标状态向量作为第二向量；基于所述文本解码网络对所述第一向量及所述第二向量进行处理，得到解码状态向量；获取所述文本解码网络的预设网络矩阵；基于所述预设网络矩阵对所述文本向量及所述解码状态向量拼接后的向量进行处理，得到所述任一文本词汇的概率向量；计算所述概率向量中所有元素的总和，得到所述任一文本词汇的词汇分数；将所述词汇分数大于预设分数阈值的文本词汇确定为所述评价画像。 8.一种评价画像生成装置，其特征在于，所述评价画像生成装置包括：获取单元，用于当接收到评价画像生成请求时，根据所述评价画像生成请求获取评论权　利　要　求　书 2/3 页 3 CN 114637856 A 3

专利 评价画像生成方法、装置、设备及存储介质

专利评价画像生成方法、装置、设备及存储介质