(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210882802.4
(22)申请日 2022.07.22
(71)申请人 深圳零时科技有限公司
地址 518052 广东省深圳市南 山区南头街
道深南大道10168号佳嘉豪商务大厦
18A
(72)发明人 王恩强 黄路明
(74)专利代理 机构 广州三环 专利商标代理有限
公司 44202
专利代理师 薛梦
(51)Int.Cl.
G06F 40/289(2020.01)
G06F 40/30(2020.01)
G06F 40/216(2020.01)
(54)发明名称
文本情感分析模型的训练方法、 装置、 设备
及存储介质
(57)摘要
本申请公开一种文本情感分析模型的训练
方法、 装置、 设备及存储介质, 涉及语言 处理技术
领域, 利用该训练方法训练得到的模 型在进行文
本情感分类时, 能够提高文本情感分类的准确。
具体方案包括: 获取目标文本, 以及目标文本中
各句子的实际情感类型; 确定各句子中各词的字
向量和位置向量, 字向量用于指示词的内容信
息, 位置向量用于指示词在句子中的位置信息;
根据各句子中各词的字向量和位置向量, 以及预
设的情感分析模 型, 对各句子中的词之间的语义
相关性进行分析处理, 得到各句子的预测情感类
型; 根据各句子的第一标签和第二标签, 对情感
分析模型进行训练, 直至各句子的第一标签与第
二标签满足第一预设条件为止, 得到目标情感分
析模型。
权利要求书2页 说明书9页 附图3页
CN 115169345 A
2022.10.11
CN 115169345 A
1.一种文本情感分析模型的训练方法, 其特 征在于, 所述方法包括:
获取目标文本, 并获取所述目标文本包括的多个句子中各所述句子的第一标签, 所述
第一标签用于指示所述句子的实际情感类型;
确定各所述句子中各词的字向量和位置向量, 所述字向量用于指示所述词的内容信
息, 所述位置向量用于指示所述词在所述句子中的位置信息;
根据各所述句子中各词的字向量和位置向量, 以及预设的情感分析模型, 对各所述句
子中的词之间的语义相关性进行分析处理, 得到各所述句 子的第二标签, 所述第二标签用
于指示所述句子的预测情感类型;
根据各所述句子的第一标签和第二标签, 对所述情感分析模型进行训练, 直至各所述
句子的第一标签与第二标签满足第一预设条件为止, 得到目标情感分析模型。
2.根据权利要求1所述的方法, 其特征在于, 所述根据各所述句子 中各词的字向量和位
置向量, 以及预设的情感分析模 型, 对各所述句子中的词之间的语义相关性进 行分析处理,
得到各所述句子的第二标签, 包括:
根据各所述句子 中各词的字向量和位置向量以及所述情感分析模型, 对各所述句子中
的词之间的语义相关性进行分析处 理, 得到各 所述句子的特 征向量;
根据各所述句子的特征向量对各所述句子进行情感分类, 得到各所述句子的第二标
签。
3.根据权利要求2所述的方法, 其特 征在于, 所述获取目标文本之前, 所述方法还 包括:
获取参考文本, 并确定所述参考文本中各参考句子中各参考词的参考字向量、 参考位
置向量和参考文本 向量, 所述参考字 向量用于指示所述参考词的内容信息, 所述参考位置
向量用于指示所述参考词在所述参考句子中的位置信息, 所述参考文本向量用于指示所述
参考词对应的参 考句子的内容信息;
根据各所述参考句子中各参考词的参考字向量、 参考位置向量和所述参考文本向量对
预设的初始情感分析模型进行训练, 直至所述初始情感分析模型收敛, 得到所述情感分析
模型。
4.根据权利要求3所述的方法, 其特征在于, 所述根据各所述参考句子中各参考词的参
考字向量、 参考位置 向量和所述参考文本 向量对预设的初始情感分析模型进行训练, 直至
所述初始情感分析模型收敛, 得到所述情感分析模型, 包括:
根据各所述参考句子中各参考词的参考字向量、 参考位置向量和参考文本向量, 确定
各所述参考句子中各参 考词的参 考词向量;
将各所述参考句子包括的参考词向量输入至所述初始情感分析模型中, 进行语义关联
的编码处 理, 得到各 所述参考句子的句子向量;
将各所述句子向量输入至所述初始情感分析模型中进行解码处理, 得到各所述句子向
量解码后的各参 考词的解码字向量、 解码位置向量和解码文本向量;
将各所述参考句子 中各参考词的参考字向量、 参考位置向量和参考文本向量作为真实
解码标签, 将各所述参考句 子中各参考词的解码字 向量、 解码位置 向量和解码文本 向量作
为预测解码标签;
根据所述真实解码标签和所述预测解码标签对所述初始情感分析模型进行训练, 直至
所述初始情感分析模型收敛, 得到所述情感分析模型。权 利 要 求 书 1/2 页
2
CN 115169345 A
25.根据权利要求1所述的方法, 其特征在于, 所述根据各所述句子 中各词的字向量和位
置向量, 以及预设的情感分析模 型, 对各所述句子中的词之间的语义相关性进 行分析处理,
得到各所述句子的第二标签, 包括:
将各所述句子 中各词的字向量和位置向量输入至初始情感分析模型中, 对各所述句子
中的词之间的语义相关性进行分析处 理, 得到各 所述句子中各词对应的词向量;
将各所述句子 中各词对应的词向量输入至预设的长短期记忆模型中进行特征提取, 得
到各所述句子的特 征向量;
根据各所述句子的特征向量对各所述句子进行情感分类, 得到各所述句子的第二标
签。
6.根据权利要求2或5所述的方法, 其特征在于, 所述根据各所述句子的特征向量对各
所述句子进行情感分类, 得到各 所述句子的第二标签, 包括:
将各所述句子的特征向量输入至预设的全连接神经网络线性分类层中进行分类处理,
得到各所述句子对于不同情感类型的结果 值;
将各所述句子对于不同情 感类型的结果值进行归一化处理, 得到各所述句子对于不同
情感类型的预测分类概 率;
对于各所述句子, 根据 所述句子对于不同情感类型的预测分类概率确定各所述句子的
第二标签。
7.根据权利要求6所述的方法, 其特征在于, 所述第 一标签还包括实际情感类型的实际
概率, 所述预设条件 包括:
各所述句子实际情感类型对应的实际概率与所述实际情感类型对应的预测分类概率
之间的概 率差值的绝对值小于预设阈值。
8.一种文本情感分析模型的训练装置, 其特 征在于, 所述装置包括:
获取模块, 用于获取目标文本, 并获取所述目标文本包括的多个句子中各所述句子的
第一标签, 所述第一标签用于指示所述句子的实际情感类型;
确定模块, 用于确定各所述句子中各词的字向量和位置向量, 所述字向量用于指示所
述词的内容信息, 所述 位置向量用于指示所述词在所述句子中的位置信息;
处理模块, 用于根据各所述句子中各词的字向量和位置向量, 以及预设的情感分析模
型, 对各所述句子中的词之 间的语义相关性进行分析处理, 得到各所述句子的第二标签, 所
述第二标签用于指示所述句子的预测情感类型;
训练模块, 用于根据各所述句子的第一标签和第二标签, 对所述情感分析模型进行训
练, 直至各所述句 子的第一标签与第二标签满足第一预设条件为止, 得到目标情感分析模
型。
9.一种计算机设备, 其特征在于, 包括存储器和处理器, 所述存储器存储有计算机程
序, 所述计算机程序被所述处理器执行时实现权利要求1 ‑7任一项所述的文本情感分析模
型的训练方法。
10.一种计算机可读存储介质, 其特征在于, 其上存储有计算机程序, 所述计算机程序
被处理器执行时实现权利要求1 ‑7任一项所述的文本情感分析模型的训练方法。权 利 要 求 书 2/2 页
3
CN 115169345 A
3
专利 文本情感分析模型的训练方法、装置、设备及存储介质
安全报告 >
其他 >
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-03-03 20:14:30上传分享