(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210867697.7
(22)申请日 2022.07.22
(71)申请人 腾讯科技 (深圳) 有限公司
地址 518000 广东省深圳市南 山区高新区
科技中一路腾讯大厦3 5层
(72)发明人 王子禛
(74)专利代理 机构 深圳市联鼎知识产权代理有
限公司 4 4232
专利代理师 陈文君
(51)Int.Cl.
G06F 16/35(2019.01)
G06F 40/30(2020.01)
G06F 40/284(2020.01)
G06F 40/216(2020.01)
G06K 9/62(2022.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
语义类型识别方法、 装置、 计算机可读介质
及电子设备
(57)摘要
本申请公开了一种语义类型识别方法、 装
置、 计算机可读介质以及电子设备, 所述方法包
括: 根据待识别语义请求在预设模板库中匹配,
得到目标语义请求模板, 并获取目标语义请求模
板的模板 特征; 对待识别语义请求进行文本特征
提取, 得到待识别语义请求对应的文本特征; 根
据模板特征和文本特征进行第一语义类型识别,
并融合目标语义请求模板对应的指定语义类型,
得到目标语义类型识别结果。 本申请技术方案可
以对语音请求进行语义类型识别, 一方面考虑了
语义请求模板所提供的先验知识, 另一方面考虑
了待识别语义请求本身的文本特征, 也就是在语
义类型识别过程考虑了多角度特征, 提高了语义
识别的准确性和泛化能力。
权利要求书2页 说明书18页 附图7页
CN 115203418 A
2022.10.18
CN 115203418 A
1.一种语义类型识别方法, 其特 征在于, 包括:
根据待识别语义请求在预设模板库中匹配, 得到目标语义请求模板, 并获取所述目标
语义请求模板的模板特 征; 所述预设模板库包括多个指定语义类型的语义请求模板;
对所述待识别语义请求进行文本特征提取, 得到所述待识别语义请求对应的文本特
征;
根据所述目标语义请求模板的模板特征和所述文本特征进行第 一语义类型识别, 得到
第一语义类型识别结果;
对所述第一语义类型识别结果和所述目标语义请求模板对应的指定语义类型进行融
合, 得到目标语义类型识别结果, 所述 目标语义类型识别结果指示所述待识别语义请求的
类型为复合语义请求或简单语义请求, 所述复合语义请求包括具有多个意图的语义请求,
所述简单语义请求包括具有单一 意图的语义请求。
2.根据权利要求1所述的语义类型识别方法, 其特征在于, 根据待识别语义请求在预设
模板库中匹配, 得到目标语义请求模板, 包括:
根据待识别语义请求在预设模板库中匹配, 得到多个候选语义请求模板;
计算各个候选语义请求模板的置信度得分, 所述置信度得分与 所述待识别语义请求中
通配符的占比呈负相关 关系;
根据所述置信度得分对所述多个候选语义请求模板进行筛选, 得到目标语义请求模
板。
3.根据权利要求1所述的语义类型识别方法, 其特征在于, 所述模板特征包括模板向
量; 获取所述目标语义请求模板的模板特 征, 包括:
对所述目标语义请求模板进行分词处 理, 得到多个模板词汇;
对所述多个模板词汇进行向量映射, 得到多个词汇向量, 并将所述多个词汇向量组成
模板向量矩阵;
对所述模板向量矩阵进行池化处 理, 得到所述目标语义请求模板的模板向量。
4.根据权利要求1所述的语义类型识别方法, 其特征在于, 对所述第 一语义类型识别结
果和所述 目标语义请求模板对应的指定语义类型进行融合, 得到目标语义类型识别结果,
包括:
获取模板权重, 所述模板权重体现所述目标语义请求模板的指定语义类型在所述目标
语义类型识别结果中的重要程度;
根据所述模板权重对所述目标语义请求模板的指定语义类型进行调 整, 得到第 二语义
类型识别结果;
对所述第一语义类型识别结果和所述第 二语义类型识别结果进行融合, 得到所述目标
语义类型识别结果。
5.根据权利要求 4所述的语义类型识别方法, 其特 征在于, 获取模板 权重, 包括:
检测模板 权重参数是否具有设定值;
若所述模板 权重参数具有设定值, 则将所述设定值作为所述模板 权重;
若所述模板权重参数不具有设定值, 则根据 所述目标语义请求模板的模板特征和所述
文本特征计算得到所述模板 权重。
6.根据权利要求5所述的语义类型识别方法, 其特征在于, 所述目标语义请求模板的模权 利 要 求 书 1/2 页
2
CN 115203418 A
2板特征包括所述目标语义请求模板的模板向量和所述目标语义请求模板的置信度得分; 根
据所述目标语义请求模板的模板特 征和所述文本特 征计算得到所述模板 权重, 包括:
将所述目标语义请求模板的模板向量和所述目标语义请求模板的置信度得分相乘, 得
到初始权 重;
根据所述初始权 重和所述文本特 征进行特征提取和映射处 理, 得到所述模板 权重。
7.根据权利要求1 ‑6任一项所述的语义类型识别方法, 其特征在于, 对所述待识别语义
请求进行文本特 征提取, 得到所述待识别语义请求对应的文本特 征, 包括:
对所述待识别语义请求进行分词处 理, 得到多个待识别词汇;
对所述多个待识别词汇进行向量映射, 得到多个词汇向量, 并将所述多个词汇向量组
成待识别向量矩阵;
通过多种尺寸的卷积核对所述待识别向量矩阵进行 卷积处理, 得到多个卷积向量;
对所述多个卷积向量进行池化处 理, 得到多个池化数据;
将所述多个池化数据拼接, 得到所述待识别语义请求对应的文本特 征。
8.一种语义类型识别装置, 其特 征在于, 包括:
模板匹配模块, 用于根据待识别语义请求在预设模板库中匹配, 得到目标语义请求模
板, 并获取所述目标语义请求模板的模板特征; 所述预设模板库包括多个指定语义类型 的
语义请求模板;
文本特征提取模块, 用于对所述待识别语义请求进行文本特征提取, 得到所述待识别
语义请求对应的文本特 征;
第一语义类型识别模块, 用于根据 所述目标语义请求模板的模板特征和所述文本特征
进行第一语义类型识别, 得到第一语义类型识别结果;
目标语义类型识别模块, 用于对所述第 一语义类型识别结果和所述目标语义请求模板
对应的指定语义类型进行融合, 得到目标语义类型识别结果, 所述 目标语义类型识别结果
指示所述待识别语义请求的类型为复合语义请求或简单语义请求, 所述复合语义请求包括
具有多个意图的语义请求, 所述简单语义请求包括具有单一 意图的语义请求。
9.一种计算机可读介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被处理器
执行时实现权利要求1至7中任意 一项所述的语义类型识别方法。
10.一种电子设备, 其特 征在于, 包括:
处理器; 以及
存储器, 用于存 储所述处 理器的可 执行指令;
其中, 所述处理器执行所述可执行指令使得所述电子设备执行权利要求1至7中任意一
项所述的语义类型识别方法。权 利 要 求 书 2/2 页
3
CN 115203418 A
3
专利 语义类型识别方法、装置、计算机可读介质及电子设备
安全报告 >
其他 >
文档预览
中文文档
28 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-03-03 20:14:30上传分享