(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211306175.6
(22)申请日 2022.10.25
(71)申请人 深圳市人马互动科技有限公司
地址 518000 广东省深圳市南 山区粤海街
道高新区社区高新南环路46号留学生
创业大厦二期20层
(72)发明人 顾蓝笛 韩婧
(74)专利代理 机构 广州三环 专利商标代理有限
公司 44202
专利代理师 王勤
(51)Int.Cl.
G06F 40/30(2020.01)
G06F 40/279(2020.01)
G06F 40/194(2020.01)
G10L 15/30(2013.01)G10L 15/26(2006.01)
G10L 15/18(2013.01)
(54)发明名称
基于服务场景识别的语音数据处理方法及
相关装置
(57)摘要
本发明公开了一种基于服务场景识别的语
音数据处理方法及相关装置, 应用于语音互动系
统, 该方法包括: 接收来自电子设备的用户在当
前次对话事件中所录入的语音信息, 通过人机互
动引擎执行如下操作: 将语音信息转换为原始文
本; 根据当前次对话事件的对话内容和/或事件
关联信息确定当前次对话事件所属的目标服务
场景, 事件关联信息包括以下至少一种: 电子设
备在当前次对话事件中提供的服务或应用的类
型、 电子设备的设备类型; 获取目标服务场景的
基准词语集合; 根据基准词语集合对原始文本进
行分词, 得到原始文本的适配目标服务场景的至
少一个文本句式; 根据至少一个文本句式对原始
文本进行语义分析, 得到语义分析结果。 提高了
语义识别的准确率。
权利要求书2页 说明书11页 附图5页
CN 115374793 A
2022.11.22
CN 115374793 A
1.一种基于服务场景识别的语音数据处理方法, 其特征在于, 应用于语音互动系统的
服务器, 所述服务器设置有人机互动引擎, 所述语音互动系统还包括与所述服务器通信连
接的电子设备, 所述方法包括:
接收来自所述电子设备的用户在 当前次对话事件中所录入的语音信 息, 通过所述人机
互动引擎执 行如下操作:
将所述语音信息转换为原 始文本;
根据所述当前次对话事件的对话内容和/或事件关联信 息确定所述当前次对话事件所
属的目标服务场景, 所述事件关联信息包括以下至少一种: 所述电子设备在所述当前次对
话事件中提供的服 务或应用的类型、 所述电子设备的设备类型;
获取所述目标服 务场景的基准词语集 合;
根据所述基准词语集合对所述原始文本进行分词, 得到所述原始文本的适配所述目标
服务场景的至少一个文本句式;
根据所述至少一个文本句式对所述原 始文本进行语义分析, 得到语义分析 结果。
2.根据权利要求1所述的方法, 其特征在于, 所述至少一个文本句式包括多个, 所述根
据所述至少一个文本句式对所述原 始文本进行语义分析之前, 所述方法还 包括:
确定每个文本句式包括的词语中存在单字的文本句式为目标文本句式;
确定所述目标文本句式 中包括的单字的可实现性;
从多个文本句式 中删除所述可实现性低于预设值的文本句式。
3.根据权利要求2所述的方法, 其特征在于, 所述至少一个文本句式包括多个, 所述根
据所述至少一个文本句式对所述原 始文本进行语义分析, 包括:
以每个文本句式中包括的基准词语为基础, 对所述每个文本句式进行逻辑检测, 得到
所述每个文本句式的逻辑得分;
对所述逻辑得分最高的文本句式进行语义分析, 得到语义分析 结果。
4.根据权利要求3所述的方法, 其特征在于, 所述以每个文本句式中包括的基准词语为
基础, 对所述每 个文本句式进行逻辑检测, 得到所述每 个文本句式的逻辑得分, 包括:
确定所述每 个文本句式 中与所述基准词语相邻的词语为校验词语;
确定所述基准词语与所述校验词语组合成一个短语的可能性评分;
根据所述可能性评分确定所述每 个文本句式的逻辑得分。
5.根据权利要求4所述的方法, 其特征在于, 所述根据所述可能性评分确定所述每个文
本句式的逻辑得分, 包括:
确定所述每 个文本句式包括的所有词语中每 个词语在所述目标服 务场景的出现概 率;
确定所述每个文本句式中每个词语的系数值, 文本句式中距离所述基准词语越远的词
语, 系数值越低;
根据所述每 个词语的出现概 率和所述系数值确定概 率评分;
根据所述可能性评分和所述 概率评分确定每 个文本句式的逻辑得分。
6.根据权利要求1 ‑5任一项所述的方法, 其特征在于, 所述根据 所述基准词语集合对所
述原始文本进行分词, 包括:
根据所述原始文本中包括的基准词语集合确定预设文本库中是否包括与所述原始文
本相似度高于预设值的目标文本;权 利 要 求 书 1/2 页
2
CN 115374793 A
2若存在, 则根据所述目标文本的分词结果对所述原 始文本进行分词。
7.根据权利要求6所述的方法, 其特 征在于, 所述方法还 包括:
获取所述用户的历史文本, 所述历史文本为根据 所述用户的历史语音记录转换后的文
本, 所述历史文本对应的文本句式为用于语义分析的文本句式;
将所述历史文本和所述历史文本对应的文本句式添加到所述预设文本库。
8.一种基于服务场景识别的语音数据处理装置, 其特征在于, 应用于语音互动系统的
服务器, 所述服务器设置有人机互动引擎, 所述语音互动系统还包括与所述服务器通信连
接的电子设备, 包括:
接收单元: 用于接收来自所述电子设备的用户在当前次对话事件中所录入的语音信
息, 通过所述人机互动引擎执 行如下操作:
确定单元: 用于将所述语音信息转换为原 始文本;
根据所述当前次对话事件的对话内容和/或事件关联信 息确定所述当前次对话事件所
属的目标服务场景, 所述事件关联信息包括以下至少一种: 所述电子设备在所述当前次对
话事件中提供的服 务或应用的类型、 所述电子设备的设备类型;
分析单元: 用于获取 所述目标服 务场景的基准词语集 合;
根据所述基准词语集合对所述原始文本进行分词, 得到所述原始文本的适配所述目标
服务场景的至少一个文本句式;
根据所述至少一个文本句式对所述原 始文本进行语义分析, 得到语义分析 结果。
9.一种电子设备, 其特征在于, 包括处理器、 存储器、 通信接口, 以及一个或多个程序,
所述一个或多个程序被存储在所述存储器中, 并且被配置由所述处理器执行, 所述程序包
括用于执 行如权利要求1 ‑7任一项所述的方法中的步骤的指令 。
10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储用于电子数
据交换的计算机程序, 其中, 所述计算机程序使得计算机执行如权利要求 1‑7中任一项 所述
的方法。权 利 要 求 书 2/2 页
3
CN 115374793 A
3
专利 基于服务场景识别的语音数据处理方法及相关装置
安全报告 >
其他 >
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-03-03 20:13:37上传分享