专利 基于服务场景识别的语音数据处理方法及相关装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211306175.6 (22)申请日 2022.10.25 (71)申请人深圳市人马互动科技有限公司地址 518000 广东省深圳市南山区粤海街道高新区社区高新南环路46号留学生创业大厦二期20层 (72)发明人顾蓝笛　韩婧　 (74)专利代理机构广州三环专利商标代理有限公司 44202 专利代理师王勤 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/279(2020.01) G06F 40/194(2020.01) G10L 15/30(2013.01)G10L 15/26(2006.01) G10L 15/18(2013.01) (54)发明名称基于服务场景识别的语音数据处理方法及相关装置 (57)摘要本发明公开了一种基于服务场景识别的语音数据处理方法及相关装置，应用于语音互动系统，该方法包括：接收来自电子设备的用户在当前次对话事件中所录入的语音信息，通过人机互动引擎执行如下操作：将语音信息转换为原始文本；根据当前次对话事件的对话内容和/或事件关联信息确定当前次对话事件所属的目标服务场景，事件关联信息包括以下至少一种：电子设备在当前次对话事件中提供的服务或应用的类型、电子设备的设备类型；获取目标服务场景的基准词语集合；根据基准词语集合对原始文本进行分词，得到原始文本的适配目标服务场景的至少一个文本句式；根据至少一个文本句式对原始文本进行语义分析，得到语义分析结果。提高了语义识别的准确率。权利要求书2页说明书11页附图5页 CN 115374793 A 2022.11.22 CN 115374793 A 1.一种基于服务场景识别的语音数据处理方法，其特征在于，应用于语音互动系统的服务器，所述服务器设置有人机互动引擎，所述语音互动系统还包括与所述服务器通信连接的电子设备，所述方法包括：接收来自所述电子设备的用户在当前次对话事件中所录入的语音信息，通过所述人机互动引擎执行如下操作：将所述语音信息转换为原始文本；根据所述当前次对话事件的对话内容和/或事件关联信息确定所述当前次对话事件所属的目标服务场景，所述事件关联信息包括以下至少一种：所述电子设备在所述当前次对话事件中提供的服务或应用的类型、所述电子设备的设备类型；获取所述目标服务场景的基准词语集合；根据所述基准词语集合对所述原始文本进行分词，得到所述原始文本的适配所述目标服务场景的至少一个文本句式；根据所述至少一个文本句式对所述原始文本进行语义分析，得到语义分析结果。 2.根据权利要求1所述的方法，其特征在于，所述至少一个文本句式包括多个，所述根据所述至少一个文本句式对所述原始文本进行语义分析之前，所述方法还包括：确定每个文本句式包括的词语中存在单字的文本句式为目标文本句式；确定所述目标文本句式中包括的单字的可实现性；从多个文本句式中删除所述可实现性低于预设值的文本句式。 3.根据权利要求2所述的方法，其特征在于，所述至少一个文本句式包括多个，所述根据所述至少一个文本句式对所述原始文本进行语义分析，包括：以每个文本句式中包括的基准词语为基础，对所述每个文本句式进行逻辑检测，得到所述每个文本句式的逻辑得分；对所述逻辑得分最高的文本句式进行语义分析，得到语义分析结果。 4.根据权利要求3所述的方法，其特征在于，所述以每个文本句式中包括的基准词语为基础，对所述每个文本句式进行逻辑检测，得到所述每个文本句式的逻辑得分，包括：确定所述每个文本句式中与所述基准词语相邻的词语为校验词语；确定所述基准词语与所述校验词语组合成一个短语的可能性评分；根据所述可能性评分确定所述每个文本句式的逻辑得分。 5.根据权利要求4所述的方法，其特征在于，所述根据所述可能性评分确定所述每个文本句式的逻辑得分，包括：确定所述每个文本句式包括的所有词语中每个词语在所述目标服务场景的出现概率；确定所述每个文本句式中每个词语的系数值，文本句式中距离所述基准词语越远的词语，系数值越低；根据所述每个词语的出现概率和所述系数值确定概率评分；根据所述可能性评分和所述概率评分确定每个文本句式的逻辑得分。 6.根据权利要求1 ‑5任一项所述的方法，其特征在于，所述根据所述基准词语集合对所述原始文本进行分词，包括：根据所述原始文本中包括的基准词语集合确定预设文本库中是否包括与所述原始文本相似度高于预设值的目标文本；权　利　要　求　书 1/2 页 2 CN 115374793 A 2若存在，则根据所述目标文本的分词结果对所述原始文本进行分词。 7.根据权利要求6所述的方法，其特征在于，所述方法还包括：获取所述用户的历史文本，所述历史文本为根据所述用户的历史语音记录转换后的文本，所述历史文本对应的文本句式为用于语义分析的文本句式；将所述历史文本和所述历史文本对应的文本句式添加到所述预设文本库。 8.一种基于服务场景识别的语音数据处理装置，其特征在于，应用于语音互动系统的服务器，所述服务器设置有人机互动引擎，所述语音互动系统还包括与所述服务器通信连接的电子设备，包括：接收单元：用于接收来自所述电子设备的用户在当前次对话事件中所录入的语音信息，通过所述人机互动引擎执行如下操作：确定单元：用于将所述语音信息转换为原始文本；根据所述当前次对话事件的对话内容和/或事件关联信息确定所述当前次对话事件所属的目标服务场景，所述事件关联信息包括以下至少一种：所述电子设备在所述当前次对话事件中提供的服务或应用的类型、所述电子设备的设备类型；分析单元：用于获取所述目标服务场景的基准词语集合；根据所述基准词语集合对所述原始文本进行分词，得到所述原始文本的适配所述目标服务场景的至少一个文本句式；根据所述至少一个文本句式对所述原始文本进行语义分析，得到语义分析结果。 9.一种电子设备，其特征在于，包括处理器、存储器、通信接口，以及一个或多个程序，所述一个或多个程序被存储在所述存储器中，并且被配置由所述处理器执行，所述程序包括用于执行如权利要求1 ‑7任一项所述的方法中的步骤的指令。 10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储用于电子数据交换的计算机程序，其中，所述计算机程序使得计算机执行如权利要求 1‑7中任一项所述的方法。权　利　要　求　书 2/2 页 3 CN 115374793 A 3

专利 基于服务场景识别的语音数据处理方法及相关装置

专利基于服务场景识别的语音数据处理方法及相关装置