(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211311084.1
(22)申请日 2022.10.25
(71)申请人 仿脑科技 (深圳) 有限公司
地址 518000 广东省深圳市福田区沙 头街
道天安社区深南大道6029号江西大厦
世纪豪庭 20C2
(72)发明人 陈鹏福 胡天宝 覃伟
(74)专利代理 机构 广东众赢专利代理事务所
(普通合伙) 44423
专利代理师 樊宝忠
(51)Int.Cl.
G10L 15/26(2006.01)
G06F 40/126(2020.01)
G06F 40/157(2020.01)
G06F 40/30(2020.01)
(54)发明名称
一种智能语音处 理方法及系统
(57)摘要
本发明涉及一种智能语音处理方法及系统,
通过对语音处理转换成文本字符串, 将文本字 符
串中字符进行遍历组合, 确定词组位置和属性编
码以及单字符位置和属性编码; 利用文本字符串
中不同属性的词组和单字符的位置关系及其关
联性确定句型特征结构, 并根据句型特征结构将
词组和单字符的属性编码代入预设句型运算公
式进行运算, 运算使设备可以对 上下文或前后字
词的语义属性进行逻辑关联, 通过字符属性、 词
组属性、 句型特征以及语序的不同可以使设备在
不同场景获得更精准的语义理解和响应结果, 提
高了人与设备之间的信息交 互质量。
权利要求书2页 说明书7页 附图3页
CN 115440225 A
2022.12.06
CN 115440225 A
1.一种智能语音处 理方法, 其特 征在于, 包括如下步骤:
获取目标语音信号, 对所述目标语音信号识别处 理并转换为文本 字符串;
将所述文本字符串以字符为单位转换为字符识别编码, 所述字符识别编码包含字首编
码、 字身编码、 部首编码和字型 结构编码;
通过对所述文本字符串中相邻 字符的所述字首编码和/或所述字身编码进行逐一遍历
组合, 得到组合编码; 在预设字典数据库中搜索并校验所述组合编 码是否为词组编码, 若校
验结果为词组编码, 则通过所述词组编码在所述预设字典数据库中匹配获得词组属性编
码, 缓存所述词组属 性编码并在所述文本字符串中对应位置做词组位置标记, 若校验结果
为非词组编码, 则释放所述组合编码, 提取当前文本字符的所述部首编码和所述字型结构
编码, 通过所述部首编 码和所述字型结构编码的组合在所述预设字典数据库中匹配获得单
字符属性编 码, 缓存所述单字符属性编 码并在所述文本字符串中对应位置做单字符位置标
记;
根据所述词组位置提取所述词组属性编码特征以及所述单字符位置提取所述单字符
属性编码特 征在预设句型 数据库中匹配确定句型 特征结构;
利用所述句型 特征结构在所述预设句型 数据库中匹配获得对应的句型运 算公式;
根据所述句型运算公式代入所述词组属性编码和/或所述单字符属性编码进行运算获
得运算结果参数;
在所述预设句型数据库中匹配所述句型特征结构获得对应的响应结果转换规则, 将所
述运算结果参数根据所述响应结果转换规则转换为响应结果, 对设备执行并输出所述响应
结果, 所述响应结果 转换规则包括实现对所述设备识别和控制的响应编码。
2.如权利要求1所述的一种智能语音处理方法, 其特征在于, 还包括如下步骤: 所述句
型特征结构区分有主语特征和谓语特征, 所述词组属性编 码和所述单字符属性编 码可根据
所述主语特征和所述谓语特征与上下文所述句型特征结构的所述主语特征和所述谓语特
征进行二次组合, 利用所述二次组合结果在所述预设句型数据库中匹配确定所述句型特征
结构, 利用所述句型特征结构在所述预设句型数据库中匹配获得对应的句型运算 公式并进
行运算, 获得所述运算结果参数。
3.如权利要求1所述的一种智能语音处理方法, 其特征在于, 所述句型特征结构包括单
句结构和复句结构, 所述单句结构包括主谓句结构、 非主谓句结构和特殊单句结构, 所述复
句结构包括并列复句结构、 承接复句结构、 递进复句结构和选择复句结构; 所述句型运算 公
式为可对编码进行运 算的函数式程序。
4.如权利要求1所述的一种智能语音处理方法, 其特征在于, 所述通过对所述文本字符
串中相邻字符的所述字首编码和/或所述字身编码进行逐一遍历组合步骤, 具体组合步骤
包括: 所述文本字符串中包含若干字符, 取若干字符每个字符的所述字首编码加所述文本
字符串中末尾字符的所述字身编码进行遍历组合。
5.如权利要求2所述的一种智能语音处理方法, 其特征在于, 所述通过所述词组编码在
所述预设字典数据库中匹配获得词组属性编码步骤具体包括: 若 所述词组编码在所述预设
字典数据库中匹配获得多个词组属性编 码, 则通过与所述文本字符串中相 邻字符的所述单
字符属性编码组合或根据所述句型特征结构中所述主语特征和所述谓语特征来确定匹配
的所述词组属性编 码; 若所述部首编 码和所述字型结构编 码的组合在所述预设字典数据库权 利 要 求 书 1/2 页
2
CN 115440225 A
2中匹配获得多个单字符属性编 码, 则通过与所述文本字符串中相 邻字符的所述单字符属性
编码组合或根据所述句型特征结构中所述主语特征和所述谓语特征来确定匹配的所述单
字符属性编码。
6.如权利要求1所述的一种智能语音处理方法, 其特征在于, 还包括如下步骤: 预先将
所述设备的控制指 令转换为具有属性的所述响应编 码, 所述执行输出响应结果模块利用所
述响应结果 转换规则调用所述响应编码, 实现对所述设备的识别和控制。
7.如权利要求1至6任意一项所述的一种智能语音处理方法, 其特征在于, 所述字符识
别编码可为基于 仓颉码编码策略生成的识别编码。
8.一种智能语音处 理系统, 其特 征在于, 包括:
语音信号文本转换模块: 用于获取目标语音信号, 对所述目标语音信号识别处理并转
换为文本 字符串;
字符识别编码模块: 用于将所述语音信号文本转换模块转换的所述文本字符串以字符
为单位转换为字符识别编 码, 所述字符识别编 码包含字首编码、 字身编码、 部首编码和字型
结构编码;
预设字典数据库: 用于存储预设词组及其属性编码、 关联部首编码和字型结构编码组
合的单字符及其属性编码;
编码组合定位模块: 用于对所述文本字符串中相邻 字符基于所述字符识别编码模块转
换的所述字首编码和/或所述字身编码进行逐一遍历组合, 在所述预设字典数据库中校验
相邻字符组合是否可为词组, 并定位词组及单字符位置;
编码缓存模块: 用于缓存所述编码组合定位模块校验得到的所述词组属性编码及词组
位置标记和缓存所述单字符属性编码及单字符位置标记;
预设句型数据库: 用于存储预设句型特征结构及其对应的句型运算公式、 响应结果转
换规则;
句型匹配运算模块: 用于根据 所述编码 缓存模块的所述词组属性编码及词组位置和所
述单字符属性编码及单字符位置在所述预设句型数据库中匹配确定句型特征结构, 利用所
述句型特征结构在所述预设句型数据库中匹配获得对应的句型运算 公式, 根据所述句型运
算公式代入所述词组属性编码和/或所述单字符属性编码进行运 算获得运 算结果参数;
执行输出响应结果模块: 用于将所述运算结果参数根据 所述响应结果转换规则转换为
响应结果, 执 行并输出 所述响应结果。
9.如权利要求8所述的一种智能语音处理系统, 其特征在于, 还包括, 指令编码模块: 用
于预先将设备的控制指 令转换为具有属性的响应编 码, 所述执行输出响应结果模块利用所
述响应结果 转换规则调用所述响应编码, 实现对所述设备的识别和控制。
10.如权利要求9所述的一种智能语音处理系统, 其特征在于, 还包括, 发送模块: 用于
所述指令编码模块向目标设备发送控制指令 。权 利 要 求 书 2/2 页
3
CN 115440225 A
3
专利 一种智能语音处理方法及系统
安全报告 >
其他 >
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-03-03 20:13:37上传分享