(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211032819.7
(22)申请日 2022.08.26
(71)申请人 广州华多网络科技有限公司
地址 511442 广东省广州市番禺区南村镇
万达广场B1栋24层
(72)发明人 叶朝鹏
(74)专利代理 机构 广州利能知识产权代理事务
所(普通合伙) 44673
专利代理师 王增鑫
(51)Int.Cl.
G06Q 50/28(2012.01)
G06Q 10/08(2012.01)
G06F 16/9537(2019.01)
G06F 16/9535(2019.01)
G06F 40/289(2020.01)G06F 40/30(2020.01)
G06K 9/62(2022.01)
(54)发明名称
通信地址联想方法及其装置、 设备、 介质、 产
品
(57)摘要
本申请公开一种通信地址联想方法及其装
置、 设备、 介质、 产品, 所述方法包括: 获取用户的
地址文本集, 其中包含录入地址文本及历史地址
文本; 调用至少两个召回接口实施数据召回, 每
个召回接口根据地址文本集中的各个地址文本
从标准地址库中召回相应多个候选地址子集, 每
个候选地址子集均包含被召回的标准地址文本;
将各个候选地址子集合并为召回地址集, 将各个
标准地址文本在所有候选地址子集中出现的频
次确定为相应的标准地址文本的召回权重; 计算
所述录入地址文本与所述召回地址集中各个标
准地址文本的语义相似度匹配其相应的召回权
重获得的排序分值, 根据该排序分值对召回地址
集进行排序后推送给所述用户。 本申请能够实现
更精准的地址联想效果。
权利要求书2页 说明书15页 附图5页
CN 115205085 A
2022.10.18
CN 115205085 A
1.一种通信地址联想方法, 其特 征在于, 包括如下步骤:
获取用户的地址文本集, 所述地址文本集包含用户提交的录入地址文本及该用户历史
使用的历史地址文本;
调用至少两个召回接口实施数据召回, 每个召回接口根据 所述地址文本集中的各个地
址文本从标准地址库中召回相应多个候选地址子集, 每个候选地址子集均包含被召回的标
准地址文本;
将各个候选地址子集合并为召回地址集, 将各个标准地址文本在所有候选地址子集中
出现的频次确定为相应的标准 地址文本的召回权 重;
计算所述录入地址文本与所述召回地址集中各个标准地址文本的语义相似度匹配其
相应的召回权重获得的排序分值, 根据该排序分值对召回地址集进行排序后推送给所述用
户。
2.根据权利要求1所述的通信地址联想方法, 其特征在于, 计算所述录入地址文本与 所
述召回地址集中各个标准地址文本的语义相似度匹配其相应的召回权重获得的排序分值,
包括:
分别对所述录入地址文本和召回地址集中的各个标准地址执行两种以上粒度的分词
处理, 构造每一粒度相对应的分词序列;
对应每个地址文本, 将其多种粒度的分词序列分别转换为嵌入向量;
基于每个地址文本的全部嵌入向量提取其深层语义信 息, 获得相应的地址文本的地址
特征向量;
应用预设的数据距离算法, 计算所述录入地址文本的地址特征向量与召回地址集中各
个所述的标准地址文本的地址特征向量之 间的数据距离作为语义相似度, 将 每个标准地址
文本的语义相似度与其召回权 重相乘获得排序分值。
3.根据权利要求2所述的通信地址联想方法, 其特征在于, 基于每个地址文本的全部嵌
入向量提取其深层语义信息, 获得相应的地址文本的地址特 征向量, 包括:
对于每个地址文本的全部嵌入向量, 轮流将其中每个嵌入向量作为查询向量, 同时将
其余嵌入向量作为键 向量和值向量, 输入注意力层中执行注意力运算, 获得其中各个嵌入
向量相对应的关键特 征向量;
对每个地址文本的全部嵌入向量分别执行池化操作后 拼接, 获得其中各个嵌入向量相
对应的压缩特 征向量;
对于每个地址文本, 将其所有关键特征向量及所有压缩特征向量拼接为地址特征向
量。
4.根据权利要求3所述的通信地址联想方法, 其特征在于, 计算所述录入地址文本与 所
述召回地址集中各个标准地址文本的语义相似度匹配其相 应的召回权重获得 的排序分值
的步骤中, 采用预训练至收敛状态的地址文本匹配模型实施所述录入地址文本与所述标准
地址文本的语义相似度的计算, 以确定出召回地址集中每个标准地址文本对应所述录入地
址文本的所述 排序分值。
5.根据权利要求4所述的通信地址联想方法, 其特征在于, 所述地址文本匹配模型的工
作过程包括:
应用编码层 分别对所述录入地址文本及召回地址集中的单个标准地址文本进行编码,权 利 要 求 书 1/2 页
2
CN 115205085 A
2获得其相应的各个嵌入向量;
应用特征提取层分别对所述录入地址文本及所述单个标准地址文本各自的嵌入向量
进行基于注意力和池化操作的运 算, 获得各个地址文本相应的地址特 征向量;
应用线性层计算所述录入地址文本及所述单个标准地址文本各自的地址特征向量之
间的语义相似度, 获得相似度向量;
应用分类器对所述召回权重与所述相似度向量的乘积矩阵做分类映射, 获得其映射到
预设的分类空间的正向类别的分类概率作为所述的排序分值, 其中, 所述正向类别为所述
地址文本匹配模型在训练阶段确定为输入正样本相对应的类别。
6.根据权利要求5所述的通信地址联想方法, 其特征在于, 所述地址文本匹配模型的训
练过程包括:
调用数据集中的单个训练样本, 所述训练样本包括两个地址文本且关联设置为表征两
个地址文本是否指向同一 地址的监 督标签;
将所述训练样本的两个地址文本同步输入所述地址文本匹配模型, 由地址文本匹配模
型预测出其映射到所述分类空间的相对应的分类结果;
根据所述训练样本的监督标签计算所述分类结果的损失值, 在所述损失值未达到预设
收敛条件时对地址文本匹配模型实施梯度更新, 继续从数据集中调用训练样本以实施迭代
训练, 直至 达至所述预设收敛 条件。
7.一种通信地址联想装置, 其特 征在于, 包括:
用户地址获取模块, 设置为获取用户的地址文本集, 所述地址文本集包含用户提交的
录入地址文本及该用户历史使用的历史地址文本;
多路召回执行模块, 设置为调用至少两个召回接口实施数据召回, 每个召回接口根据
所述地址文本集中的各个地址文本从标准地址库中召回相应多个候选地址子集, 每个候选
地址子集均包 含被召回的标准 地址文本;
召回权重确定模块, 设置为将各个候选地址子集合并为召回地址集, 将各个标准地址
文本在所有候选地址 子集中出现的频次确定为相应的标准 地址文本的召回权 重;
相似匹配排序模块, 设置为计算所述录入地址文本与 所述召回地址集中各个标准地址
文本的语义相似度匹配其相应的召回权重获得的排序分值, 根据该排序分值对召回地址集
进行排序后推送给 所述用户。
8.一种计算机设备, 包括中央处理器和存储器, 其特征在于, 所述中央处理器用于调用
运行存储于所述存储器中的计算机程序以执行如权利要求1至6中任意一项所述的方法的
步骤。
9.一种计算机可读存储介质, 其特征在于, 其以计算机可读指令的形式存储有依据权
利要求1至6中任意一项 所述的方法所实现的计算机程序, 该计算机程序被计算机调用运行
时, 执行相应的方法所包括的步骤。
10.一种计算机程序产品, 其特征在于, 包括计算机程序/指令, 所述计算机程序/指令
被处理器执行时实现权利要求1至 6中任意一项所述方法的步骤。权 利 要 求 书 2/2 页
3
CN 115205085 A
3
专利 通信地址联想方法及其装置、设备、介质、产品
安全报告 >
其他 >
文档预览
中文文档
23 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-03-03 20:13:27上传分享