说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111599279.6 (22)申请日 2021.12.24 (71)申请人 新奥新智科技有限公司 地址 065000 河北省廊坊市中国(河北)自 由贸易试验区大兴机场片区廊坊临空 经济区航谊道自贸区科创基地2101 (72)发明人 段静文 张世锋 汪一鸣 (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 专利代理师 黄德海 (51)Int.Cl. G06V 30/414(2022.01) G06V 30/413(2022.01) G06N 20/00(2019.01) G06K 9/62(2022.01)G06V 10/764(2022.01) (54)发明名称 文本图像中表格key-value信息的提取方法 及装置 (57)摘要 本申请涉及图像处理技术领域, 特别涉及一 种文本图像中表 格key‑value信息的提取方法及 装置, 其中, 方法包括: 识别文本图像中的表格单 元格位置信息; 根据表格单元格位置信息和单元 格内容信息构造单元格特征, 并利用机器学习分 类算法得到key ‑value的MAP图; 利用key ‑value 的MAP图将每个表格单元展开为一维链路, 并构 建动态规划, 获取最优 的key‑value从属关系路 径, 基于最优 的key‑value从属关系路径获取表 格key‑value信息。 由此, 解决了相关技术中基于 模板和规则提取key ‑value信息, 通常需要设置 繁琐规则或阈值, 操作复杂、 鲁棒性较差, 且适用 性较差及提取的准确性较低等问题。 权利要求书2页 说明书8页 附图2页 CN 114495144 A 2022.05.13 CN 114495144 A 1.一种文本图像中表格key ‑value信息的提取 方法, 其特 征在于, 包括以下步骤: 识别文本图像中的表格单 元格位置信息; 根据所述表格单元格位置信 息和单元格内容信 息构造单元格特征, 并利用机器学习分 类算法得到key ‑value的MAP图; 以及 利用所述key ‑value的MAP图将每个表格单元展开为一维链路, 并构建动态规划, 获取 最优的key ‑value从属关系路径, 基于所述最优的key ‑value从属关系路径获取表格key ‑ value信息 。 2.根据权利要求1所述的方法, 其特征在于, 在识别所述文本图像中的表格单元格位置 信息之前, 包括: 利用二位图像的快速傅里叶变换将所述文本图像转化到傅里叶频谱空间, 得到频谱图 像; 对所述频谱图进行霍夫直线提取, 得到直线在频谱中的角度信息, 并利用所述角度信 息对图片进行倾 斜校正。 3.根据权利要求1所述的方法, 其特征在于, 所述识别文本图像中的表格单元格位置信 息, 包括: 对所述文本 图像进行灰度处理, 且基于横向和纵向的卷积算子, 对二值化图像进行膨 胀腐蚀, 得到二 值化图像; 通过所述二值化图像的图像连通域获取表格外框信息, 确定所述表格中的横线和竖 线; 基于所述表格 中的横线和竖线的交点获取表格角点坐标, 并将所述角点坐标按照预设 规则排列, 得到排序后的角点 坐标, 获取 得到所述表格单 元格位置信息 。 4.根据权利要求1所述的方法, 其特征在于, 所述基于所述最优的key ‑value从属关系 路径获取表格key ‑value信息, 包括: 解码所述 最优的key ‑value从属关系路径, 得到所述表格key ‑value信息 。 5.一种文本图像中表格key ‑value信息的提取装置, 其特 征在于, 包括: 识别模块, 用于识别文本图像中的表格单 元格位置信息; 构造模块, 用于根据所述表格单元格位置信息和单元格内容信息构造单元格特征, 并 利用机器学习分类算法得到key ‑value的MAP图; 以及 获取模块, 用于利用所述key ‑value的MAP图将每个表格单元展开为一维链路, 并构建 动态规划, 获取最优的key ‑value从属关系路径, 基于所述最优的key ‑value从属关系路径 获取表格key ‑value信息 。 6.根据权利要求5所述的装置, 其特 征在于, 还 包括: 校正模块, 用于在识别所述文本 图像中的表格单元格位置信息之前, 利用二位图像的 快速傅里叶变换将所述文本图像转化到傅里叶频谱空间, 得到频谱图像, 对所述频谱图进 行霍夫直线提取, 得到直线在频谱中的角度信息, 并利用所述角度信息对图片进行倾斜校 正。 7.根据权利要求5所述的装置, 其特征在于, 所述识别模块用于对所述文本图像进行灰 度处理, 且基于横向和纵向的卷积算子, 对二值化图像进行膨胀腐蚀, 得到二值化图像; 通 过所述二值化图像的图像连通域获取表格外框信息, 确定所述表格中的横线和竖线; 基于权 利 要 求 书 1/2 页 2 CN 114495144 A 2所述表格中的横线和竖线的交点获取表格角点坐标, 并将所述角点坐标按照预设规则排 列, 得到排序后的角点 坐标, 获取 得到所述表格单 元格位置信息 。 8.根据权利要求1所述的方法, 其特征在于, 所述获取模块用于解码所述最优的key ‑ value从属关系路径, 得到所述表格key ‑value信息 。 9.一种电子设备, 其特征在于, 包括: 存储器、 处理器及存储在所述存储器上并可在所 述处理器上运行的计算机程序, 所述处理器执行所述程序, 以实现如权利要求 1‑4任一项所 述的文本图像中表格key ‑value信息的提取 方法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器 执行, 以用于实现如权利要求1 ‑4任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114495144 A 3
专利 文本图像中表格key-value信息的提取方法及装置
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 23:17:40
上传分享
举报
下载
原文档
(510.1 KB)
分享
友情链接
安全管理制度体系文件.pdf
GB-T 26610.3-2014 承压设备系统基于风险的检验实施导则 第3部分:风险的定性分析方法.pdf
GB-T 6040-2019 红外光谱分析方法通则.pdf
GB T 42446-2023 信息安全技术 网络安全从业人员能力基本要求.pdf
GB-T 42632-2023 海洋生态环境水下有缆在线监测系统技术要求.pdf
腾讯研究院AIGC发展趋势报告2023.pdf
GB-T 36478.2-2018 物联网 信息交换和共享 第2部分:通用技术要求.pdf
GB-T 28827.7-2020 信息技术服务 运行维护 第7部分:成本度量规范.pdf
DB3301-T 0348—2021 机关食堂数字化管理规范 杭州市.pdf
DB63-T 2010.1-2022 涉路行为标准化规范 第1部分:技术导则 青海省.pdf
GB-T 6968-2019 膜式燃气表.pdf
GB-T 42588-2023 系统与软件工程 功能规模测量 NESMA方法.pdf
GB-T 32918.5-2017 信息安全技术 SM2椭圆曲线公钥密码算法 第5部分:参数定义.pdf
GB-T 9081-2008 机动车燃油加油机.pdf
GB-T 17714-2022 啤酒桶质量通则.pdf
信通院 封莎 云服务数据安全能力构建与最佳实践.pdf
GB-T 39908-2021 科技计划形成的科学数据汇交 通用代码集.pdf
GB-T 31392-2022 煤矿矿井水利用技术导则.pdf
GB-T 31432-2015 独山玉 命名与分类.pdf
GB 29437-2012 工业冰醋酸单位产品能源消耗限额.pdf
1
/
3
13
评价文档
赞助2.5元 点击下载(510.1 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。