说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111604113.9 (22)申请日 2021.12.24 (71)申请人 中山大学 地址 510275 广东省广州市海珠区新港西 路135号 (72)发明人 何钺 卓汉逵 (74)专利代理 机构 深圳市创富知识产权代理有 限公司 4 4367 代理人 高冰 (51)Int.Cl. G06N 5/02(2006.01) G06N 5/04(2006.01) G06N 20/00(2019.01) G06F 40/20(2020.01) G06F 40/30(2020.01) (54)发明名称 一种基于常识知识库的短文本故事生成方 法及系统 (57)摘要 本发明公开了一种基于常识知识库的短文 本故事生成方法及系统, 该方法包括: 构建常识 知识库; 基于常识知识库构造第一训练样本并训 练知识构建模块, 得到训练完成的知识构建模 块; 收集第二训练样本并训练文本生成模块, 得 到训练完成的文本生成模块; 获取故事首句, 基 于训练完成的知识构建模块和训练完成的文本 生成模块迭代 生成预设篇幅 的短文本故事。 该系 统包括: 常识知识库、 知识构建模块和文本生成 模块通过使用本发明, 能够自动生成短文本故事 且故事内容的逻辑连贯并符合常理。 本发明作为 一种基于常识知识库的短文本故事生成方法及 系统, 可广泛应用于自然语言处 理领域。 权利要求书1页 说明书7页 附图5页 CN 114266354 A 2022.04.01 CN 114266354 A 1.一种基于常识知识库的短文本故事生成方法, 其特 征在于, 包括以下步骤: 构建常识知识库; 基于常识知识库构造第 一训练样本并训练知识构建模块, 得到训练完成的知识构建模 块; 收集第二训练样本并训练文本生成模块, 得到训练完成的文本生成模块; 获取故事首句, 基于训练完成的知识构建模块和训练完成的文本生成模块迭代生成预 设篇幅的短文本故事。 2.根据权利要求1所述一种基于常识知识库的短文本故事生成方法, 其特征在于, 所述 常识知识库中的每一条常识均包括上 下文、 事件、 关系和后果。 3.根据权利要求2所述一种基于常识知识库的短文本故事生成方法, 其特征在于, 所述 基于常识知识库构 造第一训练样本并训练知识构建模块, 得到训练完成的知识构建模块这 一步骤, 其具体包括: 将常识知识库中的上 下文、 事件、 关系和后果进行部分拼接, 得到第一训练样本; 以第一训练样本中的上下文、 事件、 关系为输入, 第一训练样本中的后果为标签, 训练 知识构建模块, 得到训练完成的知识构建模块。 4.根据权利要求3所述一种基于常识知识库的短文本故事生成方法, 其特征在于, 所述 收集第二训练样本并训练文本生成模块, 得到训练完成的文本生成模块这一步骤, 其具体 包括: 收集第二训练样本, 所述第二训练样本包括现有故事内容和知识模块的补充信息; 以第二训练样本为输入, 现有故事内容的下一句文本为标签, 训练文本生成模块, 得到 训练完成的文本生成模块。 5.根据权利要求4所述一种基于常识知识库的短文本故事生成方法, 其特征在于, 所述 知识构建模块和文本生成模块均包括GPT ‑2模型和外围脚本 。 6.根据权利要求5所述一种基于常识知识库的短文本故事生成方法, 其特征在于, 所述 获取故事首句, 基于训练完成的知识构建模块和训练完成的文本生成模块迭代生成预设篇 幅的短文本故事这 一步骤, 其具体包括: 获取故事首句并设置最终短文本故事的句子数; 基于常识知识库, 结合故事首句和当前故事内容进行文本拼接, 得到第一输入; 将第一输入送入训练完成的知识构建模块, 生成对应的后果输出; 基于常识知识库, 结合故事首句、 当前故事内容和对应的后 果输出进行文本拼接, 得到 第二输入; 将第二输入送入训练完成的文本生成模块, 更新故事内容; 循环知识构建模块和文本生成模块的工作步骤, 直至故事内容的句子数达 到预设值。 7.一种基于常识知识库的短文本故事生成系统, 其特 征在于, 包括: 常识知识库, 用于存 储常识知识; 知识构建模块, 用于根据接收的故事内容, 推理出对应的后果并输出; 文本生成模块, 用于根据接收的故事内容和对应的后果, 逐句生成后续的文本, 并不断 与知识构建模块进行交 互。权 利 要 求 书 1/1 页 2 CN 114266354 A 2一种基于常识知识库的短文本故事生成方 法及系统 技术领域 [0001]本发明涉及自然语言处理领域, 尤其涉及 一种基于常识知识库的短文本故事生成 方法及系统。 背景技术 [0002]故事生成是自然语言处理领域的一项重要的工作, 已成为自然语言处理的重要组 成部分。 然而, 实现一个好的故事生成模型一直是一个非常具有挑战性的任务。 故事生 成任 务是指, 人类给予故事的标题或是故事开头的几句话作为模型 的输入, 模型根据这些输入 能够自动生成故事内容的任务。 故事生成具有广泛的应用场景, 如智能写作、 文章润色等。 评价生成的故事内容的质量的其中一个重要指标是故事的连贯性。 现有的基于自回归的生 成模型, 在生成故事 下文时, 只参考了已有的故事 上文, 而没有考虑生成的下文的情节与已 有情节是否逻辑连贯, 是否符合逻辑, 最终导致生成的文本语法正确但出现常识性的逻辑 错误。 发明内容 [0003]为了解决上述技术问题, 本发明的目的是提供一种基于常识知识库的短文本故事 生成方法及系统, 能够自动生成短文本故事 且故事内容的逻辑连贯并符合常理。 [0004]本发明所采用的第一技术方案是: 一种基于常识知识库的短文本故事生成方法, 包括以下步骤: [0005]构建常识知识库; [0006]基于常识知识库构造第一训练样本并训练知识构建模块, 得到训练完成的知识构 建模块; [0007]收集第二训练样本并训练文本生成模块, 得到训练完成的文本生成模块; [0008]获取故事首句, 基于训练完成的知识构建模块和训练完成的文本生成模块迭代生 成预设篇幅的短文本故事。 [0009]进一步, 所述常识知识库中的每一条常识均包括上 下文、 事件、 关系和后果。 [0010]进一步, 所述基于常识知识库构造第一训练样本并训练知识构建模块, 得到训练 完成的知识构建模块 这一步骤, 其具体包括: [0011]将常识知识库中的上 下文、 事件、 关系和后果进行部分拼接, 得到第一训练样本; [0012]以第一训练样本中的上下文、 事件、 关系为输入, 第一训练样本中的后果为输出, 训练知识构建模块, 得到训练完成的知识构建模块。 [0013]进一步, 所述收集第二训练样本并训练文本生成模块, 得到训练完成的文本生成 模块这一步骤, 其具体包括: [0014]收集第二训练样本, 所述第二训练样本包括现有故事内容和知识模块的补充信 息; [0015]以第二训练样本为输入, 现有故事内容的下一句文本为标签, 训练文本生成模块,说 明 书 1/7 页 3 CN 114266354 A 3
专利 一种基于常识知识库的短文本故事生成方法及系统
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 23:14:00
上传分享
举报
下载
原文档
(918.5 KB)
分享
友情链接
GB-T 28517-2012 网络安全事件描述和交换格式.pdf
GB-T 7729-2021 冶金产品化学分析 分光光度法通则.pdf
GB-T 14986.4-2018 软磁合金 第4部分:铁铬合金.pdf
GA-T 1574—2019 信息安全技术 数据库安全加固产品安全技术要求.pdf
GB-T 39944-2021 筒子纱数字化染色成套装备 通用技术条件.pdf
之江实验室 - 2023.6.6 - 生成式大模型安全与隐私白皮书.pdf
T-ISAS 004—2021 沙棘果油.pdf
T-TJKCSJ 001—2020 天津市全过程工程咨询服务导则.pdf
GB-T 38994-2020 船舶数字化协同制造技术通用要求.pdf
GB-T 35273-2020 信息安全技术 个人信息安全规范.pdf
T-YNRZ 014—2023 黄瓜高产栽培技术规程.pdf
GB-T 15852.3-2019 信息技术 安全技术 消息鉴别码 第3部分:采用泛杂凑函数的机制.pdf
GB-T 29767-2013 信息安全技术 公钥基础设施 桥CA体系证书分级规范.pdf
JR-T0223-2021 金融数据安全 数据生命周期安全规范.pdf
GB-T 50087-2013 工业企业噪声控制设计规范.pdf
DB36-T 1346-2020 节能评估技术导则 中药制剂 江西省.pdf
GM-T 0125.1-2022 JSON Web 密码应用语法规范 第1部分:算法标识.pdf
DB3308-T 026-2015 衢州市河道生态治理导则 衢州市.pdf
NY-T 1060-2006 水泥生产用磷石膏.pdf
T-CAS 600—2022 经营者公平竞争合规管理体系建设.pdf
1
/
3
14
评价文档
赞助2.5元 点击下载(918.5 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。