说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111604113.9 (22)申请日 2021.12.24 (71)申请人 中山大学 地址 510275 广东省广州市海珠区新港西 路135号 (72)发明人 何钺 卓汉逵  (74)专利代理 机构 深圳市创富知识产权代理有 限公司 4 4367 代理人 高冰 (51)Int.Cl. G06N 5/02(2006.01) G06N 5/04(2006.01) G06N 20/00(2019.01) G06F 40/20(2020.01) G06F 40/30(2020.01) (54)发明名称 一种基于常识知识库的短文本故事生成方 法及系统 (57)摘要 本发明公开了一种基于常识知识库的短文 本故事生成方法及系统, 该方法包括: 构建常识 知识库; 基于常识知识库构造第一训练样本并训 练知识构建模块, 得到训练完成的知识构建模 块; 收集第二训练样本并训练文本生成模块, 得 到训练完成的文本生成模块; 获取故事首句, 基 于训练完成的知识构建模块和训练完成的文本 生成模块迭代 生成预设篇幅 的短文本故事。 该系 统包括: 常识知识库、 知识构建模块和文本生成 模块通过使用本发明, 能够自动生成短文本故事 且故事内容的逻辑连贯并符合常理。 本发明作为 一种基于常识知识库的短文本故事生成方法及 系统, 可广泛应用于自然语言处 理领域。 权利要求书1页 说明书7页 附图5页 CN 114266354 A 2022.04.01 CN 114266354 A 1.一种基于常识知识库的短文本故事生成方法, 其特 征在于, 包括以下步骤: 构建常识知识库; 基于常识知识库构造第 一训练样本并训练知识构建模块, 得到训练完成的知识构建模 块; 收集第二训练样本并训练文本生成模块, 得到训练完成的文本生成模块; 获取故事首句, 基于训练完成的知识构建模块和训练完成的文本生成模块迭代生成预 设篇幅的短文本故事。 2.根据权利要求1所述一种基于常识知识库的短文本故事生成方法, 其特征在于, 所述 常识知识库中的每一条常识均包括上 下文、 事件、 关系和后果。 3.根据权利要求2所述一种基于常识知识库的短文本故事生成方法, 其特征在于, 所述 基于常识知识库构 造第一训练样本并训练知识构建模块, 得到训练完成的知识构建模块这 一步骤, 其具体包括: 将常识知识库中的上 下文、 事件、 关系和后果进行部分拼接, 得到第一训练样本; 以第一训练样本中的上下文、 事件、 关系为输入, 第一训练样本中的后果为标签, 训练 知识构建模块, 得到训练完成的知识构建模块。 4.根据权利要求3所述一种基于常识知识库的短文本故事生成方法, 其特征在于, 所述 收集第二训练样本并训练文本生成模块, 得到训练完成的文本生成模块这一步骤, 其具体 包括: 收集第二训练样本, 所述第二训练样本包括现有故事内容和知识模块的补充信息; 以第二训练样本为输入, 现有故事内容的下一句文本为标签, 训练文本生成模块, 得到 训练完成的文本生成模块。 5.根据权利要求4所述一种基于常识知识库的短文本故事生成方法, 其特征在于, 所述 知识构建模块和文本生成模块均包括GPT ‑2模型和外围脚本 。 6.根据权利要求5所述一种基于常识知识库的短文本故事生成方法, 其特征在于, 所述 获取故事首句, 基于训练完成的知识构建模块和训练完成的文本生成模块迭代生成预设篇 幅的短文本故事这 一步骤, 其具体包括: 获取故事首句并设置最终短文本故事的句子数; 基于常识知识库, 结合故事首句和当前故事内容进行文本拼接, 得到第一输入; 将第一输入送入训练完成的知识构建模块, 生成对应的后果输出; 基于常识知识库, 结合故事首句、 当前故事内容和对应的后 果输出进行文本拼接, 得到 第二输入; 将第二输入送入训练完成的文本生成模块, 更新故事内容; 循环知识构建模块和文本生成模块的工作步骤, 直至故事内容的句子数达 到预设值。 7.一种基于常识知识库的短文本故事生成系统, 其特 征在于, 包括: 常识知识库, 用于存 储常识知识; 知识构建模块, 用于根据接收的故事内容, 推理出对应的后果并输出; 文本生成模块, 用于根据接收的故事内容和对应的后果, 逐句生成后续的文本, 并不断 与知识构建模块进行交 互。权 利 要 求 书 1/1 页 2 CN 114266354 A 2一种基于常识知识库的短文本故事生成方 法及系统 技术领域 [0001]本发明涉及自然语言处理领域, 尤其涉及 一种基于常识知识库的短文本故事生成 方法及系统。 背景技术 [0002]故事生成是自然语言处理领域的一项重要的工作, 已成为自然语言处理的重要组 成部分。 然而, 实现一个好的故事生成模型一直是一个非常具有挑战性的任务。 故事生 成任 务是指, 人类给予故事的标题或是故事开头的几句话作为模型 的输入, 模型根据这些输入 能够自动生成故事内容的任务。 故事生成具有广泛的应用场景, 如智能写作、 文章润色等。 评价生成的故事内容的质量的其中一个重要指标是故事的连贯性。 现有的基于自回归的生 成模型, 在生成故事 下文时, 只参考了已有的故事 上文, 而没有考虑生成的下文的情节与已 有情节是否逻辑连贯, 是否符合逻辑, 最终导致生成的文本语法正确但出现常识性的逻辑 错误。 发明内容 [0003]为了解决上述技术问题, 本发明的目的是提供一种基于常识知识库的短文本故事 生成方法及系统, 能够自动生成短文本故事 且故事内容的逻辑连贯并符合常理。 [0004]本发明所采用的第一技术方案是: 一种基于常识知识库的短文本故事生成方法, 包括以下步骤: [0005]构建常识知识库; [0006]基于常识知识库构造第一训练样本并训练知识构建模块, 得到训练完成的知识构 建模块; [0007]收集第二训练样本并训练文本生成模块, 得到训练完成的文本生成模块; [0008]获取故事首句, 基于训练完成的知识构建模块和训练完成的文本生成模块迭代生 成预设篇幅的短文本故事。 [0009]进一步, 所述常识知识库中的每一条常识均包括上 下文、 事件、 关系和后果。 [0010]进一步, 所述基于常识知识库构造第一训练样本并训练知识构建模块, 得到训练 完成的知识构建模块 这一步骤, 其具体包括: [0011]将常识知识库中的上 下文、 事件、 关系和后果进行部分拼接, 得到第一训练样本; [0012]以第一训练样本中的上下文、 事件、 关系为输入, 第一训练样本中的后果为输出, 训练知识构建模块, 得到训练完成的知识构建模块。 [0013]进一步, 所述收集第二训练样本并训练文本生成模块, 得到训练完成的文本生成 模块这一步骤, 其具体包括: [0014]收集第二训练样本, 所述第二训练样本包括现有故事内容和知识模块的补充信 息; [0015]以第二训练样本为输入, 现有故事内容的下一句文本为标签, 训练文本生成模块,说 明 书 1/7 页 3 CN 114266354 A 3

.PDF文档 专利 一种基于常识知识库的短文本故事生成方法及系统

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于常识知识库的短文本故事生成方法及系统 第 1 页 专利 一种基于常识知识库的短文本故事生成方法及系统 第 2 页 专利 一种基于常识知识库的短文本故事生成方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:14:00上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。