(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210922591.2
(22)申请日 2022.08.02
(71)申请人 天津外国语大 学
地址 300204 天津市河西区马场道1 17号
(72)发明人 刘宏伟 刘宏蕊 张鸿彬
(74)专利代理 机构 四川省方圆智云知识产权代
理事务所(普通 合伙) 51368
专利代理师 严晓玲
(51)Int.Cl.
G06F 16/34(2019.01)
G06F 16/36(2019.01)
G06F 16/383(2019.01)
G06F 16/387(2019.01)
G06F 40/284(2020.01)
G06F 40/30(2020.01)
(54)发明名称
一种基于语义知识库的电影故事文本生成
方法和系统
(57)摘要
本发明公开了一种基于语义知识库的电影
故事文本生成方法和系统, 包括: 电影故事资源
库构建模块: 构建电影故事资源库; 电影知识聚
合模块: 采用信息预处理和图神经网络聚合相关
的电影知识; 编码模块: 编码电影知识和电影主
题信息; 编码电影知识和电影主题信息。 提取电
影主题信息和已生成的电影故事情节; 解码模
块: 解码器计算词的最后分布并生成电影故事情
节; 计算词的最后分布并生成电影故事文本; 评
估和筛选模块: 选择电影故事文本来完善电影故
事资源库和语义知识库。 本发明能够更好地生成
更符合主题、 更流畅和更多样化的故事, 能够生
成出基于时间段的电影故事文本, 将电影故事文
本存储到语义知识库中, 为后面生成新的故事文
本提供更多的素 材。
权利要求书3页 说明书11页 附图3页
CN 115269819 A
2022.11.01
CN 115269819 A
1.一种基于语义知识库的电影故事文本生成方法, 其特 征在于, 包括以下步骤:
步骤101: 构建电影故事资源库; 电影故事资源库包括: 电影故事文本、 电影故事情节、
电影语义知识库和电影主题信息, 电影故事文本具有将 每个电影时间段内发生的内容分段
呈现的特性, 电影故事情节包括: 电影时间段、 电影地点词和电影场景词, 每个电影时间段
内会出现相应的电影地点词和电影场景词, 电影场景词包括了电影场景氛围和电影场景提
示词;
步骤102: 采用信息预处理和图神经网络聚合相关的电影知识; 采用基于电影故事情节
和电影故事文本生成的层次化生成框架, 采用生成模型图编码电影知识和编码电影主题信
息, 输出基于电影主题信息的电影故事情节和电影故事文本的生成;
步骤103: 采用双编码器分别编码电影知识和电影主题信息; 第一个编码器采用层级联
合合并全局 和局部编码器获得的信息, 第二个编码器采用神经网络提取电影主题信息;
步骤104: 采用解码器计算词的最后分布并生成电影故事情节; 根据编码器编码后的信
息, 将第一个编 码器的输出和 第二个编 码器的输出进 行拼接, 并获得一个新的编 码信息; 采
用解码器解码新的编码信息, 得到电影故事情节;
步骤105: 结合已生成的电影故事情节, 采用电影故事文本生成模型分别编码电影知识
和电影主题信息; 电影故事文本生成模型 由双编码器和解码器组成, 第一个编码器采用层
级联合合并全局和局部编 码器获得的信息, 第二个编 码器采用神经网络提取电影主题信息
和已生成的电影故事情节;
步骤106: 采用解码器计算词的最后分布并生成电影故事文本; 根据编码器编码后的信
息, 将第一个编 码器的输出和 第二个编 码器的输出进 行拼接, 并获得一个新的编 码信息; 采
用解码器解码新的编码信息, 得到电影故事文本;
步骤107: 结合自动评估和人工筛选, 选择电影故事文本来完善电影故事资源库和语义
知识库; 电影语义知识库具有丰富的电影知识, 能够结合多个电影的内容生成新的电影故
事情节和电影故事文本, 筛选出高质量的电影故事情节和电影故事文本, 储存并完善电影
故事资源库和电影 语义知识库的构建。
2.根据权利要求1所述的一种基于语义知识库的电影故事文本生成方法, 其特征在于:
步骤101包括以下子步骤:
S11: 获取电影故事文本, 采用主题生成模型生成电影主题信息;
S12: 根据电影故事文本和电影主题信息, 构建电影 语义知识库;
S13: 结合电影 语义知识库, 采用无监 督算法生成电影故事情节。
3.根据权利要求2所述的一种基于语义知识库的电影故事文本生成方法, 其特征在于:
S12包括以下子步骤:
S121, 根据电影故事文本, 构建本体信息;
电影主题信息和电影时间段为平行类, 电影时间段为父类, 电影地点词和电影场景词
分别为电影时间段的子类; 自定义语义知识库的本体信息, 结合自顶向下和自底向上 的混
合方法定义类, 再根据类定义 其属性和约束, 最后对类中添加实例;
S122, 根据电影故事文本和本体信息, 抽取电影知识; 采用知识抽取工具抽取电影知
识; 首先进 行实体识别, 实体识别包括: 人物、 地名、 机构名和专有名词; 然后, 在实体基础上
从非结构化文本中抽取出预先定义的实体 关系; 最后, 结合依存分析方法整理关系的种类,权 利 要 求 书 1/3 页
2
CN 115269819 A
2丰富关系信息, 包 含主谓宾中的谓词、 动词和被动词;
S123, 结合本体信息和电影知识, 融合电影知识; 采用结合自适应特征的方法对具有歧
义的知识进行消歧, 能够通过自训练来精确地选择重要的信息,
S124, 根据融合后的电影知识, 推理电影知识; 基于预先定义好的本体, 利用推理规则
来对知识进一 步地补全。
4.根据权利要求1所述的一种基于语义知识库的电影故事文本生成方法, 其特征在于:
步骤103包括以下子步骤:
S31, 根据电影知识, 采用电影故事情节生成模型的第一个编码器编码全局和局部的电
影知识;
S32, 采用电影故事情节生成模型的第二个编码器编码电影主题信息 。
5.根据权利要求1所述的一种基于语义知识库的电影故事文本生成方法, 其特征在于:
步骤104可以包括以下子步骤:
S41, 结合自回归方式, 采用解码器生成词的最后分布;
S42, 根据词的最后分布, 得到电影故事情节的生成。
6.根据权利要求1所述的一种基于语义知识库的电影故事文本生成方法, 其特征在于:
步骤105包括以下子步骤:
S51, 根据 所述电影知识, 采用电影故事文本生成模型的第一个编码器编码全局和局部
的电影知识;
S52, 采用电影故事文本生成模型的第二个编码器联合编码电影主题信息和已生成的
电影故事情节。
7.根据权利要求1所述的一种基于语义知识库的电影故事文本生成方法, 其特征在于:
步骤106包括以下子步骤:
S61, 结合自回归方式, 采用解码器生成词的最后分布;
S62, 采用词的最后分布, 得到电影故事文本的生成。
8.根据权利要求1所述的一种基于语义知识库的电影故事文本生成方法, 其特征在于:
步骤107包括以下子步骤:
S71, 采用自动评估指标和人工筛选评估方法, 选择生成的高质量电影故事文本; 自动
评估指标包括BLUE和ROUGE评估指标, 而人工筛选包括Intrinsic评估和Inter ‑evaluator
Agreement评估方法
S72, 根据生成的高质量电影故事文本, 完 善电影故事资源库和语义知识库。
9.一种基于语义知识库的电影故事文本生成系统, 其特征在于: 所述系统用于协助执
行权利要求1 ‑7所述的基于语义知识库的电影故事文本生成方法;
系统包括:
电影故事资源库构建模块: 用于构建电影故事资源库;
电影知识聚合模块: 采用信息预处 理和图神经网络聚合相关的电影知识;
编码模块: 采用 双编码器分别编码电影知识和电影主题信息; 采用电影故事文本生成
模型分别编 码电影知识和电影主题信息; 采用神经网络提取电影主题信息和已生成的电影
故事情节;
解码模块: 采用解码器计算词的最后分布并生成电影故事情节; 计算词的最后分布并权 利 要 求 书 2/3 页
3
CN 115269819 A
3
专利 一种基于语义知识库的电影故事文本生成方法和系统
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:14:21上传分享