说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210169414.1 (22)申请日 2022.02.23 (71)申请人 成都智元汇信息技 术股份有限公司 地址 610000 四川省成 都市中国 (四川) 自 由贸易试验区成都 高新区吉泰五路88 号3栋26层1号 (72)发明人 邓秋雄 赵丁漫 李阳 饶龙强  周武毅 张剑勇 李建涛 袁进泽  杨伟  (74)专利代理 机构 成都蓉创智汇知识产权代理 有限公司 51276 专利代理师 赵雷 (51)Int.Cl. G06F 3/14(2006.01) G06F 9/451(2018.01)G06F 40/30(2020.01) G10L 15/26(2006.01) H04H 20/62(2008.01) (54)发明名称 基于公共交通的文本、 音频自适应方法、 显 示终端、 系统 (57)摘要 本发明公开了一种基于公共交通的文本自 适应方法、 显示终端、 系统, 具体包括以下步骤: S1、 接收主控端发送的人工播报信息及相关信 息, 所述相关信息包括中断指令或置信度, 所述 人工播报信息包括人工播报音频与文本信息; S2、 对所述人工播报音频进行自适应处理, 获得 自适应人工播报音频; 对所述文本信息进行自适 应处理, 获得自适应显示页面; S3、 根据所述自适 应人工播报音频、 自适应文本信息, 以及中断指 令或置信度将进行同步播放与显示。 本发明通过 大大降低了系统的耗能, 同时也赋能于设备, 使 设备不单单只是一个语音播报, 同时也具备自适 应文本展示的功能, 提升 了设备价 值。 权利要求书3页 说明书8页 附图3页 CN 114564165 A 2022.05.31 CN 114564165 A 1.基于公共交通的文本、 音频自适应方法, 其特征在于, 应用于站点的显示终端, 所述 显示终端与主控端实现通信交 互, 具体包括以下步骤: S1、 接收主控端发送 的人工播报信息及相关信息, 所述相关信息包括中断指令或置信 度, 所述人工播报信息包括人工播报音频与文本信息; S2、 对所述人工播报音频进行自适应处 理, 获得自适应人工播报音频; 对所述文本信息进行自适应处 理, 获得自适应显示页面; S3、 根据所述自适应人工播报音频、 自适应文本信 息, 以及中断指令中断当前播放的音 频、 中断当前显示的页面并同步播放、 显示所述自适应人工播报音频、 显示所述自适应显示 页面; 或 根据所述自适应人工播报音频、 自适应文本信息, 以及置信度将所述自适应人工播报 音频、 自适应显示页面插入待播放显示队列, 所述待播放显示队列用于按照置信度的大小 顺序依次读取所述待播放显示队列中的自适应人工播报音频、 自适应显示页面, 以用于根 据所述自适应人工播报音频、 自适应显示页面进行同步 播放与显示。 2.根据权利要求1所述的基于公共交通的文本、 音频自适应方法, 其特征在于, 所述自 适应处理包括调速处 理, 所述调速处 理具体包括以下步骤: 对所述人工播报音频进行语义识别获得文本信息, 所述文本信息包括总字数与总时 长; 获取所述总字数与总时长的比值并进行判定; 当所述比值小于预设范围的最小端点时, 对所述人工播报音频进行加速处理, 以得到 与预设速度相匹配的加速的自适应人工播报音频; 当所述比值大于预设范围的最大端点时, 对所述人工播报音频进行减速处理, 以得到 与预设速度相匹配的减速的自适应人工播报音频。 3.根据权利要求1所述的基于公共交通的文本、 音频自适应方法, 其特征在于, 所述自 适应处理还包括标准 化处理, 所述标准 化处理具体包括以下步骤: 对人工播报音频进行拼音解析处理, 得到人工播报音频对应的拼音序列; 将拼音序列 输入普通话识别模型, 得到人工播报音频的普通 话识别判定结果; 当普通话识别判定结果为是, 则通过文本转语音模块对所述文本信 息进行语音合成生 成合成人工播报音频。 4.根据权利要求1所述的基于公共交通的文本、 音频自适应方法, 其特征在于, 对所述 文本信息进行自适应处 理, 获得自适应显示页面, 具体包括以下步骤: 获取所述显示终端的屏幕尺寸; 根据所述屏幕尺寸确定与自适应显示页面适配的字体大小; 其中, 所述自适应显示页 面为在所述显示终端的屏幕上待显示的文本信息 。 5.根据权利要求4所述的基于公共交通的文本、 音频自适应方法, 其特征在于, 所述文 本信息携带有预设尺寸, 根据所述屏幕尺寸确定与自适应显示页面适配的字体大小, 具体 包括以下步骤: 若所述屏幕尺寸大于预设尺寸, 根据所述屏幕尺寸和所述预设尺寸确定尺寸调整量; 根据所述尺寸调整量和预设的调整系数, 计算所述与自适应显示页面适配的字体大 小。权 利 要 求 书 1/3 页 2 CN 114564165 A 26.根据权利要求5所述的基于公共交通的文本、 音频自适应方法, 其特征在于, 所述文 本信息还携带有预设字体大小, 通过以下公式计算所述与自适应显示页面适配的字体大 小: c=b×(w‑p)×a; 其中, w‑p为所述尺寸调整量, w为所述屏幕尺寸, p为所述预设尺寸, a为所述预设的调 整系数, b为与预设尺寸相匹配的预设字体大小,c为所述与自适应显示页面适配的字体大 小。 7.根据权利要求4所述的基于公共交通的文本、 音频自适应方法, 其特征在于, 所述文 本信息还携带有预设字体大小, 通过以下公式计算所述与自适应显示页面适配的字体大 小: c=b×w/p; 其中, w/p为所述尺寸调整量, w为所述屏幕尺寸, p为所述预设尺寸, b为与预设尺寸相 匹配的预设字体大小,c为所述与自适应显示页面 适配的字体大小。 8.一种基于公共交通的文本、 音频自适应显示终端, 其特 征在于, 包括: 显示屏; 一个或多个处 理器; 存储单元, 用于存储一个或多个程序, 当所述一个或多个程序被所述一个或多个处理 器执行时, 能使得所述一个或多个处理器实现根据权利要求 1至7中任意一项 所述的一种基 于公共交通的文本自适应方法, 所述 一个或多个程序包括: 接收模块, 用于接收主控端发送的人工播报信息及相关信息, 所述相关信息包括中断 指令或置信度, 所述人工播报信息包括人工播报音频与文本信息; 自适应模块, 用于对所述人工播报音频进行自适应处 理, 获得自适应人工播报音频; 对所述文本信息进行自适应处 理, 获得自适应显示页面; 播放显示模块, 用于根据 所述自适应人工播报音频、 自适应文本信 息, 以及中断指令 中 断当前播放的音频、 中 断当前显示的页面并同步播放、 显示所述自适应人工播报音 频、 显示 所述自适应显示页面; 或 根据所述自适应人工播报音频、 自适应文本信息, 以及置信度将所述自适应人工播报 音频、 自适应显示页面插入待播放显示队列, 所述待播放显示队列用于按照置信度的大小 顺序依次读取所述待播放显示队列中的自适应人工播报音频、 自适应显示页面, 以用于根 据所述自适应人工播报音频、 自适应显示页面进行同步 播放与显示。 9.一种基于公共交通的文本、 音频自适应系统, 其特 征在于, 包括: 显示终端与主控端, 所述显示终端与主控端通过局域网实现通信交 互, 所述主控端具 备语音采集显示终端, 用于: 构建站点的三维模型地图, 所述三维模型中包括站点每个显示终端的标签以及显示终 端对应的屏幕尺寸, 以及应急场景 下预设人工播报音频、 预设文本信息; 获取三维模型地图中被选择的显示终端; 将人工播报音频、 文本信息以及相关信息下发至所述显示终端; 所述人工播报音频包 括预设人工播报音频或语音采集模块在触发后采集的人工播报音频信息; 所述文本信息包 括预设文本信息或语音采集模块在触发后采集的人工播报音频信息并进行语音转文字处权 利 要 求 书 2/3 页 3 CN 114564165 A 3

PDF文档 专利 基于公共交通的文本、音频自适应方法、显示终端、系统

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于公共交通的文本、音频自适应方法、显示终端、系统 第 1 页 专利 基于公共交通的文本、音频自适应方法、显示终端、系统 第 2 页 专利 基于公共交通的文本、音频自适应方法、显示终端、系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:28上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。