专利 基于公共交通的文本、音频自适应方法、显示终端、系统

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210169414.1 (22)申请日 2022.02.23 (71)申请人成都智元汇信息技术股份有限公司地址 610000 四川省成都市中国（四川）自由贸易试验区成都高新区吉泰五路88 号3栋26层1号 (72)发明人邓秋雄　赵丁漫　李阳　饶龙强　周武毅　张剑勇　李建涛　袁进泽　杨伟　 (74)专利代理机构成都蓉创智汇知识产权代理有限公司 51276 专利代理师赵雷 (51)Int.Cl. G06F 3/14(2006.01) G06F 9/451(2018.01)G06F 40/30(2020.01) G10L 15/26(2006.01) H04H 20/62(2008.01) (54)发明名称基于公共交通的文本、音频自适应方法、显示终端、系统 (57)摘要本发明公开了一种基于公共交通的文本自适应方法、显示终端、系统，具体包括以下步骤： S1、接收主控端发送的人工播报信息及相关信息，所述相关信息包括中断指令或置信度，所述人工播报信息包括人工播报音频与文本信息； S2、对所述人工播报音频进行自适应处理，获得自适应人工播报音频；对所述文本信息进行自适应处理，获得自适应显示页面； S3、根据所述自适应人工播报音频、自适应文本信息，以及中断指令或置信度将进行同步播放与显示。本发明通过大大降低了系统的耗能，同时也赋能于设备，使设备不单单只是一个语音播报，同时也具备自适应文本展示的功能，提升了设备价值。权利要求书3页说明书8页附图3页 CN 114564165 A 2022.05.31 CN 114564165 A 1.基于公共交通的文本、音频自适应方法，其特征在于，应用于站点的显示终端，所述显示终端与主控端实现通信交互，具体包括以下步骤： S1、接收主控端发送的人工播报信息及相关信息，所述相关信息包括中断指令或置信度，所述人工播报信息包括人工播报音频与文本信息； S2、对所述人工播报音频进行自适应处理，获得自适应人工播报音频；对所述文本信息进行自适应处理，获得自适应显示页面； S3、根据所述自适应人工播报音频、自适应文本信息，以及中断指令中断当前播放的音频、中断当前显示的页面并同步播放、显示所述自适应人工播报音频、显示所述自适应显示页面；或根据所述自适应人工播报音频、自适应文本信息，以及置信度将所述自适应人工播报音频、自适应显示页面插入待播放显示队列，所述待播放显示队列用于按照置信度的大小顺序依次读取所述待播放显示队列中的自适应人工播报音频、自适应显示页面，以用于根据所述自适应人工播报音频、自适应显示页面进行同步播放与显示。 2.根据权利要求1所述的基于公共交通的文本、音频自适应方法，其特征在于，所述自适应处理包括调速处理，所述调速处理具体包括以下步骤：对所述人工播报音频进行语义识别获得文本信息，所述文本信息包括总字数与总时长；获取所述总字数与总时长的比值并进行判定；当所述比值小于预设范围的最小端点时，对所述人工播报音频进行加速处理，以得到与预设速度相匹配的加速的自适应人工播报音频；当所述比值大于预设范围的最大端点时，对所述人工播报音频进行减速处理，以得到与预设速度相匹配的减速的自适应人工播报音频。 3.根据权利要求1所述的基于公共交通的文本、音频自适应方法，其特征在于，所述自适应处理还包括标准化处理，所述标准化处理具体包括以下步骤：对人工播报音频进行拼音解析处理，得到人工播报音频对应的拼音序列；将拼音序列输入普通话识别模型，得到人工播报音频的普通话识别判定结果；当普通话识别判定结果为是，则通过文本转语音模块对所述文本信息进行语音合成生成合成人工播报音频。 4.根据权利要求1所述的基于公共交通的文本、音频自适应方法，其特征在于，对所述文本信息进行自适应处理，获得自适应显示页面，具体包括以下步骤：获取所述显示终端的屏幕尺寸；根据所述屏幕尺寸确定与自适应显示页面适配的字体大小；其中，所述自适应显示页面为在所述显示终端的屏幕上待显示的文本信息。 5.根据权利要求4所述的基于公共交通的文本、音频自适应方法，其特征在于，所述文本信息携带有预设尺寸，根据所述屏幕尺寸确定与自适应显示页面适配的字体大小，具体包括以下步骤：若所述屏幕尺寸大于预设尺寸，根据所述屏幕尺寸和所述预设尺寸确定尺寸调整量；根据所述尺寸调整量和预设的调整系数，计算所述与自适应显示页面适配的字体大小。权　利　要　求　书 1/3 页 2 CN 114564165 A 26.根据权利要求5所述的基于公共交通的文本、音频自适应方法，其特征在于，所述文本信息还携带有预设字体大小，通过以下公式计算所述与自适应显示页面适配的字体大小： c＝b×(w‑p)×a；其中， w‑p为所述尺寸调整量， w为所述屏幕尺寸， p为所述预设尺寸， a为所述预设的调整系数， b为与预设尺寸相匹配的预设字体大小,c为所述与自适应显示页面适配的字体大小。 7.根据权利要求4所述的基于公共交通的文本、音频自适应方法，其特征在于，所述文本信息还携带有预设字体大小，通过以下公式计算所述与自适应显示页面适配的字体大小： c＝b×w/p；其中， w/p为所述尺寸调整量， w为所述屏幕尺寸， p为所述预设尺寸， b为与预设尺寸相匹配的预设字体大小,c为所述与自适应显示页面适配的字体大小。 8.一种基于公共交通的文本、音频自适应显示终端，其特征在于，包括：显示屏；一个或多个处理器；存储单元，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，能使得所述一个或多个处理器实现根据权利要求 1至7中任意一项所述的一种基于公共交通的文本自适应方法，所述一个或多个程序包括：接收模块，用于接收主控端发送的人工播报信息及相关信息，所述相关信息包括中断指令或置信度，所述人工播报信息包括人工播报音频与文本信息；自适应模块，用于对所述人工播报音频进行自适应处理，获得自适应人工播报音频；对所述文本信息进行自适应处理，获得自适应显示页面；播放显示模块，用于根据所述自适应人工播报音频、自适应文本信息，以及中断指令中断当前播放的音频、中断当前显示的页面并同步播放、显示所述自适应人工播报音频、显示所述自适应显示页面；或根据所述自适应人工播报音频、自适应文本信息，以及置信度将所述自适应人工播报音频、自适应显示页面插入待播放显示队列，所述待播放显示队列用于按照置信度的大小顺序依次读取所述待播放显示队列中的自适应人工播报音频、自适应显示页面，以用于根据所述自适应人工播报音频、自适应显示页面进行同步播放与显示。 9.一种基于公共交通的文本、音频自适应系统，其特征在于，包括：显示终端与主控端，所述显示终端与主控端通过局域网实现通信交互，所述主控端具备语音采集显示终端，用于：构建站点的三维模型地图，所述三维模型中包括站点每个显示终端的标签以及显示终端对应的屏幕尺寸，以及应急场景下预设人工播报音频、预设文本信息；获取三维模型地图中被选择的显示终端；将人工播报音频、文本信息以及相关信息下发至所述显示终端；所述人工播报音频包括预设人工播报音频或语音采集模块在触发后采集的人工播报音频信息；所述文本信息包括预设文本信息或语音采集模块在触发后采集的人工播报音频信息并进行语音转文字处权　利　要　求　书 2/3 页 3 CN 114564165 A 3

专利 基于公共交通的文本、音频自适应方法、显示终端、系统

专利基于公共交通的文本、音频自适应方法、显示终端、系统