全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210155863.0 (22)申请日 2022.02.21 (65)同一申请的已公布的文献号 申请公布号 CN 114217901 A (43)申请公布日 2022.03.22 (73)专利权人 中国人民解 放军国防科技大 学 地址 410000 湖南省长 沙市开福区德雅路 109号 (72)发明人 余杰 刘晓东 彭龙 马俊  谭郁松 吴庆波  (74)专利代理 机构 苏州国诚专利代理有限公司 32293 专利代理师 陈松 (51)Int.Cl. G06F 9/451(2018.01)G06F 40/58(2020.01) (56)对比文件 US 2014180 670 A1,2014.0 6.26 US 2020073948 A1,2020.0 3.05 WO 2007056807 A1,20 07.05.24 CN 112115063 A,2020.12.2 2 CN 10434615 3 A,2015.02.1 1 审查员 李敏 (54)发明名称 国产操作系统下汉藏语言数据的翻译管理 及评估方法 (57)摘要 本发明提供了一种 国产操作系统下汉藏语 言数据的翻译管理及评估方法, 其可以对基于 Linux的国产 操作系统中大量软件数以千万计的 藏语言数据进行统筹管理, 有效降低国产操作系 统汉藏语言维护的管理成本, 包括以下步骤: 解 析基于Linux的国产 操作系统下所有的软件源代 码, 获得源词条, 构建源词条数据集; 响应于源词 条的翻译数据的更新, 构建新增 翻译数据与源词 条的翻译映射关系; 依据翻译映射关系, 在国产 操作系统中进行跨软件的待处理源词条检查, 对 于检测到存在待处理源词条的软件, 进行翻译数 据的更新 或新增; 对新增翻译数据进行翻译质量 评估, 输出翻译正确性的评估结果。 权利要求书2页 说明书8页 附图4页 CN 114217901 B 2022.07.29 CN 114217901 B 1.国产操作系统下汉藏语言数据的翻译管理及评估方法, 其特 征在于, 包括以下步骤: 解析基于Linux的国产操作系统下所有的软件源代码, 获得源词条, 构建源词条数据 集, 所述国产操作系统为银河麒 麟操作系统; 响应于源词条的翻译数据的更新, 构建新增翻译数据与源词条的翻译映射关系; 依据翻译 映射关系, 在 国产操作系统中进行跨软件的待处理源词条检查, 对于检测到 存在待处 理源词条的软件, 进行翻译数据的更新或新增; 对新增翻译数据进行翻译质量评估, 输出翻译正确性的评估结果; 其中, 所述源词条的翻译数据的更新通过交互式web服务提供源词条数据集的翻译服 务, 收录翻译人员翻译得到的新增翻译数据得到; 翻译正确性的评估结果 通过交互式web服 务反馈给翻译人员, 用于优化翻译质量; 所述对新增翻译数据进行翻译质量评估, 输出翻译正确性的评估结果, 具体包括以下 步骤: 对翻译映射关系中新增翻译数据进行语义相关性分析, 如果语义相似性未达到设定的 阈值, 标记待分析翻译数据的翻译正确性概率为0; 如果达到阈值, 则继续进行翻译数据差 异性计算; 分析新增翻译数据与标准翻译样本的差异性, 依据差异性数值计算得到新增翻译数据 的翻译正确性 概率; 将国产操作系统中所有源词条的翻译正确性 概率汇总, 输出 软件翻译正确性报告。 2.根据权利要求1所述的国产操作系统下汉藏语言数据的翻译管理及评估方法, 其特 征在于, 所述构建新增翻译数据与源词条的翻译映射关系, 具体包括以下步骤: 对源词条进行语言合法性校验, 对于检测合法的源词条, 检测源词条是否存在源词条 数据集中, 将检测到不合法或对应的源词条不在源词条数据集中的源词条作为非法数据进 行废弃; 对于通过语言合法性检测且存在于源词条数据集中的源词条, 继续检测源词条是否存 在翻译数据, 若源词条存在翻译数据, 更新关联的翻译映射关系, 如果不存在翻译数据, 构 建新的翻译映射关系。 3.根据权利要求2所述的国产操作系统下汉藏语言数据的翻译管理及评估方法, 其特 征在于: 在 对源词条进 行语言合法性校验时, 若源词条不是合法的汉语或藏语的自然语言, 在交互式web服 务中提供报错或警告。 4.根据权利要求2所述的国产操作系统下汉藏语言数据的翻译管理及评估方法, 其特 征在于: 在 对藏语言的源词条进 行语言合法性校验时, 通过识别藏语 言文本数据的ISO  639  语言标识码, 分析源词条 是否为合法自然语言。 5.根据权利要求2所述的国产操作系统下汉藏语言数据的翻译管理及评估方法, 其特 征在于: 响应于翻译映射关系的更新或者新建, 生产关联的翻译 更新事件, 响应于翻译更新 事件的产生, 从翻译更新事件中解析得到待处理源词条, 在国产操作系统中全部软件中行 进行待处 理源词条检查。 6.根据权利要求5所述的国产操作系统下汉藏语言数据的翻译管理及评估方法, 其特 征在于: 所述对于检测到存在待处理源词条的软件, 进 行翻译数据的更新或新增, 具体包括 以下步骤:权 利 要 求 书 1/2 页 2 CN 114217901 B 2对于检测到存在待处理源词条的软件, 检测软件中是否存在待处理源词条的翻译数 据, 若不存在翻译 数据, 则根据翻译映射关系, 新增源词条的翻译 数据; 若存在翻译 数据, 对 比软件中的原有翻译数据与翻译映射关系中新增翻译数据是否一致, 若不一致, 则采用新 增翻译数据进行 更新, 若一 致, 则对新增翻译数据作废弃处 理; 将更新后的或新增的翻译数据提交至对应的软件 源代码进行 更新。 7.根据权利要求1所述的国产操作系统下汉藏语言数据的翻译管理及评估方法, 其特 征在于: 所述方法基于 国产操作系统下汉藏语言数据的翻译管理及评估系统实现, 所述国 产操作系统下汉藏语言数据的翻译管理及评估系统包括 通讯连接的: 源词条获取模块, 用于解析基于Linux的国产操作系统下所有的软件源代码, 获得源词 条, 构建源词条 数据集; 翻译映射关系构建模块, 用于根据获得的源词条的翻译数据的更新, 构建新增翻译数 据与源词条的翻译映射关系; 更新模块, 用于依据翻译 映射关系, 在 国产操作系统中进行跨软件的待处理源词条检 查, 对于检测到存在待处 理源词条的软件, 进行翻译数据的更新或新增; 评估模块, 用于对新增翻译数据进行翻译质量评估, 输出翻译正确性的评估结果。 8.根据权利要求1所述的国产操作系统下汉藏语言数据的翻译管理及评估方法, 其特 征在于: 所述方法基于计算机装置实现, 所述计算机装置包括: 包括处理器、 存储器以及程 序; 所述程序存储在所述存储器 中, 所述处理器调用存储器存储的程序, 以执行权利要求1 所述的国产操作系统下汉藏语言数据的翻译管理及评估方法。 9.根据权利要求1所述的国产操作系统下汉藏语言数据的翻译管理及评估方法, 其特 征在于: 所述方法基于计算机可读存储介质实现, 所述计算机可读存储介质用于存储程序, 所述程序用于执行权利要求1所述的国产操作系统下汉藏语言数据的翻译管理及评估方 法。权 利 要 求 书 2/2 页 3 CN 114217901 B 3

.PDF文档 专利 国产操作系统下汉藏语言数据的翻译管理及评估方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 国产操作系统下汉藏语言数据的翻译管理及评估方法 第 1 页 专利 国产操作系统下汉藏语言数据的翻译管理及评估方法 第 2 页 专利 国产操作系统下汉藏语言数据的翻译管理及评估方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:26:13上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。