说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
首页
频道
批量下载
联系我们
问题反馈
投诉渠道
商务合作
注册会员
首页
批量下载
联系我们
问题反馈
投诉渠道
商务合作
注册会员
批量下载
ICS 35.040 L 71 GB 中华人民共和国国家标准 GB/T21023—2007 中文语音识别系统通用技术规范 General specification for Chinese speech recognition system 2007-06-29发布 2007-11-01实施 中华人民共和国国家质量监督检验检疫总局 发布 中国国家标准化管理委员会 GB/T21023—2007 目 次 前言 III 范围 规范性引用文件 2 术语和定义 语音识别系统分类及表述 4. 1 基于用途的分类 4. 2 基于词汇量的分类 4. 3 基于所能识别的说话人群的分类 4.4 基于系统工作模式的分类 4.5 语音识别系统的应用环境 4.6 语音识别系统使用背景环境 语音识别系统表述规范 4.7 5语音识别系统性能指标 5. 1 概述 5.2 识别性能分类指标 5.3响应时间指标 5. 4 系统分类指标要求 6语音输人和识别输出 6. 1 语音识别输入准则 6.2语音识别输出准则 7 语音识别系统性能测试方法 7. 1 概述 7. 2 测试语料设计 7. 3 测试语音录制 7. 4 基于语音识别标准库的测试方法 7. 5 基于现场口呼的测试方法 7. 6 测试报告内容 8语音识别标准库及规范 8. 1 概述 8.2语音识别标准库语音特性的描述 8.3 语音识别标准库的标注 8 8. 4 语音识别标准库的来源 8.5语音识别标准库的数据转换 附录A(资料性附录)听写系统有关符号读法 附录B(资料性附录) 语音识别用无调汉语拼音表 11 参考文献 12 GB/T 21023—2007 前言 请注意本标准的某些内容有可能涉及专利。本标准的发布机构不承担识别这些专利的责任 本标准的附录A、附录B是资料性附录。 本标准由中华人民共和国信息产业部提出。 本标准由全国信息技术标准化技术委员会归口。 本标准由中国电子技术标准化研究所、中国科学院自动化研究所、清华大学、中国社会科学院语言 研究所起草。 本标准主要起草人:徐波、孙甲松、李爱军、徐明星、黄泰翼、鲍怀翘、尹波、吴志刚。 II GB/T21023—2007 中文语音识别系统通用技术规范 1范围 本标准规定了中文语音识别系统的基本术语、分类,技术指标、测试方法,输入/输出以及中文语音 识别标准库等。 本标准适用于各种计算机、网络和终端设备配置的中文语音识别系统。本标准的制定和实施主要 用于指导中文语音识别系统的研制、应用和测试。 2规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有 的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究 是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB18030—2005信息技术中文编码字符集 3术语和定义 下列术语和定义适用于本标准。 3. 1 语音识别 speechrecognition 将人类的声音信号转化为文字或者指令的过程。 3. 2 语音识别系统 speech recognition system 具有语音识别功能的开发工具、软件、装置或应用。 3.3 词汇表 vocabulary list 语音识别系统所包含和处理的所有词汇。 3. 4 激活词汇 activeword 语音识别系统在某个时间点能同时识别的所有词汇。 3.5 发音utterance 用户输入的一个语音单位,可以是词、短语或句子。发音单元之间需有有意、明显停顿。 3. 6 孤立字语音isolatedwordspeech 以字为发音单元,字与字之间需有有意、明显停顿的语音。 3.7 连接词语音 connected word speech 以词为发音单元,词与词之间需有有意、明显停顿的语音 3.8 连续语音 continuous speech 词与词之间无需刻意停顿的自然发音语音。 注:包括朗读语音和自然语音。 GB/T21023—2007 3. 9 汉语通用语 Mandarin and its dialect variation 普通话以及普通话的地方变体。 注:为中国人跨地区交流时最常见之普通话。 3. 10 同构语音数据 isomorphic speech data 除说话人不同外,其他语音属性相同或基本相同的语音数据集合。 3. 11 语音识别工作模式 working modefor speechrecognition 语音识别系统对说话方式、内容以及句型等的限制。 3. 12 标准配置 standardconfiguration 正常运行语音识别所需要的基本计算机配置 注:如CPU、内存、网络、麦克风、A/D精度要求等,由生产厂家给出。 3.13 系统自适应 speaker adaption 语音识别系统通过用户发音完成对识别模型参数修改的自适应过程。 3.14 用户自适应 user adaption 用户熟悉应用系统、了解自动语音识别系统特性的学习过程 3.15 删除错误deletionerror 用户所发语音在语音识别结果中没有出现的错误。 3. 16 插入错误insertionerror 用户没有发的语音在识别结果中出现的错误。 3. 17 替换错误 substitution error 用户所发语音被识别成其他语音的语音识别错误。 3. 18 被测系统 system for testing 参加评估的语音识别系统。 3. 19 测试系统 testing system 对被测系统进行评估的系统和体系。 3.20 副语言学 paralinguistic feature 言语中非音段的语音特征以及种种非语音信号。 注:这些行为被充分用来对总的交际效应作出贡献 4语音识别系统分类及表述 语音识别系统可以基于不同的用途、不同的词汇量、所能适应的不同人群、不同的工作模式、不同的 应用平台进行分类。基本分类可以融合,例如某个系统可以是“基于PC平台的超天词汇量特定人群书 2
GB-T 21023-2007 中文语音识别系统通用技术规范
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 思安 于
2023-02-21 17:30:58
上传分享
举报
下载
原文档
(2.7 MB)
分享
友情链接
GB-T 39254-2020 增材制造 金属制件机械性能评价通则.pdf
GB-T 19707-2005 冰刀鞋.pdf
T-CSTM 01094—2023 材料基因工程 合金扩散偶制备元数据.pdf
DB11-T 348-2022 建筑中水运行管理规范 北京市.pdf
GB-T 32169.3-2015 政务服务中心运行规范 第3部分:窗口服务提供要求.pdf
YD-T 4177.3-2022 移动互联网应用程序(APP)收集使用个人信息最小必要评估规范 第3部分:图片信息.pdf
GB-T 16275-2008 城市轨道交通照明.pdf
GB-T 10886-2019 三螺杆泵.pdf
GB-T 41787.1-2022 室内LED照明设备天花板安装接口 第1部分机械接口和电气接口规范.pdf
GM-T 0027-2014 智能密码钥匙技术规范.pdf
DB4405-T 197—2019 近江牡蛎养殖技术操作规程 汕头市.pdf
GB-T 33138-2016 存储备份系统等级和测试方法.pdf
GB-T 14492-2008 一次性使用电石包装钢桶.pdf
T-CSBME 064—2022 骨龄辅助诊断人工智能医疗器械质量要求与评价 第1部分:数据集.pdf
GB-T 26250-2010 电子工业用气体 砷化氢.pdf
GB-T 10111-2008 随机数的产生及其在产品质量抽样检验中的应用程序.pdf
DB31-T 1356.2-2022 公共数据资源目录 第2部分:元数据规范 上海市.pdf
GB-T 39559.2-2020 城市轨道交通设施运营监测技术规范 第2部分:桥梁.pdf
T-CIAPS 0031—2023 钠离子电池通用规范.pdf
YD-T 3763.6-2021 研发运营一体化(DevOps)能力成熟度模型 第6部分:安全及风险管理.pdf
1
/
3
15
评价文档
赞助2元 点击下载(2.7 MB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。