文库搜索
切换导航
首页
频道
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
首页
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
批量下载
ICS 35.040 L 71 GB 中华人民共和国国家标准 GB/T21023—2007 中文语音识别系统通用技术规范 General specification for Chinese speech recognition system 2007-06-29发布 2007-11-01实施 中华人民共和国国家质量监督检验检疫总局 发布 中国国家标准化管理委员会 GB/T21023—2007 目 次 前言 III 范围 规范性引用文件 2 术语和定义 语音识别系统分类及表述 4. 1 基于用途的分类 4. 2 基于词汇量的分类 4. 3 基于所能识别的说话人群的分类 4.4 基于系统工作模式的分类 4.5 语音识别系统的应用环境 4.6 语音识别系统使用背景环境 语音识别系统表述规范 4.7 5语音识别系统性能指标 5. 1 概述 5.2 识别性能分类指标 5.3响应时间指标 5. 4 系统分类指标要求 6语音输人和识别输出 6. 1 语音识别输入准则 6.2语音识别输出准则 7 语音识别系统性能测试方法 7. 1 概述 7. 2 测试语料设计 7. 3 测试语音录制 7. 4 基于语音识别标准库的测试方法 7. 5 基于现场口呼的测试方法 7. 6 测试报告内容 8语音识别标准库及规范 8. 1 概述 8.2语音识别标准库语音特性的描述 8.3 语音识别标准库的标注 8 8. 4 语音识别标准库的来源 8.5语音识别标准库的数据转换 附录A(资料性附录)听写系统有关符号读法 附录B(资料性附录) 语音识别用无调汉语拼音表 11 参考文献 12 GB/T 21023—2007 前言 请注意本标准的某些内容有可能涉及专利。本标准的发布机构不承担识别这些专利的责任 本标准的附录A、附录B是资料性附录。 本标准由中华人民共和国信息产业部提出。 本标准由全国信息技术标准化技术委员会归口。 本标准由中国电子技术标准化研究所、中国科学院自动化研究所、清华大学、中国社会科学院语言 研究所起草。 本标准主要起草人:徐波、孙甲松、李爱军、徐明星、黄泰翼、鲍怀翘、尹波、吴志刚。 II GB/T21023—2007 中文语音识别系统通用技术规范 1范围 本标准规定了中文语音识别系统的基本术语、分类,技术指标、测试方法,输入/输出以及中文语音 识别标准库等。 本标准适用于各种计算机、网络和终端设备配置的中文语音识别系统。本标准的制定和实施主要 用于指导中文语音识别系统的研制、应用和测试。 2规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有 的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究 是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB18030—2005信息技术中文编码字符集 3术语和定义 下列术语和定义适用于本标准。 3. 1 语音识别 speechrecognition 将人类的声音信号转化为文字或者指令的过程。 3. 2 语音识别系统 speech recognition system 具有语音识别功能的开发工具、软件、装置或应用。 3.3 词汇表 vocabulary list 语音识别系统所包含和处理的所有词汇。 3. 4 激活词汇 activeword 语音识别系统在某个时间点能同时识别的所有词汇。 3.5 发音utterance 用户输入的一个语音单位,可以是词、短语或句子。发音单元之间需有有意、明显停顿。 3. 6 孤立字语音isolatedwordspeech 以字为发音单元,字与字之间需有有意、明显停顿的语音。 3.7 连接词语音 connected word speech 以词为发音单元,词与词之间需有有意、明显停顿的语音 3.8 连续语音 continuous speech 词与词之间无需刻意停顿的自然发音语音。 注:包括朗读语音和自然语音。 GB/T21023—2007 3. 9 汉语通用语 Mandarin and its dialect variation 普通话以及普通话的地方变体。 注:为中国人跨地区交流时最常见之普通话。 3. 10 同构语音数据 isomorphic speech data 除说话人不同外,其他语音属性相同或基本相同的语音数据集合。 3. 11 语音识别工作模式 working modefor speechrecognition 语音识别系统对说话方式、内容以及句型等的限制。 3. 12 标准配置 standardconfiguration 正常运行语音识别所需要的基本计算机配置 注:如CPU、内存、网络、麦克风、A/D精度要求等,由生产厂家给出。 3.13 系统自适应 speaker adaption 语音识别系统通过用户发音完成对识别模型参数修改的自适应过程。 3.14 用户自适应 user adaption 用户熟悉应用系统、了解自动语音识别系统特性的学习过程 3.15 删除错误deletionerror 用户所发语音在语音识别结果中没有出现的错误。 3. 16 插入错误insertionerror 用户没有发的语音在识别结果中出现的错误。 3. 17 替换错误 substitution error 用户所发语音被识别成其他语音的语音识别错误。 3. 18 被测系统 system for testing 参加评估的语音识别系统。 3. 19 测试系统 testing system 对被测系统进行评估的系统和体系。 3.20 副语言学 paralinguistic feature 言语中非音段的语音特征以及种种非语音信号。 注:这些行为被充分用来对总的交际效应作出贡献 4语音识别系统分类及表述 语音识别系统可以基于不同的用途、不同的词汇量、所能适应的不同人群、不同的工作模式、不同的 应用平台进行分类。基本分类可以融合,例如某个系统可以是“基于PC平台的超天词汇量特定人群书 2
GB-T 21023-2007 中文语音识别系统通用技术规范
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由
思安
于
2023-02-21 17:30:58
上传分享
举报
下载
原文档
(2.7 MB)
分享
给文档打分
您好可以输入
255
个字符
网站域名是多少( 答案:
github5.com
)
评论列表
暂时还没有评论,期待您的金玉良言
热门文档
SL-T 801-2020 水利一张图空间信息服务规范.pdf
GB-T 26698-2022 考试用铅笔和涂卡专用笔.pdf
DB11-T 1961-2022 软件和信息化项目运行评价指标体系 北京市.pdf
GB-T 35278-2017 信息安全技术 移动终端安全保护技术要求.pdf
DB11-T 1537-2018 风机节能监测 北京市.pdf
GB-T 27025-2019 检测和校准实验室能力的通用要求.pdf
GB-T 28839-2012 进出境货物木质包装申报规范.pdf
ISO IEC 27017-2015 中文版.pdf
T-CACE 087.1—2023 基于项目的温室气体减排量评估技术规范 互联网平台闲置物品交易 通用要求.pdf
DB43-T 1997-2021 数字化电能计量装置整体误差检测技术规范 湖南省.pdf
绿盟 2014工控系统的安全研究与实践报告.pdf
GM-T 0078-2020 密码随机数生成模块设计指南.pdf
GB-T 2428-1998 成年人头面部尺寸.pdf
T-CAMDI 009.10—2020 无菌医疗器械初包装洁净度 第10部分:污染限量.pdf
T-CSTM 00500—2022 绿色设计产品评价技术规范 光伏逆变器.pdf
GB-Z 29830.1-2013 信息技术 安全技术 信息技术安全保障框架 第1部分:综述和框架.pdf
GB-T 31516-2015 邻苯二甲酸酐危险特性分类方法.pdf
DB3305-T 244-2022 数字法院信息系统运维管理规范 湖州市.pdf
ISO 5393 2017 Rotary tools for threaded fasteners — Performance test method.pdf
DB13-T 5181-2020 尾矿库溃坝泥石流数值模拟技术规程 河北省.pdf
1
/
3
15
评价文档
赞助2元 点击下载(2.7 MB)
回到顶部
×
微信扫码支付
2
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里 下载
×
分享,让知识传承更久远
×
文档举报
举报原因:
×
优惠下载该文档
免费下载 微信群 欢迎您
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。