ICS 35.240.01 CCS L 60 中华人民共和国国家标准 GB/T41864—2022 信息技术 计算机视觉 术语 Information technology-Computer vision-Terminology 2022-10-12实施 2022-10-12发布 国家市场监督管理总局 发布 国家标准化管理委员会 GB/T41864—2022 目 次 前言 范围 1 规范性引用文件 2 3 术语和定义 3.1 图像表示类 3.2 图像获取类 3.3 图像处理类 3.4 图像分割类 10 3.5 图像理解类 3.6 视频理解类 16 3.7 三维计算机视觉类 21 3.8 计算摄像学类 23 3.9 性能评价类 24 3.10 应用相关类 26 参考文献 28 索引 29 GB/T41864—2022 前言 起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任, 本文件由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。 学院自动化研究所、北京爱奇艺科技有限公司、中国工业互联网研究院、上海科技大学、北京格灵深瞳信 息技术有限公司、清华大学、南开大学、北京理工大学、南京邮电大学、福州大学、北京科技大学、北京邮 电大学、中国科学院深圳先进技术研究院、华北电力大学、北京交通大学、北京电子科技学院、中国科学 技术大学、电子科技大学、深圳市商汤科技有限公司、湘潭大学、西北工业大学、西安电子科技大学、哈尔 司、华中科技大学、北京信息科技大学、中国传媒大学、河南科技学院、南京大学、兰州理工大学、中国科 学院大学、中科南京软件技术研究院、中国科学院软件研究所、武汉理工大学、中国医学科学院生物医学 工程研究所、山东省计算中心(国家超级计算济南中心)、上海依图网络科技有限公司、杭州海康威视数 字技术股份有限公司、小米通讯技术有限公司、北京电信规划设计院有限公司、深圳云天励飞技术股份 阵元技术(深圳)有限公司、北京三快在线科技有限公司(美团)、北京佰才邦技术有限公司、华夏芯(北 京)通用处理器技术有限公司、云从科技集团股份有限公司、重庆邮电大学、北京眼神科技有限公司、之 江实验室、苏州中德宏泰电子科技股份有限公司、曙光信息产业股份有限公司、北京字节跳动网络技术 有限公司、郑州金惠计算机系统工程有限公司。 本文件主要起草人:陈熙霖、册立芳、马珊珊、王亮、王涛、王聪、马伟、简萌、卢汉清、邓亚峰、刘俊晖、 李实英、黄严、张晓垒、索津莉、刘烨斌、杨巨峰、程明明、柴森春、周全、赵铁松、牛玉贞、殷绪成、马占宇、 刘海波、苗启广、葛仕明、沈晶、刘伟锋、徐明亮、吴月升、刘文予、冯、黄小明、曹刚、王海棠、马玉琨、 任桐炜、杨丽芳、李策、马丙鹏、李晖、王少帆、张文利、李如玮、王卓峰、段立娟、贾熹滨、齐娜、杨新武、 王瑾、朱青、付利华、刘兆英、虞晶怡、何晖光、谢凌曦、文石磊、乔利稳、邓成、王瑞平、黄祥林、肖长诗、 高永超、张婷、薛云志、孟令中、张媛、许源、蒲江波、赵春昊、任文奇、浦世亮、赵群、徐圣普、王珏、韩宵、 朱亚军、吴涛、邹博、傅建龙、蒲亚坤、资鑫斌、王一鹤、冯小雪、曹晓琦、张伊祎、那票宁、魏晓明、李军、 马彬、田永会、刘军、丁雨、罗家赛、宋方方、单海军、宁皓、欧阳马生、朱贵波、王金桥、刘亦珩、张磊、 杨春林、张栋栋、王长虎。 GB/T41864—2022 信息技术 计算机视觉 术语 1范围 本文件界定了计算机视觉领域中常用的术语和定义。 本文件适用于计算机视觉概念的理解和信息交流 规范性引用文件 2 本文件没有规范性引用文件。 3术语和定义 3.1[ 图像表示类 3.1.1 彩色图像 colorimage 种采用多通道分量表示可见光波段光谱信息的图像。 3.1.2 多光谱图像 multi-spectral image 一种采用多通道分量表示相应波长的光谱信息的图像。 注:如果多光谱图像表达的光谱信息对应波长均处于可见光波段,则为彩色图像。 3.1.3 多视图 日multipleview 组从不同方位拍摄的同一场景的图像 3.1.4 二值图像 泉binaryimage 种采用单通道二值分量表示的图像。 3.1.5 高动态范围图像 high dynamic range image 一种具有更大曝光动态范围(即更大的明暗差别)的图像。 3.1.6 灰度 grayscale 种图像亮度表示方式,仅表示图像中每一个像素的亮度信息 注:灰度通常从最暗(黑色,灰度为0)到最亮(白色,灰度为最大值),通常将灰度划分为256个等级,其中0代表最 暗等级,255代表最亮等级。 3.1.7 灰度图像 泉grayscaleimage 一种采用单通道分量表示的图像。 1 GB/T41864—2022 3.1.8 全景图 panorama 种通过多幅图像拼接获取的图像。 3.1.9 随机噪声 random noise 波动不可预测的图像噪声。 注:随机噪声包括随机白噪声(功率谱密度为常数)、有色噪声(功率谱密度不为常数)、高斯噪声(统计上服从高斯 分布)、椒盐噪声(由两个脉冲值组成)。 3.1.10 图像 image 一种客观世界视觉信息的静态可视化表示。 注:图像包括数字图像和模拟图像。 3.1.11 图像分辨率 image resolution 图像单位尺寸中包含的像素点数,用于描述图像精细程度 注:对于数字图像的分辨率,通常由垂直方向和水平方向单位距离的像素个数确定。 3.1.12 颜色模型 colormodel 一种利用基本颜色元素表示颜色的数学模型。 注:常用的颜色模型包括RGB(以红色(Red)、绿色(Green)和蓝色(Blue)为基本颜色分量)、HSI(以色调(Hue)、饱 和度(Saturation)和强度(Intensity)为基本颜色分量)、Lab(以L、a、b作为基本颜色分量)、YCbCr(以亮度、蓝色 和红色为基本颜色分量)、CMYK[以青(Cyan)、品红(Magenta)、黄(Yellow)和黑(Black)为基本颜色分量等。 3.1.13 颜色空间 color space 一种利用颜色模型的基本元素张成的颜色表达空间。 3.1.14 噪声 noise 随机出现于图像中的亮度或色度干扰。 3.1.15 噪声分布 noisedistribution 一种描述图像中的噪声统计特性的方法。 3.1.16 周期噪声 periodic noise 一种存在于图像中的具有空间周期特性的噪声。 3.2 图像获取类 3.2.1 成像雷达 imaging radar 产生高分辨率目标图像的雷达系统。 2 GB/T41864—2022 3.2.2 超分辨成像super-resolutionimaging 通过改进成像系统,增强其获得的图像的分辨率。 注1:光学超分辨成像方法突破了光学成像系统的衍射极限。 注2:几何超分辨成像方法着眼于增强数字传感器的分辨率。 3.2.3 多光谱相机multi-spectralcamera 高光谱相机hyper-spectralcamera 种获取场景图像中多个波长(段)的光谱信息的相机。 3.2.4 象timeofflightimaging 飞行时间成像 利用光速测量光信号在相机和物体之间传播所经历的时间,来解析图像上各点对应深度信息。 3.2.5 高动态范围成像highdynamicrangeimaging 与正常的数字成像技术相比,允许更大范围的曝光或值动态范围(即,在明暗区域之间的值范围更 广)的一组技术。 注1:目的是准确表示各种强度级别,例如在外部场景中受阳光直射的浅色物品和深色阴影区域。 注2:通常利用从不同曝光范围照片中生成的方法来获取高动态范围图像。 [来源:ISO19262:2015,3.119,有修改] 3.2.6 光度立体photometricstereo 一种通过在不同光照条件下观察物体来估计物体表面法线的技术。 3.2.7 光台lightstage 一种用于场景形状、纹理、反射、动作捕捉的结构光或多相机系统。 3.2.8 光场相机lightfieldcamera 一种记录下多个方向光束数据,形成光场,并通过计算生成指定对焦面或观测视角的图像的相机。 3.2.9 结构光相机structuredlightcamera 种通过向场景主动投射特定红外结构光并利用摄像头采集信息来获取物体的位置和深度的 - 相机。 3.2.10 立体相机stereocamera 一种利用两个或多个独立成像的镜头,同步采集场景中多视点信息并获取场景三维信息的相机。 3.2.11 模拟相机analogcamera 种利用可以逐渐变化的媒体(如胶片和摄影板)记录光学影像的相机。 注:可以逐渐变化的媒体包括胶片、摄影板等。 3 GB/T41864—2022 3.2.12 偏振相机 polarizationcamera 一种利用偏振传感器来获取每个图像像素的强度和偏振角度的相机。 注:偏振相机可用于压力检查,减少反光,改善图像对比度,检测划痕以及物体检测等应用 3.2.13 数字相机digitalcamera 使用芯片阵列图像传感器检测图像的设备,例如感光耦合元件(CCD)或互补式金属氧化物半导体 (CMOS),其将视觉图像转换为电信号。 [来源:ISO20263:2017,3.1.4] 3.2.14 深度相机 Ldepthcamera 一种记录每个像素点在三维物理场景中对应点到相机镜头距离的相机。 注:常见的深度相机成像方法包括结构光成像、飞行时间成像等 3.2.15 图像采样 image sampling 在水平和垂直方向上

pdf文档 GB-T 41864-2022 信息技术 计算机视觉 术语

文档预览
中文文档 48 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共48页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
GB-T 41864-2022 信息技术 计算机视觉 术语 第 1 页 GB-T 41864-2022 信息技术 计算机视觉 术语 第 2 页 GB-T 41864-2022 信息技术 计算机视觉 术语 第 3 页
下载文档到电脑,方便使用
本文档由 思安2023-01-18 17:30:47上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
热门文档