ఒြ*"ࠩඔሳದϢJOEEఒြ*"ࠩඔሳದϢJOEE ༯༯ఒြ*"ࠩඔሳದϢJOEEఒြ*"ࠩඔሳದϢJOEE ༯༯目录
导语篇:L4 级以上的才是数字人未来
认知篇: AI 数字人的特征和价值
多模态交互、深度学习和 AIGC是 AI 数字人的三大特征
从“替代”到“连接”,AI 数字人应用的三大方向
生态篇:AI 数字人产业生态“拼图”
底层软硬件技术决定数字人系统“进化”水平AIGC赋能平台创造“低代码”数字人开发环境运营管理平台打通技术到应用的“最后一公里”多终端覆盖与数字人随时随地建立连接行业应用推动数字人价值的“增长飞轮”
能力篇:商汤赋能 AI 数字人走入千行百业
AI 技术“双维度”研发投入,夯实 AI 数字人生产力底座AIGC“全栈式”布局,打造“一站式”生产流水线
智能化生成引擎:增强人物形象的生动性智能化驱动引擎:提升人物动作的协调性智能化交互引擎:提高人物理解的智慧性
制作运营“一体化”,面向行业“全链路”赋能全终端、全行业方案覆盖,让数字人走入千行百业04
06
10
14
ఒြ*"ࠩඔሳದϢJOEEఒြ*"ࠩඔሳದϢJOEE ༯༯实践篇:AI 数字人应用八大场景
场景一:金融网点“新窗口”
场景二:在线互金“新入口”场景三:商场交互“新触点”场景四:文博讲解“新体验”场景五:品牌营销“新代言”场景六:企业前台“新形象”场景七:智慧车舱“新助手”场景八:虚拟活动“新服务”
展望篇:AI 数字人未来十大展望
展望一:产业数字化转型的重要抓手展望二:企业竞争的核心“人力”资产展望三:老龄化催生“陪伴型”数字人需求展望四:开发平台“在线化”(DHaaS) 是趋势展望五:未来虚实融合世界的基本组成展望六:数据安全和用户隐私保护仍是关键展望七:高等级数字人依赖通用 AI 技术发展展望八:“云边端”协同计算支撑规模化应用未来展望九:数字人资产确权和流通将促进交易市场活跃展望十:数字人市场发展将诞生一批新业态、新机遇19
27
ఒြ*"ࠩඔሳದϢJOEEఒြ*"ࠩඔሳದϢJOEE ༯༯4
导语篇:L4 级以上的才是数字人未来
导语篇
L4 级以上的才是数字人未来
2021 年是元宇宙元年,随着元宇宙概念的火爆也一同带动了数字人市场的快速升温。据计算全球平均每天都会
诞生一个数字人。数字人正成为一股潮流,涌入人们的日常生活——会“捉妖”的虚拟美妆达人柳夜熙,抖音出道三天点赞即超百万,一夜之间成为国内虚拟偶像界的“顶流”;在江苏卫视跨年演唱会上,昔日歌后邓丽君“重返”舞台,与歌手周深同台对唱,交织几代人的青春记忆;而在刚刚落幕的冬奥会上,二十多位数字人同台亮相,担当起手语主播、气象主播、奥林匹克公益宣传大使、冬奥官方周边带货主播等各式角色,代替真人为冬奥赛事提供服务支持……数字人的热度吸引着众多参与者纷纷入局,据企查查数据显示,国内现有“数字人”相关企业超过 28 万家,近五年的新增注册企业增速复合增长率达到近 60%。
与此同时,资本也在不断涌入数字人赛道。 据天眼查数据不完全统计,2021 年全年,数字人相关投资共 27 笔,
融资金额从数百万元人民币到数千万元美元不等。2022 年开年不到一个月的时间,数字人领域即完成了近百起
融资,累计额度超过 4 亿元人民币。
数字人市场的热度不减,除与元宇宙概念加持的关系外,技术驱动和需求牵引也是助力的关键。数字人的核心是“人”,本质上是通过数字技术提高数字人的综合体验,使之带来真人般的感受和互动。一方面,随着人工智能、虚拟现实、高精度渲染等技术的发展和融合,数字人的拟人化程度愈来愈高,从形象、
表情、 姿态、 动作, 再到语音、 语意、 语态等方方面面正在逐步逼近真人水平。 例如, 超写实数字人 (Metahuman)已成为当前主流,柳夜熙、 “邓丽君”等都是超写实数字人的代表,拥有高度逼真的数字化外观形象。另一方面,人工智能技术在数字人形象生成、动作驱动和语言交互等环节的深入应用,也将进一步提升数字人制作的 自动
化水平,推动数字人市场从利基走向大众。
在需求侧,消费领域的流量经济和产业领域的人口红利都在面临增长瓶颈,对生产效率与成本提出了更多要求。
数字人的高度拟人化代替真人角色进入生产生活各个领域,将成为数字经济发展的“新动能 ”,为 Z 时代新消
费市场,以及产业数字化转型构筑巨大的想象空间和应用前景。据头豹研究所测算,2030 年我国数字人整体市场规模将达到 2700 亿元。
ఒြ*"ࠩඔሳದϢJOEEఒြ*"ࠩඔሳದϢJOEE ༯༯5
企业级 AI数字人 |数字经济发展“新动能”
数字人的拟人化,以及生产制作的自动化程度反映数字人系统整体进化和发展水平,代表着数字技术综合运
用能力和成熟度体现。根据“拟人化”和“自动化”两个维度,我们可以将数字人分成 L1-L5 五个等级,如下图所示。
以人工制作为主场景 : 平面展示等主要依赖外部动
捕设备采集口型、表情、肢体动作信息
场景 : 视频录播等主要依赖算法驱动
口型、表情、肢体动作
场景 : 实时互动等智能化交互,但在
特定场合需要人工接管
场景 : 垂直领域逐
步代替真人服务等完全实现智能化交互, 可处理全局性、通用性问题
场景 : 个性化虚拟助
手
理解智能拟人化程度
动作协调
形象写实
自动化水平 Al 在各个制作环节的渗透程度L1L2L3L4L5
数字人 L1-L5 等级(来源:商汤智能产业研究院)
其中,我们将 L4 和 L5 等级的数字人统称为“AI 数字人”。 Ta 们不仅具备高度的拟人化呈现,在形象、
动作和智力层面都更接近于真人水平,能够听懂、看懂、有记忆、自学习,与人进行自然交互;同时,在制
作流程中也融合了大量的人工智能算法技术来提升数字人的生产效率,降低数字人的制作成本。我们认为,只有达到 L4 级别及以上的数字人才能真正的走入千行百业,在消费和产业领域大放异彩。
那么,AI 数字人具有哪些特征?它的市场价值、产业生态和发展趋势又是如何?商汤科技作为一家人工智能
企业, 我们在生态中扮演怎样的角色, 又是如何赋能 AI 数字人产业的可持续发展?白皮书将分别从认知、 生态、能力、实践和展望五个方面为大家展现数字人发展的未来图景。
ఒြ*"ࠩඔሳದϢJOEEఒြ*"ࠩඔሳದϢJOEE ༯༯01
认知篇
AI 数字人的特征和价值
多模态交互、深度学习和 AIGC是 AI 数字人的三大特征
从“替代”到“连接”,AI 数字人应用的三大方向
认知篇 生态篇 能力篇 实践篇 展望篇0708
ఒြ*"ࠩඔሳದϢJOEEఒြ*"ࠩඔሳದϢJOEE ༯༯7
企业级 AI数字人 |数字经济发展“新动能”
多模态交互、深度学习和 AIGC
是 AI 数字人的三大特征
我们认为, 具备足够自然和拟真的多模态交互能力, 是数字人在更广泛的应用场景中逐步替代真人角色的关键。
所谓“多模态交互”,即是将深度学习神经网络和计算机图形学相结合,充分模拟人与人之间自然真实的交互方式,实现“听得懂,看得见,说得出”的人机交互效果。
拥有多模态交互能力的 AI 数字人,不仅能够呈现传统语音对话无法展现的多媒体信息,通过结合计算机视觉
技术,还能完成身份识别、手势识别、情感识别等多项交互任务,让交互过程更加丰富且高效。与此同时,可视化的写实形象也赋予了 AI 数字人独特的情感温度,有助于建立人性化的情感纽带。
每一个 AI 数字人背后都有一个“智慧的大脑”,可以基于语音语义理解等技术,结合不同领域的知识库和海
量数据训练,进行深度学习和迭代升级,让自己变得越来越“聪明”,越来越专业,从而能够快速适应瞬息万变的市场变化和细分化的场景需求,不断打破即有的应用边界,为用户持续创造新价值和新体验。应用
价值 制作AI 数字人
三大基本特征多模态交互是“核心力”
替代真人角色的关键
深度学习是“创造力”
越来越“聪明”AIGC 是“生产力”
降低制作门槛
AI 数字人的三大基本特征(来源:商汤智能产业研究院)
首先,在应用层面,多模态交互是 AI 数字人的“核心力”。
其次,在价值层面,深度学习是 AI 数字人的“创造力”。
ఒြ*"ࠩඔሳದϢJOEEఒြ*"ࠩඔሳದϢJOEE ༯༯
商汤 企业级AI数字人白皮书 2022
安全报告 >
运营商 >
文档预览
中文文档
32 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共32页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思安 于 2023-01-16 17:30:06上传分享