南京海米云信息科技有限公司 025-85989270

虚拟人、数字人、虚拟数字人傻傻分不清?一文看懂数字人

发布者:147小编 时间:2023-12-07

责任编辑需经许可,明令禁止转发!

交互式人、位数人、交互式位数人心急搞不清

现阶段交互式人、位数人、交互式位数人那些和位数人有关的术语在网络上关注度非常高。8月18日,明星龚俊位数人亮相于腾讯与中央电视台新闻联合举办的“腾讯世界大会2021”上,因此上了热搜。

相片源自https://www.notion.so/707f032b96914f74a6d1d6195a823833#bce81d59b9024a8d9a9504467f257c43

今年三月份,澳门热蒙堡县面世了全新交互式代言“Zoe”,并正式发布一支名为《Re/Imagine》的国际品牌公益广告,Zoe也是澳门首个国际品牌独创的交互式代言。

澳门热蒙堡县交互式代言“Zoe”,相片源自 https://www.youtube.com/watch?v=a9Yv1Qc-N94

惠康也在5月面世了交互式童星imma作为交互式代言的X绿雪糕广告。imma由韩国的AWW公司制作,并负责运营。事实上,imma还有几位弟妹。

惠康X绿雪糕交互式代言imma,相片源自https://t.cj.sina.com.cn/articles/view/3168382560/bcd9ae6001900ya3f

同在5月,以“AYAYI”为SS的超戏剧化位数人在SNS平台火爆散播,其在聚润正式发布的首篇讲义,获得近300万的阅读量,近10appledaily赞,因此一夜涨粉近4万。

AYAYI,相片源自http://www.xinhuanet.com/techpro/20210721/0e8dfd50699f43358d273d094452658c/202107210e8dfd50699f43358d273d094452658c_4bt3-2_b.jpg

交互式人、位数人、交互式位数人,那些术语有什么区别呢?那些术语现阶段没有标准技术标准的表述,在责任编辑中笔者尝试从字面、控制技术上,和其强调的目的几个方面厘清它们的表述,和之间的亲密关系。讨论其表述和亲密关系的意义在于对位数人这个应用领域进行制度化、技术标准,以便散播过程中传递准确而清晰的表述,建立技术标准的知觉,更有利于行业发展。

术语发展史

从发展史上来看,医学研究应用领域种叠使用交互式人那些术语——20世纪末80二十世纪起,人类文明医学对消化系统结构、物理反应、性刺激位数化演示控制技术开始发展,发起了一系列针对消化系统的研究方案,包括人类文明基因组方案(human genome project,HGP)、IntelliTone人类文明方案(visible human project,VHP)、交互式人类文明方案(virtual human project,VHP)、人类文明神经系统方案(human brain project,HBP)。21世纪末初,美国科学家国联(FAS)基于上述方案成立了位数人国联(digital human consortium),目标是实现对DNA、蛋白质、细胞、组织、器官、系统和整体生命运作机制进行精确演示。

而碰巧也在20世纪末80二十世纪,1982年韩国以《强袭堡垒》中配角曹原彰美为依据包装了首位交互式百变,其单曲成功打进当时知名音乐榜单。

《强袭堡垒》配角曹原彰美,相片源自https://www.youtube.com/watch?v=oLaouxryhBA

1984年英国创造出一个Max Headroom 的交互式人物为主人公的记录片,播映后一炮而红,节目播映全天收视增加一倍。

Max Headroom,相片源自https://en.wikipedia.org/wiki/File:MaxheadroomMpegMan.jpg

2007年,韩国达秘普顿今后媒体面世了交互式百变VOCALOID今后,面世后一炮而红,其音乐创作关注度自面世后一直持续至今,可以说VOCALOID今后打开了交互式人音乐创作的大门。

VOCALOID今后,相片源自https://upload.wikimedia.org/wikipedia/zh/thumb/7/7f/Hatsune_Miku_NT.jpg/250px-Hatsune_Miku_NT.jpg

2019年,视觉特效公司位数王国软件研发主管Doug Roble博士在TED演讲中演示了由自己表演实时驱动的位数化身Digi Doug。

Doug Roble在TED演讲中演示Digi Doug,相片来源,https://digitaldomain.com/wp-content/uploads/2019/12/Live-on-the-TED-Stage.jpg

与医学研究应用领域目的不同,责任编辑所提及的交互式人、位数人、交互式位数人的目标是通过计算机图形学控制技术(Computer Graphic,CG)创造出与人类文明形象接近的位数化形象,并赋予其特定的人物身份设定,在视觉上拉近和人的心理距离,为人类文明带来更加真实的情感互动。

交互式人

网络上流行的交互式网红、交互式主播,称之为交互式人(Virtual Human)。之所以称之为交互式,第一点人物的身份是虚构的,现实世界中不存在的,比如火热的的交互式网红Lil Miquela,她在Instagram上的拥有300多万粉丝,她虚构的身份设定是生活在洛杉矶的一名19岁女生。

Lil Miquela,相片源自https://www.instagram.com/p/COI_tD1hjGh/

如果说身份是虚构的,那么电视剧或电影里的人类文明演员所扮演的配角也是可能是虚构的,但人类文明配角并不能称之为交互式人,因为第二点——交互式人没有现实世界中的身体,它是通过计算机图形学控制技术进行交互式制作的,交互式人的本体存在于计算设备中(比如电脑、手机)中,通过显示设备呈现出来,让人类文明能通过眼睛看见。第三点,它具备人类文明的外观和行为模式,交互式人具有人类文明身体的外观形体结构,表现出来的行为模式是与人类文明相仿的,交互式人的影像通常是呈现出某种人类文明的活动。比如VOCALOID今后的的配角设定是16岁的百变,生日8月31日,身高与体重则分别是158cm与42kg,擅长流行歌曲,摇滚乐和舞蹈,网上散播的VOCALOID今后的图像视频主要是歌舞类型。

位数人

“位数人”一词源自于英文 Digital Human,中文翻译过来是“位数人类文明”,简称位数人,现阶段关于位数人并没有技术标准的表述。之所以称之为位数人,强调了它存在于位数世界。而位数世界是人类文明设计运行于计算设备上的代码和数据,它是计算设备上运行的程序,位数世界底层操纵的是0和1这样的数据,相对于人类文明物理世界来说,物理世界是真实的,位数世界是交互式的。位数人基本满足交互式人的第二、三项特征,稍有区别的是,位数人的身份设定可以是按照现实世界中的人物进行设定,外观也可以完全一致,按照真人还原制作的位数人也可以称为位数孪生,比如位数王国制作的 Digi Doug

位数王国软件研发主管Doug Roble的照片和其位数孪生渲染图的对比,相片源自https://www.artstation.com/artwork/L2KK4l

交互式人和位数人,如果交互式人表述放弃第一项交互式身份设定的要求,强调其存在于交互式位数世界的性质,那么和位数人就没有区别。

交互式位数人

中国人工智能产业发展国联总体组和中关村数智人工智能产业国联位数人工作委员会正式发布的《2020 年交互式位数人发展白皮书》(以下简称“位数人白皮书”)中对交互式位数人的描述是:

与上述医疗应用领域的位数化消化系统不同,本篇中所分析的交互式位数人(以下简称“位数人”)是指具有位数化外形的交互式人物。与具备实体的机器人不同,交互式位数人依赖显示设备存在。交互式位数人宜具备以下三方面特征:一是拥有人的外观,具有特定的相貌、性别和性格等人物特征;二是拥有人的行为,具有用语言、面部表情和肢体动作表达的能力;三是拥有人的思想,具有识别外界环境、并能与人交流互动的能力。

位数人白皮书中”具有位数化外形的交互式人物“的描述强调了交互式人物的性质。关于交互式人物的表述,并没有进行解释。腾讯百科上交互式人物的表述是:

交互式人物指在现实中或发展史上不存在的人物配角,它可以存在于电视剧、电影、漫画、游戏等的音乐创作性作品中虚构的人物。

如果按照腾讯百科上对交互式人物的表述,则位数人白皮书中描述的交互式位数人是对上述交互式人描述的延展,除了外观和行为,增加了思想和交流互动的部分,如果严格按照上述各表述特征的要求,位数人的范畴包含交互式人,交互式人的范畴包含交互式位数人。

而现阶段存在的大多数交互式位数人自身是不具备思考的能力,与外界交互绝大多数是通过人操纵实现的交互,比如交互式主播之类。现阶段通过人工智能控制技术提供的交互能力,其能力与人力幼童相比也是非常初级的。主要是因为现阶段人工智能的智能水平还比较低,能做的事情很有限。这一点,用过智能音箱的朋友应该都深有感触,无论是小度,还是小爱同学、天猫精灵,都只能对部分特定句式的问题给出有效回答。

位数人白皮书中对交互式位数人是否必须满足其所述三项特征的描述上用词并不直接——“宜具备”。宜是多义词,作为形容词有”合适的“的意思,作为动词有”适合于“的意思,作为助动词有”应当“、”应该“的意思,但在现代汉语中多用于否定词(不宜),此处将宜理解为助动词”应该“比较合适语境,即”位数人应该具备以下三方面特征“,即不要求必须具备,只是期望具备。在不要求必须具备思想和交流互动的能力前提下,交互式人和交互式位数人是等价的,交互式位数人强调交互式身份和位数化制作特性。

对于不要求必须具备交流互动能力,虚构身份的位数人,位数人、交互式人、交互式位数人这三者概念可以认为是等同的,网络上很多文章中指的是这个级别的表述,三者经常混淆使用。从严格意义上来讲,上文对位数人表述更宽泛,后文使用“位数人”一词来进行讨论。

2D位数人与3D位数人

2D指的是几何上的二维,3D指的是几何上的三维。2D是平面空间,3D是立体空间。2D位数人和3D位数人区别不仅体现在视角上,也体现在制作控制技术上。从呈现视角形式来说,2D位数人只能以单个视角去浏览,一般都是在制作的时候就已经确定了视角,用户不可以自行变换视角。而3D位数人能够以任意视角去浏览,至于是否开放视角给用户自己调整,由产品制作团队根据产品设定来表述。现阶段大多数显示设备都是2D的,很多3D作品也选择使用2D呈现,比如科幻动作电影《阿丽塔:战斗天使》是使用3D制作,影院放映同时有2D和3D版。但即使是3D版本,也只能有立体效果,并不能调整视角。从制作控制技术上来说,3D位数人需要制作三维立体模型,2D位数人则不一定需要。为什么说不一定需要,因为传统的制作方法一般直接做2D的图像即可,而新的趋势也有使用制作三维模型渲染成2D图像的方法来制作。

照片戏剧化位数人

位数人的外观风格可以由有多种类型,通常由艺术家来表述,比如有卡通、戏剧化等等。在3D位数人方向,专门强调外观和动作看起来非常逼真,渲染效果达到难以辨别是照片还是渲染图的程度,可以称之为照片戏剧化位数人(photorealistic digital human),典型代表是Siren

Siren渲染图,相片源自https://docs.unrealengine.com/4.27/en-US/Resources/Showcases/DigitalHumans/

为什么专门聊一下照片级戏剧化位数人,因为这是现阶段3D动画行业对位数人研究的最新进展,要达到动作尤其是表情非常真实的效果是非常难且复杂的,在诸多方面存在挑战,但也是最接近真实人类文明外观的效果,人类文明在情感上接受度会更高。位数人可以应用到娱乐、金融、医疗、快消等诸多应用领域,比如在电影中饰演某个配角,作为银行的交互式客户经理,亦或者作为你的交互式助理。那些应用要通过位数人传递非常真实人类文明的情感表现,因此对位数人的外观、表情、声音、动作都希望达到与人类文明无差异的水平,这也推动了照片戏剧化位数人的发展。2021年初,虚幻引擎开发商Epic Games面世了MetaHuman Creator ,用于快速创造出非常真实的位数人,因此通过动作捕捉系统可以在虚幻引擎中实时驱动并渲染。

MetaHuman Creator 界面,相片源自https://docs.metahuman.unrealengine.com/Images/UserGuide/Face/mhc_face_blend.webp

结语

近年来明星国际品牌代言丑闻不断,对于代言的国际品牌方有非常大的负面影响。交互式人设的位数人作为国际品牌代言避免了人设崩塌风险。因此,位数人可以7X24小时工作,这也是人类文明无法做到的。现阶段多个行业都在进行位数人作为人类文明替代或补充的应用探索,这也是位数人走向商业化的一种模式。现在很热的元宇宙(Metaverse),正是一个庞大的交互式位数世界,位数人在将会其中扮演非常重要的组成部分。

位数人的浪潮正在席卷而来,无论在商业上,还是在控制技术上,位数人在今后都有非常大的发展空间。那么,我们离头号玩家中的交互式世界还有多远呢?

参考文献

2020 年交互式位数人发展白皮书,中关村数智人工智能产业国联,http://pg.jrj.com.cn/acc/Res/CN_RES/INDUS/2020/12/19/cdb07e97-aa5f-4f6a-bf9a-7c001bb43b26.pdfVOCALOID今后,维基百科,https://zh.wikipedia.org/wiki/VOCALOID未來Max Headroom,维基百科,https://en.wikipedia.org/wiki/Max_Headroom位数人,腾讯百科,https://baike.baidu.com/item/位数人交互式人物,腾讯百科,https://baike.baidu.com/item/交互式人物位数人、交互式人、位数替身区别是什么?,CG世界,https://www.163.com/dy/article/G65SG2560516BJGJ.html中国位数人男1号,腾讯百科,https://baike.baidu.com/item/中国位数人男1号位数消化系统研究及其应用,吕婷,中国组织工程研究与临床康复 第 14 卷 第 48 期 2010–11–26 出版,https://www.cjter.com//fileup/2095-4344/PDF/2010-48-9041.pdf只做了个头?雀巢也自己搞了个交互式童星!,CG世界,https://mp.weixin.qq.com/s/AxRSjF3ffX1ZI5vkNrvuTg“超戏剧化位数人”火了 交互式童星也有明星“待遇”,北京青年报,http://www.xinhuanet.com/techpro/20210721/0e8dfd50699f43358d273d094452658c/c.htmlStyle3D携手腾讯智能云,为交互式IP加码位数服装,砍柴网,https://xw.qq.com/cmsid/20210830A0AECW00

注:头图源自网络相片合成(上:Zoe,下左一:VOCALOID今后,下左二:阿喜,下左三:华智冰,下左四:Siren,下左五:imma)