南京海米云信息科技有限公司 025-85989270

用一篇文章,帮你了解什么是虚拟数字人?

发布者:147小编 时间:2023-12-15

洛天依的再次出现和伤风败俗,让许多人看见了可视化式童星的宽广消费市场。除此以外,可视化式主持人、可视化式雇员等位数人涌现,在替代人类文明专门从事这类金融行业的与此同时也引起了一些争论。本文作者围绕“位数人”进行预测,希望对你有帮助。

我们好,我是Clippp。那时为我们分享的是「可视化式位数人」。这段时间元银河系基本概念的大火带动了许多人对未来的无限玩味,与元银河系紧密相关的可视化式位数人的热度也在提升。

现在网络上经常再次出现各式各样的位数人,可视化式童星、可视化式主持人层出不穷,当然伴随着位数人一同再次出现的还有各种争论。

那时他们就来一起探究可视化式位数人是甚么、具有哪些特点,分成这三类类别以及都应用在甚么金融行业,深入地介绍可视化式位数人基本概念。

一、位数人的三各方面特点

可视化式位数人是指具有位数化外形的可视化式人物形像。与具有实体的机器人不同,可视化式位数人依赖表明电子设备存在,他们所知的许多可视化式人都要透过手机、电脑或者智慧液晶电视等电子设备才能表明。

可视化式位数人宜具有以下三各方面特点:

一是保有人的外观,具有特定的相貌、性别和性格等人物形像特点;二是保有人的行为,具有用语言、面部眼神和肢体姿势表达的潜能;三是保有人的思想,具有辨识外间环境、并能与人交流交互的潜能。

综合性上看,就是具有四各方面的潜能,即形像潜能、感知潜能、表达潜能和娱乐交互潜能。

如果他们下次再看见有公司推出位数人,就可以紧密结合这些特点和潜能来判断这个位数人的可信性,避免被趁势营销的企业钻了钻空子。

二、位数人的运转基本原理

知道了甚么是位数人,接下去就要搞清楚位数人到底是怎么说话、交互的,是背后有布偶在操控,还是完全透过控制技术聚合。

面对新兴的位数人,相信许多读者都存在类似的疑问。

位数人的诞生发展和AI人工智慧化可以说是密切相关,想介绍位数人的运转基本原理,具体来说要知道位数人的通用控制系统框架。

可视化式位数人控制系统一般情况下由人物形像形像、音频聚合、动画电影聚合、音频制备表明、可视化等5个组件构成。(资料参考:2020年可视化式位数人发展绿皮书)

可视化组件为扩展项,依照其有无,可将位数人分成可视化型位数人和非可视化型位数人。

具体来说看一下非可视化型位数人:控制系统依据目标文档聚合相关联的人物形像音频及动画电影,并制备音频呈现出给使用者。

可视化型位数人依照驱动力方式的不同可分成智能化驱动力型和布偶驱动力型。

智能化驱动力型位数人:透过智能化控制系统自动加载并导出辨识外间输入信息,依照导出结果决策位数人后续的输出文档,驱动力人物形像数学模型聚合相应的音频与姿势来使位数人跟使用者交互。

这种人物形像数学模型是预先透过AI控制技术训练得到,可透过文档驱动力聚合音频和相关联动画电影,业内将此数学模型称为TTSA(Text To Speech & Animation)人物形像数学模型。

布偶驱动力型位数人:布偶依照音频监控控制系统传来的使用者音频,与使用者实时音频,与此同时透过姿势捕捉采集控制系统将布偶的眼神、姿势呈现出在可视化式位数人形像上,从而与使用者进行可视化。

三、位数人常见的类别

调研预测当前消费市场上的位数人,依照人物形像图形层次,分成2D和3D两大类,由外形上可分成米老鼠、戏剧化等风格,综合性上看可分成ACG、3D米老鼠、3D高戏剧化、布偶形像四种类别。

接下去依照每种类别的特点,由外在形像、服饰装扮、眼神姿势等各方面,紧密结合典型案例来逐一预测可视化式位数人的设计。

1. ACG类别

可视化式歌手-洛天依

洛天依的职业设定为可视化式歌姬,个性软萌可爱、温柔细腻,外貌特点上是灰发、绿瞳,头戴碧玉发饰。

除了独特的形像和性格,洛天依还能唱歌、跳舞、直播带货,多样的才艺加持让人物形像设定不单薄,受到许多使用者的关注。

2. 3D米老鼠类别

可视化式助理-度晓晓

度晓晓是基于可视化式人IP的陪伴型可视化式助理。在小度助手的潜能基础上,度晓晓有可视化式人物形像形像和情感可视化控制系统,具有视觉辨识潜能,支持自然的交流方式。

在外形装扮上,度晓晓是红色短发的甜美可爱风,五官比例偏向ACG风格。依照现有案例上看,度晓晓在眨眼、微笑等面部微姿势以及肢体的造型,都很自然、生动,整体设计效果相对较好。

度晓晓定期更新身穿不同主题服装、摆着各种pose的形像,每套服装都有一个主题再带配上各种周边小配饰,营造出一种清新时尚的效果。

3. 3D高戏剧化类别

浦发银行位数雇员-小浦

小浦作为银行的位数雇员,主要进行风险评估、要闻播报、投资建议等在线服务。

由外观上,小浦在形像上无论发型还是五官都足够拟人化、职业化,穿着银行职业装,属于比较典型的银行职员形像。

小浦没有很夸张的面部眼神,始终以面带微笑的状态面向使用者,给人一种亲切感。肢体姿势相对较少,没有特别夸张的姿势设定,只有固定的几套姿势。

4. 可视化式童星-AYAYI

AYAYI是使用Unreal引擎造出来的特别拟真的Metahuman形像。

外在形像:戏剧化程度更高,人物形像整体效果已经和布偶十分接近,五官特别精致、眼睑微敛、银色短发,散发着一种清冷气质。

从AYAYI社交账号的更新上看,目前主要是分享一些AYAYI的摆拍图片,穿着的服装、饰品都比较真实、时尚,拍照环境都是休闲、艺术类的场景。

AYAYI人物形像形像的时尚感和真实感,更容易切入商业化,比如穿着特定品牌的服装进行摆拍。

高保真位数人-Siren(塞壬)

Siren是高保真、实时、可可视化位数人,用到了实时渲染、眼神捕捉、姿势捕捉、高保真3D扫描等前沿控制技术,达到了目前业界最高的控制技术水平。

Siren的面貌细节更加真实,可以很清楚看见皮肤的细节、眼睛的转动、说话的神态、脸上各种各样的细纹。不管是毛孔、细纹等皮肤质感,还是神态上的眼神,都很像布偶。

Siren在说话时嘴唇姿势自然,效果真实。之所以有的位数人看起来不自然,很大一部分原因是因为位数人面部眼神不生动,特别是在说话时嘴唇和脸部、牙齿甚至舌头的联动,很容易再次出现姿势不联动、不真实的情况。

5. 布偶形像类别

新华社AI制备主持人-新小浩

“新小浩”是无论外在形像、面部眼神、服装搭配、说话声音,还是肢体姿势上,都是完全基于真实主持人聚合。

透过音频制备、唇形制备、眼神制备以及深度学习等控制技术,克隆出具有和布偶主持人一样播报潜能的“AI 制备主持人”。

他们每天都会遇见各种各样的人,即使脸上最细微的眼神,他们都可以感知到,用计算机打造出来的眼神,往往缺乏灵气。

布偶形像的可视化式主持人的优势在于,他的特点都是来源于布偶,呈现出的面貌和状态更容易被使用者介绍。如果不仔细看,可能分辨不出是不是布偶。

四、位数人的应用场景

目前国内消费市场上已经再次出现了非常多的可视化式位数人,在各行各业中有着广泛的应用。

可视化式位数人控制技术紧密结合实际应用场景领域,切入各类,形成金融行业应用解决方案,赋能影视、传媒、游戏、金融、文旅等领域,依照需求为使用者提供定制化服务。

按照应用场景或金融行业的不同,已经再次出现了娱乐型位数人,如可视化式童星、歌手、网红、可视化式代言人等;

助手型位数人,如可视化式客服、可视化式导游、智能化助手。

主持人型位数人,如可视化式主持人、可视化式支持人等。

这里搜集的案例只是可视化式位数人的应用的一小部分,还有许多优秀的应用案例等待着我们去一起发现。

五、代表性的研发平台

国内有许多互联网平台在研发可视化式位数人,我也从中收获了大量的信息和资料,这次把这些平台分享给我们:

搜狗AI开放平台网易伏羲、网易易现百度AI开放平台腾讯云、腾讯NEXTStudios讯飞开放平台

如果我们想介绍更多关于AI人工智慧化、位数人和最新科技的发展,可以去这些平台学习~

慢慢来比较快,希望对你有所帮助!