来源:官媒
【官媒综合报导】杨伯涛:去年“双11” ,亚洲地区数十家B2C网络平台现场北京人民广播电台上架数个“位数人”主持人,不仅“相片等级”重制布偶眼神姿势,还能24半小时现场直播带货、流利解答顾客疑问、推荐多种省钱团购…… 有统计数据统计,现阶段在我国从事音频表演等活动的主持人账号有近1.4亿个,其中交互式“位数人”占了四成,超过5000万个。 “位数人”怎样问世?还有什么样应用领域情景?未来可能面临什么样风险和机遇?《官媒》本报记者对此展开了调查。
半半小时,两个“位数人”问世!
“位数人”又称“2D布偶孪生位数人”, 指人们通过计算机控制技术模拟两个类似布偶的交互式人形像。天猫云言犀位数人商品相关人士接受《官媒》本报记者采访时,梳理了以大数学模型为代表的人工智慧控制技术,怎样从无到有创造两个“位数人”。
简单说,两个“位数人”问世须要历经三个步骤。第一步,“人像音频拍摄”。仅需收集布偶主持人的形像外貌、人声等音音频统计数据,比如,能在录影棚收集1至2个半小时布偶带货音频等。实际上,前述相关人士介绍,在现有大数学模型控制技术护持下,已经能做到只需收集布偶3到5两分钟的音频。
第二步,“形像人声数学模型体能训练”。包括音音频预处理、自动化统计数据标注、3D人脸重建、皮肤痒驱动体能训练等。简单说,就是把这三五两分钟音频放入天猫云独立自主研发软件“位数人自助布季夫工具”中,24半小时内,就能生产两个“位数人”。
“我们其实还能做得更快,例如能有针对性地对主持人带货的状态展开统计数据收集,半个半小时就能生产出来两个用于现场直播带货的‘位数人’。”前述相关人士说本报记者,现阶段,天猫云约莫为4000个国际品牌提供“位数人”服务项目。以现场直播“位数人”为例,形像订制服务费约莫几万元左右,也有更快速轻量化以及批量化订制形像可直接采用,服务费不到一万元。两者区别在哪?前者聚合的“位数人”,皮肤痒匹配、神态表现的效果能根据顾客需求订制。但从商业应用领域的视角考虑,后者性价比更高,生产成本更低。
第三步,投放给用户,将“位数人”形像应用领域在不同情景。去年9月,新浪微博曾上架一段音频,人工智慧学者高庆一的“位数人”和天猫来宾的“位数人”展开了一场闲谈。音频中,“位数人”高庆一的站立、表情符号、眼神,以及和天猫“位数人”来宾之间的互动,几乎能模拟布偶,但仍能看出和布偶之间的差距。“从整个制作的控制技术视角来讲,金融行业内现阶段比拼的是怎样用更快的速度,更低的生产成本,去复制和布季夫‘位数人’。”该相关人士说本报记者,很多“位数人”看起来眼神比较呆板且面目固定,仅手部有一些小姿势,怎样聚合大面目,如侧脸、站立、表情符号等,也是金融行业内急需突破的两个控制技术难点。
贵州毕节,AI位数会客厅里的交互式主持人。图源 视觉我国
现阶段看,“位数人”生产成本十分具有诱惑力。据介绍,言犀交互式主持人生产成本不足布偶的1/10,除一台电脑和两个营运人员外无需其他投入。前述相关人士为本报记者举了两个国产化妆国际品牌采用“位数人”现场直播的例子,借助如前所述大数学模型的现场直播文案自动聚合,国际品牌方只需2至3个半小时就能完成现场北京人民广播电台电影剧本的搭建。如果采用布偶现场直播,100多款商品靠人工编写现场直播电影剧本,可能要花费两三天。效果方面,统计数据表明,采用“位数人”和布偶接力现场直播后,现场北京人民广播电台月销量翻了3倍。
多方推动“位数人”更多破冰
去年杭州亚运会开幕式,观众对参与点火的“位数火炬”印象深刻。随着人工智慧控制技术的不断成熟,此类“位数人”已经越来越走近普通人的生活,在B2C带货、在线现场直播、新闻播报等领域大显身手。
我国人工智慧企业华大基因交互式人网络平台总经理郜静文15日说《官媒》本报记者,华大基因的交互式位数人应用领域覆盖媒体、教育、金融、文旅、资源共享等,交互式人能出任交互式主持人、交互式老师、交互式客服人员、交互式导游、交互式政务导办员等角色。
据郜静文介绍,“位数人”的生产成本主要包括构筑生产成本、控制技术服务项目生产成本、独立自主营运生产成本,现阶段各块生产成本随着控制技术和应用领域情景的迭代改进也在持续降低,如2D布偶构筑的交互式人,前几年体能训练须要30两分钟的统计数据,现阶段统计数据在3两分钟乃至30秒也能完成构筑,“这方面控制技术的快速发展,也是真实世界情景破冰需求给控制技术带来的巨大推动力”。
“位数人”在韩国也非常火爆,很多金融行业开始起用交互式位数人展开服务项目招待。据韩国朝日电视网报导,韩国电报电信公司开始采用交互式位数人出任招待向导。这个“位数人”是由9名真实世界员工和其他人的面孔合成的,而人声和姿势则是如前所述AI控制技术。报导称,这是韩国亚洲地区首个布偶大小的“位数人”,除了前台招待外,该“位数人”还将用于商务客服人员等。
美国科技公司通过打造交互式网红来帮助企业吸引流量。统计表明,2022年,大约35%的美国顾客购买了“位数人”推广的商品,PR320一代和Z世代成员占这些顾客总量的40%。据Territory Influence称,交互式网红市场现阶段价值46亿美元,预计到2025年将增长26%。
艾媒咨询提供的《2023年我国交互式人产业发展与商业趋势研究报告》表明,2022年我国交互式人带动产业市场规模和核心市场规模分别为1866.1亿和120.8亿,预计2025年分别达到6402.7亿和480.6亿。
现阶段,最常见的“位数人”出现在B2C现场直播领域。天猫云言犀位数人商品相关人士接受《官媒》本报记者采访时表示,“位数人”未来的应用领域情景非常广阔,金融机构、机场、政务部门等,都须要“位数人”员工提供服务项目,比如说充当办理线下业务的银金融行业务员、机场向导等等。
未来随着人工智慧控制技术的迭代,前述相关人士表示,“位数人”表现力将更加逼真,不仅仅在外观上,甚至在一些说话办事风格上,“位数人”都将被赋予更多“智能”,在一些服务项目类的情景迅速破冰,满足企业、机构的多种需求。
谈及“位数人”的未来应用领域情景,对外经济贸易大学国际关系学院学者梁怀新对《官媒》本报记者表示,“位数人”已经在B2C现场直播等领域得到充分应用领域,但其在自身的类人化呈现、交互感受等层面还存在很大的拓展空间。随着这些控制技术层面问题的解决,“位数人”的应用领域情景将会进一步拓展,在位数偶像、位数诊疗、位数谈判、位数电游等领域还会有更大的应用领域空间,能被用来打造大IP娱乐明星、类人化诊治医师、谈判助手、全息游戏等。
这些风险须要重视
随着“位数人”在越来越多的情景得到应用领域,其风险与监管问题也日益突出。对外经济贸易大学国际关系学院学者梁怀新说《官媒》本报记者,一方面,“位数人”在设计过程中须要收集仿生对象的个人统计数据,如果储存不当,容易造成隐私统计数据泄露,产生冒用个人人声、肖像展开诈骗的问题;另一方面,“位数人”的大量采用也会对劳动力市场产生冲击,使得人类的工作机会被大量占据,带来大规模失业风险;此外,“位数人”的安全问题还体现在会使大众社交方式“脱实向虚”、社会资本向位数领域过度聚集等方面。
在制作“位数人”前,天猫方面表示,会与出镜人员签订肖像权在内的授权协议等。在收集“位数人”对标的布偶的肖像、人声等统计数据前,天猫云言犀位数人商品相关人士接受《官媒》本报记者采访时也表示,必须跟布偶主持人签订相关的法律授权协议,包括肖像采用情景、范围等,都要详细约束。而从统计数据安全性的视角来说,天猫网络平台以及算法等,须要在国家工信部展开算法控制技术备案。此外,相关部门还要求对交互式形像采用加密控制技术,须要确保交互式形像不管投放在哪,都能做到可追踪,保障这些“位数人”的安全性。
“在交互式位数人的应用领域安全方面,监管部门和金融行业都非常关注,在版权授权、控制技术认证、内容安全、展示鉴别等方面展开规范。”华大基因交互式人网络平台总经理郜静文向《官媒》本报记者介绍说,交互式“位数人”的构筑须要得到版权人的同意,控制技术公司的聚合式控制技术须要得到相关单位认证,应用领域方和网络平台方须要对内容安全展开审核和监管,用户获得时有明显或隐形的展示交互式位数人的信息告知等。
据了解,现阶段,为规范“位数人”及相关产业,我国已经颁布了《聚合式人工智慧服务项目管理暂行办法》等一系列相关规章。2022年11月25日,国家网信办、工信部、公安部联合发布《互联网信息服务项目深度合成管理规定》(以下简称《规定》),旨在加强互联网信息服务项目深度合成管理。《规定》提到,深度合成服务项目控制技术支持者应当履行备案和变更、注销备案手续。
梁怀新表示,未来针对“位数人”在著作权、肖像权、统计数据隐私、网络平台监管等方面存在的问题,可通过“综专结合”思路,率先在金融行业内制定专门解决“位数人”具体安全隐患的行政规章,并争取早日出台“位数人”监管的国家综合法规。