数字人“黑洞”:花100万造人,花800万运营 | 甲子光年

甲子光年 2022-11-24 13:21

今年前10个月,国内数字人就拿走120亿元。

作者 | 周晓莉
编辑 | 刘景丰

数字人正在攻城略地。

在视频平台,越来越多数字人成为up主。11月15日,百度AI数字人希加加、度晓晓、林开开、叶悠悠等在快手账号发布一条入驻快手短视频,宣告百度数字人家族集体入驻快手。而B站上的直播一栏,也已经有专门的虚拟主播选项。

在营销圈,百度AI数字人“希加加”已经抢了麦当劳产品推荐官的饭碗;A-SOUL的人气虚拟偶像“嘉然”成为PICO的首场VR主播;而奇瑞汽车和花点时间则先后宣布将虚拟数字人“阿喜Angie”作为自己的品牌代言人;另一位数字人国风少女“翎_LING”更是斩获了特斯拉、宝格丽、雅诗兰黛等多个大牌的代言。

当然,说到这里也不能少了“柳夜熙”。2021年,凭借国风美妆“捉妖”人设,在抖音爆火的“柳夜熙”,至今合作的品牌包括百度Apollo、小鹏汽车、VIVO,还有娇韵诗、安踏、字节游戏等超200个品牌。

去年走红的超写实数字人“柳夜熙” 图源:柳夜熙微博

数字人,似乎在以肉眼可见的速度成为新的流量明星。而数字人背后的企业,也在今年赚足了资本的注意力。

然而,一个尴尬的现实是,爆火的数字人背后,真正能持久运营的少之又少。在抖音平台,就连数字人中的顶流“柳夜熙”目前也只更新了23期内容。而为了做好内容,柳夜熙已经配备了140余人的创意团队,单单一个作品的全部参与人员会在200人左右。

这意味着,要花费巨额的运营成本。而通常,维持一个虚拟人的运营,一年就要花费七八百万元。

这也使得,数字人这个行业如同她那盛世美颜——华美的脸庞之下,尽是辛酸。


1.120亿买来了什么?

2021年10月31日,“柳夜熙”凭借一条“捉妖”题材短视频爆红,一夜涨粉363万。这是许多人开始认识虚拟人的第一课——流量。

从此以后,各大虚拟人纷纷出现,并赚足了一时的眼球:数字员工“崔筱盼”荣获2021年万科总部最佳新人奖,虚拟人“邓丽君”在江苏卫视2022跨年演唱会亮相,湖南卫视全新综艺《你好,星期六》启用数字主持人“小漾”……

数字人爆火于2021,延续于2022。相关数据显示,截止2022年10月,国内虚拟数字人领域融资数量近百起,金额约120亿元。然而,这120亿元的投资,目前看并没有给整个行业带来一个亮眼的表现,反而热度一过,乱象丛生。

凭捉妖视频走红的“柳夜熙”,已经是当下虚拟数字人的代表。在其抖音账号,目前发布的作品共有23条。相比抖音上其他视频的日更或周更频率,“柳夜熙”这一创作速度显然无法满足人们的需求。

实际上,这已是数字人账号中更新比较频繁的了。抖音上,国风数字人翎_LING自2020年11月于抖音发布第一条视频以来,至今也只有区区12条。最靠前的几条全是与品牌合作的广告视频,最后一条视频停在了今年9月份为某橄榄油拍摄的广告,此后就陷入停滞。

在企业端,担任全球鞋类巨头斯凯奇潮流主理人的数字人孔襄,于今年4月份在抖音正式出道发布第一条视频,截至到目前也仅发布了8条视频,这其中,有3条是在4月份发布的,最后一条视频停更在今年9月,已显现后继无力的征兆。

虽然一代又一代虚拟数字人蜂拥而至,但它们中的多数并未在市场中激起太大浪花,就已消失不见。

除了更新乏力,一些数字人在呈现方式上也有很多“猫腻”。

快手 Y-Tech 技术专家施侃乐博士告诉「甲子光年」,如果数字人在短视频平台的前三秒不能吸引到用户,用户大概率会流失,所以虚拟人的形象需要做到在三秒钟之内让用户爱上。这其中可能是通过卡通式的可爱、也可能是通过仿真人的逼真,但都需要做到尽可能的优秀。

虚拟歌手初音未来的演唱会现场

有数字人行业相关人士告诉「甲子光年」,大部分报价低、且声称能够打造数字人的公司,其实是在做动画,“只不过把动画模型一点点抠出来罢了。”

还有些号称超写实的数字人,其数字人根本就不是3D模型,而是真人。在做直播的时候,为了节省成本,采取用真人直播+AI换脸的半虚拟方案——除脸部是数字化构建外,其他地方,凡是不涉及到脸部特写,只要衣服、身形比例差不多,就可以用真人来实拍。

这种走“捷径”的方式,就会导致行业缺少对虚拟人生产技术的重视,长期来看一定会影响数字人的发展。实际上,已有很多知名的数字人案例遭到吐槽,比如登上春晚的虚拟数字人“翎_LING”就被吐槽面部僵硬一眼假;北京国际电影节的元宇宙星推官虚拟数字人“梅涩甜”也被吐槽角色建模塑胶感严重,“土味十足”;首个国风虚拟男艺人“秦佑”同样被吐槽“毫无特色”。

在商业化上,数字人带货尽管噱头很大,但并没有达到预期。数字人没有真人的产品感知,天然就存在局限性。以数字人“翎_LING”为例,2021年翎_LING在小红书发布笔记,称某品牌口红“滋润不干”,随后就遭到网友质疑,“虚拟人怎么知道这唇膏涂上去干不干?”

数字人翎_LING为某品牌口红带货拍摄的广告图

不是真人的数字人在试图以“人”的角度评测产品时,由于虚拟人是出现在虚拟环境中,而商品是在现实环境中,如果没能解决好两者的互动关系,很大程度上会适得其反。

此外,为数字人提供设备解决方案的上游企业,普遍的做法是先为客户提供数字人的一次性解决方案,但条件是要让客户长期购买其软件服务,每年再交一些服务费。更像是借着数字人的火热,先用数字人做“诱饵”,实则还是推平台软件来收费。

还有一些to B公司,在为客户做完方案之后却不把数字资产给客户,而只是做一个最终图片或是视频的交付。因为担心客户在拿走数字资产后,会去找其他的供应商做内容,后续就很难赚到钱。这类公司普遍存在的难点在于,在打包产品的时候如果没能沉淀出平台能力,就只能在项目制徘徊,无法复用,难以走向平台化。

再加上元宇宙的概念之下,虽然大厂基本都在布局数字人相关业务,但是不少数字人订单实际上是外包给第三方公司。由于各家的技术标准不一样,让数字人在数字资产制作、人物渲染、人工智能训练、构建知识库,打造生产内容能力之间的各个节点比较割裂,致使成本更高,且最终生产出来的数字人,较之原始需求想要达到的效果出现折损。

据清华大学新闻与传播学院元宇宙文化实验室近期发布的《元宇宙发展研究报告3.0》显示,当前虚拟IP正面临不同程度的热度减退、用户新鲜感丧失等难题。从品牌角度,制作高品质虚拟IP成本较高,而后继运营乏力,无高水准交互能力支撑,IP价值呈现回落态势。


2.花100万“造人”,花800万运营

一位数字人行业从业者向「甲子光年」表达了一个观察:在数字人刚开始火的时候,大家会更注重数字人的皮相,所以面数(注:面数指的是3D人物的三角形个数,通常三角形的个数越多人物越逼真。)高制作精良的数字人就容易出圈。但这类数字人一旦出圈以后,后面的驱动极贵,到后期的维护成本会很高。这时候IP能不能成功,不仅仅是虚拟人的面数以及视频是否制作精良,而是很大程度上取决于它背后的世界观,它的故事性

一句话就是,漂亮的皮囊靠不住,还得是有趣的灵魂。

这也就解释了,为什么全球有超过3万个数字人,然而能被人记住的却寥寥无几。

据业内人士透露,很多刚进入这个行业的人,由于对行业了解不够,不是从现实出发,而是在赶潮流的情况下做了一款超写实的数字人,认为有100万就能够将数字人做得很好,但忽略了后期运营的预算实际上是前者的数倍。因为只要用它,后面就要持续投入,一旦预算不够,这个超写实的数字人也就做废了。

目前来看,仅仅打造一款超写实数字人的价格通常就在100万元左右,费用成本主要在形象设计、建模绑定和渲染驱动三大部分。

以抖音美妆达人“柳夜熙”为例,其制作企业创壹科技CEO梁子康曾对媒体表示,“柳夜熙”仅制作投入就在百万元级别,而第一条“柳夜熙”的短视频成本约几十万元。超写实虚拟人视频每秒的成本都在万元区间。

除此外,虚拟数字人还需要技术驱动,传统通过真人驱动的模式,需要穿动作捕捉服才能达到对虚拟人的微表情控制。而仅一套专业动捕服就需要几十万到几百万不等的投入,同时需要十几个人的团队进行维护,穿这套动捕服,再加上头盔的校准都需要一个小时。

当然,这些只是技术、装备上的价格,更大的成本在内容。

“柳夜熙”虽然没有固定的中之人(注:中之人指虚拟人背后的真人操作者)但也必须要在内容以及运营上,保证IP人设的一致性、连贯性,还要不断有新创意,这并非易事。

“柳夜熙”背后的运营公司创壹科技创始人谢多盛向「甲子光年」坦言,打造“柳夜熙”,最难的地方的确在于如何去构建它的世界观,因为世界观才能辅助数字人完成精神价值。

“柳夜熙”找到的突破口是,定位2.5次元、国风美妆、以捉妖师来和元宇宙的剧情做贴合。从“柳夜熙”目前发布的短视频来看,悬疑剧情衔接紧密,画风不输电影质感,每个短视频都能传递出它想要构建的世界观,颇具看点。

有网友在“柳夜熙”的抖音账号下留言;“感觉好像在看电影啊”,“立意做得也好”……所以,“柳夜熙”的成功,本质上还是内容能力的成功。

“柳夜熙”这类内容的一条3-5分钟的视频背后,有相当多的人力支撑。谢多盛告诉「甲子光年」,柳夜熙的整个创意团队目前大概140号人,但实际在柳夜熙的制作拍摄过程中,整体一个作品的参与人员会在200人左右。

“柳夜熙”团队曾透露,推出“柳夜熙”之前的半年多时间,研发成本、人员成本、技术成本等投入已“远超百万元”。小冰公司首席运营官、人工智能创造力实验室负责人徐元春也曾表示,目前运用3D建模等类似技术制作的超写实虚拟人,仅单个形象部分,3D模型成本就在30万元至45万元左右,运营一年可能要花掉五六百万元。

这里面,一段3分钟左右的超高清数字人动画制作费用动辄就要几十万元,从策划到筹备需要1~2个月的时间,总体成本接近一个S级的网剧。再加上在数字人本身费用、直播费用、以及元宇宙空间打造上的投入,没几百万根本下不来。

数字人后续的运营成本才是看不见底的“黑洞” 图源:拍信

单以数字人直播来说,数字人每次直播运行的一排设备、几十个光追摄像头、所有的光学动作捕捉、场景灯光修正、视觉动作捕捉,每一个小的技术点的修正价格,都在万元往上。那些更逼真的数字人,会对面部表情精度以及头发纹理有更高的要求,对于它的驱动就会更难,成本也极高。

这也就是为何有些超写实的数字人做到很逼真,却只能静态呈现。即便是动态,也是在2D或者是一些简单模型上面去做。 在这个行业,数字人的成本往往先通过面数来评估工作量,再制定相应成本,也由于行业的非标性,导致没有具体价格,价格弹性就导致价格不透明。

对于数字人的运营成本,某从业者估算了一个更大的数字,“假如建模花100万,另外至少再放800万准备去用它”。而所谓的“用它”也就是让其动起来,比如数字人的语音表达、 面部表情、 动作生成等,都需要AI驱动,这是投入的大头。

一个反面的例子是,某从业者曾接触过一家银行,对方希望打造一款数字人。最早其先与某元宇宙数字整合营销服务商进行合作,合作项目分别是数字人本身费用、短视频费用、直播费用以及元宇宙空间。

其中还用数字人搞了一场脱口秀直播,这就涉及到场地、真人演员、软硬件的动捕设备、演播室系统等等。除开这些本身成本之外,提供服务方还需要从中赚到利润。结果就是,合作了仅半年,就已经花费了三四百万。

钱没少花,技术上的交付成果却很粗糙。据了解,这家银行由于元宇宙空间还未上线,只能继续和这家厂商合作,但其余的项目都已经主动寻找其他厂商去提供服务了。


3.我们需要多少数字人?

在今年7月21日的2022百度世界大会现场上,百度集团资深副总裁、百度移动生态事业群组(MEG)总经理何俊杰做了一个出人意料的判断,“‘人均一个数字人’的时代已经到来”。

可从目前数字人的发展来看,无论是在变现还是新玩法上都陷入了瓶颈。在市场认知上,顶流无非就那么几个,用户端对于数字人的接受程度并没有想象中高,在影响力上面也没有一个更大的突破。

这不禁让人发问,在产业技术尚还没有得到大升级的条件下,市场真的需要这么多数字人吗?

当前数字人经常被诟病的一点在于,是只有一个数字“皮囊”却没有“灵魂”,无法做到与人更自然的交互,更不具备“情感连接”。

施侃乐博士表示,无论是数字人背后的主体(即中之人或人工智能)的主观能动性、感染力等综合的吸引力,还是通过“皮囊”表现出的拟真程度,(即面部的微表情、一颦一笑),这两点都是虚拟人技术的深水区。尤其在主体的主观能动性上,目前人工智能还很难在模拟人类表演和情绪上完全通过图灵测试。

此外,从多个维度去看数字人,也远没到真正的产业爆发点。

从市场层面来看,当前的数字人更多是应用在to B、to G领域中,还处在一个非常早期的市场教育阶段,在to B尚未形成规模化的时候,对于to C就更需要前者先去普及。所以当前的to C领域还需要较长时间的培育,目前的商业化都还在探索之中,主要以品牌掏钱为主。

AI技术上,当数字人有了皮相之后,它后面的驱动以及对话,如果没有一个非常好的AI大脑,也只能局限在中之人里。目前对于数字人的制作难点在实时交互上,要做到实时交互,不仅需要有Unity这样的实时3D引擎来完成高画质渲染,同时也需要语音、智能系统、硬件设备、网络甚至算力的系统配合,需要各个学科协同发展。

从产销情况上,市场早期阶段,数字人缺乏大规模的商用场景,更多用在B端。数字人普遍集中在服务型数字人,如虚拟客服、银行虚拟业务员、景区导览数字人。而形象IP级的数字人,多是用于品牌传播,但由于后期内容运营成本昂贵,各家都在探索阶段。

从承载数字人的“场域”上,由于数字人涉及云端渲染、动捕、NLP等技术,对技术和资金投入要求高,从前期的设备投入到后期的人力时间,都在一定程度上阻碍了数字人的大规模商用。同时,要考虑将数字人运用在什么样的场才能够更好地去承载它的算力,比如影视级或者是CG游戏级的,设备还很难跟上,现在的场更依赖于大厂推动。

图源:Getty Images

虽然借着元宇宙叙事,很大程度上能加快数字人的发展进程,但也只有在技术上将成本降下来,才能更好地去规模化。

其次,还需要实现元宇宙“破壁”般的万物融合,让数字人在元宇宙里面可以真正去提供服务,陪伴用户进行其他场合和平台的社交、游戏、办公等活动,而不是单点式地提供某一种类型的价值。

宙予科技创始人兼CEO朱峰认为,数字人要结合以3D互联网为定义的元宇宙主体来谈,3D互联网里面的人货场应该是交互着对用户提供服务。不能缺少对用户具体使用场景的深刻理解,否则单独只以数字人作为产品提供服务,只能是盲人摸象。

李未可科技品牌负责人李恬认为,数字人要想真正迎来产业上的爆发,应该是消费级的,而不只是一个观赏性的东西。每个人拥有一个自己的数字孪生,大家除了在生活中交互之外,还可以在一个虚拟的平行空间里面也用自己的数字形象去交互。在一个全新的设备上去社交,要等到AR和VR真正普及之后,但现在并没有到这个时间。

那么,从当前来看,数字人的爆发最有可能先基于AI技术的发展,比如UE5和MetaHuman的出现,极大降低了实时渲染以及创建高精度数字人的门槛。让数字人在一些交互式的营销场景以及在数字员工的场景下,去逐渐取代中之人的方案,现在已经有很多的行业应用。

另外,在2D互联网向3D互联网的变迁过程中,需要虚拟世界跟现实世界之间高度融合,也为数字人带来了一个大的天时,在事关产品体验、事关市场供给以及商业模式下,数字人要想持续的热,这是一场合力。

今年称得上是一个数字人的爆发节点,无论大厂或小厂,都推出了自己的数字人,但当前数字人大多处于L1~L3阶段,即依赖算法驱动肢体、姿态、口型、表情等,数字人可执行简单的决策和操作。未来数字人将实现L4~L5水平,由数字人自主进行决策、执行任务,完全实现智能化交互。

而现在,数字人背后的企业要做的不是拉开一场众多参与者制造的数字人“竞赛”,更应该思考如何赋予优质的内容和不断更新的技术手段,让数字人真正能够发挥价值释放吸引力。


END.


推荐阅读