数字人 ,则可能是开启
元宇宙时代的“任督二脉”。
从最基础的文本交互,到语音互动,再到融合了视觉、语音及语义技术的多模态数字人交互,我们对虚拟世界中的交流需求越来越高,数字人的概念随之逐渐火热。
那么,数字人技术的实现有哪些难点呢?
作为“数字新物种”,数字人的真实感来源于形象的表现力。相比文字、语音交互产品,数字人加入了视觉元素,这就需要一个更加逼真、更具表现力的形象来满足用户的视觉需求,让用户能够有充足的交互沉浸感。这样的表现力需要做到数字人的声音、形象、嘴型、表情的一致性。
此外,相关的运算和处理需要在与用户对话的过程中实时生成,对于AI算法和
计算机 的性能也要求较高。当传递的信息从简单的文字信息,变成复杂的音视频信息,只有同时具备
自然 语言理解(NLP)、语音识别和生成,视觉合成这样的整体AI能力,才能给用户一个自然逼真的体验。
举个例子,“捏脸”是每个数字人诞生的过程中最为重要的环节,也是长期以来数字人的诞生过程中最耗时的部分。关于这道题的解法,Epic Games提供了一套解法。通过工具实现从嘴唇伸缩到眼睛距离、皮肤颜色、牙齿形状、皱纹形态、毛细血管和胡须的自定性,创作者可以自定义所有内容,自由地“捏”出想要的人脸,例如抬起或放下眉毛,改变颌骨的形状和耳朵的高度,甚至睫毛的长度也是可以改变的。并且,随着光影变化,光线在不同肤色、不同年龄、不同性别的角色上均会呈现出不同的效果。
而数字人如何表现得像个“人类”,提供更为合适的交互手段,也是亟待解决的问题。尽管现在
人工智能 已经越来越普遍地被运用在
互联网 上,包括
人工智能 客服、自动化流程、自动化工具,甚至是像AlphaGo这样的
人工智能玩家。可以说,人工智能技术的发展,已经可以基本满足用户的需求。但人工智能长期以来被用户所诟病的就在于:始终呈现的是冷冰冰的文字形象,这样偏二维世界的体验并没有与网络技术和人工智能的发展相匹配,这种体验和我们现在看《电子世界争霸战》是一样的。
因此实现数字人的人格化、让数字人的行为动作“像个人类”至关重要。
关于这点,行业内也有众多失败案例。2018年,瑞典一家
银行 就曾经“开除”了一名“表现不佳”的数字人。最直接的理由就是Amelia的业绩表现没能达到预期。尽管Amelia被认为是世界上最好的AI系统之一,并被广泛地应用于
医疗 和
金融行业 ,但其中欠缺的人格化,也是众多用户摒弃数字人的原因。
02
8月,
芯片 巨头NVIDIA的真假“皮衣教主事件”,将数字人推向热度至高点。部分媒体当时称“NVIDIA欺骗了全世界”,
英伟达 CEO黄仁勋某次两个小时线上演讲,全程数字人出面,从家居背景到人物、服装等均是虚拟AI能力展示。尽管黄仁勋的“数字人”只出现了14秒,其他部分均为真人演讲,但仍向外界传递了数字人技术未来具有无限的可能性。
其实,数字人距离生活已不遥远,虚拟主播、虚拟教师、虚拟明星、虚拟客服……
数字人的形象正在愈发立体和全面地展示在我们的生活中,让以商业和技术为导向的数字经济多了些温情和烟火气。
据量子位智库发布的《虚拟数字人深度产业分析报告》显示,而这个市场也并不单一,将围绕着包括
游戏/
影视、服务平台、媒体平台、医学等更丰富的领域展开。
用户对于数字体验“真实化”的需求永不止步,在数字文化产业领域,数字人最基本的应用就在于对游戏、影视作品沉浸感的提升。Epic Game的虚幻引擎被广泛应用,在虚幻引擎的官网,Epic Games是这样定义数字人技术对于游戏行业的影响的:A world of possibilities。通过技术,Epic Games实现了游戏人物的“高保真化”。随着近几年人工智能技术的不断演进,游戏行业中涌现的一些新技术让数字人的制作过程得到了有效地简化,使得数字人成功地进入了公众的视野之中。
数字人甚至已经被运用至众多非娱乐产业,展现出了其强大的“功能性”价值。
虚拟互动技术的扩展,让数字人已经可以发挥一些常人无法企及的作用,
例如医学、矿产、航空
航天等领域。此外,通过定制主持人形象,也可以实现内容快速、自动化的生产,优化观看体验。例如,在神州十二号成功发射三位航天员顺利抵达空间站后不久,由新华社和腾讯联合打造、专门面向航天主题和场景研发的数字航天员、国内首个进入多场景运营的数字人“小诤”亮相,带用户漫游三大空间站。截至目前“小诤”已经完成了多次太空报道,涵盖了“天问一号”火星探测任务和中国空间站。这种效率从侧面说明了当前数字人技术的成熟度已经到达了一定的水平。
除了功能性的应用以外,数字人同样具有“人文关怀”的功用。通过基于真人形象,打造出具有高度关怀感和真实感的多模态AI助手型虚拟数字人。这种虚拟数字人在特定关怀类场景乃至通用化交互中,可以提供顾问、关怀、陪伴,以及事务处理等服务。国外厂商已有的落地场景包括个性化理财顾问、心理咨询顾问和购物助理等。
毫无疑问,元宇宙的“沉浸感”是体验的至高标准。想要创造这种“沉浸感”,需要“高保真”的游戏环境。
因此,数字人技术+突破性的硬件是进入元宇宙时代的先决条件,数字人技术可以赋能组成元宇宙的各种元素,突破性的硬件能够将人的意识从外部世界和虚拟世界进行串联,二者结合才可搭建出一个与现实世界别无二致的虚拟世界。
截至目前,数字人的高保真技术日渐成熟。从数字人的外形构造来看,不论是Epic Game还是NExT Studios均已经在数字人面部的细节还原方面取得众多进展,且达到了实用的水平。随着拍照式相机阵列扫描重建得到飞速发展,目前可实现毫秒级高速拍照扫描,成为当前人物建模主流方式,并成功应用于游戏、电影、传媒等行业。同时,通过实时动作捕捉系统将人物动作还原,也使得各类型互动体验成为了可能。
数字人的“高保真”,也体现在整体环境和交互体验的深度还原:运用虚幻引擎、实时光线追踪技术等等,创作出更为真实、沉浸感更强的模拟效果和视觉体验。
作为新生事物,数字人虽然进入实用阶段,但仍尚属“稚嫩”。关于数字人未来发展的方向,也需要更多地思考。谁也无法预测数字人和元宇宙最后的发展结果。我们目前对于元宇宙的众多想象,也只是基于影视作品的天马行空。
元宇宙的实现,需要人工智能来进行源源不断的内容供给,利用AI推动各行各业完成现实世界和虚拟世界的链接;也需要VR/AR技术的持续进步,不断加强用户的沉浸感和体验感;需要心理学知识,让元宇宙超脱出“数字组成的冰冷世界”的概念,数字也同样具有温度;甚至,元宇宙的实现也需要
区块链,保障
新世界 中的身份、资产、社会关系,以建立元宇宙的公信力。