当前位置:商业频道首页 > 头条推荐 > 正文

“AI复活”,安慰还是生意?

“起死回生”这件事,过去只在科幻电影里见过,但今年,被“复活”的案例越来越多。

2月底,知名音乐人包晓柏用AI“复活”女儿,女儿在妈妈生日时还为她唱了一首生日歌;3月初,商汤年会上,刚去世不久的商汤科技创始人汤晓鸥以数字人的形式被“复活”,还来了一场“汤式风格”的演讲;近日,还有有网友用AI技术“复活”李玟、乔任梁等已逝明星,备受争议。

和逝去的亲人“再见面”,这门此前隐秘小众的生意,开始频繁地出现在大众眼前。但因为用到的技术不同,价格不同,效果也不同。

“AI复活”,安慰还是生意?

花10元,能让去世亲人的照片“眨眼”,背后是简单的图像处理技术;花千元,能和没来及道别就离开的亲人视频通话,用到的是AI换脸变声技术;花万元,则可以和电子屏幕里亲人的克隆数字人聊天,数字人能说会动有表情,真实感更强。

“AI复活”是一门有强烈需求的生意,酝酿着亿级市场,盯上这块蛋糕的商家却鱼龙混杂。有的下载软件就能制作“会说话的照片”进行售卖;有的本身是数字人服务商,在向B端售卖直播、会展、主持人等数字人之外,开发面向C端的数字人定制APP;还有一批商家,看准了用户复活亲人、克隆明星的需求,用自研+接入第三方技术接口的方式,为用户提供定制化服务。

“AI复活”或许在将来会成为一个像拍照一样常见的服务,但其中也存在数据隐私、法律伦理等问题。有业内人士表示,AI换脸变声技术的成熟,还会让一些人借着用户对亲人的想念和信任实施诈骗,“回忆虽好,谨防被‘割’”,他提醒道。

“复活”亲人,需要多少钱?

目前市面上的“AI复活”产品,根据成本高低、技术难易,可以分为三个等级,也对应着用户在AI“复活”某人之后,与亲人“再次相见”的三种方式。

其中最低一档是照片驱动,俗称talking photo(能动的照片),前几年就有类似的APP火过一阵。

利用深度学习、图像处理等技术,就能让照片里人物的嘴巴和眼睛动起来;如果让照片里的人开口说话或唱歌,则要用到对口型(唇语匹配)和语音生成。“这些技术都已经成熟且开源,量产之后,单次成本可以压缩到10元以内。”有10年AI创业经验的极链科技创始人&总裁董慧智介绍。

第二档是表情捕捉驱动的伪直播,给真人模特换上逝者的形象和声音,进行语音电话或视频电话等互动,或生成祝福短视频等。

这里面用到了语音克隆、AI换脸、动捕(表情捕捉)、深度伪造(deepfake)等技术来变人变声。董慧智称,这是一种特别讨巧的方式,技术不新鲜,部分AI诈骗用到的是类似的技术。动捕器材及人力成本稍高一些,需要数千元。

这类“AI复活”的视频片段在短视频平台播放量很高,一般是小辈为家里的老人下订单,找人用逝者的脸和声音与老人通话,对老人谎称逝者在外工作,将“善意的谎言”继续,老人一般也看不出异样,只是频频抹泪。

“AI复活”,安慰还是生意?

孙先生用AI换脸“复活”父亲

第三档是近期比较火的用数字人技术“复活”亲人,因为交付的产品不一样,成本也有所不同。

一般来说,通过收集人物生前的照片、声音等数据来克隆数字人的形象和声音,然后底层搭载大语言模型模拟逝者的思想,可与之进行实时的文字或语音交流。

51数字人有这项业务,创始人陈鸿告诉「定焦」,一般产品交付的是一个带有数字人的屏幕,大屏有电视那么大,小屏可以是iPad那么大。用户登录账号之后,就能看到逝去亲人的数字人形象,用户可以通过语音或文字与数字人互动,产品还可以提供语音电话叫醒服务。

“定制类的‘复活亲人’业务,一般要5万元以上。”陈鸿称,因为客户都是长期付费,后续还会不断在细节上调优,也有一些客户是一个家族凑钱一起做,要求更高。

“AI复活”对于数据质量的要求非常高,被克隆者生前的照片、视频或语音样本越多、越清晰,数字人的相似度就越高。再输入一些个人特征数据,比兴趣爱好,才能模拟其性格。“素材不够全,成本还会再增加。”陈鸿表示。

因此,精度越高、数据越定制化,效果也就越接近真人,价格也更贵。所谓的精度,主要体现在以下几个方面:人物口型准确度、分辨率清晰度、动作复杂程度、服饰发型和表情丰富度、语音(音色、语气)相似度、是否有电音、是否有抑扬顿挫(多情感)、是否带交互、交互是否更贴合本人性格等。

放到数字人领域,需要完美克隆某个人的技术难度可谓“上不封顶”。商汤科技“复活”的创始人汤晓鸥,就是一个案例。

商汤科技数字空间事业群数字文娱事业部总经理栾青告诉「定焦」,为了还原汤老师的音容笑貌,用到了不同技术。整个制作过程中,商汤运用了自研的TTS语音生成大模型,截取了汤老师四、五段不同说话风格的声音作为prompt(提示),总声音素材不过十几秒,还原了汤老师的东北口音、音色、常用的语气词和语调以及冷幽默的风格。

此外,商汤如影数字人技术团队采用了汤老师之前清晰有效的视频,用商汤自研的视频生成技术进行动作生成和场景过渡,还原走动、喝水等动作,以及微笑的表情。

受限于素材不多,以及算力、成本的考量,目前很多数字人的视频和产品看起来还是很“假”。“这些都不算是完整地‘复活’数字人,技术和服务的最高交付上限,也无法满足人们的最低需求下限”,陈鸿称。

形象不够像,就得用情绪价值来补,在数字人的设计上加入一些交互细节。他举例,比如一个客户的爷爷最喜欢老四,聊天时爷爷突然会说下个月是老四的生日了,家人要多聚、兄弟要和睦,客户就会一下子被打动。

总得来说,前两档用到的都是相对简单的图像处理、换脸和声音克隆技术,能看到人脸、模仿声音,但因为成本低,效果粗糙,市面上看到的还原度比较高且能动起来、能对话的都属于第三档数字人,越像越贵。

谁在靠克隆人赚钱?

从过往“复活亲人”的案例可以看到,大部分不像真人且让人出戏甚至尴尬。而随着生成式AI技术的发展,栾青观察到,“AI复活”在技术上的可行性和真实度上都变得更高,能让人投入、想哭,使得这类需求被进一步激发出来。

由此,一条产业链应运而生。在这条产业链上,一部分是跟风商家,一部分是数字人服务商,一部分是AI从业者,还有一部分是专门做定制AI复活(复活或克隆亲人、明星、企业家等)的玩家。

电商平台上,有不少店铺提供“AI复活”服务,让照片说话的标价多为10元、50元。短视频平台上,也有不少人以“AI造梦”“AI疗愈”的名义提供类似服务。“收费便宜、效果粗糙,但这是一个长期存在的长尾市场。”董慧智称。

“AI复活”,安慰还是生意?

淘宝上售卖的“让照片说话”服务

热点推送

本周关注

MORE