在今年的江蘇衛(wèi)視跨年晚會(huì)上,周深與數(shù)字人“鄧麗君”跨時(shí)空合唱《大魚》刷屏,展現(xiàn)出數(shù)字人的眾多可能性。日前,在以數(shù)字人為主題的百度科技沙龍“AI呀,我去!”
上,百度智能云AI人機(jī)交互實(shí)驗(yàn)室負(fù)責(zé)人李士巖表示:“我們近兩年的奮斗目標(biāo)是,通過百度智能云曦靈平臺(tái)的開放,讓每個(gè)人實(shí)現(xiàn)數(shù)字人自由。”
目前,數(shù)字人經(jīng)歷了以“紙片人”為代表的1.0階段、以Vtuber主播為代表的2.0時(shí)代,已進(jìn)化至3.0階段,具備模型高精、人工智能驅(qū)動(dòng)特點(diǎn)的數(shù)字人3.0成為行業(yè)主流。據(jù)李士巖介紹,
“百度智能云曦靈數(shù)字人平臺(tái)”具有全場(chǎng)景、一站式、平臺(tái)化的特點(diǎn),能滿足從最初數(shù)字人形象定制、人設(shè)管理再到業(yè)務(wù)編排、內(nèi)容創(chuàng)作,最后到多種驅(qū)動(dòng)模式下與用戶互動(dòng)的全部需求,
這也意味著在一個(gè)平臺(tái)上即可實(shí)現(xiàn)數(shù)字人的全鏈路調(diào)優(yōu),從而使效果達(dá)到最好。
李士巖以數(shù)字人生成環(huán)節(jié)為例,演示了百度智能云曦靈平臺(tái)的功能。用戶在百度智能云曦靈平臺(tái)上傳一張照片,就能快速生成一個(gè)可被AI驅(qū)動(dòng)的2D數(shù)字人像,
以前需要兩三個(gè)月時(shí)間做出來的3D數(shù)字人,現(xiàn)在可以壓縮到小時(shí)級(jí),同時(shí)還可以通過一句話語音描述或簡(jiǎn)單捏臉等多種形式快速生成數(shù)字人。數(shù)字人個(gè)性化功能開發(fā)也較之前更加完善,
以百度剛剛發(fā)布的3D寫實(shí)口語數(shù)字人為例,
其口型合成準(zhǔn)確率高達(dá)98.5%。
在技術(shù)催生的數(shù)字人3.0階段,虛擬人可與不同行業(yè)產(chǎn)生更緊密的融合。基于市場(chǎng)使用場(chǎng)景,數(shù)字人可以分為演藝型數(shù)字人、服務(wù)型數(shù)字人兩類。演藝型數(shù)字人包括虛擬主播、
虛擬偶像以及數(shù)字孿生的虛擬品牌代言人。目前百度已經(jīng)打造了AI手語主播、央視網(wǎng)虛擬主持人小C、航天局火星車數(shù)字人祝融號(hào)、百度虛擬代言人希加加、百度APP代言人龔俊數(shù)字人。
服務(wù)型數(shù)字人包括數(shù)字員工、虛擬員工、虛擬業(yè)務(wù)員等,可以幫助金融、運(yùn)營(yíng)商、政府、零售等行業(yè)提供基于數(shù)字人的新一代客戶服務(wù)能力,解決排隊(duì)長(zhǎng)、回應(yīng)慢、人力成本高等問題。
目前,百度已經(jīng)和浦發(fā)銀行、光大銀行、中國聯(lián)通合作,推出了一對(duì)一服務(wù)型數(shù)字人。
李士巖表示,數(shù)字人產(chǎn)業(yè)有三大核心推動(dòng)力,一是用戶需求與技術(shù)升級(jí),二是政策支持與資本涌入,三是計(jì)算平臺(tái)的迭代。
百度在數(shù)字人技術(shù)上的突破也得益于其在行業(yè)內(nèi)的持續(xù)布局。早在2019年,百度就開始了“虛擬數(shù)字人戰(zhàn)略”。基于多年的AI技術(shù)沉淀,AI能力已成為百度智能云曦靈平臺(tái)的核心能力,
現(xiàn)在百度也在把這種能力開放給外界。