虛擬人“華智冰”彈唱秘密揭開(kāi) 面部表情、歌聲均由智能框架生成_互聯(lián)網(wǎng)
導(dǎo)語(yǔ):9月30日消息,近日,虛擬人“華智冰”彈唱視頻走紅網(wǎng)絡(luò)。對(duì)此,該內(nèi)容制作方小冰公司發(fā)表說(shuō)明,介紹了“華智冰”彈唱內(nèi)容制作背景,涉及相關(guān)技術(shù)與此前的不同之處,以及對(duì)虛擬人內(nèi)容技術(shù)發(fā)展的觀點(diǎn)和態(tài)度。
9月30日消息,近日,虛擬人“華智冰”彈唱視頻走紅網(wǎng)絡(luò)。對(duì)此,該內(nèi)容制作方小冰公司發(fā)表說(shuō)明,介紹了“華智冰”彈唱內(nèi)容制作背景,涉及相關(guān)技術(shù)與此前的不同之處,以及對(duì)虛擬人內(nèi)容技術(shù)發(fā)展的觀點(diǎn)和態(tài)度。
小冰公司表示,虛擬人將成為未來(lái)視頻內(nèi)容的主要提供者之一,而安全、可控、無(wú)隱私風(fēng)險(xiǎn)和侵權(quán)風(fēng)險(xiǎn)是其前提。因此,小冰一直在這一趨勢(shì)方向上進(jìn)行探索,并從不同方面對(duì)這一領(lǐng)域做拓展研究。小冰與清華大學(xué)計(jì)算機(jī)系合作華智冰項(xiàng)目,正是在預(yù)訓(xùn)練模型方面進(jìn)行合作,希望能夠以智能模型作為核心,試驗(yàn)預(yù)訓(xùn)練模型能夠帶來(lái)哪些技術(shù)與應(yīng)用方面的驚喜。
這次傳播的視頻,來(lái)自小冰發(fā)布會(huì)的進(jìn)展匯報(bào)展示,為華智冰能力續(xù)寫(xiě)了一些新的進(jìn)展,demo小冰框架下最新的面部生成和3D視頻封裝技術(shù)成果。具體來(lái)說(shuō):視頻中人物的面部特征,包括人臉、表情、口型等,全部由人工智能小冰框架X Avatar生成并進(jìn)行融合;視頻中的人物肢體、動(dòng)作,包括手持吉他彈唱,來(lái)源于小冰團(tuán)隊(duì)成員魚(yú)子醬醬錄制的原始視頻模版。視頻中的歌聲,由人工智能小冰框架X Studio生成。
隨著視覺(jué)化交互內(nèi)容(如短視頻)的不斷深化,對(duì)于人物出鏡交互的需求越來(lái)越多。但是,由于人類的行為存在各種不穩(wěn)定性,常常給商業(yè)機(jī)構(gòu)和品牌方帶去很大的風(fēng)險(xiǎn)與不確定性。對(duì)此,越來(lái)越多的商業(yè)機(jī)構(gòu)、內(nèi)容制作方與品牌方,呼喚一種安全可控的虛擬人類內(nèi)容(含商業(yè)代言)產(chǎn)品化技術(shù)。
已往付諸產(chǎn)品化的技術(shù)存在諸多問(wèn)題:它無(wú)法像真實(shí)人類一樣,生成足夠豐富的面部features,且無(wú)法打通生成與替換的端到端流程。因此,只能實(shí)現(xiàn)真實(shí)人類面部間的替換,精度質(zhì)量不足。更嚴(yán)重的問(wèn)題是,以往的方法無(wú)法從根源上避免隱私侵權(quán)風(fēng)險(xiǎn)。
新的產(chǎn)品化技術(shù)實(shí)現(xiàn)了完全虛擬生成不存在的面部,且具有足夠豐富的features,從而能夠?qū)崿F(xiàn)精度更高的視覺(jué)化交互內(nèi)容。尤其是,由于從根源上避免了使用任何真實(shí)人類面部的可能性,有效阻斷以往技術(shù)無(wú)法避免的隱私侵權(quán)問(wèn)題。從隱私角度,是一個(gè)重要的進(jìn)步。
小冰公司還透露,華智冰除了3D面部生成、歌聲合成的優(yōu)化外,還有其他很多更底層的、涉及數(shù)字人“大腦”的新技術(shù)應(yīng)用,例如在有機(jī)融合了知識(shí)圖譜和預(yù)訓(xùn)練模型后,可以讓數(shù)字人有常識(shí)和推理能力。華智冰正在不斷“成長(zhǎng)”中,還會(huì)有更多最新技術(shù)的應(yīng)用,敬請(qǐng)期待。