語(yǔ)音合成技術(shù)再次創(chuàng)新突破 科大訊飛虛擬主播酷似真人
時(shí)間:2019-06-11 10:23 來(lái)源:搜狐 責(zé)任編輯:莫小煙
原標(biāo)題:語(yǔ)音合成技術(shù)再次創(chuàng)新突破,科大訊飛虛擬主播酷似真人
要說(shuō)5月21日在上海舉辦的科大訊飛2019新品發(fā)布會(huì)最大的亮點(diǎn)非虛擬主播莫屬了,科大訊飛虛擬主播利用訊飛的語(yǔ)音合成、語(yǔ)義理解、圖像處理、機(jī)器翻譯等人工智能技術(shù),實(shí)現(xiàn)多語(yǔ)言的新聞播報(bào),并支持文本到視頻的自動(dòng)輸出,是全球 人工智能多語(yǔ)種虛擬主播。
就在5月21日,科大訊飛2019新品發(fā)布會(huì)上,使用了全球 多語(yǔ)種A.I.虛擬主播,能實(shí)現(xiàn)中、英、日、韓、俄、西、法7國(guó)語(yǔ)言,以及維吾爾語(yǔ)、藏語(yǔ)2種民族語(yǔ)言同時(shí)進(jìn)行直播,在發(fā)布會(huì)現(xiàn)場(chǎng)引起了關(guān)注。就人工智能語(yǔ)音技術(shù)技術(shù)革新而言,科大訊飛無(wú)疑已經(jīng)走在了行業(yè)前列。
在此之前,今年全國(guó)兩會(huì)上科大訊飛就推出了人工智能虛擬主播小晴,這次以全身形象亮相新品發(fā)布會(huì),作為大會(huì)的串場(chǎng)主持人。在發(fā)布會(huì)上,科大訊飛的虛擬主播不止主持得惟妙惟肖,還表演了變聲技術(shù),其模擬了多個(gè)男女聲音,惟妙惟肖的聲音讓人以為這幾位嘉賓真的來(lái)到了現(xiàn)場(chǎng)。相信之后科大訊飛能夠讓變聲技術(shù)運(yùn)用在娛樂(lè)領(lǐng)域中,實(shí)現(xiàn)聲音的cosplay。
目前在網(wǎng)絡(luò)上AI換臉技術(shù)獲得了許多網(wǎng)友的熱捧,此次科大訊飛的語(yǔ)音cos秀給未來(lái)直播以及視頻等娛樂(lè)領(lǐng)域帶來(lái)了更多的可能。而且科大訊飛的虛擬主播不僅擁有流暢動(dòng)聽(tīng)的話(huà)語(yǔ)還有自然的表情動(dòng)作,這讓人感受到極強(qiáng)的娛樂(lè)性。或許在未來(lái)的影視劇中,會(huì)大面積出現(xiàn)科大訊飛的聲音cos。畢竟這不止節(jié)約了影視劇制作成本,還加快了影視劇制作的進(jìn)程。
當(dāng)然,科大訊飛的虛擬主播之所以能夠如此惟妙惟肖,是因?yàn)榭拼笥嶏w在多個(gè)技術(shù)維度都有創(chuàng)新。就拿虛擬主播來(lái)說(shuō),其就將科大訊飛語(yǔ)音合成、機(jī)器翻譯、圖像處理等人工智能技術(shù)進(jìn)行了結(jié)合。目前整個(gè)行業(yè)中,能夠?qū)⑦@么多科技前沿技術(shù)融合得這樣好的企業(yè),屈指可數(shù)。
據(jù)了解本次發(fā)布會(huì)上,客串主持人的虛擬主播,其表情和聲音的模擬也是可以調(diào)節(jié)的。先輸入播報(bào)的內(nèi)容,通過(guò)科大訊飛的語(yǔ)音合成技術(shù)進(jìn)行語(yǔ)音合成,然后利用多模態(tài)合成模型基于語(yǔ)音驅(qū)動(dòng)表情序列生成對(duì)應(yīng)的表情序列。這樣就能夠達(dá)到聲像一致,給人展現(xiàn)出如同主播在主持的感受。
可以預(yù)見(jiàn)的是科大訊飛將多種AI技術(shù)廣泛運(yùn)用在不同場(chǎng)景中,為人工智能時(shí)代的早日到來(lái)注入了活力,而虛擬主播不僅是研發(fā)了具有娛樂(lè)性的虛擬主播以及變聲cos,還給整個(gè)娛樂(lè)行業(yè)帶來(lái)了更多的可能性。
投稿郵箱:chuanbeiol@163.com 詳情請(qǐng)?jiān)L問(wèn)川北在線(xiàn):http://m.sanmuled.cn/