最新精品久久,欧美亚洲福利,表妹免费在线观看,久久国产二区,国产三级电影网站,日本特黄久久,成人a在线视频免费观看

直擊|阿里公布新語音合成技術(shù) 錄音10分鐘定制AI語音

來源:智匯工業(yè)

點(diǎn)擊:981

A+ A-

所屬頻道:新聞中心

關(guān)鍵詞:AI聲音 智能語音

    7月10日下午消息,阿里巴巴發(fā)布新一代語音合成技術(shù)KAN-TTS,稱可大幅提高合成語音與真人發(fā)聲的相似度,并將語音合成定制成本降低10倍以上。該技術(shù)由達(dá)摩院機(jī)器智能實(shí)驗(yàn)室自主研發(fā)。


      阿里方面稱,當(dāng)前業(yè)界商用系統(tǒng)的合成語音與原始音頻錄音的接近程度通常在85%到90%之間,而基于KAN-TTS技術(shù)的合成語音可將該數(shù)據(jù)提高到97%以上。


      據(jù)悉,KAN-TTS由達(dá)摩院機(jī)器智能實(shí)驗(yàn)室自主研發(fā),深度融合了目前主流的端到端TTS技術(shù)和傳統(tǒng)TTS技術(shù),從多個方面改進(jìn)了語音合成。傳統(tǒng)語音合成定制需要10小時以上的數(shù)據(jù)錄制和標(biāo)注,對錄音人和錄音環(huán)境要求很高。從啟動定制到最終交付,項(xiàng)目周期長成本高。


      阿里利用Multi-Speaker Model與Speaker-aware Advanced Transfer Learning相結(jié)合的方法,將語音合成定制成本降低10倍以上,周期壓縮3倍以上。也就是說,用1小時有效錄音數(shù)據(jù)和不到兩個月制作周期,就能完成一次標(biāo)準(zhǔn)TTS定制。


      此外,這使得普通用戶定制“AI聲音”的門檻更低。只需手機(jī)錄音十分鐘,就能獲得與錄制聲音高度相似的合成語音。


    (審核編輯: 劉傳龍)

    聲明:除特別說明之外,新聞內(nèi)容及圖片均來自網(wǎng)絡(luò)及各大主流媒體。版權(quán)歸原作者所有。如認(rèn)為內(nèi)容侵權(quán),請聯(lián)系我們刪除。