人工智能快速發(fā)展催生語音合成技術(shù)的成熟,讓機器不僅能“開口說話”,甚至能夠“復(fù)刻”我們個性化的聲音。
日前,科大訊飛宣布其蟬聯(lián)了國際語音合成大賽13連冠,并且推出了“錄制10段話,即可生成專屬聲音”的黑科技產(chǎn)品。據(jù)悉,聲音復(fù)刻黑科技已落地多個應(yīng)用場景并獲得諸多業(yè)內(nèi)人士好評。
發(fā)力c端 有聲閱讀、生活應(yīng)用全覆蓋
在手機閱讀領(lǐng)域,訊飛語音合成技術(shù)已經(jīng)服務(wù)超過1萬家的閱讀類產(chǎn)品,包括QQ閱讀、書旗小說、多看閱讀、京東閱讀、咪咕閱讀、追書神器等,每天提供10億次以上的聽書量。
以訊飛閱讀APP為例,依托科大訊飛全球領(lǐng)先的智能語音合成與個性化技術(shù),可以將自己或親朋好友的聲音應(yīng)用到有聲閱讀領(lǐng)域,即能將書城內(nèi)任意文字轉(zhuǎn)化為個性化的聲音,且做到音色高保真還原,朗讀的語氣、語調(diào)、情感也堪比真人。
而在各類生活應(yīng)用APP領(lǐng)域,目前包括滴滴打車、高德導(dǎo)航、抖音、美團騎手等在內(nèi)的互聯(lián)網(wǎng)大型APP,都在使用訊飛語音合成技術(shù),每天為這些APP提供近19億次的服務(wù)。大眾所熟知的高德地圖中,甜美的志玲姐姐、耿直的黃曉明、青春洋溢的TFBOYS等明星團,用他們聲音的路況播報并不是每字每句提前錄好的,而是通過訊飛合成明星個人音庫來實現(xiàn)復(fù)刻。
賦能媒體 有聲報紙、虛擬主播齊上陣
日前舉行的第五屆世界互聯(lián)網(wǎng)大會上,科大訊飛董事長劉慶峰在“媒體變革與傳播創(chuàng)新”論壇中表示,“通過與媒體攜手合作,訊飛的技術(shù)可以在媒體采、編、播、審、存整個領(lǐng)域發(fā)揮作用,讓媒體變得更加智能化、實時化,給人才釋放出更多的時間”。
根據(jù)科大訊飛官方消息,其已與人民日報海外版、光明日報和央視等多家媒體達成合作,探索人工智能+媒體的多種可能。科大訊飛與光明日報的合作協(xié)議顯示,雙方將在近期推出第一張“智能化有聲報紙”,讓光明日報“能聽會說”。同時,訊飛在虛擬主播應(yīng)用上也帶來重大突破——今年5月,虛擬主持人“康曉輝”與記者在CCTV特別報道《直播長江》現(xiàn)場進行了對話互動;11月的進博會期間,新晉上崗的人工智能虛擬主播“進寶”更是憑借著訊飛定制語音,成為全場焦點。
在自身技術(shù)和產(chǎn)品應(yīng)用做大做強的同時,科大訊飛秉承開放合作的理念,共享產(chǎn)業(yè)資源和技術(shù)紅利,力圖通過更多的合作者,一起把聲音復(fù)刻所創(chuàng)造的極致體驗帶到大眾身邊。