微軟Azure AI語音服務(wù)推出虛擬人形象支持文本轉(zhuǎn)視頻

2024-08-23

220

IT之家 8 月 23 日消息，微軟 Azure AI 語音服務(wù)允許開發(fā)者構(gòu)建多語言生成式 AI 語音應(yīng)用，Azure AI 語音服務(wù)最新推出了文本到語音虛擬人功能，可以將簡單的文本轉(zhuǎn)換為人類自然說話視頻。

今天，微軟宣布全面推出 Text to Speech Avatar 功能。這項(xiàng)新功能使開發(fā)者能夠?yàn)槠溆脩魟?chuàng)建個(gè)性化虛擬人。該服務(wù)的輸出視頻分辨率為 1920 x 1080，每秒 25 幀。

Text to Speech Avatar 具有以下功能：

將文本轉(zhuǎn)換為由 Azure AI 文本轉(zhuǎn)語音提供支持的人類說話視頻，該視頻具有自然的聲音。

提供不同的人物預(yù)設(shè)形象。

形象的聲音由 Azure AI 文本轉(zhuǎn)語音生成。

使用批量合成 API 異步或?qū)崟r(shí)合成文本到語音人像視頻。

在 Speech Studio 中提供內(nèi)容創(chuàng)建工具，無需編碼即可創(chuàng)建視頻內(nèi)容。

通過 Speech Studio 中的實(shí)時(shí)聊天頭像工具啟用實(shí)時(shí)人像對(duì)話。

定價(jià)方面，文本轉(zhuǎn)視頻服務(wù)的收費(fèi)將根據(jù)視頻輸出的長度計(jì)算并按秒收費(fèi)。該服務(wù)現(xiàn)已在東南亞、北歐、西歐、瑞典中部、美國中南部和美國西部地區(qū)推出。

微軟Azure AI語音服務(wù)推出虛擬人形象 支持文本轉(zhuǎn)視頻