• 科普信息網

    首個AI手語主播在冰雪賽事上線 專業能力如何練成

    發布時間:2022-02-08 11:39:25 來源:科技日報 責任編輯:caobo

    2月4日,央視新聞AI手語主播上崗,她將在冬奧會新聞播報、賽事直播和現場采訪中,為聽障人士送上實時手語翻譯服務。

    這位由“百度智能云曦靈”數字人平臺打造的首個AI手語主播,已在剛剛開啟的冰雪賽事中上線,她提供的手語服務,讓聽障人士可以快捷獲取賽事資訊,感受賽事精彩。

    從“段子手”朱廣權與AI手語主播在線pk的視頻可看到,AI手語主播的“手速”沒有被朱廣權的超快語速難住。她的專業能力是怎樣練成的?

    手語數字人的本質是解決翻譯問題,難點在于手語并非按照語言逐字翻譯,而要根據語句整體意思進行語言精煉和語序調整。同時,為幫助聽障人士更好理解,還需實時配合表情和唇語。

    這就要求AI手語數字人必須解決信息凝練度、低時延和精細化三方面極其復雜的技術難題。也就是說,AI手語主播不僅要有高精度的數字人形象,更要擁有能夠語音識別、手語翻譯和手語表達的AI大腦。

    AI手語主播的AI大腦依托于百度智能云。

    為保證AI手語主播具備高可懂度的手語表達能力和精準連貫的呈現效果,通過百度自主研發的機器翻譯技術,百度智能云構建出一套精確的手語翻譯引擎,可懂度達85%以上,媲美主流的中英、中日等方向的機器翻譯結果;結合百度自研的語音識別技術,可將冰雪賽事的文字及音視頻內容,快速精準地轉化為手語;通過專為手語優化的自然動作引擎,完成AI手語主播的動作驅動,實時演繹為數字人的動作、表情和唇語;百度智能云基于《國家通用手語詞典》規范建立的規模龐大的手語動作庫,保證了手語表達的動作準確性;而用百度首創的4D掃描數據進行訓練,可讓AI手語主播的表情自然生動,口型生成準確度高達98.5%。

    如此復雜的數字人研發,百度智能云只用了不到2個月。

    目前,數字人尚未實現規模化產業落地,主要原因在于制作技術門檻高、周期長、成本高。

    百度集團副總裁吳甜曾說:“百度希望通過領先的全棧AI能力,把虛擬人的生產周期縮短到小時級別,降低生產成本,并且用AI驅動生成內容。”

    2021年12月,百度發布了集數字人生產、內容創作、業務配置服務為一體的智能數字人平臺“百度智能云曦靈”,基于人像驅動、智能對話、語音交互、智能推薦四大技術引擎,讓數字人“能聽、能說、能理解、可互動”,讓相關企業能以低成本快速定制2D卡通、真人形象及3D卡通、超寫實數字人像,實現對話服務、內容創作全流程業務配置,極大降低了數字人開發難度。

    比如,在“百度智能云曦靈”平臺上傳一張照片,就能快速生成一個可被AI驅動的2D數字人像。如今,2D數字人的生產流程已從一個星期縮短到半個小時,3D數字人的生成也已從兩三個月壓縮到一兩周的時間。

    與此同時,數字人個性化功能開發也更加完善。比如,通過輕量化模型訓練,用戶說20句話即可生成屬于自己音色的數字人。

    百度AI人機交互實驗室負責人李士巖說:“我們近一兩年的奮斗目標是通過百度智能云曦靈平臺的開放,讓每個人、每一家企業實現數字人自由。”

    據了解,百度智能云曦靈已為諸多行業提供了一站式虛擬主持人、虛擬員工、虛擬偶像、品牌代言人的創建與運營服務。(科技日報記者 劉艷)

    標簽: AI手語主播 AI 冰雪賽事 聽障人士

    上一篇:Intel揭秘冬奧開幕式:AI實時畫面演算
    下一篇:最后一頁

    新聞排行

    江苏体彩网