火山引擎推出“影院級字幕”同傳方案 助力村上隆跨國直播

(原標題:火山引擎推出“影院字幕同傳方案 助力村上跨國直播

牛士BiaNews消息:12月12日,日本藝術家村上隆在今日頭條西瓜視頻、抖音同步開啓首場中國直播,吸引近80萬人次在線觀看。直播過程中,村上隆向中國觀衆分享了他近期的圖書作品以及新的作品靈感,著名攝影師蜷川實花和知名主持人蔡康永也與村上隆探討了藝術理念等問題。

圖:村上隆首場中國直播,火山同傳提供實時智能同傳字幕

本場直播中,火山引擎旗下的火山同傳產品獨家全程提供了實時智能同傳字幕,通過深厚的技術實力和穩定的產品服務,給中國觀衆帶來了流暢的跨國直播體驗

火山同傳對外首秀 打造“影院級字幕”

傳統會議、直播場景中,機器翻譯解決方案提供的字幕通常是“打字級字幕”,觀看這種字幕,觀衆需要投入很大的精力在瀏覽和理解字幕上,觀衆體驗非常差。原因有兩個:一是“打字級字幕”全程會不停跳動,觀衆的視線無法聚焦,容易造成視覺疲勞。另一個,每句字幕的停留時間過短,觀衆往往來不及看完就會跳到下一句。

圖:火山同傳“影院級字幕”,流暢穩定

圖:傳統“打字級字幕”,頻繁跳動

爲了提升用戶體驗,此次村上隆的跨國直播中,火山同傳創新性地推出了“影院級字幕”方案,與視頻流整合後流暢地輸出完整的譯文語句,在屏幕上逐句顯示。觀衆可以清楚看到精準的字幕結果,免受字幕跳動帶來的視覺干擾。

在本次村上隆的跨國直播中,火山同傳的“影院級字幕”方案就引起了觀衆們的好奇和質疑。在彈幕裡,就有個別觀衆質疑真的是否在直播。

圖:村上隆直播中的字幕吸引了關注

火山同傳產品經理表示:“這種質疑在我們看來,是對我們的肯定。爲了實現‘影院級字幕’效果,並在直播中保證‘音畫字同步’,火山同傳準備了一套延時字幕方案。”

該方案中,音頻被推送到主控端完成機器同傳後人工利用直播的推拉流延時時間,在機器同傳的結果上進行內容校對,以保證投屏字幕的強可讀性。之後,火山同傳的畫面延時功能,能夠保證校對後的字幕在延時結束後準時送出,與延時後的畫面整合並同步推流到觀衆端,最終呈現出添加了高質量字幕的直播畫面。

保證一場專業直播同傳字幕質量的關鍵是定向的技術優化字節跳動傑出科學家人工智能實驗室總監李磊介紹,在村上隆的直播中,火山翻譯團隊除了採用前沿神經網絡機器翻譯技術進行模型訓練外,還針對直播場景引入了領域適應技術,將村上隆以往的訪談和演講數據用於優化算法,並對口語規範化專業術語定製都進行了特殊優化處理,確保最終呈現的字幕能夠簡潔、精準。

百項專利、50餘篇學術論文 打造專業翻譯產品矩陣

火山同傳“影院級字幕”的背後,是火山翻譯團隊超過40位頂尖科學家、工程師打磨出的機器翻譯模型。

火山翻譯由字節跳動計算機研究科學家、工程師、產品經理、產品運營和語言專家組成的專業團隊研發,擁有包括火山同傳、火山翻譯API、火山翻譯Studio、瀏覽器翻譯助手等在內的一系列矩陣產品。

目前,火山翻譯已支持超過50個語種全語向互譯,應用於辦公、娛樂、新聞等各類場景中,每天爲來自全球的過億用戶提供優質的翻譯體驗。

火山翻譯團隊擁有百餘項技術發明專利,在人工智能頂級國際學術會議已發表50餘篇學術論文。其自研的高性能序列推理引擎LightSeq,推理速度業界領先,比原生系統提高10倍,翻譯速度可達20,000詞/秒。

在近期剛結束的機器學習頂級賽事——2020國際機器翻譯大賽(WMT2020)中,經過全球語言專家充分評估,火山翻譯在「中文-英語」語向翻譯項目上力羣雄,以顯著優勢獲得世界冠軍

在人工智能領域,“如何讓AI更好地賦能行業”一直是個值得探索的方向。火山翻譯的火山同傳在這個方向上對外邁出了堅實的一步,將機器同傳的高效快捷和人工翻譯的精準進行結合。此次村上隆跨國直播中,火山同傳就爲觀衆提供了“影院級字幕”的直播體驗,實現“1+1>2”的效果。

李磊表示:“火山翻譯將致力於打造前沿研究、產品研發和用戶反饋的閉環,在迭代中快速進步。希望火山翻譯能幫助更多用戶進行國際跨語言交流,爲行業乃至整個社會發展貢獻一份力量。”