播音員會被人工智能取代嗎?揭開“AI合成主播”的神秘面紗

智能硬件
2018
12/05
網信江蘇
分享
第五屆世界互聯網大會期間,新華社聯合搜狗公司發布了全球首個合成新聞主播——“人工智能合成主播”(以下稱“AI合成主播”),引起了國內外媒體的關注。目前“AI合成主播”已經實現日常新聞播報的量產。“AI合成主播”的算法原理是什么?它的出現是否會取代真人主播?對此,新華社新媒體中心副總編輯齊慧杰接受訪談,為你揭開“AI合成主播”的神秘面紗。

▲“AI合成主播”正在播報新聞

Q:第五屆世界互聯網大會上“AI合成主播”表現搶眼。當初萌發“AI合成主播”的創意靈感是什么?開發過程是怎樣的?開發過程中遇到了哪些困難?

齊慧杰:“AI合成主播”的雛形是搜狗公司研發的一款可以從圖像表情、聲音語言等層面進行擬人化訓練的AI產品。我們看到這款AI產品以后,發現它有很多地方可以和媒體的內容生產相結合,最終我們決定和搜狗公司聯合開發這款“AI合成主播”。

在開發過程中,最大的困難是保證“AI合成主播”在工作時,表情、唇動和聲音完全地自然合一。在此之前國外已經有一些虛擬的主播形象了,但是無法做到表情、唇動和聲音的吻合。因此我們在這方面下了大力氣,最終攻克了這一技術難點,這也是我們的“AI合成主播”在技術層面上最獨特的地方。目前這個“AI合成主播”在世界上是獨一無二的,現在很多海外媒體對我們的“AI合成主播”很感興趣。

▲AI合成主播通過語音播報介紹自己

▲“AI合成主播”播報新聞《(珠海航展)燃 紅鷹飛行表演隊發布宣傳片秀特技》

Q:“AI合成主播”背后的算法機制是怎樣的?如何實現音頻和表情、唇動保持自然一致?

齊慧杰:“AI合成主播”最難的地方是實現表情、唇動和聲音的自然一致。為了實現這一點,我們使用了大量的前沿技術,比如人臉關鍵點檢測、人臉特征提取、人臉重構、唇語識別、情感遷移等,在此基礎上結合語音、圖像等多模態信息進行聯合建模訓練后,生成與真人無異的AI分身模型。該項技術能夠將所輸入的中英文文本自動生成相應內容的視頻,并確保視頻中音頻和表情、唇動保持自然一致,展現與真人主播無差別的效果。

Q:“AI合成主播”未來有可能會取代真人主播嗎?

齊慧杰:目前“AI合成主播”可以代替真人主播做一些基礎性的工作,提高了新聞視頻的制作效率。但是在一些互動性較強的欄目,或一些需要應變和評論的場合,還是需要真人主播來完成工作,這是“AI合成主播”一時半會兒無法取代的。

“AI合成主播”可以完成真人主播的部分工作,這也對真人主播的綜合能力提出了更高的要求,未來的真人主播應該是一個集記者、編輯等多重媒體人身份于一身的多面手。

THE END
廣告、內容合作請點擊這里 尋求合作
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表新Q科技的觀點和立場。

相關熱點

2月26日,努比亞官方開啟開學特惠活動(活動工夫是2月26日-27日),多款新機降價促銷,其中努比亞Z17mini 6GB+64GB版售價1299元。努比亞Z17mini是努比亞在2017年推出的中端手機,其亮點是拍照。它搭載了索尼1300萬像素后置攝像頭,其中一顆為黑色鏡頭,搭載真顏色RGB Sensor,擔任采集豐厚的顏色信息,另一顆為彩色鏡頭,搭載索尼定制全透光MONO Sensor,進光
通信/計算
iPhone 7發布時,蘋果做出了一項嚴重決議,那就是丟棄了耳機孔在iPhone上呈現的時機,開端全力擁抱無線耳機,這樣做的益處不言而喻。剔除3.5mm耳機孔可以讓蘋果借機賺取更多的錢,當然更深層的一點是,為寸土寸金的外部設計留出空間,既然行業的領頭羊都曾經做出表率,其他廠商跟進也是必定。隨后我們看到不少手機廠商開端摒棄3.5mm耳機孔,而谷歌和高通也在一定水平上減速了這個狀況的發作,不過關于全
通信/計算
  還有幾天,你們就要正式和2017年說拜拜了。而在這一年里,有哪部手機讓你映像深刻呢?可能有些讓你映像深刻的手機本身在市場上
數碼產品
  今年蘋果發布了iPhone 8/8Plus/X三部手機,但恐怕連庫克自己都沒想到iPhone8/8Plus命途多舛,市場的不認可、設備本身的不完善
數碼產品
  北京時間2017年11月22日,中國鐵路正式宣布,從11月23日起(,中國鐵路客戶服務中心12306網站將正式上線微信支付功能。也就是
業界動態
  現在提起電商大佬,可能你們第一時間就會想到馬云和劉強東,對吧?但在小智還年輕的時代,這兩個名字還不存在,那個時候聽到最
數碼產品

相關推薦

1
3
野牛闪电电子