AI精確復制聲音 真假“比爾·蓋茨”難辨

?機器人資訊 ????|???? ?2020-07-19

AI精確復制聲音 真假“比爾·蓋茨”難辨


   【網易智能訊6月14日消息】臉書的研究人員成功克隆了微軟總裁比爾·蓋茨的聲音。


  臉書人工智能研究中心的肖恩·瓦斯奎茲(Sean Vasquez)和邁克·劉易斯(Mike Lewis)于本周表示,他們已經努力模仿人類語言有一段時間了。然而,模仿人類語言顯然是件難事,當人們聽到斯蒂芬·霍金所使用的那套最著名的說話機器發聲時,會發現它聽起來仍然很不像人類。


  但是現在,研究員們似乎已經取得了進展。如果你聽了蓋茨的克隆所發出的聲音,我想你是會同意的。因為它聽起來很像比爾·蓋茨,你甚至很難分辨出它和他真實聲音的區別。


  研究人員展示了他們的研究。在這里,機器模仿著蓋茨的腔調發聲,“請給你珍愛的朋友發一封充滿愛意的短信。”其中最不可思議的是,這臺機器在說“珍愛(cherish)”時,準確無誤地捕捉到蓋茨不斷上升的語調變化的。


  這項技術被稱為MelNet,可以用來復制人類的語調。到目前為止,蓋茨和其他許多人的聲音都被它完美地再現了。瓦斯奎茲和劉易斯說,克隆的音頻取自各類Ted演講。


  兩位研究人員還表示,直到最近,文本到語音轉換軟件還不能很好地工作的原因是它使用了波形圖記錄聲音。這些圖顯示了聲音在幾秒鐘內的音階變化。如果你聽到過蓋茨說“珍愛”這個詞,就知道他的語氣是變化劇烈的。在試圖模仿一個人的時候,深度學習機器必須預測到所有這些細微的變化,這很不容易。


  瓦斯奎茲和劉易斯說,他們通過使用一種叫做光譜圖的東西來訓練機器,成功地克隆了聲音。

免責聲明:本網部分文章和信息來源于互聯網,本網轉載出于傳遞更多信息和學習之目的。如轉載稿涉及版權等問題,請立即聯系網站所有人,我們會予以更改或刪除相關文章,保證您的權利。