當身邊有人在狂歡時,在別人狂歡時要學會離場當你身邊有人在聚會的時候。無論是人們在說話,孩子們在玩耍,隔壁的建筑工人,還是一只寵物狗試圖從前廊嚇跑一只想象中的怪物,當試圖在Skype上打電話時,背景噪音真的聽不見。不過這種情況在Skype會有很大改善今天我向大家介紹的是Skype桌面應用的最新背景降噪功能當你用Skype......
無論是人們在說話,孩子們在玩耍,隔壁的建筑工人,還是一只寵物狗試圖從前廊嚇跑一只想象中的怪物,當試圖在Skype上打電話時,背景噪音真的聽不見。
不過這種情況在Skype會有很大改善
今天我向大家介紹的是
Skype桌面應用的最新背景降噪功能
當你用Skype和對方通話時,除了你自己的聲音之外,消除幾乎所有的聲音。
在設置中,點擊音頻和視頻,找到“噪音消除”選項,調整周圍的聲音。
取消調整通話的Skype選項。
以下是可用的選項:
自動(默認)Skype應用程序將根據您的環境調整噪音抑制水平。
低將抑制低水平的持續背景噪音,如計算機風扇或空調。但是,如果您想要共享正在播放的音樂,您可以使用此設置。
高所有背景聲音,除了語音,將被取消。
關閉噪音取消已被禁用。
注:啟用此選項將使用更多的計算機資源,因為降噪發生在所用的設備上,而不是Skype。
真的有這么神奇嗎
如果你想知道它是如何工作的,請繼續讀下去。
它的工作原理是對音源進行分析,然后利用經過專門訓練的深度神經網絡,在不影響說話人聲音的情況下,過濾掉噪音。雖然傳統的降噪算法可以解決簡單而一致的噪音(例如風扇發出的噪音),但這些神經網絡可以學習區分語音和更復雜和不一致的噪音(例如在鍵盤上打字,食物包裝紙的吱嘎聲,對,還有那只狗的嚎叫聲)。
這項技術依靠機器學習(ML)來學習凈化語音和噪音的區別,也就是通常所說的人工智能(AI)。使用一個有代表性的數據集來訓練ML模型,以便它能在我們的Skype用戶遇到的大多數情況下工作。在純語音、噪音類型和用戶加入在線電話的環境方面,數據集需要有足夠的多樣性。
為了實現這種多樣性,我們使用的數據集包含大約760小時的純語音數據和180小時的噪聲數據。為了遵守微軟嚴格的隱私標準,沒有為此數據集收集任何客戶數據。相反,我們使用公開可用的數據或眾包來收集特定的場景。對于純語音,我們平衡地使用男性和女性的聲音。我們還收集了10多種語言(包括聲調語言)的數據,以幫助確保模型不會扭曲單詞的聲調,從而改變句子的意思。對于噪音數據,我們包括了150種噪音,以覆蓋用戶可能遇到的各種場景,從鍵盤輸入到流水到打鼾。我們也在純言語中包含情緒,以防止笑或哭等表達受到抑制。用戶加入Skype會議的環境特征對語音信號也有很大影響。為了捕捉這種多樣性,我們使用來自3000多個真實房間環境和115000多個合成房間的數據來訓練我們的模型。
當我們采用深度學習時,擁有一個強大的模型訓練基礎結構是很重要的。我們使用Microsoft Azure使團隊能夠開發ML模型的改進版本。從噪聲中提取原始純凈語音的另一個挑戰是以人類耳朵認為自然和愉快的方式。由于沒有與人類感知高度相關的客觀指標,我們開發了一個框架,使我們能夠將處理后的音頻樣本發快遞給眾包供應商,它們的音頻質量將由人類聽眾在一到五顆星的范圍內進行評級,以獲得平均意見得分(MOS)。在這些人類分數的幫助下,我們可以開發新的感知指數,并且在人類主觀分數的幫助下,我們在提高深度學習模型的質量方面取得了快速進展。為了促進這一領域的研究,我們開源了感知質量的數據集和眾包框架。
最后,我們創建了一個deep 學習模型,以便在Skype桌面應用程序上實時高效運行。通過針對人類感知進行優化,我們可以在質量和復雜性之間實現良好的妥協,這意味著用戶使用的大多數Windows設備都可以利用基于人工智能的降噪功能。
特別聲明:以上文章內容僅代表作者本人觀點,不代表ESG跨境電商觀點或立場。如有關于作品內容、版權或其它問題請于作品發表后的30日內與ESG跨境電商聯系。
二維碼加載中...
使用微信掃一掃登錄
使用賬號密碼登錄
平臺顧問
微信掃一掃
馬上聯系在線顧問
小程序
ESG跨境小程序
手機入駐更便捷
返回頂部