日本a√视频在线,久久青青亚洲国产,亚洲一区欧美二区,免费g片在线观看网站

        <style id="k3y6c"><u id="k3y6c"></u></style>
        <s id="k3y6c"></s>
        <mark id="k3y6c"></mark>
          
          

          <mark id="k3y6c"></mark>

          新聞中心

          EEPW首頁 > 模擬技術(shù) > 設(shè)計應(yīng)用 > 一種用于抗噪語音識別的動態(tài)參數(shù)補(bǔ)償新方法

          一種用于抗噪語音識別的動態(tài)參數(shù)補(bǔ)償新方法

          作者: 時間:2009-05-04 來源:網(wǎng)絡(luò) 收藏

          3.2 協(xié)方差
          同樣根據(jù)(10)和相關(guān)假設(shè),可以獲得對數(shù)譜域的帶噪語音特征的協(xié)方差算法。

          本文引用地址:http://yuyingmama.com.cn/article/188936.htm

          其中


          附加隨機(jī)變量Zkl的引入以及附加隨機(jī)變量與語音和噪聲的動態(tài)特征不相關(guān)假設(shè)的使用降低了動態(tài)模型問題的求解維數(shù)。這種維數(shù)的降低同Gauss-Hermite數(shù)字積分的應(yīng)用,使得新的DPCM成為一種十分有效的動態(tài)模型補(bǔ)償


          4 算法評估
          算法評估實驗采用基于孤立字的6狀態(tài)HMM來做識別器。每個狀態(tài)有4個高斯密度函數(shù)。選取24個MFCC(12個靜態(tài)特征,12個動態(tài)特征)作為語音特征。訓(xùn)練階段,用純凈語音訓(xùn)練出純凈語音模型。在識別階段,使用純凈語音模型作為基本模型來識別。
          使用TI―digits為算法評估語音庫,選用數(shù)據(jù)庫中有16個人(8男8女)的5081個短句,其中包含20個孤立詞,數(shù)字‘0’到‘9’和10個附加命令如‘go’、‘help’、‘repeate’等。訓(xùn)練集含有641句,測試集包括5081句。算法分析窗口的長度為32ms,幀速率為9.6ms/幀。選取NOISEX-92中的White、Pink和Destoryerengine 3種噪聲作為評估的環(huán)境噪聲。使用200幀非重疊的噪聲來估計噪聲模型。全局信噪比定義為:


          其中Pm(k)是第m幀的純凈語音功率普,N(k)是估計的噪聲能量平均譜,H是每句的語音幀數(shù),L是FFT的長度,g是縮放因子讓所加的噪聲符合指定的全局信噪比。帶噪語音由(20)生成。


          其中y(i)是帶噪語音,x(i)和n(i)分別是純凈語音和噪聲。對于文中語音的動態(tài)特征參數(shù)是依據(jù)(21)獲得。


          為了比較DPCM的性能,采用5種識別:失配情況下的識別,Log―Add PMC,Log―Normal PMC,以及Log-AddPMC與Log―Normal PMC和DPCM相結(jié)合的方法。
          圖2給出了White Noise環(huán)境下Gauss―Hermite積分項數(shù)n與識別率及算法復(fù)雜度關(guān)系。從圖中可以看出隨著積分項n的增加,兩種方法的識別率都沒有明顯的變化。但是算法的復(fù)雜度卻隨著n的增加而增加。結(jié)果說明n=2的Gauss―Hermite積分可以提供足夠的計算精度。因此在DPCM 中采用n=2, 即



          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉