欧美aⅴ在线,国产手机精品一区二区,日韩国产欧美一区二区三区,精品视频在线观看视频免费视频,欧美在线小视频,精品一区视频

咨詢熱線:021-80392549

利用隱空間投影算法的模型自適應(yīng)方法

放大字體  縮小字體 發(fā)布日期:2014-10-21     來源:[標(biāo)簽:出處]     作者:[標(biāo)簽:作者]     瀏覽次數(shù):103
核心提示:
摘  要:為了降低語音識別系統(tǒng)中噪聲的影響,提出一種利用隱空間投影算法的模型自適應(yīng)方法。該方法利用狀態(tài)間的相關(guān)性提取出反映碼本和待識別語音共同特性的基矢量。由于語音與噪聲是相互獨(dú)立的,因此,當(dāng)語音識別系統(tǒng)中有噪聲存在時(shí),認(rèn)為不能用基矢量表示的那部分余量就是噪聲。與本征音方法相比,該方法可以有效地降低噪聲對語音識別系統(tǒng)的影響。該方法在提取基矢量時(shí)利用了自適應(yīng)教據(jù),并且節(jié)省了存儲空間。實(shí)驗(yàn)結(jié)果表明:該方法在噪聲環(huán)境下相對于最大似然線性回歸自適應(yīng)方法有4~9百分點(diǎn)的提高,相對于最大后驗(yàn)概率和本征音方法有更大的提高。
關(guān)鍵詞:信息處理;說話人自適應(yīng);隱空間投影;空間相關(guān)性

    語音識別技術(shù)近些年來取得了很大的進(jìn)展,得到了廣泛的應(yīng)用,但是,穩(wěn)健性問題仍然是語音識別中一個(gè)嚴(yán)重的問題。所謂的穩(wěn)健性是指語音識別系統(tǒng)在各種條件下都能保持較高識別率的這樣一種性質(zhì),穩(wěn)健性問題的解決將是推動語音識別技術(shù)實(shí)用化的一個(gè)關(guān)鍵因素。模型自適應(yīng)是一種解決穩(wěn)健性問題比較有效的方法,通過利用少量的待識別語音更新碼本,使得自適應(yīng)后的碼本更接近于待識別的語音的特性,同時(shí)使得自適應(yīng)后的碼本更接近于識別環(huán)境。
    聲學(xué)碼本的各個(gè)狀態(tài)之間是相互關(guān)聯(lián)的,某些狀態(tài)間存在著很強(qiáng)的相關(guān)性,這種相關(guān)性被稱為“空間相關(guān)性。由于噪聲與語音信號是統(tǒng)計(jì)獨(dú)立的,語音信號的相關(guān)性是噪聲所不具備的,因此,可以利用語音信號的空間相關(guān)性提高語音識別系統(tǒng)的穩(wěn)健性。
    為了減弱噪聲對語音識別系統(tǒng)的影響,本文提出了一種利用隱空間投影projection to latentstructure(PLS)的模型自適應(yīng)方法,該方法利用聲學(xué)狀態(tài)間的相關(guān)性,通過模型自適應(yīng)降低噪聲對語音識別系統(tǒng)的影響。
    目前比較有效的自適應(yīng)技術(shù)有最大似然線性回歸(maximum likelihood linear regression,MLLR)、最大后驗(yàn)概率(maximum a posterior,MAP)和本征音(eigenvoice,EV)等幾種,MLLR利用期望值最大(expectation maximization,EM)算法使得自適應(yīng)數(shù)據(jù)的似然值最大,MAP利用最大后驗(yàn)概率更新當(dāng)前碼本參數(shù)。EV算法利用主分量分析(principal componentanalysis,PCA)來提取出一組基,用這組基來表示碼本的性質(zhì),由于碼本的狀態(tài)間存在著相關(guān)性,因此,可以用較少的基來表示碼本的特性,然后根據(jù)待識別說話人的特性調(diào)整各個(gè)基的系數(shù);但是,由于這些基是從訓(xùn)練數(shù)據(jù)中提取出來的,當(dāng)碼本訓(xùn)練數(shù)據(jù)有限時(shí),它可能不能充分地反映待識別的說話人的特性,或者說待識別說話人與碼本之間的相關(guān)性。PLS方法則可以解決這個(gè)問題,它與EV算法的主要區(qū)別在于,PLS方法在提取基矢量的過程中利用了待識別的說話人數(shù)據(jù)。由于噪聲與語音是統(tǒng)計(jì)獨(dú)立的,因此,可以認(rèn)為待識別說話人數(shù)據(jù)中不能用這組基線性表示的余量就是噪聲。

1 PLS模型自適應(yīng)
   
如果用X表示碼本,Y表示待識別語音(來自同一說話人),PLS模型則要尋找一組基矢量ti,這組基矢量既可以用來表示X,也可以用來表示Y,即X和Y均表示成隱變量ti的線性變換。當(dāng)有噪聲存在時(shí),不能用基矢量的線性組合表示的那部分語音就是噪聲。表示如下:


其中:X是K×N維矩陣;Y是K×M維矩陣,K表示特征維數(shù),N表示碼本狀態(tài)個(gè)數(shù),M表示說話人統(tǒng)計(jì)量包含的狀態(tài)數(shù)目(M≤N);ti是K×1維的列矢量,ti的個(gè)數(shù)用A來表示,即i=1,2,…,A;pi是N×1維的列矢量;ri是M×1維的列矢量。這里的pi和ri分別表示ti在X中及Y中的權(quán)重,矩陣E和F表示預(yù)測誤差矩陣,那么噪聲就表示為誤差矩陣F。

1.1 基向量的求解
   
假設(shè)從兩組變量中分別提取成分t和u,t是自變量X的一個(gè)線性變換t=Xw,u是因變量X的一個(gè)線性變換u=Yv。
    欲使得t和u的相關(guān)程度達(dá)到最大,即可以通過讓t和u的內(nèi)積最大來實(shí)現(xiàn),即一個(gè)條件極值問題:


    利用Langrange乘數(shù)法,可知當(dāng)t是矩陣的最大特征值對應(yīng)的特征向量時(shí),u是矩陣的最大特征值對應(yīng)的特征向量時(shí),t和u的相關(guān)程度達(dá)到最大。

1.2 PLS說話人自適應(yīng)算法計(jì)算步驟
   
根據(jù)上面給出的基向量求解方法,可以給出下面的PLS說話人自適應(yīng)算法的計(jì)算步驟。
    步驟l變量去均值歸一化處理,X和Y的各個(gè)分量都要去均值歸一化,設(shè)Xo和Yo分別表示經(jīng)過歸一化和去均值處理后的矩陣。
    下面用Xi、Yi、ti、pi、ri分別表示第i次迭代得到的自變量、因變量、基矢量、自變量系數(shù)、因變量系數(shù),其中i=1,2,…,A,A表示基矢量的個(gè)數(shù)。
    步驟2 又分為3步。

    步驟3 利用Yi更新碼本中相應(yīng)狀態(tài)的均值。
    與EV算法相比,PLS利用了待識別說話人的數(shù)據(jù)提取基矢量,因此,它所提取出的基矢量能反映待識別的說話人的特性,可以用于說話人自適應(yīng)。此外,當(dāng)待識別的語音中含有噪聲時(shí),由于這組基也是反映碼本特性

工博士工業(yè)品商城聲明:凡資訊來源注明為其他媒體來源的信息,均為轉(zhuǎn)載自其他媒體,并不代表本網(wǎng)站贊同其觀點(diǎn),也不代表本網(wǎng)站對其真實(shí)性負(fù)責(zé)。您若對該文章內(nèi)容有任何疑問或質(zhì)疑,請立即與商城(www.lmelshi.com)聯(lián)系,本網(wǎng)站將迅速給您回應(yīng)并做處理。
聯(lián)系電話:021-31666777
新聞、技術(shù)文章投稿QQ:3267146135  投稿郵箱:syy@gongboshi.com
主站蜘蛛池模板: 成人的天堂视频一区二区三区| 自拍偷拍1| 青青青手机视频| 高清国产在线| 亚洲电影资源| 青草视频在线| 久久免费视频1| 亚洲a人片在线观看网址| 国产网站免费观看| 精品国产中文一级毛片在线看| 久操视频免费看| www.287abc.com| 99精品视频在线观看免费播放| 亚洲天天在线| 国产最爽乱淫视频国语对白| 国产欧美在线观看| 免费人欧美成又黄又爽的视频| 2018av男人天堂| 亚洲人成网址在线观看| 亚洲免费a| 狼人综合伊人| 91久久福利国产成人精品| 免费成人在线观看视频| 久久99青青久久99久久| 95看片| 亚洲国产片| 亚洲黄色免费在线观看| 久久欧洲视频| 国产成人爱片免费观看视频| 在线a视频免费观看| 久久综合伊人| 中文在线观看永久免费| 久久婷婷人人澡人人爱91| 欧美视频在线观看一区二区| 97久久精品人人澡人人爽| 亚洲一区精品视频在线| 色偷偷91久久综合噜噜噜| 日本免费久久| 调教白丝小公主h文| 国产成人鲁鲁免费视频a| 日本视频久久|