一、基于小波變換和Teager能量算子濁音段提?。ㄕ撐奈墨I(xiàn)綜述)
查琳[1](2020)在《基于聲音傳感器的目標(biāo)識別技術(shù)研究》文中認(rèn)為目前指紋識別、虹膜識別、聲音識別等生物特征識別技術(shù)發(fā)展十分迅速,已經(jīng)在軍事、金融和安全等領(lǐng)域有著廣泛的應(yīng)用。因?yàn)槁曇裟繕?biāo)識別技術(shù)有樣本易采集、算法復(fù)雜度低、隱蔽性強(qiáng)等優(yōu)點(diǎn),所以適用于更多的場景也有更重大的研究意義,已成為近年來的研究熱點(diǎn)。但是現(xiàn)有的聲音目標(biāo)識別技術(shù)的相關(guān)研究多是在實(shí)驗(yàn)室中進(jìn)行的,不適用于野外這類噪聲較大的環(huán)境中。本文主要研究了在噪聲環(huán)境中的聲音目標(biāo)識別,利用放置在野外環(huán)境中的聲音傳感器采集聲音數(shù)據(jù),經(jīng)過一系列處理,最終能夠識別出聲音是由人、車還是小型飛行器發(fā)出的。為此,本文將從以下幾個方面進(jìn)行討論和研究:(1)對在噪聲環(huán)境中采集的聲音信號進(jìn)行預(yù)處理,提取較純凈的聲音信號。本文采用基于Teager能量算子的端點(diǎn)檢測來達(dá)到預(yù)處理的目的。傳統(tǒng)的端點(diǎn)檢測方法大部分是基于聲音信號的短時能量和短時過零率特征研究出來的。這兩種特征是在時域中檢測到的,簡單且易于實(shí)現(xiàn),但不適用于信噪比較低的情況,會增加誤判的可能性。但是在小波域中,有用聲音信號段的小波系數(shù)明顯大于無聲和噪聲段而且更穩(wěn)定。因此,基于小波域Teager能量算子的端點(diǎn)檢測更適用于野外環(huán)境中的聲音目標(biāo)識別。(2)將現(xiàn)有的聲音特征參數(shù)分為時域參數(shù)和頻域參數(shù)兩類,逐一介紹了常用聲音特征參數(shù)的原理及優(yōu)缺點(diǎn)。本文使用的聲音數(shù)據(jù)是由放置在野外環(huán)境中的聲音傳感器采集到的,會產(chǎn)生信噪比低、不穩(wěn)定等問題。單一的特征參數(shù)不能達(dá)到很好的識別效果,所以使用梅爾頻率倒譜系數(shù)和線性預(yù)測倒譜系數(shù)的融合特征作為本次研究的特征參數(shù)。(3)本次實(shí)驗(yàn)需要在短時間內(nèi)識別出聲音是由人、車還是小型飛行器發(fā)出的,所以在保證識別率的條件下,對識別速度也有一定的要求。因此,最終選擇使用矢量量化模型(VQ)進(jìn)行分類。經(jīng)過分析和研究,發(fā)現(xiàn)目前矢量量化模型多使用歐式距離作為失真測度。由于本文使用梅爾頻率倒譜系數(shù)和線性預(yù)測倒譜系數(shù)的融合特征作為特征參數(shù),所以改用對數(shù)似然比作為矢量量化模型的失真測度。利用MATLAB對模型進(jìn)行了設(shè)計(jì)與實(shí)現(xiàn),通過實(shí)驗(yàn)證明該識別系統(tǒng)能夠在保證識別率的情況下提高識別速度,而且可以適用于更廣泛的場景中。
吳鵬[2](2019)在《機(jī)載環(huán)境下的語音識別關(guān)鍵技術(shù)的研究》文中指出語音識別技術(shù)是近三十年來的熱門研究課題,也是一門綜合性很強(qiáng)的學(xué)科,有著遠(yuǎn)大的應(yīng)用前景。雖然在當(dāng)今社會已經(jīng)涌現(xiàn)出不少的語音產(chǎn)品,但在應(yīng)用過程中還存在著各種各樣的問題,特別是在某種特定的背景下,因此本文著重于對機(jī)載環(huán)境下的語音識別技術(shù)展開研究。詳細(xì)介紹了語音識別的實(shí)現(xiàn)流程與系統(tǒng)架構(gòu),闡述了語音識別系統(tǒng)的各個組成部分的基本原理,包括預(yù)處理、端點(diǎn)檢測、特征提取以及識別的方法。提出一種結(jié)合譜減法與短時零熵的檢測方法。該方法在檢測的前端部分運(yùn)用譜減法進(jìn)行降噪處理,并融合了短時過零率和功率譜熵,構(gòu)造出一種新的語音參數(shù),即短時零熵。經(jīng)實(shí)驗(yàn)證明,該算法能夠在機(jī)載環(huán)境下取得較為滿意的檢測效果。提出一種基于HHT變換的改進(jìn)MFCC特征。該方法是將HHT變換取代FFT變換進(jìn)行時頻分析,且在MFCC特征的高頻部分采用Teager能量,得到一種改進(jìn)MFCC參數(shù)。實(shí)驗(yàn)結(jié)果表明,該參數(shù)在機(jī)載環(huán)境下有著良好的穩(wěn)健性和魯棒性。在HMM的理論基礎(chǔ)上,以Matlab軟件作為開發(fā)平臺,搭建一個基于機(jī)載指令的語音識別系統(tǒng),并展現(xiàn)了識別流程中的各個環(huán)節(jié)的操作界面與仿真結(jié)果。最終的演示結(jié)果表明改進(jìn)算法在機(jī)載環(huán)境下具有很好的應(yīng)用價值。
夏令祥[3](2019)在《低信噪比環(huán)境下語音端點(diǎn)檢測方法的研究》文中進(jìn)行了進(jìn)一步梳理國務(wù)院下發(fā)了《新一代人工智能發(fā)展規(guī)劃的通知》,要求建立新一代人工智能關(guān)鍵共性技術(shù)體系,將自然語言處理技術(shù)規(guī)劃在內(nèi)。語音端點(diǎn)檢測作為自然語言處理技術(shù)中的關(guān)鍵部分,對其展開研究具有重大意義。針對低信噪比環(huán)境下的語音端點(diǎn)檢測準(zhǔn)確率低的問題,本文提出了三種新的語音端點(diǎn)檢測方法,并設(shè)計(jì)實(shí)驗(yàn)驗(yàn)證了其可行性和優(yōu)越性。首先介紹了語音信號預(yù)處理方法、傳統(tǒng)的語音特征提取方法和端點(diǎn)識別方法,為本文的研究提供了理論基礎(chǔ)。然后在特征提取部分,提出了三種語音特征提取方法:(1)分析了使用譜熵(SE)和梅爾頻率倒譜系數(shù)(MFCC)進(jìn)行語音端點(diǎn)檢測效果較差的缺點(diǎn)及原因,并探究了MFCC的第一個分量(MFCC0)對MFCC在語音信號處理中影響,發(fā)現(xiàn)MFCC0具有一定程度的語音追蹤能力。然后使用MFCC0對SE加權(quán),提出了譜熵梅爾積(PSEM)的概念。最后使用PSEM進(jìn)行語音信號特征提取,并與SE和MFCC倒譜系數(shù)距離對比,證明了PSEM的優(yōu)越性。(2)針對基于經(jīng)驗(yàn)?zāi)J椒纸猓‥MD)和Teager能量算子(EMD-TEO)的特征提取方法,指出導(dǎo)致其算法耗時長的原因是進(jìn)行了大量的EMD分解。引入信息熵的概念,并改進(jìn)概率計(jì)算的方式,降低算法復(fù)雜度,提高魯棒性,提出了Teager能量信息熵(TEE)的概念。提取語音信號的TEE特征并與EMD-TEO特征比較,證明了TEE具有較好的實(shí)時性和端點(diǎn)檢測性能。(3)探究了傳統(tǒng)排列熵(PE)中的概率計(jì)算方式對語音端點(diǎn)檢測效果的影響,指出PE的概率計(jì)算未考慮子序列均值的缺點(diǎn),使用加權(quán)排列熵(WPE)作為語音特征參數(shù)提取方法,并通過仿真實(shí)驗(yàn)證明了該方法進(jìn)行語音端點(diǎn)檢測的優(yōu)越性。在端點(diǎn)識別部分,使用模糊C均值聚類算法(FCMC)和貝葉斯信息準(zhǔn)則(BIC)對傳統(tǒng)雙門限法的高、低門限值自適應(yīng)估計(jì),使雙門限法具有了自適應(yīng)性。最后,將本文三種特征參數(shù)分別與該方法結(jié)合,形成三種新的語音端點(diǎn)檢測方法。使用TIMIT語音庫和NUST6032014語音庫設(shè)計(jì)對比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果證明,在低信噪比環(huán)境中,與傳統(tǒng)語音端點(diǎn)檢測方法相比,本文所提三種方法都具有較高的端點(diǎn)檢測準(zhǔn)確率。
朱春利[4](2019)在《基于多特征融合的語音端點(diǎn)檢測方法研究》文中提出隨著信息技術(shù)的發(fā)展,語音智能化逐漸走上成熟,端點(diǎn)檢測作為語音信號處理中一個核心技術(shù)而顯得十分重要。語音端點(diǎn)檢測的目的是從帶噪語音信號中有效判別出語音的端點(diǎn),從而減少語音信號處理的運(yùn)算量和提高系統(tǒng)的性能?,F(xiàn)有的端點(diǎn)檢測方法在信噪比(Signal Noise Ratio,SNR)較高的環(huán)境下往往具有較好的檢測效果,但隨著信噪比的降低,端點(diǎn)檢測效果很不理想,甚至失效。針對此問題,本文通過改進(jìn)前端語音降噪算法,并結(jié)合改進(jìn)后的多特征融合策略進(jìn)行語音的雙門限端點(diǎn)檢測,并通過與其它方法進(jìn)行實(shí)驗(yàn)仿真對比,驗(yàn)證了本文方法的優(yōu)越性。本文的研究工作及創(chuàng)新點(diǎn)主要表現(xiàn)在以下幾個方面:(1)結(jié)合語音增強(qiáng)技術(shù),提出了基于最小均方(the Least Mean Square,LMS)自適應(yīng)濾波減噪與多特征改進(jìn)的語音單字端點(diǎn)檢測方法,在處理噪聲的過程中引入多次中值濾波平滑處理,有效減少了語音信號所含的野點(diǎn)噪聲,并將改進(jìn)后的對數(shù)能量和短時平均過門限率相融合進(jìn)行雙門限端點(diǎn)檢測。(2)針對譜減法中短時傅里葉變換(Short-Time Fast Fourier Transform,SFFT)不能對非平穩(wěn)信號進(jìn)行有效分析,提出基于S譜減與多特征改進(jìn)融合的連續(xù)語音端點(diǎn)檢測方法,將S變換引入到譜減法中,使得語音具有更強(qiáng)的抗噪聲性能,并利用改進(jìn)的Mel頻率倒譜系數(shù)(Mel Frequency Cepstrum Coefficient,MFCC)倒譜距離與均勻子帶方差特征相融合的方法實(shí)現(xiàn)雙門限雙參數(shù)法檢測。(3)為了提高語音端點(diǎn)檢測閾值設(shè)定的自適應(yīng)性,采用了基于語音前導(dǎo)無話段噪聲估計(jì)的動態(tài)閾值設(shè)定策略,使得該閾值會隨著每段語音的前導(dǎo)無話段計(jì)算噪聲的情況而動態(tài)變化。(4)針對傳統(tǒng)的評測方法存在操作性不足、誤差性較大的問題,提出了置信度評測機(jī)制,通過端點(diǎn)檢出率、漏檢率、算法復(fù)雜度等指標(biāo)來計(jì)算端點(diǎn)檢測正確率,增強(qiáng)了實(shí)驗(yàn)的可信度和可靠性。
劉振燾,徐建平,吳敏,曹衛(wèi)華,陳略峰,丁學(xué)文,郝曼,謝橋[5](2018)在《語音情感特征提取及其降維方法綜述》文中進(jìn)行了進(jìn)一步梳理情感智能是人工智能的重要發(fā)展方向,隨著人工智能的迅速發(fā)展,情感智能已成為當(dāng)前人機(jī)交互領(lǐng)域的研究熱點(diǎn).語音情感是人們相互情感交流最直接、最高效的途徑,越來越多的研究者投入到語音情感識別的研究中.該文綜述了國內(nèi)外近幾年語音情感特征提取及降維領(lǐng)域的最新進(jìn)展.首先,介紹了語音情感識別中常用的特征,將語音特征分為韻律特征、基于譜的特征等,并提出以個性化與非個性化的方式對語音情感特征進(jìn)行分類.然后,對其中廣泛應(yīng)用的特征提取方法進(jìn)行了詳細(xì)地比較與分析,闡述了各類方法的優(yōu)缺點(diǎn),并對最新的基于深度學(xué)習(xí)方法的語音特征提取的相關(guān)研究進(jìn)行了介紹.同時,介紹了常用的語音情感特征降維方法,并在此基礎(chǔ)上分析了這些特征降維方法時間復(fù)雜度,對比了各類方法的優(yōu)缺點(diǎn).最后,對當(dāng)前語音情感識別領(lǐng)域的研究現(xiàn)狀與難點(diǎn)進(jìn)行了討論與展望.
朱虹,金小峰[6](2017)在《改進(jìn)的跨語種說話人確認(rèn)方法的研究》文中指出提出了一種基于改進(jìn)的語音融合特征和GMM模型相結(jié)合的跨語種說話人確認(rèn)方法.首先,采用Teager能量算子提取語音中的濁音段,消除與說話人聲道特征無關(guān)的靜音段和清音段.其次,提取基音周期參數(shù),并與16維的MFCC參數(shù)融合形成本文的語音融合特征.最后,將本文方法與文獻(xiàn)[9]的方法分別進(jìn)行了單語種和跨語種的說話人確認(rèn)對比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明本文方法識別準(zhǔn)確率和平均判別時間均優(yōu)于文獻(xiàn)[9]的方法,證明本文提出的方法有效,可用于跨語種的說話人確認(rèn)應(yīng)用領(lǐng)域.
王磊[7](2014)在《基于小波包變換的說話人識別特征參數(shù)提取算法研究》文中研究指明隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,語音特征已經(jīng)成為計(jì)算機(jī)處理的一種重要資源。傳統(tǒng)的文字、圖像等信息處理雖然在某些領(lǐng)域有很大的市場,但是在某些領(lǐng)域文字、圖像等信息的處理卻不能反映個體的特征,對個體的認(rèn)證也有局限性。說話人識別是一種通過對人的語音信號進(jìn)行提取、分析,然后判斷說話人是誰的技術(shù)。說話人識別技術(shù)在某些領(lǐng)域能通過對不同信號的差異性進(jìn)行分析來達(dá)到區(qū)分人與人之間這種差異性,從而實(shí)現(xiàn)個體的認(rèn)證。隨著技術(shù)發(fā)展,其應(yīng)用場景將進(jìn)入通信、互聯(lián)網(wǎng)、醫(yī)療、消費(fèi)電子等各種領(lǐng)域。因此,對說話人識別進(jìn)行研究有很大的意義。本文以MFCC特征參數(shù)提取過程為基礎(chǔ),將小波包變換技術(shù)和Teager能量算子運(yùn)用到特征參數(shù)提取過程中,重點(diǎn)研究基于小波包變換的說話人識別過程,以及基于小波包變換與能量算子的說話人識別過程。論文主要工作如下:首先對說話人識別技術(shù)進(jìn)行介紹,然后對常用的幾種說話人識別技術(shù)進(jìn)行闡述,并對一種傳統(tǒng)的基于MFCC的計(jì)算方法分析優(yōu)點(diǎn)與缺點(diǎn)。此外,對小波包變換的理論、原理進(jìn)行了分析和介紹。提出了一種基于小波包變換的特征參數(shù)提取算法。詳細(xì)分析了MFCC的優(yōu)缺點(diǎn),將小波包變換應(yīng)用到MFCC提取過程中去,用小波包變換替代快速傅里葉變換和Mel濾波器組,從而能很好的反映信號非平穩(wěn)、持續(xù)短、時域和頻域局部化等特征,同時又解決了Mel濾波器組高頻部分精度不高的問題,最后得到新特征參數(shù)newMFCC,與頻譜重心結(jié)合得到組合特征參數(shù),并且用差分參數(shù)作為特征參數(shù)作為比對,并通過仿真實(shí)驗(yàn)證明改進(jìn)算法有更好的識別效果。提出了一種小波包變換與Teager能量算子結(jié)合的特征參數(shù)提取算法。分析了噪音環(huán)境下MFCC的不足,同時結(jié)合Teager能量算子在語音增強(qiáng)下的表現(xiàn),將Teager能量算子運(yùn)用到之前的小波包變換的特征提取算法中。構(gòu)建了新的提取算法過程,得到了新特征參數(shù)newMFCC2,最后仿真實(shí)驗(yàn)證明了在噪音環(huán)境下該算法有更好的識別結(jié)果。
王耀琦,王小鵬,張忠林[8](2012)在《一種低信噪比環(huán)境下的基音檢測方法》文中提出噪聲是低信噪比環(huán)境下影響基音檢測準(zhǔn)確率的主要因素之一,為此提出一種基于形態(tài)學(xué)濾波和小波變換相結(jié)合的基音檢測方法。該方法首先用形態(tài)學(xué)濾波器濾除噪聲,突出基音。然后在小波域利用Teager能量算子區(qū)分清、濁音,通過濁音小波系數(shù)模的極大值提取基音。實(shí)驗(yàn)結(jié)果表明,在信噪比較小時該方法也能準(zhǔn)確地檢測出語音信號的基音,與傳統(tǒng)的基音檢測方法相比,該方法有較強(qiáng)的抗噪性。
馮亞楠[9](2012)在《基于小波域Teager能量熵的音符起點(diǎn)檢測算法研究》文中研究指明音樂音符起點(diǎn)檢測是基于內(nèi)容的音樂信號分析處理的關(guān)鍵性環(huán)節(jié)。尤其對開啟音樂檢索領(lǐng)域新篇章的哼唱檢索(QBH)系統(tǒng)而言,若加入一種高效快捷的音符切分程序,不僅可以在很大程度上提升檢索效率,而且可以極大程度地方便用戶的使用,即可免去很多限制直接使用自然哼唱進(jìn)行檢索。因此音符起點(diǎn)檢測確實(shí)是基于內(nèi)容的音樂檢索系統(tǒng)中不可缺少的一個重要步驟。本文首先介紹了近年來音樂信號領(lǐng)域中各種經(jīng)典有效的處理算法,并分析了各自利弊。之后,針對音樂音符所特有的信號特征,將幾種有效的特征參數(shù)進(jìn)行融合進(jìn)而提出了更為有效的全新的音符起點(diǎn)檢測算法——小波域的Teager能量熵算法。鑒于Teager能量特征參量不僅包含信號幅度信息,而且包含信號的頻率信息,這一特性恰能很好地反映音頻流中音符所特有的能量分布隨頻率而有所差異的特性。與此同時,信息熵能夠很好地反映特征參量的分布情況,而不會受到信號個別樣本點(diǎn)變化的影響。因此,本文首先將二者相結(jié)合,提出了基于Teager能量熵的音符切分算法。接著對所提取的Teager能量熵特征曲線首先經(jīng)由對數(shù)函數(shù)的均衡峰值處理,而后用雙門限閾值法提取峰值,進(jìn)而完成整個音符切分過程。與目前較優(yōu)的音符切分法——自適應(yīng)子帶譜熵法相比,Teager能量熵算法快速簡潔,計(jì)算量減少近60%,得到的檢測曲線更平整光滑,音符分界更為明顯,音符切分的準(zhǔn)確度提高近十個百分點(diǎn),尤其適用于打擊類樂曲。但是,當(dāng)待處理的音樂信號中摻雜有噪聲信號,尤其是高頻噪聲時,Teager能量熵算法的檢測性能會遜色不少。對于這一問題,本文在特征提取前首先進(jìn)行了小波變換,濾除高頻噪聲,只對低頻信號進(jìn)行Teager能量熵特征提取,實(shí)驗(yàn)證明抗噪性能確實(shí)提升了不少。至此,形成了本文最終提出的音符起點(diǎn)檢測算法——小波域的Teager能量熵算法。文中對不同種類的音樂音頻進(jìn)行實(shí)驗(yàn)檢測,實(shí)驗(yàn)數(shù)據(jù)大體分為四大類共七組音樂片段,約共含2000多個音符。實(shí)驗(yàn)結(jié)果表明本文算法在音符起點(diǎn)檢測中確實(shí)更具優(yōu)勢,尤其對于由多種樂器演奏或加有背景音樂的復(fù)雜音樂音頻信號,本文算法的優(yōu)勢將更加突出。
孫穎[10](2011)在《情感語音識別與合成的研究》文中研究表明情感語音識別與合成技術(shù)是當(dāng)前語音信號處理研究的熱點(diǎn)問題,目的是使計(jì)算機(jī)既能夠聽懂人類語言所攜帶的情感成分,又可以說出人類語言,實(shí)現(xiàn)人機(jī)智能通信,使計(jì)算機(jī)與人的交流暢通無阻。情感語音識別是語音識別技術(shù)的一個新的分支,由于情感本身概念的不確定性及語音中情感特征的模糊性,使得情感語音識別成為一個難點(diǎn)問題。語音合成技術(shù)一直以來研究者眾多,但是,如何能夠構(gòu)建出一個存儲量小,自然度高的合成系統(tǒng)一直是需要重點(diǎn)解決的問題。本文緊緊抓住情感語音識別的難點(diǎn)和語音合成的重點(diǎn),提出了基于人耳聽覺特性模型的情感語音識別特征,并用聲門特征對基于人耳聽覺的情感語音特征進(jìn)行了補(bǔ)償優(yōu)化;實(shí)現(xiàn)了基于隱馬爾科夫模型的語音合成系統(tǒng),在此基礎(chǔ)上,對系統(tǒng)合成的語音進(jìn)行了參數(shù)分析和修改,將情感特征加入了合成語音,實(shí)現(xiàn)了基于隱馬爾科夫模型的情感語音合成。本文的主要工作和創(chuàng)新性成果如下:(1)在深入研究情感理論的基礎(chǔ)上,分析了韻律特征在不同情感中的表現(xiàn),構(gòu)建了包括“高興”、“生氣”和“中立”三種情感狀態(tài),漢語普通話和英語兩種語言的TYUT情感語音數(shù)據(jù)庫。通過主觀辨聽實(shí)驗(yàn)和典型特征的分析實(shí)驗(yàn),確定了TYUT情感語音數(shù)據(jù)庫的有效性。(2)將基于人耳聽覺特性模型的過零峰值幅度特征用于情感語音識別,并將該特征中用于代表頻率與說話速率的過零特征與Teager能量算子中的非線性能量特征有機(jī)地結(jié)合在一起,提出了一種基于人耳聽覺特性模型的新特征——過零最大Teager能量算子特征,新特征在情感語音識別實(shí)驗(yàn)中表現(xiàn)出良好的性能。(3)將人的發(fā)音模型與聽覺模型相結(jié)合,通過分析聲門特征對人耳聽覺模型特征的影響,提出了用聲門特征補(bǔ)償人耳聽覺特征的新算法,并將補(bǔ)償后的新算法用于情感識別實(shí)驗(yàn),得到了較高的識別率。新算法表現(xiàn)出了優(yōu)良的性能。(4)針對實(shí)際交談中,背景環(huán)境復(fù)雜的情況,設(shè)計(jì)了一種混合情感語音數(shù)據(jù)庫的實(shí)驗(yàn),用以檢驗(yàn)情感特征的數(shù)據(jù)庫獨(dú)立性。通過對混合語音數(shù)據(jù)庫實(shí)驗(yàn)結(jié)果的對比,發(fā)現(xiàn)過零最大Teager能量算子特征是本文所有特征中,數(shù)據(jù)庫依賴性最小的特征。(5)為了能夠合成出具有不同情感的語句,首先,搭建了基于隱馬爾科夫模型的情感語音合成系統(tǒng),接著對合成出的語句進(jìn)行了參數(shù)修改,最終實(shí)現(xiàn)了基于隱馬爾科夫模型的情感語音合成,初步得到了合成的情感語音。
二、基于小波變換和Teager能量算子濁音段提?。ㄕ撐拈_題報(bào)告)
(1)論文研究背景及目的
此處內(nèi)容要求:
首先簡單簡介論文所研究問題的基本概念和背景,再而簡單明了地指出論文所要研究解決的具體問題,并提出你的論文準(zhǔn)備的觀點(diǎn)或解決方法。
寫法范例:
本文主要提出一款精簡64位RISC處理器存儲管理單元結(jié)構(gòu)并詳細(xì)分析其設(shè)計(jì)過程。在該MMU結(jié)構(gòu)中,TLB采用叁個分離的TLB,TLB采用基于內(nèi)容查找的相聯(lián)存儲器并行查找,支持粗粒度為64KB和細(xì)粒度為4KB兩種頁面大小,采用多級分層頁表結(jié)構(gòu)映射地址空間,并詳細(xì)論述了四級頁表轉(zhuǎn)換過程,TLB結(jié)構(gòu)組織等。該MMU結(jié)構(gòu)將作為該處理器存儲系統(tǒng)實(shí)現(xiàn)的一個重要組成部分。
(2)本文研究方法
調(diào)查法:該方法是有目的、有系統(tǒng)的搜集有關(guān)研究對象的具體信息。
觀察法:用自己的感官和輔助工具直接觀察研究對象從而得到有關(guān)信息。
實(shí)驗(yàn)法:通過主支變革、控制研究對象來發(fā)現(xiàn)與確認(rèn)事物間的因果關(guān)系。
文獻(xiàn)研究法:通過調(diào)查文獻(xiàn)來獲得資料,從而全面的、正確的了解掌握研究方法。
實(shí)證研究法:依據(jù)現(xiàn)有的科學(xué)理論和實(shí)踐的需要提出設(shè)計(jì)。
定性分析法:對研究對象進(jìn)行“質(zhì)”的方面的研究,這個方法需要計(jì)算的數(shù)據(jù)較少。
定量分析法:通過具體的數(shù)字,使人們對研究對象的認(rèn)識進(jìn)一步精確化。
跨學(xué)科研究法:運(yùn)用多學(xué)科的理論、方法和成果從整體上對某一課題進(jìn)行研究。
功能分析法:這是社會科學(xué)用來分析社會現(xiàn)象的一種方法,從某一功能出發(fā)研究多個方面的影響。
模擬法:通過創(chuàng)設(shè)一個與原型相似的模型來間接研究原型某種特性的一種形容方法。
三、基于小波變換和Teager能量算子濁音段提取(論文提綱范文)
(1)基于聲音傳感器的目標(biāo)識別技術(shù)研究(論文提綱范文)
摘要 |
abstract |
第1章 緒論 |
1.1 研究的背景和意義 |
1.2 國內(nèi)外研究現(xiàn)狀 |
1.2.1 聲音目標(biāo)識別國內(nèi)外研究現(xiàn)狀 |
1.2.2 特征融合技術(shù)國內(nèi)外研究現(xiàn)狀 |
1.3 論文主要研究內(nèi)容及結(jié)構(gòu)安排 |
1.4 技術(shù)路線 |
第2章 基于端點(diǎn)檢測的聲音信號預(yù)處理 |
2.1 聲音信號預(yù)處理 |
2.2 端點(diǎn)檢測 |
2.2.1 聲音信號的端點(diǎn)檢測 |
2.2.2 端點(diǎn)檢測基本原理 |
2.3 基于短時能量和短時過零率的端點(diǎn)檢測 |
2.4 基于Teager能量算子的端點(diǎn)檢測 |
2.4.1 Teager能量算子原理 |
2.4.2 Teager能量算子特性 |
2.5 本章小節(jié) |
第3章 聲音特征參數(shù)提取 |
3.1 時域特征參數(shù) |
3.2 頻域特征參數(shù) |
3.3 本章小節(jié) |
第4章 基于主成分分析的特征融合 |
4.1 特征融合理論基礎(chǔ) |
4.2 PCA基本原理 |
4.3 基于PCA的特征融合 |
4.4 本章小結(jié) |
第5章 基于聲音傳感器的目標(biāo)識別方法 |
5.1 聲音目標(biāo)識別方法 |
5.2 基于傳統(tǒng)矢量量化的聲音目標(biāo)識別 |
5.2.1 標(biāo)量量化與矢量量化 |
5.2.2 矢量量化原理 |
5.3 基于改進(jìn)矢量量化的聲音目標(biāo)識別 |
5.4 仿真實(shí)驗(yàn)與結(jié)果分析 |
5.4.1 實(shí)驗(yàn)參數(shù)設(shè)置及模塊 |
5.4.2 不同特征參數(shù)下識別率分析 |
5.4.3 不同特征參數(shù)下識別速度分析 |
5.4.4 預(yù)處理對識別率影響分析 |
5.4.5 失真測度對識別率影響分析 |
5.5 本章小結(jié) |
結(jié)論 |
參考文獻(xiàn) |
攻讀碩士學(xué)位期間發(fā)表的論文和獲得的科研成果 |
致謝 |
(2)機(jī)載環(huán)境下的語音識別關(guān)鍵技術(shù)的研究(論文提綱范文)
摘要 |
Abstract |
第一章 緒論 |
1.1 語音識別的研究背景與意義 |
1.2 語音識別研究現(xiàn)狀 |
1.2.1 國外研究現(xiàn)狀 |
1.2.2 國內(nèi)研究現(xiàn)狀 |
1.3 語音識別在航空領(lǐng)域的應(yīng)用 |
1.4 主要研究內(nèi)容 |
1.5 論文的組織機(jī)構(gòu) |
第二章 語音識別技術(shù)的基本理論 |
2.1 .語音識別的概述 |
2.1.1 語音識別的分類 |
2.1.2 語音的產(chǎn)生機(jī)理和模型 |
2.1.3 語音識別的系統(tǒng)構(gòu)架 |
2.2 語音信號的預(yù)處理 |
2.2.1 語音的采集 |
2.2.2 預(yù)加重 |
2.2.3 分幀加窗 |
2.2.4 端點(diǎn)檢測 |
2.3 語音信號的特征提取 |
2.4 主要的識別算法 |
2.5 本章小結(jié) |
第三章 改進(jìn)的短時零熵端點(diǎn)檢測方法 |
3.1 引言 |
3.2 傳統(tǒng)的端點(diǎn)檢測算法 |
3.2.1 基于時域特征-短時能量和過零率 |
3.2.2 基于頻域特征-功率譜熵 |
3.3 基于譜減法和短時零熵值的端點(diǎn)檢測算法 |
3.3.1 機(jī)載噪聲的特點(diǎn) |
3.3.2 譜減法 |
3.3.3 短時零熵值的定義 |
3.3.4 門限估計(jì)算法 |
3.3.5 基于譜減法和短時零熵的端點(diǎn)檢測 |
3.4 實(shí)驗(yàn)及結(jié)果分析 |
3.5 本章小結(jié) |
第四章 基于HHT變換的改進(jìn)MFCC特征提取 |
4.1 引言 |
4.2 常用的特征提取方法 |
4.2.1 線性預(yù)測倒譜系數(shù) |
4.2.2 MFCC倒譜系數(shù) |
4.3 Hilbert-Huang變化 |
4.3.1 EMD分解的原理及過程 |
4.3.2 Hilbert譜分析 |
4.4 基于HHT變化的特征提取方法 |
4.4.1 Teager能量算子 |
4.4.2 基于HHT變換的改進(jìn)MFCC特征提取 |
4.5 仿真實(shí)驗(yàn)及結(jié)果分析 |
4.6 本章小結(jié) |
第五章 HMM語音識別系統(tǒng)的研究 |
5.1 HMM模型的概念 |
5.2 HMM的定義及基本參數(shù) |
5.3 HMM的類型及三大問題 |
5.4 HMM的基本算法 |
5.4.1 前向-后向算法 |
5.4.2 Viterbi算法 |
5.4.3 Baum-Welch算法 |
5.5 HMM的實(shí)現(xiàn) |
5.6 本章小結(jié) |
第六章 機(jī)載語音識別系統(tǒng)的實(shí)驗(yàn)仿真 |
6.1 實(shí)驗(yàn)平臺的搭建 |
6.1.1 語音庫的建立 |
6.1.2 語音識別系統(tǒng)的主界面 |
6.2 HMM的訓(xùn)練和識別 |
6.3 實(shí)驗(yàn)結(jié)果的分析 |
6.4 本章小結(jié) |
第七章 總結(jié)與展望 |
7.1 本文總結(jié) |
7.2 展望 |
致謝 |
攻讀碩士學(xué)位期間主要的研究成果 |
參考文獻(xiàn) |
附錄一 插圖清單 |
附錄二 表格清單 |
(3)低信噪比環(huán)境下語音端點(diǎn)檢測方法的研究(論文提綱范文)
致謝 |
摘要 |
abstract |
變量注釋表 |
1 緒論 |
1.1 課題研究背景及意義 |
1.2 國內(nèi)外研究現(xiàn)狀 |
1.3 本文主要研究內(nèi)容與章節(jié)安排 |
2 語音端點(diǎn)檢測的基本理論 |
2.1 語音信號的預(yù)處理 |
2.2 傳統(tǒng)的語音特征提取方法 |
2.3 語音端點(diǎn)識別方法 |
2.4 本章小結(jié) |
3 低SNR環(huán)境下基于譜熵梅爾積的語音特征提取 |
3.1 引言 |
3.2 基于譜熵的語音特征提取 |
3.3 基于梅爾頻率倒譜系數(shù)的語音特征提取 |
3.4 低SNR環(huán)境下基于PSEM的語音特征提取 |
3.5 本章小結(jié) |
4 低SNR環(huán)境下基于Teager能量信息熵的語音特征提取 |
4.1 引言 |
4.2 基于EMD-TEO的語音特征提取 |
4.3 低SNR環(huán)境下基于TEE的語音特征提取 |
4.4 本章小結(jié) |
5 低SNR環(huán)境下基于加權(quán)排列熵的語音特征提取 |
5.1 引言 |
5.2 基于排列熵的語音特征提取 |
5.3 低SNR環(huán)境下基于WPE的語音特征提取 |
5.4 本章小結(jié) |
6 基于FCMC和 BIC的雙門限法與實(shí)驗(yàn)驗(yàn)證 |
6.1 引言 |
6.2 基于FCMC和 BIC的雙門限法 |
6.3 語音端點(diǎn)檢測實(shí)驗(yàn)驗(yàn)證與分析 |
6.4 本章小結(jié) |
7 總結(jié)與展望 |
7.1 結(jié)論 |
7.2 展望 |
參考文獻(xiàn) |
作者簡歷 |
學(xué)位論文數(shù)據(jù)集 |
(4)基于多特征融合的語音端點(diǎn)檢測方法研究(論文提綱范文)
摘要 |
ABSTRACT |
第一章 緒論 |
1.1 課題的研究背景及意義 |
1.2 國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢 |
1.2.1 研究概況 |
1.2.2 國內(nèi)外語音端點(diǎn)檢測方法的發(fā)展 |
1.3 論文的主要研究內(nèi)容與章節(jié)安排 |
第二章 語音信號處理基礎(chǔ) |
2.1 語音信號的特點(diǎn)與模型 |
2.1.1 語音信號的產(chǎn)生機(jī)制及特性 |
2.1.2 語音信號的數(shù)學(xué)模型 |
2.2 語音信號數(shù)字化與預(yù)處理 |
2.2.1 語音信號的數(shù)字化 |
2.2.2 語音信號的預(yù)處理 |
2.3 語音去噪方法介紹 |
2.3.1 語音去噪對于端點(diǎn)檢測的意義 |
2.3.2 噪聲的分類與特性 |
2.3.3 傳統(tǒng)的語音去噪方法 |
2.4 典型語音端點(diǎn)檢測模塊 |
2.4.1 特征提取 |
2.4.2 噪聲估計(jì) |
2.4.3 判決機(jī)制 |
2.5 本章小結(jié) |
第三章 基于特征的語音端點(diǎn)檢測典型算法 |
3.1 基于特征參數(shù)的端點(diǎn)檢測方法 |
3.1.1 基于特征參數(shù)的端點(diǎn)檢測方法的一般步驟 |
3.1.2 雙門限端點(diǎn)檢測法 |
3.2 基于時域特征參數(shù)的端點(diǎn)檢測 |
3.2.1 語音能量特征 |
3.2.2 語音過零率特征 |
3.2.3 自相關(guān)特征 |
3.3 基于頻域特征參數(shù)的端點(diǎn)檢測 |
3.3.1 倒譜距離特征 |
3.3.2 頻帶方差特征 |
3.3.3 譜熵特征 |
3.4 傳統(tǒng)特征參數(shù)端點(diǎn)檢測的缺陷 |
3.5 基于多特征參數(shù)融合的端點(diǎn)檢測 |
3.5.1 能零比的端點(diǎn)檢測 |
3.5.2 能熵比的端點(diǎn)檢測 |
3.6 本章小結(jié) |
第四章 基于LMS減噪與多特征改進(jìn)的語音單字端點(diǎn)檢測方法 |
4.1 自適應(yīng)濾波減噪 |
4.1.1 LMS算法基本原理 |
4.1.2 LMS自適應(yīng)算法 |
4.2 LMS減噪與改進(jìn)雙門限端點(diǎn)檢測 |
4.2.1 改進(jìn)的短時對數(shù)能量 |
4.2.2 改進(jìn)的短時平均過門限率 |
4.2.3 中值濾波平滑處理 |
4.3 實(shí)現(xiàn)結(jié)果與分析 |
4.3.1 實(shí)驗(yàn)環(huán)境 |
4.3.2 實(shí)驗(yàn)置信度性能評測 |
4.3.3 實(shí)驗(yàn)準(zhǔn)確性結(jié)果與分析 |
4.3.4 實(shí)驗(yàn)穩(wěn)健性結(jié)果與分析 |
4.4 本章小結(jié) |
第五章 基于S譜減與多特征改進(jìn)融合的連續(xù)語音端點(diǎn)檢測方法 |
5.1 基于MFCC倒譜距離特征提取 |
5.1.1 MFCC特征提取 |
5.1.2 MFCC倒譜距離 |
5.2 基于S譜減法的MFCC倒譜距離特征提取 |
5.2.1 S譜減法降噪 |
5.2.2 S譜減MFCC倒譜距離特征提取 |
5.3 基于均勻子帶分離頻帶方差特征提取 |
5.4 動態(tài)閾值更新與端點(diǎn)檢測 |
5.5 實(shí)驗(yàn)結(jié)果與分析 |
5.5.1 實(shí)驗(yàn)環(huán)境 |
5.5.2 實(shí)驗(yàn)置信度性能評測 |
5.5.3 實(shí)驗(yàn)結(jié)果與分析 |
5.6 本章小結(jié) |
第六章 結(jié)論與展望 |
6.1 結(jié)論 |
6.2 展望 |
參考文獻(xiàn) |
作者在攻讀碩士學(xué)位期間公開發(fā)表的論文 |
作者在攻讀碩士學(xué)位期間所參與的項(xiàng)目 |
致謝 |
(6)改進(jìn)的跨語種說話人確認(rèn)方法的研究(論文提綱范文)
0 引言 |
1 融合特征的提取方法 |
1.1 濁音段的提取與整合 |
1.2 融合特征 |
2 跨語種說話人確認(rèn)算法 |
3 實(shí)驗(yàn)結(jié)果及分析 |
3.1 單語種說話人確認(rèn)實(shí)驗(yàn) |
3.2 跨語種說話人確認(rèn)實(shí)驗(yàn) |
4 結(jié)論 |
(7)基于小波包變換的說話人識別特征參數(shù)提取算法研究(論文提綱范文)
摘要 |
Abstract |
第1章 緒論 |
1.1 研究背景和意義 |
1.2 國內(nèi)外研究的現(xiàn)狀 |
1.2.1 國外研究現(xiàn)狀 |
1.2.2 國內(nèi)研究現(xiàn)狀 |
1.3 本文主要工作 |
1.4 本文的組織結(jié)構(gòu) |
第2章 說話人識別技術(shù)的研究 |
2.1 說話人識別基本介紹 |
2.1.1 說話人識別的概念 |
2.1.2 說話人識別的原理 |
2.1.3 說話人識別的性能評估 |
2.2 說話人識別的特征提取 |
2.2.1 說話人識別的特征提取準(zhǔn)則 |
2.2.2 常用的特征參數(shù) |
2.2.3 特征參數(shù)的評價方法 |
2.2.4 語音信號的分析方法 |
2.2.5 LPCC特征參數(shù)提取 |
2.2.6 MFCC特征參數(shù)的提取 |
2.3 說話人識別模型 |
2.3.1 說話人識別模型匹配方法 |
2.3.2 高斯混合模型 |
2.3.3 最大似然估計(jì) |
2.3.4 基于GMM的說話人識別系統(tǒng) |
2.4 小結(jié) |
第3章 小波分析和小波包變換 |
3.1 小波分析 |
3.1.1 小波分析概述 |
3.1.2 母小波 |
3.1.3 連續(xù)小波變換 |
3.1.4 離散小波變換 |
3.2 多分辨率分析 |
3.3 小波包變換 |
3.4 常用小波函數(shù) |
3.5 小結(jié) |
第4章 基于小波包變換的特征提取算法 |
4.1 MFCC的缺點(diǎn) |
4.2 小波包變換 |
4.3 改進(jìn)的特征參數(shù)newMFCC提取過程 |
4.4 頻譜重心 |
4.5 newMFCC和頻譜重心的提取過程 |
4.6 仿真實(shí)驗(yàn) |
4.6.1 實(shí)驗(yàn)設(shè)置 |
4.6.2 實(shí)驗(yàn)一結(jié)果 |
4.6.3 實(shí)驗(yàn)二結(jié)果 |
4.6.4 實(shí)驗(yàn)三結(jié)果 |
4.6.5 實(shí)驗(yàn)結(jié)果分析 |
4.7 小結(jié) |
第5章 基于Teager能量算子的特征提取算法 |
5.1 噪音的處理方式 |
5.2 小波去噪 |
5.3 Teager能量算子 |
5.4 改進(jìn)的特征參數(shù)newMFCC2的提取過程 |
5.5 仿真實(shí)驗(yàn) |
5.5.1 實(shí)驗(yàn)設(shè)置 |
5.5.2 實(shí)驗(yàn)一結(jié)果 |
5.5.3 實(shí)驗(yàn)二結(jié)果 |
5.5.4 實(shí)驗(yàn)三結(jié)果 |
5.5.5 實(shí)驗(yàn)結(jié)果分析 |
5.6 小結(jié) |
結(jié)論 |
參考文獻(xiàn) |
附錄 A 攻讀學(xué)位期間發(fā)表的論文 |
致謝 |
(8)一種低信噪比環(huán)境下的基音檢測方法(論文提綱范文)
1 形態(tài)學(xué)濾波器 |
2 小波變換的基音檢測算法 |
3 仿真實(shí)驗(yàn)與算法性能分析 |
4 結(jié)束語 |
(9)基于小波域Teager能量熵的音符起點(diǎn)檢測算法研究(論文提綱范文)
摘要 |
ABSTRACT |
第一章 緒論 |
1.1 課題研究背景 |
1.2 音符起點(diǎn)檢測 |
1.2.1 音符起點(diǎn)檢測的定義及意義 |
1.2.2 音符起點(diǎn)檢測的發(fā)展現(xiàn)狀 |
1.3 課題主要研究工作 |
1.4 論文結(jié)構(gòu)安排 |
第二章 音樂信號相關(guān)知識 |
2.1 音高 |
2.2 音強(qiáng) |
2.3 音色 |
2.4 波形包絡(luò) |
第三章 音符起點(diǎn)檢測特征 |
3.1 基于能量的音符起點(diǎn)檢測算法 |
3.1.1 簡諧運(yùn)動能量 |
3.1.2 時域能量 |
3.1.3 Teager能量 |
3.1.3.1 Teager能量算子 |
3.1.3.2 Teager能量算子的抗噪性能 |
3.1.4 對比分析 |
3.2 基于熵的音符起點(diǎn)檢測算法 |
3.2.1 信息熵 |
3.2.2 熵在音樂信號處理中的應(yīng)用 |
3.2.2.1 譜熵 |
3.2.2.2 子帶譜熵 |
3.2.3 算法改進(jìn) |
3.3 小波域的音符起點(diǎn)檢測算法 |
3.3.1 傅里葉變換 |
3.3.2 短時傅里葉變換 |
3.3.3 小波變換的含義 |
3.3.3.1 連續(xù)小波變換(CWT)的數(shù)學(xué)定義 |
3.3.3.2 離散小波變換(DWT)的數(shù)學(xué)定義 |
3.3.4 小波域中的音符切分 |
第四章 音符起點(diǎn)檢測系統(tǒng) |
4.1 預(yù)處理 |
4.1.1 預(yù)加重 |
4.1.2 加窗 |
4.1.3 分幀 |
4.2 特征提取 |
4.2.1 特征參數(shù) |
4.2.2 方差 |
4.3 后處理 |
4.4 峰值提取 |
第五章 實(shí)驗(yàn)仿真及結(jié)果分析 |
5.1 實(shí)驗(yàn)數(shù)據(jù) |
5.2 性能評價指標(biāo) |
5.3 結(jié)果分析 |
5.3.1 Teager能量熵 |
5.3.2 小波域的Teager能量熵 |
第六章 總結(jié)與展望 |
參考文獻(xiàn) |
發(fā)表論文和參加科研情況說明 |
致謝 |
(10)情感語音識別與合成的研究(論文提綱范文)
摘要 |
ABSTRACT |
符號對照表 |
圖索引 |
表索引 |
第一章 緒論 |
1.1 課題研究背景與意義 |
1.2 語音感知系統(tǒng)和生成系統(tǒng) |
1.2.1 激勵模型 |
1.2.2 聲道模型 |
1.2.3 輻射模型 |
1.2.4 語音信號的數(shù)學(xué)模型 |
1.3 語音識別技術(shù)與語音合成技術(shù)的研究現(xiàn)狀 |
1.3.1 國內(nèi)外語音識別技術(shù)的現(xiàn)狀 |
1.3.2 國內(nèi)外語音合成技術(shù)的現(xiàn)狀 |
1.4 本文的研究內(nèi)容及創(chuàng)新點(diǎn) |
1.5 論文的結(jié)構(gòu)安排 |
第二章 情感語音基本理論研究 |
2.1 緒論 |
2.2 情感的分類 |
2.2.1 情感維度空間理論 |
2.2.2 離散情感理論 |
2.2.3 基于離散情感的情感維度空間理論 |
2.3 情感語音特征分析 |
2.3.1 短時平均過零率 |
2.3.2 短時平均能量 |
2.3.3 基音頻率 |
2.3.4 共振峰 |
2.4 情感語音識別模型 |
2.4.1 隱馬爾科夫模型(HMM) |
2.4.2 人工神經(jīng)網(wǎng)絡(luò)(ANN) |
2.4.3 混合高斯模型(GMM) |
2.4.4 主元素分析法(PCA) |
2.4.5 矢量分隔型馬氏距離判別法 |
2.4.6 支持向量機(jī)(SVM) |
2.5 情感語音合成研究 |
2.6 本章小結(jié) |
第三章 情感語音庫 |
3.1 引言 |
3.2 TYUT情感語音數(shù)據(jù)庫的建立 |
3.2.1 情感語音數(shù)據(jù)庫建立的基本原則 |
3.2.2 情感及情感語句的選擇 |
3.2.3 語音的采集 |
3.2.4 情感語句的有效性分析 |
3.3 Berlin(EMO-DB)情感語音數(shù)據(jù)庫 |
3.4 其它情感語音數(shù)據(jù)庫簡介 |
3.5 本章小結(jié) |
第四章 多種語音情感識別特征對情感語音庫有效性的驗(yàn)證 |
4.1 引言 |
4.2 基本特征簡介 |
4.2.1 LPCC特征 |
4.2.2 MFCC特征 |
4.2.3 LPMCC特征 |
4.2.4 ZCPA特征 |
4.2.5 AUSEES特征 |
4.2.6 AUSEEG特征 |
4.3 實(shí)驗(yàn)過程及結(jié)果分析 |
4.3.1 一種語言的實(shí)驗(yàn) |
4.3.2 混合語音數(shù)據(jù)庫的實(shí)驗(yàn) |
4.4 本章小結(jié) |
第五章 基于人耳聽覺特性模型的特征研究及在情感語音識別中的應(yīng)用 |
5.1 引言 |
5.2 人耳的聽覺模型 |
5.3 基于人耳聽覺特性的過零峰值幅度(ZCPA)特征及其在情感語音識別中的應(yīng)用 |
5.3.1 過零峰值幅度特征基本算法 |
5.3.2 過零峰值幅度特征在情感語音識別中的應(yīng)用 |
5.4 幀優(yōu)化算法對ZCPA特征的改進(jìn) |
5.4.1 幀優(yōu)化算法基本理論 |
5.4.2 實(shí)驗(yàn)步驟 |
5.4.3 實(shí)驗(yàn)結(jié)果及分析 |
5.5 Teager能量算子特征及在情感語音識別中的應(yīng)用 |
5.5.1 Teager能量算子 |
5.5.2 Teager能量算子在情感語音識別中的應(yīng)用 |
5.6 基于人耳聽覺特性的過零峰值最大Teager能量算子(ZCMT)特征 |
5.6.1 ZCMT特征原理及提取步驟 |
5.6.2 實(shí)驗(yàn)結(jié)果及分析 |
5.7 本章小結(jié) |
第六章 聲門特征補(bǔ)償?shù)娜硕犛X模型特征研究及在情感語音識別中的應(yīng)用 |
6.1 引言 |
6.2 聲門特征的基本理論 |
6.2.1 語音產(chǎn)生的非線性模型 |
6.2.2 典型的聲門特征及基音周期的提取 |
6.3 一種聲門特征補(bǔ)償?shù)娜硕犛X模型特征 |
6.3.1 聲門特征對于人耳聽覺模型特征的影響 |
6.3.2 人耳聽覺補(bǔ)償算法 |
6.3.3 聲門特征補(bǔ)償?shù)娜硕犛X模型特征在情感語音識別中的應(yīng)用 |
6.3.4 實(shí)驗(yàn)結(jié)果及分析 |
6.3.5 本文所有特征在情感語音識別實(shí)驗(yàn)的結(jié)果比較 |
6.4 本章小結(jié) |
第七章 基于隱馬爾科夫模型的語音合成與情感語音合成 |
7.1 引言 |
7.2 基于HMM的語音合成系統(tǒng) |
7.2.1 基于HMM的語音合成系統(tǒng)的基本結(jié)構(gòu) |
7.2.2 基于HMM的語音合成系統(tǒng)實(shí)驗(yàn)平臺的搭建 |
7.2.3 實(shí)驗(yàn)結(jié)果及分析 |
7.3 基于HMM的情感語音合成系統(tǒng)的實(shí)現(xiàn) |
7.3.1 基于HMM的情感語音合成系統(tǒng)的基本結(jié)構(gòu) |
7.3.2 實(shí)驗(yàn)結(jié)果及分析 |
7.4 本章小結(jié) |
第八章 總結(jié)與展望 |
8.1 總結(jié) |
8.2 展望 |
參考文獻(xiàn) |
致謝 |
攻讀博士期間已發(fā)表的學(xué)術(shù)論文 |
攻讀博士期間的科研工作及成果 |
四、基于小波變換和Teager能量算子濁音段提?。ㄕ撐膮⒖嘉墨I(xiàn))
- [1]基于聲音傳感器的目標(biāo)識別技術(shù)研究[D]. 查琳. 沈陽理工大學(xué), 2020(08)
- [2]機(jī)載環(huán)境下的語音識別關(guān)鍵技術(shù)的研究[D]. 吳鵬. 安徽工業(yè)大學(xué), 2019(02)
- [3]低信噪比環(huán)境下語音端點(diǎn)檢測方法的研究[D]. 夏令祥. 中國礦業(yè)大學(xué), 2019(09)
- [4]基于多特征融合的語音端點(diǎn)檢測方法研究[D]. 朱春利. 上海大學(xué), 2019(03)
- [5]語音情感特征提取及其降維方法綜述[J]. 劉振燾,徐建平,吳敏,曹衛(wèi)華,陳略峰,丁學(xué)文,郝曼,謝橋. 計(jì)算機(jī)學(xué)報(bào), 2018(12)
- [6]改進(jìn)的跨語種說話人確認(rèn)方法的研究[J]. 朱虹,金小峰. 延邊大學(xué)學(xué)報(bào)(自然科學(xué)版), 2017(02)
- [7]基于小波包變換的說話人識別特征參數(shù)提取算法研究[D]. 王磊. 湖南大學(xué), 2014(04)
- [8]一種低信噪比環(huán)境下的基音檢測方法[J]. 王耀琦,王小鵬,張忠林. 鐵道學(xué)報(bào), 2012(02)
- [9]基于小波域Teager能量熵的音符起點(diǎn)檢測算法研究[D]. 馮亞楠. 天津大學(xué), 2012(08)
- [10]情感語音識別與合成的研究[D]. 孫穎. 太原理工大學(xué), 2011(10)