(資料圖片)
企查查APP顯示,近日,阿里巴巴達摩院(杭州)科技有限公司“聲紋特征提取方法、說話人識別方法、模型訓(xùn)練方法及裝置”專利公開。企查查專利摘要顯示,主要技術(shù)方案包括:獲取包含語音的音頻段;提取音頻段的頻譜特征輸入聲紋提取模型。其中聲紋提取模型的第一卷積處理層包括一個以上串連的第一卷積處理模塊,第一卷積處理模塊包括多個串連的基礎(chǔ)模塊;基礎(chǔ)模塊對輸入該基礎(chǔ)模塊的特征進行降維處理,得到第一特征;對第一特征進行至少一種粒度的池化處理,并對池化處理的結(jié)果進行卷積處理,得到第二特征;以及對第一特征進行卷積處理得到第三特征;對第二特征和第三特征進行融合處理,得到該基礎(chǔ)模塊輸出的特征;池化層對第一卷積處理層輸出的特征進行池化處理,得到聲紋特征。本申請能夠提升聲紋特征提取的準(zhǔn)確性。
標(biāo)簽:















