永利赌场p6-永利赌场至尊-大发888 zhidu

新聞中心

講準(zhǔn)字【2025】第227號(hào):Zapformer:模型架構(gòu)的最新進(jìn)展

發(fā)布時(shí)間:2025-10-16 瀏覽量:

講座報(bào)告主題:Zapformer:模型架構(gòu)的最新進(jìn)展
專(zhuān)家姓名:Daniel Povey
日期:2025-10-18 時(shí)間:09:15
地點(diǎn):江蘇鎮(zhèn)江明都大飯店商務(wù)樓二樓華怡廳
主辦單位:計(jì)算機(jī)科學(xué)與通信工程學(xué)院


主講簡(jiǎn)介:Daniel Povey 博士是著名開(kāi)源語(yǔ)音識(shí)別工具 Kaldi 的提出者和主要維護(hù)者,被業(yè)界稱(chēng)為 “Kaldi 之父”。Kaldi 項(xiàng)目在學(xué)術(shù)界和工業(yè)界都極具影響力,廣泛應(yīng)用于各研究機(jī)構(gòu)和國(guó)內(nèi)外知名公司,有力地推動(dòng)了智能語(yǔ)音處理的產(chǎn)業(yè)化。Daniel Povey 在智能語(yǔ)音處理的技術(shù)上做出了非常多的貢獻(xiàn)。他首次將序列區(qū)分性訓(xùn)練方法應(yīng)用于語(yǔ)音識(shí)別,他提出的 LF-MMI 建模方法至今仍為商用語(yǔ)音識(shí)別系統(tǒng)普遍使用的標(biāo)準(zhǔn)技術(shù)。他也是將深度學(xué)習(xí)用于語(yǔ)音識(shí)別領(lǐng)域的重要引領(lǐng)者,在語(yǔ)音識(shí)別中推廣了時(shí)延神經(jīng)網(wǎng)絡(luò),配合 LF-MMI 訓(xùn)練,是 2015-2020 年學(xué)術(shù)界和工業(yè)界普遍使用的最佳組合。他還是深度學(xué)習(xí)在聲紋識(shí)別領(lǐng)域的重要引領(lǐng)者,提出的 X-vectors 方法是第一個(gè)取得成功并被普遍應(yīng)用的深度學(xué)習(xí)說(shuō)話(huà)人識(shí)別方法,廣泛應(yīng)用于工業(yè)界。他在國(guó)際頂級(jí)會(huì)議和期刊發(fā)表論文200多篇,谷歌學(xué)術(shù)引用近 52000 次,h-index 70,擔(dān)任 Signal Processing Letters 的終身副主編。研究專(zhuān)長(zhǎng):語(yǔ)音識(shí)別和聲學(xué)建模。


主講內(nèi)容簡(jiǎn)介:我們此前發(fā)布的Zipformer架構(gòu)在語(yǔ)音識(shí)別應(yīng)用中達(dá)到了業(yè)界領(lǐng)先的性能水平,但其應(yīng)用受限于模型復(fù)雜性和訓(xùn)練流程的繁瑣性。新推出的"Zapformer"架構(gòu)旨在簡(jiǎn)化Zipformer,并采用比以往更大的數(shù)據(jù)集進(jìn)行架構(gòu)調(diào)優(yōu)和訓(xùn)練方法改進(jìn)。在A(yíng)SR應(yīng)用中,Zapformer的性能顯著優(yōu)于Zipformer,而Zipformer本身也優(yōu)于Conformer或Transformer。主要改進(jìn)包括:移除隨機(jī)化元素(如丟棄和層丟棄),用輔助損失函數(shù)替代其穩(wěn)定性和泛化促進(jìn)效果。


歡迎師生參加!

專(zhuān)家姓名 Daniel Povey 講座時(shí)間 2025-10-18 09:15
講座地點(diǎn) 江蘇鎮(zhèn)江明都大飯店商務(wù)樓二樓華怡廳