騰訊公布大語(yǔ)言模型訓(xùn)練專利 可提高模型的準(zhǔn)確性觀點(diǎn)

天眼查App顯示,2月7日,騰訊科技(深圳)有限公司申請(qǐng)的“大語(yǔ)言模型的訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)”專利公布。
天眼查App顯示,2月7日,騰訊科技(深圳)有限公司申請(qǐng)的“大語(yǔ)言模型的訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)”專利公布。
摘要顯示,在該方法中,通過在大語(yǔ)言模型的訓(xùn)練過程中引入第一摘要文本和第二摘要文本,為模型訓(xùn)練提供了更多可學(xué)習(xí)信息,同時(shí)由于第一摘要文本和第二摘要文本包含的信息量不同,且第一摘要文本中包含正確語(yǔ)句和錯(cuò)誤語(yǔ)句,通過對(duì)同一樣本文本的兩個(gè)不同摘要文本進(jìn)行對(duì)比學(xué)習(xí),并區(qū)分學(xué)習(xí)第一摘要文本中的正確語(yǔ)句和錯(cuò)誤語(yǔ)句,避免了由于摘要文本單一而導(dǎo)致的模型過擬合和生成不準(zhǔn)確等問題,不僅提高了模型的泛化性能,還提高了模型的準(zhǔn)確性。
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。