螞蟻數(shù)科提出創(chuàng)新跨域微調(diào)框架ScaleOT 入選全球AI頂會AAAI 2025觀點

                  觀察君 2025-02-26 14:43
                  分享到:
                  導(dǎo)讀

                  近日,在全球人工智能頂級學(xué)術(shù)會議AAAI 2025期間,由螞蟻數(shù)科、浙江大學(xué)、利物浦大學(xué)和華東師范大學(xué)聯(lián)合團隊提出了一種創(chuàng)新的跨域微調(diào)(offsite-tuning)框架——ScaleOT,該框架可實現(xiàn)在模型性能無損的前提下,將隱私保護(hù)效果提升50%。與知識蒸餾技術(shù)相比,Scale OT顯著降低了90%的算力消耗,為百億級參數(shù)模型的跨域微調(diào)提供了一種高效、輕量化的解決方案。

                  在具體業(yè)務(wù)場景中應(yīng)用大模型時,模型微調(diào)是關(guān)鍵步驟。然而,傳統(tǒng)微調(diào)方法面臨兩難:將數(shù)據(jù)上傳給模型方,可能會引發(fā)數(shù)據(jù)隱私和安全風(fēng)險;而將完整模型交給數(shù)據(jù)方則可能會導(dǎo)致模型知識產(chǎn)權(quán)泄漏,并增加微調(diào)模型遭受攻擊的風(fēng)險。

                  近日,在全球人工智能頂級學(xué)術(shù)會議AAAI 2025期間,由螞蟻數(shù)科、浙江大學(xué)、利物浦大學(xué)和華東師范大學(xué)聯(lián)合團隊提出了一種創(chuàng)新的跨域微調(diào)(offsite-tuning)框架——ScaleOT,該框架可實現(xiàn)在模型性能無損的前提下,將隱私保護(hù)效果提升50%。與知識蒸餾技術(shù)相比,Scale OT顯著降低了90%的算力消耗,為百億級參數(shù)模型的跨域微調(diào)提供了一種高效、輕量化的解決方案。這篇論文以其創(chuàng)新性入選了全球AI頂會AAAI的oral論文。據(jù)了解,本屆AAAI大會共收到近13000篇論文,被選中做口頭報告的論文比例僅4.6%。

                  為同時保護(hù)模型產(chǎn)權(quán)與數(shù)據(jù)隱私,目前業(yè)內(nèi)采用的主流方案是"跨域微調(diào)"。跨域微調(diào)是一種大模型隱私保護(hù)訓(xùn)練方法,它通過有損壓縮技術(shù)將大模型轉(zhuǎn)換為仿真器(Emulator),數(shù)據(jù)持有方基于仿真器訓(xùn)練適配器(Adapter)并返回給大模型,從而完成調(diào)優(yōu)。在此過程中,由于數(shù)據(jù)和模型均未出域,該方法同時保護(hù)了模型方與數(shù)據(jù)方的隱私。然而跨域微調(diào)往往需要犧牲模型的性能或者付出高昂算力成本。

                  當(dāng)前主流的跨域微調(diào)方法存在顯著局限性:其一,其“均勻抽積木”式的處理方式容易造成模型關(guān)鍵層的缺失,從而導(dǎo)致模型性能顯著下降;其二,若采用蒸餾技術(shù)來彌補性能損失,計算成本幾乎與重新訓(xùn)練一個中型模型相當(dāng)。此外,現(xiàn)有方法在隱私保護(hù)方面缺乏靈活性,難以根據(jù)不同場景需求動態(tài)調(diào)整隱私保護(hù)強度。

                  據(jù)螞蟻數(shù)科技術(shù)團隊介紹,ScaleOT提出了三大創(chuàng)新思路,有效地實現(xiàn)了在模型性能與隱私安全之間的平衡。首先是對大模型智能層的重要性進(jìn)行評估,用強化學(xué)習(xí)給大模型做掃描,自動識別哪些層對當(dāng)前任務(wù)最關(guān)鍵,動態(tài)保留模型“核心層”,有效降低模型性能損耗。其次,對保留的模型原始層做“打碼”,讓攻擊者無法通過中間層復(fù)原原始模型,可以在性能幾乎無損的情況下,顯著提升隱私保護(hù)強度。最后,該框架還可以根據(jù)不同場景需求進(jìn)行靈活組裝,實現(xiàn)隱私強度可調(diào)節(jié)。

                  解決數(shù)據(jù)和模型的隱私安全問題,是大模型在產(chǎn)業(yè)界尤其是金融行業(yè)落地的重要課題。螞蟻數(shù)科技術(shù)團隊這一創(chuàng)新的大模型隱私微調(diào)算法,為大模型隱私保護(hù)提供了新穎的思路與解決方案。目前,該算法已經(jīng)融入螞蟻數(shù)科旗下的摩斯大模型隱私保護(hù)產(chǎn)品中,并已成為國內(nèi)首批通過信通院大模型可信執(zhí)行環(huán)境產(chǎn)品專項測試的產(chǎn)品之一。

                  螞蟻數(shù)科 AAAI 2025
                  分享到:

                  1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;
                  2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
                  3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補充。