亚洲第一色欲AV|丰满无码人妻热妇无码喷水区|日韩成人一区二区|情五月亚洲天堂网

安全資訊

專題·人工智能安全 | 國產(chǎn)大模型的數(shù)據(jù)安全風(fēng)險(xiǎn)與技術(shù)治理路徑

| 北京師范大學(xué) 郭宇 王悅;香港大學(xué) 徐仕遠(yuǎn)

隨著全球人工智能技術(shù)的加速迭代,國產(chǎn)大模型在過去一年實(shí)現(xiàn)了跨越式突破。以DeepSeek、豆包等為代表的具有自主知識產(chǎn)權(quán)的高質(zhì)量國產(chǎn)大模型不斷涌現(xiàn),標(biāo)志著我國在千億級參數(shù)模型研發(fā)領(lǐng)域達(dá)到國際先進(jìn)水平。2025年《政府工作報(bào)告》明確提出:持續(xù)推進(jìn)人工智能+’行動,將數(shù)字技術(shù)與制造優(yōu)勢、市場優(yōu)勢更好的結(jié)合,支持大模型廣泛應(yīng)用。因此,基于國產(chǎn)大模型的創(chuàng)新應(yīng)用迎來了前所未有的發(fā)展機(jī)遇。

然而,國產(chǎn)大模型在能力飛速躍遷的同時(shí),也面臨著嚴(yán)峻的數(shù)據(jù)安全挑戰(zhàn)。一方面,訓(xùn)練數(shù)據(jù)泄露、后門攻擊、對抗樣本攻擊等風(fēng)險(xiǎn)在大模型中普遍存在。另一方面,由于國產(chǎn)大模型所處的技術(shù)生態(tài)、應(yīng)用場景和數(shù)據(jù)環(huán)境等獨(dú)特背景,可能面臨數(shù)據(jù)合規(guī)、認(rèn)知侵蝕等更為特殊、復(fù)雜的數(shù)據(jù)安全風(fēng)險(xiǎn)。以教育領(lǐng)域的大模型為例,受攻擊的大模型可能生成含有知識性錯誤的內(nèi)容,模型產(chǎn)生的價(jià)值偏差還可能扭曲學(xué)生的認(rèn)知。國產(chǎn)大模型在醫(yī)療、金融等垂直領(lǐng)域的應(yīng)用也面臨類似的數(shù)據(jù)安全風(fēng)險(xiǎn),不僅威脅技術(shù)應(yīng)用效能,更深層次地侵蝕著智能時(shí)代的認(rèn)知安全防線。因此,唯有實(shí)現(xiàn)技術(shù)創(chuàng)新與安全防護(hù)的動態(tài)平衡,方能在全球人工智能治理格局中確立中國方案的話語權(quán)。

 

一、數(shù)據(jù)安全風(fēng)險(xiǎn)

數(shù)據(jù)作為人工智能技術(shù)發(fā)展的基礎(chǔ)要素,在其全生命周期中面臨著多重安全風(fēng)險(xiǎn)。具體而言,國產(chǎn)大模型的數(shù)據(jù)安全風(fēng)險(xiǎn)主要體現(xiàn)在三個核心維度:數(shù)據(jù)泄露風(fēng)險(xiǎn)威脅著信息資產(chǎn)的機(jī)密性,惡意數(shù)據(jù)風(fēng)險(xiǎn)動搖著算法模型的可靠性,數(shù)據(jù)合規(guī)風(fēng)險(xiǎn)挑戰(zhàn)著技術(shù)應(yīng)用的合法性。這三重風(fēng)險(xiǎn)的疊加效應(yīng),不但侵蝕著用戶對國產(chǎn)大模型應(yīng)用系統(tǒng)的信任基礎(chǔ),還可能對人工智能技術(shù)的可持續(xù)發(fā)展構(gòu)成系統(tǒng)性威脅。

(一)數(shù)據(jù)泄露風(fēng)險(xiǎn)

當(dāng)前,國產(chǎn)大模型的數(shù)據(jù)泄漏風(fēng)險(xiǎn)主要集中在三個核心環(huán)節(jié)。

一是訓(xùn)練數(shù)據(jù)泄露風(fēng)險(xiǎn),隱私信息被逆運(yùn)算出來。大模型訓(xùn)練高度依賴海量數(shù)據(jù)優(yōu)化模型表現(xiàn),而訓(xùn)練數(shù)據(jù)通常包含著隱私敏感信息。例如,教育大模型的訓(xùn)練數(shù)據(jù)可能涉及教材、答題記錄、師生課堂行為等內(nèi)容,這些信息存在被出來的風(fēng)險(xiǎn)。若缺乏保護(hù)措施,攻擊者可通過成員推斷攻擊,利用模型輸出反推某條數(shù)據(jù)是否在訓(xùn)練集中。如果訓(xùn)練數(shù)據(jù)包含師生的個人信息,攻擊者甚至可以通過多次攻擊重構(gòu)個體身份,侵犯用戶隱私。

二是交互信息泄露風(fēng)險(xiǎn),大模型對話不再安全。大模型應(yīng)用部署所依賴的云計(jì)算平臺、微服務(wù)架構(gòu)和數(shù)據(jù)庫等基礎(chǔ)設(shè)施一旦存在安全漏洞,就可能成為攻擊的突破口。在教育大模型的應(yīng)用中,學(xué)生通常會向模型輸入包含個人隱私的個性化問題,而模型生成的解題思路和作文批改等內(nèi)容也可能涉及敏感信息。若傳輸鏈路或服務(wù)器等基礎(chǔ)設(shè)施存在安全漏洞,攻擊者便可截獲敏感交互信息,造成數(shù)據(jù)泄露。此外,攻擊者也可以通過提示注入操控模型輸出,誘導(dǎo)其泄露后臺指令或內(nèi)部知識庫內(nèi)容。

三是模型參數(shù)竊取風(fēng)險(xiǎn),模型被惡意復(fù)制。模型參數(shù)是大模型的核心資產(chǎn),以教育大模型為例,其參數(shù)中往往沉淀著海量教學(xué)方法、知識點(diǎn)關(guān)聯(lián)等高質(zhì)量信息。若缺乏保護(hù)措施,攻擊者可通過模型逆向工程,反復(fù)查詢模型,推測模型參數(shù)結(jié)構(gòu)并復(fù)現(xiàn)功能相似的山寨模型。然而,更隱蔽的風(fēng)險(xiǎn)在于模型參數(shù)中隱含的訓(xùn)練數(shù)據(jù)特征,可能間接導(dǎo)致數(shù)據(jù)泄漏。

(二)惡意數(shù)據(jù)風(fēng)險(xiǎn)

國產(chǎn)大模型面臨的惡意數(shù)據(jù)風(fēng)險(xiǎn)更為隱蔽,主要包括兩類威脅路徑。

一是訓(xùn)練數(shù)據(jù)投毒風(fēng)險(xiǎn),扭曲模型認(rèn)知。數(shù)據(jù)投毒風(fēng)險(xiǎn)源自大模型訓(xùn)練數(shù)據(jù)的開放性與質(zhì)量控制失衡。目前主流的訓(xùn)練數(shù)據(jù)源自公開數(shù)據(jù)、網(wǎng)絡(luò)文本及用戶生成內(nèi)容,其多源異構(gòu)特性使得數(shù)據(jù)清洗難度呈指數(shù)級增長。攻擊者可以利用數(shù)據(jù)監(jiān)管盲區(qū),通過投毒、后門攻擊等方式,定向注入誤導(dǎo)性內(nèi)容,進(jìn)而實(shí)現(xiàn)價(jià)值觀滲透。在教育領(lǐng)域,數(shù)據(jù)投毒將引發(fā)三重連鎖反應(yīng)。首先,直接導(dǎo)致模型輸出知識性錯誤。其次,隱性偏見會扭曲模型價(jià)值判斷基準(zhǔn),可能在學(xué)生認(rèn)知形成的關(guān)鍵期產(chǎn)生意識形態(tài)塑造風(fēng)險(xiǎn)。最后,引發(fā)系統(tǒng)性信任危機(jī),嚴(yán)重制約人工智能技術(shù)應(yīng)用效能。

二是對抗樣本攻擊風(fēng)險(xiǎn),威脅模型決策可靠性。對抗樣本攻擊主要是通過挖掘大模型特征空間的魯棒性缺陷以及抗干擾能力不足,惡意影響大模型的決策。攻擊者利用模型決策邊界脆弱性,通過對輸入數(shù)據(jù)施加人類難以察覺的擾動,實(shí)現(xiàn)在特征空間形成誤導(dǎo)性映射效應(yīng)。以教育領(lǐng)域?yàn)槔?,教育大模型的多模態(tài)輸入特性加劇了多模態(tài)脆弱性,尤其在作業(yè)批改、語言學(xué)習(xí)等開放教學(xué)場景中,存在對抗樣本輸入導(dǎo)致大模型錯誤輸出的風(fēng)險(xiǎn),使學(xué)生在無意識中接受錯誤邏輯。

(三)數(shù)據(jù)合規(guī)風(fēng)險(xiǎn)

盡管數(shù)據(jù)治理技術(shù)與監(jiān)管框架日益完善,國產(chǎn)大模型仍面臨著兩個關(guān)鍵的數(shù)據(jù)合規(guī)風(fēng)險(xiǎn)。

一是數(shù)據(jù)收集違規(guī)風(fēng)險(xiǎn)。國產(chǎn)大模型在發(fā)展過程中面臨的數(shù)據(jù)收集違規(guī)風(fēng)險(xiǎn),源于數(shù)據(jù)隱私保護(hù)法規(guī)體系與企業(yè)技術(shù)發(fā)展需求之間的不匹配。國內(nèi)數(shù)據(jù)合規(guī)監(jiān)管框架仍處于動態(tài)完善階段,部分企業(yè)對數(shù)據(jù)合規(guī)邊界理解模糊,加之大模型訓(xùn)練需海量多源數(shù)據(jù)支撐,企業(yè)在數(shù)據(jù)采集環(huán)節(jié)存在未經(jīng)充分授權(quán)爬取公開數(shù)據(jù)、違規(guī)使用隱私信息等問題。

二是生成內(nèi)容合規(guī)風(fēng)險(xiǎn)。國產(chǎn)大模型生成內(nèi)容的合規(guī)性問題,根源在于技術(shù)邏輯缺陷、數(shù)據(jù)治理不足與外部環(huán)境復(fù)雜性的疊加。國產(chǎn)大模型的訓(xùn)練數(shù)據(jù)存在內(nèi)在偏差和污染風(fēng)險(xiǎn),例如,訓(xùn)練語料中可能混雜未篩選的錯誤價(jià)值導(dǎo)向內(nèi)容。此外,算法設(shè)計(jì)的局限性使得模型對復(fù)雜場景的合規(guī)性檢測能力不足。若過濾機(jī)制僅依賴簡單的關(guān)鍵詞屏蔽,則難以應(yīng)對隱蔽性強(qiáng)的有害內(nèi)容生成檢測需求。大模型生成的幻覺數(shù)據(jù)可能帶來價(jià)值觀沖突和公眾信任度下降等負(fù)面影響。

 

二、技術(shù)防御對策

針對國產(chǎn)大模型應(yīng)用所面臨的數(shù)據(jù)泄露、惡意攻擊與合規(guī)失控等安全挑戰(zhàn),需要在數(shù)據(jù)采集到模型部署的全流程中,構(gòu)建覆蓋全生命周期、多維度的技術(shù)治理體系,筑牢國產(chǎn)大模型的安全防線。

(一)數(shù)據(jù)采集與預(yù)處理階段

數(shù)據(jù)采集與預(yù)處理作為國產(chǎn)大模型數(shù)據(jù)安全治理的基礎(chǔ),其風(fēng)險(xiǎn)控制需要聚焦兩個環(huán)節(jié)。

一是構(gòu)建數(shù)據(jù)合規(guī)準(zhǔn)入機(jī)制。針對國產(chǎn)大模型訓(xùn)練數(shù)據(jù)面臨的合規(guī)性挑戰(zhàn),需要建立嚴(yán)格的準(zhǔn)入機(jī)制。首先,構(gòu)建分類分級的數(shù)據(jù)采集標(biāo)準(zhǔn),依據(jù)《數(shù)據(jù)安全法》和《個人信息保護(hù)法》等法律法規(guī)制定行業(yè)數(shù)據(jù)分級指南,對教育、醫(yī)療等領(lǐng)域數(shù)據(jù)進(jìn)行敏感程度等級劃分,明確不同層級數(shù)據(jù)的采集范圍與處理權(quán)限。通過精細(xì)化分類管理,避免超范圍采集高敏數(shù)據(jù),降低數(shù)據(jù)濫用風(fēng)險(xiǎn)。其次,考慮使用技術(shù)手段動態(tài)評估數(shù)據(jù)合規(guī)性,利用人工智能技術(shù)自動檢測數(shù)據(jù)集中的未脫敏信息和非法跨境傳輸行為,降低企業(yè)因監(jiān)管滯后導(dǎo)致的被動整改成本。

二是建設(shè)訓(xùn)練數(shù)據(jù)安全治理體系。針對國產(chǎn)大模型訓(xùn)練數(shù)據(jù)面臨的投毒攻擊、對抗樣本植入等新型安全威脅,需建立覆蓋預(yù)處理、動態(tài)檢測、深度清洗的多級防御體系。首先,依據(jù)《生成式人工智能服務(wù)管理暫行辦法》等關(guān)于數(shù)據(jù)質(zhì)量安全的政策要求,制定行業(yè)標(biāo)準(zhǔn),明確投毒攻擊、對抗樣本植入等安全威脅的防御基線。其次,針對攻防動態(tài)性的特點(diǎn),組建政產(chǎn)學(xué)研用數(shù)據(jù)安全聯(lián)盟,搭建惡意樣本特征庫共享平臺,持續(xù)對訓(xùn)練數(shù)據(jù)進(jìn)行有效評估清洗,保障訓(xùn)練數(shù)據(jù)的可信可用。

(二)模型預(yù)訓(xùn)練與微調(diào)階段

模型預(yù)訓(xùn)練與微調(diào)作為國產(chǎn)大模型安全防御的關(guān)鍵階段,需要從兩方面入手構(gòu)建數(shù)據(jù)安全體系。

一是應(yīng)用隱私增強(qiáng)訓(xùn)練框架。針對國產(chǎn)大模型訓(xùn)練中的數(shù)據(jù)隱私泄露風(fēng)險(xiǎn),需要建立多層次防護(hù)架構(gòu)。首先,參考《人工智能安全標(biāo)準(zhǔn)化白皮書》的相關(guān)要求,從算法層面制定隱私增強(qiáng)訓(xùn)練框架的行業(yè)標(biāo)準(zhǔn),明確數(shù)據(jù)隱私保護(hù)基線。其次,硬件級防護(hù)也是可采用的安全訓(xùn)練框架。參照《面向大模型訓(xùn)練與推理數(shù)據(jù)保護(hù)的可信執(zhí)行環(huán)境技術(shù)要求》的相關(guān)建議,通過部署基于硬件加密的可信執(zhí)行環(huán)境,對敏感數(shù)據(jù)和關(guān)鍵操作進(jìn)行安全沙箱隔離,防止惡意節(jié)點(diǎn)竊取中間計(jì)算結(jié)果。

二是加強(qiáng)魯棒性強(qiáng)化設(shè)計(jì)。針對國產(chǎn)大模型在對抗環(huán)境中的脆弱性,需要建立動態(tài)訓(xùn)練、多維評估和迭代優(yōu)化的閉環(huán)增強(qiáng)體系。首先,在訓(xùn)練階段注入多類型對抗樣本,例如文本字符擾動、圖像幾何畸變、音頻頻譜遮蔽等,構(gòu)建動態(tài)對抗訓(xùn)練集,通過迭代式對抗攻擊-防御循環(huán)優(yōu)化模型參數(shù)魯棒性。此外,通過構(gòu)建魯棒性評估與迭代優(yōu)化體系,可以提升模型在對抗環(huán)境下的綜合穩(wěn)定性,建立涵蓋多類別攻擊場景的標(biāo)準(zhǔn)化測試集,自動化測試得到量化模型魯棒性指標(biāo),并反饋至訓(xùn)練環(huán)節(jié)進(jìn)行防御強(qiáng)化。

(三)部署與應(yīng)用監(jiān)控階段

部署與應(yīng)用監(jiān)控階段作為大模型安全治理的最后防線,應(yīng)從兩個關(guān)鍵階段入手實(shí)現(xiàn)管控閉環(huán)。

一是應(yīng)用實(shí)時(shí)風(fēng)險(xiǎn)感知策略。針對國產(chǎn)大模型交互接口面臨的模型竊取、數(shù)據(jù)泄露等安全風(fēng)險(xiǎn),需建立實(shí)時(shí)風(fēng)險(xiǎn)感知策略。首先,構(gòu)建多維度異常行為智能分析引擎,在接口部署異常查詢檢測模塊,分析請求多維特點(diǎn),并根據(jù)風(fēng)險(xiǎn)指數(shù)自動匹配彈性應(yīng)急響應(yīng)策略,實(shí)現(xiàn)入口處的實(shí)時(shí)風(fēng)險(xiǎn)感知。同時(shí),依托虛擬化攻防靶場,定期開展新型攻擊模擬推演,動態(tài)更新防御策略知識庫。

二是部署生成內(nèi)容合規(guī)引擎。針對國產(chǎn)大模型的內(nèi)容安全風(fēng)險(xiǎn),需建立多維度的防御架構(gòu)。首先,需要銜接《人工智能生成合成內(nèi)容標(biāo)識辦法》《新一代人工智能倫理規(guī)范》等人工智能倫理規(guī)范的要求,將核心價(jià)值觀融入模型訓(xùn)練全流程。其次,考慮整合敏感信息特征庫與語義風(fēng)險(xiǎn)識別模型,實(shí)現(xiàn)高風(fēng)險(xiǎn)表述的實(shí)時(shí)攔截。最后,人機(jī)協(xié)同的高風(fēng)險(xiǎn)決策機(jī)制同樣重要,將高風(fēng)險(xiǎn)內(nèi)容自動分配至人工審核,對自動審核的結(jié)果進(jìn)行查漏補(bǔ)缺,并利用人工審核結(jié)果不斷改進(jìn)自動審核的漏洞。

 

三、結(jié)

隨著國產(chǎn)大模型在技術(shù)能力與應(yīng)用場景上的突破,其數(shù)據(jù)安全風(fēng)險(xiǎn)治理已從單純的技術(shù)攻防升級為系統(tǒng)性生態(tài)構(gòu)建的命題。當(dāng)前,數(shù)據(jù)泄露、惡意攻擊與合規(guī)失控等問題不僅暴露了國產(chǎn)大模型技術(shù)鏈的脆弱性,更凸顯出技術(shù)發(fā)展與治理能力之間的鴻溝。國產(chǎn)大模型的數(shù)據(jù)安全防御需突破事后修復(fù)的局限,向頂層設(shè)計(jì)的主動免疫演進(jìn)。現(xiàn)有數(shù)據(jù)安全治理多聚焦于事后追責(zé),而國產(chǎn)大模型的復(fù)雜性要求治理框架向以事前預(yù)防為起點(diǎn)的全周期延伸。國產(chǎn)大模型的安全治理不能止步于技術(shù)合規(guī),在確保算法可靠性的基礎(chǔ)上,更需要回歸以人為本的價(jià)值錨點(diǎn),構(gòu)建法律規(guī)制完善、行業(yè)標(biāo)準(zhǔn)動態(tài)適配、跨部門協(xié)同聯(lián)動的多維度監(jiān)管生態(tài)。2025人工智能+”行動的落地,既需技術(shù)側(cè)攻堅(jiān)難題,亦需在治理側(cè)回答為誰而治的價(jià)值之問。唯有以安全為基、以創(chuàng)新為脈、以人文為魂,方能在全球人工智能競爭與合作中,塑造兼具競爭力與責(zé)任感的可持續(xù)發(fā)展智能方案。

(本文刊登于《中國信息安全》雜志2025年第3期)

 

 

 

服務(wù)熱線

138-6598-3726

產(chǎn)品和特性

價(jià)格和優(yōu)惠

安徽靈狐網(wǎng)絡(luò)公眾號

微信公眾號