滿(mǎn)血守護(hù)DeepSeek,360率先推出DS大模型安全方案
當(dāng)前,以DeepSeek為代表的國(guó)產(chǎn)大模型發(fā)展勢(shì)頭迅猛,正重塑全球人工智能技術(shù)格局。然而,其背后潛藏的系統(tǒng)漏洞、數(shù)據(jù)安全、內(nèi)容風(fēng)險(xiǎn)等隱患也頻頻敲響警鐘,不僅對(duì)大模型自身的安全性提出了更高的要求,也對(duì)整個(gè)行業(yè)的規(guī)范發(fā)展和治理構(gòu)成嚴(yán)峻的考驗(yàn)。安全不再是附加標(biāo)簽,而是大模型引領(lǐng)數(shù)智時(shí)代的原生屬性。
基于此,360集團(tuán)正式推出DS大模型安全解決方案,覆蓋模型訓(xùn)練、推理、運(yùn)營(yíng)等大模型落地應(yīng)用全過(guò)程,滿(mǎn)血守護(hù)DeepSeek發(fā)展,促進(jìn)國(guó)產(chǎn)大模型企業(yè)向安全、向善、可信、可控的方向發(fā)展,為全球人工智能技術(shù)治理提供了可借鑒的“中國(guó)方案”。
DeepSeek發(fā)展面臨五大安全挑戰(zhàn)
DeepSeek以其強(qiáng)大的數(shù)據(jù)處理能力、精準(zhǔn)的算法模型以及深度的用戶(hù)洞察,重塑了AI領(lǐng)域的游戲規(guī)則。然而,以DeepSeek為代表的大模型作為新質(zhì)生產(chǎn)力推動(dòng)者的同時(shí),也面臨傳統(tǒng)網(wǎng)絡(luò)安全與新型安全風(fēng)險(xiǎn)交織的雙重挑戰(zhàn)。具體而言:
系統(tǒng)安全
此前DeepSeek遭遇網(wǎng)絡(luò)攻擊導(dǎo)致新用戶(hù)注冊(cè)受阻的事件就暴露了大模型系統(tǒng)安全方面的脆弱性。DeepSeek運(yùn)行所依賴(lài)的硬件設(shè)施、軟件框架、操作系統(tǒng)等基礎(chǔ)層以及提示工程、緩存、向量庫(kù)等訓(xùn)練和推理過(guò)程中使用的生態(tài)鏈工具共同構(gòu)成龐大復(fù)雜的系統(tǒng),系統(tǒng)中每個(gè)環(huán)節(jié)的缺陷都可能被惡意利用,加之開(kāi)發(fā)運(yùn)維過(guò)程中存在的不當(dāng)使用和濫用等行為,技術(shù)脆弱性與人為風(fēng)險(xiǎn)因素相互疊加,使得大模型面臨嚴(yán)峻的系統(tǒng)安全風(fēng)險(xiǎn)。
數(shù)據(jù)安全
數(shù)據(jù)在大模型各階段流動(dòng)創(chuàng)造價(jià)值,也帶來(lái)數(shù)據(jù)泄漏、篡改、濫用等各類(lèi)隱私及合規(guī)風(fēng)險(xiǎn)。在數(shù)據(jù)收集訓(xùn)練階段,可能使用未經(jīng)授權(quán)版本數(shù)據(jù)訓(xùn)練,導(dǎo)致侵權(quán);在部署能力及開(kāi)發(fā)階段,使用不同供應(yīng)商的服務(wù)時(shí),可能存在黑盒以提取大模型記憶隱私數(shù)據(jù);在對(duì)外提供服務(wù)時(shí),可能存在API濫用隱患問(wèn)題;在推理使用階段,用戶(hù)交互數(shù)據(jù)可能會(huì)泄漏或者濫用,違反隱私合規(guī)風(fēng)險(xiǎn)。
內(nèi)容安全
由于DeepSeek依賴(lài)大量公開(kāi)數(shù)據(jù)進(jìn)行訓(xùn)練,模型可能在無(wú)意中學(xué)習(xí)到不當(dāng)?shù)男袨椋敵龅膬?nèi)容可能會(huì)存在政治敏感、暴力違禁、色情低俗等不良內(nèi)容,造成信息污染和倫理風(fēng)險(xiǎn)。例如2024年,Google大模型Gemini被指無(wú)法正確生成白人歷史圖像,引發(fā)人們對(duì)人工智能存在種族歧視問(wèn)題的擔(dān)憂(yōu),google不得不停用該功能。
此外,不法分子通過(guò)數(shù)據(jù)投毒、對(duì)抗樣本、Prompt注入等手段,直接模型的“認(rèn)知邏輯”予以扭曲,進(jìn)而引發(fā)信息泄露、危害公共安全等嚴(yán)重后果。此前,用戶(hù)以偽裝成開(kāi)發(fā)者的指令,讓ChatGPT生成可被用于網(wǎng)絡(luò)犯罪的電腦病毒等危險(xiǎn)內(nèi)容,便引發(fā)公眾對(duì)大模型內(nèi)容安全的擔(dān)憂(yōu)。
幻覺(jué)問(wèn)題
大模型在運(yùn)行過(guò)程中,其自身的幻覺(jué)問(wèn)題往往會(huì)導(dǎo)致生成錯(cuò)誤信息,不僅造成虛假內(nèi)容的傳播,還極大降低了模型的可用性。2023年,美國(guó)一位資深律師因在訴訟中引用了ChatGPT提供的6個(gè)完全不存在的判例,而被罰款5000美元。除了司法領(lǐng)域,在金融、醫(yī)療、安全等垂直行業(yè)應(yīng)用中,大模型的幻覺(jué)問(wèn)題也可能存在誤導(dǎo)性建議、未經(jīng)驗(yàn)證的治療方法、錯(cuò)誤的防御策略等特定隱患,進(jìn)而誤導(dǎo)用戶(hù)判斷和決策。
行為失控
大模型發(fā)展過(guò)程中,Agent自主性不斷增強(qiáng),嵌入到業(yè)務(wù)工作流中,可能帶來(lái)新的安全隱患。Agent在復(fù)雜交互中因邏輯缺陷、環(huán)境誤判等原因,可能導(dǎo)致出現(xiàn)指令劫持、任務(wù)偏離、資源濫用等非預(yù)期行為,即執(zhí)行一些未經(jīng)授權(quán)的操作,或者導(dǎo)致系統(tǒng)資源的過(guò)度消耗,甚至引發(fā)系統(tǒng)崩潰等嚴(yán)重后果。
對(duì)癥下藥
首個(gè)DS版大模型安全解決方案上線
作為兼具數(shù)字安全和AI雙重能力的科技企業(yè),360很早開(kāi)始關(guān)注大模型安全風(fēng)險(xiǎn),提出“以模制模”理念,利用安全大模型來(lái)檢測(cè)和防范大模型可能出現(xiàn)的安全風(fēng)險(xiǎn)。
針對(duì)以DeepSeek為代表的國(guó)產(chǎn)大模型廠商面臨的安全挑戰(zhàn),360推出DS大模型安全解決方案,錨定系統(tǒng)安全、數(shù)據(jù)安全、內(nèi)容安全、幻覺(jué)問(wèn)題、行為失控五大挑戰(zhàn),對(duì)癥下藥,守護(hù)DeepSeek大模型訓(xùn)練、推理和運(yùn)營(yíng)全流程,為全球人工智能技術(shù)治理提供“中國(guó)方案”。
安全體檢員360智鑒
全天候掃描系統(tǒng)安全
針對(duì)大模型系統(tǒng)安全問(wèn)題,360智鑒以全鏈路、精細(xì)化和動(dòng)態(tài)進(jìn)化的檢測(cè)能力為核心,融合紅藍(lán)對(duì)抗思路和大模型自身技術(shù)優(yōu)勢(shì),為企業(yè)提供一套全面、智能、高效的大模型系統(tǒng)安全檢測(cè)方案,幫助企業(yè)在大模型上線前進(jìn)行全方位的安全評(píng)估,保障大模型系統(tǒng)的可靠性與業(yè)務(wù)穩(wěn)定性。
360智鑒覆蓋了從數(shù)據(jù)清洗、模型訓(xùn)練、模型推理、部署上線的整個(gè)生命周期中的系統(tǒng)安全檢測(cè),支持近百個(gè)組件的400+公開(kāi)漏洞檢測(cè),覆蓋RAG、Agent、prompt等場(chǎng)景的安全性分析,同時(shí),能夠快速集成新的安全檢測(cè)技術(shù)和方法,適應(yīng)不斷變化的安全威脅形勢(shì)。
數(shù)據(jù)倉(cāng)管員360智數(shù)
守護(hù)模型數(shù)據(jù)使用安全
針對(duì)DeepSeek面臨的數(shù)據(jù)安全挑戰(zhàn),360基于智能化數(shù)據(jù)安全管理平臺(tái)圍繞大模型資產(chǎn)梳理分級(jí)、模型邊界審查、模型數(shù)據(jù)風(fēng)險(xiǎn)監(jiān)測(cè)三大維度構(gòu)建閉環(huán)解決方案360智數(shù),全方位護(hù)航大模型數(shù)據(jù)全生命周期,守護(hù)大模型數(shù)據(jù)流動(dòng)安全,具體而言:
全鏈路數(shù)據(jù)資產(chǎn)梳理,通過(guò)AI動(dòng)態(tài)資產(chǎn)識(shí)別技術(shù),構(gòu)建大模型數(shù)據(jù)地圖。對(duì)大模型元數(shù)據(jù)分析,實(shí)現(xiàn)訓(xùn)練數(shù)據(jù)合規(guī)追溯、知識(shí)庫(kù)重要數(shù)據(jù)識(shí)別、模型數(shù)據(jù)隱私內(nèi)容檢測(cè)三重治理;
動(dòng)態(tài)數(shù)據(jù)分級(jí)分類(lèi),對(duì)大模型智能體數(shù)據(jù)知識(shí)庫(kù)、向量庫(kù)、開(kāi)放服務(wù)、記憶等位置進(jìn)行動(dòng)態(tài)分類(lèi)分級(jí),定期檢查合規(guī)性和區(qū)域合法性,保證用戶(hù)及企業(yè)使用安全;
智能風(fēng)險(xiǎn)監(jiān)測(cè),通過(guò)大模型對(duì)數(shù)據(jù)開(kāi)放及調(diào)用行為進(jìn)行監(jiān)測(cè),識(shí)別異常調(diào)用、算法漏洞、知識(shí)庫(kù)偏差,通過(guò)趨勢(shì)分析及預(yù)測(cè)實(shí)現(xiàn)異常發(fā)現(xiàn)-風(fēng)險(xiǎn)研判-流程處置,以模制模,全面防控隱私數(shù)據(jù)、重要數(shù)據(jù)泄漏及模型行為失控風(fēng)險(xiǎn)。
信息凈化器360智盾
全流程審核內(nèi)容安全
為保障大模型內(nèi)容安全,360智盾打造了全流程、多種類(lèi)、多模態(tài)、場(chǎng)景化的內(nèi)容安全體系,通過(guò)精準(zhǔn)的風(fēng)險(xiǎn)檢測(cè)、高效的內(nèi)容攔截與替代機(jī)制,幫助企業(yè)確保生成內(nèi)容的合法性、合規(guī)性與倫理可靠性,同時(shí)提升用戶(hù)體驗(yàn)和模型輸出的可信度。
360智盾支持100多類(lèi)風(fēng)險(xiǎn)內(nèi)容的識(shí)別過(guò)濾,涵蓋超200種對(duì)抗內(nèi)容防御機(jī)制,支持文本、音頻、圖片、視頻等多種模態(tài)的風(fēng)險(xiǎn)防護(hù),并通過(guò)平臺(tái)定制化場(chǎng)景風(fēng)控策略,滿(mǎn)足不同場(chǎng)景的風(fēng)控需求,檢測(cè)識(shí)別正確率超90%。
安全領(lǐng)航員360智搜
把模型拉出幻覺(jué)泥潭
為避免大模型陷入幻覺(jué)泥潭,360智搜通過(guò)精確的知識(shí)整合,減少虛假或不準(zhǔn)確信息,提升大模型的可信度與可靠性,有效減少大模型生成幻覺(jué)內(nèi)容的可能性。同時(shí),360智搜支持基于企業(yè)私域數(shù)據(jù)的知識(shí)提煉與總結(jié),為企業(yè)提供更安全、更高效的業(yè)務(wù)支持。
360智搜整合多領(lǐng)域精品知識(shí)庫(kù),實(shí)現(xiàn)全網(wǎng)與私域知識(shí)的無(wú)縫對(duì)接,提升信息獲取效率。實(shí)際應(yīng)用中,在幻覺(jué)檢測(cè)Agent加持下,大模型通用場(chǎng)景下幻覺(jué)比例下降50%以上。
調(diào)度指揮官360智控
Agent流程可控可管
為確保Agent在執(zhí)行任務(wù)時(shí)嚴(yán)格遵循既定流程,避免失控行為的發(fā)生,360智控通過(guò)原生安全的AI Agent可控框架對(duì)大模型場(chǎng)景進(jìn)行統(tǒng)一編排調(diào)用,原生設(shè)置安全措施、監(jiān)督任務(wù)規(guī)劃全程、監(jiān)控工具調(diào)用過(guò)程,把大模型能力關(guān)在籠子中,解決大模型不可控的問(wèn)題。
360 DS大模型安全解決方案支持多種部署及交付方式,滿(mǎn)足以DeepSeek為代表的通用大模型企業(yè)對(duì)便捷、成本、安全等多種因素個(gè)性化需求。
此外,360大模型安全解決方案已在政務(wù)、稅務(wù)、醫(yī)療等垂直行業(yè)落地應(yīng)用,守護(hù)千行百業(yè)智能化轉(zhuǎn)型。未來(lái),360將繼續(xù)護(hù)航大模型安全,為全球人工智能技術(shù)治理提供了可借鑒的“中國(guó)方案”。
如需咨詢(xún)相關(guān)服務(wù)
請(qǐng)聯(lián)系電話(huà)
400-0309-360