久久99性xxx老妇胖精品,日韩三级一区,色婷婷久久久,亚洲精品欧美

登錄
首頁 > 奧迪 > 大模型智能體不止能寫代碼,還能被訓(xùn)練成白帽黑客

大模型智能體不止能寫代碼,還能被訓(xùn)練成白帽黑客

發(fā)布時間:2025-09-13 14:07:35 發(fā)布用戶: xiangyou

當人們還在驚嘆大模型能寫代碼、能自動化辦公時,它們正在悄然踏入一個更敏感、更危險的領(lǐng)域 —— 網(wǎng)絡(luò)安全

想象一下,如果 AI 不只是寫代碼的助手,而是能夠像「白帽黑客」一樣,在不破壞系統(tǒng)的前提下模擬攻擊、發(fā)現(xiàn)漏洞、提出修復(fù)建議,會帶來怎樣的改變?

這個問題,最近由 Amazon AWS AI 的 Q Developer 團隊給出了答案。他們在 arXiv 上同時發(fā)布了兩篇論文,提出了訓(xùn)練網(wǎng)絡(luò)安全大模型的全新方法:Cyber-Zero 和 CTF-Dojo。這兩項研究不僅是學(xué)術(shù)探索,更像是一次「實戰(zhàn)演練」的預(yù)告,預(yù)示著大模型智能體正在從通用任務(wù)走向網(wǎng)絡(luò)安全的前線。

論文 1: Cyber-Zero: Training Cybersecurity Agents without Runtime

鏈接: https://arxiv.org/abs/2508.00910

論文 2: Training Language Model Agents to Find Vulnerabilities with CTF-Dojo

鏈接:https://arxiv.org/abs/2508.18370

網(wǎng)絡(luò)安全

大模型落地的一座特殊堡壘

在通用任務(wù)上,大模型的訓(xùn)練已經(jīng)形成了相對成熟的范式:海量數(shù)據(jù)、長時間預(yù)訓(xùn)練、再經(jīng)過對齊與微調(diào)。但網(wǎng)絡(luò)安全場景不同,其核心難點在于訓(xùn)練環(huán)境與數(shù)據(jù)的高度敏感性。

事實上,閉源大模型已經(jīng)在安全攻防方向展現(xiàn)出一定潛力。Google 的 Project Zero 團隊就曾使用 Gemini 系列模型探索漏洞發(fā)現(xiàn),一些初創(chuàng)公司甚至嘗試構(gòu)建基于閉源模型的「AI 紅隊」,用來模擬攻擊并進行防御驗證。實際案例表明,這些強大的閉源模型確實具備了發(fā)現(xiàn)漏洞、自動化執(zhí)行攻擊步驟的潛力。

然而問題在于,這些模型的訓(xùn)練范式和數(shù)據(jù)集完全不透明。我們無法得知它們是如何習得攻防知識的,也無法驗證模型的安全性與可靠性。更重要的是,閉源模型無法被研究者和企業(yè)安全團隊自主改造或控制,這本身在安全領(lǐng)域是一種潛在風險。

另一方面,如果要讓模型從零開始學(xué)會攻防,傳統(tǒng)思路需要搭建真實運行環(huán)境,以生成交互軌跡。但這種方式成本高、風險大,甚至可能在實驗中觸發(fā)不可控的攻擊。而高質(zhì)量的安全攻防數(shù)據(jù)本就極度稀缺。漏洞利用和修復(fù)往往涉及復(fù)雜的環(huán)境狀態(tài)、系統(tǒng)調(diào)用和長時間推理,很難像自然語言文本那樣容易轉(zhuǎn)化為標準語料。

這意味著,如果繼續(xù)沿用傳統(tǒng)方式,「AI 白帽黑客」可能永遠只能停留在實驗階段。Amazon 團隊正是瞄準了這個瓶頸,提出了兩個互補的解決方案:Cyber-Zero 致力于「如何生成安全而高效的訓(xùn)練數(shù)據(jù)」,而 CTF-Dojo 則專注于「如何在實戰(zhàn)中訓(xùn)練模型發(fā)現(xiàn)漏洞」。

Cyber-Zero

無需真實環(huán)境的模擬訓(xùn)練場

Cyber-Zero 的核心思想是「runtime-free training」,即完全不依賴真實運行環(huán)境,而是通過已有知識和語言建模生成訓(xùn)練所需的高質(zhì)量行為軌跡 (trajectories)。

團隊注意到,公開的 CTF(Capture The Flag)競賽 writeups 是極其寶貴的資源。它們記錄了參賽者如何分析題目、嘗試攻擊、定位漏洞以及最終解題的過程。Cyber-Zero 正是基于這些 writeups,構(gòu)建出高質(zhì)量的訓(xùn)練軌跡。

具體來說,系統(tǒng)首先從 writeups 中提取關(guān)鍵步驟和思路,然后通過設(shè)定不同的人格(persona),讓大模型在純文本環(huán)境中模擬攻防雙方的對話與操作。例如,攻擊者 persona 會生成可能的利用路徑,防御者 persona 會進行應(yīng)對。這一過程中生成的長序列交互被視作行為軌跡,用于訓(xùn)練網(wǎng)絡(luò)安全智能體。

實驗表明,這種免運行時的軌跡生成不僅規(guī)模可觀,而且多樣性豐富,覆蓋了常見的攻防模式。與真實環(huán)境生成的軌跡相比,Cyber-Zero 的數(shù)據(jù)在漏洞定位、攻擊路徑推理等任務(wù)上的訓(xùn)練效果毫不遜色,甚至在部分指標上表現(xiàn)更優(yōu)。這意味著,AI 白帽黑客可以在一個完全安全的虛擬訓(xùn)練營中反復(fù)優(yōu)化,而不必擔心成本和風險。

團隊還得出幾項關(guān)鍵發(fā)現(xiàn):

  • 通用的軟件工程智能體(SWE Agents)無法直接遷移至網(wǎng)絡(luò)安全任務(wù)。寫代碼 ≠ 找漏洞,兩類技能之間存在明顯鴻溝。
  • 模型規(guī)模與性能密切相關(guān):參數(shù)更大的模型更擅長維持長程推理鏈,跨多步組合命令,并在多輪交互中保持狀態(tài)連貫,這對復(fù)雜攻防至關(guān)重要。
  • 經(jīng)過 Cyber-Zero 軌跡微調(diào)的 32B 智能體,性能已接近閉源模型 Claude-3.7-Sonnet,而推理成本僅為其 1%。

這些結(jié)果一方面凸顯了 Cyber-Zero 的實用價值:它不僅能安全、低成本地生成訓(xùn)練數(shù)據(jù),還能讓模型通過微調(diào)在安全任務(wù)上具備實用能力;另一方面也指出了研究方向:如果不針對安全任務(wù)進行專門優(yōu)化,即便是大規(guī)模的通用 SWE 智能體也難以承擔白帽黑客的角色。

CTF-Dojo

讓 AI 在實戰(zhàn)中學(xué)會發(fā)現(xiàn)漏洞

如果說 Cyber-Zero 提供的是一個「虛構(gòu)的訓(xùn)練場」,它通過解析 CTF writeups 與 persona 模擬,在純文本空間中生成攻防軌跡,讓模型在完全無風險的虛擬環(huán)境中學(xué)習;那么 CTF-Dojo 就是一個「真實的戰(zhàn)場」。它直接構(gòu)建可運行的 CTF 攻防環(huán)境,讓智能體能夠真正執(zhí)行命令、與系統(tǒng)交互、發(fā)現(xiàn)并利用漏洞。前者強調(diào)規(guī)模化、安全、高效的數(shù)據(jù)生成,后者強調(diào)貼近實戰(zhàn)的攻防演練,兩者一虛一實,形成互補。

CTF-Dojo 的核心難點在于:如何在大規(guī)模下為 LLM 智能體提供穩(wěn)定的運行環(huán)境。傳統(tǒng) SWE(軟件工程)代理通常需要專家手動配置環(huán)境才能運行,而每個任務(wù)的準備工作往往耗時數(shù)周,極大限制了研究規(guī)模。為此,Amazon 團隊提出了 CTF-Forge,一種能夠在幾分鐘內(nèi)自動搭建運行時的容器化工具,可以快速部署數(shù)百個挑戰(zhàn)實例,顯著降低了人力成本。

研究團隊選擇了全球最具代表性的 pwn.college CTF Archive 作為種子數(shù)據(jù)。該數(shù)據(jù)集收錄了數(shù)百個來自頂級賽事的高質(zhì)量題目,涵蓋六大類別,從 Web 漏洞、二進制利用到密碼學(xué)挑戰(zhàn)一應(yīng)俱全。通過精心篩選,并排除測試數(shù)據(jù)中已包含的題目,最終形成了 658 個獨立任務(wù)實例,為智能體訓(xùn)練提供了堅實的基礎(chǔ)。

然而,最初實驗表明,開源模型在這些復(fù)雜任務(wù)上的成功率極低。大部分 OSS 模型只能完成少數(shù)挑戰(zhàn),生成的軌跡也質(zhì)量參差不齊。為了提高可用樣本的產(chǎn)出率,團隊引入了三項推理階段增強技術(shù):

  • 將公開的賽題筆記(writeups) 作為提示,幫助模型更快鎖定解題方向;
  • 運行時增強:通過在執(zhí)行過程中動態(tài)修改環(huán)境配置或任務(wù)約束,把過于復(fù)雜的挑戰(zhàn)「降維」,從而提升模型完成任務(wù)的成功率;
  • 教師模型多樣化:不僅依賴單一模型生成解題軌跡,而是同時調(diào)用多種不同類型的大模型(包括開源和閉源),讓它們各自貢獻成功案例,以此獲得更豐富、更具多樣性的訓(xùn)練樣本。

最終,團隊主要依賴 Qwen3-Code-480B 和 DeepSeek-V3-0324 兩個強大的開源模型,收集到來自 274 個挑戰(zhàn)的 1000+ 成功軌跡。在去除冗余、限制每個任務(wù)實例的最大樣本數(shù)后,最終得到了 486 條高質(zhì)量、經(jīng)過運行驗證的軌跡

基于這些數(shù)據(jù),研究團隊對 Qwen3 系列模型(8B、14B 和 32B 參數(shù)規(guī)模)進行了訓(xùn)練,并在多個網(wǎng)絡(luò)安全基準任務(wù)上評估了效果。結(jié)果顯示,經(jīng)過 CTF-Dojo 訓(xùn)練的模型,在 EnIGMA+ 基準(源自前作 Cyber-Zero)上取得了最高 11.6% 的絕對提升,不僅超過了開源基線模型,還表現(xiàn)出與閉源模型接近的水平。更重要的是,隨著訓(xùn)練樣本數(shù)量的增加,性能呈現(xiàn)出清晰的可擴展性,證明了在真實環(huán)境軌跡驅(qū)動下,大模型在網(wǎng)絡(luò)安全任務(wù)上的潛力可以被系統(tǒng)性激發(fā)。

這些結(jié)果意味著,CTF-Dojo 不僅解決了過去「環(huán)境難以大規(guī)模配置」的工程難題,還驗證了一個核心科學(xué)問題:網(wǎng)絡(luò)安全智能體的性能能夠隨著執(zhí)行數(shù)據(jù)的增加而持續(xù)提升。在已有 SWE 代理無法泛化的情況下,CTF-Dojo 給出了一條清晰的道路:通過規(guī)模化、自動化的運行環(huán)境收集軌跡,推動模型逐步逼近人類白帽黑客的實戰(zhàn)水平。

從虛擬到實戰(zhàn)的組合拳

把 Cyber-Zero 和 CTF-Dojo 放在一起看,就會發(fā)現(xiàn)它們形成了一個閉環(huán)。Cyber-Zero 提供的是安全、可擴展的訓(xùn)練數(shù)據(jù)來源,相當于一個虛擬訓(xùn)練營;而 CTF-Dojo 則是實戰(zhàn)武館,讓模型在真實挑戰(zhàn)中不斷迭代。前者解決了數(shù)據(jù)與成本的問題,后者解決了能力習得與遷移的問題。兩者結(jié)合,為 AI 白帽黑客的成長提供了完整路徑。

這種設(shè)計思路的意義在于,它不僅追求理論上的可行性,還強調(diào)在生產(chǎn)環(huán)境中真正可部署。正如論文中展示的實驗結(jié)果,Cyber-Zero 的數(shù)據(jù)生成和 CTF-Dojo 的環(huán)境構(gòu)建都能規(guī)模化運行,且能在真實任務(wù)上帶來可驗證的性能提升。這標志著 AI 在網(wǎng)絡(luò)安全方向正在逐步進入應(yīng)用落地階段。

未來意義與挑戰(zhàn)

AI 白帽黑客蘊藏廣闊前景:在企業(yè)安全團隊中,它可以作為虛擬成員,自動掃描代碼、發(fā)現(xiàn)潛在漏洞,并提出修復(fù)建議;在紅隊演練中,它可以充當對手角色,幫助測試防御系統(tǒng);在教育場景中,它可以成為學(xué)員的「陪練」,提供個性化的挑戰(zhàn)和反饋。更長遠來看,隨著成本降低和技術(shù)成熟,中小企業(yè)也有望借助這樣的系統(tǒng)獲得「普惠安全」。

但與此同時,這項技術(shù)的雙重用途屬性不容忽視。正如研究團隊在論文中強調(diào)的那樣,雖然 Cyber-Zero 和 CTF-Dojo 的初衷是幫助開發(fā)者和研究人員在軟件部署前發(fā)現(xiàn)并修復(fù)漏洞,但同樣的能力也可能被濫用于進攻目的,比如自動化發(fā)現(xiàn)外部系統(tǒng)的漏洞,甚至開發(fā)惡意工具。特別是 Cyber-Zero 的「免運行時」方法,降低了訓(xùn)練高性能網(wǎng)絡(luò)安全智能體的門檻,使其更容易被更廣泛的群體獲取和使用。這種民主化的趨勢既意味著安全研究的普及,也意味著風險的擴散。

實驗結(jié)果已經(jīng)證明,基于虛擬軌跡或執(zhí)行驗證數(shù)據(jù)訓(xùn)練的模型,能夠在多個基準任務(wù)上達到接近甚至媲美閉源前沿模型的性能。這表明先進網(wǎng)絡(luò)安全能力的民主化不僅在技術(shù)上可行,而且正在快速到來。如何確保這類能力更多地服務(wù)于防御,而不是被濫用于攻擊,將是未來亟需討論的議題。

在未來研究方向上,團隊提出了幾個值得關(guān)注的思路。一個是構(gòu)建實時更新的 CTF 基準:通過 CTF-Forge 自動重建比賽環(huán)境,把來自活躍 CTF 賽事的挑戰(zhàn)容器化,用于動態(tài)評測和軌跡采集,實現(xiàn)可擴展、實時的 benchmark。另一個方向是強化學(xué)習,即讓網(wǎng)絡(luò)安全智能體直接與動態(tài)環(huán)境交互,并通過結(jié)構(gòu)化獎勵獲得反饋。這種范式有望突破單純模仿學(xué)習的局限,使模型能夠發(fā)展出更普適、更具適應(yīng)性的策略,更好地應(yīng)對未知的安全問題。

因此,未來的關(guān)鍵在于平衡開放與安全。在推動技術(shù)進步與普及的同時,建立有效的安全護欄,需研究者、開發(fā)者、安全機構(gòu)與政策制定者協(xié)同努力,確保這類強大工具以負責任的方式被開發(fā)和使用。唯有如此,才能真正增強整體網(wǎng)絡(luò)防御能力,迎接一個更安全的智能時代。

Copyright 2018-2026 趣玩多 版權(quán)所有
久久99性xxx老妇胖精品,日韩三级一区,色婷婷久久久,亚洲精品欧美
九一国产精品| 亚洲va中文在线播放免费| 视频一区二区不卡| 日韩中文首页| 亚洲性图久久| 啪啪国产精品| 三级在线看中文字幕完整版| 国产亚洲欧美日韩精品一区二区三区| 婷婷综合激情| 99国产精品| 视频在线在亚洲| 蜜桃久久久久久久| 日本中文字幕一区二区视频| 亚洲理论在线| 97久久亚洲| 精品国产午夜肉伦伦影院| 四季av一区二区凹凸精品| 亚洲伊人精品酒店| 一区二区三区网站| 欧美日韩1区| 美女久久久久久| 91综合网人人| 免费高潮视频95在线观看网站| 久久激情网站| 91精品国产自产观看在线| 中文字幕亚洲在线观看| 亚洲aⅴ网站| 免费观看在线综合| 日韩精品成人| 欧美日本不卡| 高清在线一区| 日韩亚洲国产欧美| 日韩网站在线| 国产精品一在线观看| 91一区二区三区四区| 91精品二区| 国产色噜噜噜91在线精品| 国产美女高潮在线| 亚洲欧美一级| 成人午夜国产| 国产精品日本一区二区三区在线| 麻豆视频在线看| 日产欧产美韩系列久久99| 成人在线免费观看91| 欧美不卡视频| 精品理论电影在线| 午夜亚洲福利| 国产精品www994| 日韩一区二区三区精品视频第3页 日韩一区二区三区免费视频 | 国产欧美视频在线| 久久久久久久久丰满| 国产精品地址| 亚洲狼人精品一区二区三区| 久久久精品日韩| 久久精品99国产精品日本| 三级精品视频| 91中文字幕精品永久在线| 亚洲制服一区| 午夜欧美精品久久久久久久| 麻豆视频在线看| 98精品久久久久久久| 欧美日本精品| 国产欧美二区| 国产欧美日韩一区二区三区四区 | 免费成人在线观看| 午夜精品婷婷| 婷婷亚洲五月| 欧美日韩色图| 伊人久久大香线蕉av不卡| 成人在线免费观看网站| 精品国产午夜| 日韩欧美国产精品综合嫩v| 国产极品久久久久久久久波多结野| 日韩精品久久久久久| 日韩精品免费视频一区二区三区| 日韩精品a在线观看91| 日韩亚洲精品在线观看| 青青国产91久久久久久| 国产毛片一区二区三区| 精品一区二区三区中文字幕视频| 久久天堂影院| 久久久久免费av| 免费人成网站在线观看欧美高清| 一本一道久久a久久精品蜜桃| 欧美午夜不卡| 婷婷综合一区| 久久伊人久久| 欧美日韩四区| 欧美影院视频| 在线观看精品| 亚洲综合色婷婷在线观看| 欧美日韩 国产精品| 国产一区二区精品久| 免费观看不卡av| 欧美一级二级三级视频| 91视频一区| 五月激激激综合网色播| 国产成人精品三级高清久久91| 三上亚洲一区二区| 影音国产精品| 精品无人区麻豆乱码久久久 | 激情亚洲影院在线观看| 国产亚洲亚洲| 岛国精品一区| 日韩av中文字幕一区二区| 成人午夜网址| 亚洲精选91| 亚洲一区二区日韩| 精品伊人久久| 国产一区二区三区四区五区| 日韩精品视频中文字幕| 国产aⅴ精品一区二区三区久久| 国产精品色网| 香蕉久久99| 国产精选在线| 国产麻豆精品久久| 丝袜亚洲另类欧美| 久久中文字幕av| 成人精品视频| 欧美成人一二区| 亚洲精品激情| 天堂av在线一区| 欧美va天堂| 在线亚洲人成| 国产精品久久久久久av公交车| 蜜桃传媒麻豆第一区在线观看| 国产福利亚洲| 日韩三区四区| 免费一级片91| 久久国产日韩| 久久九九电影| 亚洲成人国产| av综合电影网站| 亚洲美女久久精品| 麻豆久久久久久| 国产精品欧美在线观看| 天堂va欧美ⅴa亚洲va一国产| 日韩视频一区二区三区在线播放免费观看| 欧美激情aⅴ一区二区三区| 日韩高清国产一区在线| 视频一区免费在线观看| 日韩av首页| 久久精品动漫| 韩国精品主播一区二区在线观看 | 国产欧美丝祙| 国产精品亲子伦av一区二区三区| 日韩激情精品| 国产乱码精品| 国产精品亚洲二区| 国产精品麻豆久久| 亚洲一级少妇| 国产综合激情| 日本亚洲不卡| 精品国产美女a久久9999| 国产亚洲精品美女久久久久久久久久| 欧美黄色一区二区| 卡一卡二国产精品| 欧美一级网址| 国产精品手机在线播放| 日韩av有码| 欧美特黄一区| 日本亚洲三级在线| 久久亚洲美女| 国产美女亚洲精品7777| 98精品视频| 丝袜国产日韩另类美女| 国产欧美一区二区三区精品观看| 国产精品男女| 999久久久精品国产| 欧美午夜不卡| 欧美午夜三级| 欧美成人国产| 7777精品| 久久婷婷久久| 日韩精品一区二区三区中文| 国产精品成人自拍| 欧美午夜不卡| 老司机精品视频网| 国产美女精品| 92国产精品| 欧美成人精品午夜一区二区| 偷拍欧美精品| 国产一区二区三区探花| 久久亚洲精品伦理| 中文在线资源| 在线综合欧美| 高清一区二区三区| 国产伦理久久久久久妇女| 欧美中文一区二区| 国产日韩中文在线中文字幕| 亚洲一区亚洲| 欧美亚洲激情| av中文资源在线资源免费观看| 日本aⅴ精品一区二区三区| 久久免费大视频| 久久久91麻豆精品国产一区| 亚洲资源网站| 美女国产一区| 国产精品88久久久久久| 久久精品色播|