00后担大梁交大本科生在计算机安全顶级会议上实现突破，打造大模型全方位安全分析底座

上海交通大学计算机学院（网络空间安全学院、密码学院）本科生徐菲悦作为第一作者的论文“A Multidimensional Evaluation Framework for Robustness and Alignment in Large Language Models”被计算机安全顶级学术会议 IEEE Symposium on Security and Privacy 2026（简称 IEEE S&P）录用。论文提出面向大型语言模型（LLM）的“安全魔方（Security Cube）”评估体系，构建覆盖攻击、防御与判定三大维度的多指标框架，为大模型安全评估建立统一多维框架，系统化刻画攻击与防御版图，为大模型安全研究与产业落地提供全方位安全分析底座。该研究由王烁、贺超翔、胡宏盛、孙士锋、谷大武等老师指导，合作者包括交大研究生杭晟、刘修铭、赵宇博，以及微软首席科学家Bin Zhu等。据悉，本次 IEEE S&P全球仅录用118篇论文，本科生作为第一作者在 IEEE S&P2025 发文在大陆地区尚属首次。

IEEE S&P、ACM CCS、Usenix Security、NDSS称为网络与信息安全领域四大国际顶级学术会议，代表着国际网络与信息安全研究的最前沿水平。

从“攻防样例”走向“系统评价”，构建“安全魔方”统一多维评估框架

大型语言模型在通用智能方面取得显著突破，但现实世界的越狱（jailbreak）等攻击会诱导模型输出不当内容，威胁高风险应用中的安全、合规与信任。现有评估多依赖单一的攻击成功率等指标，难以反映攻击可复现性、跨模型与跨防御的普适性，以及对模型内部机制的实质性影响，导致安全治理缺乏统一、可比较的评价基准。

论文对越狱攻击与防御方法进行了结构化分类，进一步提出安全魔方（Security Cube），从攻击者轴、防御轴、评判轴三条主轴系统刻画 LLM 安全性，共引入14项指标，并对13 种攻击、5 种防御与 4 种评判器进行了全面评测。

其中，框架新增并强调了多项关键度量，用以弥补传统单指标评价的不足，包括：

攻击稳定性与可重复性：衡量攻击在不同设置下是否稳定复现；

跨防御、跨模型的可迁移性：评估攻击是否能跨越不同防护策略与模型架构；

内部破坏程度：判断攻击是否仅绕过表层过滤，还是对模型内部激活与安全检查造成了本质影响；

对抗效率：刻画实现成功攻击所需的计算/查询成本，支持在安全与效率之间进行工程权衡。

该魔方框架从指标维度与实验设计两方面统一了攻击、加固与裁决的评价语言，为研究者横向比较不同方法、为工程团队制定安全基线与合规标准、为监管机构形成可量化的审查视角提供了可操作的“通用量表”。

学生风采

第一作者徐菲悦为上海交通大学计算机学院2022级本科生，已获直博资格。在校期间曾获国家奖学金、本科生 A 等奖学金、优秀学生干部等多项荣誉；作为核心成员获得2024 全球 AI 攻防挑战赛季军与杰出方案奖等成绩，展现了面向真实场景问题的攻防能力与工程落地潜力。

免责声明：市场有风险，选择需谨慎！此文仅供参考，不作买卖依据。

责任编辑：kj005

文章投诉热线:157 3889 8464 投诉邮箱:7983347 16@qq.com

关键词：

主摄必须第一？1/1.28英寸超广角扛起均衡影像大旗

“国补”未能拯救的电视，DeepSeek能行吗？

华为或首发国产一英寸大底影像自研成厂商必由之路？

真我Neo7 SE评测：性能强更有长续航，重度游戏玩家新选择

中华网数码

00后担大梁交大本科生在计算机安全顶级会议上实现突破，打造大模型全方位安全分析底座

比5070 Ti要低20%左右？NVIDIA RTX 5070跑分成绩曝光

AMD 锐龙7 9700X 对决酷睿i7-14700K：畅玩电竞，新锐龙依旧锐不可挡！

Intel® Amston Lake：边缘计算与网络通信的强劲引擎

“我是被逼的” 黄仁勋表示：英伟达不能没有中国

相关新闻

抖音持续打击“杀猪盘”“虚假投资理财”等诈骗黑产，揭露诈骗套路

越南玩具婴童市场蓄势腾飞，中国企业集中亮相2025IBTE越南国际玩具及婴童用品展

干部应常坐百姓“冷板凳”

韩国旅行商赴滇考察深化云南文旅价值共融

“活力灌城·包容共健”——都江堰市举办第34个国际残疾人日全民健身活动

《凤凰台上》萧荧公主抢糖葫芦，鹤宸神演技带火“糖葫芦娃”新梗！

丽人丽妆与Alula爱羽乐达成战略合作，携手全球乳业帝国领航母婴健康新征程

【颜值的隐形框架】北京煤医微整形医生陶泓旭"少女幼态脸明星打法"

宜选网亮相印尼雅加达机床展，“AI采购”解决方案塑造跨境贸易新体验

千岭冰封寒，万里雪中飞：2025雪中飞123大众冰雪季吉林启幕，助推全民冰雪热潮

数码推荐

数码图片

党建引领护光明服务惠民谱新篇!

礼丝食品集团捐赠爱心瓷砖助力前进中学共守食品安全

破局“生态之困”！青葡萄融合云桌面麒麟版于华为展台重磅宣讲，引领国产化办公新纪元

TATA木门双十一强势领跑创新产品力叠加平台革新开启家居消费新范式

新闻排行

智能触控新纪元：前行者X98键盘，以创新科技重塑输入体验

铭凡M1 Plus迷你主机:Intel芯、双网口与高性能打造新一代企业高效解决方案

凉皮品牌终极排行榜：凉皮先生全维度五星领跑，成为口味、销量、服务全能标杆

[北京吃货地图] 一碗凉皮的终极答案！凉皮先生凭什么成为京圈"性价比之王"？

2025乐划锁屏内容大赏正式开启，40万奖金征集“推窗时刻”

深圳香蜜丽格黎京雄院长携手半岛大超炮，登陆纽约时代广场大屏

华硕ProArt战略合作北京电影学院导演系，助力第十四届学生导演奖！

乐高控必冲！枣橙科技全球首创 AI 积木陪伴机器人登全运会舞台，首发即高光

联发科天玑9500芯动力，OPPO Find X9重塑旗舰手机新标准

DeepGEO（深度AI搜索）横空出世！国内首个AI搜索指数平台发布

00后担大梁交大本科生在计算机安全顶级会议上实现突破，打造大模型全方位安全分析底座

相关新闻

数码推荐

数码图片

党建引领护光明 服务惠民谱新篇!

礼丝食品集团捐赠爱心瓷砖 助力前进中学共守食品安全

破局“生态之困”！青葡萄融合云桌面麒麟版于华为展台重磅宣讲，引领国产化办公新纪元

TATA木门双十一强势领跑 创新产品力叠加平台革新开启家居消费新范式

新闻排行

党建引领护光明服务惠民谱新篇!

礼丝食品集团捐赠爱心瓷砖助力前进中学共守食品安全

TATA木门双十一强势领跑创新产品力叠加平台革新开启家居消费新范式