小组三项研究成果被ESEC/FSE工业长文及 New Ideas接收


清华大学软件系统安全保障小组三项研究成果被会议The ACM Joint European Software Engineering Conference and Symposium on the Foundations of Software Engineering (ESEC/FSE) 工业长文及 New Ideas接收。

第一项研究成果为“Dodrio: Parallelizing Taint Analysis Based Fuzzing via Redundancy-Free Scheduling”。该论文提出了一种通过减少冗余行为的将基于污点分析的模糊测试并行化的框架。其主要思想是通过实时同步全局状态,均衡的安排模糊测试任务,从而最大限度地减少冗余,使所有实例作为一个整体来发挥作用。与其他并行方法相比,Dodrio覆盖基本块的平均速度提高了 123%-398%。发现的基本块的数量增加了 5%-16%。该工作由博士后梁杰、毕业博士生王明哲,博士生周炽金等共同完成。

第二项研究成果为“When Fuzzing Meets LLMs: Challenges and Opportunities”。该论文研究了当前使用大语言模型来提升模糊测试性能的一些关键流程,并在这些关键流程当中总结了5个主要的挑战。该论文提出了解决这些挑战的建议,并以数据库测试为例给出一些解决方案。实验证明了这些建议能够有效地提升大语言模型在模糊测试的应用的效果。该工作由清华大学副教授姜宇,博士后梁杰,博士生马福辰、陈元亮、周炽金、沈煜恒、符景洲、张泉,硕士生吴志镛,毕业博士生王明哲等共同完成。

第三项研究成果为“Human-Imperceptible Retrieval Poisoning Attacks in LLM-Powered Applications“,该论文揭露一种新的威胁,称为检索污染攻击。目前,越来越多的开发者通过检索增强生成(RAG)技术来开发大语言模型。然而,这些应用设计未充分考虑外部内容的风险,使得攻击者能够进行检索污染攻击。本文发现攻击者可以借助应用的RAG过程中的流程来诱导大语言模型产生恶意响应。攻击者可以创建与正常文档外观上无异的恶意文档来诱导应用产生恶意内容。实验显示,此类攻击的成功率可达88.33%,在现实应用中也实现了66.67%的成功率。该工作由博士生张泉、周炽金、高贵焕,中南大学硕士生曾彬琪等共同完成。

ESEC/FSE是软件工程领域顶尖学术会议,是中国计算机协会(CCF)软件工程领域A类会议之一。ESEC/FSE对所录用的工业长文在原始创新性方面有较高要求,并要求论文具有解决工程实际问题的实用性。