小组研究成果被ACM会议EuroSys 2026接收

EuroSys（European Conference on Computer Systems）是计算机系统领域的国际顶级会议之一，长期关注操作系统、分布式系统、云计算与大规模系统工程等前沿方向。EuroSys 2026 共收到 723 篇投稿，最终录用 138 篇，录用率约为 19.1%。

由清华大学软件系统安全保障小组完成的论文《Fuzzing Enterprise-Grade Blockchain Systems: Industrial Practice and Solutions》被 EuroSys 2026 正式接收。该工作聚焦于企业级区块链系统的安全与可靠性测试问题，系统性总结了真实工业环境下区块链系统在架构复杂性、协议交互、多组件耦合等方面面临的测试挑战，并提出了一套面向工业实践的模糊测试方法与解决方案。该研究结合真实系统经验与工程实践，力求提升区块链基础设施的安全性与鲁棒性。

随着区块链技术在金融、政务、供应链等关键领域的广泛应用,企业级区块链系统的安全性成为行业关注的焦点。尽管学术界已提出多种模糊测试工具,但这些工具在工业环境中的部署仍面临严峻挑战。论文提出的Thor框架针对工业部署中的三大关键障碍提出了系统性解决方案:

状态模型构建难题:在持续集成/持续部署(CI/CD)环境中,频繁的代码提交导致状态模型快速失效。Thor采用混合模式消息生成技术,结合主动构造和被动截获策略,通过钩子机制捕获真实节点通信并进行智能变异,在模型不完善的早期阶段仍能保持高效测试。
测试收敛速度瓶颈:现有工具需要12小时以上才能达到代码覆盖率收敛,无法满足工业CI/CD的时间要求。Thor创新性地提出两层并行模糊测试架构,在协议状态空间和消息结构两个层面并行执行测试,将收敛时间缩短至30-100分钟,测试效率提升数倍。
逻辑测试预言机适配困境:不同区块链系统日志格式差异巨大,人工构造逻辑漏洞检测器成本极高。Thor引入大语言模型(LLM)辅助的自动预言机生成技术,利用LLM从高层属性描述和系统日志中自动提取关键信息,合成用于检测共识漏洞、安全性违规等逻辑错误的断言脚本。

在实际应用中,Thor框架已成功部署于多个主流企业级区块链系统,包括长安链(Chainmaker)、微众银行FISCO BCOS、以太坊(Go-Ethereum)等。部署至今，在9个商业区块链系统中发现87个漏洞,其中75个已被维护者确认,17个获得了CVE标识。漏洞类型涵盖内存错误(内存泄漏、缓冲区溢出)和关键逻辑问题(共识挂起、非法交易确认)等,有效提升了系统安全性。

性能评估实验显示,Thor在测试效率上显著优于现有学术工具LOKI和Tyr,分支覆盖率平均提升9.65%,同时保持了工业可接受的系统开销(TPS下降约9.9%-16.1%)。该框架已在工业环境中持续运行数年,充分验证了其实用性和有效性。

该工作不仅为企业级区块链系统提供了实用的安全测试方案,更为系统级模糊测试技术的工业化落地探索了新路径,对提升关键基础设施的安全保障水平具有重要意义。