小组研究成果被IEEE/ACM会议ICSE 2024接收


清华大学软件系统安全保障小组研究成果“Sedar: Obtaining High-Quality Seeds for DBMS Fuzzing via Cross-DBMS SQL Transfer”被ICSE 2024接收。

该论文提出了Sedar,一种通过跨数据库的测例迁移来获取数据库模糊测试的高质量初始种子的方法。首先,Sedar从其他流行数据库中收集SQL测试用例,并分析其schema信息。然后,Sedar通过大语言模型将这些测例转换成待测数据库的语法,其prompt根据SQL测例中的语句和schema信息自动生成。最后,为了使模糊测试工具能够对迁移后的测例进行正常的语法解析和变异,Sedar会在语法解析阶段主动标注测例中无法识别的部分,进行注释和变异完成后的解注释处理。Sedar在Virtuoso, MonetDB, DuckDB, ClickHouse上总计发现了70个漏洞,其中19个已被正式分配CVE编号。相较于迁移前的种子,Sedar在被测数据库上提升了21.40%-214.84%的代码覆盖率;将Sedar迁移的种子与数据库官方测试用例结合使用时,可以提高4.90%-28.41%的代码覆盖率。该工作由直博生符景洲、博后梁杰、硕士生吴志镛等共同参与完成。

IEEE/ACM International Conference on Software Engineering(ICSE)由IEEE与ACM联合主办,是软件工程领域公认的旗舰学术会议,关注软件工程领域的各个研究方向。ICSE是中国计算机学会推荐的A类国际学术会议(CCF-A),是清华大学计算机学科推荐 A 类会议。