📝 Selected Papers

(* indicates equal contribution, # indicates corresponding author)

Publications

ICML 2026

SARSteer: Safeguarding Large Audio Language Models via Safe-Ablated Refusal Steering

Weilin Lin, Jianze Li, Hui Xiong, Li Liu^#

The first inference-time defense framework specifically designed for Large Audio Language Models (LALMs).
Proposes text-derived refusal steering to enforce refusal without manipulating audio inputs.
Introduces decomposed safety space ablation to mitigate over-refusal on benign speech queries.

The Forty-Third International Conference on Machine Learning (ICML), Seoul, South Korea, 2026

NeurIPS 2025 D&B

BackdoorDM: A Comprehensive Benchmark for Backdoor Learning on Diffusion Model

Weilin Lin^*, Nanjun Zhou^*, Yanyun Wang, Jianze Li, Hui Xiong, Li Liu^#

The first comprehensive benchmark for backdoor learning on diffusion models.
Propose a unified attack formulation and a systematic target taxonomy.
Support 9 diffusion backdoor attacks, 5 defense methods, and 3 visualization tools.

The Thirty-Ninth Annual Conference on Neural Information Processing Systems Datasets & Benchmarks Track (NeurIPS D&B), San Diego, California, USA, 2025

AAAI 2025 Oral

Fusing Pruned and Backdoored Models: Optimal Transport-based Data-free Backdoor Mitigation Oral Presentation (4.6%)

Weilin Lin, Li Liu^#, Jianze Li, Hui Xiong

One of the few data-free defense strategies against backdoor attacks.
First adaptation of OT and model fusion on backdoor defense.

The Thirty-Ninth AAAI Conference on Artificial Intelligence (AAAI-25), Philadelphia, Pennsylvania, USA, 2025

NeurIPS 2024

Unveiling and Mitigating Backdoor Vulnerabilities based on Unlearning Weight Changes and Backdoor Activeness

Weilin Lin, Li Liu^#, Shaokui Wei, Jianze Li, Hui Xiong

New insights on unlearning weight change and backdoor activeness.
Propose an effective defense strategy using reinitialization and fine-tuning.

Annual Conference on Neural Information Processing Systems (NeurIPS), Vancouver, Canada, 2024

ICASSP 2025 Gradient Norm-based Fine-Tuning for Backdoor Defense in Automatic Speech Recognition, Nanjun Zhou^*, Weilin Lin^*, Li Liu^#.
WWW 2023 Autodenoise: Automatic data instance denoising for recommendations, Weilin Lin, Xiangyu Zhao^#, Yejing Wang, Yuanshao Zhu, Wanyu Wang.
KDD 2022 AdaFS: Adaptive feature selection in deep recommender system, Weilin Lin, Xiangyu Zhao^#, Yejing Wang, Tong Xu, Xian Wu.

Preprints

Arxiv 2024 Segment anything for videos: A systematic survey, Chunhui Zhang, Yawen Cui, Weilin Lin, Guanjie Huang, Yan Rong, Li Liu^#, Shiguang Shan.
Arxiv 2023 A comprehensive survey on segment anything model for vision and beyond, Chunhui Zhang, Li Liu^#, Yawen Cui, Guanjie Huang, Weilin Lin, Yiqian Yang, Yuehong Hu.

Weilin Lin (林威霖)

📝 Selected Papers

Publications

Preprints