LGApr 25

Conditional Imputation for Within-Modality Missingness in Multi-Modal Federated Learning

Wugeng Zheng, Ziwen Kan, Katie Wang, Chen Chen, Song Wang

arXiv:2604.2311273.2h-index: 5Has Code

AI Analysis

Addresses within-modality missingness in clinical multimodal federated learning, a practical bottleneck for privacy-preserving healthcare AI.

CondI uses conditional diffusion models to impute missing temporal data in multimodal federated learning, achieving comparable performance to state-of-the-art baselines on three clinical datasets (PTB-XL, SLEEP-EDF, MIMIC-IV).

Multimodal Federated Learning (MMFL) enables privacy-preserving collaborative training, but real-world clinical applications often suffer from within-modality missingness caused by sensor intermittency or irregular sampling. Existing methods implicitly represent unobserved data via architectural alignment or missing embeddings, often failing to recover the true distribution and yielding sub-optimal performance. We propose CondI, a federated framework explicitly addressing this missingness using conditional diffusion models. CondI employs a two-phase training pipeline: first, imputing unobserved temporal components using available multimodal context and conditional embeddings; second, optimizing modality-specific extractors and joint embedding spaces. During inference, imputed raw data pass through trained extractors to generate robust features, providing a holistic representation for downstream tasks. Explicit data imputation ensures models operate on complete semantic structures, significantly enhancing resilience against severe data incompleteness. Experiments on three clinical datasets (PTB-XL, SLEEP-EDF, MIMIC-IV) demonstrate CondI achieves comparable results to state-of-the-art baselines. Code: https://github.com/ZhengWugeng/CondI

View on arXiv PDF Code

Similar