CLMay 26, 2025

CulFiT: A Fine-grained Cultural-aware LLM Training Paradigm via Multilingual Critique Data Synthesis

Ruixiang Feng, Shen Gao, Xiuying Chen, Lisi Chen, Shuo Shang

arXiv:2505.19484v217.616 citationsh-index: 31Has CodeACL

Originality Incremental advance

AI Analysis

This addresses cultural inclusivity for low-resource regions, reducing biases and stereotypes in AI systems, though it is incremental as it builds on existing training methods.

The paper tackles cultural bias in large language models by proposing CulFiT, a training paradigm using multilingual critique data synthesis and fine-grained reward modeling, which achieves state-of-the-art performance in cultural alignment and general reasoning on benchmarks including their new GlobalCultureQA dataset.

Large Language Models (LLMs) have demonstrated remarkable capabilities across various tasks, yet they often exhibit a specific cultural biases, neglecting the values and linguistic diversity of low-resource regions. This cultural bias not only undermines universal equality, but also risks reinforcing stereotypes and perpetuating discrimination. To address this, we propose CulFiT, a novel culturally-aware training paradigm that leverages multilingual data and fine-grained reward modeling to enhance cultural sensitivity and inclusivity. Our approach synthesizes diverse cultural-related questions, constructs critique data in culturally relevant languages, and employs fine-grained rewards to decompose cultural texts into verifiable knowledge units for interpretable evaluation. We also introduce GlobalCultureQA, a multilingual open-ended question-answering dataset designed to evaluate culturally-aware responses in a global context. Extensive experiments on three existing benchmarks and our GlobalCultureQA demonstrate that CulFiT achieves state-of-the-art open-source model performance in cultural alignment and general reasoning.

View on arXiv PDF Code

Similar