Is FlatQuant superseded?

FlatQuant (LLM quantization): superseded — cited as a baseline and beaten by newer methods. 2 paper(s) critique it, 4 beat it on benchmarks — #12 of 80 most-superseded. Sub-problem: cluster led by SmoothQuant. Newer alternatives in the same sub-problem include OffQ, FAIR-Calib, InfoQuant, ConQuR, Activation Residual Hessian Quantization (ARHQ).

Method Drift›LLM quantization

Superseded baseline#12 of 80 most-superseded

FlatQuant

FlatQuant: Flatness Matters for LLM Quantization

LLM quantization · first seen Oct 12, 2024

superseded — cited as a baseline and beaten by newer methods

2 papers critique it · 4 beat it on benchmarks

What papers say

Verbatim critique sentences, each from a paper that cites FlatQuant as a baseline.

“FlatQuant flatquant demonstrates a loss of only 1.4 points”
— OSC: Hardware Efficient W4A4 Quantization via Outlier Separation in Channel Dimension
“Even though these approaches successfully quantize LLMs to 4 bits with slight performance degradation, they apply the same type of transformation across all layers, ignoring the distribution characteristics of each layer within LLMs.”
— Adaptive Layer-Wise Transformations for Post-Training Quantization of Large Language Models

Beaten on benchmarks

Head-to-head results where a newer method reports beating FlatQuant. Values are copied from the source paper's tables — verify against the cited paper.

Reasoning-QAT beats FlatQuant · Avg. [Qwen3-0.6B W4A4KV4]
21.44 vs 17.34
What Makes Low-Bit Quantization-Aware Training Work for Reasoning LLMs? A Systematic Study
Reasoning-QAT beats FlatQuant · Avg. [R1-1.5B W4A4KV4]
41.31 vs 38.39
What Makes Low-Bit Quantization-Aware Training Work for Reasoning LLMs? A Systematic Study
Reasoning-QAT beats FlatQuant · Avg. [Qwen3-4B W4A4KV4]
60.78 vs 58.28
What Makes Low-Bit Quantization-Aware Training Work for Reasoning LLMs? A Systematic Study
adaptive transformation selection framework beats FlatQuant · WikiText-2 PPL [W4A4KV4]
5.61 vs 5.78
Adaptive Layer-Wise Transformations for Post-Training Quantization of Large Language Models
adaptive transformation selection framework beats FlatQuant · C4 PPL [W4A4KV4]
7.58 vs 7.86
Adaptive Layer-Wise Transformations for Post-Training Quantization of Large Language Models
adaptive transformation selection framework beats FlatQuant · WikiText-2 PPL [W3A3K3V3]
7.22 vs 7.54
Adaptive Layer-Wise Transformations for Post-Training Quantization of Large Language Models
adaptive transformation selection framework beats FlatQuant · C4 PPL [W3A3K3V3]
9.43 vs 9.76
Adaptive Layer-Wise Transformations for Post-Training Quantization of Large Language Models
adaptive transformation selection framework beats FlatQuant · WikiText-2 PPL [W4A4K2V2]
6.98 vs 7.51
Adaptive Layer-Wise Transformations for Post-Training Quantization of Large Language Models
adaptive transformation selection framework beats FlatQuant · C4 PPL [W4A4K2V2]
9.04 vs 9.87
Adaptive Layer-Wise Transformations for Post-Training Quantization of Large Language Models
adaptive transformation selection framework beats FlatQuant · WikiText-2 PPL [W3A3K2V2]
9.83 vs 11.51
Adaptive Layer-Wise Transformations for Post-Training Quantization of Large Language Models
adaptive transformation selection framework beats FlatQuant · C4 PPL [W3A3K2V2]
13.35 vs 15.89
Adaptive Layer-Wise Transformations for Post-Training Quantization of Large Language Models
adaptive transformation selection framework beats FlatQuant · Avg [W4A4KV4]
67.88 vs 67.47
Adaptive Layer-Wise Transformations for Post-Training Quantization of Large Language Models

Newer alternatives

Recent methods in the same sub-problem, not yet superseded in the knowledge base.